6

PROBABILIDADE 6.1 Introdução
A teoria da probabilidade é a parte da matemática que estuda os fenômenos aleatórios. Todo fato ou acontecimento passível de observação é chamado de fenômeno, e os seus
possíveis resultados são determinísticos ou aleatórios. Qualquer ensaio ou experiência destinado à verificação de um fenômeno é chamado de experimento. Diz-se que um fenômeno é determinístico quando apresenta um só resultado sob as mesmas condições de experimentação, isto é, se a experiência não se altera o seu resultado é sempre o mesmo. Já os fenômenos aleatórios, ainda que repetidos sob as mesmas condições iniciais, apresentam resultados distintos ou incertos, porque estão sujeitos às leis do acaso. Tanto que quando se atira uma moeda para o alto a força da gravidade faz com que a sua queda seja certa, a velocidade da queda da moeda, desde que lançada sob as mesmas condições, será uma constante que se pode chamar de fenômeno determinístico. Mas a ocorrência de cara ou de coroa é imprevisível, pois alguém pode apostar em cara e dar coroa, ou vice-versa. É essa incerteza quanto aos resultados do acontecimento que denota o que se chama de fenômeno aleatório. Neste contexto, a probabilidade é um número real que exprime quão provável é a chance de ocorrer um particular resultado do acontecimento aleatório. De início a teoria da probabilidade era utilizada para prever resultados de jogos de azar, e daí a razão de tal vertente ser bastante explorada no estudo introdutório da matéria. Porém, com o passar do tempo, as aplicações de probabilidade se expandiram notavelmente, sobretudo em processos de tomada de decisão ligados a acontecimentos sujeitos aos efeitos do acaso, tais como: previsão meteorológica e de safras agrícolas; risco de apólices de seguro; cotação de ações em bolsa de valores; controle de qualidade; marketing, etc.

6.2 Experimento aleatório
Designa uma experiência em que os seus resultados são imprevisíveis, mesmo que seja repetida indefinidamente sob condições semelhantes, e é simbolizado pela letra E latina. Eis alguns exemplos de experimento aleatório:

2
E1: arremessar um dado e anotar o número do lado que cai para cima; E2: lançar uma moeda e verificar a seqüência de cara e coroa; E3: retirar cartas de um baralho e verificar as figuras; E4: Conferir o número de peças defeituosas produzidas diariamente por uma máquina; E5: Verificar a execução de uma tarefa e anotar o tempo gasto por cada trabalhador. Embora os resultados dos experimentos retromencionados se pareçam absolutamente acidentais, verifica-se que na realidade eles tendem para uma estabilidade estatística quando a experiência é repetida um número relativamente grande de vezes. Esta regularidade é fundamental porque facilita a construção de modelos matemáticos para descrever o comportamento do fenômeno, possibilitando à previsibilidade de cada valor em particular, como se verá mais adiante.

6.3 Espaço amostral
O conjunto de todos os resultados possíveis de um experimento aleatório é chamado de espaço amostral. Este é um conjunto S em que cada um de seus elementos está associado a um e somente um resultado possível do experimento. Eis, então, os seguintes exemplos: a) lançamento de um dado: S1 = {1, 2, 3, 4, 5, 6}; b) lançamento de uma moeda: S2 = {cara, coroa}; c) retirada de uma carta de um baralho: S3 = {as 52 cartas}; d) Contagem diária das peças defeituosas produzidas por uma máquina, para controle do processo: S 4 = {0, 1, 2, 3, ..., n} ; e) tempo que um grupo de trabalhadores gasta para executar uma tarefa que está a ser

implantada:

S5 = {x ∈ R / x > 0

}.

Os exemplos vistos nas letras a, b, c e d são de espaços amostrais finitos numeráveis e o da letra e de espaço amostral infinito não-enumerável, cujo estudo será abstraído neste capítulo, por exigir aplicação de matemática avançada, em face de maior complexidade teórica.

6.4 Eventos
Prof. Gilberto S. Gramacho, UEFS, 29/09/2006.

3 Qualquer subconjunto do espaço amostral S é chamado de evento. Se um evento tem apenas um
elemento é chamado de evento simples, e de evento composto se tem mais de um elemento. Um evento é definido por uma sentença e tem como símbolo as letras maiúsculas do alfabeto. Os seus elementos são descritos por números arábicos, ou letras minúsculas quando não têm expressão numérica. Eis que quando se lança uma moeda o espaço amostral é formado por dois eventos simples cara (c) e coroa (k), tal que S = {c, k}. Agora quando se lançam duas moedas o espaço amostral corresponde a quatro seqüências de coroa/coroa (kk), coroa/cara (kc), cara/coroa (ck) e cara/cara (cc), de modo que se tem S = {kk, kc, ck, cc}, onde cada seqüência é um evento composto de S. E o evento relativo a pelo menos uma cara é definido pelo subconjunto A = {kc, ck, cc}. Veja-se ainda, neste caso, que os elementos de S podem ser definidos como pontos de uma variável aleatória, quando se enuncia, por exemplo, que
X

é igual ao número de caras. Isso permite

descrever o mesmo espaço amostral através de números, tal que S = {0, 1, 2} e o referido evento A pelo subconjunto numérico A = {1, 2}, como se vê no quadro abaixo.
Quadro 6.1 – Eventos relativos ao lançamento de duas moedas Seqüências kk kc, ck cc
X

= número de caras 0 1 2

Outrossim, quando o experimento consiste no lançamento de um dado o número de casos possíveis é igual a seis, que corresponde à freqüência de cada uma das seis faces que pode cair voltada para cima, e é representado pelo conjunto S = {1, 2, 3, 4, 5, 6}. Para um S finito ou infinito numerável, constituído de n elementos, existem 2 n subconjuntos ou eventos possíveis. a) Evento impossível: É uma situação impossível de acontecer na realização de determinado experimento e se representa pelo símbolo Φ . Eis que é impossível obter uma seqüência de três caras num único lançamento de duas moedas, ou dar número menor que a unidade no lançamento de um dado. Os conceitos de evento impossível e de conjunto vazio são equivalentes. b) Evento certo: Quando envolve todos os resultados do experimento. Seja, por exemplo, o

Prof. Gilberto S. Gramacho, UEFS, 29/09/2006.

que se representa pela notação A ∩ B (lê-se A inter B). O complemento de A em relação S. é possível obter novos eventos através das operações de união e interseção. 2. ou ainda melhor A ⊂ B ={∀x ∈A →x ∈B} .4. que se identifica pela notação A ou A C (lê-se complemento de A). Gilberto S. definidos em S. 6}. ou complementação.4 lançamento de um dado. b) Interseção de eventos: Sejam A e B dois eventos definidos em S. Prof. 5. como se vê a seguir: a) União de eventos: Sejam os eventos A e B contidos em S. 6. ou pelo símbolo A∩ B= {x∈ S/ x∈ A x∈ B} e . cujo símbolo é A ={x ∈S / x ∉A} . Isto equivale à noção de conjunto universo ou conjunto fundamental estudado na teoria dos conjuntos. cuja notação é A ⊂ B . que se identifica pela notação A ∪ B (lê-se A união B). 4. ou x∉A número x de elementos de S não pertencentes a A.1 Operações com eventos Já é sabido que o espaço amostral S abrange todos os resultados possíveis do experimento aleatório ou todos os elementos de uma população de interesse. O evento A = {ocorrer número natural entre 1 e 6} é um evento certo. A união de A com B é dada pelos elementos de S que pertencem a A ou B (ou ambos). UEFS. Aqui a notação x∈A significa número x de elementos de S pertencentes ao evento A. d) Inclusão de eventos: Sejam A e B dois eventos associados ao espaço amostral S. como se verifica nas áreas sombreadas da figura abaixo. se todo elemento de A é também elemento de B. 29/09/2006. Dados os eventos A e B. é formado pelos x elementos de S que não pertencem a A. A interseção de A com B é formada pelos x elementos de S que pertencem simultaneamente a A e B. . 3. c) Complementação de eventos: Seja um evento A contido em S ( A ⊂ S ). O diagrama de Venn-Euller dá uma boa idéia dessa combinação de eventos. Diz-se que A está contido (ou incluído) em B. pois os seus resultados possíveis coincidem com o do conjunto S = {1. ou em símbolos A∪B = {x∈S/x∈A ou x∈B (ou ambos)}. da teoria dos conjuntos. Gramacho.

e a interseção é um evento impossível tal que A ∩ B = Φ . 4. 4. 29/09/2006. e) Distributiva: A ∪(B ∩C) = ( A ∪B) ∩(A ∪C) e A ∩( B ∪C) = ( A ∩B) ∪( A ∩C) . Gilberto S. b) C = {número ímpar} = {1. como se nota na figura abaixo: Figura 6. Exemplo: É possível simular os eventos abaixo. . cujo espaço amostral é S = {1. 2. c) D = {n° inteiro positivo} = {1. Gramacho.1 Diagramas de Venn-Euller Se os eventos A e B não têm qualquer elemento em comum a união é formada pela soma dos seus elementos A ∪ B = A + B . UEFS. f) Idempotente: A ∩ A = A e A ∪ A = A . Φ =S e A = A . S =Φ . d) Comutativa: A ∩ B = B ∩ A e A ∪ B = B ∪ A . com os números referentes ao jogo de um dado. úteis no estudo de probabilidade.5 Figura 6. 5. 6} → D = S (evento certo). 2. Prof. 3. h) Leis de Morgan: A ∩B = A ∪B e A ∪B = A ∩B . 5. d) E = {número menor que a unidade}→ E ={} = Φ (evento impossível). A ∩A = Φ . A ∩S = A e A ∪S = S . 6}. 3. b) Associativa: ( A ∩B) ∩C = A ∩( B ∩C) e ( A ∪B) ∪C = A ∪( B ∪C) . b) B = {número primo} = {2. a) Absorção: A ∪( A ∩B) = A e A ∩( A ∪B) = A . união e interseção de eventos. 5}. 6}: a) A = {número par} = {2. 4. c) Complementares: A ∪A =S . g) Identidade: A ∩ Φ = Φ .2 Diagrama de Venn para A ∩ B = Φ Apresentam-se abaixo algumas propriedades decorrentes de complementação. 3. 3. A ∪ Φ = A . 5}.

5. 3.). pois as probabilidades Prof. em que duas caras ocorrem. o conceito a definir está contido na própria definição. etc. considerando o espaço amostral S = {cc. 3. pois só se aplica a conjuntos com número finito de resultados. 6}. 5}. Porém. pois cara (c) e coroa (k) são igualmente prováveis. extrair cartas de baralho. antes de ser observada qualquer amostra de eventos. 3. l) A ∩B = A ∪B = {1.5. j) A ∪B = A ∩B = {n° que não seja par ou não primo} = {1. kc. 6. Gilberto S. kk}.5 Cálculo de probabilidades 6. é calculada da seguinte maneira: P( A ) = n (A) núm ero de casos favoráveis em A = número de casos possíveis em S n (S) Esta “definição” é muito simples e intuitiva. 4.1 “Definição” clássica Se o espaço amostral S é finito e os seus elementos são igualmente prováveis. i) A ∪B ={nem par nem primo} = {1}.6 e) A ∪ B = {número par ou primo} = {2. P ( A ) = × = . ou seja. 5}. 3. e por isso é bastante utilizada para calcular probabilidades de eventos associados a sorteios e jogos de azar (lançar moeda ou dado. 29/09/2006. 5. Gramacho. a probabilidade do evento A. . ou seja. g) A ={número não par}= {1. 4. definido em S. UEFS. n (S) 4 2 2 4 No caso de duas moedas viciadas. Veja-se que quando duas moedas honestas são lançadas é possível antecipar a probabilidade do evento duas caras (cc). 4. f) A ∩ B = {número par e primo} = {2}. isto é. a fórmula clássica não se aplica. 6}. 3. o conceito clássico não é considerado definição geral de probabilidade. 6}. Com ela se calcula probabilidades a priori. e exige que estes sejam igualmente prováveis. a sua probabilidade é calculada do seguinte modo: P( A) = n (A) 1 1 1 1 = . ck. 5}. m) C ={número não ímpar} = {2. Definindo-se o evento A = {cc}. n) C = C ={inverso de um n° não ímpar}={número ímpar} = {1.

por enquanto. . 29/09/2006. tal que P( A ) = f lim ( i ) . desconhecida. o ponto de estabilização da freqüência relativa funciona como aproximação de P(A). o que é expresso pela fórmula: P(A ) ≅ fi n O gráfico abaixo dá idéia da regularidade da freqüência relativa. Observe-se que se o experimento consiste no lançamento de duas moedas viciadas. Gramacho. Teoricamente. Significa que só será possível avaliá-la mediante a observação empírica das freqüências de cara num grande número de Prof. a probabilidade de um evento A é o limite da freqüência relativa quando o número n de observações tende para infinito. porque a probabilidade elementar de cara (ou de coroa) é. E só poderão ser avaliadas mediante observação da freqüência relativa numa experimentação repetida um número grande de vezes.7 correspondentes aos pontos de S passam a ser diferentes e desconhecidas. representado pela freqüência relativa do acontecimento. n → +∞ n Onde fi =f ri é a freqüência relativa e fi a freqüência absoluta simples. numa série de observações relativamente grande. quando o experimento é repetido um número grande de vezes. Figura 6. UEFS.5. a probabilidade de um evento é um número positivo e menor ou igual a unidade.3 Regularidade da freqüência relativa f ri Como se observa na figura anterior. sob iguais condições. Gilberto S. n Quando n é grande. em repetições do experimento. 6.2 Definição freqüêncial Esta definição propõe que a probabilidade de um evento seja avaliada com base na regularidade das freqüências relativas. não há como antecipar a probabilidade do evento referente a duas caras (cc). um número muito grande de vezes ou mediante verificações em séries históricas.

6. c) P( A ∪B) = (PA ) +P (B) . Gramacho. a fim de deixar a definição a mais abrangente possível. (k) Com efeito. típicos de variáveis contínuas. Então. serão iguais a P(k) = 1 1 2 e P(c) = 2 × → P (c) = . por conseguinte. acha-se P(c) = 2p. Prof. se A e B são mutuamente exclusivos (disjuntos). cujos mais importantes se apresentam adiante. Neste aspecto. faz-se P(c) =2P e P(k) = p. a definição se completa com os teoremas fundamentais. por definição.3 Definição axiomática Para contornar as dificuldades encontradas nas definições anteriores. a definição de probabilidade com base nas freqüências relativas apresenta restrições do ponto de vista matemático. 3 3 9 Apesar de ser muito útil na prática. uma vez que o limite pode não existir. Seja. por substituição. obtidas por substituição. UEFS. no entanto ela é fundamental pela abrangência. 3 3 3 2 2 4 E. Seja A um evento associado a S. a probabilidade de A é uma função definida em S. b) P(S) = 1. pois as suas propriedades possibilitam operar até em espaços amostrais infinitos não-enumeráveis. E lembrando que. Σ p = 1. nas seguintes condições: a) 0 ≤ P (A ) ≤1 . Note-se que esta definição não ensina como avaliar objetivamente uma P(A). um experimento aleatório descrito pelo espaço amostral S. tal que p é uma probabilidade por enquanto desconhecida de coroa. . Se o resultado da experimentação revelar que a freqüência de cara c é duas vezes mais que a de coroa k. 29/09/2006. aí sim será possível calcular a probabilidade de cada ponto de S. que atribui um número real a cada evento simples de S. 3 Com isso as probabilidades de cara e de coroa. por fim. Gilberto S.8 lançamentos. a definição moderna de probabilidade foi desenvolvida com fundamento em axiomas. pode obter-se o valor de p do seguinte modo: 2p +p =1 → =1 → = 3p p 1 . a probabilidade do evento duas caras é P (cc ) = × = .5. E.

quer dizer. O teorema é demonstrado expondo os eventos A∪B e B da seguinte maneira: (i) A ∪B = A ∪( A ∩B) (ii) B = (A ∩B) ∪( A ∩B) A figura abaixo dá idéia de como se efetiva esse tipo de exposição.4 Definição subjetiva Aqui a probabilidade de um evento depende de avaliação pessoal.Se A e B são eventos quaisquer. só poderá ser estimada pelo grau de crença ou expectativa que o especialista tenha sobre o assunto. segue-se que: 1 P P(A) + P( A ) = 1. pois A ∪A = S . então P ( A ) = − (A ) .5. Eis que o evento A e o seu complemento A são mutuamente excludentes.Se A é o complemento de A. Com efeito. 1 P II . de modo meramente subjetivo. 29/09/2006. então P (Φ) =0 . III . Para demonstrar este teorema basta escrever A ∪ Φ = A e aplicar a propriedade c do item 6. a saber: P(A ∪Φ ) = P( A ) →P( A ) +P(Φ) = P(A ) → P(Φ) =P(A) −P(A) =0 → P (Φ ) = 0 . Prof. pois A e Φ são disjuntos. 6. a probabilidade da cotação de uma ação a ser lançada na bolsa de valores subir em médio prazo.5.4 Complementaridade de eventos A Para demonstrar o teorema escreve-se P( A ∪ ) =P(S) .9 6. então: P(A ∪B) = P( A) +P( B) −P( A ∩B) .Se Φ é um evento impossível. . devido a inexistência de dados preliminares. Gramacho.6 Teoremas básicos I .3. Lembrando que P(S) = 1 e que A e A são disjuntos. UEFS. permitindo comprovar que de fato P ( A ) = − (A ) . contando com o conhecimento ou a intuição do pesquisador. como se nota na figura abaixo: Figura 6. Gilberto S.

tal que P( A )≤ ( B). como se faz a seguir: P (A ∪ ) −P ) = P ) + P A ∩ ) −[P B (B (A ( B (A ∩ ) + P A ∩ )] B ( B P (A ∪ ) = P ) + P ) + P A ∩ ) −P B (A (B ( B (A ∩ ) −P A ∩ ) B ( B B Com a eliminação de ±P( A ∩ ) .10 Figura 6. então P(A) ≤ P(B). Demonstra-se o teorema partindo da expressão observa na figura adiante: B =A ∪ A ∩ ) . IV . comprova-se que: P(A ∪B) =P(Α ) + P(Β ) −P(Α ∩B) . o sinal se inverte. resta P(B) −P (A ) ≥ 0 → −P ( A ) ≥− ( B) . as respectivas probabilidades podem ser escritas da seguinte forma: B B (i) P(A ∪ ) =P(A ) +P ( A ∩ ) (B (A B ( B (ii) P ) = P ∩ ) +P A ∩ ) Para comprovar o teorema basta subtrair (i) de (ii).5 Diagrama de Venn para união de eventos Como os eventos de (i) e (ii) são mutuamente excludentes.Se A ⊂ B. Gramacho. Gilberto S. A generalização do teorema para três eventos A. 29/09/2006. ( C cuja ilustração se Figura 6. UEFS. escreve-se: P( B) =P{A ∪ A ∩ )} =P( A ) +P( A ∩ ) → ( B) −P( A ) =P( A ∩ ) ( C B P B B Como P( A ∩ ) ≥0 . . P P Multiplicando a inequação acima por (-1). é representada pela fórmula abaixo: P(A∪B∪C) = P(A) + P(B) + P(C) – P(A∩B) – P(A∩C) – P(B∩C) + P(A∩B∩C).6 Inclusão de eventos tipo A ⊂ B C Como A e ( A ∩ ) são eventos mutuamente exclusivos. Prof. B e C.

B. Exemplo: Do conjunto formado pelas letras A.1 Fatorial Fatorial de um número n é definido como o produto de todos os números naturais de n até 1. ou o número possível de maneiras pelas quais se pode retirar n bolas vermelhas de uma urna onde estão guardadas N bolas de cores azuis. elas poderiam ocupar os quatro assentos de 24 maneiras distintas. Esse recurso é utilizado em probabilidade para determinar o número possível de resultados de um experimento. por convenção.. CABD. DCBA. CDBA. sem precisar de enumeração direta. conforme cálculos a seguir: 4! = 4×3×2×1 = 24 agrupamentos. 6. ADCB. que são: {ABCD. ! 1 2! = 2×1 = 2. o número de arranjos simples de n elementos agrupados de k maneiras é definido por: Prof. BDAC. É representado pela notação n! (lê-se n fatorial) e pela fórmula: n!=n ( n − )( n −2). obtém-se 24 agrupamentos de quatro letras. 6. para 1 n >1 . ! 1 1 = . ABDC. CDAB. Conseqüentemente: 0 = . DBCA. CBDA. BDCA.11 6. brancas e vermelhas. 29/09/2006. Significa que caso fossem reservadas quatro cadeiras num recinto para as quatro pessoas identificadas pelas letras A. ADCB. CBAD.7. ACBD. tal como o número possível de amostras de tamanho n que pode ser extraído de um lote de N peças ( n ≤ N ). C e D. ACDB. 4! = 4×3×2×1 = 24. Gilberto S. BADC.7 Análise combinatória É uma técnica de contagem que se aplica para resolver problemas onde é necessário levar em conta agrupamentos de elementos ou objetos. DABC. CABD. por convenção. B.2 Arranjo simples É um tipo de agrupamento em que um grupo se distingue de outro pela natureza e pela ordem dos elementos. DACB. DBAC. Logo.. C e D. BCDA. . BACD. Gramacho. UEFS. DCAB}. 3! = 3×2×1 = 6. BCAD.7. 1 .

1.7. CA... A 1 = n . diferem quanto à ordem (AB ≠ BA). para n > 1 n Exemplo: Quantas permutações podem ser formadas com as letras A. n Exemplo: De quantas maneiras as letras A.4 Combinação simples Prof. B. para n >1 . Gilberto S. C e D podem ser arranjadas duas a duas? A 2 = 4 × 3 = 12 arranjos. UEFS. CD. 4 Observe-se que A n = n! .(n − k + 1) .7. AC. 1 . BC. para n >1 . AD. CB.7. .. A formação de cada arranjo difere apenas quanto à disposição dos elementos. . de um arranjo de n elementos tomados n a n.. B. cuja fórmula é a seguinte: Pn = A n = n!= n ( n −1)( n − 2). Trata-se. Eis que no arranjo AB os elementos se distinguem pela natureza (A ≠ B). 4 A 3 = 4 × 3 × 2 = 24 arranjos. enquanto que os arranjos AB e BA. tal que A 4 = (4 − 2)! = 2! = (n − k)! 2! 6. 6. n Por conseguinte: 0 A n =1...12 A k = n(n − 1)(n − 2). DB. para k ≤ n. n A 2 = 4 × 3 = 12 arranjos.. BD. constituídos dos mesmos elementos. para k ≤ n. C e D? P4 = 4! = 4×3×2×1 = 24 permutações. O número de arranjos de n elementos k a k é também calculado através da fórmula: Ak = n n! 4! 4! 4 × 3 × 2! 2 =12 . portanto. Gramacho. 29/09/2006. DC}. em que cada arranjo é constituído por todos os elementos do conjunto. 4 A 4 = 4! = 4 × 3 × 2 × 1 = 24 arranjos.3 Permutação simples Permutação Simples é um caso particular de arranjo simples. DA. BA. conforme relação abaixo: 4 {AB. que correspondem ao número de agrupamentos encontrados no exemplo do subitem 6.

isto é: BA.13 É um tipo de agrupamento sem repetição. b) de ocorrer número igual de pontos em ambos os dados.2 6.7. Construa o espaço amostral e defina as probabilidades com relação aos seguintes eventos: a) de a soma de pontos ser um número par.4 1.5 3. B.6 5. k Por definição. Dois dados honestos são lançados simultaneamente.2 4.1 6. AD.5 4.4 4. que são: {AB.1 5. Exemplo 2: Se numa sala existem 10 alunos.5 5. BC.1 4.5 2. 29/09/2006.2 1. .3 3. para k ≤ n. C e D? C2 4 A 2 4× 3 = 4 = = 6 combinações.2 3. Aqui o grupo AB = BA.1 3. Gilberto S. CA. CB.3 5. d) de a soma de pontos ser menor ou igual a 8.6 4. c) de a soma de pontos ser um número ímpar ou primo. 3 C10 = 3 A 10 10 × 9 ×8 = 120 comissões.2 2.4 5. k! k!( n − k )! É também muito comum o emprego da notação ( n ) .1 2.6 6.1 1.3 1.5 1.2. pelo fato de descartar os grupos formados por elementos dispostos em ordem diferente. UEFS. e que se resolve por combinação simples.3 6.4 3.3 2. DB e DC.6 3. BD. CD}. e constitui uma só combinação. A combinação de n elementos tomados k a k é dada através da fórmula: Ck = n Ak n! n = .4 2. C 0 = 1 e C1 = n. no qual uma combinação difere da outra somente pela natureza dos elementos e a ordem dos elementos não importa. 2! 2 ×1 Esse conjunto é a metade do número de arranjos tomados 2 a 2. Gramacho.3 4.4 6.6 Prof. AC.2 5. n n Exemplo 1: Quantas combinações de dois elementos são obtidas com as letras A.6 2.5 6. ■ Solução: O espaço amostral relativo ao jogo de dois dados é: 1. = 3! 3 × 2 ×1 Exercícios Resolvidos 01. quantas comissões de três alunos podem ser formadas? Este é um tipo de problema no qual a ordem dos indivíduos não tem importância. encontrado no exemplo do subitem 6. DA.

36 I∪P ={nº impar e primo}= {(1. (4. (3.2). b) verdes. (6.2). (2. c) de cores diferentes. (6. (3.4).6). Gilberto S. (2.2).2).5)}: I ∪P = 12 . Na mesma situação da questão 04. (4. (2.4).3).6).2). (5. 36 18 13 12 19 + − = .1). (5. (5.1). (5. o número de elementos de cada evento pode ser determinado através de combinação e de arranjo simples. (6. (1.2). d) uma azul e a outra branca. ou verdes..6). (6. (5. (2.1).1).1). (1. (4.3). (3.1).3).4).1). (6.5). Eis a solução: ) a) A = {a bola é de cor azul}: P(A = 5 ..6)}: P( B) = c) I = {nº ímpar}= {(1..5). (6. (4. (1.5). (4. UEFS.6).1). (2. 36 2 6 1 = .1). (3.6). (1. 36 6 b) B ={números iguais} = {(1.2). Prof.4). 36 36 36 36 26 13 = . Gramacho.5). (3. (6. a) As duas bolas podem ser azuis.2). (5. Dentro de um saco há 12 bolas: 5 azuis.4). (2. . f) pelo menos uma branca. e) a primeira azul e a segunda branca. (6. (2. (3. c) azul ou branca.6). (5.5). (5.3). (6. (4. (6. (2.5). (5. (1.6).2).1). (1.5)}: P(I) = 18 .5). b) branca.1). 36 18 P(I ∪P ) = P(Ι ) + P(P ) − P(Ι ∩P ) = d) D = {número ≤ 8} = {(1. (2.5)}: P( P) = 13 . (4.3). 12 3 5 4 9 3 + = = 12 12 12 4 b) B = {a bola é de cor branca}: P(B) = c) A∪B) = {a bola é azul ou branca}: P(A ∪B) = P(A ) + P(B) = 03. (1. calcule a probabilidade de ela ser de cor: a) azul. (4.6)}: P(A) = 18 1 = . (6. (3. (4.1).3).4). (3.6).3). (6. (4. (1. ■ Solução: Como as bolas são sorteadas sem reposição.6).4). (4. Calcule a probabilidade de ambas serem: a) da mesma cor. 36 P = {nº primo} = {(1.4).2).2)}: P(D) = 02. 12 4 1 = .14 a) A = {(1. duas bolas são retiradas sem reposição.4).1). (3.3).(1.2). ou brancas.4). 29/09/2006.5). (5. (2. (5. (2.1). 4 brancas e 3 verdes.4). Se uma bola é retirada ao acaso.3).1).

C1 C1 5 × 3 15 . 21 21 21 21 21 21 Prof. P (4) =4p. p ∑ i P(3) =3p. 29/09/2006. P(2) = . 12 ×11 66 33 e) P(A ∩ B) = A1 A 1 5 4 2 A12 f) P(pelo menos uma branca) =1 . 66 22 c) P(ambas de cores diferentes) = =1 −[P(A 1 ∩A 2 ) + P(B 1 ∩B 2 ) + P(V 1 ∩V2 ] =1 − 19 47 = .15 2 2 C5 + C2 + C3 4 2 C12 P(A 1 ∩ A 2 ) + P(B 1 ∩ B 2 ) + P(V1 ∩ V2 ) = 5 × 4 4 × 3 3× 2 + + 2 ×1 2 ×1 2 ×1 = 10 + 6 + 3 = 19 . Gramacho. Gilberto S. É preciso calcular P( A ∩V ) . 66 66 33 5 × 4 10 5 = = (há especificação da ordem). 6 é duas vezes mais provável que 3. substituindo-se o valor de p nas expressões acima 21 definidas se obtém: a) P(1) = 1 2 3 4 5 6 . Determine: b) a probabilidade de ocorrer a face 3 ou a face 5 num único lançamento. P(4) = . (1 ■ Solução: Sejam P ) =p. 66 66 d) P(A ∩ B) = C1 C1 5 4 2 C12 = = 5 × 4 20 10 = = (não há especificação da ordem). pois os demais termos já são conhecidos.[P(A 1 ∩A 2 ) + P(A ∩V) + P(V 1 ∩V2 ] . Por conseguinte. isto é. P ) =6 (6 p. P( A ∩ V ) = 5 3 = = 66 66 66 P = 1 − ( 16 06 + 636 + 16 56) = 1 − 62 68 = 1 − 13 93 → P = a) a probabilidade de cada ponto amostral. 14 33 04. . UEFS. P(3) = . P(5) = e P(6) = . = 12 ×11 66 66 2 ×1 b) P(V1 ∩ V2 ) = 2 C3 2 C12 = = 3 1 = . Um dado é viciado tal que a probabilidade de dar um dos números de cada face é proporcional ao seu valor. P(5) =5p e Eis que por definição =1 ⇔ p + 2p + 3p + 4p +5p + 6p = 1 → 21p =1 →p = 1 . P(2) =2p.

para n(A) ≠ 0. então a probabilidade de B dado que A tenha acontecido é definida pela fórmula: P(B / A) = P( A ∩B) . (C (B (C ) ) ■ Solução: Sejam P ) =p . p Eis que ∑ i =1 →4p + 2p + p =1 →7p =1 →p = 1 2 4 ) ) ) a) P(C = . para P ) P( B) >0 . b) a probabilidade de B ou C ganhar a prova. UEFS. P ) =2P ) =2p e P(A =2P(B =4p . Gilberto S. a probabilidade de B dado A pode ser calculada diretamente por meio da fórmula: P(B / A) = n ( A ∩B) . vem: 7 b) P(B ∪C ) = P(B) + P(C) = 2 1 3 + = . Sendo S um espaço amostral equiprovável. P ( A / B) = P ( A ∩B) (B . P(A) A probabilidade P(B/A) mede a probabilidade relativa dos elementos comuns aos eventos A e B em relação ao espaço amostral reduzido A. como se vê na área colorida da figura adiante: Figura 6. .9 Teorema do produto Prof.7 Diagrama para a condição B/A Alternativamente.8 Probabilidade condicional Se A e B são eventos associados ao espaço amostral S. 21 21 21 05. substituindo. 7 7 7 6.16 b) P(3 ou 5) = P(3) + P(5) = 3 5 8 + = . n (A) 6. P(B = e P(A = . Os atletas A. 7 7 7 1 . Sabe-se que o atleta A tem 2 vezes mais probabilidade de ganhar que B. Calcule: a) as probabilidades de vitória de cada um. B e C disputarão uma prova de atletismo. e que B tem 2 vezes mais probabilidade de ganhar que C. Gramacho. 29/09/2006. Logo. para P(A) > 0.

9.2)} Prof. haverá então dependência entre eles. forem eventos dependentes. An .. A2. UEFS..2 Eventos independentes Um evento é independente quando a sua ocorrência não afeta a de outro ou vice-versa. Gilberto S. Em geral. 6. Se alguém informa que ocorreu soma igual a 8. a regra do produto para dois ou mais eventos é mais simples: P(A ∩B) =P(Α )×P(Β ) . ∩ A n ) = P( A 1 ) × P( A 2 / A 1 ) ×. . An .6). A independência acontece em sorteios ou processos de amostragem com reposição. .3). P(A ∩B ∩C ) = P ( A ) ×P ( B) ×P (C) . (5... São exemplos típicos de eventos dependentes os casos de sorteios ou amostragem sem reposição. ou. × P( A n / A 1 ∩ A 2 ∩. (A P /A (B ) =P ) (B e Exercícios resolvidos 01....9. P( A ∩B ∩C) = P( A ) ×P( B / A ) ×P(C / A ∩B) . Um par de dados é lançado. qual a probabilidade haver ocorrido a face 3 em um deles? ■ Solução: Definem-se os eventos A e B da seguinte forma: A = {soma de pontos igual a 8) → A = {(2. Nesse caso.. Genericamente. ∩ A n −1 ) 6. × P(A n ) Se A e B são eventos independentes.. A sua correta aplicação depende da identificação de dependência ou independência entre eventos. A fórmula do produto para dois ou mais eventos é: P( A ∩B) = P( A ) ×P( B / A ) ... ..5). (6. Gramacho..17 Este teorema decorre da definição de probabilidade condicional e serve para calcular probabilidades referentes a um produto de eventos.1 Eventos dependentes Sejam dois eventos A e B associados a um experimento. Se a ocorrência de A influencia B. se A1. (4.... então: P(A 1 ∩A 2 ∩.. forem eventos dependentes.. se A1.4). então: P( A 1 ∩ A 2 ∩.. (3. A2. ou vice-versa. ∩A n ) = P(A 1 ) × P(A 2 ) ×. valem as relações: P /B (A ) =P ) . 29/09/2006..

logo o total de 2 somas com os dígitos 1. B = {alunas} = {60% do total de estudantes}= 60 alunas.3). 5 e 7}.5). será C 2 = 6 somas. Na biblioteca de uma universidade. Sendo 5 azuis. Prof. 4 ● Por sua vez. UEFS. 6 e 8 é c 2 = 6 somas. 29/09/2006.20 × 40 + 0. ● A soma de dois números é par se ambos forem impares ou ambos forem pares. (3. 17 04. c) ambas serem de cores diferentes. A∩B ={é aluna e está estudando estatística} = {15%} = 9 alunas.15× 60 = 8 + 9 = 17 alunos. Se um estudante é escolhido aleatoriamente e está estudando Estatística. Gramacho. em dado momento. d) uma bola azul e a outra branca. P( A ) 16 03.53 . . (6.3). A =10 + 6 =16 somas pares. sem reposição. Portanto. onde 40 são alunos e 60 são alunas.1). o total de somas com os números 2.3). determine as probabilidades de: a) ambas serem da mesma cor. A∩B = {soma igual a 8 e dando a face 3} = {(3. Gilberto S.3)} P(B / A) = P( A ∩B) 2 = P(A) 5 02. com relação ao evento B. e) a primeira azul e a segunda branca. ● Por conseguinte. Se a soma deles é par. 4.2).3). (2.3). (3. Veja que A ∩ B = {soma dois a dois de 3.3). logo: A = {estudando estatística} = 0. e o total de soma 4 2 desses números é C 3 = 6 somas. 20% dos alunos e 15% das alunas estão estudando Estatística. (3. (3. P(B/A) = 9 = 0. qual a probabilidade de ser uma aluna? ■ Solução: Sejam 100 estudantes. (5.5). (4. Enquanto que com os dígitos 2. b) ambas serem verdes. dois a dois. 5. 4 brancas e 3 verdes. (3. f) pelo menos uma bola branca. (3.6)}. Dois dígitos são selecionados aleatoriamente de 1 a 9. Sabe-se que dentro de uma sacola existem 12 bolas. As alunas representam 60% dos estudantes presentes. P( B / A ) = P( A ∩B) 3 = . qual a probabilidade de ambos os números serem primos? ■ Solução: Sejam os eventos A = {soma dos números é par} e B = {ambos são primos}. 5 e 7. 7 e 9 é C 5 = 10 . Se forem retiradas duas bolas. 3.4). (5.18 B = {dar a face 3} = {(1. 3.

agora ele será resolvido pela regra do produto. admitindo que as bolas são extraídas com reposição. Gilberto S. a) P(A 1 ∩A 2 ) + P(B 1 ∩B2 ) + P(V1 ∩V2 ) = 5 ×5 4 ×4 3 ×3 25 +16 + 9 50 25 + + = = = 12 ×12 12 ×12 12 ×12 144 144 72 b) P(V 1 ∩V2 ) = P(V 1 ) × P( V2 ) = c) C = {ambas de cores diferentes} 3 ×3 9 1 = = . sem prejudicar o conceito de independência. 12 ×12 144 16 25 47 = . 12 ×11 12 ×11 12 ×11 132 132 33 05. pois os eventos ocorrem em urnas diferentes. para eventos dependentes. b. 29/09/2006.[P(A 1 ∩ A 2 ) + 2P(A ∩ V) + P(V1 ∩V2 )] P( E ) = 1 − ( 5×4 5 ×3 3×2 20 + 30 + 6 56 19 +2 + ) =1 − =1 − = . uma ficha é sorteada aleatoriamente na urna A e posta na urna B. sorteia-se uma ficha em B. Sorteia-se uma ficha em cada urna. c) ambas da mesma cor. qual a probabilidade de ela ser verde? ■ Solução: Aqui o sorteio pode ser feito com ou sem reposição de fichas. Gramacho. UEFS. Depois. Outra urna B contém 3 fichas verdes e 2 pretas. do problema 04. b) ambas de cores diferentes. 12 ×11 33 e) E = {pelo menos uma branca}: P( E ) =1 . e) agora. d) pelo menos uma de cor verde.19 ■ Solução: Este problema já foi feito por análise combinatória. e c. . então a probabilidade de: a) As 2 fichas serem pretas. 72 72 P (C) =1 −[P(A 1 ∩A 2 ) + P(B 1 ∩B 2 ) + P(V 1 ∩V2 )] =1 − 06. ■ Solução: Aplica-se a regra do produto para eventos independentes. Resolva os itens a. Prof. Uma urna A contém 5 fichas verdes e 3 pretas. Calcule. a) P(A 1 ∩ A 2 ) + P(B 1 ∩ B 2 ) + P(V1 ∩ V2 ) = 5×4 4 ×3 3×2 20 + 12 + 6 19 + + = = 12 ×11 12 ×11 12 ×11 132 66 b) P(V 1 ∩V2 ) = P(V 1 )P(V 2 /V1 ) = c) C = {ambas são de cores diferentes} 3 ×2 1 = 12 ×11 22 19 47 = 66 66 P (C) = 1 − [P(A 1 ∩ A 2 ) + P(B 1 ∩ B 2 ) + P(V1 ∩ V2 )] = 1 − P(A ∩ B) + P(B ∩ A) = 2P(A ∩ B) = 2 × 5×4 10 = . 12 ×11 33 d) P(A ∩ B) = 5 ×4 5 = (a ordem é especificada).

eventos que formam uma partição do espaço amostral S. tal que a união de todos eles é igual a S.. Gilberto S. UEFS.20 a) P(P A ∩ PB ) = P(P A ) × P(P B ) = 3 2 3 × = . A2 . 20 20 3 3 5 4 9 + 20 29 = e) P( V / B) = P( PA ) P( VB / PA ) + P( VA )P( VB / VA ) = × + × = 8 6 8 6 40 48 08. mutuamente exclusivos.10 Teorema da probabilidade total Sejam A1. 8 5 20 5 2 3 3 10 +9 19 = b) P(VA ∩PB ) ∪P( PA ∩VB ) = × + × = 8 5 8 5 40 40 3 2 5 3 6 +15 21 = c) P( PA ∩PB ) ∪P( VA ∩VB ) = × + × = . portanto. 8 5 8 5 40 40 d) P(pelo menos uma verde) = 1 − P (PA ∩PB ) = 1 − 3 17 = . quando já se conhecem todos os eventos da família Ai. Se ambos atiram 4 vezes. A probabilidade de um atirador A acertar um alvo é igual a ½. . 2 3 16 81 81 b) B = {pelo menos um deles acertar o alvo}: P( B) =1 − 1 80 = . 81 81 6. tem-se: 1 2 1 16 1 a) P[( A ) 4 ∩( B) 4 ] = P( A × A × A ×A ) × P( B × B ×B × B) = ( ) 4 ( ) 4 = × = . A probabilidade de outro atirador B acertar o mesmo alvo é de 1 3 . An.. isto é. qual a probabilidade de: a) nenhum atirador acertar o alvo? b) pelo menos um dos atiradores acertar o alvo? ■ Solução: Aqui o desempenho de um atirador não influi no desempenho do outro. os eventos Ai são. dois a dois. Gramacho.8 Partição de eventos Ai e interseções com o evento B Prof. E seja B um evento qualquer de S. Sendo assim. e com estes se intercepta. 29/09/2006. os eventos A e B são independentes. na forma da figura abaixo: Figura 6.

a probabilidade de B.5% na máquina A e 5% na B. Gramacho.. Pelo teorema do produto para eventos dependentes. A máquina B. = 0. onde P(B) ≠ 0. mais moderna. i i i= 1 n segue a fórmula geral P( A i / B) = P(A i )P(B / A i ) ∑P(A )P(B / A ) i i i =1 n . Se uma garrafa for retirada casualmente para teste de qualidade. mais antiga.015 → .. Os percentuais de unidades defeituosas são de 1. UEFS. b) Se ela é defeituosa.0255 (D /D b) P(A ) = +P(B )P(D ) /B =0. ∪P( A n ∩B) →P( B) =  P(A i= 1 n i ∩B) . Exemplo: Numa pequena fábrica de garrafas térmicas a máquina A. 29/09/2006. P(A )P(D ) /A P(D ) Prof. P (B) P(B) = Como ∑P(A )P(B / A ) .18% . responde pelas 30% restantes.4118 ou 41.0255 →P(A ) /D =0. ) )P(D ) /A a) P(D =P(A P ) =0. ou.015 +0.05 =0. i i i= 1 n 6. calcule: a) a probabilidade de ela ser defeituosa. tal que: P( B) = P( A 1 ∩B) ∪P( A 2 ∩B) ∪.0105 0.. + P(A n )P(B/A n ) . qual a probabilidade de ter sido produzida pela máquina A? ■ Solução: Seja o evento D = {a garrafa é defeituosa}. dado que um dos eventos A i tenha ocorrido. ainda: P(B) = ∑P(A )P(B / A ) .7 ×0. é expressa pela união das interseções de todos os eventos Ai com B. . por meio da fórmula: P( A i / B) = P( A i ) P( B / A i ) . responde por 70% das unidades produzidas.3 ×0. Gilberto S.0105 +0.21 Então.11 Teorema de Bayes O teorema de Bayes serve para calcular a probabilidade de um particular evento Ai dado que B aconteceu. deduz-se que: P(B) = P(A 1 )P(B/A 1 ) + P(A 2 )P(B/A 2) + ..

tal que X : S →R . Gramacho. UEFS. é uma função que tem domínio em S e contradomínio em R (a reta dos números reais). 29/09/2006. Prof. .1 Definição Variável aleatória (va) é uma função real definida sobre os eventos do espaço amostral S. Gilberto S. Neste particular.22 Exercícios Propostos (ver lista de exercícios já distribuída) 7 VARIÁVEIS ALEATÓRIAS UNIDIMENSIONAIS 7.

23
O estudo de variáveis aleatórias é importante porque nem sempre os pontos do espaço amostral são numéricos, sendo então necessário descobrir um meio de transformá-los em números, através de uma função chamada de variável aleatória, que facilita o cálculo de medidas estatísticas.

7.2. Variável aleatória discreta
Variável aleatória discreta (vad) é uma função que associa um único número real a cada evento de uma partição do espaço amostral S. São variáveis que resultam de processos aleatórios em que os possíveis resultados são casuais e formam um conjunto enumerável, a exemplo do número de pacientes atendidos num hospital, ou de furtos de veículos numa cidade. Já se viu que quando se lançam duas moedas o conjunto de resultados possíveis do experimento é de quatro seqüências de dois elementos (cara e coroa), representadas pelo espaço amostral S = {kk, kc, ck, cc}. Mas essa representação de S não é das mais adequadas para operações matemáticas, ensejando que a expressão qualitativa de cada evento de S seja definida como um ponto de uma variável aleatória, fazendo-se, por exemplo, x = número de caras. Assim o mesmo espaço amostral se transforma no conjunto numérico S = {0, 1, 2}, em que o ponto zero corresponde ao evento duas corroas (kk), um aos eventos cara e coroa e vice-versa (ck e kc) e dois ao evento duas caras (cc), conforme se observa no quadro adiante.
Quadro 7.1 – Variável aleatória relativa ao lançamento de duas moedas Eventos A1 = {kk} A2 = {kc, ck} A3 ={cc}
X

= número de caras 0 1 2

Seja ainda uma amostra ao acaso de uma peça de um lote produzido em certo dia. A peça pode ser classificada em defeituosa (d) ou perfeita (p), tal que S = {d, p}. Eis que essa classificação pode ser expressa através de números, tal como zero para peça defeituosa e um para peça perfeita, de modo que S = {0, 1}. Aí os pontos do espaço amostral representam uma variável aleatória do tipo x = peça defeituosa, como exposto na tabela abaixo.
Quadro 7.2 – Definição de uma vad para a amostra casual de uma peça Eventos D = {a peça é defeituosa} P = {a peça é perfeita}
X

= peça defeituosa 0 1

Prof. Gilberto S. Gramacho, UEFS, 29/09/2006.

24
A essa altura dá para perceber que a definição de uma vad visa facilitar o tratamento matemático, uma vez que às vezes os pontos do espaço amostral são atributos, sendo necessário transformá-los em números, mediante uma função de variável aleatória.

7.2.3 Distribuição de probabilidade de variável aleatória discreta
Definição: É uma função P(X) que associa probabilidades aos valores da vad X. Isto é,

quando uma vad X assume os valores x 1 , x 2 , ..., x n , com as respectivas probabilidades
p( x 1 ) , p( x 2 ) ,..., p( x n ) , definidas por uma P(X), em que a soma dessas probabilidades é

igual a um, tem-se a dita distribuição de probabilidade de X, como resumido no quadro abaixo:
Quadro 7.3 – Distribuição de probabilidade da vad X X P(X)

x1

x2

... ...

xn p( x n )

p ( x 1 ) p( x 2 )

∑p( x
i =1

n

i

)

Assim, o conjunto [X, P(X)] é chamado de distribuição de probabilidade de X, onde P(X) é a função de probabilidade que associa a cada valor da vad a probabilidade do evento correspondente, de maneira que p(x i ) = P(X = x i ) = P(A i ) , para i = 1, 2, ..., n. Intuitivamente, uma distribuição de probabilidade equivale a uma distribuição de freqüências relativas para os resultados do experimento aleatório, em que exprime a probabilidade ou chance com que cada resultado da vad pode acontecer quando o experimento é realizado um número grande de vezes. Em suma, a cada possibilidade do acontecimento é atribuída uma probabilidade. O estudo de distribuições de probabilidade é importante em inferência estatística, pois a suposição sobre propriedades de uma população, com base em dados de amostras, se fundamenta em distribuições teóricas de probabilidade. Em casos mais simples é fácil elaborar uma distribuição de probabilidade mediante quadros ou gráficos, como se verifica no lançamento de duas moedas, onde x é a vad número de caras:
Quadro 7.4 – Distribuição de probabilidade referente ao número de caras no lance de duas moedas Eventos A1 = {kk} A2 ={kc, ck }
X

= nº de caras 0 1

P(X = x i )

¼ ½

Prof. Gilberto S. Gramacho, UEFS, 29/09/2006.

25
A3 = {cc} Total (Σ) 2

¼
1

Esta distribuição de probabilidade está representada na figura abaixo:

Figura 7.1 Distribuição de probabilidade relativa ao número de caras no jogo de duas moedas

Outra ilustração similar é a distribuição de probabilidade relativa ao jogo de um dado:
Quadro 7.5 – Distribuição de probabilidade do número de pontos no jogo de um dado
X

= número de pontos 1 2 3 4 5 6 Total (Σ)

P(X = x i )
1/6 1/6 1/6 1/6 1/6 1/6 6/6 = 1

O gráfico desta distribuição se observa na figura a seguir:

Figura 7.2 Distribuição de probabilidade da vad relativa ao jogo de um dado

Quando o experimento se refere ao jogo de dois dados, a elaboração da distribuição de probabilidade é mais trabalhosa, embora ainda se possa representá-la através de quadro ou gráfico, como se vê adiante, onde X é uma vad igual à soma possível de pontos nos dois dados:
Quadro 7.6 – Distribuição de probabilidade – vad referente ao número de pontos no lance de dois dados

Prof. Gilberto S. Gramacho, UEFS, 29/09/2006.

como se verá no capítulo adiante. (5:5).26 X = número de pontos 2 3 4 5 6 7 8 9 10 11 12 Eventos (1:1) (1:2). (3:4). (6:2) (3:6). (6:5) (6:6) P(X = x i ) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36 Total (Σ) 36/36 = 1 A representação gráfica da distribuição anterior se encontra na figura a seguir: Figura 7. em que X é igual ao número de pontos que se pode obter. (4:2). Gilberto S. Gramacho. Essa função é F(x) = P(X ≤ x i ) .4 Função distribuição acumulada É uma função que dá a probabilidade de a vad X assumir um valor menor ou igual a x i . (5:3).2. (4:5). (3:1) (1:4). (4:1) (1:5). segue-se função distribuição pertinente: Quadro 7. (3:5).3 Distribuição de probabilidade do número provável de pontos no lançamento de dois dados Nem sempre é possível estabelecer distribuições de probabilidade de modo tão direto como nos casos visto até aqui. (2:2). (2:3). (4:3). (2:4). 7. (5:2). (5:4). (6:4) (5:6). (2:5). 29/09/2006. há situações em que a probabilidade de eventos só pode ser definida por modelos apropriados. (6:1) (2:6). (5:1) (1:6).7 – Função distribuição referente ao número de pontos no jogo de dois dados X P(X) 2 3 4 5 5 7 8 9 10 11 12 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36 P(X ≤ x i 1/36 3/36 6/36 10/36 15/36 21/36 26/36 30/36 33/36 35/36 1 ) Prof. Para o caso dos dois dados. (3:2). UEFS. . (2:1) (1:3). (6:3) (4:6). (4:4). (3:3).

e assim por diante.5 Valor esperado de uma variável aleatória discreta Se X é uma vad de valores x 1 . assim. Gramacho. p n . o número esperado de pontos relativo ao lançamento dos dois dados pode ser calculado com os operadores do quadro abaixo: Quadro 7. e probabilidades p1 . 29/09/2006.. 1 2 3 6 P ( X ≤4) = + + = é a probabilidade de ocorrer no máximo quatro pontos no 3 6 3 6 3 6 3 6 mesmo caso.8 – Número esperado de pontos da vad relativa ao arremesso de dois dados X 2 3 4 5 6 7 8 9 10 11 12 Total (Σ) P(X) 1/36 2/36 3/36 4/36 5/36 6/36 XP(X) 2/36 6/36 12/36 20/36 30/36 42/36 40/36 36/36 30/36 22/36 12/36 252/36 = 7 5/36 4/36 3/36 2/36 1/36 36/36 = 1 Verifica-se. .. cuja fórmula é: E(X) = x 1 P( x 1 ) + x 2 P( x 2 ) + . Prof...é 3 6 3 6 3 6 a probabilidade de se obter no máximo três pontos no jogo de dois dados.2.. + x n P ( x n ) → E(X) = ∑ x i P ( x i ) i =1 Deste modo. p 2 . que E(X) ou µ = 7 pontos. . x n .. x 2 . UEFS. 7. P ≤ ) = 1 2 3 + = .27 1 (X ≤ ) = 3 (X ≤x i ) são interpretados da seguinte maneira: P Os valores de P éa 3 6 (X 3 probabilidade de se obter dois pontos no jogo de dois dados. o valor esperado de X é igual ao valor médio da variável. n respectivamente. Gilberto S... .

Assim.83 −7 2 =54 . cujo resultado corresponde ao desvio padrão. Quanto menor é o valor da variância maior é a concentração de probabilidades em torno do valor médio da variável aleatória. cuja fórmula se vê seguir: σ 2 =[E (X 2 )-E ) (X 2 ] =[E (X 2 ) .4 pontos. .9 – Cálculo da variância da vad referente ao número de pontos no lance de dois dados X 2 3 4 5 6 7 8 9 10 11 12 Total (Σ) P(X) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36 36/36 = 1 XP(X) 2/36 6/36 12/36 20/36 30/36 42/36 40/36 36/36 30/36 22/36 12/36 252/36 = 7 X2P(X) 4/36 18/36 48/36 100/36 180/36 294/36 320/36 324/36 300/36 242/36 144/36 1. o que pode gerar confusão na hora da interpretação.28 7.2. UEFS. através da sua raiz quadrada. 29/09/2006. vem: 2 σ 2 =[ ∑x i P ( x i ) −( ∑x i P ( x i ) 2 ] ou σ 2 = ∑x i2 P( x i ) −μ 2 . Gilberto S.μ2] Como E ( X ) = ∑x i2 P ( x i ) e μ = ∑x i P( x i ).83 −49 →σ =5.83 pontos (ao quadrado). σ =54 . Prof. Portanto. isto é. a variância da vad referente ao número de pontos quando se lançam dois dados é calculada a partir dos operadores expostos no quadro a seguir: Quadro 7.83 2 2 Portanto. como segue: σ = var iância →σ = 5. A variância é uma medida de dispersão expressa no quadrado da variável. Calcula-se também a variância por meio da fórmula σ 2 = Σ( x i −μ ) 2 P ( x i ) . É identificada pelas notações Var(X) ou σ 2 . Gramacho. é melhor expressá-la na mesma unidade da variável original.83 = 2.6 Variância de uma variável aleatória discreta A variância é uma medida de concentração de probabilidades da vad em torno da média.974/36 = 54.

sendo X uma v. c) P(a ≤ x ≤ b) = ∫f ( x )dx (probabilidade correspondente à área sob a curva limitada a b pelo intervalo compreendido entre x = a e x = b). elabore a distribuição de probabilidade e a sua representação gráfica. 3/8. R: 4/35. em 3 lançamentos. UEFS.1 Função densidade de probabilidade Aqui a distribuição de probabilidade é definida por uma função f(x). Gilberto S. As bolas pretas são retiradas uma a uma até esgotar o seu estoque. 3/8 e 1/8. 12/35 e 1/35. Três peças são retiradas de um lote onde há 15 perfeitas e 5 defeituosas. Gramacho. Sendo X = número de bolas pretas. Uma moeda é jogada 3 vezes. calcule: a) A distribuição de probabilidade. Dado que X é o número Prof. 29/09/2006. que deve satisfazer às condições abaixo: ) a) f(x ≥0 . 7. igual ao número de caras. 9/64. 27/64 e 27/64. 34/35 e 35/35. quando do estudo da distribuição normal. chamada de função densidade de probabilidade (fdp). Exercícios 01. a probabilidade é igual a zero. Para valores fora do intervalo a que se limita o experimento. Se uma moeda é viciada de modo que a ocorrência de cara é duas vezes mais provável que coroa.29 Significa que quando dois dados são lançados o número esperado de pontos é 7. 03. 1 definida por f(x) vale um). 22/35. ∀x ∈R . sujeito a uma variação média de mais ou menos 2. c) O valor esperado e o desvio padrão de X. 04. R: 1/8. Este assunto será mais detalhado adiante. R: 1/64. . b) A função distribuição F(x). determine a distribuição de probabilidade referente ao número de caras. 02. a.3. R: 4/35.4 pontos. ou curva de freqüência. R: 9/7 e respectivamente.3 Variável aleatória contínua Uma variável aleatória é contínua (vac) quando assume infinitos valores num dado intervalo (a. + ∞ b) − ∞ ∫f ( x )dx = (toda a área sob a curva de probabilidade. 7. 18/35. Numa caixa estão guardadas 4 bolas brancas e 3 pretas. b).

90/684 e 6/684 8 Prof. defina a distribuição de probabilidade correspondente. R: 0. 29/09/2006. 0. Gramacho. 315/684. 0. caso as peças sejam: a) Extraídas com reposição. Gilberto S.02.30 de peças de defeituosas. b) Extraídas sem reposição. R: 273/684.14 e 0. UEFS.42.42. .

se a pergunta se refere a peça defeituosa. são modelos que descrevem o comportamento de variáveis passíveis de medição. Gramacho. então sucesso deve ser entendido como a ocorrência de peça defeituosa. desde que a amostra represente uma fatia muito pequena da população). a exemplo de sorteios com reposição (ou sem reposição. a exemplo.. que consistem numa experiência aleatória com apenas duas possibilidades. por exemplo. a utilização da distribuição binomial apóia-se nas seguintes hipóteses: a) n tentativas ou provas independentes. Para isso existem alguns modelos de distribuição que são utilizados para estudar o comportamento de muitos fatos reais. As distribuições de probabilidade dividem-se em discretas e contínuas. da distribuição normal e da distribuição t de Student. O estudo de distribuições de probabilidade é fundamental em inferência estatística. entre outras. pois as suposições sobre propriedades de populações. 29/09/2006. Gilberto S. isto é. sucesso ou fracasso. com base em dados de amostras. Em casos assim.1. As distribuições contínuas. Neste aspecto. dependem de como se distribui a variável na população. Mas ocorrem situações mais complexas em que é preciso recorrer-se a modelos para calcular probabilidades associadas aos eventos da variável aleatória. por seu turno. Essas distribuições apresentam particularidades próprias que facilitam a sua identificação. denotadas por sucesso ou insucesso. Prof. As discretas descrevem variáveis cujos eventos podem ser contados e representados por números inteiros. 8. UEFS. Por exemplo: Deu cara no lançamento de uma moeda? Um eleitor votou em determinado candidato? Há peças defeituosas num lote de peças produzidas em determinado dia? Os termos sucesso e insucesso devem ser interpretados com cuidado.31 DISTRIBUIÇÕES TEÓRICAS DE PROBABILIDADE Já foi dito que quando a variável tem comportamento simples é fácil expor a distribuição de probabilidade através de tabela ou gráfico. Distribuição binomial É uma distribuição discreta que se aplica a processos conhecidos como de Bernoulli. e podem ser colocadas como perguntas de resposta sim ou não. b) cada tentativa só admite dois resultados. a variável aleatória apresenta valor igual a 0 (zero) quando ocorre insucesso e 1 (um) quando ocorre sucesso. . A distribuição binomial e a distribuição de Poisson são exemplos clássicos de distribuições discretas. podem assumir infinitos valores num dado intervalo. Sendo que sucesso corresponde ao número de eventos em que se está interessado.

Nesta fórmula o termo n é o número de provas. que se representa por X ≈ B( n . 2 3. Neste contexto. A distribuição binomial é utilizada para avaliar probabilidades de eventos relacionados com controle de qualidade. mercado de ações. . Gilberto S. a probabilidade de k sucessos em n tentativas ou provas independentes é calculada por intermédio da fórmula: P( x = k ) = C k p k q n −k . p) e se lê x tem distribuição binomial de parâmetros n e p. A distribuição binomial tem média μ = np e variância σ2 =npq . C k n é o número de maneiras distintas de se obter k sucessos em n provas. basta que se defina a vad X = número de caras (sucesso). Assim. e P( x =0) =q n é a probabilidade de nenhum sucesso. etc. Aqui a probabilidade dos respectivos eventos. 29/09/2006. 2.. a jogada de uma moeda caracteriza a mais elementar das distribuições binomiais.. Gramacho. 1 / 2) . No entanto. A fim de contornar eventuais dificuldades com a operação da fórmula da distribuição binomial. n n. 1. ambos com a mesma probabilidade de 1 . recomenda-se que n não exceda a 30 ocorrências (n≤ 30). vendas. UEFS. k é o número de sucessos em n provas. 3 2 2 2 4 Prof.. para x =0. cara (c) ou coroa (k). As quantidades n e p são os parâmetros da distribuição. é calculada assim: a) nenhuma cara. análise demográfica. cujos eventos são {ckk. para uma binomial do tipo X ≈B(3. que podem ser calculados um a um pela distribuição binomial sem precisar de enumeração direta.32 c) a probabilidade de sucesso é p e a de fracasso ou insucesso é q =1 − p . quando se joga uma moeda três vezes há uma combinação de 2 resultados possíveis. ou n = 3 e p =q =1/ 2 . kck e kkc}: P(x = 1) = C1 ( 1 )1 ( 1 ) 3− 1 = 3 × 1 × 1 = 3 / 8 . pois admite apenas dois resultados possíveis. 1. 2 8 b) uma cara. que deve assumir os valores 0. representada pelo evento {kkk}: 0 P( x = 0) = C 3 ( 1 ) 3 = 1× 1 = 1/ 8 . risco de apólices de seguro. que são complementares entre si e permanecem constantes durante todo o processo de observação. .

havendo 0 0 até quem admita p < . quando n tende para mais infinito ( n → + ∞ ) e p tende para zero ( p →0 ). de tempo ou espaço. c) o número de ocorrências em qualquer intervalo é independente do número de ocorrências em outros intervalos. número de defeitos por metro quadrado (m2) de um piso. Assim.. caracterizando a distribuição de probabilidade do número de caras no jogo de três moedas. consegue-se boa aproximação a partir de valores de n superior a 30 ( n > 30 ) e p inferior a 0. para x = . representadas pelo evento {ccc}: P( x = 3) = C 3 ( 1 ) 3 ( 1 ) 3− 3 = 1× 1 × 1 = 1/ 8 . Em problemas típicos da binomial. num intervalo discreto. . Gramacho. 2.33 c) duas caras. A utilização da distribuição de Poisson baseia-se nas seguintes hipóteses: a) a probabilidade de uma ocorrência é a mesma em todo o campo de observação. 8. . b) a probabilidade de mais de uma ocorrência num único ponto é aproximadamente zero. cujos eventos são {cck. mas a variável aleatória é o número de sucessos observados (não sobrepostos – independentes) num intervalo contínuo. 3 2 2 8 Observe-se que a soma das probabilidades correspondente a estes eventos é igual a unidade. ckc.. k! Tem-se aqui: μ = np .71828 μ (x ) natural (constante). A distribuição de Poisson é um caso limite da binomial.2. kcc}: 2 P( x = 2) = C 3 ( 1 ) 2 ( 1 ) 3− 2 = 3 × 1 × 1 = 3 / 8 .05 ( p < 0.05 ).. Gilberto S. Distribuição de Poisson A variável de interesse na distribuição binomial era o número de sucessos em n provas independentes.1 . que é a média da distribuição. e P =0 =e − é a probabilidade de nenhum sucesso. 1. a probabilidade de k sucessos num intervalo de tempo ou espaço é estimada por intermédio da fórmula: P( x = k ) = μ k e −μ 0 . tais como: número de veículos que cruzam um semáforo por minuto. é a base do logaritmo Prof. a distribuição é discreta e o processo semelhante ao de Bernoulli. e = 2. 2 2 4 2 d) três caras.. número de chamadas por hora para atendimento de emergência num posto de bombeiros. UEFS. 29/09/2006. Em Poisson. etc..

Gramacho. Gilberto S. Prof. c) exatamente 5 pedidos no espaço de uma hora. Logo. Curiosamente.9502 .00248 = = 0. d) no máximo dois garrafões avariados. 29/09/2006.34 A média μ é o único parâmetro da distribuição de Poisson. ■ Solução: Seja a vad X = número de pedidos para entrega em domicilio e µ = 3 (média de pedidos recebidos a cada meia hora).2% deles sofrem algum tipo de avaria durante a viagem. b) P(x ≥1) =1 −P( x = 0) =1 −0.002) = 2 garrafões com avaria. Calcule a probabilidade de que se encontre num carregamento de mil garrafões: a) nenhum com avaria. propriedade que só acontece nesta distribuição. como n é maior que 30 e p é menor que 0. UEFS. ■ Solução: A vad é X = garrafões avariados e a sua média é µ = 1.0498 = 0. b) pelo menos um pedido no mesmo espaço de tempo. e que facilita a solução de muitos problemas concretos.776 ×0.05.000(0.9 u 8% .53% .0498 o 4. que se lê X tem distribuição de Poisson de média μ. porém. b) exatamente dois com avaria. Uma variável aleatória de Poisson é representada pela notação X ≈P (μ ) . A média μ é sempre proporcional ao intervalo de tempo ou espaço definidos no problema. ou seja. para qualquer outro intervalo o valor da média deve sofrer a correção numérica adequada. P( x = 5) = 6 5 e −6 7. o seu valor deve corresponder ao tamanho do intervalo apresentado. X ≈P( μ =3) . pode ser resolvido mediante uma distribuição de Poisson de média 2: a) P(x =0) =e −2 =0. Assim.1654 5! 120 Exemplo 2: Uma firma que transporta garrafões de vinho tem observado que 0.1353 ou 13. a) P(x =0) =e −3 =0. c) mais de um com avaria. a variância de Poisson é σ 2 = np . Calcule as probabilidades de o restaurante: a) não receber nenhum pedido para entrega em domicilio na próxima meia hora. . Veja-se que este problema é do tipo binomial. Assim. c) A média para o novo intervalo de tempo é de µ = 3× 2 = 6 pedidos por hora. Decorre que μ =σ 2 . Exemplo 1: O telefone de um restaurante especializado em pizzas recebe em média três pedidos para entrega em domicilio a cada meia hora.

1353 = = 0.2706 + 0. podendo assumir a variável qualquer valor dentro de um intervalo previamente definido.3. é expressa por: f (x) = 1 σ 2π e 1  x −μ  −   2 σ  2 . pois muitas variáveis no mundo real têm comportamento bastante aproximado dessa distribuição. cuja f. e) P(x ≤ 2) = P ( x = 0) +P( x =1) +P( x = 2) = 0. Distribuição normal Recorde-se que uma variável aleatória é contínua quando os seus valores decorrem de medida. (c) embora os dados de muitas situações reais não sejam rigorosamente normais. Eis alguns dos motivos da sua elevada importância em estatística: (a) os seus resultados são de fácil operação matemática.5941 . A distribuição de probabilidade desse tipo de variável é definida por uma função densidade de probabilidade (f. para − ∞ ≤ x ≤ +∞. por razões teórica e prática.2706 ) → → P ( x >1) =0. (d) a distribuição amostral de muitas estatísticas tende para a distribuição normal em face do teorema do limite central. A distribuição é descrita por uma curva em forma de sino.2706 ou 27. a sua aproximação por essa distribuição dá bons resultados e facilita o tratamento matemático.d.06%.1353 −0. 8. podendo assumir infinitos valores num determinado intervalo. 1 Pois bem.1353 + 0.p. c) − ∞ ∫f ( x )dx = .p. a distribuição normal é a mais importante das distribuições de probabilidade. (b) muitas técnicas estatísticas pressupõem que os dados têm distribuição normal.35 2 2 e −2 4 ×0.d. 2! 2 ×1 b) P( x = 2) = c) P ( x >1) =1 −P( x ≤ =1 −P( x =0) −P( x =1) =1 −0. Gramacho.2706 P(x ≤ 2) = 0.6765 .). b) ∫ a b + ∞ f ( x )dx = P (a < x ≤ b) . . Gilberto S. A distribuição normal é contínua. UEFS. com as seguintes propriedades: ) a) f(x ≥0 . 29/09/2006. Prof.

conforme figura a seguir: X = µ . Gramacho. expressos em desvio padrão de X.26 % . 1) . ∞ Com isso. A média reporta-se ao centro da distribuição e o desvio padrão ao espalhamento de curva. têm os seguintes percentuais: μ ±1σ = 68 . Os demais termos da fórmula são as constantes π = 3.1. Uma v.26 % . é unimodal e tem achatamento proporcional ao desvio padrão ou variância. e o ponto de máximo se dá em interceptam a curva (vide figura adiante). representada por O cálculo de áreas sob a curva normal é simplificado por meio da transformação z = 1 2π 1 − z2 2 z ≈N (0. que se lê: X tem distribuição normal de parâmetros μ e σ 2 .74 % . Formato da distribuição normal padrão Prof. A sua média. μ ± 2σ = 95 . σ 2 ) . A distribuição normal tem forma de sino. limitadas pela distância entre o desvio padrão e a média. Gilberto S. moda e mediana são iguais. Os pontos de inflexão da curva se dão em μ ±1σ = 68 . σ que origina a distribuição normal padrão. conforme a figura abaixo: Figura 8. . de média zero e variância unitária. Por sua vez. as áreas sob a curva. a. Formato da distribuição normal x −μ . 29/09/2006. os afastamentos em torno da média. A área total limitada pela curva normal e pelo eixo das abscissas é 1 (um) ou 100%.1416 e e = 2. e as proporções de área sob a curva estão tabeladas. X que segue uma distribuição normal é representada por X ≈ N(μ. são convertidos em unidades padronizadas z.36 A média μ = np e a variância σ 2 = npq são os parâmetros da distribuição normal. UEFS. para − ∞ ≤ z ≤ + .71828 (base do logaritmo natural). A função densidade da normal padrão é Φ(z) = e . nos pontos em que as retas x = −σ e x=σ Figura 8.2. é simétrica em relação à média μ . é assintótica em relação ao eixo de X.44 % e μ ±3σ = 99 .

de perto. que. Neste caso.00. a proporção da área situada entre os pontos de abscissa 0 e 1 é 0.75) = 0.3413 120  120  220 − 360    b) P(x < 220) = P(z < z1 ) = P z < 120   → P( x < 220 ) = P(z < −1. UEFS.2266  Prof.00.17 ) = 0.00.2734 = 0.3790 = 0. 29/09/2006. calcule a probabilidade de um assalariado qualquer: a) ganhar entre R$ 360.00 e desvio padrão de R$ 120. Transformando X em z.00? ■ Solução: O salário é uma variável aleatória X.00. é a mesma da área compreendida entre os pontos de abscissa 0 e -1 (vide tabela).00.00. e) ganhar entre R$ 240.0.00 e 520. Gilberto S. uma distribuição normal de média R$ 360.5 −0. c) ganhar mais de R$ 450.5 . . através de z = x −μ . Por exemplo. com distribuição normal de média R$ 360.00 e 480. acha-se na tabela σ de z as proporções de área sob a curva correspondentes às faixas de salários que se deseja saber:  a) P (360 ≤ x ≤ 480 ) = P 360 − 360 480 − 360  ≤z ≤  = P(0 ≤ z ≤ 1) = 0.00 e 460.37 A maioria das tabelas traz as proporções de área de zero até um ponto positivo de z. Exemplo: Um órgão de pesquisa conclui que o salário pago pelas microempresas de certa região segue.360  c) P(x > 450) = P(z > z 1 ) = P z > 120    = P(z > 0.00 e 480. Gramacho.00 e desvio padrão R$ 120. devido à simetria da curva.00. f) como se distribuem 95% dos salários em torno da média? g) qual o número esperado e o desvio padrão de 600 desses trabalhadores que ganham entre R$ 360. d) ganhar entre R$ 460. b) ganhar menos de R$ 220.1210 450 .3413.

Prof. σ 2 =npq =205 (1 −0.3413 →μ = 205 trabalhadores.95 é 0. g) μ = np =600 ×0.83 < z <1. .96 . Gilberto S.1115 e) P( 240 ≤ x ≤ 460 ) = P ( −1 ≤ z ≤1) = 0.8 ≤ x ≤ 595.2) = 0.6826 f) Eis que a metade da área de 0.96 e z 2 =1.3413 +0. Donde se conclui que o intervalo de x em torno da média é P(124.4082 −0.9 ×2 =x −3 0 x μ ± 6 10 6 x −μ .38 520 −360   460 −360 P( 460 < x < 520 ) = P <z <  = P(0. Gramacho.3413 ) →σ 2 =135 →σ =12 trabalhadores. tal que: σ → x = 360 ± 235.33 ) 120  120  d) P( 460 < x < 360 ) = 0. 29/09/2006.2 . que permitem determinar os limites x1 e x2 mediante substituição na fórmula z = zσ = − → 1. Entrando-se com este valor na tabela da distribuição normal obtém-se os escores reduzidos z 1 = −1.2967 = 0.95.475. UEFS.3413 = 0.

Gilberto S.39 9 TEORIA DA ESTIMAÇÃO 9. Gramacho. ˆ Significa. Neste ponto. Isso demonstra como informações amostrais podem ser generalizadas para fazer juízo sobre propriedades da população como um todo. dentre outros. que a proporção p encontrada na amostra é divulgada como uma estimativa da verdadeira proporção p de eleitores favoráveis a esse candidato. será comentado mais à frente. com uma margem de erro de tantos por cento (para mais ou para menos). de acordo com pesquisa do instituto tal. é de suma importância o conhecimento da distribuição amostral da estatística eleita como estimador do parâmetro da população. O caminho para se chegar a esse tipo de conclusão. ou município. A teoria da estimação é a parte da Inferência Estatística em que se estuda a elaboração de intervalos de confiança com base em estatísticas amostrais.2 Estimação por ponto Prof. informando que o candidato tal lidera.1 Introdução A estimativa de um parâmetro de uma população pode ser feita por ponto ou por intervalo. UEFS. no país. nos quais se espera. que esteja incluído o verdadeiro valor do parâmetro populacional. a corrida eleitoral. e caso as eleições fossem logo realizadas. ou estado. 9. naquele momento. tendo sido a pesquisa realizada nos últimos dias e que foram entrevistados um número n de eleitores. em toda a população habilitada a votar. esse ˆ candidato seria eleito com uma proporção p de votos. deste modo. 29/09/2006. . naquele momento. com uma probabilidade definida. Eis que em tempos de eleição é comum a divulgação de pesquisas sobre intenção de votos pelos órgãos de comunicação.

40 Na estimação pontual estima-se um único valor do parâmetro populacional. tanto quanto possível. com um nível de confiança. E também a proporção p do número de desempregados (x) na amostra (n). como já comentado. σ Por outro lado. no qual se admite. Gramacho. a saber: P( −z c ≤ x −μ ≤ z c ) = 1 − α → P( −z c σ x ≤ x − μ ≤ z c σ x ) = 1 − α .3 Intervalo de confiança ― IC Intervalo de confiança é uma técnica de estimação que visa estabelecer um intervalo de valores. que se identifica por x ~ N(μ. quanto menor for a amplitude de um IC melhor é a informação que ele fornece. 9. σ x = σ n . pode-se depreender que uma alta precisão foi atingida. se a distribuição amostral da média segue uma distribuição normal a variável aleatória x terá média µ e variância x −μ σ2 = x σ2 . pois. σ 2 ) . 29/09/2006. Assim. é uma estimativa por ponto da verdadeira proporção p de desemprego profissional na população. . Para deduzir a fórmula do IC para a média µ basta substituir a expressão de z no intervalo P(−z c ≤ z ≤ z c ) = 1 − α . que se denota por x ~ N( μ . relativa a certa categoria profissional. respectivamente. de maneira que se a amplitude do intervalo é pequena.1 Intervalo de confiança para a média da população µ ― σ conhecido Se a variável aleatória x tem distribuição normal de média µ e variância σ 2 . E desta forma x n x −μ σ/ n a variável z passa a ser z = σ x ou z = . A vantagem dessa técnica é que ela confere um grau de precisão à estimativa. a média da amostra x e a variância da amostra s 2 são estimativas por ˆ ponto da média μ e da variância σ 2 da população. centrado numa estatística amostral. Eis que a solução σx Prof. 9. Gilberto S. interessa obter. Assim. que esteja incluído o parâmetro da população.3. a partir de dados da amostra. Os extremos do IC são chamados limites de confiança. Por isso. σ 2 ). UEFS. a variável padronizada é expressa por z = x −μ . intervalos de amplitude mínima para um dado nível de confiança.

em face do nível de confiança adotado. A configuração gráfica de um IC para a média µ é vista na figura abaixo: Figura 9. z • z c ou α = z crítico. • σ = desvio padrão da população. 29/09/2006. isto é. • μ = média da população. • e = zc σ n = erro padrão da estimativa ou erro de amostragem (semi-amplitude do IC). E ainda mais. • α = nível de significância – probabilidade de o IC encontrado não incluir a média µ . quando σ é desconhecido. • 1 − α = nível de confiança – probabilidade de o IC incluir a média µ . ou μ = x ± z c σ n σ n .41 desta expressão em relação a μ é P( x − z c σ x ≤ μ ≤ x + z c σ x ) = 1 − α . Gilberto S. do desvio padrão σ ou do seu estimador s. por substituição. • x = média da amostra. do tamanho da amostra e da dispersão dos elementos da população. Por isso. a . o valor do erro padrão depende do nível de confiança adotado. Gramacho. . UEFS. obtém-se. abscissa da distribuição normal padrão.1 Gráfico de um IC para a média populacional μ De um modo geral. cujo valor é obtido na tabela 2 da distribuição z. Quando se aumenta o nível de confiança de uma estimativa o valor do erro padrão também Prof. também é chamado de z tabelado. Como o desvio padrão da distribuição de x é σ x = seguinte fórmula para estimar o IC para a média populacional µ : P( x − z c σ n ≤ μ ≤ x + zc σ n ) = 1 − α . o erro padrão e reflete a variação aleatória que ocorre de amostra para amostra numa distribuição amostral de médias.

por simetria. Assim. Em se tratando de estudo pioneiro. quando se aumenta o tamanho da amostra n é de se esperar uma redução no erro padrão equivalente a n . coletou-se. o consumo mensal registrado em 100 domicílios. z = -1. entra-se na tabela da distribuição normal com a probabilidade de 0. em que não há nada escrito sobre o assunto. aleatoriamente.42 aumenta. . A arquitetura Prof. encontrando-se z = 1. Gilberto S. n =  c  . era cerca de 50 kw/mês. para compensar a maior probabilidade de acerto que se atribui à estimação do parâmetro.   n e  e   n 2 Neste particular. para mais ou para menos. ou então. n é função do erro padrão e do nível de confiança 1 − α .96 (vide tabela da página 81). ou do desvio padrão amostral s. É relevante dizer que a obtenção do desvio padrão σ para calcular o tamanho mínimo de amostras é um problema crucial na teoria da estimação. obtendo-se. Outrossim. uma vez que e = z c σ n . em certa cidade. a única alternativa é a seleção de uma amostra piloto. um IC de 95% de confiança proporciona um erro padrão e menor que o de um IC de 99% de confiança. 29/09/2006. ■ Solução: Para achar os valores críticos de z. dado o nível de confiança de 95%.4750 equivalente à metade de 1 − α (0. dessa amostra. na lista da companhia distribuidora. Exemplo 1: Num censo passado apurou-se que a variação do consumo domiciliar de energia. influencia o valor de e.4750). Para estimar o consumo médio atual. como demonstrado a seguir: 2 z σ (z σ) 2 (z σ) 2 z σ e =  c  → e2 = c → n = c 2 . Pretende-se estimar um IC de 95% para o verdadeiro consumo médio domiciliar mensal de energia. quando este é usado como estimador do primeiro. que permita fazer uma estimativa preliminar da medida de dispersão que será utilizada para calcular em definitivo o tamanho mínimo de amostra adequado. quanto maior for a dispersão verificada na população ou na amostra maior será o valor do erro padrão da estimativa. e pode ser superado consultando-se pesquisas ou estudos similares. ou seja.95/2 = 0. mantendo-se os demais fatores constantes. em que se tenha estimado o “ σ ” da variável de interesse.96 e. uma média equivalente a 320 kw/mês. A grandeza do desvio padrão populacional σ . Gramacho. UEFS. A fórmula para calcular o tamanho mínimo da amostra é obtida isolando n da fórmula do erro padrão e = z c σ n 2 .

mantendo-se o nível de confiança de 95%? z σ  1. . Gilberto S. tem-se: n ( N − 1)e 2 = 2 zcσ2 N − n 2 × × n ( N − 1) → n ( N − 1)e 2 = z c σ 2 ( N − n ) n N −1 2 2 2 2 n ( N − 1)e 2 = z c σ 2 N − nz c σ 2 → n ( N − 1)e 2 + nz c σ 2 = z c σ 2 N 2 2 n[( N − 1)e 2 + z c σ 2 ] = z c σ 2 N .8 kw/mês. 29/09/2006. UEFS. donde se conclui que: Prof.8 para 5 kw/mês.2 ≤ μ ≤ 329 . como demonstrado a seguir: z σ e = c ×  n  2 N −n N −1  z 2σ 2 N − n  → e2 = c × .43 do IC em comento é ilustrada no gráfico a seguir: μ = x ± zc σ n = 320 ±1.  n N −1  2 Multiplicando os dois membros desta expressão por n ( N −1) . N −1 σ n N −n .8 → 310 . Pergunta-se qual o tamanho mínimo da amostra necessário para reduzir o erro padrão de 9.96 50 = 320 ± 9. o erro padrão da estimativa é identificado pela expressão e = z c da qual se tira a fórmula de n para calcular o tamanho mínimo da amostra.8 kw/mês. a fórmula do intervalo de confiança para μ inclui o fator de correção σ n N −n . A estimativa em tela dá um erro padrão de 9. com 95% de 100 confiança.96 × 50  n = c  =  → n = 384 domicílios. 5    e  2 2 Em se tratando de população finita (amostragem sem reposição). Gramacho. N −1 N −n . conforme se verifica a seguir: N −1 μ = x ± zc Neste caso.

a um nível de confiança de 95%. obtendo.3765 N-n pode ser ignorado para n N -1 Vale lembrar que o fator de correção de população finita menor que 5% de N ( n < 0. O auditor sabe.40 → μ = 260 ±10 . utiliza-se em seu lugar. a estimativa do saldo médio em aberto ( μ ) das 500 contas encerradas no mês.96 × 35 5) 2 1 + (1.1 Note-se que 40 = 0. por experiência. pelo setor de Contabilidade de uma firma.00 e nível de confiança de 95%.41 → 249 . Gilberto S. depois de examiná-las.08 > 0. Então. Exemplo 2: Um auditor selecionou ao acaso uma amostra de 40 contas a receber de um total (população) de 500 contas arquivadas num determinado mês.2384 → n = 137 contas 1 + 0. devido a erro contábil. com 95% de confiança.59 e R$ 270.05 . N −n pode ser ignorado quando n é menor N −1 9.05 N ). que em situações parecidas. em face de erro contábil.59 ≤ μ ≤ 270 . seria um valor entre R$ 249.96 35 40 500 . A formula acima pode ser simplificada para: n = ( z c σ e) 2 1 + ( z c σ e) 2 / N .3.00. seria calculada assim: μ = 260 ±1. 29/09/2006. UEFS. um saldo médio em aberto de R$ 260. Prof. .05 N ).00. como estimador.44 2 zcσ2N 2 ( N − 1)e 2 + z c σ 2 n= .2 Intervalo de confiança para a média µ ― σ desconhecido Em não se conhecendo o desvio padrão da população ( σ ). qual deveria ser o tamanho da amostra? n= (1. o valor do desvio padrão populacional ( σ ) não excede a R$ 35. 50 Logo. Esta aproximação melhora à medida que n cresce. Se o auditor desejasse trabalhar com um erro padrão da estimativa de R$ 5. o desvio padrão amostral (s). É importante destacar que o fator de correção que 5% de N ( n < 0.41. Gramacho. o auditor poderia inferir que o saldo médio em aberto das 500 contas encerradas.96 × 35 5) / 500 2 = 188 . mas não se deve esquecer a distinção entre pequenas e grandes amostras.41 R$ 500 .

8 horas. um IC para o verdadeiro tempo médio de duração de todas das lâmpadas. E mais. com x = 600 e s = 25. pode-se utilizar a distribuição normal para elaborar o intervalo de confiança para a média populacional µ . Estime-se. o número de lâmpadas a ser testado seria de: Prof.90 corresponde valores críticos de z c = ±1.1 Grandes amostras Quando o tamanho da amostra é maior ou igual a 30 ( n ≥ 30 ).8 → 594. com 90% de confiança. Gramacho. com 90% de confiança. n n s n . Ou. 29/09/2006. UEFS.64 25 50 = 600 ± 5. através da fórmula: P( x − z c s s < μ < x + zc ) =1− α . donde obteve duração média de 600 horas e desvio padrão de 25 horas.5 horas. .64 na tabela da distribuição normal. com os mesmos 90% de confiança.2.  e  2 Exemplo 1: Seja um fabricante de lâmpadas que para estimar o tempo médio de duração do seu produto seleciona para ensaio uma amostra aleatória de 50 unidades. resumidamente: μ = x ± z c A fórmula para calcular o tamanho da amostra.3. em face do teorema do limite central.45 9.8 hs. é dada n pela expressão n =   z cs   . A arquitetura do IC é retratada no quadro abaixo: Significa que se todas as lâmpadas fossem testadas encontrar-se-ia um tempo médio de duração entre 594. Gilberto S.2 ≤ µ ≤ 605. Caso o fabricante decidisse fixar o erro padrão em 2.2 e 605. obtém-se: μ = x ± zc s n = 600 ± 1. a partir do erro padrão e = z c s . ■ Solução: Para 1 − α = 0.

3. o problema é minimizado pela utilização da distribuição t de Student no lugar da normal.96 × 42 5) / 500 1 + 0. 29/09/2006. . nada Prof. pelo setor de Contabilidade de uma firma.79 → 246 . porque está sujeito a flutuações muito grandes de amostra para amostra. a um nível de confiança de 95%. Exemplo 2: Voltemos ao caso da amostra aleatória de 40 contas a receber de um lote de 500 contas arquivadas em certo mês. o auditor obtém na amostra um saldo médio em aberto de R$ 260.   e    Em se tratando de população finita (amostragem sem reposição) inclui-se o fator de correção à fórmula do IC: μ = x ± zc s n N −n . o desvio padrão amostral s não é um bom estimador do desvio padrão populacional σ. o que não é raro. Todavia. todavia.64 × 25  z s n = c  =   2. é calculado da maneira abaixo: μ = 260 ± 1. 2 1 + (1.00 (devido a erro contábil).96 × 42 5) 2 271. quando há certeza de que a população de onde provém a amostra é normalmente distribuída.79 reais.46  1. Gramacho.96 42 40 500 − 40 →μ = 260 ±13 . agora. Gilberto S. supondo que o desvio padrão populacional é desconhecido.21 ≤ μ ≤ 273 . Assim.2.00 e desvio padrão (s) de R$ 42.5  → n = 269 lâmpadas. o tamanho mínimo da amostra admitindo um erro padrão da estimativa de R$ 5. UEFS. N −1 2 2 E o calculo do tamanho da amostra é feito através da fórmula adiante: n= ( z c s e) 2 1 + ( z c s e) 2 / N .00 e nível de confiança de 95%.5421 9.0633 = → n = 176 contas.2 Pequenas amostras ― a distribuição t de Student Em pequenas amostras ( n < 30 ). 500 −1 Enquanto isso. A estimativa do saldo médio em aberto das 500 contas encerradas e arquivadas no mês. Ressalve-se que quando a população é normalmente distribuída e se conhece impede que se utilize a distribuição normal em pequenas amostras. é de: n= (1. σ.

em face de urgência no resultado da pesquisa. o intervalo de confiança de 95% para a duração média das lâmpadas como um todo? ■ Solução: Sejam n = 16 lâmpadas. s n Ou. .47 A diferença básica entre a distribuição normal e a distribuição t é que esta. em função do nível de significância α e de n–1 graus de liberdade (g. como se verifica na figura adiante: Figura 9. Para facilitar.2 Formato das distribuições t de Student e normal Por conseguinte.3 Gráfico de um IC para a média μ com a distribuição t t s Enquanto que a fórmula para estimar o tamanho da amostra é n =  c  . então. por ser mais dispersa. UEFS.3. de modo resumido: μ = x ± t c . A ilustração gráfica de um intervalo de confiança com a distribuição t é semelhante ao que foi visto nos casos que envolveram a distribuição normal. admita-se que ele tenha apurado a mesma média e o mesmo desvio padrão. Prof. cujo valor se obtém na tabela desta distribuição.). decidisse coletar apenas 16 lâmpadas para teste. citado no exemplo 1 do subitem 4. s = 25 hs. que corresponde à abscissa da distribuição t de Student.  e  2 Exemplo 1: Imagine que o fabricante de lâmpadas.2.05. Qual seria. a fórmula do IC neste caso é: P( x − t c s n ≤ μ ≤ x + tc s n ) =1−α . tem as extremidades mais alongadas que a primeira. x = 600 horas. Onde s é o desvio padrão da amostra e t c ou t α / 2 é chamado t crítico. Gramacho. como se observa na figura abaixo: Figura 9. Gilberto S. e α = 0. 29/09/2006.l.

N −1 2 2 Para estimar o tamanho mínimo da amostra utiliza-se a fórmula: n= (t c s/e) 2 1 + (t c s/e) 2 / N . Caso interessasse reduzir o erro padrão de 13.05N. a fórmula do IC fica igual a: μ = x ± tc s n N −n .7 e 613.1315. Gilberto S. No caso de população finita. em que se adota o fator de correção de população finita. encontra-se t c =±2. cuja ilustração se verifica no gráfico adiante: Logo.1315 × 25 = 600 ±13 . . Prof. μ = x ± t c horas.3 para 8 horas.7 ≤ μ ≤ 613 . com 95% de confiança.1315 × 25  n = c  =  → n = 144 lâmpadas. dentre os 128 que comparecem a uma assembléia. Supondo que a idade dos acionistas é uma variável aleatória que se distribui normalmente. s n = 600 ± 2.s   2. construa um intervalo de confiança de 95% para a idade média de todos os acionistas que freqüentam a assembléia. respectivamente.7 4 Infere-se que o tempo médio global de duração das lâmpadas seria um valor entre 586. UEFS.48 Entrando-se na tabela da distribuição t com n −1 = 15 graus de liberdade e nível de significância α =0.3 horas. Exemplo 2: Uma amostra aleatória de 16 acionistas de uma grande empresa.05. sobretudo para n > 0. apresenta idade média de 52 e desvio padrão de 6 anos. o número de lâmpadas que deveria ser testado seria de:  t . mantendo o nível de confiança de 95% para a estimativa da média μ.3 horas. 8    e  Este tamanho de amostra permitiria ao fabricante utilizar sem problemas a distribuição normal para estimar um novo intervalo de confiança para a média μ. Gramacho. 29/09/2006. ou 586 .

05 . também. Para α = 0. A proporção de eventos favoráveis na população é p = x x ˆ e o seu estimador na amostra é p = .1315 na tabela da distribuição t.05 e n − 1 = 15 graus de liberdade corresponde o valor t c = 2. o tamanho mínimo da amostra seria de aproximadamente: n= (2. cuja distribuição de probabilidade é do tipo binomial. Gilberto S. pois a estimativa de proporções envolve quase sempre grandes amostras retiradas de populações muito grandes.3 Intervalo de confiança para a proporção populacional p Há situações em que a variável de interesse só admite dois resultados possíveis: sucesso ou fracasso. . ela pode ser aproximada pela distribuição normal.1315 6 16 × 128 − 16 → μ = 52 ± 3 → 49 ≤ μ ≤ 55 anos. infere-se que a idade média de todos os acionistas que compareceram à assembléia situa-se entre 49 e 55 anos. cujo esboço gráfico se encontra abaixo. da distribuição normal padrão. N n Apesar de a distribuição de p ser binomial. Para estimar a idade média geral dos acionistas. com erro máximo de 2 anos e nível de confiança de 95%. utilizar a distribuição t. pois σ é desconhecido e n é menor que 30. com 95% de confiança. eis que surge: Prof. Gramacho. Aqui a probabilidade de sucesso é p e a de fracasso q =1 − p .31945 9. com n–1 graus de liberdade. μ = np e σ 2 = npq . μ = 52 ± 2.1315 × 6 / 2) 2 1 + ( 2.49 ■ Solução: Como n=16 e N=128. sugerindo que se N 128 deve utilizar o fator de correção de população finita.89 → n ≅ 31 acionistas. n 16 = = 0. 29/09/2006. UEFS. respectivamente.1315 × 6 / 2) / 128 2 = 40. Deve-se. tem-se.3. 1 + 0. Substituindo estes parâmetros na fórmula de z. 128 − 1 Portanto. Eis que a média e a variância da distribuição binomial são.125 > 0.

chega-se a: n ˆ p −p pq . pois se considera 0. como já dito.50 z= x −μ x − np →z = . em que 0. • e = zc ˆˆ pq = erro padrão da estimativa ou erro de amostragem. σ npq x np − n z= n Dividindo-se a nova expressão de z por n.25 = (0. • ˆ p ˆ ˆ = proporção na amostra e q =1 −p é o complemento de p . n Como os parâmetros p e q de dentro da raiz são desconhecidos. npq n2 z= x ˆ Trocando por p . n ˆˆ pq . 29/09/2006. UEFS. vem: ˆ P( p − z c pq ˆ ≤ p ≤ p + zc n pq ) =1 − α . a saber: P( −z c ≤ ˆ p −p pq n ≤ zc ) =1 − α . n ˆ ˆ Quando não se conhecem os parâmetros p e q .5 como valor n máximo da proporção p.5) 2 . n Para encontrar a fórmula do IC para estimar a proporção populacional p. basta substituir a nova expressão de z em P( −z c ≤ z ≤ z c ) = 1 − α . tirando o valor de p.25 ˆ . obtido na tabela da distribuição normal. resumidamente: p = p ± z c • p = proporção na população. utiliza-se a fórmula p = p ± z c . a que se pretende estimar. tem-se: . • z c = z crítico. . resultando na seguinte fórmula do IC para a proporção p: ˆ P( p − z c ˆˆ pq ˆ ≤ p ≤ p + zc n ˆˆ pq ) =1 − α . A fórmula para calcular o tamanho da amostra para a proporção p é obtida a partir do Prof. onde: n ˆ Ou. Gramacho. eles são substituídos pelos ˆ ˆ seus respectivos estimadores p e q . nem os respectivos estimadores p e q 0. Gilberto S.

9 1) → n = 503 peças.025 e    2   (0. onde e = z c N −1 ˆˆ pq × n N −n é o erro padrão da estimativa. ˆˆ   ˆˆ 2  n e  e   2 2 Exemplo 1: Seja o caso de um industrial que considera satisfatório um percentual de até 6% de peças defeituosas produzidas em sua fábrica de equipamentos eletrônicos.  e = zc   2 ˆˆ pq n 2  z 2 ˆˆ  → e 2 = z c pq → n = z c pq ↔ n =  c  pq . x = peças defeituosas. O esboço do IC em comento consta no gráfico a seguir: Caso interesse diminuir a margem de erro da estimativa de 4% para 2. ˆ q =1 −0.51 quadrado da fórmula do erro padrão.13 . Estime-se um intervalo de confiança para a verdadeira proporção de peças defeituosas.09 (proporção de peças 200 defeituosas na amostra).09 =0.04 → 0. ˆ ■ Solução: n = 200 peças. o IC para a verdadeira proporção de peças defeituosas: p = 0. a verdadeira proporção de peças defeituosas é um valor compreendido no intervalo acima. o tamanho mínimo da amostra deverá ser de: z   1. p = 18 = 0.09 × 0. N −1 Para calcular o tamanho da amostra.96 0. então. utiliza-se a fórmula em destaque. Gilberto S. com 95% de confiança.91 → p = 0.09 ±1. A inspeção feita numa amostra aleatória de 200 peças revelou que 18 apresentavam defeitos.09)(0. a fórmula do IC inclui o fator de correção e passa a ser: ˆ p = p ± zc ˆˆ pq × n N −n .05 ≤ p ≤ 0.96 . 200 Assim. Segue-se.5%. obtida algebricamente a partir da expressão do erro padrão. .96 ˆˆ n =  c  pq → n =   0. que envolve o dito percentual de 6% de peças defeituosas. 1 − α = 0.   2 Quando se trata de população finita. qual seja: Prof.09 ± 0. como demonstrado abaixo. mantendo-se os 95% de confiança.95 (nível de confiança) donde se obtém na tabela da distribuição normal padrão z c = ± 1. Gramacho. 29/09/2006. com 95% de confiança.9 1 (proporção de peças perfeitas na amostra). UEFS.

Elabore-se um intervalo de confiança de 95% para a proporção geral de analfabetos. onde se constatou que 56 deles eram analfabetos.52 ˆˆ z 2 pqN .500 −1)( 0.35 ±1. como se vê a seguir: p = 0.500 (tamanho da população).500 −1 0. é necessário adotar o fator de correção de população finita para estimar a proporção populacional p.95 . com 95% de confiança. com erro máximo de 4% e nível de confiança de 95%.04 ) Prof.35 (proporção de analfabetos na amostra). na área rural de um pequeno município. . Por exemplo. 2 2 (1.500 indivíduos.42 de analfabetos.05 ×1.35 × 0. o tamanho mínimo de amostra para estimar a verdadeira proporção de analfabetos na mesma área.65 1.96 ) 2 0. Verifica-se que a verdadeira proporção de analfabetos na área pesquisada se situa entre 28% e 42%.96 0. O último censo demográfico assinala que a população adulta da área coberta pela pesquisa é de 1.65 + (1. Gramacho. 29/09/2006. Gilberto S.500 −160 × 160 1. na tabela da distribuição normal padrão. 35% com margem de erro de 7%.65 (proporção de alfabetizados na amostra). seria: n= (1.07 →0.35 × 0.28 ≤ p ≤ 0.96 ) 0. x = 56 (n° de ˆ analfabetos).05 N →160 > 0. UEFS. isto é.500 → n = 401 indivíduos. 2 ˆˆ z pq + ( N −1)e 2 n= Exemplo 2: Seja um levantamento por amostragem levado a cabo junto a 160 indivíduos adultos. mediante o qual se encontra z =1.96 . 1 − α = 0. 160 ˆ ˆ q =1 −p =1 −0.35 ± 0. N = 1. ■ Solução: n = 160 (tamanho da amostra).500 →160 > 75 .35 × 0.65 ×1. Sendo n > 0. p = 56 = 0. nível de confiança.35 = 0.

A decisão de aceitar ou não a hipótese inicial seria determinada por uma estatística teste que avaliasse a significância de eventuais diferenças entre proporções obtidas por amostragem e a proporção de 5% fixada pelo controle de qualidade. 29/09/2006. mas que deve ser confrontada. Neste caso. Esta é uma proporção que vale para todo o universo. . com a proporção decorrente de amostras retiradas da linha de produção.53 10 TEORIA DA DECISÃO 10. que ao lado da teoria da estimação é outra importante vertente da Inferência Estatística. com nível máximo de confiança (probabilidade de aceitar a hipótese submetida a teste). Ainda mais que o percentual de 5%. para verificação da conformidade do processo. que são procedimentos destinados a verificar se é verdadeira ou falsa a suposição que se estabelece acerca do valor do parâmetro populacional. com o tempo. UEFS. deverá ser atualizado tendo em vista o natural desgaste do equipamento no caminho da absolescência. periodicamente. em que o controle de qualidade considera normal o funcionamento de um equipamento quando a proporção de itens defeituosos se acerca de 5%. Gramacho.1 Definição Na teoria da decisão. Gilberto S. estudam-se os testes de hipóteses. seria interessante o controle de qualidade formular e confrontar as hipóteses a seguir: • H 0 (agá índice zero): O equipamento está operando normalmente. • H1 (agá índice um): O equipamento não está operando normalmente. Caso o teste revelasse pouca significância para Prof. Seja determinado processo de fabricação. E o fato de aceitar ou não uma hipótese estatística implica sempre em tomar uma decisão.

que é o mais importante. é igual ao nível de significância α (alfa) e a do erro tipo II é β (beta). corresponde ao nível de significância do teste. assunto que não será abordado neste texto. Um teste de hipóteses compõe-se da hipótese nula ( H 0 ). que se contrapõe a H 0 . Gilberto S. ou erro beta. baseada no verdadeiro parâmetro da população. H 0 é chamada de hipótese nula porque estabelece que é nula a diferença entre valor real e valor suposto para o parâmetro populacional. Neste sentido. que corresponde àquela que se deseja provar. o objeto de estudo é confirmar a veracidade estatística de algumas hipóteses a respeito de parâmetros da população visando tomada de decisões. ou seja. A descrição dessas possibilidades de erro consta do quadro abaixo: Quadro 10. menos importante. Gramacho. 10. que consiste em rejeitar a hipótese nula H 0 quando ela é verdadeira. Prof. a hipótese inicial seria aceita. Enquanto que o erro tipo II. Daí a sua maior importância técnica e de controle bem mais fácil que o do erro tipo II. que intercepta a região de aceitação de H 0 . o que é demonstrado através da elaboração da chamada curva característica de operação (CCO).1 – Risco de erro num teste de hipótese Decisão Aceita Rejeita Hipótese nula ( H 0 ) Verdadeira CORRETO ERRO TIPO I Falsa ERRO TIPO II CORRETO O erro tipo I. e da hipótese alternativa ( H1 ). aquela que é aceita quando esta é rejeitada.2 Teste de hipóteses Os testes de hipóteses são utilizados quando existe alguma suposição quanto ao valor de algum parâmetro da população e se pretende testar a sua consistência. A probabilidade do erro tipo I.3 Risco de erros em testes de hipóteses Quando uma hipótese é aceita há sempre o risco de ocorrer dois tipos de erro: o ERRO TIPO I. UEFS. compreende a quantidade da distribuição amostral. que consiste em aceitar a hipótese H 0 quando ela é falsa. ou o ERRO TIPO II. ou erro alfa. .54 essas diferenças. a partir de evidências observadas na amostra. Este procedimento será detalhado mais adiante. 10. 29/09/2006.

No primeiro. . entre μ e μ 0 .4 Teste para a média populacional µ – teste z Quando o desvio padrão populacional σ é conhecido o teste para a média μ é feito com a distribuição normal. No segundo. para mais ou para menos. Gramacho.2 – Decisão num teste z para a média populacional μ Hipótese Tipo de teste Nula H 0 : µ = µo H 0 : µ = µo H 0 : µ = µo Decisão Aceita-se H 0 se -zc ≤ zo ≤ zc se zo < zc se zo > -zc Alternativa H1 : µ ≠ µo H1 : µ > µo H1 : µ < µo Bicaudal Unicaudal à direita Unicaudal à esquerda A estatística z o vista no quadro acima é chamada de z observado e é calculada com base em estatísticas amostrais. UEFS. Eis que a hipótese nula estabelece uma igualdade entre a média populacional μ e a média suposta μ o (diferença nula). enquanto que a hipótese alternativa é sempre de desigualdade. Enquanto que z c é o chamado z crítico. Gilberto S. 29/09/2006. testa-se a hipótese de desigualdade. a) Formulação do teste Os testes de hipótese são do tipo bilateral (bicaudal) ou unilateral (unicaudal). O teste Z é ainda utilizado quando σ é desconhecido e a amostra é maior ou igual a trinta ( n ≥ 30 ). testa-se a hipótese de igualdade ou diferença a média populacional μ e o valor suposto μ 0 .55 10. O gráfico de uma curva normal para realização de um teste bicaudal tem o formato visto na figura abaixo: Figura 10. que delimita a área de aceitação do teste e é obtido na tabela da distribuição normal.1 Formato de um teste z bicaudal para a média μ Prof. qualquer que seja o tamanho da amostra. O modo de formular e decidir sobre um teste de hipóteses para a média μ resume-se no quadro abaixo: Quadro 10. em face do nível de confiança 1 − α .

Neste caso.2 Formato de um teste z unicaudal à esquerda para a média μ Aqui. quando z 0 < z c . . σx σ n n σ é conhecido. a probabilidade α . Prof. aceita-se H 0 . se a estatística teste zo (z observado) cair entre -zc e zc. correspondendo às duas 2 α fica repartida em duas partes iguais áreas demarcadas nas extremidades da curva normal. a probabilidade α de rejeição de H 0 é dada pela área sob a curva situada na extremidade direita. em destaque na figura anterior. como se vê na figura a seguir: Figura 10. mede o afastamento. Aceita-se H 0 . a probabilidade de aceitação de H 0 é 1 − α . com nível de confiança 1 − α . como zo = x −μ x −μ σ → zo = . E a probabilidade de rejeição é α .56 A probabilidade de aceitar H 0 é 1 − α . Em testes bicaudais ou α . No teste unicaudal à direita. tem-se: No caso. a estatística z o . Gramacho. No teste unicaudal à esquerda. 29/09/2006. chamada z observado. quando z 0 > z c . e a de rejeitá-la é bilaterais. entre a média amostral ( x ) e a média populacional ( μ ). b) Estatística do teste A estatística de um teste mede a discrepância existente entre a estatística amostral e o parâmetro populacional a ser testado. eis que σ x = . aceita-se H 0 . como ilustra a figura abaixo: Figura 10. representada pela área sob a curva localizada na extremidade esquerda.3 Formato de um teste z unicaudal à direita para a média μ Enfim. UEFS. Gilberto S. com nível de confiança 1 − α . em unidades normais padronizadas. com nível de confiança 1 − α .

em dados de um censo. conforme esboço no gráfico abaixo. Prof. Neste caso.95 tem-se um valor modular de z c = ± 1.95 . Teste-se a hipótese de que o consumo médio de energia é de 350 kw/mês.8 . em operação similar à de elaboração de intervalos de confiança. • Formulação do teste: H 0 : μ = 350 kw/mês ∴ H 1 : μ ≠ 350 kw/mês. com 95% de confiança. não havendo evidência estatística de que o verdadeiro consumo médio domiciliar de energia seja de 350 kw/mês. 1.96. com 95% de confiança.57 Exemplo 1: Foi apurado. então. • Estatística do teste: z o = x −μ σ/ n = 320 − 350 50 / 100 → z o = −6 Para um nível de confiança de 0. ■ Solução: σ = 50 kw/mês. uma discrepância muito grande entre a média amostral e a média suposta para a população como um todo.96. Como zo = -6 está fora do intervalo [-1. Uma amostra aleatória de 100 consumidores deu uma média amostral de 320 kw/mês. era de 50 kw/mês ( σ ) e que o consumo médio atual na cidade beira a casa dos 350 kw/mês. Nota-se. Gilberto S. resultando 340.96]. n = 100. mediante a fórmula: xc = μo ± zc σ n O símbolo x c é o valor crítico da média amostral e μ o é a média populacional suposta. aceita-se H 0 quando o valor da média amostral cair no intervalo limitado pelos valores críticos de x c . rejeita-se H 0 . o teste para a média μ com os dados do exemplo anterior: • Formulação: H 0 : μ = 350 kw/mês ∴ H 1 : μ ≠ 350 kw/mês.2 ≤ x c ≤ 359.8 kw/mês. UEFS. em certa cidade. x = 320 kw/mês e 1 − α = 0. Segue-se. 29/09/2006.96 50 100 x c = 350 ± 9. Gramacho. • Valores críticos de x : x c = μ O ± z c σ n = 350 ±1. que a variação do consumo domiciliar de energia. na tabela da distribuição normal. no caso presente. Chega-se à mesma conclusão calculando-se limites críticos para a média amostral. .

Como este valor é superior ao de zo = -6. Para um nível de confiança de 0.8 kw/mês. a hipótese nula ( H 0 ) é igualmente rejeitada. pega-se na tabela da distribuição normal o valor zc = -1.8 kw/mês. 29/09/2006. havendo indícios de que o consumo médio de energia na cidade é de fato inferior a 350 kw/mês (vide gráfico abaixo).8 kw/mês. como se depreende no gráfico adiante.58 Como na solução anterior. σ n = 350 − 1.95 e sendo o teste unilateral. Gilberto S. com nível de confiança de 95%: • Formulação: H 0 : μ = 350 kw/mês ∴ H 1 : μ < 350 kw/mês. Gramacho. rejeita-se H 0 . Exemplo 2: Aproveitando os dados do exemplo anterior. teste-se a hipótese de o consumo médio de energia ser inferior a 350 kw/mês. . • Estatística do teste: zo = -6 (a mesma do exemplo 1). como segue: • Formulação: H 0 : μ = 350 kw/mês ∴ H 1 : μ < 350 kw/mês • Valor crítico de x : x c = μ o − z c x c = 350 − 8.64 50 100 Rejeita-se H 0 .2 = 341. Aceitar-se-ia H 0 para valores de x c > 341 . como ilustra o gráfico adiante: Prof. UEFS.64. pois a média amostral de 320 é menor que 341. A hipótese nula H 0 é igualmente rejeitada quando se calcula um valor crítico para a média amostral x . pois a média da amostra de 320 kw/mês não se encaixa no intervalo acima.

Exemplo 3: De uma amostra aleatória representando a remuneração mensal de 36 comerciários (salário e comissão) de uma cidade média. a distribuição t substitui a normal Prof. na tabela da distribuição normal. pois z o = 0. com 90% de confiança.00 44 . obteve-se média e desvio padrão de R$ 329.90/2=0.4500). 29/09/2006.4500 (0. mas n é proveniente de uma população normalmente distribuída.00 ∴ H 1 ≠ 325 . se essa média atende a suposição de que o ganho médio geral da categoria é de R$ 325. x = 329 .5 Teste para a média populacional µ – teste t de Student Quando o desvio padrão σ é desconhecido e o tamanho da amostra n é pequeno ( n < 30 ). respectivamente. 7.43 → z o = 0. Teste-se. Gilberto S.47 Como dá para ver no gráfico acima.00.43 − 325 .83 / 36 = 4.90 . s = 44 . Os valores críticos de z são iguais a ±1.59 .83 . este é trocado pelo desvio padrão amostral s.53 . que é o seu estimador na amostra. UEFS. 1 − α = 0. Gramacho. aceita-se H 0 com 90% de confiança.64.59 está compreendido entre ±1.83. denotando que a remuneração média mensal geral dos comerciários pode ser de cerca de R$ 325.64. 10. para o nível de confiança de 90%. Formulação: H 0 = 325 . .53 e R$ 44.64 corresponde à probabilidade de 0. O valor de z c =1.00. intervalo que delimita a área de aceitação do teste. e a estatística do .59 Quando o tamanho da amostra é n ≥ 30 e o desvio padrão populacional teste é expressa pela fórmula abaixo: zo = x −μ s/ n σ é desconhecido.00 Estatística do teste: z o = x −μ s/ n = 329 . ■ Solução: n = 36.

.3).3 – Decisão num teste t para a média populacional μ Tipo de teste Bicaudal Unicaudal à direita Unicaudal à esquerda Hipótese Nula H 0 : µ = µo H 0 : µ = µo H 0 : µ = µo Decisão Aceita-se Ho se -tc ≤ to ≤ tc se to < tc se to > -tc Alternativa H1 : µ ≠ µo H1 : µ > µo H1 : µ < µo Segue-se a representação gráfica da distribuição t para um teste bicaudal: Figura 10. b) Estatística do teste: t o = x −μ s/ n . Gramacho. com 1 − α de confiança. a) Formulação do teste Neste caso. como já detalhado no caso da distribuição normal (vide figuras 10. se to cair entre -tc e tc. Isso acontece porque o desvio padrão da amostra (s) não é um bom estimador do desvio padrão da população ( σ ). UEFS. Em testes unilaterais toda a área de rejeição α se localiza numa das extremidades da curva (direita ou esquerda). a formalização e a decisão inerentes ao teste seguem o mesmo ritual dos casos anteriores.4 Formato de um teste t bicaudal para a média μ Neste caso. por refletir a maior dispersão verificada sempre em distribuições de pequenas amostras. cujo resumo se encontra no quadro seguinte: Quadro 10.2 e 10. Gilberto S. e daí a denominação de teste t para a média populacional.60 na realização do teste. 29/09/2006. aceita-se H 0 . Prof. A distribuição t de Student é mais alongada nas extremidades do que a distribuição normal.

Ressalte-se. = 501.52 . que delimita a área de aceitação do teste. e equivale a 2. s = 10 gramas.52 está compreendido no intervalo ± 2.95 (α = 0.61 Nesta fórmula s é o desvio padrão da amostra e to é chamado de t observado.5 − 500 10 / 12 → t o = 0. Então. havendo forte evidência de que a máquina fora regulada satisfatoriamente. 1–α = 0.05) e n–1=11. Sabe-se que a distribuição do peso líquido dos potes é quase normal. Caso se opte pela fixação de limites críticos para a média amostral x . que mede o desvio existente entre média amostral e média da população.05 é encontrado na tabela da distribuição t de Student. que o teste pode ser feito da seguinte maneira: • Formulação: H 0 : μ = 500 gramas ∴H1 : μ ≠ 500 gramas. Exemplo: Uma máquina é regulada para envasar margarina em potes de 500 gramas.5 gramas e desvio padrão de 10 gramas. revelando peso líquido médio de 501. Iniciada a produção. Gramacho.201 × 10 12 = 500 ± 6.5 . Prof. UEFS. Neste sentido. • Valores críticos da média: xc = μo ± tc s n = 500 ± 2.2010. • Formulação: H 0 : μ = 500 gramas • Estatística para o teste: t o = x −μ s/ n ∴ H1 : μ ≠ 500 gramas. foi recolhida uma amostra de 12 potes. aceita-se H 0 com 95% de confiança. 29/09/2006. o teste poderá ser feito através da fórmula: xc = μo ± tc s n . pode-se aceitar que a máquina está operando satisfatoriamente? ■ Solução: n = 12.2010. Ao nível de confiança de 95%. O valor de tc para 11 graus de liberdade e nível de significância de 0. . ainda. Gilberto S.4 . x = 501 . Como se vê no gráfico acima. o valor to = 0. rejeita-se H 0 quando a média da amostra exceder aos valores críticos x c .

1.3). como admite o fabricante? Prof.4 gramas. p é a proporção hipotética na população. aceita-se H 0 com 95% de confiança. 29/09/2006. Pode-se admitir que a verdadeira proporção de peças defeituosas é realmente de 5%. com 95% de confiança. p é a proporção na amostra. quando se utilizou a distribuição normal para testar a média μ (vide figuras 10.6 Teste para a proporção populacional p a) Formulação do teste O modo de formalizar e decidir sobre os testes de hipótese para proporção segue o mesmo raciocínio até aqui desenvolvido.5 gramas se situa no intervalo acima.4.62 que resulta em 493 . A inspeção feita numa amostra aleatória de 200 peças constatou uma proporção de 6% de defeituosas.6 ≤ x c ≤ 506 . conforme se depreende também no gráfico a seguir: 10.2 e 10. 10. Gilberto S. zo = ˆ p −p pq n b) Estatística do teste: ˆ Como já esclarecido.5 – Decisão num teste z para a proporção populacional p Tipo de teste Bicaudal Unicaudal à direita Unicaudal à esquerda Hipótese Nula Alternativa Decisão Aceita-se Ho se -zc ≤ zo ≤ zc se zo < zc se zo > -zc H 0 : p = po H 0 : p = po H 0 : p = po H1 : p ≠ po H1 : p > p 0 H 1 : p < po Os três tipos de testes anotados no quadro acima têm perfil gráfico igual aos do subitem 10. Como a média x = 501 . conforme resumo do quadro 18: Quadro 10. . Exemplo 1: Um industrial considera satisfatório se a proporção de peças produzidas na sua indústria for da ordem de 5%. UEFS. e q =1 − p é o complemento de p. z o é o z observado. Gramacho.

num teste unilateral. pode-se aceitar a hipótese de que a real proporção de peças defeituosas é superior a 7%? • Formulação: H0 : p = 0.96. • Cálculo da estatística zo: zo = ˆ p −p pq n = 0. 29/09/2006. O valor de z crítico para 95% de confiança.63 • Formulação: H0 : p = 0.64. UEFS.64 . Para o grau de confiança de 95%. que delimita a área de aceitação de H 0 . há forte evidência de que a proporção equivalente a 5% de peças defeituosas é verdadeira. .65 .05 × 0.7 O Teste do p–valor Nesse caso. a veracidade da hipótese é confirmada pela estatística teste chamada de p–valor ou Prof.95 200 → z o = 0.65 pertence ao intervalo ±1. ao nível de confiança adotado.06 − 0.93 200 → z o = −0. correspondem valores críticos de z nos valores de ±1. Portanto.07 0. Significa que a verdadeira proporção de peças defeituosas não é superior a 7%. é z c = 1. que permite aceitar H 0 .55 .07. Gramacho. O esboço do teste se vê no gráfico abaixo: Aqui.07 ∴ H1 : p > 0.55 < 1. • Estatística do teste: zo = ˆ p −p pq n = 0.96. ao nível de 95% de confiança. pois 0.07 × 0. pois -0. 10. Gilberto S.05 contra H1 : p ≠ 0. na tabela da normal.05 0. Exemplo 2: Utilizando as mesmas informações do exemplo 1. aceita-se H 0 .05. cujo desenho se observa no gráfico adiante.06 − 0.

Aí consiste a grande vantagem da técnica em comento. UEFS. quando x é menor que μ 0 (a média amostral é menor que o valor suposto para a média populacional). que é o nível de significância do teste ( p <α ). Hipótese nula: H 0 : μ = 350 kw/mês (teste bicaudal). b) p − valor = P ( z ≥ z 0 ) . ou seja. quando x é maior que μ 0 . Destarte. a exemplo da planilha Excel. Julgando que atualmente consumo médio mensal seja de cerca de 350 kw/mês. rejeita-se H 0 . menor é a probabilidade de a hipótese nula ser verdadeira. quando x é maior que μ 0 . Deste modo. Gramacho. O p–valor corresponde a um nível de significância observado. cuja variação histórica é de 50 kw/mês. A dificuldade prática de se trabalhar com o p–valor.05 . O teste do p–valor dá resultado igual ao do método tradicional. Prof. quanto menor é o p–valor encontrado. obtendo-se consumo médio de 320 kw/mês. aceita-se a hipótese nula. com 95% de confiança. quando x é menor que μ 0 . Exemplo: Voltemos ao caso do consumo domiciliar de energia em certa cidade. como acontece no processo tradicional. Gilberto S. n = 100. em que a comparação é feita com o nível de significância arbitrado α . 29/09/2006. como num teste de hipóteses tradicional. . Com esse teste chega-se à mesma coisa de maneira diferente. dentre outros.64 valor–p. o seu resultado consiste em aceitar ou rejeitar a hipótese nula H 0 . se encontra praticamente superada em face dos aplicativos disponíveis em computador. x = 320 kw/mês. Teste a hipótese de o consumo médio de energia ser de 350 kw/mês. 1 − α = 0.95 . b) p − valor = 2P( z ≥ z 0 ) . sem a necessidade de estabelecer hipótese alternativa nem valores críticos. Em testes com a distribuição normal o p–valor é calculado da seguinte maneira: • Para teste unicaudal: a) p − valor = P ( z ≤ z 0 ) . donde α = 0. para obter o resultado do teste. quando o p–valor é menor que α . A rejeição da hipótese nula ( H 0 ) ocorre quando o p–valor do teste é menor que o valor escolhido de α . ■ Solução: σ = 50 kw/mês. • Para teste bicaudal: a) p − valor = 2P( z ≤ z 0 ) . se a distribuição é distinta da normal. coletou-se uma amostra aleatória junto a 100 consumidores. do contrário. E o resultado do teste é obtido por meio de comparação entre o p–valor e o nível de significância adotado.

mensurando o seu impacto sobre setores de educação. bem estar social e comércio de uma ampla e variada gama de bens e serviços que a sociedade moderna exige. taxa de juros e níveis de investimento e emprego. Vale relembrar. renda. uma vez que fornecem subsídios indispensáveis à formulação. saúde. e pesquisadas as correlações e relações funcionais existentes.4999 ) → p − valor = 0. que quanto menor é o valor numérico do p–valor maior é a evidência contra a aceitação de H 0 .0002 .65 • Cálculo da estatística zo: z o = x −μ σ/ n = 320 − 350 50/ 100 → z o = −6 (como visto antes). que facilitam a tomada de decisões. emprego. que produz uma grande diversidade de relações de causa e efeito. . por fim. 29/09/2006. para z o = -6 e z c = ±1.0002<0. Neste contexto. implementação e avaliação de ações políticas. rejeita-se H 0 . que precisam ser analisadas. 11 CORRELAÇÃO E REGRESSÃO SIMPLES No mundo real é fácil de encontrar relações de interdependência entre duas ou mais variáveis aleatórias. Sem isso é absolutamente impossível pensar-se em planejamento público ou privado. • Cálculo do p–valor para teste bicaudal: p − valor = 2P( z ≤ −6) = 2(0. a exemplo de: consumo e renda. constantemente são estabelecidos cruzamentos de informações.05 ( p − valor <α ). Assim. Gramacho. peso e altura de um grupo de pessoas. custo total e quantidade de insumos necessários para produzir um bem. Prof. a fim de avaliar e controlar efeitos decorrentes de variáveis que interagem entre si. compreendidas e controladas. gasto com propaganda e volume de vendas. Gilberto S. A própria atividade humana em toda a sua plenitude é um corpo complexo de fatos e ações entrelaçados entre si. o planejamento utiliza-se de técnicas de tratamento e análise de dados.96 .5 − 0. dentre inúmeras outras relações importantes. intensidade de chuvas e volume de safras agrícolas. preço e demanda de um produto. Como 0. UEFS. Nota-se que a mesma conclusão foi conseguida pelo critério tradicional. não havendo evidência estatística de que o consumo médio de energia na cidade seja de 350 kw/mês.

o coeficiente de correlação e o coeficiente de determinação são indicadores eficientes da qualidade do ajustamento. se a relação envolver mais de duas variáveis. se é negativo há relação inversa entre as variáveis. O sinal de r indica o sentido da correlação. etc). definir a tendência dos valores observados. ou seja. 29/09/2006. respectivamente. Se r é positivo há relação direta entre as variáveis. 11. tal que r = 1 ou r = -1.66 A dependência funcional entre variáveis aleatórias é estudada por meio de duas técnicas mutuamente relacionadas chamadas de correlação e de regressão. Neste caso. polinomial. . Assim. UEFS. que varia no intervalo de -1 a 1 ( − 1 ≤ r ≤ 1 ). Gilberto S. A vantagem do coeficiente de correlação é que não é afetado pela medida das variáveis envolvidas na relação. de Prof. a aderência da função aos dados é avaliada por estatísticas que permitem testar a eficiência do ajustamento da função aos valores da amostra que representa a relação. Quando todos os pontos observados coincidem com a linha reta. E a análise de regressão é utilizada para estudar esse mesmo relacionamento mediante o ajustamento de uma curva ou função matemática adequadamente escolhida. etc. Quando a relação é entre duas variáveis. denotando que a variação numa delas causa efeito contrário em outra. pela dificuldade de representação no plano. Na população esse coeficiente é representado pela letra grega ρ (rô) e na amostra pelo letra latina r (erre). de fácil interpretação. através de um índice conhecido como coeficiente de correlação. o coeficiente r é um estimador de ρ na amostra. É um procedimento mais científico que utiliza inferência estatística (análise de variância. que pode ser de natureza linear. possibilitando definir a função que se ajusta à relação. a depender da variação do sinal. Um problema crucial nessa área de estudo é o da identificação da relação funcional que descreve o comportamento dos dados empíricos. A determinação de uma função que se ajusta a um conjunto de pontos do plano é chamada técnica de ajustamento. testes de significância. a tendência dos dados é facilmente identificada por meio do gráfico conhecido como diagrama de dispersão. ou seja. Gramacho. A análise de correlação é utilizada para avaliar o grau de relacionamento entre duas ou mais variáveis. pois o seu valor é um número adimensional. a correlação é perfeita. exponencial. em que os pares de valores x i e y i são representados no plano. Porém. positiva ou negativa.1 Correlação linear simples Serve para avaliar o grau de relação linear entre duas variáveis. Não há correlação linear quando o coeficiente r é igual a zero.

30 a correlação é muito fraca ou desprezível. Gramacho.60 < | r | ≤ 0. isto é. var(x) é a variância da variável aleatória x.1 Na prática procura-se maximizar o valor do coeficiente de correlação. Mas essa regra não é rígida. UEFS. selecionando amostras que proporcionem coeficientes o mais próximo possível de ±1 .60 a correlação é relativamente fraca. Gilberto S. . entre elas.67 forma que a variação de uma provoca efeito no mesmo sentido em outra. a relação entre as variáveis não é muito expressiva. A fórmula básica para estimar o coeficiente de correlação linear entre X e Y é: r= cov( x . pelo que praticamente nada se pode concluir sobre a relação. var( y) → r= ∑( x − x )( y − y) ∑( x − x ) 2 ∑( y − y) 2 O símbolo cov(x. pois varia de autor para autor. eis um dos exemplos abaixo: a) se 0 < | r | ≤ 0. como ilustram os gráficos a seguir. a relação entre as variáveis é forte.99 a correlação é significativa. b) se 0. y) significa covariância entre as variáveis aleatórias x e y. a fim de avaliar a correlação linear entre tais Prof. y) var( x ). 29/09/2006. Alguns autores costumam estabelecer intervalos a fim de facilitar a interpretação do coeficiente de correlação. Figura 11.30 < | r | ≤ 0. e var(y) é a variância da variável aleatória y. isto é. c) se 0. Exemplo: Um órgão de pesquisa coletou os seguintes dados sobre consumo e renda de uma região (em bilhões de unidades monetárias constantes).

81 2.09 0.23 x² 10.25 13.04 0.89 12.29 9.9 28.5 0.9 21.68 variáveis. de modo direto.25 0.81 2.9 21.7 4.69 16.6 -0.1 2. Gramacho. Então.00 0.1 2.36 0.01 114.2 3.0 4.42 (x – 4)(y – 3) 0.9 28.5 4.81 2.3 0.3 3.1 3.Correlação linear simples pelo método dos desvios em torno da média Ano 1999 2000 2001 2002 2003 2004 2005 Total Renda (x) Consumo (y) 3.09 0.25 0.0 2.8 -0.0 xy 6. segue-se o valor do coeficiente de correlação referente ao caso em estudo: Cálculo das médias: x = 2.2 0.64 20.72 0. é obtido a partir dos somatórios elaborados no quadro adiante: Quadro 11.08 y–3 -0.25 0.5 3.23 28 21 =4 e y = = 3 .3 0.1 0.9 0.25 15. o mesmo valor da estimativa de r para a relação entre o consumo e a renda.3 3.81 0.7 3.41 5. Existem outras fórmulas mais simples de operar.72 8. 29/09/2006.9 0.Amostra sobre Consumo e Renda Anual .00 17.2 4. sem precisar calcular os desvios de cada valor da variável em torno da sua média.5 0.09 0. UEFS.0 0.25 0.1 3.9 -0. Gilberto S.0 (y – 3)² 0.4 2.0 x–4 -0.86 15.4 2.23 →r = 0.994 2.23 5.5 3.0 2.2437 O valor de r indica que existe uma forte relação linear entre o consumo e a renda.5 4. com base nas somas obtidas no 7 7 quadro acima.00 0.0 (x – 4)² 0.40 13.7 3.23 ( 2. como a que se apresenta a seguir: r= ∑xy − ∑x ∑y / n [ ∑x 2 − ( ∑x ) 2 / n ][ ∑y 2 − ( ∑y) 2 / n ] Então.7 4.08 y² 4.42 Prof.2 – Cálculo do coeficiente de correlação linear pelo método direto Ano 1999 2000 2001 2002 2003 2004 2005 Total Renda (x) Consumo (y) 3.40 9.30 0.76 7.08 )( 2.25 24.99 12.75 19.24 12.0 4.0336 = 2.06 0.2 3.5 3.64 0.2 4.5 3.1 . conforme quadro a seguir: Quadro 11. desenvolvidas a partir da fórmula original vista acima.5 -0.61 10.01 0.09 0.21 65.42 ) r= = 2.3 0.11 86. .

Como já dito. que pode ser estudada através do modelo y = α + βx + ε . Se a relação é proveniente de uma amostra. as variações absolutas em x provocam variações absolutas em y. Gramacho. O diagrama a seguir mostra uma situação em que a nuvem de pontos. 29/09/2006. UEFS. Gilberto S. um jeito prático de identificar a tendência de uma relação é através do diagrama de dispersão. Se a amostra for grande é possível verificar se a equação da reta é a melhor opção de ajustamento à nuvem de pontos distribuídos no plano. formando cada par de valores x i e yi um ponto no plano. em que os coeficientes “a” e “b” são estimadores dos parâmetros α e β . apesar dos afastamentos.42 − 212 / 7] = 0. pois a relação entre as mesmas pode ser decorrente de mera casualidade . 11. .69 r= ∑ xy − ∑ x ∑ y / n [ ∑ x 2 − (∑ x ) 2 / n ][ ∑ y 2 − (∑ y) 2 / n ] = 86 .23 − 28 × 21 / 7 [114 . os α e β são parâmetros relativos uma característica da população. como é mais freqüente.994 Cabe advertir que um índice de correlação elevado não implica necessariamente em relação de dependência entre duas variáveis. em que os valores de Y figuram em ordenada e os de X em abscissa. segue uma tendência linear: Prof.08 − 28 2 / 7][ 65 .2 Regressão linear simples Supõe-se que o relacionamento entre duas variáveis segue uma tendência linear. X é a variável independente.e não de causalidade. Esta equação é uma estimativa do modelo teórico acima. a regressão é ˆ representada pela equação da reta y =a + bx . Eis que na equação acima: coeficientes Y é a variável dependente. A equação da reta indica que se há regressão linear de y sobre x. e o símbolo ε éo erro aleatório – aquele que não é explicado pelo modelo adotado para estudar a relação entre X e Y. para a população como um todo.

1 O Método de mínimos quadrados É um método utilizado para estimar os coeficientes da reta. mediante minimização da soma ˆ dos quadrados dos desvios entre valores observados (y) e valores estimados pela reta ( y ). troca-se y por a + bx na expressão Σ ( y −y) 2 . Gilberto S. onde a diferença ε = y − y simboliza o erro aleatório (não explicado pela regressão). por ˆ ˆ ( meio da equação ∑ε 2 = ∑ y − y) 2 . chega-se ao sistema de equações normais que minimiza ε 2 . . Gramacho. conforme instruções abaixo: ˆ ˆ Em primeiro lugar.70 Figura 11. pois a segunda derivada do quadrado do erro é também positiva: − 2( Σy − na − bΣx ) = 0 → Σy = na + bΣx 2 (i) − 2( Σxy − aΣx − bΣx 2 ) = 0 →Σxy = aΣx + bΣx 2 (ii) Este sistema tem a seguinte solução para os coeficientes a e b: a= Σy Σx −b e n n b= ∑ xy − ∑ x ∑ y / n ∑ x 2 − (∑ x ) 2 / n Prof. igualando-se as derivadas parciais a zero. observando as propriedades dos somatórios e arrumando os termos. UEFS.2.2 11. 29/09/2006. deriva-se parcialmente ε 2 em relação aos coeficientes "a" e "b": ∂Σε 2 = 2Σ( y − a − bx )( −1) = . ( Em segundo. A minimização de Σ 2 gera um sistema de equações normais para calcular os coeficientes ε ˆ da reta y =a +bx . tal que: ∑ε 2 = ∑ y −a −bx ) 2 .2( Σy − na − bΣx ) ∂a ∂Σε 2 = 2Σ( y − a − bx )( −x ) = −2( Σxy − aΣx − bΣx 2 ) ∂b Em terceiro.

28 n n 7 7 a= ˆ 1 7 Afinal.28 + 1. A equação estimada sugere que quando a renda (x) aumenta de um bilhão de unidades monetárias.07 bilhão de unidades monetárias.71 Exemplo: Seja a relação entre consumo e renda. Como o somatório dos desvios em torno da média é igual a zero.08 114.112 2. Os somatórios apurados naquele quadro permitem determinar os valores dos coeficientes da → b= 86.1 xc = x − 4 -0.68 0. .23 = = → b = 1.08 .3 – Amostra sobre Consumo e Renda Anual – Regressão linear simples – Sistema reduzido Ano 1999 Renda (x) 3.0 x . indicando que o ajustamento da reta equação da reta do seguinte modo: b= ∑ xy − ∑ x ∑ y / n ∑ x 2 − (∑ x ) 2 / n ˆ y = a + bx amolda-se bem à série histórica. Gramacho. com base nos somatórios elaborados no quadro seguinte: Quadro 11. Σx c = Σ ( x − x ) = 0 . cujo coeficiente de correlação igual a 0.23 − 28 × 21 / 7 86 . o sistema de equações é simplificado para: Σy = na → a = Σy →a = y n (i) (ii) 2 Σx c y = bΣx c → b = ∑x c y 2 ∑x c Agora.994 sugere uma forte relação linear entre essas duas variáveis.(28) / 7 21 28 Σy Σx −b →a = −1. constante do quadro 11.07 × → a = −1. o consumo (y) sofre um acréscimo médio de 1. O sistema de equações normais pode ser reduzido mediante a transformação x c = x − x . a estimativa do consumo no referido ano seria: ˆ ˆ y 2006 = −1. a reta de regressão do consumo sobre a renda é y =− .23 − 84 2.07 bilhões.08 .2.07 × 5 → y 2006 = 4.2 Consumo (y) 2.64 Prof.28 +1. Gilberto S.8 2 xc xcy -1.1.07 2 114. Caso as autoridades projetassem um nível de renda anual de cinco bilhões de unidades monetárias para a região em 2006. 29/09/2006. UEFS. os coeficientes da reta de regressão vão ser estimados através do sistema reduzido (centrado na média).

66 1.2 4.4 2.9 21. como ilustram as fórmulas seguintes: r2 = ˆ VE ∑( y − y) 2 = VT ∑( y − y) 2 2 ou r = 1 − ˆ VR ∑( y − y) 2 =1 − .07 x c .9 0.9 28.07 ( x − 4) = 3 +1.20 -0.25 0.72 2000 2001 2002 2003 2004 2005 Total 3. indicando que há um relacionamento perfeito entre diminui à medida que o seu valor se afasta da unidade. o poder de X explicação é de 100%.08 -1. 29/09/2006.2.25 0.3 0. O coeficiente r 2 varia entre 0 e 1. como segue: ˆ ˆ y = 3 +1.07 x − 4. na qual a relação entre a variação residual (VR) e a total (VT) é subtraída da unidade. Gramacho. a equação da reta centrada na média de ˆ é y = 3 +1.81 0.7 4.5 3. tal que todos os valores observados estão sobre a reta ou curva.00 0. O poder de explicação de r 2 Calcula-se r 2 através da relação entre a variação explicada (VE) e a variação total (VT).2 Coeficiente de explicação É uma medida da qualidade do ajustamento da função aos dados. 1 11. e Y.1 3.0 0.0 4.04 0. Representa a variação total da variável y (dependente) que é explicada pela variável x (dependente).08 X Assim.07 2.5 0. UEFS. inclusive de funções não lineares.81 2. É também conhecido como coeficiente de determinação e é simbolizado por r 2 . Se r 2 = 1 .5 -0. o modelo de regressão nada explica sobre a relação entre as variáveis X e Y.75 3. ou ainda por intermédio da relação complementar.5 4. Exemplo: Eis o cálculo de r2 para a relação consumo e renda.28 +1. basta apenas trocar x c por x − 4 na equação de y.2 0. Para recuperar os ˆ valores originais de X. Se r 2 = 0 .00 0. com base nas somas do Prof. . através do modelo de regressão.23 → b = 1.07 x . ou seja.0 2.51 2.33 a= Σy 21 = →a =3 n 7 b= ∑ xcy 2 ∑ xc = 2.0 0.7 3.3 3.0 -0. 0 ≤ r 2 ≤ 1 .28 →y = − .5 3. que vale para qualquer tipo VT ∑( y − y) 2 ajustamento. Gilberto S.09 0.

0081 0.07 0. Por exemplo. ou seja.05 0.54 3.01 0.0016 0.09 0.1 2.2 3.3 -0.00 ˆ (y .0016 -0.42 ˆ y 2.36 0.0 Consumo (y) 2.9 -0.09 Prof.3413. senão vejamos: r = 0.Cálculo do coeficiente de explicação Ano 1993 1994 1995 1996 1997 1998 1999 Total Renda (x) 3.9 28.06 0.06 0.0004 0.4 .01 0.02 0. 29/09/2006. Gramacho.5 4. ou vice-versa. Vale ressaltar que a raiz quadrada de r 2 é uma estimativa do coeficiente de correlação r. As áreas para os valores negativos de z são conseguidas por simetria.02 0. a área sob a curva entre z = 0 e z = 1 corresponde a 0.0 y.68 3.08 0.42 O resultado acima informa que 98.5 0. Quadro 11.0036 0.9 (y-3)² 0.7 4.73 quadro abaixo.0289 r 2 =1 − ˆ ∑( y − y) 2 ∑( y − y) 2 =1 − 0. 9 9 ANEXOS Tabela I – Distribuição normal padronizada O valor de cada casa da tabela indica a proporção da área total sob a curva normal entre z = 0 e um valor positivo de z.06 0. UEFS.4 2.7 3.9 8 =0.00 0.2 4.14 2.9 4 .09 -0.Consumo e Renda Anual .5 3.8% da variação do consumo é explicada pela variação da renda.10 0.46 2.96 21. z 0.81 0.6 -0.03 0.04 ˆ (y .0289 = 1 − 0.21 3. .0036 0.1 0.0 4.00 3.0100 0.0119 → r 2 = 0.3 3.3 0.81 2.9 21.09 0.1 3.04 0.3 0.25 0.988 2. a regressão linear tem um alto poder de explicação sobre a variação da relação consumo/renda.5 3. Gilberto S.04 -0.y ) -0.y )2 0. que é o mesmo valor da área compreendida entre z = 0 e z = -1.

4992 0.4345 0.4890 0.4015 0.3389 0.8 1.025 35.1217 0.4994 0.4995 0.4986 0.4963 0.4846 0.4984 0.4966 0.4990 0.4920 0.0120 0.4938 0.4767 0.4981 0.4957 0.4961 0.4279 0.3340 0.0636 0.4616 0.0948 0.4997 0.3 1.4207 0.4948 0.2 1.4974 0.4946 0.4306 0.4699 0.4968 0.1985 0.0675 0.3138 2.4993 0.1026 0.4625 0.9200 0.4850 0.1064 0.4987 0.2053 0.0478 0.4821 0.0793 0.0987 0.4808 0.4918 0.4573 0.4960 0.1950 0.2324 0.1591 0.7 2.8856 0.3106 0.2 3.4929 0.0000 0.4893 0.4854 0.4996 0.2157 0.3508 0.1293 0.4997 0.4976 0.2054 0.4962 0.3264 0.4131 0.4066 0.5 2.3289 0.4994 0.4997 0.0871 0.4881 0.706 4.4995 0.4251 0.8 0.4826 0.6 1.2454 0.4934 0.4693 0.4554 0.4955 0.2673 0.2642 0.3365 0.4925 0.2224 0.4864 0.1808 0.2 0.4964 0.2190 0.4857 0.1628 0.4994 0.4909 0.4 1. Gramacho.2517 0.4991 0.4945 0.4988 0.4671 0.1 2.1331 0.4871 0.4993 0.9248 Prof.1103 0.4591 0.3749 0.4803 0.1 0.4967 0.4830 0.4505 0.4370 0.4989 0.3127 0.3643 0.4783 0.4985 0.4761 0.4474 0.3944 0.4996 0.3 2.4972 0.4429 0.3554 0.4980 0.4974 0.0239 0.4099 0.4887 0.3315 0.4992 0.4997 0.1406 0.3980 0.4997 0.4986 0.4906 0.3621 0.4987 0.2939 0.3599 0.4793 0.6036 0.4236 0.0910 0.4649 0.4997 0.4952 0.4484 0.4633 0.4817 0.4878 0. ν α 1 2 0.8 2.4394 0.4911 0.1255 0.4868 0.2088 0.4495 0.2 2.4995 0.7 0.4991 0.74 0.0080 0.3 0.4991 0.4582 0.0714 0.9 3.4994 0.4332 0.4756 0.4706 0.20 3.3051 0.4896 0.4996 0.2764 0.0279 0.3238 0.4936 0.4973 0.4798 0.5 0. 29/09/2006.2995 0.4993 0.4940 0.2019 0.3849 0.1554 0.4979 0.4904 0.3438 0.2611 0.0 3.05 12.1879 0.10 6.4049 0.4996 0.25 2.9 2.4142 1.0199 0.4 2.2257 0.4990 0.3729 0.4988 0. UEFS.4222 0.3962 0.0832 0.3133 0.3907 0.2852 0.6 0.4994 0.1368 0.4545 0.4965 0.657 9.3997 0.3159 0.4842 0.4406 0.1141 0.4719 0.4177 0.4898 0.4192 0.1736 0.2291 0.4990 0.4525 0.1 1.4162 0.4788 0.4971 0.0596 0.1664 0.4978 0.4995 0.2549 0.4913 0.2703 0.4147 0.7 1.4953 0.2422 0.2734 0.4997 0.4732 0.2823 0.4991 0.4664 0.4983 0.4515 0.4082 0.0040 0.0319 0.4975 0.4265 0.4969 0.4970 0.3869 0.0 0.4319 0.1517 0.4987 0.4943 0.4977 0.2486 0.4927 0.3810 0.4977 0.4 0.3531 0.4996 0. Gilberto S.4993 0.3790 0.4997 0.4292 0.4463 0.0517 0.0359 0.4772 0.4982 0.4834 0.4441 0.2389 0.4884 0.01 63.3830 0.2910 0.4686 0.3485 0.0398 0.3 3.4875 0.1179 0.3888 0.4608 0.3023 0.4995 0.9 1.4992 0.1700 0.0160 0.4996 0.4750 0.4812 0.4932 0.4382 0.4564 0.4989 0.2794 0.4656 0.4713 0.4916 0.4357 0.4979 0.4838 0.4 0.4599 0.3686 0.3186 0.4861 0.4956 0.2881 0.0438 0.4901 0.4997 0.3708 0.4995 0.0777 1.4998 Tabela II – Distribuição t de Student Nível de significância (α ) para teste bilateral em face do número de graus de liberdade (ν = n -1).2357 0.4452 0.4115 0.4949 0.4032 0.0 1.542 6.4997 0.4982 0.1 3.4985 0.6 2.0753 0.3770 0.4726 0.3461 0.4951 0.3925 0.4744 0.3212 0.4535 0.4989 0.4922 0.1772 0.4778 0.2123 0.3577 0.4641 0.4418 0.4738 0.1844 0.1915 0.4931 0.2967 0.2580 0.4981 0.1480 0.4941 0.3413 0.0 2.4959 0.1443 0.3078 0.5 1.4678 0.0557 0. .4984 0.3665 0.

3304 1.3830 1.3117 1.6973 1.3031 1.3287 1.1866 1.3968 1.6338 2.3163 1.7564 2.3638 2.1448 2.1098 2.8073 2.7207 1.6449 3.6577 1.2213 1.3125 1.2733 1.7500 2.1789 1.4334 2.3253 1.6174 2.1937 1.7291 1.7969 2.1816 1.1673 1.4759 1.0518 2.4226 1.1757 1.8412 2.3979 2.1315 2.7109 1.4954 3.3846 2.7787 2.1967 1.9208 2.0452 2.1802 1.4899 2.8453 2.7341 1.7081 1.0150 1.3634 1.6603 2.3009 1.0595 2.8609 2.7011 1.1009 2.2041 1.3788 2.1559 1.7613 1.2991 2.5096 2.1604 2.8784 2.0123 2.7074 3.8314 2.1731 1.4995 3.1503 1.3562 1.6991 1.4469 2.2089 1.6377 1.5326 2.2498 3.0321 3.1831 1.3646 2.6839 1.1848 1.9600 4.4398 1.1634 2.3368 1.3150 1.7764 2.1748 1.3232 1.0687 2.1887 1.9768 2.0003 1.2281 2.2145 1.1058 3.3722 1.3289 2.7874 2.1910 1.3910 2.1693 3.8595 1.4729 2.2622 2.2890 1.3406 1.9687 2.3502 1.7633 2.2010 2.2297 1.5600 2.9467 2.1739 1.7515 2.0423 2.7459 1.6850 2.6041 4.0484 2.7171 1.1788 2.2958 1.3114 1.0860 2.1825 2.8982 2.0739 2.7707 2. 29/09/2006.3334 1.8409 4.6707 1.7530 1.2414 5. Gilberto S.0555 2.3450 1.75 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 +∞ 1.9545 3.5706 2.7056 1.4581 2.3734 2.8125 1.7139 1.4231 2.4450 2.9432 1.1777 1.3534 2.7709 1.8331 1.0930 2.1199 2.1766 1. .0211 2.1765 3.7396 1.3685 2.7033 1.2820 2.8188 2.3178 1.4055 2.7959 1.2001 1.7823 1.3444 1.9799 1.3104 1.5931 2.2543 1.1318 2.7045 2.0639 2.2403 1.3554 3. Gramacho.8946 1.5758 Prof.7247 1.4149 1. UEFS.4138 2.3195 1.5332 1.2699 2.3212 1.1616 1.3060 2.3596 2.0796 2.

Sign up to vote on this title
UsefulNot useful