P. 1
UEFS-ProbabilidadeeInferencia[1]

UEFS-ProbabilidadeeInferencia[1]

|Views: 545|Likes:
Publicado porliviarldias

More info:

Published by: liviarldias on Feb 15, 2011
Direitos Autorais:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as DOC, PDF, TXT or read online from Scribd
See more
See less

11/29/2012

pdf

text

original

Sections

  • 6.1 Introdução
  • 6.2 Experimento aleatório
  • 6.3 Espaço amostral
  • 6.4 Eventos
  • 6.5.1 “Definição” clássica
  • 6.5.2 Definição freqüêncial
  • 6.5.3 Definição axiomática
  • 6.5.4 Definição subjetiva
  • 6.6 Teoremas básicos
  • 6.7.1 Fatorial
  • 6.7.2 Arranjo simples
  • 6.7.3 Permutação simples
  • 6.7.4 Combinação simples
  • 6.9.1 Eventos dependentes
  • 6.9.2 Eventos independentes
  • 6.10 Teorema da probabilidade total
  • 6.11 Teorema de Bayes
  • 7.1 Definição
  • 7.2.3 Distribuição de probabilidade de variável aleatória discreta
  • 7.2.4 Função distribuição acumulada
  • 7.2.5 Valor esperado de uma variável aleatória discreta
  • 7.2.6 Variância de uma variável aleatória discreta
  • 7.3 Variável aleatória contínua
  • 8.1. Distribuição binomial
  • 8.2. Distribuição de Poisson
  • 8.3. Distribuição normal
  • 9.1 Introdução
  • 9.2 Estimação por ponto
  • 9.3.1 Intervalo de confiança para a média da população µ ― σ conhecido
  • 9.3.2.1 Grandes amostras
  • 9.3.2.2 Pequenas amostras ― a distribuição t de Student
  • 9.3.3 Intervalo de confiança para a proporção populacional p
  • 10.1 Definição
  • 10.2 Teste de hipóteses
  • 10.3 Risco de erros em testes de hipóteses
  • 10.4 Teste para a média populacional µ – teste z
  • 10.5 Teste para a média populacional µ – teste t de Student
  • 10.6 Teste para a proporção populacional p
  • 10.7 O Teste do p–valor
  • 11.1 Correlação linear simples
  • 11.2.1 O Método de mínimos quadrados
  • 11.2.2 Coeficiente de explicação

6

PROBABILIDADE 6.1 Introdução
A teoria da probabilidade é a parte da matemática que estuda os fenômenos aleatórios. Todo fato ou acontecimento passível de observação é chamado de fenômeno, e os seus
possíveis resultados são determinísticos ou aleatórios. Qualquer ensaio ou experiência destinado à verificação de um fenômeno é chamado de experimento. Diz-se que um fenômeno é determinístico quando apresenta um só resultado sob as mesmas condições de experimentação, isto é, se a experiência não se altera o seu resultado é sempre o mesmo. Já os fenômenos aleatórios, ainda que repetidos sob as mesmas condições iniciais, apresentam resultados distintos ou incertos, porque estão sujeitos às leis do acaso. Tanto que quando se atira uma moeda para o alto a força da gravidade faz com que a sua queda seja certa, a velocidade da queda da moeda, desde que lançada sob as mesmas condições, será uma constante que se pode chamar de fenômeno determinístico. Mas a ocorrência de cara ou de coroa é imprevisível, pois alguém pode apostar em cara e dar coroa, ou vice-versa. É essa incerteza quanto aos resultados do acontecimento que denota o que se chama de fenômeno aleatório. Neste contexto, a probabilidade é um número real que exprime quão provável é a chance de ocorrer um particular resultado do acontecimento aleatório. De início a teoria da probabilidade era utilizada para prever resultados de jogos de azar, e daí a razão de tal vertente ser bastante explorada no estudo introdutório da matéria. Porém, com o passar do tempo, as aplicações de probabilidade se expandiram notavelmente, sobretudo em processos de tomada de decisão ligados a acontecimentos sujeitos aos efeitos do acaso, tais como: previsão meteorológica e de safras agrícolas; risco de apólices de seguro; cotação de ações em bolsa de valores; controle de qualidade; marketing, etc.

6.2 Experimento aleatório
Designa uma experiência em que os seus resultados são imprevisíveis, mesmo que seja repetida indefinidamente sob condições semelhantes, e é simbolizado pela letra E latina. Eis alguns exemplos de experimento aleatório:

2
E1: arremessar um dado e anotar o número do lado que cai para cima; E2: lançar uma moeda e verificar a seqüência de cara e coroa; E3: retirar cartas de um baralho e verificar as figuras; E4: Conferir o número de peças defeituosas produzidas diariamente por uma máquina; E5: Verificar a execução de uma tarefa e anotar o tempo gasto por cada trabalhador. Embora os resultados dos experimentos retromencionados se pareçam absolutamente acidentais, verifica-se que na realidade eles tendem para uma estabilidade estatística quando a experiência é repetida um número relativamente grande de vezes. Esta regularidade é fundamental porque facilita a construção de modelos matemáticos para descrever o comportamento do fenômeno, possibilitando à previsibilidade de cada valor em particular, como se verá mais adiante.

6.3 Espaço amostral
O conjunto de todos os resultados possíveis de um experimento aleatório é chamado de espaço amostral. Este é um conjunto S em que cada um de seus elementos está associado a um e somente um resultado possível do experimento. Eis, então, os seguintes exemplos: a) lançamento de um dado: S1 = {1, 2, 3, 4, 5, 6}; b) lançamento de uma moeda: S2 = {cara, coroa}; c) retirada de uma carta de um baralho: S3 = {as 52 cartas}; d) Contagem diária das peças defeituosas produzidas por uma máquina, para controle do processo: S 4 = {0, 1, 2, 3, ..., n} ; e) tempo que um grupo de trabalhadores gasta para executar uma tarefa que está a ser

implantada:

S5 = {x ∈ R / x > 0

}.

Os exemplos vistos nas letras a, b, c e d são de espaços amostrais finitos numeráveis e o da letra e de espaço amostral infinito não-enumerável, cujo estudo será abstraído neste capítulo, por exigir aplicação de matemática avançada, em face de maior complexidade teórica.

6.4 Eventos
Prof. Gilberto S. Gramacho, UEFS, 29/09/2006.

3 Qualquer subconjunto do espaço amostral S é chamado de evento. Se um evento tem apenas um
elemento é chamado de evento simples, e de evento composto se tem mais de um elemento. Um evento é definido por uma sentença e tem como símbolo as letras maiúsculas do alfabeto. Os seus elementos são descritos por números arábicos, ou letras minúsculas quando não têm expressão numérica. Eis que quando se lança uma moeda o espaço amostral é formado por dois eventos simples cara (c) e coroa (k), tal que S = {c, k}. Agora quando se lançam duas moedas o espaço amostral corresponde a quatro seqüências de coroa/coroa (kk), coroa/cara (kc), cara/coroa (ck) e cara/cara (cc), de modo que se tem S = {kk, kc, ck, cc}, onde cada seqüência é um evento composto de S. E o evento relativo a pelo menos uma cara é definido pelo subconjunto A = {kc, ck, cc}. Veja-se ainda, neste caso, que os elementos de S podem ser definidos como pontos de uma variável aleatória, quando se enuncia, por exemplo, que
X

é igual ao número de caras. Isso permite

descrever o mesmo espaço amostral através de números, tal que S = {0, 1, 2} e o referido evento A pelo subconjunto numérico A = {1, 2}, como se vê no quadro abaixo.
Quadro 6.1 – Eventos relativos ao lançamento de duas moedas Seqüências kk kc, ck cc
X

= número de caras 0 1 2

Outrossim, quando o experimento consiste no lançamento de um dado o número de casos possíveis é igual a seis, que corresponde à freqüência de cada uma das seis faces que pode cair voltada para cima, e é representado pelo conjunto S = {1, 2, 3, 4, 5, 6}. Para um S finito ou infinito numerável, constituído de n elementos, existem 2 n subconjuntos ou eventos possíveis. a) Evento impossível: É uma situação impossível de acontecer na realização de determinado experimento e se representa pelo símbolo Φ . Eis que é impossível obter uma seqüência de três caras num único lançamento de duas moedas, ou dar número menor que a unidade no lançamento de um dado. Os conceitos de evento impossível e de conjunto vazio são equivalentes. b) Evento certo: Quando envolve todos os resultados do experimento. Seja, por exemplo, o

Prof. Gilberto S. Gramacho, UEFS, 29/09/2006.

2. cuja notação é A ⊂ B . 6}. como se verifica nas áreas sombreadas da figura abaixo. d) Inclusão de eventos: Sejam A e B dois eventos associados ao espaço amostral S. A interseção de A com B é formada pelos x elementos de S que pertencem simultaneamente a A e B. 3. como se vê a seguir: a) União de eventos: Sejam os eventos A e B contidos em S.4 lançamento de um dado. Isto equivale à noção de conjunto universo ou conjunto fundamental estudado na teoria dos conjuntos. Gilberto S. Diz-se que A está contido (ou incluído) em B. da teoria dos conjuntos. 29/09/2006. 5. Prof. cujo símbolo é A ={x ∈S / x ∉A} . O complemento de A em relação S. definidos em S. b) Interseção de eventos: Sejam A e B dois eventos definidos em S. que se representa pela notação A ∩ B (lê-se A inter B). O diagrama de Venn-Euller dá uma boa idéia dessa combinação de eventos. O evento A = {ocorrer número natural entre 1 e 6} é um evento certo. pois os seus resultados possíveis coincidem com o do conjunto S = {1. Gramacho. que se identifica pela notação A ou A C (lê-se complemento de A). é possível obter novos eventos através das operações de união e interseção. UEFS. Aqui a notação x∈A significa número x de elementos de S pertencentes ao evento A.4.1 Operações com eventos Já é sabido que o espaço amostral S abrange todos os resultados possíveis do experimento aleatório ou todos os elementos de uma população de interesse. ou pelo símbolo A∩ B= {x∈ S/ x∈ A x∈ B} e . c) Complementação de eventos: Seja um evento A contido em S ( A ⊂ S ). que se identifica pela notação A ∪ B (lê-se A união B). ou complementação. ou x∉A número x de elementos de S não pertencentes a A. ou em símbolos A∪B = {x∈S/x∈A ou x∈B (ou ambos)}. 4. Dados os eventos A e B. 6. ou ainda melhor A ⊂ B ={∀x ∈A →x ∈B} . . é formado pelos x elementos de S que não pertencem a A. se todo elemento de A é também elemento de B. A união de A com B é dada pelos elementos de S que pertencem a A ou B (ou ambos).

6} → D = S (evento certo). 4. b) B = {número primo} = {2.5 Figura 6. 6}: a) A = {número par} = {2. 5}. 5. 4. 4. 2. 3. Φ =S e A = A . e a interseção é um evento impossível tal que A ∩ B = Φ . úteis no estudo de probabilidade. e) Distributiva: A ∪(B ∩C) = ( A ∪B) ∩(A ∪C) e A ∩( B ∪C) = ( A ∩B) ∪( A ∩C) . UEFS. com os números referentes ao jogo de um dado. 3. g) Identidade: A ∩ Φ = Φ . b) C = {número ímpar} = {1. f) Idempotente: A ∩ A = A e A ∪ A = A . Prof. c) D = {n° inteiro positivo} = {1. Exemplo: É possível simular os eventos abaixo. 5. 3. b) Associativa: ( A ∩B) ∩C = A ∩( B ∩C) e ( A ∪B) ∪C = A ∪( B ∪C) . . h) Leis de Morgan: A ∩B = A ∪B e A ∪B = A ∩B . como se nota na figura abaixo: Figura 6. 2. d) E = {número menor que a unidade}→ E ={} = Φ (evento impossível). a) Absorção: A ∪( A ∩B) = A e A ∩( A ∪B) = A . Gramacho.2 Diagrama de Venn para A ∩ B = Φ Apresentam-se abaixo algumas propriedades decorrentes de complementação. união e interseção de eventos. c) Complementares: A ∪A =S . 3. Gilberto S. A ∪ Φ = A . A ∩A = Φ . 6}.1 Diagramas de Venn-Euller Se os eventos A e B não têm qualquer elemento em comum a união é formada pela soma dos seus elementos A ∪ B = A + B . d) Comutativa: A ∩ B = B ∩ A e A ∪ B = B ∪ A . 5}. 29/09/2006. S =Φ . cujo espaço amostral é S = {1. A ∩S = A e A ∪S = S .

a probabilidade do evento A. Com ela se calcula probabilidades a priori.1 “Definição” clássica Se o espaço amostral S é finito e os seus elementos são igualmente prováveis. 3. 4. pois cara (c) e coroa (k) são igualmente prováveis. extrair cartas de baralho. ck. e por isso é bastante utilizada para calcular probabilidades de eventos associados a sorteios e jogos de azar (lançar moeda ou dado. 5}. ou seja. 5. 5. o conceito a definir está contido na própria definição. considerando o espaço amostral S = {cc. Gilberto S. a fórmula clássica não se aplica.5 Cálculo de probabilidades 6. n (S) 4 2 2 4 No caso de duas moedas viciadas. é calculada da seguinte maneira: P( A ) = n (A) núm ero de casos favoráveis em A = número de casos possíveis em S n (S) Esta “definição” é muito simples e intuitiva. 5}. P ( A ) = × = . n) C = C ={inverso de um n° não ímpar}={número ímpar} = {1.5.6 e) A ∪ B = {número par ou primo} = {2. UEFS. 5}. kk}. f) A ∩ B = {número par e primo} = {2}. 3. 29/09/2006. kc. i) A ∪B ={nem par nem primo} = {1}. g) A ={número não par}= {1. 6}. 6. antes de ser observada qualquer amostra de eventos. pois as probabilidades Prof. Porém. pois só se aplica a conjuntos com número finito de resultados. o conceito clássico não é considerado definição geral de probabilidade. 3. 3. 4. 6}. l) A ∩B = A ∪B = {1. 6}. Definindo-se o evento A = {cc}. 3. Veja-se que quando duas moedas honestas são lançadas é possível antecipar a probabilidade do evento duas caras (cc). definido em S. . m) C ={número não ímpar} = {2. a sua probabilidade é calculada do seguinte modo: P( A) = n (A) 1 1 1 1 = .). etc. Gramacho. ou seja. j) A ∪B = A ∩B = {n° que não seja par ou não primo} = {1. em que duas caras ocorrem. 4. isto é. e exige que estes sejam igualmente prováveis.

representado pela freqüência relativa do acontecimento.3 Regularidade da freqüência relativa f ri Como se observa na figura anterior. porque a probabilidade elementar de cara (ou de coroa) é. numa série de observações relativamente grande.5. . o que é expresso pela fórmula: P(A ) ≅ fi n O gráfico abaixo dá idéia da regularidade da freqüência relativa. 6. em repetições do experimento. n Quando n é grande. Teoricamente. o ponto de estabilização da freqüência relativa funciona como aproximação de P(A). desconhecida. 29/09/2006. não há como antecipar a probabilidade do evento referente a duas caras (cc). Figura 6. tal que P( A ) = f lim ( i ) . UEFS. Observe-se que se o experimento consiste no lançamento de duas moedas viciadas. a probabilidade de um evento é um número positivo e menor ou igual a unidade. sob iguais condições. um número muito grande de vezes ou mediante verificações em séries históricas.7 correspondentes aos pontos de S passam a ser diferentes e desconhecidas. E só poderão ser avaliadas mediante observação da freqüência relativa numa experimentação repetida um número grande de vezes. Significa que só será possível avaliá-la mediante a observação empírica das freqüências de cara num grande número de Prof. Gramacho. Gilberto S. a probabilidade de um evento A é o limite da freqüência relativa quando o número n de observações tende para infinito. quando o experimento é repetido um número grande de vezes. por enquanto. n → +∞ n Onde fi =f ri é a freqüência relativa e fi a freqüência absoluta simples.2 Definição freqüêncial Esta definição propõe que a probabilidade de um evento seja avaliada com base na regularidade das freqüências relativas.

por fim. E lembrando que. por conseguinte. se A e B são mutuamente exclusivos (disjuntos). pode obter-se o valor de p do seguinte modo: 2p +p =1 → =1 → = 3p p 1 . UEFS.3 Definição axiomática Para contornar as dificuldades encontradas nas definições anteriores. 3 Com isso as probabilidades de cara e de coroa. a definição moderna de probabilidade foi desenvolvida com fundamento em axiomas.8 lançamentos. aí sim será possível calcular a probabilidade de cada ponto de S. no entanto ela é fundamental pela abrangência. Seja. por definição. tal que p é uma probabilidade por enquanto desconhecida de coroa. típicos de variáveis contínuas. a probabilidade de A é uma função definida em S. 3 3 9 Apesar de ser muito útil na prática. 3 3 3 2 2 4 E. 6. E. nas seguintes condições: a) 0 ≤ P (A ) ≤1 . serão iguais a P(k) = 1 1 2 e P(c) = 2 × → P (c) = . Gramacho.5. acha-se P(c) = 2p. a definição se completa com os teoremas fundamentais. Então. cujos mais importantes se apresentam adiante. uma vez que o limite pode não existir. Σ p = 1. a fim de deixar a definição a mais abrangente possível. c) P( A ∪B) = (PA ) +P (B) . Gilberto S. a definição de probabilidade com base nas freqüências relativas apresenta restrições do ponto de vista matemático. Neste aspecto. pois as suas propriedades possibilitam operar até em espaços amostrais infinitos não-enumeráveis. Seja A um evento associado a S. Se o resultado da experimentação revelar que a freqüência de cara c é duas vezes mais que a de coroa k. Note-se que esta definição não ensina como avaliar objetivamente uma P(A). (k) Com efeito. um experimento aleatório descrito pelo espaço amostral S. b) P(S) = 1. faz-se P(c) =2P e P(k) = p. Prof. por substituição. 29/09/2006. a probabilidade do evento duas caras é P (cc ) = × = . obtidas por substituição. . que atribui um número real a cada evento simples de S.

4 Complementaridade de eventos A Para demonstrar o teorema escreve-se P( A ∪ ) =P(S) .4 Definição subjetiva Aqui a probabilidade de um evento depende de avaliação pessoal. a probabilidade da cotação de uma ação a ser lançada na bolsa de valores subir em médio prazo.3.5.Se A e B são eventos quaisquer. então P ( A ) = − (A ) .9 6. então: P(A ∪B) = P( A) +P( B) −P( A ∩B) . Para demonstrar este teorema basta escrever A ∪ Φ = A e aplicar a propriedade c do item 6.5. então P (Φ) =0 .6 Teoremas básicos I . 1 P II . Gramacho. permitindo comprovar que de fato P ( A ) = − (A ) . Com efeito. O teorema é demonstrado expondo os eventos A∪B e B da seguinte maneira: (i) A ∪B = A ∪( A ∩B) (ii) B = (A ∩B) ∪( A ∩B) A figura abaixo dá idéia de como se efetiva esse tipo de exposição. a saber: P(A ∪Φ ) = P( A ) →P( A ) +P(Φ) = P(A ) → P(Φ) =P(A) −P(A) =0 → P (Φ ) = 0 . Eis que o evento A e o seu complemento A são mutuamente excludentes. de modo meramente subjetivo. 29/09/2006. III .Se Φ é um evento impossível. devido a inexistência de dados preliminares. como se nota na figura abaixo: Figura 6.Se A é o complemento de A. Gilberto S. Lembrando que P(S) = 1 e que A e A são disjuntos. Prof. quer dizer. UEFS. . pois A ∪A = S . pois A e Φ são disjuntos. contando com o conhecimento ou a intuição do pesquisador. 6. só poderá ser estimada pelo grau de crença ou expectativa que o especialista tenha sobre o assunto. segue-se que: 1 P P(A) + P( A ) = 1.

escreve-se: P( B) =P{A ∪ A ∩ )} =P( A ) +P( A ∩ ) → ( B) −P( A ) =P( A ∩ ) ( C B P B B Como P( A ∩ ) ≥0 . tal que P( A )≤ ( B). como se faz a seguir: P (A ∪ ) −P ) = P ) + P A ∩ ) −[P B (B (A ( B (A ∩ ) + P A ∩ )] B ( B P (A ∪ ) = P ) + P ) + P A ∩ ) −P B (A (B ( B (A ∩ ) −P A ∩ ) B ( B B Com a eliminação de ±P( A ∩ ) . então P(A) ≤ P(B). o sinal se inverte. . Gilberto S. UEFS. comprova-se que: P(A ∪B) =P(Α ) + P(Β ) −P(Α ∩B) .10 Figura 6. resta P(B) −P (A ) ≥ 0 → −P ( A ) ≥− ( B) . A generalização do teorema para três eventos A. ( C cuja ilustração se Figura 6. Prof. B e C.5 Diagrama de Venn para união de eventos Como os eventos de (i) e (ii) são mutuamente excludentes. é representada pela fórmula abaixo: P(A∪B∪C) = P(A) + P(B) + P(C) – P(A∩B) – P(A∩C) – P(B∩C) + P(A∩B∩C). 29/09/2006.6 Inclusão de eventos tipo A ⊂ B C Como A e ( A ∩ ) são eventos mutuamente exclusivos. as respectivas probabilidades podem ser escritas da seguinte forma: B B (i) P(A ∪ ) =P(A ) +P ( A ∩ ) (B (A B ( B (ii) P ) = P ∩ ) +P A ∩ ) Para comprovar o teorema basta subtrair (i) de (ii). IV .Se A ⊂ B. Gramacho. P P Multiplicando a inequação acima por (-1). Demonstra-se o teorema partindo da expressão observa na figura adiante: B =A ∪ A ∩ ) .

. ADCB. Gramacho. BCAD.2 Arranjo simples É um tipo de agrupamento em que um grupo se distingue de outro pela natureza e pela ordem dos elementos. UEFS. 6. por convenção. DABC. elas poderiam ocupar os quatro assentos de 24 maneiras distintas. CDBA. 1 . Logo.7. CDAB.7 Análise combinatória É uma técnica de contagem que se aplica para resolver problemas onde é necessário levar em conta agrupamentos de elementos ou objetos. B. DACB. DBAC. C e D. por convenção. 3! = 3×2×1 = 6. sem precisar de enumeração direta. ! 1 2! = 2×1 = 2. 4! = 4×3×2×1 = 24.. ABDC.. Exemplo: Do conjunto formado pelas letras A. DCBA. B. Gilberto S. que são: {ABCD. BDAC. Significa que caso fossem reservadas quatro cadeiras num recinto para as quatro pessoas identificadas pelas letras A. DBCA.7. BDCA. 6. BCDA. ! 1 1 = . BACD. CABD. o número de arranjos simples de n elementos agrupados de k maneiras é definido por: Prof. conforme cálculos a seguir: 4! = 4×3×2×1 = 24 agrupamentos. Esse recurso é utilizado em probabilidade para determinar o número possível de resultados de um experimento. CABD. tal como o número possível de amostras de tamanho n que pode ser extraído de um lote de N peças ( n ≤ N ). DCAB}.1 Fatorial Fatorial de um número n é definido como o produto de todos os números naturais de n até 1. É representado pela notação n! (lê-se n fatorial) e pela fórmula: n!=n ( n − )( n −2). obtém-se 24 agrupamentos de quatro letras. ACBD. CBAD. ACDB. C e D. CBDA. brancas e vermelhas. ou o número possível de maneiras pelas quais se pode retirar n bolas vermelhas de uma urna onde estão guardadas N bolas de cores azuis. BADC. ADCB.11 6. 29/09/2006. para 1 n >1 . Conseqüentemente: 0 = .

4 A 4 = 4! = 4 × 3 × 2 × 1 = 24 arranjos. BD.. 4 Observe-se que A n = n! . AC. 6. B.. diferem quanto à ordem (AB ≠ BA). n A 2 = 4 × 3 = 12 arranjos. para k ≤ n. 29/09/2006. que correspondem ao número de agrupamentos encontrados no exemplo do subitem 6. Gilberto S. Eis que no arranjo AB os elementos se distinguem pela natureza (A ≠ B). 4 A 3 = 4 × 3 × 2 = 24 arranjos. n Por conseguinte: 0 A n =1. Trata-se. em que cada arranjo é constituído por todos os elementos do conjunto.7.4 Combinação simples Prof. para n >1 .(n − k + 1) . para k ≤ n. UEFS. .12 A k = n(n − 1)(n − 2). portanto. enquanto que os arranjos AB e BA. A 1 = n . cuja fórmula é a seguinte: Pn = A n = n!= n ( n −1)( n − 2). DC}.3 Permutação simples Permutação Simples é um caso particular de arranjo simples. n Exemplo: De quantas maneiras as letras A. B. CA. A formação de cada arranjo difere apenas quanto à disposição dos elementos. DA. . C e D? P4 = 4! = 4×3×2×1 = 24 permutações. tal que A 4 = (4 − 2)! = 2! = (n − k)! 2! 6. Gramacho. O número de arranjos de n elementos k a k é também calculado através da fórmula: Ak = n n! 4! 4! 4 × 3 × 2! 2 =12 ... para n > 1 n Exemplo: Quantas permutações podem ser formadas com as letras A.. C e D podem ser arranjadas duas a duas? A 2 = 4 × 3 = 12 arranjos. CD.1. DB...7. AD. de um arranjo de n elementos tomados n a n. para n >1 .7. 1 . BA. conforme relação abaixo: 4 {AB. BC. CB. constituídos dos mesmos elementos.

3 6. Gilberto S.1 3.4 3.2 4.2 1. CA.1 5.5 5. AD.1 2.4 5. e constitui uma só combinação.4 2. BD. c) de a soma de pontos ser um número ímpar ou primo.1 4.1 1.6 5. DB e DC. BC. CB. Dois dados honestos são lançados simultaneamente.4 1.2 3. 29/09/2006.2 6. CD}. e que se resolve por combinação simples. Construa o espaço amostral e defina as probabilidades com relação aos seguintes eventos: a) de a soma de pontos ser um número par.6 3. Gramacho. C 0 = 1 e C1 = n.3 3.2 5.6 6. B.3 2.3 5.2 2.4 6. pelo fato de descartar os grupos formados por elementos dispostos em ordem diferente. k! k!( n − k )! É também muito comum o emprego da notação ( n ) .5 6. k Por definição. 3 C10 = 3 A 10 10 × 9 ×8 = 120 comissões. d) de a soma de pontos ser menor ou igual a 8. UEFS. ■ Solução: O espaço amostral relativo ao jogo de dois dados é: 1. no qual uma combinação difere da outra somente pela natureza dos elementos e a ordem dos elementos não importa. Exemplo 2: Se numa sala existem 10 alunos.5 1. C e D? C2 4 A 2 4× 3 = 4 = = 6 combinações. para k ≤ n. Aqui o grupo AB = BA. b) de ocorrer número igual de pontos em ambos os dados.7.2.4 4. = 3! 3 × 2 ×1 Exercícios Resolvidos 01. n n Exemplo 1: Quantas combinações de dois elementos são obtidas com as letras A.3 1. 2! 2 ×1 Esse conjunto é a metade do número de arranjos tomados 2 a 2. DA. que são: {AB.1 6.5 4.3 4. AC.6 4. quantas comissões de três alunos podem ser formadas? Este é um tipo de problema no qual a ordem dos indivíduos não tem importância. .6 Prof.13 É um tipo de agrupamento sem repetição.6 2.5 3. isto é: BA.5 2. encontrado no exemplo do subitem 6. A combinação de n elementos tomados k a k é dada através da fórmula: Ck = n Ak n! n = .

2). (6.4). (4. e) a primeira azul e a segunda branca. (2.1). 29/09/2006. (5.4).. (3. (5.3). (6. (2.4). (4. (1.2). ou verdes. d) uma azul e a outra branca.5).6). (2.1). (1.14 a) A = {(1. 36 2 6 1 = . o número de elementos de cada evento pode ser determinado através de combinação e de arranjo simples.1).1). ou brancas. (4. b) branca. (5.4). 12 4 1 = . (4.2). 36 I∪P ={nº impar e primo}= {(1. (6. (1.4). (6. Prof. (6.(1... (1. (6. Se uma bola é retirada ao acaso.4). f) pelo menos uma branca. 36 18 13 12 19 + − = . (2.2).3).1). (1.2). (5. (3. (4.3). c) de cores diferentes. (5. c) azul ou branca.6).4). 36 36 36 36 26 13 = . (3. (1.3).3). (5. (5. (1. (6. 12 3 5 4 9 3 + = = 12 12 12 4 b) B = {a bola é de cor branca}: P(B) = c) A∪B) = {a bola é azul ou branca}: P(A ∪B) = P(A ) + P(B) = 03.5).6)}: P(A) = 18 1 = .5)}: I ∪P = 12 .6). (2.3).4). (1.1).4). (4. (4.5).5).5). 4 brancas e 3 verdes. Calcule a probabilidade de ambas serem: a) da mesma cor. (6. (6.2).2). (6.6)}: P( B) = c) I = {nº ímpar}= {(1.1). (2. (2. 36 6 b) B ={números iguais} = {(1. (2. duas bolas são retiradas sem reposição.1).1). (5.4).4). 36 P = {nº primo} = {(1. (3.5).2).5)}: P( P) = 13 .1).6). calcule a probabilidade de ela ser de cor: a) azul. (3.2). (3. a) As duas bolas podem ser azuis. (4.1). Na mesma situação da questão 04. Eis a solução: ) a) A = {a bola é de cor azul}: P(A = 5 .2)}: P(D) = 02. UEFS. (5. Gilberto S.2). (3.3).3). (2.6).2). Gramacho. (4. (6. (5. (6.1). (4.5).3).1).1).6).1). (2. (5. Dentro de um saco há 12 bolas: 5 azuis. (3.6).5). ■ Solução: Como as bolas são sorteadas sem reposição.5)}: P(I) = 18 . (4.6). b) verdes. (2.6). . (3. 36 18 P(I ∪P ) = P(Ι ) + P(P ) − P(Ι ∩P ) = d) D = {número ≤ 8} = {(1.

UEFS. (1 ■ Solução: Sejam P ) =p. Gramacho. pois os demais termos já são conhecidos. P(5) =5p e Eis que por definição =1 ⇔ p + 2p + 3p + 4p +5p + 6p = 1 → 21p =1 →p = 1 . P( A ∩ V ) = 5 3 = = 66 66 66 P = 1 − ( 16 06 + 636 + 16 56) = 1 − 62 68 = 1 − 13 93 → P = a) a probabilidade de cada ponto amostral. 14 33 04. substituindo-se o valor de p nas expressões acima 21 definidas se obtém: a) P(1) = 1 2 3 4 5 6 . Por conseguinte. . P(2) = . P(5) = e P(6) = . P ) =6 (6 p. 66 66 33 5 × 4 10 5 = = (há especificação da ordem). 66 66 d) P(A ∩ B) = C1 C1 5 4 2 C12 = = 5 × 4 20 10 = = (não há especificação da ordem). P(3) = . 21 21 21 21 21 21 Prof. P (4) =4p.[P(A 1 ∩A 2 ) + P(A ∩V) + P(V 1 ∩V2 ] . 66 22 c) P(ambas de cores diferentes) = =1 −[P(A 1 ∩A 2 ) + P(B 1 ∩B 2 ) + P(V 1 ∩V2 ] =1 − 19 47 = . 12 ×11 66 33 e) P(A ∩ B) = A1 A 1 5 4 2 A12 f) P(pelo menos uma branca) =1 . Gilberto S. Determine: b) a probabilidade de ocorrer a face 3 ou a face 5 num único lançamento. 6 é duas vezes mais provável que 3. isto é. C1 C1 5 × 3 15 . = 12 ×11 66 66 2 ×1 b) P(V1 ∩ V2 ) = 2 C3 2 C12 = = 3 1 = . P(4) = . É preciso calcular P( A ∩V ) . 29/09/2006. p ∑ i P(3) =3p. Um dado é viciado tal que a probabilidade de dar um dos números de cada face é proporcional ao seu valor.15 2 2 C5 + C2 + C3 4 2 C12 P(A 1 ∩ A 2 ) + P(B 1 ∩ B 2 ) + P(V1 ∩ V2 ) = 5 × 4 4 × 3 3× 2 + + 2 ×1 2 ×1 2 ×1 = 10 + 6 + 3 = 19 . P(2) =2p.

P(A) A probabilidade P(B/A) mede a probabilidade relativa dos elementos comuns aos eventos A e B em relação ao espaço amostral reduzido A. para P(A) > 0. P ) =2P ) =2p e P(A =2P(B =4p .16 b) P(3 ou 5) = P(3) + P(5) = 3 5 8 + = . 21 21 21 05. p Eis que ∑ i =1 →4p + 2p + p =1 →7p =1 →p = 1 2 4 ) ) ) a) P(C = . a probabilidade de B dado A pode ser calculada diretamente por meio da fórmula: P(B / A) = n ( A ∩B) . Sabe-se que o atleta A tem 2 vezes mais probabilidade de ganhar que B.8 Probabilidade condicional Se A e B são eventos associados ao espaço amostral S. como se vê na área colorida da figura adiante: Figura 6. n (A) 6. 7 7 7 1 . 7 7 7 6. para P ) P( B) >0 . vem: 7 b) P(B ∪C ) = P(B) + P(C) = 2 1 3 + = . substituindo. e que B tem 2 vezes mais probabilidade de ganhar que C. Gilberto S. (C (B (C ) ) ■ Solução: Sejam P ) =p . UEFS.9 Teorema do produto Prof. b) a probabilidade de B ou C ganhar a prova. para n(A) ≠ 0. P(B = e P(A = . Gramacho.7 Diagrama para a condição B/A Alternativamente. B e C disputarão uma prova de atletismo. 29/09/2006. Calcule: a) as probabilidades de vitória de cada um. Logo. Os atletas A. P ( A / B) = P ( A ∩B) (B . . então a probabilidade de B dado que A tenha acontecido é definida pela fórmula: P(B / A) = P( A ∩B) . Sendo S um espaço amostral equiprovável.

A fórmula do produto para dois ou mais eventos é: P( A ∩B) = P( A ) ×P( B / A ) . qual a probabilidade haver ocorrido a face 3 em um deles? ■ Solução: Definem-se os eventos A e B da seguinte forma: A = {soma de pontos igual a 8) → A = {(2. valem as relações: P /B (A ) =P ) ... Gilberto S. se A1.17 Este teorema decorre da definição de probabilidade condicional e serve para calcular probabilidades referentes a um produto de eventos. (6. × P( A n / A 1 ∩ A 2 ∩.9...... ∩ A n −1 ) 6. (4.. UEFS. ∩A n ) = P(A 1 ) × P(A 2 ) ×. forem eventos dependentes. A independência acontece em sorteios ou processos de amostragem com reposição. então: P(A 1 ∩A 2 ∩. Em geral... Um par de dados é lançado..3). 29/09/2006. se A1. forem eventos dependentes. P( A ∩B ∩C) = P( A ) ×P( B / A ) ×P(C / A ∩B) .. Gramacho.9. An . ou. A2.. São exemplos típicos de eventos dependentes os casos de sorteios ou amostragem sem reposição. A sua correta aplicação depende da identificação de dependência ou independência entre eventos. a regra do produto para dois ou mais eventos é mais simples: P(A ∩B) =P(Α )×P(Β ) . An . (5. ou vice-versa. Genericamente. Se alguém informa que ocorreu soma igual a 8..2 Eventos independentes Um evento é independente quando a sua ocorrência não afeta a de outro ou vice-versa. A2.5).4). .. ∩ A n ) = P( A 1 ) × P( A 2 / A 1 ) ×.. (3.1 Eventos dependentes Sejam dois eventos A e B associados a um experimento.2)} Prof. P(A ∩B ∩C ) = P ( A ) ×P ( B) ×P (C) ... . . × P(A n ) Se A e B são eventos independentes. haverá então dependência entre eles. Nesse caso. Se a ocorrência de A influencia B. 6. (A P /A (B ) =P ) (B e Exercícios resolvidos 01. então: P( A 1 ∩ A 2 ∩..6)..

1). (3.3).20 × 40 + 0. qual a probabilidade de ambos os números serem primos? ■ Solução: Sejam os eventos A = {soma dos números é par} e B = {ambos são primos}. Portanto. (2.3). 3. logo: A = {estudando estatística} = 0. Sabe-se que dentro de uma sacola existem 12 bolas. Prof. (3. f) pelo menos uma bola branca. 6 e 8 é c 2 = 6 somas. (3. 20% dos alunos e 15% das alunas estão estudando Estatística.4). 5. As alunas representam 60% dos estudantes presentes.3)} P(B / A) = P( A ∩B) 2 = P(A) 5 02. determine as probabilidades de: a) ambas serem da mesma cor.2). (3.3). 29/09/2006. P( A ) 16 03. 4. c) ambas serem de cores diferentes. 17 04.53 . qual a probabilidade de ser uma aluna? ■ Solução: Sejam 100 estudantes.3). A∩B ={é aluna e está estudando estatística} = {15%} = 9 alunas. Gilberto S. b) ambas serem verdes. (3. 4 ● Por sua vez.5). Se forem retiradas duas bolas. Gramacho.5). (3. logo o total de 2 somas com os dígitos 1. Se um estudante é escolhido aleatoriamente e está estudando Estatística.15× 60 = 8 + 9 = 17 alunos. A∩B = {soma igual a 8 e dando a face 3} = {(3. ● Por conseguinte. A =10 + 6 =16 somas pares. onde 40 são alunos e 60 são alunas. UEFS. Veja que A ∩ B = {soma dois a dois de 3. (6. 5 e 7. Sendo 5 azuis. d) uma bola azul e a outra branca. Se a soma deles é par.18 B = {dar a face 3} = {(1. P(B/A) = 9 = 0. 7 e 9 é C 5 = 10 . 4 brancas e 3 verdes. P( B / A ) = P( A ∩B) 3 = . (5. 5 e 7}. e) a primeira azul e a segunda branca. Dois dígitos são selecionados aleatoriamente de 1 a 9. Na biblioteca de uma universidade. B = {alunas} = {60% do total de estudantes}= 60 alunas.6)}. (5.3). ● A soma de dois números é par se ambos forem impares ou ambos forem pares. sem reposição. dois a dois. Enquanto que com os dígitos 2. o total de somas com os números 2. e o total de soma 4 2 desses números é C 3 = 6 somas. com relação ao evento B.3). . será C 2 = 6 somas. em dado momento. 3. (4.

d) pelo menos uma de cor verde. 72 72 P (C) =1 −[P(A 1 ∩A 2 ) + P(B 1 ∩B 2 ) + P(V 1 ∩V2 )] =1 − 06. do problema 04. então a probabilidade de: a) As 2 fichas serem pretas. e c. 29/09/2006. qual a probabilidade de ela ser verde? ■ Solução: Aqui o sorteio pode ser feito com ou sem reposição de fichas. Prof. uma ficha é sorteada aleatoriamente na urna A e posta na urna B. para eventos dependentes. a) P(A 1 ∩A 2 ) + P(B 1 ∩B2 ) + P(V1 ∩V2 ) = 5 ×5 4 ×4 3 ×3 25 +16 + 9 50 25 + + = = = 12 ×12 12 ×12 12 ×12 144 144 72 b) P(V 1 ∩V2 ) = P(V 1 ) × P( V2 ) = c) C = {ambas de cores diferentes} 3 ×3 9 1 = = . Gilberto S. .[P(A 1 ∩ A 2 ) + 2P(A ∩ V) + P(V1 ∩V2 )] P( E ) = 1 − ( 5×4 5 ×3 3×2 20 + 30 + 6 56 19 +2 + ) =1 − =1 − = . admitindo que as bolas são extraídas com reposição. b. UEFS. 12 ×11 33 d) P(A ∩ B) = 5 ×4 5 = (a ordem é especificada). b) ambas de cores diferentes. e) agora.19 ■ Solução: Este problema já foi feito por análise combinatória. Depois. Sorteia-se uma ficha em cada urna. 12 ×12 144 16 25 47 = . Uma urna A contém 5 fichas verdes e 3 pretas. 12 ×11 33 e) E = {pelo menos uma branca}: P( E ) =1 . c) ambas da mesma cor. Gramacho. ■ Solução: Aplica-se a regra do produto para eventos independentes. Outra urna B contém 3 fichas verdes e 2 pretas. Resolva os itens a. pois os eventos ocorrem em urnas diferentes. Calcule. agora ele será resolvido pela regra do produto. sem prejudicar o conceito de independência. 12 ×11 12 ×11 12 ×11 132 132 33 05. a) P(A 1 ∩ A 2 ) + P(B 1 ∩ B 2 ) + P(V1 ∩ V2 ) = 5×4 4 ×3 3×2 20 + 12 + 6 19 + + = = 12 ×11 12 ×11 12 ×11 132 66 b) P(V 1 ∩V2 ) = P(V 1 )P(V 2 /V1 ) = c) C = {ambas são de cores diferentes} 3 ×2 1 = 12 ×11 22 19 47 = 66 66 P (C) = 1 − [P(A 1 ∩ A 2 ) + P(B 1 ∩ B 2 ) + P(V1 ∩ V2 )] = 1 − P(A ∩ B) + P(B ∩ A) = 2P(A ∩ B) = 2 × 5×4 10 = . sorteia-se uma ficha em B.

tem-se: 1 2 1 16 1 a) P[( A ) 4 ∩( B) 4 ] = P( A × A × A ×A ) × P( B × B ×B × B) = ( ) 4 ( ) 4 = × = . e com estes se intercepta. An.20 a) P(P A ∩ PB ) = P(P A ) × P(P B ) = 3 2 3 × = . os eventos Ai são. Gilberto S. isto é. 29/09/2006. dois a dois. 8 5 8 5 40 40 d) P(pelo menos uma verde) = 1 − P (PA ∩PB ) = 1 − 3 17 = . Gramacho. qual a probabilidade de: a) nenhum atirador acertar o alvo? b) pelo menos um dos atiradores acertar o alvo? ■ Solução: Aqui o desempenho de um atirador não influi no desempenho do outro. os eventos A e B são independentes. 2 3 16 81 81 b) B = {pelo menos um deles acertar o alvo}: P( B) =1 − 1 80 = .. Sendo assim.. UEFS. Se ambos atiram 4 vezes. tal que a união de todos eles é igual a S. 81 81 6. mutuamente exclusivos.10 Teorema da probabilidade total Sejam A1. A probabilidade de outro atirador B acertar o mesmo alvo é de 1 3 . eventos que formam uma partição do espaço amostral S. 20 20 3 3 5 4 9 + 20 29 = e) P( V / B) = P( PA ) P( VB / PA ) + P( VA )P( VB / VA ) = × + × = 8 6 8 6 40 48 08. quando já se conhecem todos os eventos da família Ai. 8 5 20 5 2 3 3 10 +9 19 = b) P(VA ∩PB ) ∪P( PA ∩VB ) = × + × = 8 5 8 5 40 40 3 2 5 3 6 +15 21 = c) P( PA ∩PB ) ∪P( VA ∩VB ) = × + × = . portanto.8 Partição de eventos Ai e interseções com o evento B Prof. E seja B um evento qualquer de S. A2 . A probabilidade de um atirador A acertar um alvo é igual a ½. . na forma da figura abaixo: Figura 6.

. deduz-se que: P(B) = P(A 1 )P(B/A 1 ) + P(A 2 )P(B/A 2) + .3 ×0. responde pelas 30% restantes. tal que: P( B) = P( A 1 ∩B) ∪P( A 2 ∩B) ∪. ou. Os percentuais de unidades defeituosas são de 1. onde P(B) ≠ 0.5% na máquina A e 5% na B. i i i= 1 n 6. responde por 70% das unidades produzidas. qual a probabilidade de ter sido produzida pela máquina A? ■ Solução: Seja o evento D = {a garrafa é defeituosa}. Se uma garrafa for retirada casualmente para teste de qualidade.. i i i= 1 n segue a fórmula geral P( A i / B) = P(A i )P(B / A i ) ∑P(A )P(B / A ) i i i =1 n . ) )P(D ) /A a) P(D =P(A P ) =0.0105 0. = 0. b) Se ela é defeituosa.7 ×0. calcule: a) a probabilidade de ela ser defeituosa. é expressa pela união das interseções de todos os eventos Ai com B. dado que um dos eventos A i tenha ocorrido. Pelo teorema do produto para eventos dependentes. a probabilidade de B. Gilberto S.0255 (D /D b) P(A ) = +P(B )P(D ) /B =0.015 +0. . P (B) P(B) = Como ∑P(A )P(B / A ) . ∪P( A n ∩B) →P( B) =  P(A i= 1 n i ∩B) . Exemplo: Numa pequena fábrica de garrafas térmicas a máquina A. mais moderna. por meio da fórmula: P( A i / B) = P( A i ) P( B / A i ) . mais antiga.11 Teorema de Bayes O teorema de Bayes serve para calcular a probabilidade de um particular evento Ai dado que B aconteceu.05 =0. ainda: P(B) = ∑P(A )P(B / A ) . + P(A n )P(B/A n ) .0105 +0..18% . P(A )P(D ) /A P(D ) Prof. 29/09/2006. A máquina B.015 → ..21 Então. Gramacho. UEFS.0255 →P(A ) /D =0.4118 ou 41.

tal que X : S →R . Gilberto S. é uma função que tem domínio em S e contradomínio em R (a reta dos números reais). .1 Definição Variável aleatória (va) é uma função real definida sobre os eventos do espaço amostral S. Neste particular.22 Exercícios Propostos (ver lista de exercícios já distribuída) 7 VARIÁVEIS ALEATÓRIAS UNIDIMENSIONAIS 7. 29/09/2006. Prof. UEFS. Gramacho.

23
O estudo de variáveis aleatórias é importante porque nem sempre os pontos do espaço amostral são numéricos, sendo então necessário descobrir um meio de transformá-los em números, através de uma função chamada de variável aleatória, que facilita o cálculo de medidas estatísticas.

7.2. Variável aleatória discreta
Variável aleatória discreta (vad) é uma função que associa um único número real a cada evento de uma partição do espaço amostral S. São variáveis que resultam de processos aleatórios em que os possíveis resultados são casuais e formam um conjunto enumerável, a exemplo do número de pacientes atendidos num hospital, ou de furtos de veículos numa cidade. Já se viu que quando se lançam duas moedas o conjunto de resultados possíveis do experimento é de quatro seqüências de dois elementos (cara e coroa), representadas pelo espaço amostral S = {kk, kc, ck, cc}. Mas essa representação de S não é das mais adequadas para operações matemáticas, ensejando que a expressão qualitativa de cada evento de S seja definida como um ponto de uma variável aleatória, fazendo-se, por exemplo, x = número de caras. Assim o mesmo espaço amostral se transforma no conjunto numérico S = {0, 1, 2}, em que o ponto zero corresponde ao evento duas corroas (kk), um aos eventos cara e coroa e vice-versa (ck e kc) e dois ao evento duas caras (cc), conforme se observa no quadro adiante.
Quadro 7.1 – Variável aleatória relativa ao lançamento de duas moedas Eventos A1 = {kk} A2 = {kc, ck} A3 ={cc}
X

= número de caras 0 1 2

Seja ainda uma amostra ao acaso de uma peça de um lote produzido em certo dia. A peça pode ser classificada em defeituosa (d) ou perfeita (p), tal que S = {d, p}. Eis que essa classificação pode ser expressa através de números, tal como zero para peça defeituosa e um para peça perfeita, de modo que S = {0, 1}. Aí os pontos do espaço amostral representam uma variável aleatória do tipo x = peça defeituosa, como exposto na tabela abaixo.
Quadro 7.2 – Definição de uma vad para a amostra casual de uma peça Eventos D = {a peça é defeituosa} P = {a peça é perfeita}
X

= peça defeituosa 0 1

Prof. Gilberto S. Gramacho, UEFS, 29/09/2006.

24
A essa altura dá para perceber que a definição de uma vad visa facilitar o tratamento matemático, uma vez que às vezes os pontos do espaço amostral são atributos, sendo necessário transformá-los em números, mediante uma função de variável aleatória.

7.2.3 Distribuição de probabilidade de variável aleatória discreta
Definição: É uma função P(X) que associa probabilidades aos valores da vad X. Isto é,

quando uma vad X assume os valores x 1 , x 2 , ..., x n , com as respectivas probabilidades
p( x 1 ) , p( x 2 ) ,..., p( x n ) , definidas por uma P(X), em que a soma dessas probabilidades é

igual a um, tem-se a dita distribuição de probabilidade de X, como resumido no quadro abaixo:
Quadro 7.3 – Distribuição de probabilidade da vad X X P(X)

x1

x2

... ...

xn p( x n )

p ( x 1 ) p( x 2 )

∑p( x
i =1

n

i

)

Assim, o conjunto [X, P(X)] é chamado de distribuição de probabilidade de X, onde P(X) é a função de probabilidade que associa a cada valor da vad a probabilidade do evento correspondente, de maneira que p(x i ) = P(X = x i ) = P(A i ) , para i = 1, 2, ..., n. Intuitivamente, uma distribuição de probabilidade equivale a uma distribuição de freqüências relativas para os resultados do experimento aleatório, em que exprime a probabilidade ou chance com que cada resultado da vad pode acontecer quando o experimento é realizado um número grande de vezes. Em suma, a cada possibilidade do acontecimento é atribuída uma probabilidade. O estudo de distribuições de probabilidade é importante em inferência estatística, pois a suposição sobre propriedades de uma população, com base em dados de amostras, se fundamenta em distribuições teóricas de probabilidade. Em casos mais simples é fácil elaborar uma distribuição de probabilidade mediante quadros ou gráficos, como se verifica no lançamento de duas moedas, onde x é a vad número de caras:
Quadro 7.4 – Distribuição de probabilidade referente ao número de caras no lance de duas moedas Eventos A1 = {kk} A2 ={kc, ck }
X

= nº de caras 0 1

P(X = x i )

¼ ½

Prof. Gilberto S. Gramacho, UEFS, 29/09/2006.

25
A3 = {cc} Total (Σ) 2

¼
1

Esta distribuição de probabilidade está representada na figura abaixo:

Figura 7.1 Distribuição de probabilidade relativa ao número de caras no jogo de duas moedas

Outra ilustração similar é a distribuição de probabilidade relativa ao jogo de um dado:
Quadro 7.5 – Distribuição de probabilidade do número de pontos no jogo de um dado
X

= número de pontos 1 2 3 4 5 6 Total (Σ)

P(X = x i )
1/6 1/6 1/6 1/6 1/6 1/6 6/6 = 1

O gráfico desta distribuição se observa na figura a seguir:

Figura 7.2 Distribuição de probabilidade da vad relativa ao jogo de um dado

Quando o experimento se refere ao jogo de dois dados, a elaboração da distribuição de probabilidade é mais trabalhosa, embora ainda se possa representá-la através de quadro ou gráfico, como se vê adiante, onde X é uma vad igual à soma possível de pontos nos dois dados:
Quadro 7.6 – Distribuição de probabilidade – vad referente ao número de pontos no lance de dois dados

Prof. Gilberto S. Gramacho, UEFS, 29/09/2006.

(2:5). (5:4). 7. 29/09/2006. (5:3). (4:4). (3:2). (6:5) (6:6) P(X = x i ) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36 Total (Σ) 36/36 = 1 A representação gráfica da distribuição anterior se encontra na figura a seguir: Figura 7. (6:2) (3:6). (6:4) (5:6). (2:4).3 Distribuição de probabilidade do número provável de pontos no lançamento de dois dados Nem sempre é possível estabelecer distribuições de probabilidade de modo tão direto como nos casos visto até aqui. (5:5). segue-se função distribuição pertinente: Quadro 7. (2:3).4 Função distribuição acumulada É uma função que dá a probabilidade de a vad X assumir um valor menor ou igual a x i . (3:1) (1:4). em que X é igual ao número de pontos que se pode obter. (3:3). (4:2). . UEFS. (5:2). (4:1) (1:5). (6:1) (2:6). (2:1) (1:3). (5:1) (1:6).7 – Função distribuição referente ao número de pontos no jogo de dois dados X P(X) 2 3 4 5 5 7 8 9 10 11 12 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36 P(X ≤ x i 1/36 3/36 6/36 10/36 15/36 21/36 26/36 30/36 33/36 35/36 1 ) Prof. (4:5). há situações em que a probabilidade de eventos só pode ser definida por modelos apropriados.2. (3:5). (4:3). Essa função é F(x) = P(X ≤ x i ) . Gilberto S. (2:2). Gramacho. Para o caso dos dois dados. (3:4). como se verá no capítulo adiante.26 X = número de pontos 2 3 4 5 6 7 8 9 10 11 12 Eventos (1:1) (1:2). (6:3) (4:6).

UEFS. assim... 7. o número esperado de pontos relativo ao lançamento dos dois dados pode ser calculado com os operadores do quadro abaixo: Quadro 7. cuja fórmula é: E(X) = x 1 P( x 1 ) + x 2 P( x 2 ) + . . x 2 . 1 2 3 6 P ( X ≤4) = + + = é a probabilidade de ocorrer no máximo quatro pontos no 3 6 3 6 3 6 3 6 mesmo caso.é 3 6 3 6 3 6 a probabilidade de se obter no máximo três pontos no jogo de dois dados. Prof.. e probabilidades p1 . o valor esperado de X é igual ao valor médio da variável.. p 2 .8 – Número esperado de pontos da vad relativa ao arremesso de dois dados X 2 3 4 5 6 7 8 9 10 11 12 Total (Σ) P(X) 1/36 2/36 3/36 4/36 5/36 6/36 XP(X) 2/36 6/36 12/36 20/36 30/36 42/36 40/36 36/36 30/36 22/36 12/36 252/36 = 7 5/36 4/36 3/36 2/36 1/36 36/36 = 1 Verifica-se.. n respectivamente. p n . que E(X) ou µ = 7 pontos. Gramacho. . Gilberto S. 29/09/2006... e assim por diante. . x n .5 Valor esperado de uma variável aleatória discreta Se X é uma vad de valores x 1 ..2. + x n P ( x n ) → E(X) = ∑ x i P ( x i ) i =1 Deste modo.27 1 (X ≤ ) = 3 (X ≤x i ) são interpretados da seguinte maneira: P Os valores de P éa 3 6 (X 3 probabilidade de se obter dois pontos no jogo de dois dados. P ≤ ) = 1 2 3 + = .

UEFS. Gilberto S. a variância da vad referente ao número de pontos quando se lançam dois dados é calculada a partir dos operadores expostos no quadro a seguir: Quadro 7. σ =54 . o que pode gerar confusão na hora da interpretação. .974/36 = 54. isto é. Quanto menor é o valor da variância maior é a concentração de probabilidades em torno do valor médio da variável aleatória. é melhor expressá-la na mesma unidade da variável original.83 −49 →σ =5.28 7.6 Variância de uma variável aleatória discreta A variância é uma medida de concentração de probabilidades da vad em torno da média.2. 29/09/2006.83 pontos (ao quadrado). Portanto.9 – Cálculo da variância da vad referente ao número de pontos no lance de dois dados X 2 3 4 5 6 7 8 9 10 11 12 Total (Σ) P(X) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36 36/36 = 1 XP(X) 2/36 6/36 12/36 20/36 30/36 42/36 40/36 36/36 30/36 22/36 12/36 252/36 = 7 X2P(X) 4/36 18/36 48/36 100/36 180/36 294/36 320/36 324/36 300/36 242/36 144/36 1. cujo resultado corresponde ao desvio padrão.83 = 2. através da sua raiz quadrada. Calcula-se também a variância por meio da fórmula σ 2 = Σ( x i −μ ) 2 P ( x i ) . Gramacho. como segue: σ = var iância →σ = 5.83 2 2 Portanto. Assim. É identificada pelas notações Var(X) ou σ 2 .μ2] Como E ( X ) = ∑x i2 P ( x i ) e μ = ∑x i P( x i ). A variância é uma medida de dispersão expressa no quadrado da variável.4 pontos.83 −7 2 =54 . cuja fórmula se vê seguir: σ 2 =[E (X 2 )-E ) (X 2 ] =[E (X 2 ) . Prof. vem: 2 σ 2 =[ ∑x i P ( x i ) −( ∑x i P ( x i ) 2 ] ou σ 2 = ∑x i2 P( x i ) −μ 2 .

Para valores fora do intervalo a que se limita o experimento. Numa caixa estão guardadas 4 bolas brancas e 3 pretas.3 Variável aleatória contínua Uma variável aleatória é contínua (vac) quando assume infinitos valores num dado intervalo (a. quando do estudo da distribuição normal. determine a distribuição de probabilidade referente ao número de caras. 03. que deve satisfazer às condições abaixo: ) a) f(x ≥0 .1 Função densidade de probabilidade Aqui a distribuição de probabilidade é definida por uma função f(x). UEFS. Este assunto será mais detalhado adiante. b). 18/35. .4 pontos. R: 1/64. + ∞ b) − ∞ ∫f ( x )dx = (toda a área sob a curva de probabilidade. 9/64. R: 4/35. 02. ∀x ∈R . 7.3. 12/35 e 1/35. em 3 lançamentos.29 Significa que quando dois dados são lançados o número esperado de pontos é 7. R: 4/35. 7. R: 9/7 e respectivamente. 04. calcule: a) A distribuição de probabilidade. a probabilidade é igual a zero. elabore a distribuição de probabilidade e a sua representação gráfica. 3/8 e 1/8. 27/64 e 27/64. R: 1/8. a. Uma moeda é jogada 3 vezes. sujeito a uma variação média de mais ou menos 2. 1 definida por f(x) vale um). sendo X uma v. c) P(a ≤ x ≤ b) = ∫f ( x )dx (probabilidade correspondente à área sob a curva limitada a b pelo intervalo compreendido entre x = a e x = b). 29/09/2006. 3/8. Três peças são retiradas de um lote onde há 15 perfeitas e 5 defeituosas. Gramacho. Se uma moeda é viciada de modo que a ocorrência de cara é duas vezes mais provável que coroa. igual ao número de caras. Exercícios 01. Gilberto S. c) O valor esperado e o desvio padrão de X. 34/35 e 35/35. b) A função distribuição F(x). ou curva de freqüência. Dado que X é o número Prof. 22/35. Sendo X = número de bolas pretas. chamada de função densidade de probabilidade (fdp). As bolas pretas são retiradas uma a uma até esgotar o seu estoque.

Gilberto S. R: 0. defina a distribuição de probabilidade correspondente. 315/684. 90/684 e 6/684 8 Prof.42. UEFS.14 e 0. . b) Extraídas sem reposição.30 de peças de defeituosas.42. caso as peças sejam: a) Extraídas com reposição. Gramacho. 0. R: 273/684. 0.02. 29/09/2006.

8. b) cada tentativa só admite dois resultados. com base em dados de amostras.31 DISTRIBUIÇÕES TEÓRICAS DE PROBABILIDADE Já foi dito que quando a variável tem comportamento simples é fácil expor a distribuição de probabilidade através de tabela ou gráfico. Gramacho. se a pergunta se refere a peça defeituosa. Para isso existem alguns modelos de distribuição que são utilizados para estudar o comportamento de muitos fatos reais. a exemplo. sucesso ou fracasso. A distribuição binomial e a distribuição de Poisson são exemplos clássicos de distribuições discretas. pois as suposições sobre propriedades de populações. Distribuição binomial É uma distribuição discreta que se aplica a processos conhecidos como de Bernoulli. Gilberto S. Em casos assim. As discretas descrevem variáveis cujos eventos podem ser contados e representados por números inteiros. que consistem numa experiência aleatória com apenas duas possibilidades. e podem ser colocadas como perguntas de resposta sim ou não. podem assumir infinitos valores num dado intervalo. Mas ocorrem situações mais complexas em que é preciso recorrer-se a modelos para calcular probabilidades associadas aos eventos da variável aleatória. 29/09/2006. a variável aleatória apresenta valor igual a 0 (zero) quando ocorre insucesso e 1 (um) quando ocorre sucesso. Essas distribuições apresentam particularidades próprias que facilitam a sua identificação. desde que a amostra represente uma fatia muito pequena da população). entre outras. a exemplo de sorteios com reposição (ou sem reposição. UEFS. da distribuição normal e da distribuição t de Student. As distribuições contínuas. Sendo que sucesso corresponde ao número de eventos em que se está interessado. Neste aspecto. são modelos que descrevem o comportamento de variáveis passíveis de medição. . O estudo de distribuições de probabilidade é fundamental em inferência estatística. então sucesso deve ser entendido como a ocorrência de peça defeituosa. As distribuições de probabilidade dividem-se em discretas e contínuas. por seu turno. Prof.1. Por exemplo: Deu cara no lançamento de uma moeda? Um eleitor votou em determinado candidato? Há peças defeituosas num lote de peças produzidas em determinado dia? Os termos sucesso e insucesso devem ser interpretados com cuidado.. isto é. dependem de como se distribui a variável na população. a utilização da distribuição binomial apóia-se nas seguintes hipóteses: a) n tentativas ou provas independentes. denotadas por sucesso ou insucesso. por exemplo.

k é o número de sucessos em n provas.. basta que se defina a vad X = número de caras (sucesso). ambos com a mesma probabilidade de 1 . cujos eventos são {ckk. etc. . recomenda-se que n não exceda a 30 ocorrências (n≤ 30). quando se joga uma moeda três vezes há uma combinação de 2 resultados possíveis. para uma binomial do tipo X ≈B(3. Gilberto S. vendas. 2. UEFS. 2 3.32 c) a probabilidade de sucesso é p e a de fracasso ou insucesso é q =1 − p . Aqui a probabilidade dos respectivos eventos. 29/09/2006. p) e se lê x tem distribuição binomial de parâmetros n e p. 2 8 b) uma cara. a jogada de uma moeda caracteriza a mais elementar das distribuições binomiais. kck e kkc}: P(x = 1) = C1 ( 1 )1 ( 1 ) 3− 1 = 3 × 1 × 1 = 3 / 8 . que podem ser calculados um a um pela distribuição binomial sem precisar de enumeração direta. representada pelo evento {kkk}: 0 P( x = 0) = C 3 ( 1 ) 3 = 1× 1 = 1/ 8 . A distribuição binomial tem média μ = np e variância σ2 =npq . A distribuição binomial é utilizada para avaliar probabilidades de eventos relacionados com controle de qualidade. Neste contexto. risco de apólices de seguro. Assim. e P( x =0) =q n é a probabilidade de nenhum sucesso. análise demográfica. n n. a probabilidade de k sucessos em n tentativas ou provas independentes é calculada por intermédio da fórmula: P( x = k ) = C k p k q n −k ... As quantidades n e p são os parâmetros da distribuição. é calculada assim: a) nenhuma cara. 1. pois admite apenas dois resultados possíveis. cara (c) ou coroa (k). ou n = 3 e p =q =1/ 2 . 3 2 2 2 4 Prof. 1. que se representa por X ≈ B( n . A fim de contornar eventuais dificuldades com a operação da fórmula da distribuição binomial. 1 / 2) . . C k n é o número de maneiras distintas de se obter k sucessos em n provas. mercado de ações. Nesta fórmula o termo n é o número de provas. Gramacho. que são complementares entre si e permanecem constantes durante todo o processo de observação. que deve assumir os valores 0. No entanto. para x =0.

é a base do logaritmo Prof. k! Tem-se aqui: μ = np . a probabilidade de k sucessos num intervalo de tempo ou espaço é estimada por intermédio da fórmula: P( x = k ) = μ k e −μ 0 . Distribuição de Poisson A variável de interesse na distribuição binomial era o número de sucessos em n provas independentes. para x = . UEFS.1 . mas a variável aleatória é o número de sucessos observados (não sobrepostos – independentes) num intervalo contínuo. 8.. e = 2. quando n tende para mais infinito ( n → + ∞ ) e p tende para zero ( p →0 )... A utilização da distribuição de Poisson baseia-se nas seguintes hipóteses: a) a probabilidade de uma ocorrência é a mesma em todo o campo de observação. 3 2 2 8 Observe-se que a soma das probabilidades correspondente a estes eventos é igual a unidade. que é a média da distribuição.33 c) duas caras. 29/09/2006. c) o número de ocorrências em qualquer intervalo é independente do número de ocorrências em outros intervalos. consegue-se boa aproximação a partir de valores de n superior a 30 ( n > 30 ) e p inferior a 0. Em problemas típicos da binomial. tais como: número de veículos que cruzam um semáforo por minuto. A distribuição de Poisson é um caso limite da binomial. 2 2 4 2 d) três caras.05 ( p < 0. a distribuição é discreta e o processo semelhante ao de Bernoulli.71828 μ (x ) natural (constante). Em Poisson. . Gramacho. havendo 0 0 até quem admita p < .. caracterizando a distribuição de probabilidade do número de caras no jogo de três moedas. Gilberto S. número de chamadas por hora para atendimento de emergência num posto de bombeiros. de tempo ou espaço. num intervalo discreto. Assim. kcc}: 2 P( x = 2) = C 3 ( 1 ) 2 ( 1 ) 3− 2 = 3 × 1 × 1 = 3 / 8 . .05 ). e P =0 =e − é a probabilidade de nenhum sucesso. 1. etc.2.. cujos eventos são {cck. ckc. representadas pelo evento {ccc}: P( x = 3) = C 3 ( 1 ) 3 ( 1 ) 3− 3 = 1× 1 × 1 = 1/ 8 . b) a probabilidade de mais de uma ocorrência num único ponto é aproximadamente zero. 2. número de defeitos por metro quadrado (m2) de um piso.

e que facilita a solução de muitos problemas concretos. 29/09/2006. c) exatamente 5 pedidos no espaço de uma hora. d) no máximo dois garrafões avariados. como n é maior que 30 e p é menor que 0. Assim.00248 = = 0. Exemplo 1: O telefone de um restaurante especializado em pizzas recebe em média três pedidos para entrega em domicilio a cada meia hora.000(0. b) pelo menos um pedido no mesmo espaço de tempo.2% deles sofrem algum tipo de avaria durante a viagem.1654 5! 120 Exemplo 2: Uma firma que transporta garrafões de vinho tem observado que 0. ■ Solução: Seja a vad X = número de pedidos para entrega em domicilio e µ = 3 (média de pedidos recebidos a cada meia hora).34 A média μ é o único parâmetro da distribuição de Poisson. c) A média para o novo intervalo de tempo é de µ = 3× 2 = 6 pedidos por hora. Calcule a probabilidade de que se encontre num carregamento de mil garrafões: a) nenhum com avaria. ■ Solução: A vad é X = garrafões avariados e a sua média é µ = 1. b) P(x ≥1) =1 −P( x = 0) =1 −0. a) P(x =0) =e −3 =0.9502 . propriedade que só acontece nesta distribuição.0498 o 4. Curiosamente.002) = 2 garrafões com avaria. Prof. pode ser resolvido mediante uma distribuição de Poisson de média 2: a) P(x =0) =e −2 =0. Veja-se que este problema é do tipo binomial. Assim.9 u 8% . b) exatamente dois com avaria. ou seja.0498 = 0. X ≈P( μ =3) . Decorre que μ =σ 2 . Gilberto S.776 ×0. porém. que se lê X tem distribuição de Poisson de média μ. P( x = 5) = 6 5 e −6 7. Calcule as probabilidades de o restaurante: a) não receber nenhum pedido para entrega em domicilio na próxima meia hora. Gramacho.1353 ou 13.53% . Uma variável aleatória de Poisson é representada pela notação X ≈P (μ ) . c) mais de um com avaria. UEFS. para qualquer outro intervalo o valor da média deve sofrer a correção numérica adequada. o seu valor deve corresponder ao tamanho do intervalo apresentado.05. A média μ é sempre proporcional ao intervalo de tempo ou espaço definidos no problema. . a variância de Poisson é σ 2 = np . Logo.

5941 . cuja f. c) − ∞ ∫f ( x )dx = . podendo assumir a variável qualquer valor dentro de um intervalo previamente definido. A distribuição de probabilidade desse tipo de variável é definida por uma função densidade de probabilidade (f.).06%.1353 −0. . Gilberto S. a sua aproximação por essa distribuição dá bons resultados e facilita o tratamento matemático. 29/09/2006.35 2 2 e −2 4 ×0. 8.d. pois muitas variáveis no mundo real têm comportamento bastante aproximado dessa distribuição. podendo assumir infinitos valores num determinado intervalo. (b) muitas técnicas estatísticas pressupõem que os dados têm distribuição normal. é expressa por: f (x) = 1 σ 2π e 1  x −μ  −   2 σ  2 . Eis alguns dos motivos da sua elevada importância em estatística: (a) os seus resultados são de fácil operação matemática.3. UEFS. 1 Pois bem. Distribuição normal Recorde-se que uma variável aleatória é contínua quando os seus valores decorrem de medida. A distribuição normal é contínua. para − ∞ ≤ x ≤ +∞. b) ∫ a b + ∞ f ( x )dx = P (a < x ≤ b) . Prof.d.p. A distribuição é descrita por uma curva em forma de sino.1353 = = 0.1353 + 0. (c) embora os dados de muitas situações reais não sejam rigorosamente normais.2706 ) → → P ( x >1) =0. 2! 2 ×1 b) P( x = 2) = c) P ( x >1) =1 −P( x ≤ =1 −P( x =0) −P( x =1) =1 −0.p. Gramacho. por razões teórica e prática.2706 ou 27.2706 + 0. (d) a distribuição amostral de muitas estatísticas tende para a distribuição normal em face do teorema do limite central.2706 P(x ≤ 2) = 0.6765 . com as seguintes propriedades: ) a) f(x ≥0 . a distribuição normal é a mais importante das distribuições de probabilidade. e) P(x ≤ 2) = P ( x = 0) +P( x =1) +P( x = 2) = 0.

A distribuição normal tem forma de sino.1416 e e = 2. nos pontos em que as retas x = −σ e x=σ Figura 8. 1) . para − ∞ ≤ z ≤ + . é simétrica em relação à média μ . a. é assintótica em relação ao eixo de X. as áreas sob a curva. A área total limitada pela curva normal e pelo eixo das abscissas é 1 (um) ou 100%. e o ponto de máximo se dá em interceptam a curva (vide figura adiante). e as proporções de área sob a curva estão tabeladas.71828 (base do logaritmo natural). de média zero e variância unitária. Formato da distribuição normal padrão Prof. Por sua vez. 29/09/2006. A função densidade da normal padrão é Φ(z) = e . σ 2 ) . X que segue uma distribuição normal é representada por X ≈ N(μ. Formato da distribuição normal x −μ . UEFS.26 % . . μ ± 2σ = 95 . limitadas pela distância entre o desvio padrão e a média. Os demais termos da fórmula são as constantes π = 3. os afastamentos em torno da média. que se lê: X tem distribuição normal de parâmetros μ e σ 2 . têm os seguintes percentuais: μ ±1σ = 68 . conforme figura a seguir: X = µ . expressos em desvio padrão de X. Os pontos de inflexão da curva se dão em μ ±1σ = 68 . A média reporta-se ao centro da distribuição e o desvio padrão ao espalhamento de curva. A sua média.74 % .44 % e μ ±3σ = 99 . Uma v. moda e mediana são iguais. conforme a figura abaixo: Figura 8. são convertidos em unidades padronizadas z.26 % .1. Gramacho. σ que origina a distribuição normal padrão.36 A média μ = np e a variância σ 2 = npq são os parâmetros da distribuição normal. representada por O cálculo de áreas sob a curva normal é simplificado por meio da transformação z = 1 2π 1 − z2 2 z ≈N (0. ∞ Com isso. é unimodal e tem achatamento proporcional ao desvio padrão ou variância.2. Gilberto S.

3413 120  120  220 − 360    b) P(x < 220) = P(z < z1 ) = P z < 120   → P( x < 220 ) = P(z < −1. UEFS. Gilberto S.37 A maioria das tabelas traz as proporções de área de zero até um ponto positivo de z.2266  Prof. através de z = x −μ . devido à simetria da curva.00.00 e 460. acha-se na tabela σ de z as proporções de área sob a curva correspondentes às faixas de salários que se deseja saber:  a) P (360 ≤ x ≤ 480 ) = P 360 − 360 480 − 360  ≤z ≤  = P(0 ≤ z ≤ 1) = 0. uma distribuição normal de média R$ 360.17 ) = 0.5 . Exemplo: Um órgão de pesquisa conclui que o salário pago pelas microempresas de certa região segue.00 e desvio padrão de R$ 120.360  c) P(x > 450) = P(z > z 1 ) = P z > 120    = P(z > 0.00 e desvio padrão R$ 120.00. d) ganhar entre R$ 460. que.00 e 520. Por exemplo.00. é a mesma da área compreendida entre os pontos de abscissa 0 e -1 (vide tabela).00 e 480. Neste caso. c) ganhar mais de R$ 450.75) = 0.1210 450 .00? ■ Solução: O salário é uma variável aleatória X.00.3790 = 0. a proporção da área situada entre os pontos de abscissa 0 e 1 é 0.5 −0.0. 29/09/2006. calcule a probabilidade de um assalariado qualquer: a) ganhar entre R$ 360.00.00 e 480.00. Transformando X em z. de perto. f) como se distribuem 95% dos salários em torno da média? g) qual o número esperado e o desvio padrão de 600 desses trabalhadores que ganham entre R$ 360. Gramacho.00.3413. . e) ganhar entre R$ 240. b) ganhar menos de R$ 220. com distribuição normal de média R$ 360.2734 = 0.

475.9 ×2 =x −3 0 x μ ± 6 10 6 x −μ .95. Entrando-se com este valor na tabela da distribuição normal obtém-se os escores reduzidos z 1 = −1. que permitem determinar os limites x1 e x2 mediante substituição na fórmula z = zσ = − → 1.8 ≤ x ≤ 595.95 é 0.3413 →μ = 205 trabalhadores. g) μ = np =600 ×0. 29/09/2006.2) = 0.38 520 −360   460 −360 P( 460 < x < 520 ) = P <z <  = P(0.6826 f) Eis que a metade da área de 0. UEFS.2967 = 0.2 .96 e z 2 =1. Donde se conclui que o intervalo de x em torno da média é P(124. Gramacho. σ 2 =npq =205 (1 −0.83 < z <1. Gilberto S.1115 e) P( 240 ≤ x ≤ 460 ) = P ( −1 ≤ z ≤1) = 0.4082 −0.96 .3413 ) →σ 2 =135 →σ =12 trabalhadores.33 ) 120  120  d) P( 460 < x < 360 ) = 0. Prof. . tal que: σ → x = 360 ± 235.3413 = 0.3413 +0.

O caminho para se chegar a esse tipo de conclusão. deste modo. A teoria da estimação é a parte da Inferência Estatística em que se estuda a elaboração de intervalos de confiança com base em estatísticas amostrais. no país.39 9 TEORIA DA ESTIMAÇÃO 9. em toda a população habilitada a votar. que esteja incluído o verdadeiro valor do parâmetro populacional. 29/09/2006. de acordo com pesquisa do instituto tal. Gramacho. naquele momento. e caso as eleições fossem logo realizadas.1 Introdução A estimativa de um parâmetro de uma população pode ser feita por ponto ou por intervalo. dentre outros. ou estado. com uma probabilidade definida. nos quais se espera. que a proporção p encontrada na amostra é divulgada como uma estimativa da verdadeira proporção p de eleitores favoráveis a esse candidato. esse ˆ candidato seria eleito com uma proporção p de votos. a corrida eleitoral. será comentado mais à frente. Gilberto S. ou município. ˆ Significa. UEFS. com uma margem de erro de tantos por cento (para mais ou para menos). informando que o candidato tal lidera. . naquele momento. é de suma importância o conhecimento da distribuição amostral da estatística eleita como estimador do parâmetro da população.2 Estimação por ponto Prof. 9. Neste ponto. Eis que em tempos de eleição é comum a divulgação de pesquisas sobre intenção de votos pelos órgãos de comunicação. Isso demonstra como informações amostrais podem ser generalizadas para fazer juízo sobre propriedades da população como um todo. tendo sido a pesquisa realizada nos últimos dias e que foram entrevistados um número n de eleitores.

σ 2 ) . pois. a variável padronizada é expressa por z = x −μ . Por isso. com um nível de confiança. pode-se depreender que uma alta precisão foi atingida. tanto quanto possível. σ 2 ). 29/09/2006. 9. Assim. σ x = σ n . E também a proporção p do número de desempregados (x) na amostra (n). Para deduzir a fórmula do IC para a média µ basta substituir a expressão de z no intervalo P(−z c ≤ z ≤ z c ) = 1 − α . quanto menor for a amplitude de um IC melhor é a informação que ele fornece.40 Na estimação pontual estima-se um único valor do parâmetro populacional. Assim. Eis que a solução σx Prof. a partir de dados da amostra.1 Intervalo de confiança para a média da população µ ― σ conhecido Se a variável aleatória x tem distribuição normal de média µ e variância σ 2 . que se denota por x ~ N( μ . 9. σ Por outro lado. de maneira que se a amplitude do intervalo é pequena. relativa a certa categoria profissional. A vantagem dessa técnica é que ela confere um grau de precisão à estimativa. interessa obter. como já comentado. a saber: P( −z c ≤ x −μ ≤ z c ) = 1 − α → P( −z c σ x ≤ x − μ ≤ z c σ x ) = 1 − α . é uma estimativa por ponto da verdadeira proporção p de desemprego profissional na população. .3. UEFS. no qual se admite. Os extremos do IC são chamados limites de confiança. intervalos de amplitude mínima para um dado nível de confiança. centrado numa estatística amostral. E desta forma x n x −μ σ/ n a variável z passa a ser z = σ x ou z = . respectivamente. que esteja incluído o parâmetro da população. que se identifica por x ~ N(μ. se a distribuição amostral da média segue uma distribuição normal a variável aleatória x terá média µ e variância x −μ σ2 = x σ2 . Gilberto S. Gramacho. a média da amostra x e a variância da amostra s 2 são estimativas por ˆ ponto da média μ e da variância σ 2 da população.3 Intervalo de confiança ― IC Intervalo de confiança é uma técnica de estimação que visa estabelecer um intervalo de valores.

Gilberto S. • 1 − α = nível de confiança – probabilidade de o IC incluir a média µ . • x = média da amostra. UEFS. cujo valor é obtido na tabela 2 da distribuição z. a . Por isso. • μ = média da população. o valor do erro padrão depende do nível de confiança adotado.41 desta expressão em relação a μ é P( x − z c σ x ≤ μ ≤ x + z c σ x ) = 1 − α . A configuração gráfica de um IC para a média µ é vista na figura abaixo: Figura 9. z • z c ou α = z crítico. ou μ = x ± z c σ n σ n . por substituição. E ainda mais. Gramacho. . também é chamado de z tabelado.1 Gráfico de um IC para a média populacional μ De um modo geral. do desvio padrão σ ou do seu estimador s. quando σ é desconhecido. abscissa da distribuição normal padrão. isto é. o erro padrão e reflete a variação aleatória que ocorre de amostra para amostra numa distribuição amostral de médias. obtém-se. Quando se aumenta o nível de confiança de uma estimativa o valor do erro padrão também Prof. Como o desvio padrão da distribuição de x é σ x = seguinte fórmula para estimar o IC para a média populacional µ : P( x − z c σ n ≤ μ ≤ x + zc σ n ) = 1 − α . • α = nível de significância – probabilidade de o IC encontrado não incluir a média µ . em face do nível de confiança adotado. 29/09/2006. • e = zc σ n = erro padrão da estimativa ou erro de amostragem (semi-amplitude do IC). do tamanho da amostra e da dispersão dos elementos da população. • σ = desvio padrão da população.

n é função do erro padrão e do nível de confiança 1 − α . para compensar a maior probabilidade de acerto que se atribui à estimação do parâmetro. A fórmula para calcular o tamanho mínimo da amostra é obtida isolando n da fórmula do erro padrão e = z c σ n 2 . em que não há nada escrito sobre o assunto. em certa cidade. um IC de 95% de confiança proporciona um erro padrão e menor que o de um IC de 99% de confiança. era cerca de 50 kw/mês.4750). como demonstrado a seguir: 2 z σ (z σ) 2 (z σ) 2 z σ e =  c  → e2 = c → n = c 2 . UEFS.95/2 = 0. Pretende-se estimar um IC de 95% para o verdadeiro consumo médio domiciliar mensal de energia. uma vez que e = z c σ n . por simetria. Em se tratando de estudo pioneiro. 29/09/2006. coletou-se. a única alternativa é a seleção de uma amostra piloto. . Gramacho. dessa amostra. entra-se na tabela da distribuição normal com a probabilidade de 0. uma média equivalente a 320 kw/mês. ou do desvio padrão amostral s.   n e  e   n 2 Neste particular. quanto maior for a dispersão verificada na população ou na amostra maior será o valor do erro padrão da estimativa. para mais ou para menos.4750 equivalente à metade de 1 − α (0. que permita fazer uma estimativa preliminar da medida de dispersão que será utilizada para calcular em definitivo o tamanho mínimo de amostra adequado.96 e. É relevante dizer que a obtenção do desvio padrão σ para calcular o tamanho mínimo de amostras é um problema crucial na teoria da estimação. Outrossim. ou seja. encontrando-se z = 1. o consumo mensal registrado em 100 domicílios. Gilberto S. ou então. mantendo-se os demais fatores constantes. na lista da companhia distribuidora. em que se tenha estimado o “ σ ” da variável de interesse. z = -1.96 (vide tabela da página 81). quando se aumenta o tamanho da amostra n é de se esperar uma redução no erro padrão equivalente a n .42 aumenta. obtendo-se. e pode ser superado consultando-se pesquisas ou estudos similares. Assim. dado o nível de confiança de 95%. Para estimar o consumo médio atual. A grandeza do desvio padrão populacional σ . quando este é usado como estimador do primeiro. ■ Solução: Para achar os valores críticos de z. aleatoriamente. Exemplo 1: Num censo passado apurou-se que a variação do consumo domiciliar de energia. A arquitetura Prof. n =  c  . influencia o valor de e.

Gilberto S. UEFS.8 kw/mês. A estimativa em tela dá um erro padrão de 9.96 × 50  n = c  =  → n = 384 domicílios. a fórmula do intervalo de confiança para μ inclui o fator de correção σ n N −n . Pergunta-se qual o tamanho mínimo da amostra necessário para reduzir o erro padrão de 9. Gramacho.96 50 = 320 ± 9. como demonstrado a seguir: z σ e = c ×  n  2 N −n N −1  z 2σ 2 N − n  → e2 = c × . 29/09/2006. tem-se: n ( N − 1)e 2 = 2 zcσ2 N − n 2 × × n ( N − 1) → n ( N − 1)e 2 = z c σ 2 ( N − n ) n N −1 2 2 2 2 n ( N − 1)e 2 = z c σ 2 N − nz c σ 2 → n ( N − 1)e 2 + nz c σ 2 = z c σ 2 N 2 2 n[( N − 1)e 2 + z c σ 2 ] = z c σ 2 N .2 ≤ μ ≤ 329 . .8 → 310 .8 kw/mês.  n N −1  2 Multiplicando os dois membros desta expressão por n ( N −1) . conforme se verifica a seguir: N −1 μ = x ± zc Neste caso. N −1 σ n N −n . o erro padrão da estimativa é identificado pela expressão e = z c da qual se tira a fórmula de n para calcular o tamanho mínimo da amostra. com 95% de 100 confiança.8 para 5 kw/mês. donde se conclui que: Prof.43 do IC em comento é ilustrada no gráfico a seguir: μ = x ± zc σ n = 320 ±1. 5    e  2 2 Em se tratando de população finita (amostragem sem reposição). N −1 N −n . mantendo-se o nível de confiança de 95%? z σ  1.

mas não se deve esquecer a distinção entre pequenas e grandes amostras.1 Note-se que 40 = 0. utiliza-se em seu lugar.96 × 35 5) / 500 2 = 188 . devido a erro contábil. por experiência. a estimativa do saldo médio em aberto ( μ ) das 500 contas encerradas no mês.05 N ). depois de examiná-las.3765 N-n pode ser ignorado para n N -1 Vale lembrar que o fator de correção de população finita menor que 5% de N ( n < 0. a um nível de confiança de 95%. N −n pode ser ignorado quando n é menor N −1 9. Gilberto S. que em situações parecidas.41.59 e R$ 270. 50 Logo.41 R$ 500 .00. seria calculada assim: μ = 260 ±1.2 Intervalo de confiança para a média µ ― σ desconhecido Em não se conhecendo o desvio padrão da população ( σ ). Prof.00. A formula acima pode ser simplificada para: n = ( z c σ e) 2 1 + ( z c σ e) 2 / N . como estimador. em face de erro contábil.96 35 40 500 .96 × 35 5) 2 1 + (1. pelo setor de Contabilidade de uma firma. Esta aproximação melhora à medida que n cresce.40 → μ = 260 ±10 .2384 → n = 137 contas 1 + 0. o auditor poderia inferir que o saldo médio em aberto das 500 contas encerradas.05 N ). 29/09/2006. O auditor sabe.00 e nível de confiança de 95%. Se o auditor desejasse trabalhar com um erro padrão da estimativa de R$ 5.41 → 249 . Gramacho. qual deveria ser o tamanho da amostra? n= (1. . o valor do desvio padrão populacional ( σ ) não excede a R$ 35.44 2 zcσ2N 2 ( N − 1)e 2 + z c σ 2 n= . Então. Exemplo 2: Um auditor selecionou ao acaso uma amostra de 40 contas a receber de um total (população) de 500 contas arquivadas num determinado mês. seria um valor entre R$ 249.08 > 0. É importante destacar que o fator de correção que 5% de N ( n < 0.05 . UEFS.59 ≤ μ ≤ 270 . um saldo médio em aberto de R$ 260. o desvio padrão amostral (s). com 95% de confiança. obtendo.3.

em face do teorema do limite central. . Gramacho. ■ Solução: Para 1 − α = 0. Caso o fabricante decidisse fixar o erro padrão em 2. Ou. com 90% de confiança. Estime-se.8 hs.8 → 594.8 horas.2. donde obteve duração média de 600 horas e desvio padrão de 25 horas. é dada n pela expressão n =   z cs   . com os mesmos 90% de confiança.1 Grandes amostras Quando o tamanho da amostra é maior ou igual a 30 ( n ≥ 30 ). UEFS.90 corresponde valores críticos de z c = ±1. um IC para o verdadeiro tempo médio de duração de todas das lâmpadas.45 9. resumidamente: μ = x ± z c A fórmula para calcular o tamanho da amostra. pode-se utilizar a distribuição normal para elaborar o intervalo de confiança para a média populacional µ .64 25 50 = 600 ± 5.  e  2 Exemplo 1: Seja um fabricante de lâmpadas que para estimar o tempo médio de duração do seu produto seleciona para ensaio uma amostra aleatória de 50 unidades. Gilberto S. através da fórmula: P( x − z c s s < μ < x + zc ) =1− α .3. obtém-se: μ = x ± zc s n = 600 ± 1. 29/09/2006.64 na tabela da distribuição normal. A arquitetura do IC é retratada no quadro abaixo: Significa que se todas as lâmpadas fossem testadas encontrar-se-ia um tempo médio de duração entre 594.2 e 605.5 horas. n n s n . E mais.2 ≤ µ ≤ 605. o número de lâmpadas a ser testado seria de: Prof. a partir do erro padrão e = z c s . com x = 600 e s = 25. com 90% de confiança.

79 reais. nada Prof.5  → n = 269 lâmpadas.0633 = → n = 176 contas. 2 1 + (1.00 e desvio padrão (s) de R$ 42.96 × 42 5) 2 271. Gramacho. é calculado da maneira abaixo: μ = 260 ± 1. 29/09/2006.00 (devido a erro contábil). quando há certeza de que a população de onde provém a amostra é normalmente distribuída.96 42 40 500 − 40 →μ = 260 ±13 . σ.2. 500 −1 Enquanto isso.46  1. A estimativa do saldo médio em aberto das 500 contas encerradas e arquivadas no mês. Ressalve-se que quando a população é normalmente distribuída e se conhece impede que se utilize a distribuição normal em pequenas amostras. o que não é raro. UEFS. pelo setor de Contabilidade de uma firma. o problema é minimizado pela utilização da distribuição t de Student no lugar da normal.00 e nível de confiança de 95%. o auditor obtém na amostra um saldo médio em aberto de R$ 260.5421 9. agora. Todavia.21 ≤ μ ≤ 273 .96 × 42 5) / 500 1 + 0. Gilberto S. Exemplo 2: Voltemos ao caso da amostra aleatória de 40 contas a receber de um lote de 500 contas arquivadas em certo mês. a um nível de confiança de 95%.64 × 25  z s n = c  =   2. N −1 2 2 E o calculo do tamanho da amostra é feito através da fórmula adiante: n= ( z c s e) 2 1 + ( z c s e) 2 / N . é de: n= (1. o desvio padrão amostral s não é um bom estimador do desvio padrão populacional σ. todavia. supondo que o desvio padrão populacional é desconhecido.   e    Em se tratando de população finita (amostragem sem reposição) inclui-se o fator de correção à fórmula do IC: μ = x ± zc s n N −n . o tamanho mínimo da amostra admitindo um erro padrão da estimativa de R$ 5. porque está sujeito a flutuações muito grandes de amostra para amostra. Assim. .3.2 Pequenas amostras ― a distribuição t de Student Em pequenas amostras ( n < 30 ).79 → 246 .

que corresponde à abscissa da distribuição t de Student.3. o intervalo de confiança de 95% para a duração média das lâmpadas como um todo? ■ Solução: Sejam n = 16 lâmpadas. admita-se que ele tenha apurado a mesma média e o mesmo desvio padrão. como se verifica na figura adiante: Figura 9. Para facilitar.  e  2 Exemplo 1: Imagine que o fabricante de lâmpadas. a fórmula do IC neste caso é: P( x − t c s n ≤ μ ≤ x + tc s n ) =1−α .47 A diferença básica entre a distribuição normal e a distribuição t é que esta. UEFS. cujo valor se obtém na tabela desta distribuição. x = 600 horas. Gilberto S. em função do nível de significância α e de n–1 graus de liberdade (g. Qual seria. de modo resumido: μ = x ± t c . citado no exemplo 1 do subitem 4. por ser mais dispersa.l. s = 25 hs.2. s n Ou. então.3 Gráfico de um IC para a média μ com a distribuição t t s Enquanto que a fórmula para estimar o tamanho da amostra é n =  c  . 29/09/2006. . Prof. como se observa na figura abaixo: Figura 9.). decidisse coletar apenas 16 lâmpadas para teste. em face de urgência no resultado da pesquisa. tem as extremidades mais alongadas que a primeira. e α = 0. Gramacho.2 Formato das distribuições t de Student e normal Por conseguinte.05. Onde s é o desvio padrão da amostra e t c ou t α / 2 é chamado t crítico. A ilustração gráfica de um intervalo de confiança com a distribuição t é semelhante ao que foi visto nos casos que envolveram a distribuição normal.

Caso interessasse reduzir o erro padrão de 13. em que se adota o fator de correção de população finita. 29/09/2006.1315 × 25 = 600 ±13 . Gilberto S. UEFS. μ = x ± t c horas.05. o número de lâmpadas que deveria ser testado seria de:  t . ou 586 . 8    e  Este tamanho de amostra permitiria ao fabricante utilizar sem problemas a distribuição normal para estimar um novo intervalo de confiança para a média μ.s   2. Supondo que a idade dos acionistas é uma variável aleatória que se distribui normalmente. mantendo o nível de confiança de 95% para a estimativa da média μ. construa um intervalo de confiança de 95% para a idade média de todos os acionistas que freqüentam a assembléia.7 e 613.3 horas. cuja ilustração se verifica no gráfico adiante: Logo.3 horas. sobretudo para n > 0. Exemplo 2: Uma amostra aleatória de 16 acionistas de uma grande empresa.48 Entrando-se na tabela da distribuição t com n −1 = 15 graus de liberdade e nível de significância α =0. .7 4 Infere-se que o tempo médio global de duração das lâmpadas seria um valor entre 586. a fórmula do IC fica igual a: μ = x ± tc s n N −n . Prof. N −1 2 2 Para estimar o tamanho mínimo da amostra utiliza-se a fórmula: n= (t c s/e) 2 1 + (t c s/e) 2 / N .3 para 8 horas. s n = 600 ± 2.7 ≤ μ ≤ 613 . encontra-se t c =±2.1315.05N. respectivamente. No caso de população finita. Gramacho. dentre os 128 que comparecem a uma assembléia. apresenta idade média de 52 e desvio padrão de 6 anos.1315 × 25  n = c  =  → n = 144 lâmpadas. com 95% de confiança.

cuja distribuição de probabilidade é do tipo binomial. tem-se.1315 na tabela da distribuição t.1315 × 6 / 2) 2 1 + ( 2.125 > 0. sugerindo que se N 128 deve utilizar o fator de correção de população finita.3 Intervalo de confiança para a proporção populacional p Há situações em que a variável de interesse só admite dois resultados possíveis: sucesso ou fracasso. n 16 = = 0. Gilberto S. pois a estimativa de proporções envolve quase sempre grandes amostras retiradas de populações muito grandes. Para estimar a idade média geral dos acionistas. pois σ é desconhecido e n é menor que 30. com erro máximo de 2 anos e nível de confiança de 95%. utilizar a distribuição t. N n Apesar de a distribuição de p ser binomial.89 → n ≅ 31 acionistas.05 . respectivamente. eis que surge: Prof. 128 − 1 Portanto.49 ■ Solução: Como n=16 e N=128. Eis que a média e a variância da distribuição binomial são.1315 × 6 / 2) / 128 2 = 40. infere-se que a idade média de todos os acionistas que compareceram à assembléia situa-se entre 49 e 55 anos. também. o tamanho mínimo da amostra seria de aproximadamente: n= (2. .1315 6 16 × 128 − 16 → μ = 52 ± 3 → 49 ≤ μ ≤ 55 anos. μ = 52 ± 2. ela pode ser aproximada pela distribuição normal. 1 + 0. Substituindo estes parâmetros na fórmula de z.3.05 e n − 1 = 15 graus de liberdade corresponde o valor t c = 2. com n–1 graus de liberdade. Aqui a probabilidade de sucesso é p e a de fracasso q =1 − p . A proporção de eventos favoráveis na população é p = x x ˆ e o seu estimador na amostra é p = . Deve-se. Para α = 0. com 95% de confiança. 29/09/2006. da distribuição normal padrão. UEFS. μ = np e σ 2 = npq .31945 9. Gramacho. cujo esboço gráfico se encontra abaixo.

5) 2 .25 = (0. como já dito. Gilberto S. nem os respectivos estimadores p e q 0. npq n2 z= x ˆ Trocando por p . utiliza-se a fórmula p = p ± z c . Gramacho. n ˆ ˆ Quando não se conhecem os parâmetros p e q . obtido na tabela da distribuição normal. n Para encontrar a fórmula do IC para estimar a proporção populacional p. em que 0. 29/09/2006. • ˆ p ˆ ˆ = proporção na amostra e q =1 −p é o complemento de p . UEFS. vem: ˆ P( p − z c pq ˆ ≤ p ≤ p + zc n pq ) =1 − α . onde: n ˆ Ou. A fórmula para calcular o tamanho da amostra para a proporção p é obtida a partir do Prof. . basta substituir a nova expressão de z em P( −z c ≤ z ≤ z c ) = 1 − α . n Como os parâmetros p e q de dentro da raiz são desconhecidos. tirando o valor de p. resumidamente: p = p ± z c • p = proporção na população.25 ˆ .50 z= x −μ x − np →z = . n ˆˆ pq . pois se considera 0. a saber: P( −z c ≤ ˆ p −p pq n ≤ zc ) =1 − α . resultando na seguinte fórmula do IC para a proporção p: ˆ P( p − z c ˆˆ pq ˆ ≤ p ≤ p + zc n ˆˆ pq ) =1 − α . a que se pretende estimar. σ npq x np − n z= n Dividindo-se a nova expressão de z por n.5 como valor n máximo da proporção p. tem-se: . eles são substituídos pelos ˆ ˆ seus respectivos estimadores p e q . • z c = z crítico. • e = zc ˆˆ pq = erro padrão da estimativa ou erro de amostragem. chega-se a: n ˆ p −p pq .

09 × 0.9 1 (proporção de peças perfeitas na amostra). A inspeção feita numa amostra aleatória de 200 peças revelou que 18 apresentavam defeitos.09 ±1.13 . o tamanho mínimo da amostra deverá ser de: z   1. Gilberto S. N −1 Para calcular o tamanho da amostra. onde e = z c N −1 ˆˆ pq × n N −n é o erro padrão da estimativa.04 → 0.5%. p = 18 = 0.05 ≤ p ≤ 0.09)(0. utiliza-se a fórmula em destaque.9 1) → n = 503 peças. Estime-se um intervalo de confiança para a verdadeira proporção de peças defeituosas. ˆˆ   ˆˆ 2  n e  e   2 2 Exemplo 1: Seja o caso de um industrial que considera satisfatório um percentual de até 6% de peças defeituosas produzidas em sua fábrica de equipamentos eletrônicos. ˆ ■ Solução: n = 200 peças. obtida algebricamente a partir da expressão do erro padrão. ˆ q =1 −0.95 (nível de confiança) donde se obtém na tabela da distribuição normal padrão z c = ± 1. então.51 quadrado da fórmula do erro padrão. 200 Assim. UEFS. qual seja: Prof.91 → p = 0. a fórmula do IC inclui o fator de correção e passa a ser: ˆ p = p ± zc ˆˆ pq × n N −n .96 0.09 (proporção de peças 200 defeituosas na amostra).025 e    2   (0. O esboço do IC em comento consta no gráfico a seguir: Caso interesse diminuir a margem de erro da estimativa de 4% para 2. mantendo-se os 95% de confiança. a verdadeira proporção de peças defeituosas é um valor compreendido no intervalo acima.96 .09 =0. x = peças defeituosas. que envolve o dito percentual de 6% de peças defeituosas. com 95% de confiança.96 ˆˆ n =  c  pq → n =   0. o IC para a verdadeira proporção de peças defeituosas: p = 0.09 ± 0. . 1 − α = 0. Segue-se. com 95% de confiança.   2 Quando se trata de população finita. 29/09/2006. como demonstrado abaixo.  e = zc   2 ˆˆ pq n 2  z 2 ˆˆ  → e 2 = z c pq → n = z c pq ↔ n =  c  pq . Gramacho.

1 − α = 0.42 de analfabetos. x = 56 (n° de ˆ analfabetos).65 ×1.95 . o tamanho mínimo de amostra para estimar a verdadeira proporção de analfabetos na mesma área.28 ≤ p ≤ 0.500 →160 > 75 . Por exemplo. Gilberto S.35 = 0. com 95% de confiança.65 1.35 ± 0. UEFS.500 indivíduos. mediante o qual se encontra z =1.52 ˆˆ z 2 pqN .500 (tamanho da população). Gramacho. na área rural de um pequeno município. na tabela da distribuição normal padrão.500 −160 × 160 1.65 (proporção de alfabetizados na amostra).35 (proporção de analfabetos na amostra). como se vê a seguir: p = 0.96 0.04 ) Prof. é necessário adotar o fator de correção de população finita para estimar a proporção populacional p. 2 ˆˆ z pq + ( N −1)e 2 n= Exemplo 2: Seja um levantamento por amostragem levado a cabo junto a 160 indivíduos adultos. 29/09/2006.35 × 0.07 →0.500 −1 0.65 + (1.96 ) 2 0.05 ×1.96 .35 × 0.35 × 0. 2 2 (1. nível de confiança.500 −1)( 0. Verifica-se que a verdadeira proporção de analfabetos na área pesquisada se situa entre 28% e 42%. Elabore-se um intervalo de confiança de 95% para a proporção geral de analfabetos.96 ) 0. 35% com margem de erro de 7%. N = 1. 160 ˆ ˆ q =1 −p =1 −0. O último censo demográfico assinala que a população adulta da área coberta pela pesquisa é de 1. ■ Solução: n = 160 (tamanho da amostra). com erro máximo de 4% e nível de confiança de 95%. Sendo n > 0.35 ±1. onde se constatou que 56 deles eram analfabetos. .05 N →160 > 0. seria: n= (1. isto é.500 → n = 401 indivíduos. p = 56 = 0.

com o tempo. Caso o teste revelasse pouca significância para Prof. que são procedimentos destinados a verificar se é verdadeira ou falsa a suposição que se estabelece acerca do valor do parâmetro populacional. com nível máximo de confiança (probabilidade de aceitar a hipótese submetida a teste). Esta é uma proporção que vale para todo o universo. Gilberto S. Seja determinado processo de fabricação.53 10 TEORIA DA DECISÃO 10. Ainda mais que o percentual de 5%. estudam-se os testes de hipóteses. em que o controle de qualidade considera normal o funcionamento de um equipamento quando a proporção de itens defeituosos se acerca de 5%. que ao lado da teoria da estimação é outra importante vertente da Inferência Estatística. 29/09/2006. deverá ser atualizado tendo em vista o natural desgaste do equipamento no caminho da absolescência. Gramacho. . mas que deve ser confrontada. Neste caso. • H1 (agá índice um): O equipamento não está operando normalmente. para verificação da conformidade do processo. A decisão de aceitar ou não a hipótese inicial seria determinada por uma estatística teste que avaliasse a significância de eventuais diferenças entre proporções obtidas por amostragem e a proporção de 5% fixada pelo controle de qualidade. E o fato de aceitar ou não uma hipótese estatística implica sempre em tomar uma decisão.1 Definição Na teoria da decisão. com a proporção decorrente de amostras retiradas da linha de produção. seria interessante o controle de qualidade formular e confrontar as hipóteses a seguir: • H 0 (agá índice zero): O equipamento está operando normalmente. periodicamente. UEFS.

que corresponde àquela que se deseja provar. que consiste em rejeitar a hipótese nula H 0 quando ela é verdadeira. ou erro beta. .3 Risco de erros em testes de hipóteses Quando uma hipótese é aceita há sempre o risco de ocorrer dois tipos de erro: o ERRO TIPO I. Neste sentido.2 Teste de hipóteses Os testes de hipóteses são utilizados quando existe alguma suposição quanto ao valor de algum parâmetro da população e se pretende testar a sua consistência. UEFS. A descrição dessas possibilidades de erro consta do quadro abaixo: Quadro 10. Prof. 10. a hipótese inicial seria aceita. 10. que intercepta a região de aceitação de H 0 . aquela que é aceita quando esta é rejeitada. H 0 é chamada de hipótese nula porque estabelece que é nula a diferença entre valor real e valor suposto para o parâmetro populacional. ou erro alfa. assunto que não será abordado neste texto. Enquanto que o erro tipo II. baseada no verdadeiro parâmetro da população. corresponde ao nível de significância do teste. ou seja. o que é demonstrado através da elaboração da chamada curva característica de operação (CCO). Gilberto S. que consiste em aceitar a hipótese H 0 quando ela é falsa. A probabilidade do erro tipo I. o objeto de estudo é confirmar a veracidade estatística de algumas hipóteses a respeito de parâmetros da população visando tomada de decisões. e da hipótese alternativa ( H1 ). que é o mais importante. 29/09/2006. Um teste de hipóteses compõe-se da hipótese nula ( H 0 ). a partir de evidências observadas na amostra. que se contrapõe a H 0 . menos importante.54 essas diferenças. Daí a sua maior importância técnica e de controle bem mais fácil que o do erro tipo II.1 – Risco de erro num teste de hipótese Decisão Aceita Rejeita Hipótese nula ( H 0 ) Verdadeira CORRETO ERRO TIPO I Falsa ERRO TIPO II CORRETO O erro tipo I. Gramacho. compreende a quantidade da distribuição amostral. ou o ERRO TIPO II. Este procedimento será detalhado mais adiante. é igual ao nível de significância α (alfa) e a do erro tipo II é β (beta).

entre μ e μ 0 . que delimita a área de aceitação do teste e é obtido na tabela da distribuição normal. . em face do nível de confiança 1 − α . testa-se a hipótese de desigualdade. Gramacho.2 – Decisão num teste z para a média populacional μ Hipótese Tipo de teste Nula H 0 : µ = µo H 0 : µ = µo H 0 : µ = µo Decisão Aceita-se H 0 se -zc ≤ zo ≤ zc se zo < zc se zo > -zc Alternativa H1 : µ ≠ µo H1 : µ > µo H1 : µ < µo Bicaudal Unicaudal à direita Unicaudal à esquerda A estatística z o vista no quadro acima é chamada de z observado e é calculada com base em estatísticas amostrais. a) Formulação do teste Os testes de hipótese são do tipo bilateral (bicaudal) ou unilateral (unicaudal).55 10. No segundo. testa-se a hipótese de igualdade ou diferença a média populacional μ e o valor suposto μ 0 . Gilberto S. O teste Z é ainda utilizado quando σ é desconhecido e a amostra é maior ou igual a trinta ( n ≥ 30 ). UEFS.4 Teste para a média populacional µ – teste z Quando o desvio padrão populacional σ é conhecido o teste para a média μ é feito com a distribuição normal. O gráfico de uma curva normal para realização de um teste bicaudal tem o formato visto na figura abaixo: Figura 10. 29/09/2006. Enquanto que z c é o chamado z crítico. para mais ou para menos. O modo de formular e decidir sobre um teste de hipóteses para a média μ resume-se no quadro abaixo: Quadro 10. Eis que a hipótese nula estabelece uma igualdade entre a média populacional μ e a média suposta μ o (diferença nula).1 Formato de um teste z bicaudal para a média μ Prof. qualquer que seja o tamanho da amostra. No primeiro. enquanto que a hipótese alternativa é sempre de desigualdade.

σx σ n n σ é conhecido. com nível de confiança 1 − α . mede o afastamento. 29/09/2006. Prof. Neste caso. se a estatística teste zo (z observado) cair entre -zc e zc. b) Estatística do teste A estatística de um teste mede a discrepância existente entre a estatística amostral e o parâmetro populacional a ser testado. em destaque na figura anterior. No teste unicaudal à direita. aceita-se H 0 . como zo = x −μ x −μ σ → zo = . representada pela área sob a curva localizada na extremidade esquerda. Gramacho. eis que σ x = . a probabilidade de aceitação de H 0 é 1 − α . Gilberto S. como se vê na figura a seguir: Figura 10. quando z 0 > z c .56 A probabilidade de aceitar H 0 é 1 − α . UEFS. com nível de confiança 1 − α . entre a média amostral ( x ) e a média populacional ( μ ). a estatística z o .2 Formato de um teste z unicaudal à esquerda para a média μ Aqui. com nível de confiança 1 − α . e a de rejeitá-la é bilaterais. quando z 0 < z c . correspondendo às duas 2 α fica repartida em duas partes iguais áreas demarcadas nas extremidades da curva normal. No teste unicaudal à esquerda. a probabilidade α . tem-se: No caso. aceita-se H 0 . chamada z observado. a probabilidade α de rejeição de H 0 é dada pela área sob a curva situada na extremidade direita. .3 Formato de um teste z unicaudal à direita para a média μ Enfim. em unidades normais padronizadas. como ilustra a figura abaixo: Figura 10. Em testes bicaudais ou α . Aceita-se H 0 . E a probabilidade de rejeição é α .

não havendo evidência estatística de que o verdadeiro consumo médio domiciliar de energia seja de 350 kw/mês. 1. com 95% de confiança.57 Exemplo 1: Foi apurado. em operação similar à de elaboração de intervalos de confiança. resultando 340. era de 50 kw/mês ( σ ) e que o consumo médio atual na cidade beira a casa dos 350 kw/mês. em certa cidade. que a variação do consumo domiciliar de energia. x = 320 kw/mês e 1 − α = 0. Teste-se a hipótese de que o consumo médio de energia é de 350 kw/mês. rejeita-se H 0 . mediante a fórmula: xc = μo ± zc σ n O símbolo x c é o valor crítico da média amostral e μ o é a média populacional suposta. o teste para a média μ com os dados do exemplo anterior: • Formulação: H 0 : μ = 350 kw/mês ∴ H 1 : μ ≠ 350 kw/mês.96].96 50 100 x c = 350 ± 9. aceita-se H 0 quando o valor da média amostral cair no intervalo limitado pelos valores críticos de x c . • Estatística do teste: z o = x −μ σ/ n = 320 − 350 50 / 100 → z o = −6 Para um nível de confiança de 0.8 kw/mês. no caso presente. Segue-se. Prof. uma discrepância muito grande entre a média amostral e a média suposta para a população como um todo.96. Gramacho. com 95% de confiança.2 ≤ x c ≤ 359.95 tem-se um valor modular de z c = ± 1. na tabela da distribuição normal.96.95 . • Formulação do teste: H 0 : μ = 350 kw/mês ∴ H 1 : μ ≠ 350 kw/mês. conforme esboço no gráfico abaixo. em dados de um censo. Uma amostra aleatória de 100 consumidores deu uma média amostral de 320 kw/mês. ■ Solução: σ = 50 kw/mês. Neste caso.8 . Chega-se à mesma conclusão calculando-se limites críticos para a média amostral. então. . Como zo = -6 está fora do intervalo [-1. n = 100. 29/09/2006. Gilberto S. Nota-se. • Valores críticos de x : x c = μ O ± z c σ n = 350 ±1. UEFS.

A hipótese nula H 0 é igualmente rejeitada quando se calcula um valor crítico para a média amostral x .8 kw/mês. pois a média da amostra de 320 kw/mês não se encaixa no intervalo acima.2 = 341.8 kw/mês.8 kw/mês. a hipótese nula ( H 0 ) é igualmente rejeitada. teste-se a hipótese de o consumo médio de energia ser inferior a 350 kw/mês. Gilberto S. .95 e sendo o teste unilateral. como se depreende no gráfico adiante. • Estatística do teste: zo = -6 (a mesma do exemplo 1).64 50 100 Rejeita-se H 0 . Como este valor é superior ao de zo = -6. havendo indícios de que o consumo médio de energia na cidade é de fato inferior a 350 kw/mês (vide gráfico abaixo). 29/09/2006.58 Como na solução anterior. σ n = 350 − 1. Para um nível de confiança de 0. pega-se na tabela da distribuição normal o valor zc = -1. com nível de confiança de 95%: • Formulação: H 0 : μ = 350 kw/mês ∴ H 1 : μ < 350 kw/mês. rejeita-se H 0 .64. como ilustra o gráfico adiante: Prof. Gramacho. como segue: • Formulação: H 0 : μ = 350 kw/mês ∴ H 1 : μ < 350 kw/mês • Valor crítico de x : x c = μ o − z c x c = 350 − 8. Aceitar-se-ia H 0 para valores de x c > 341 . UEFS. pois a média amostral de 320 é menor que 341. Exemplo 2: Aproveitando os dados do exemplo anterior.

83. Teste-se.59 está compreendido entre ±1.47 Como dá para ver no gráfico acima.90 . a distribuição t substitui a normal Prof.00 ∴ H 1 ≠ 325 . 10.5 Teste para a média populacional µ – teste t de Student Quando o desvio padrão σ é desconhecido e o tamanho da amostra n é pequeno ( n < 30 ). intervalo que delimita a área de aceitação do teste. Gramacho.53 . . aceita-se H 0 com 90% de confiança. UEFS.00.59 .4500). 29/09/2006. na tabela da distribuição normal.4500 (0.00 44 . para o nível de confiança de 90%. Formulação: H 0 = 325 .90/2=0.64.64. se essa média atende a suposição de que o ganho médio geral da categoria é de R$ 325. ■ Solução: n = 36. 7.64 corresponde à probabilidade de 0. s = 44 .43 → z o = 0. que é o seu estimador na amostra.00 Estatística do teste: z o = x −μ s/ n = 329 .83 .43 − 325 .59 Quando o tamanho da amostra é n ≥ 30 e o desvio padrão populacional teste é expressa pela fórmula abaixo: zo = x −μ s/ n σ é desconhecido. denotando que a remuneração média mensal geral dos comerciários pode ser de cerca de R$ 325. mas n é proveniente de uma população normalmente distribuída. pois z o = 0. respectivamente. Os valores críticos de z são iguais a ±1.53 e R$ 44. x = 329 . 1 − α = 0. obteve-se média e desvio padrão de R$ 329.00. e a estatística do . este é trocado pelo desvio padrão amostral s. O valor de z c =1. Gilberto S. Exemplo 3: De uma amostra aleatória representando a remuneração mensal de 36 comerciários (salário e comissão) de uma cidade média.83 / 36 = 4. com 90% de confiança.

4 Formato de um teste t bicaudal para a média μ Neste caso. aceita-se H 0 . Em testes unilaterais toda a área de rejeição α se localiza numa das extremidades da curva (direita ou esquerda). Prof. com 1 − α de confiança. se to cair entre -tc e tc. por refletir a maior dispersão verificada sempre em distribuições de pequenas amostras. 29/09/2006.3). Isso acontece porque o desvio padrão da amostra (s) não é um bom estimador do desvio padrão da população ( σ ).3 – Decisão num teste t para a média populacional μ Tipo de teste Bicaudal Unicaudal à direita Unicaudal à esquerda Hipótese Nula H 0 : µ = µo H 0 : µ = µo H 0 : µ = µo Decisão Aceita-se Ho se -tc ≤ to ≤ tc se to < tc se to > -tc Alternativa H1 : µ ≠ µo H1 : µ > µo H1 : µ < µo Segue-se a representação gráfica da distribuição t para um teste bicaudal: Figura 10. b) Estatística do teste: t o = x −μ s/ n . Gilberto S. . como já detalhado no caso da distribuição normal (vide figuras 10. e daí a denominação de teste t para a média populacional.60 na realização do teste. UEFS. cujo resumo se encontra no quadro seguinte: Quadro 10. a) Formulação do teste Neste caso. a formalização e a decisão inerentes ao teste seguem o mesmo ritual dos casos anteriores.2 e 10. A distribuição t de Student é mais alongada nas extremidades do que a distribuição normal. Gramacho.

o teste poderá ser feito através da fórmula: xc = μo ± tc s n . que delimita a área de aceitação do teste. • Formulação: H 0 : μ = 500 gramas • Estatística para o teste: t o = x −μ s/ n ∴ H1 : μ ≠ 500 gramas. 1–α = 0. Sabe-se que a distribuição do peso líquido dos potes é quase normal.05) e n–1=11. 29/09/2006. Gilberto S. Prof. • Valores críticos da média: xc = μo ± tc s n = 500 ± 2. aceita-se H 0 com 95% de confiança. pode-se aceitar que a máquina está operando satisfatoriamente? ■ Solução: n = 12.61 Nesta fórmula s é o desvio padrão da amostra e to é chamado de t observado. o valor to = 0.95 (α = 0.4 . Exemplo: Uma máquina é regulada para envasar margarina em potes de 500 gramas.2010. havendo forte evidência de que a máquina fora regulada satisfatoriamente. Gramacho. Caso se opte pela fixação de limites críticos para a média amostral x . ainda. rejeita-se H 0 quando a média da amostra exceder aos valores críticos x c . que mede o desvio existente entre média amostral e média da população.5 − 500 10 / 12 → t o = 0. Ressalte-se. = 501. e equivale a 2.05 é encontrado na tabela da distribuição t de Student. UEFS. revelando peso líquido médio de 501. que o teste pode ser feito da seguinte maneira: • Formulação: H 0 : μ = 500 gramas ∴H1 : μ ≠ 500 gramas. Ao nível de confiança de 95%. x = 501 . Iniciada a produção. Então.5 gramas e desvio padrão de 10 gramas. s = 10 gramas.52 . Como se vê no gráfico acima. O valor de tc para 11 graus de liberdade e nível de significância de 0.5 . . foi recolhida uma amostra de 12 potes.2010.201 × 10 12 = 500 ± 6.52 está compreendido no intervalo ± 2. Neste sentido.

z o é o z observado.62 que resulta em 493 . com 95% de confiança.5 – Decisão num teste z para a proporção populacional p Tipo de teste Bicaudal Unicaudal à direita Unicaudal à esquerda Hipótese Nula Alternativa Decisão Aceita-se Ho se -zc ≤ zo ≤ zc se zo < zc se zo > -zc H 0 : p = po H 0 : p = po H 0 : p = po H1 : p ≠ po H1 : p > p 0 H 1 : p < po Os três tipos de testes anotados no quadro acima têm perfil gráfico igual aos do subitem 10.5 gramas se situa no intervalo acima.3). e q =1 − p é o complemento de p.4.6 Teste para a proporção populacional p a) Formulação do teste O modo de formalizar e decidir sobre os testes de hipótese para proporção segue o mesmo raciocínio até aqui desenvolvido. p é a proporção na amostra.1. 10. Pode-se admitir que a verdadeira proporção de peças defeituosas é realmente de 5%. Gilberto S. A inspeção feita numa amostra aleatória de 200 peças constatou uma proporção de 6% de defeituosas. zo = ˆ p −p pq n b) Estatística do teste: ˆ Como já esclarecido. Como a média x = 501 . quando se utilizou a distribuição normal para testar a média μ (vide figuras 10. p é a proporção hipotética na população. conforme resumo do quadro 18: Quadro 10.6 ≤ x c ≤ 506 . Exemplo 1: Um industrial considera satisfatório se a proporção de peças produzidas na sua indústria for da ordem de 5%. como admite o fabricante? Prof. . conforme se depreende também no gráfico a seguir: 10.4 gramas. UEFS. Gramacho. 29/09/2006. aceita-se H 0 com 95% de confiança.2 e 10.

pode-se aceitar a hipótese de que a real proporção de peças defeituosas é superior a 7%? • Formulação: H0 : p = 0.05. O valor de z crítico para 95% de confiança. 10. correspondem valores críticos de z nos valores de ±1.05 0. a veracidade da hipótese é confirmada pela estatística teste chamada de p–valor ou Prof.06 − 0.63 • Formulação: H0 : p = 0.93 200 → z o = −0. O esboço do teste se vê no gráfico abaixo: Aqui. ao nível de confiança adotado. que permite aceitar H 0 .95 200 → z o = 0. na tabela da normal. cujo desenho se observa no gráfico adiante.05 × 0. Significa que a verdadeira proporção de peças defeituosas não é superior a 7%. Para o grau de confiança de 95%.65 pertence ao intervalo ±1. pois -0. 29/09/2006. • Cálculo da estatística zo: zo = ˆ p −p pq n = 0.65 .96. aceita-se H 0 . pois 0. ao nível de 95% de confiança. num teste unilateral.07 0.07. Exemplo 2: Utilizando as mesmas informações do exemplo 1. UEFS.06 − 0. Gramacho. • Estatística do teste: zo = ˆ p −p pq n = 0.07 × 0. Gilberto S. que delimita a área de aceitação de H 0 . Portanto.7 O Teste do p–valor Nesse caso.64.05 contra H1 : p ≠ 0.64 .07 ∴ H1 : p > 0.55 < 1. é z c = 1.55 . há forte evidência de que a proporção equivalente a 5% de peças defeituosas é verdadeira. .96.

se a distribuição é distinta da normal. a exemplo da planilha Excel. n = 100.05 .64 valor–p. b) p − valor = P ( z ≥ z 0 ) . Julgando que atualmente consumo médio mensal seja de cerca de 350 kw/mês. UEFS. rejeita-se H 0 . Em testes com a distribuição normal o p–valor é calculado da seguinte maneira: • Para teste unicaudal: a) p − valor = P ( z ≤ z 0 ) . que é o nível de significância do teste ( p <α ). b) p − valor = 2P( z ≥ z 0 ) . Teste a hipótese de o consumo médio de energia ser de 350 kw/mês. quando x é maior que μ 0 . A dificuldade prática de se trabalhar com o p–valor. menor é a probabilidade de a hipótese nula ser verdadeira. como num teste de hipóteses tradicional. ou seja. O p–valor corresponde a um nível de significância observado. Hipótese nula: H 0 : μ = 350 kw/mês (teste bicaudal). donde α = 0. A rejeição da hipótese nula ( H 0 ) ocorre quando o p–valor do teste é menor que o valor escolhido de α . cuja variação histórica é de 50 kw/mês. 1 − α = 0. x = 320 kw/mês. quando x é menor que μ 0 (a média amostral é menor que o valor suposto para a média populacional). com 95% de confiança. ■ Solução: σ = 50 kw/mês. O teste do p–valor dá resultado igual ao do método tradicional. Destarte. Gilberto S. em que a comparação é feita com o nível de significância arbitrado α . quando o p–valor é menor que α . .95 . sem a necessidade de estabelecer hipótese alternativa nem valores críticos. quando x é maior que μ 0 . Deste modo. quanto menor é o p–valor encontrado. dentre outros. Exemplo: Voltemos ao caso do consumo domiciliar de energia em certa cidade. quando x é menor que μ 0 . se encontra praticamente superada em face dos aplicativos disponíveis em computador. • Para teste bicaudal: a) p − valor = 2P( z ≤ z 0 ) . coletou-se uma amostra aleatória junto a 100 consumidores. Gramacho. como acontece no processo tradicional. 29/09/2006. obtendo-se consumo médio de 320 kw/mês. Aí consiste a grande vantagem da técnica em comento. aceita-se a hipótese nula. E o resultado do teste é obtido por meio de comparação entre o p–valor e o nível de significância adotado. para obter o resultado do teste. do contrário. Prof. o seu resultado consiste em aceitar ou rejeitar a hipótese nula H 0 . Com esse teste chega-se à mesma coisa de maneira diferente.

A própria atividade humana em toda a sua plenitude é um corpo complexo de fatos e ações entrelaçados entre si. implementação e avaliação de ações políticas.4999 ) → p − valor = 0. a exemplo de: consumo e renda. dentre inúmeras outras relações importantes. que facilitam a tomada de decisões. preço e demanda de um produto. que quanto menor é o valor numérico do p–valor maior é a evidência contra a aceitação de H 0 . e pesquisadas as correlações e relações funcionais existentes. Como 0. intensidade de chuvas e volume de safras agrícolas. por fim. Nota-se que a mesma conclusão foi conseguida pelo critério tradicional. Assim. UEFS. 29/09/2006.0002<0. Vale relembrar. renda. o planejamento utiliza-se de técnicas de tratamento e análise de dados. peso e altura de um grupo de pessoas. custo total e quantidade de insumos necessários para produzir um bem. Sem isso é absolutamente impossível pensar-se em planejamento público ou privado. Gramacho.0002 . compreendidas e controladas. a fim de avaliar e controlar efeitos decorrentes de variáveis que interagem entre si.65 • Cálculo da estatística zo: z o = x −μ σ/ n = 320 − 350 50/ 100 → z o = −6 (como visto antes). para z o = -6 e z c = ±1. Neste contexto. que precisam ser analisadas. que produz uma grande diversidade de relações de causa e efeito. rejeita-se H 0 . taxa de juros e níveis de investimento e emprego. Gilberto S. mensurando o seu impacto sobre setores de educação. bem estar social e comércio de uma ampla e variada gama de bens e serviços que a sociedade moderna exige. saúde. não havendo evidência estatística de que o consumo médio de energia na cidade seja de 350 kw/mês. .96 . • Cálculo do p–valor para teste bicaudal: p − valor = 2P( z ≤ −6) = 2(0.5 − 0. 11 CORRELAÇÃO E REGRESSÃO SIMPLES No mundo real é fácil de encontrar relações de interdependência entre duas ou mais variáveis aleatórias. emprego. constantemente são estabelecidos cruzamentos de informações. gasto com propaganda e volume de vendas.05 ( p − valor <α ). Prof. uma vez que fornecem subsídios indispensáveis à formulação.

. E a análise de regressão é utilizada para estudar esse mesmo relacionamento mediante o ajustamento de uma curva ou função matemática adequadamente escolhida. a correlação é perfeita. Assim. 11. Quando todos os pontos observados coincidem com a linha reta. respectivamente. o coeficiente r é um estimador de ρ na amostra. polinomial. a depender da variação do sinal. positiva ou negativa. exponencial. 29/09/2006. a tendência dos dados é facilmente identificada por meio do gráfico conhecido como diagrama de dispersão. a aderência da função aos dados é avaliada por estatísticas que permitem testar a eficiência do ajustamento da função aos valores da amostra que representa a relação. Gilberto S. Quando a relação é entre duas variáveis. Se r é positivo há relação direta entre as variáveis. se a relação envolver mais de duas variáveis. ou seja. que varia no intervalo de -1 a 1 ( − 1 ≤ r ≤ 1 ). se é negativo há relação inversa entre as variáveis. testes de significância. que pode ser de natureza linear. etc. através de um índice conhecido como coeficiente de correlação. de Prof. A vantagem do coeficiente de correlação é que não é afetado pela medida das variáveis envolvidas na relação.66 A dependência funcional entre variáveis aleatórias é estudada por meio de duas técnicas mutuamente relacionadas chamadas de correlação e de regressão. em que os pares de valores x i e y i são representados no plano. pois o seu valor é um número adimensional. denotando que a variação numa delas causa efeito contrário em outra. Um problema crucial nessa área de estudo é o da identificação da relação funcional que descreve o comportamento dos dados empíricos. etc).1 Correlação linear simples Serve para avaliar o grau de relação linear entre duas variáveis. A análise de correlação é utilizada para avaliar o grau de relacionamento entre duas ou mais variáveis. A determinação de uma função que se ajusta a um conjunto de pontos do plano é chamada técnica de ajustamento. UEFS. de fácil interpretação. Gramacho. possibilitando definir a função que se ajusta à relação. tal que r = 1 ou r = -1. ou seja. definir a tendência dos valores observados. É um procedimento mais científico que utiliza inferência estatística (análise de variância. Não há correlação linear quando o coeficiente r é igual a zero. o coeficiente de correlação e o coeficiente de determinação são indicadores eficientes da qualidade do ajustamento. pela dificuldade de representação no plano. Porém. Na população esse coeficiente é representado pela letra grega ρ (rô) e na amostra pelo letra latina r (erre). Neste caso. O sinal de r indica o sentido da correlação.

selecionando amostras que proporcionem coeficientes o mais próximo possível de ±1 . Figura 11. b) se 0. e var(y) é a variância da variável aleatória y. a relação entre as variáveis é forte. A fórmula básica para estimar o coeficiente de correlação linear entre X e Y é: r= cov( x . y) var( x ). como ilustram os gráficos a seguir.30 a correlação é muito fraca ou desprezível.30 < | r | ≤ 0. 29/09/2006. isto é. var(x) é a variância da variável aleatória x. Exemplo: Um órgão de pesquisa coletou os seguintes dados sobre consumo e renda de uma região (em bilhões de unidades monetárias constantes). var( y) → r= ∑( x − x )( y − y) ∑( x − x ) 2 ∑( y − y) 2 O símbolo cov(x.60 < | r | ≤ 0. pois varia de autor para autor. a fim de avaliar a correlação linear entre tais Prof.67 forma que a variação de uma provoca efeito no mesmo sentido em outra. Gramacho. y) significa covariância entre as variáveis aleatórias x e y. entre elas. . Alguns autores costumam estabelecer intervalos a fim de facilitar a interpretação do coeficiente de correlação.99 a correlação é significativa. Mas essa regra não é rígida. UEFS. pelo que praticamente nada se pode concluir sobre a relação. isto é. Gilberto S.60 a correlação é relativamente fraca. c) se 0.1 Na prática procura-se maximizar o valor do coeficiente de correlação. a relação entre as variáveis não é muito expressiva. eis um dos exemplos abaixo: a) se 0 < | r | ≤ 0.

1 .21 65. como a que se apresenta a seguir: r= ∑xy − ∑x ∑y / n [ ∑x 2 − ( ∑x ) 2 / n ][ ∑y 2 − ( ∑y) 2 / n ] Então.Amostra sobre Consumo e Renda Anual .0 (y – 3)² 0.0 0.30 0.2 4.25 0.8 -0.9 28.1 2.7 4.86 15.5 0.1 2.99 12.9 0.81 2.9 0.Correlação linear simples pelo método dos desvios em torno da média Ano 1999 2000 2001 2002 2003 2004 2005 Total Renda (x) Consumo (y) 3.9 21.25 13.2437 O valor de r indica que existe uma forte relação linear entre o consumo e a renda.64 20.5 3.41 5. desenvolvidas a partir da fórmula original vista acima.42 (x – 4)(y – 3) 0.08 y² 4.08 y–3 -0.0 2. 29/09/2006.23 x² 10.72 0.0336 = 2.61 10.89 12.1 3.5 3.2 3.5 0.4 2.4 2.9 21.09 0. Existem outras fórmulas mais simples de operar.23 5.2 – Cálculo do coeficiente de correlação linear pelo método direto Ano 1999 2000 2001 2002 2003 2004 2005 Total Renda (x) Consumo (y) 3.06 0.6 -0. sem precisar calcular os desvios de cada valor da variável em torno da sua média.5 3.0 x–4 -0.0 (x – 4)² 0.23 28 21 =4 e y = = 3 .25 24.08 )( 2.5 4.09 0.81 0.81 2.3 0.01 0.2 4. Gramacho. .3 3.7 3.23 ( 2.23 →r = 0.36 0.29 9.9 -0.01 114.5 3.40 13. é obtido a partir dos somatórios elaborados no quadro adiante: Quadro 11.40 9. segue-se o valor do coeficiente de correlação referente ao caso em estudo: Cálculo das médias: x = 2.7 3.11 86.04 0.1 0. de modo direto.25 0. o mesmo valor da estimativa de r para a relação entre o consumo e a renda.0 4.42 Prof.00 0.76 7.25 15.0 4.42 ) r= = 2.72 8.09 0.2 3.68 variáveis.5 -0.3 0.0 2. Gilberto S.2 0.0 xy 6.00 0.9 28.09 0.69 16.7 4.00 17.75 19. com base nas somas obtidas no 7 7 quadro acima.25 0. UEFS.5 4.1 3.64 0.3 3.3 0.25 0.24 12. conforme quadro a seguir: Quadro 11. Então.81 2.994 2.

Esta equação é uma estimativa do modelo teórico acima.69 r= ∑ xy − ∑ x ∑ y / n [ ∑ x 2 − (∑ x ) 2 / n ][ ∑ y 2 − (∑ y) 2 / n ] = 86 .2 Regressão linear simples Supõe-se que o relacionamento entre duas variáveis segue uma tendência linear.23 − 28 × 21 / 7 [114 . 11. UEFS. os α e β são parâmetros relativos uma característica da população. . Gramacho. pois a relação entre as mesmas pode ser decorrente de mera casualidade . Gilberto S. 29/09/2006. formando cada par de valores x i e yi um ponto no plano. em que os valores de Y figuram em ordenada e os de X em abscissa. A equação da reta indica que se há regressão linear de y sobre x. Eis que na equação acima: coeficientes Y é a variável dependente. Se a relação é proveniente de uma amostra. que pode ser estudada através do modelo y = α + βx + ε .e não de causalidade. um jeito prático de identificar a tendência de uma relação é através do diagrama de dispersão.994 Cabe advertir que um índice de correlação elevado não implica necessariamente em relação de dependência entre duas variáveis.42 − 212 / 7] = 0. X é a variável independente. O diagrama a seguir mostra uma situação em que a nuvem de pontos. apesar dos afastamentos. Se a amostra for grande é possível verificar se a equação da reta é a melhor opção de ajustamento à nuvem de pontos distribuídos no plano. Como já dito. em que os coeficientes “a” e “b” são estimadores dos parâmetros α e β . a regressão é ˆ representada pela equação da reta y =a + bx . as variações absolutas em x provocam variações absolutas em y.08 − 28 2 / 7][ 65 . como é mais freqüente. para a população como um todo. e o símbolo ε éo erro aleatório – aquele que não é explicado pelo modelo adotado para estudar a relação entre X e Y. segue uma tendência linear: Prof.

2 11. ( Em segundo. troca-se y por a + bx na expressão Σ ( y −y) 2 . mediante minimização da soma ˆ dos quadrados dos desvios entre valores observados (y) e valores estimados pela reta ( y ). por ˆ ˆ ( meio da equação ∑ε 2 = ∑ y − y) 2 . observando as propriedades dos somatórios e arrumando os termos. . onde a diferença ε = y − y simboliza o erro aleatório (não explicado pela regressão). 29/09/2006. Gilberto S. UEFS. conforme instruções abaixo: ˆ ˆ Em primeiro lugar. igualando-se as derivadas parciais a zero. A minimização de Σ 2 gera um sistema de equações normais para calcular os coeficientes ε ˆ da reta y =a +bx .2( Σy − na − bΣx ) ∂a ∂Σε 2 = 2Σ( y − a − bx )( −x ) = −2( Σxy − aΣx − bΣx 2 ) ∂b Em terceiro.2. pois a segunda derivada do quadrado do erro é também positiva: − 2( Σy − na − bΣx ) = 0 → Σy = na + bΣx 2 (i) − 2( Σxy − aΣx − bΣx 2 ) = 0 →Σxy = aΣx + bΣx 2 (ii) Este sistema tem a seguinte solução para os coeficientes a e b: a= Σy Σx −b e n n b= ∑ xy − ∑ x ∑ y / n ∑ x 2 − (∑ x ) 2 / n Prof. tal que: ∑ε 2 = ∑ y −a −bx ) 2 . Gramacho.1 O Método de mínimos quadrados É um método utilizado para estimar os coeficientes da reta. chega-se ao sistema de equações normais que minimiza ε 2 . deriva-se parcialmente ε 2 em relação aos coeficientes "a" e "b": ∂Σε 2 = 2Σ( y − a − bx )( −1) = .70 Figura 11.

07 2 114. cujo coeficiente de correlação igual a 0. indicando que o ajustamento da reta equação da reta do seguinte modo: b= ∑ xy − ∑ x ∑ y / n ∑ x 2 − (∑ x ) 2 / n ˆ y = a + bx amolda-se bem à série histórica.07 bilhões.07 bilhão de unidades monetárias. UEFS.08 114.2.112 2.23 − 84 2.28 +1.28 n n 7 7 a= ˆ 1 7 Afinal. 29/09/2006. Caso as autoridades projetassem um nível de renda anual de cinco bilhões de unidades monetárias para a região em 2006.0 x . a estimativa do consumo no referido ano seria: ˆ ˆ y 2006 = −1.(28) / 7 21 28 Σy Σx −b →a = −1. com base nos somatórios elaborados no quadro seguinte: Quadro 11.2 Consumo (y) 2. o consumo (y) sofre um acréscimo médio de 1. Gilberto S. A equação estimada sugere que quando a renda (x) aumenta de um bilhão de unidades monetárias.23 − 28 × 21 / 7 86 .28 + 1. Os somatórios apurados naquele quadro permitem determinar os valores dos coeficientes da → b= 86. constante do quadro 11. os coeficientes da reta de regressão vão ser estimados através do sistema reduzido (centrado na média).23 = = → b = 1. Como o somatório dos desvios em torno da média é igual a zero.994 sugere uma forte relação linear entre essas duas variáveis.1.64 Prof. Σx c = Σ ( x − x ) = 0 .8 2 xc xcy -1.1 xc = x − 4 -0.07 × 5 → y 2006 = 4. Gramacho. o sistema de equações é simplificado para: Σy = na → a = Σy →a = y n (i) (ii) 2 Σx c y = bΣx c → b = ∑x c y 2 ∑x c Agora.3 – Amostra sobre Consumo e Renda Anual – Regressão linear simples – Sistema reduzido Ano 1999 Renda (x) 3.68 0.71 Exemplo: Seja a relação entre consumo e renda. . O sistema de equações normais pode ser reduzido mediante a transformação x c = x − x .08 .08 . a reta de regressão do consumo sobre a renda é y =− .07 × → a = −1.

basta apenas trocar x c por x − 4 na equação de y. Para recuperar os ˆ valores originais de X. Exemplo: Eis o cálculo de r2 para a relação consumo e renda. o poder de X explicação é de 100%.4 2. O coeficiente r 2 varia entre 0 e 1.5 4.25 0.0 -0.09 0. o modelo de regressão nada explica sobre a relação entre as variáveis X e Y. que vale para qualquer tipo VT ∑( y − y) 2 ajustamento.0 0.9 28.66 1. indicando que há um relacionamento perfeito entre diminui à medida que o seu valor se afasta da unidade.9 21.2. inclusive de funções não lineares.07 ( x − 4) = 3 +1. tal que todos os valores observados estão sobre a reta ou curva.81 2. 29/09/2006.00 0.25 0. e Y.33 a= Σy 21 = →a =3 n 7 b= ∑ xcy 2 ∑ xc = 2. ou seja.9 0.5 3.28 +1. 0 ≤ r 2 ≤ 1 .04 0. como segue: ˆ ˆ y = 3 +1.3 0.2 4. É também conhecido como coeficiente de determinação e é simbolizado por r 2 .00 0.07 2. UEFS.7 3. na qual a relação entre a variação residual (VR) e a total (VT) é subtraída da unidade. a equação da reta centrada na média de ˆ é y = 3 +1.20 -0.28 →y = − .08 -1.07 x c .2 0.1 3.5 -0.75 3. Se r 2 = 1 .72 2000 2001 2002 2003 2004 2005 Total 3. com base nas somas do Prof.0 2. através do modelo de regressão.23 → b = 1. Gramacho.51 2.2 Coeficiente de explicação É uma medida da qualidade do ajustamento da função aos dados. O poder de explicação de r 2 Calcula-se r 2 através da relação entre a variação explicada (VE) e a variação total (VT).07 x − 4.7 4.5 0. Gilberto S.81 0.5 3.0 4. como ilustram as fórmulas seguintes: r2 = ˆ VE ∑( y − y) 2 = VT ∑( y − y) 2 2 ou r = 1 − ˆ VR ∑( y − y) 2 =1 − .3 3. 1 11. Se r 2 = 0 .0 0. . ou ainda por intermédio da relação complementar.08 X Assim. Representa a variação total da variável y (dependente) que é explicada pela variável x (dependente).07 x .

02 0.0289 r 2 =1 − ˆ ∑( y − y) 2 ∑( y − y) 2 =1 − 0.0289 = 1 − 0.Cálculo do coeficiente de explicação Ano 1993 1994 1995 1996 1997 1998 1999 Total Renda (x) 3.03 0.01 0. As áreas para os valores negativos de z são conseguidas por simetria.Consumo e Renda Anual .00 0.7 3. 29/09/2006.9 -0.0100 0. UEFS. Gramacho.3 0.7 4.4 2. senão vejamos: r = 0. ou vice-versa.36 0. a área sob a curva entre z = 0 e z = 1 corresponde a 0.68 3.81 0. .0016 0.6 -0.09 0.09 0.9 8 =0.y )2 0.06 0.2 4.06 0.96 21.04 0. que é o mesmo valor da área compreendida entre z = 0 e z = -1.5 0.81 2.9 28.42 ˆ y 2.8% da variação do consumo é explicada pela variação da renda.0081 0.1 2.73 quadro abaixo.04 ˆ (y . ou seja.0004 0.9 (y-3)² 0.4 .0 4.9 4 . Quadro 11.46 2.y ) -0.0 Consumo (y) 2.988 2. a regressão linear tem um alto poder de explicação sobre a variação da relação consumo/renda.0036 0.05 0. z 0.0016 -0.06 0. Vale ressaltar que a raiz quadrada de r 2 é uma estimativa do coeficiente de correlação r.0 y.10 0.5 4.2 3.01 0.02 0.3413. Gilberto S.07 0.1 3.42 O resultado acima informa que 98.04 -0. Por exemplo.00 3.14 2.5 3.00 ˆ (y .54 3.08 0.3 3.09 -0.09 Prof.1 0.25 0.21 3.3 0. 9 9 ANEXOS Tabela I – Distribuição normal padronizada O valor de cada casa da tabela indica a proporção da área total sob a curva normal entre z = 0 e um valor positivo de z.0036 0.3 -0.5 3.0119 → r 2 = 0.9 21.

4981 0.4990 0.4332 0.1293 0.9 1.4922 0.4993 0.4964 0.0359 0.4965 0.4582 0.4988 0.4981 0.2 0.1844 0.1 0.4115 0.4394 0.0 2.4995 0.4961 0.4868 0.0080 0.1443 0.1 2.01 63.4495 0.2967 0.4887 0.4951 0.3907 0.4986 0.1700 0.4927 0.4987 0.4082 0.4131 0.4991 0.0714 0.2580 0.4854 0.0398 0.4993 0.4998 Tabela II – Distribuição t de Student Nível de significância (α ) para teste bilateral em face do número de graus de liberdade (ν = n -1).4991 0.4959 0.4991 0.4996 0.4948 0.4996 0.4941 0.0 0.4978 0.6 2.8856 0.0478 0.1554 0.4049 0.4918 0.2881 0.3810 0.4997 0.4732 0.9 2.7 2.2486 0.4706 0.4798 0.0636 0.4997 0.1331 0.3 1.4857 0.4995 0.4726 0.4463 0.4406 0.3438 0.8 0.4147 0.4973 0.3686 0.4997 0.2224 0.4995 0.0910 0.4989 0.4664 0.4977 0.4864 0.4875 0.4808 0.4996 0.3413 0.4525 0.4985 0.4960 0.2257 0.3133 0.0557 0.1217 0.4993 0.4974 0.4986 0.4878 0.4177 0.4744 0.4967 0. ν α 1 2 0.4979 0.4932 0.3238 0.2517 0.3888 0. Gilberto S.4963 0.4997 0.9248 Prof.4474 0.0832 0.4929 0.4968 0.4994 0.1985 0.5 2.4767 0.4997 0.3849 0.4641 0.1103 0.4955 0.1591 0.3997 0.0777 1.2324 0.6036 0.4838 0.0 3.1517 0.4976 0.2 2.4686 0.4812 0.1879 0.7 0.4756 0.3212 0.3340 0.2088 0. UEFS.4719 0.2157 0.4996 0.4980 0.657 9.3599 0.2764 0.4936 0.4940 0.4984 0.4957 0.4962 0.1772 0.4985 0.4993 0.4952 0.2995 0.3078 0.2611 0.4861 0.4992 0.2673 0.4554 0.0517 0.3944 0.4441 0.4192 0.1736 0.7 1.4990 0.6 0.2422 0.1179 0.8 1.3106 0.4971 0.4678 0.2454 0.4834 0.4265 0.2642 0.4890 0.2019 0.4345 0.4793 0.4484 0.4292 0.4142 1.3554 0.4898 0.4949 0.4608 0.4974 0.4788 0.1664 0.4 1.3365 0.3980 0.4699 0.3264 0.4931 0.10 6.2734 0.4625 0.4633 0. 29/09/2006.4162 0.2054 0.25 2.0 1.0793 0.4997 0.4850 0.4846 0.4996 0.4778 0.4975 0.1808 0.1064 0.4977 0.4994 0.4983 0.0987 0.0319 0.4984 0.2939 0.4 0.05 12.4901 0.3869 0.74 0.4616 0.4916 0.3577 0.4649 0.2190 0.4207 0.4772 0.4997 0.4925 0.4997 0.20 3.4884 0.4992 0.0120 0.4997 0.4871 0.0871 0.4945 0.4591 0.0040 0.4934 0.0675 0.4821 0.9200 0.4953 0.1026 0.4966 0.3289 0.4370 0.3051 0.4994 0.4987 0.4573 0.4251 0.4995 0.4991 0.4987 0.4222 0.3 3.1480 0.4938 0.1 3.2389 0.4032 0.3461 0.3621 0.3531 0.4671 0.2852 0.4564 0.0239 0.4306 0. Gramacho.5 1.4693 0.0160 0.3729 0.4943 0.5 0.4906 0.3 0.4656 0.1406 0.4452 0.4982 0.4783 0.4972 0.3665 0.3790 0.2910 0.2 3.1368 0.1 1.4970 0.4738 0.4505 0.2053 0.3315 0.3127 0.0438 0.0753 0.3770 0.4946 0.4830 0.3138 2.9 3.4599 0.2549 0.3749 0.4842 0.4911 0.3023 0.4817 0.1255 0.025 35.3389 0.4994 0.4913 0.706 4.1141 0.4 0.4881 0.4904 0.4969 0.3962 0.3 2.3830 0.2291 0.4803 0.4099 0.0279 0. .4015 0.3708 0.2 1.4989 0.4357 0.3925 0.1628 0.4909 0.4 2.0596 0.4995 0.4996 0.4826 0.4418 0.4988 0.3186 0.4515 0.4920 0.0948 0.1950 0.4893 0.1915 0.4545 0.8 2.2703 0.4990 0.3508 0.4992 0.4896 0.4066 0.2357 0.4382 0.4750 0.4279 0.2794 0.4761 0.4994 0.4989 0.3159 0.6 1.0199 0.3643 0.4429 0.4997 0.2123 0.4535 0.4979 0.4319 0.4956 0.0000 0.542 6.3485 0.4982 0.4236 0.4995 0.4713 0.2823 0.

3638 2.2699 2.4149 1.1673 1.3178 1.1788 2.7515 2.2001 1.75 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 +∞ 1.0423 2.7081 1.4055 2.1777 1.0211 2.1503 1.2820 2.1825 2.0739 2.7247 1.1199 2.2958 1.7959 1.0123 2.1559 1.1731 1.3444 1.2622 2.6338 2.4995 3.7033 1. .1693 3.7764 2.6707 1.6850 2.7500 2.0484 2.3104 1.6577 1. UEFS.5332 1.4899 2.1831 1.6603 2.3212 1.7633 2.1802 1.7874 2.3163 1.6377 1.2281 2.1757 1. 29/09/2006.0687 2.5326 2.7709 1.0639 2.5758 Prof.8073 2.8188 2.8453 2.3596 2.0321 3.7291 1.1009 2.7564 2.3685 2.3195 1.7056 1.3232 1.3406 1.1848 1.9208 2.2213 1.1910 1.1789 1.7969 2.9768 2.7139 1.7787 2.9600 4.3788 2.3534 2.8609 2.1748 1.7613 1.6041 4.0595 2.7045 2.7011 1.8314 2.1098 2.9799 1.3734 2.8784 2.3114 1.2089 1.3009 1.1765 3.0518 2.9432 1.3846 2.4581 2.7396 1.0860 2.3334 1.8125 1.3450 1.9545 3.1766 1.0452 2.6991 1.4729 2.7530 1.2010 2.3910 2.4954 3.1058 3.5096 2.4759 1.1616 1.1866 1.7171 1.0796 2.3562 1.6839 1.7707 2.3304 1.3253 1.7459 1.8595 1.2145 1.4231 2.3150 1.3554 3. Gramacho.1634 2.1887 1.6973 1.2041 1.3979 2.1739 1.3646 2.7074 3.5931 2.3117 1.3368 1.3289 2.2991 2.7341 1.8982 2.1315 2.3060 2.8331 1.2414 5.0003 1.3722 1.2733 1.7109 1.3968 1.2403 1.0930 2.2498 3.6449 3.1318 2.4138 2.6174 2.7823 1.5706 2.4398 1.0150 1.3287 1.2890 1.3830 1.4226 1.9687 2.8412 2.8946 1.8409 4.3502 1.3634 1.2543 1.1967 1.5600 2.1937 1.4334 2.1604 2. Gilberto S.3125 1.3031 1.2297 1.0555 2.1816 1.9467 2.4450 2.7207 1.4469 2.1448 2.

You're Reading a Free Preview

Descarregar
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->