Você está na página 1de 41

Probabilidade

1-Espao amostral

O conjunto de todos os possveis resultados de um experimento o espao amostral . Onde n() o nmero de elementos do conjunto , ou o nmero de resultados possveis. = {w1, w2,, w3, .....wn} w = so os pontos amostrais. O espao amostral referente a um lanamento de um dado : = {1, 2, 3, 4, 5, 6} O espao amostral referente a um lanamento de uma moeda : = {cara, coroa} 2- Eventos Chama-se de evento qualquer subconjunto do espao amostral de um experimento aleatrio, ou seja, qualquer resultado do espao amostral. n(E) o nmero de resultados associados ao evento E. Exemplo: No lanamento de uma moeda ={cara, coroa}. Um evento de interesse E pode ser obter cara no lanamento de uma moeda e n(E)=1. possvel encontrar a probabilidade P(E) de qualquer subconjunto E de (do espao amostral). A probabilidade de E, anotada por P(E), l-se p de E, definida como sendo: P(E) = m / n. Isto , a probabilidade do evento A o quociente entre o nmero m de casos favorveis e o nmero n de casos possveis. Probabilidade de um evento: Seja E um evento. A probabilidade deste evento ocorrer dada por P(E), que um nmero entre 0 e 1. Quanto mais prxima a probabilidade estiver de 1, maior ser sua chance de ocorrncia. A um evento impossvel atribui-se probabilidade 0, enquanto que um evento certo tem probabilidade 1. A probabilidade de um evento medida por valores entre 0 e 1.Logo, 0 P(E) 1. mais provvel que um evento ocorra se sua probabilidade estiver prxima a 1. A probabilidade do evento certo de ocorrer 1 e a probabilidade do evento impossvel zero. P(EVENTO CERTO) =1, ou seja, P() =1 P(EVENTO IMPOSSVEL)= 0 , ou seja, para o conjunto vazio - P() = 0
A soma entendida a todos os pontos amostrais wi que pertencem a E.

Se E for qualquer evento de ento: P(E) = P(wi) i

Ex. Uma moeda jogada 2 vezes. Se c indica cara e r coroa ento O espao amostral : = { w1, w2,, w3, w4} onde w1 = (c,c) ; w2 = (c,r); w3 = (r,c); w4 = (r,r) Cada ponto wi = tem a probabilidade de ocorrer. Se as faces so iguais nos 2 lanamentos tem-se: P(E)= P (w1, w4) = +1/4 =
1

H trs maneiras diferentes de calcular ou estimar probabilidades: 1) o mtodo clssico, envolve a determinao da probabilidade de qualquer evento a priori (antes de ocorrer). Est associada a jogos de azar ou s chances de um jogo. Definio: P(E) = Nmero de maneiras que o evento pode ocorrer Nmero total de resultados possveis Ex. Qual a probabilidade de se retirar um s de um baralho. P(s) = Nmero de maneiras que o evento pode ocorrer = 4/52 Nmero total de resultados possveis 2) o mtodo subjetivo, que utiliza estimativas pessoais de probabilidade, baseadas num certo grau de crena. Ex; A probabilidade que uma mulher brasileira v ao espao num foguete, um exemplo. Como no h dados do passado devemos avaliar as nossas opinies e crenas para obter uma estimativa subjetiva. 3) o mtodo emprico ou freqncia relativa, que observa a freqncia com que algum evento ocorreu no passado e estima a probabilidade dele novamente ocorrer, fundamentada nos dados histricos. Definio: P(E) = Nmero de vezes que o evento ocorreu Nmero total de observaes Exemplo: No ltimo ms ocorreu 50 nascimentos no hospital do bairro em que mora. Trinta e dois bebs recm nascidos eram meninas. A probabilidade de que um prximo nascimento (ou qualquer nascimento escolhido aleatoriamente) seja menina ? Definio: P(meninas) = Nmero de meninas nascidas no ltimo ms Nmero total de nascimentos no ltimo ms 3- Clculo das probabilidades Muitas aplicaes da estatstica exigem a determinao da probabilidade de combinaes dos eventos. Pode ser necessrio determinar a probabilidade de ambos os eventos acontecerem P(A e B), a interseo, ou a probabilidade de um deles, A ou B, ou seja, P(A ou B), ou a unio. A interseo de A e B o conjunto de todos os elementos que esto em ambos os conjuntos A e B. O diagrama de Venn uma ferramenta til para representar a relao entre dois conjuntos. = 32/50

(A B) = A interseo B
2

Para A B ocorrer, ambos A e B devem ocorrer. Os eventos A e B so chamados associados. A unio de A e B, ou seja, A U B consiste dos elementos que esto em A ou B ou em ambos. Unio de A e B o conjunto de todos os elementos que esto em A ou em B. A regra da adio leva em conta a ocorrncia do evento A ou do evento B ou de ambos os eventos e denotada por P(AB).

P(A ou B) = P(A) + P(B) P(A e B) Dois eventos so ditos mutuamente exclusivos (excludentes) se a ocorrncia de um evento probe a ocorrncia do outro. Ex. A ocorrncia de cara e coroa em um nico lanamento de moeda. Se cara ocorre, coroa no pode ocorrer. Quando os eventos so mutuamente excludentes (no tem elementos em comum), ento a probabilidade de ambos nula e o termo P(A e B) ser zero. Ento, A B = e P (A B) = 0 Se A e B so mutuamente excludentes -------- P(A ou B) = P(A) + P(B)

Eventos Complementar So aqueles que se um no ocorrer o outro deve ocorrer certamente. EX. Se o evento A sair a face par no lanamento de um dado (2, 4 ou 6), o complementar sair a face mpar ( 1, 3 ou 5). O complementar escrito como ou AC. claro que eventos complementares formam uma coleo completa porque se A no ocorre, precisa ocorrer. Ento tem-se: P(A) + P () = 1 e P(A) = 1- p() -A=
3

Eis as seguintes operaes com conjuntos: a) (A B)C = AC U BC b) (A U B)C = AC BC c) (A ) = e A = A d) C = ; C = e) A AC= f) A U AC = g) A U = A ; A U = h) A (B U C) = (A B) U (A C) Exemplo: Em um experimento aleatrio os eventos A e B associados tais que: P(A) = 1/2 e a P(B)= 1/3 e P(A B) = 1/4 .Calcule: a) P(AC) = 1 P(A) = 1 1/2 = 1/2 b) P(A U B) = P(A) + P(B) - P(A B) = 1/2 + 1/3 1/4 = 7/12 c) P(AC BC) = P [(A U B)C] = 1- P (A U B) = 1 7/12 = 5/12 d) P(AC U BC) = P [(A B)C] = 1- P (A B) = 1 1/4 = e) P(AC B) = a probabilidade que ocorra em B, mas no ocorra em A. Podemos escrever: B= (A B) U (AC B) P(B) = P(A B) + P(AC B) Decorre: P(AC B) = P(B) - P(A B) = 1/3 1/4 = 1/12 Ou: P(AC B) = P(B - A) = P(B) - P(A B) = 1/12 f) P(AC U B) = P(AC) + P(B) - P(AC B) = 1/2 + 1/3 1/12 = .. Probabilidade Condicional - Regra da multiplicao Freqentemente queremos determinar a probabilidade de um evento sabendo-se, ou sobre a condio, de que outro evento ocorreu. Isso chamada probabilidade condicional e denominada de P(A|B) lido com a probabilidade de A dado B. A probabilidade condicional a probabilidade de que o evento A ocorra dado, ou sob a condio de que o evento B j tenha ocorrido. Assim, para dois eventos quaisquer A e B sendo P(B) > 0 definimos a probabilidade condicional de A e B, como sendo: P(A|B) = P(A B) P(B) = P (A) . P(B|A) P(B)

Considerando-se dois eventos A e B de um mesmo espao amostral, a probabilidade de A e B ocorrerem P(AB) dada por:

Quando a probabilidade de B ocorrer no depender de A ter ocorrido, dizemos que A e B so independentes, e P(B|A)=P(B) ou P(A) = P (A|B). Se A e B so independentes ---------- P(A B)=P(A) . P(B) probabilidade de eventos independentes. Se os eventos so dependentes, ento por definio precisaremos considerar o primeiro evento para determinar a probabilidade do segundo; isto , a probabilidade do evento B depende da condio de A j ter ocorrido. Logo, o princpio da probabilidade condicional de v ser usado. A probabilidade conjunta dos eventos A e B : P(A B) = P(A) . P(B|A) Onde P(B|A) a probabilidade de B ocorrer dado que A j tenha ocorrido. RESUMO; 1- A regra da multiplicao usada para calcular a probabilidade de A e B, P (A B), e a regra da adio usada para calcular a probabilidade de A ou B, P (A U B). 2 - Regras de probabilidade P(A ou B), Para eventos no mutuamente excludentes: P(A ou B ou ambos) = P(A) + P(B) P(A e B) Para eventos mutuamente excludentes: P(A ou B) = P(A) + P(B) P(A e B), para eventos independentes: P(A e B) = P(A) . P(B) Para eventos dependentes P(A e B) = P(B).P(A/B) ou P(A).P(B/A) Teorema de Bayes Definio: Seja um espao amostral e A1 , A2 , ..., Ak , eventos. Diz-se que A1 , A2 , ..., Ak formam uma partio de se: Ai , onde i= 1, 2, ..., k k

U=
i

Ai AJ = ij

Diagrama representativo do Teorema de Bayes

A1 A2

A4

A3

A5

AK

A1 , A2 , A3 , ...........Ak , onde formam uma partio de . Seja B um evento qualquer de , onde: B = (B A1 ) U (B A2 ) U ...U (B AK) k P(B) = P(AJ) J=1

. P(B/AJ)

onde j= 1,2,3,....k

(eq. 1)

P(B Ai) = P(Ai) . P(B/Ai)


Como:

onde i = 1, 2, ..., k

(eq. 2)

P(Ai/B) = P(B Ai) / P(B)

(EQ.3)

substituindo as equaes (1) e (2) na equao (3) temos: k

P(Ai/B) = [P(Ai) . P(B/Ai)] / P(AJ) . P(B/AJ)


J=1 Exemplo:

onde j= 1,2,3...k

Suponha que uma pea escolhida aleatoriamente, onde existem duas mquinas com as mesmas caractersticas. A probabilidade de ser produzida pela mquina A P(A) = 0,60 e de ser da mquina B P(B)= 0,40. A qualidade dos produtos de no terem defeitos que vem da mquina A a probabilidade condicional P(DC/A) = 0,98, logo a probabilidade de ter uma pea com defeito P(D/A)=0,02. As probabilidades condicionais para B revelam que a probabilidade de no ser defeituosa dado que a pea veio da mquina B P(DC/B)=0,96, logo a probabilidade de ser defeituosa dado que veio de B P(D/B)= 0,04.
6

Diagrama de rvore: O primeiro ramo indica qual mquina produziu a pea. O segundo ramo indica qualidade da pea e nos diz se veio da mquina A pode ser defeituosa ou no. Probabilidade que uma pea veio de A no defeituosa P(A DC) = P (A) . P(DC/A)= 0,60 . 0,98 = 0,588 P(DC/A)= 0,98 Unidade no defeituosa A MQUINA A P(A)=0,60 . P(A D) = P (A) . P(D/A)= 0,60 . 0,002 = 0,0012 P(D/A) = 0,02 Unidade defeituosa de A P(B DC) = P (B) . P(DC/B)= 0,40 . 0,96 = 0,384 C P(D /B)= 0,96 Unidade no defeituosa B

MQUINA B P(B)=0,40

P(D/B)= 0,04 Unidade defeituosa B

P(B D) = P (B) . P(D/B)= 0,40 . 0,04 = 0,016

Assim, existem 4 resultados possveis para o experimento de selecionar uma unidade da produo. Suponha que se tenha uma pea seja defeituosa e ns queremos saber a probabilidade desta vir da mquina A? (AGORA SE TEM VRIAS PEAS DEFEITUOSAS TANTO DA MQ. A QUANTO DA MQ. B E QUE SE QUER DETERMINAR DE QUE MQ. VEIO) Agora queremos determinar a P(A/D)? Regra da probabilidade condicional:

P(A/D) = P(A D) / P(D) = P(A) . P(D/A) P(D)

EQ 1

Contudo P(D) no foi obtido. aqui que entra o teorema de Bayes. H duas maneiras de uma pea ser defeituosa. Ela pode vir da mquina A e ser defeituosa ou ser da mquina B e ser defeituosa. Usando a regra da adio: P(D)= P(A D) + P(B D) = P(A) . P(D/A) + P(B) . P(D/B) EQ 2
Se substituirmos a EQ 2 na EQ 1 teremos o resultado. Pelo teorema de Bayes tem-se:

P(A/D) = P(A D) / P(A D) + P(B D) =

P(A) . P(D/A) P(A) . P(D/A) + P(B) . P(D/B)

Podemos encontrar P(A/D) = 0,0012 / (0,012+0,016) = 0,429 Enquanto a P(A) = 0,60 , P(A/D) = 0,429. Note que a P(A/D) < P(A), pois a mquina A produz uma porcentagem menor de defeitos do que a mquina B.

Tcnicas de Contagem Se dois subconjuntos so considerados diferentes devido a diferenas na ordem, eles so vistos como permutaes. Se dois subconjuntos so vistos como idnticos e constituem o mesmo subconjunto porque ambos possuem os mesmos elementos, independente da ordem, eles so chamados combinaes. Dado um conjunto com n elementos, o no. de permutaes, cada uma de tamanho r determinado por:

No de permutaes de n Elementos tomados r por vez: nPr = n! (n-r)! n!= n fatorial....por definio: 4! = 4x3x2x1- 24 e 0!= 1

O no. de combinaes de n elementos tomados r por vez : O nmero de combinaes de n elementos tomados r por vez: CN,n = N! n! (N-n)!

Ou pode ser representado por: N n = N! n! (N-n)!

Exemplo: De 4 empreendimentos uma pessoa tem capital para investir em apenas 2 requerendo o mesmo capital. Sabe-se que 2 empreendimentos vo falhar e 2 sero bem sucedidos. Se selecionar 2 empreendimentos ao a caso qual a probabilidade da pessoa selecionar pelo menos um empreendimento bem sucedido? O experimento envolve uma soluo ao acaso de 2 de 4 empreendimentos e cada possvel par de empreendimentos representada um ponto amostral. Onde S1 e S2 so empreendimentos bem sucedidos e F1 e F2 empreendimentos mal sucedidos. Quantas situaes podem ser feitas? N= 4 e n=2
8

N n

= N! n! (N-n)!

4 2 = 4! 2! 2! = 4321 =6 (2 1) x (2 1)

As combinaes possveis so: (S1, S2) (S1,F1) (S1,F2) (S2,F1) (S2,F2) (F1,F2) Selecionar um empreendimento bem sucedido inclui todos os pontos menos (F1,F2) P(SELECIONAR PELOS MENOS UM EMPREENDIMENTO) = P(S1, S2)+ P(S1,F1)+P(S1,F2)+ P(S2,F1)+P(S2,F2) P(SELECIONAR PELOS MENOS UM EMPREENDIMENTO) = 1/6+ 1/6+1/6+1/6+1/6+1/6= 5/6 Exemplo: Suponha que num lote com 20 peas existem 5 defeituosas. Se escolhermos 4 peas do lote ao acaso, ou seja, uma amostra de 4 elementos, de modo que a ordem dos elementos seja irrelevantes. Qual a probabilidade de se escolher duas peas defeituosas? P(DUAS PEAS DEFEITUOSAS) = Nmero de todos os subconjuntos com 2 peas (m) Nmero total de possibilidades (n) Peas c/ Peas s/ Defeitos defeitos m= 5 2 x 15 2 no. de maneiras que podemos escolher 2 peas c/ defeitos e 2 s/ defeitos.

n=

20 4

no. de pontos do espao amostral.

P(DUAS PEAS DEFEITUOSAS) =

C5,2 . X C15,2 C20,4

5! 2! (3)!

15! 2! (13)!

= 70/323 = 0,217

20! 4! (16)!

DISTRIBUIO DA PROBABILIDADE Varivel aleatria: pode ser discreta ou contnua. Discreta: pode assumir certos valores, usualmente nos. Inteiros e resultam basicamente de contagens. Ex. o no. de caras no lanamento de uma moeda. Contnua: resulta de uma medida e pode assumir qualquer valor dentro de um dado intervalo. Ex. O peso de um garrafo de gua mineral, que pode assumir qualquer valor entre 10 e 25 quilos. Distribuio da probabilidade: uma lista de todos os resultados possveis de um experimento e tambm das probabilidades associadas a cada um dos resultados. Ex: Aps lanar uma moeda 3 vezes determinar a probabilidade de: obter nenhuma cara; obter uma cara; obter duas caras e obter 3 caras? Distribuio discreta de probabilidade para o lanamento das moedas RESULTADOS (CARAS) PROBABILDIADE 0 1/8 1 3/8 2 3/8 3 1/8 TOTAL1 1 Onde pode ser representado por: c= cara e r= coroa = {(r,r,r); (c,r,r); (c,c,r); (c,c,c); (r,c,r); (r,r,c); (c,r,c); (r,c,c)} A distribuio de probabilidades para lanamentos da moeda

4/8 3/8 2/8 1/8

xi

A probabilidade de uma varivel aleatria X assuma um valor especfico xi denotada por P(X = xi). Assim, a probabilidade de que no lanamento de 3 moedas o resultado seja duas caras P(X = 2) = 3/8. Note que ; 0 P(X= xi) 1 e P(X= xi) =1

10

Mdia e Varincia da Destruio discreta A mdia de uma distribuio de probabilidades chamada de esperana matemtica de X, E(X). encontrada multiplicando-se cada resultado possvel pela sua respectiva probabilidade e somando essas quantidades. Mdia ou esperana de uma distribuio de probabilidade discreta = E(X) = [ (xi) P(xi)] Distribuio discreta de probabilidade para o lanamento das moedas RESULTADOS (XI) PROBABILDIADE P(xi) (xi) P(xi) 1 1/6 1/6 2 1/6 2/6 3 1/6 3/6 4 1/6 4/6 5 1/6 5/6 6 1/6 6/6 TOTAL1 1 3,5 = = E(X) (xi )2 .P(xi) (1-3,5)2 1/6 = 1.042 (2-3,5)2 1/6 = 0.375 (3-3,5)2 1/6 = 0.042 (4-3,5)2 1/6 = 0.042 (5-3,5)2 1/6 = 0.375 (6-3,5)2 1/6 = 1.042 2,92 = 2

Isso quer dizer que se lanarmos um dado podemos obter o resultado 3,5? No, isso quer dizer que se lanarmos vrias vezes um dado (teoricamente um no. infinito de vezes) a mdia dos resultados ser 3,5. A varincia de uma distribuio discreta : 2 = [xi )2 .P(xi)] o desvio padro : = 2 = 2,92= 1,71 o desvio padro mede a disperso dos resultados ao redor da mdia. Distribuio Binomial A distribuio binomial tem 4 propriedades: 1-existem dois resultados possveis (sucesso ou fracasso) 2-a probabilidade de um sucesso, , permanece constante de uma tentativa para a prxima, assim como a probabilidade de um fracasso 1- 3-a probabilidade de um sucesso em uma tentativa totalmente independente de qualquer outra tentativa 4-o experimento pode ser repetido muitas vezes. Ex. o lanamento de uma moeda pode ser considerado um exemplo de uma distribuio binomial. Distribuio Binomial P(X=x) = n ! x! (n-x)! ou n x x (1- )n-x x (1- )n-x

11

Onde, n = no. de ensaios; = probabilidade de sucesso em qualquer dos ensaios, (1)= a probabilidade de um fracasso em qualquer dos ensaios; P(X) = a probabilidade de x sucessos em n ensaios. Uma gerente de crdito da American Express descobriu que 10% () dos usurios dos cartes da companhia no pagam o total de suas dvidas em um ms. Ela quer determinar a probabilidade que de 20 contas (n) aleatoriamente selecionadas, 5 delas (x) no sejam pagas. Isso pode ser escrito como P(X=5 | n= 20, = 0,10) e l-se a probabilidade de 5 sucessos em 20 tentativas com probabilidade de sucesso em qualquer tentativa de 10%. Com n= 20, X=5 e = 0,10 tem-se: P(X= 5) = 20 ! 5! (20-5)! (0,1)5 (1- 0,1)20-5 = 20 . 19. 18 . 17 . 16 . 15! 5. 4.3.2.1 . 15! x(0,1)5 (1- 0,1)20-5

= (15504) (0,00001) (0,2058911) = 0,0319 Assim a probabilidade de uma conta qualquer no ser totalmente paga = 0,10, ento existe 3,19 % de chance de que exatamente 5 das 20 contas escolhidas aleatoriamente tenham essa caracterstica. Usando a tabela posso Tb achar b(x; n, ) = b(5; 20;0,10). Primeiro entro com n = 20 depois com x= 5 e vou at = 0,10 e acho o valor da probabilidade de 0,0319. A tabela binomial inclui valores de abaixo de 0,5. Suponha que 70% dos moradores de SP tenham internet na sua casa. Qual a probabilidade que de 10 moradores selecionados aleatoriamente 6 estejam conectados? Como > 0,5 no se pode usar a Tabela sem fazer alguns ajustes. Se a probabilidade de sucesso de um morador conectado na internet P(S) = 0,70 e de no estar P(S) = 0,30. Se 6 dos 10 moradores so usurios da Internet, ento 4 no so. Assim, 6 sucesso de = 0,70 o mesmo que 4 fracassos de =0,30. Ento pode-se escrever que P(X=6 | n= 10, = 0,70) = P(X=4 | n= 10, = 0,30) e da tabela se tem o valor aproximado de 0,2001. Mdia e varincia da Distribuio Binomial Mdia determinada por: E(X) = = n . Varincia da Distribuio Binomial: 2 = n . (1- )
12

Do exemplo anterior tem-se: n=10 E(X) = (10) (0,70) = 7 . Das 10 pessoas escolhidas aleatoriamente, espera-se que 7 estejam conectadas internet. A varincia 2 = (10) (0,70) (0,30) = 2,1.

Distribuio Binomial Acumulada


Vamos ver como aplicado na prtica. De acordo com o jornal americano 40% dos formandos do ensino mdio, nos EUA trabalham durante o vero para ganhar dinheiro para pagar as mensalidades do semestre na faculdade. Se 7 formados foram selecionados qual a probabilidade de que 3 ou menos estudantes trabalham? A probabilidade do evento A (0 a 3 trabalham) P(A) = P (X 3) EVENTO A 0 1 2 3 4 5 6 7 ESTUDANTES FORMADOS ( = 0,40)

PODEMOS ENCONTRAR O RESULTADO PELA SOMA DE : P(X= 0) + P(X= 1) + P(X= 2) + P(X= 3) = 0,0280+ 0,1306+ 0,2613+ 0,2903= 0,7102 Estas somas podem ser obtidas diretamente da tabela Binomial Acumulada P(X 3 | n = 7, = 0,40) = 0,7102. Distribuio Hipergeomtrica A distribuio binomial s apropriada se a probabilidade de sucesso de um evento permanece constante em cada tentativa, e isso ocorre se a amostra feita com reposio ou com uma populao infinita (ou muito grande). Caso a populao seja pequena e a amostragem for feita sem reposio, a probabilidade de um sucesso varia, a distribuio hipergeomtrica ser usada. P(x) = r x N n Onde N = o tamanho da amostra r = o no. de elementos na populao identificados como sucesso n = o tamanho da amostra; x = o no. de elementos de na amostra identificados como sucesso Assuma que um estbulo tem N= 10 cavalos e r = 4 deles tm uma doena contagiosa. Qual a probabilidade de selecionar uma amostra de n= 3 em que x= 2 sejam cavalos doentes? P(x) = r x N n
13

N-r n-x

N-r n-x

P (X =2) =

4 2 10 3

10-4 3-2

Obs: N n = N! n! (N-n)!

6x6 = 0,30 120 H 30 % de probabilidade de selecionar 3 cavalos, dos quais 2 esto doentes. Mdia e varincia E(X) = n . r N 2 = n

P (X =2) =

r N

N -n N-1

Distribuio de Poisson
A distribuio de Poisson uma varivel discreta, que utilizada para medir a freqncia relativa de um evento durante um perodo ou determinado espao. usada para calcular: o no. de fregueses que entram por hora numa loja; no. de acidentes por ms; no. de ligaes defeituosas feita pela empresa de Luz; no. mquinas que esto quebradas esperando o conserto..... Para aplicar a distribuio de Poisson temos que assumir: 1- A probabilidade da ocorrncia de um evento constante para qualquer intervalo de tempo ou espao; 2- a ocorrncia de um evento em qualquer intervalo, independente da ocorrncia em qualquer outro intervalo; P (X ) = x e - x! onde: x = o no. de ocorrncias do evento; = o no. mdio de ocorrncias por unidade de tempo ou espao; e = 2,71828 a base do sistema natural de logaritmos

14

Exemplo: Suponha que estejamos interessados na probabilidade de que exatamente cinco fregueses cheguem na loja na prxima hora (ou qualquer hora). Uma observao das ltimas 80 horas mostra que 800 fregueses entraram na loja. Assim, = 800/80 = 10 Fregueses por hora P (X ) = x e - x! P (X = 5) = (10)5 2,71828 -10 = 0,0378 5! Pode-se usar a tabela para achar esse valor, como segue: b(x; ) ou b(x=5; = 10) Procure no topo da tabela = 10 e desa nessa coluna at encontrar x = 5. Ento vai encontrar o valor 0,0378, isto , 3,78 % de chance de que exatamente cinco fregueses entrem na loja na prxima hora. Mdia e varincia E(X) = 2 =

Distribuio exponencial
A distribuio exponencial uma distribuio contnua. Ela mede o tempo entre duas ocorrncias, ou seja, estima o espao de tempo entre duas chegadas. A probabilidade de que o espao de tempo seja menos ou igual a uma certa quantidade x : P (X x) =1- e - t Onde : t= o espao de tempo; e= base dos sistema natural de logaritmos, 2,71828 = a taxa media de ocorrncia A distribuio de uma varivel aleatria exponencial mostrada na figura abaixo. A declividade contnua da curva mostra que quanto maior o espao de tempo x, menor a probabilidade. Distribuio exponencial

minutos
15

A probabilidade de que 30 minutos seja o tempo entre duas ocorrncias excede a probabilidade de que o espao de tempo seja 40 minutos: P (X 30) > P (X 40 ). Isso ocorre porque 30 minutos deve sempre vir antes que 40 minutos. Assuma no problema anterior que a taxa mdia de chegada = 1,5 por hora e queremos saber a probabilidade de que no mais do que duas horas seja o espao de tempo entre chegadas. Ento: P (X 2) =1- e - t = 1- e (1,5) (2) = 1 - e 3 = e 3 = 1 / e
3

= 0,0498

P (X 2) =1- 0,0498 = 0,9502 Pela tabela: Escolha x = 0 e ignore o sinal negativo de . Com o valor de 3 para o expoente e x= 0 da tabela de distribuio de Poisson obtm o valor de 0,0498 ( que o valor de e -3). H 95,02 % de chances de que um segundo fregus entre no perodo de duas horas a partir da entrada do primeiro, se a mdia de chegada for de 1,5 por hora. Distribuio Uniforme As variveis aleatrias contnuas (V.A.C) possuem uma distribuio uniforme de probabilidade se a distribuio em que todos os resultados possveis so iguais. Ex. O lanamento de um dado, onde os seis resultados possveis tm 1/6 de probabilidade de ocorrncia. Suponha que uma V.A.C. x possa assumir valores apenas em um intervalo c x d. Ento a funo freqncia uniforme tem um formato retangular conforme abaixo. Distribuio uniforme f(x) 1/ (d-c) Freqncia relativa

c a b d x Observamos que nem todos os valos possveis de x constituem de todos os pontos no intervalo entre o ponto c e o ponto d. A altura de f(x) constante no intervalo e igual a 1/(d-c). Por isso a rea total sob f(x) dada por: rea total do retngulo = base vezes altura = (d-c) . 1/ (d-c) = 1 A funo densidade de probabilidade : f(x) = 1/ (d-c) cxd
16

A funo de distribuio da probabilidade : P ( a x b) = (b-a ) / (d c) ca<bd A mdia de uma distribuio uniforme : E(X) = = (a+b)/2 Varincia de uma Distribuio uniforme : 2 = (b-a )2/12 Suponha que os contedos das latas de frutas de 450 gramas produzidas pela Alumini variem de 410 gramas a 490 gramas e sejam uniformemente distribudas. A empresa deseja encontrar a probabilidade de que uma lata pese entre 450 a 470 gramas. Uma distribuio uniforme de produtos enlatados f(x) 1/80

410

= 450

470

490

= (410+450)/2 = 450 gramas

e a altura = 1/ (490-410) = 1/80 P (X1 X X2) = (X1 X2) / AMPLITUDE X2 = 470) = (470 450) / 490 -410 = 0,25

P (X1 =450 < X < Distribuio Normal

A curva da distribuio normal possui a forma de um sino e usada para refletir a distribuio de variveis como: altura, peso, distncia e etc. Tais variveis contnuas geralmente so o resultado de medidas. Diz-se que a Varivel Aleatria de X possui distribuio normal com parmetros e 2, onde - < < + e 0 < 2 < + . A funo densidade de probabilidade da distribuio normal com mdia e varincia 2 assim definida como:

ou pode-se escrever: f(x, ,2) = 1 e - (x )2 / 2 . 2 2 - < < +

17

A curva Normal determinada por valores particulares de e 2 representada por: Funo densidade de uma V. A. X ~ N(,2) com mdia e desvio padro . f (x)

0,4 0,3 0,2 0,1

0 -2 -1 +1 +2

Observaes: f(x, ,2) --0 QUANDO x --- -/+ . Para x = o ponto mximo de f(x, ,2) e o valor mximo 1 / 2. A densidade f(x, , 2) simtrica em relao a reta x= , isto , f( +x; , 2) = f( x; ,2) para todo x = real. Denominamos a densidade normal por f(x) e escrevemos: X ~ n (,2). A Funo de Distribuio Acumulada de uma varivel aleatria x dada por: F(x)
1,0

0,5

X -2 Pode-se afirmar que: E(X) = Var (X) = 2 Se = 0 e = 1, a distribuio chamada de distribuio normal padro ou reduzida, e representada por N(0,1). Z2
18

-1

+1 +2

Assim, a funo de densidade de probabilidade reduz-se a:

( )
ou

- < Z < +

O grfico da Normal Padro : Funo densidade de probabilidade de uma V.A. Normal Padro Z ~ N (0,1) f(Z)

-1

+1

A converso das distribuies normais para a distribuio normal padro feita pela forma de converso abaixo: Z=X- Onde Z desvio normal e X algum valor especfico para uma varivel aleatria. A mdia da converso Zero e a varincia 1. Assim, independe de quais sejam a mdia e o desvio padro medidos na distribuio original Suponha que X ~ N (, 2) e queremos calcular a probabilidade de: b P(a<X<b)= a onde f (x) dada por: 1 e 2
- (x )2

f(X) dx

2 . 2

A ilustrao grfica da P ( a < X < b ) para um V.A. Normal :


19

f(x)

A integral no pode ser calculada analiticamente e probabilidade indicada s pode ser obtida por meio de integrao numrica. Um meio de obter as probabilidades usando a tabela prpria da distribuio Normal. P (0 Z ZC) onde Z ~ N (0,1) f(Z)

ZC

Exemplo: Em uma loja de modas a Moderna Fashion fez uma pesquisa em relao a altura dos seus consumidores. A mdia = 170 cm e o desvio padro = 3 cm. O eixo X mede as alturas em metros e o eixo inferior reflete essas alturas em termos de valores de Z. a)Tom tem 170 cm de altura, ento o valor de Z associado ? X= 170? Z= X = 170 170 =0 3 no. consumidores

= 170 Tom= 0

174,5 1,5 = luiz

X (ALTURA EM METROS) Z

b) Luiz tem 174,5 cm de altura e convertendo para o Z valor ele tem?

20

Z= X

= 174,5 170 3

= 1,5

O Z valor de Luiz 1,5. Ele est 4,5 cm, ou 1,5 desvios padres acima da mdia de 170 cm. c) Suponha que a Moderna Fashion que determinar qual a probabilidade de apenas um consumidor ter entre 170 e 175 cm de altura? P ( 170 X 175) = P ( 170 - 170 3 P ( 0 Z 1,67) = 0,4525 = 170 Na tabela a rea desejada para Z-valor de 1,67 vai ser: 0 1,67 Z O valor de 0,4525. H 45,25 % de chance que um consumidor escolhido aleatoriamente tenha entre 170 a 175 cm de altura. d) Suponha que se queira determinar a probabilidade de que um consumidor tenha mais do que 175 cm de altura. P (X 175) = P ( X 175-170 ) = P( Z 1,67) = 3 Sabemos que 50 % de todos os consumidores esto acima da mdia de 170 cm. = 170 175 X 175 X X 175-170 ) 3

0 1,67 Z 45,25 % de todos os consumidores tm entre 170 a 175 cm de altura. Logo: 0,5000 0, 4525 = 0,0475. H 4,75 de chance que numa escolha aleatria um consumidor tenha pelo menos 175 cm de altura. e) Suponha que se queira determinar a probabilidade de que um consumidor tenha ente 166 a 177 cm de altura.

166

= 170

177

X cm Z-valores

-1,33 0 2,33 P ( 166 X 177) = P ( 166 - 170 X 177-170 ) 3 3 P ( -1,33 Z 2,33) = 0,4082+0,4901 = 0,8983 A probabilidade de um consumidor ter entre 166 e 177 cm de altura de 89,83%.

21

Exemplo: Suponha que se queira criar um programa social para ajudar pessoas carentes, ou seja, os 15 % mais pobres da nao. A questo levantada qual a renda que separa os 15% mais pobres do restante da populao? Suponha que em 2002 a mdia de renda individual medida em 1999 era de R$ 13.812,00 anual. Assuma um desvio padro de R$ 3.550,00. Assuma que as rendas sejam normalmente distribudas. = 3.550 rea de 0,35

0,15 X= ? - 1,04 0

0,50 = 13.812 Z

X RENDA EM 1999

Embora estejamos interessados no valor de 0,15 (no se consegue ter a rea de 0,15 diretamente na tabela) devemos procurar por 0,3500 (0,5 0,15), pois apenas a rea a partir da mdia at um valor determinado acima ou abaixo da mdia dada na tabela. Ento vamos procurar na tabela a rea de 0,35, e o valor mais prximo que encontramos 0,3508, que corresponde a um Z-valor de 1,04. Como: Z= X - 1,04= X 13.812 = 10.120,00 3.550 Qualquer um com renda anual de R$ 10.120,00 ou algum valor menor receber ajuda governamental. Aproximao Normal para a Distribuio Binomial Uma distribuio Binomial envolve uma srie de n tentativas, onde a probabilidade de sucesso dada por . Se n for muito grande pode exceder a capacidade de qualquer tabela e o ser clculo difcil. Pode-se usar a distribuio normal como uma aproximao da distribuio binomial se for considerado que: n 5 e n(1 ) 5 e se estiver prximo de 0,50. Exemplo: Um sindicato dos trabalhadores em que 40 % dos membros esto a favor de uma greve. Se 15 membros so escolhidos aleatoriamente, qual a probabilidade de que 10 % apiem a greve? Da tabela binomial encontramos: P (X = 10 | N= 15, = 0,40) = 0,0245 Para usar a distribuio normal devemos encontrar a mdia e o desvio padro da normal como: = n = 15 . 0,40 = 6 = n () (1- ) = 15 (0,40) (0,60) = 1,897
22

Como existe um nmero infinito de valores numa distribuio norma (como em qualquer distribuio contnua), a probabilidade de uma varivel aleatria ser exatamente igual a um valor especfico como 10 zero. Quando se usa uma distribuio contnua para estimar a probabilidade de uma varivel aleatria discreta precisa de um ajuste. Este ajuste chamado de fator de correo de continuidade e requer que tratemos a probabilidade de exatamente 10 membros como se fosse o intervalo de 9,5 a 10,5 membros. A probabilidade de que exatamente 10 membros estejam a favor da greve mostrada pela rea do retngulo centrado em 10. Probabilidade 0,20

0,15

0,1 0,02 0,01 01 2 3 4 5 6


10 9,5 10,5

no. de membros

Usando a distribuio normal para calcular P (9,5 X 10,5) tem-se: Z = 9,5 6 1,897 Z= 10,5 6 1,897 = 1,85

= 2,37

P (9,5 X 10,5) = 0,4911 0,4678 = 0,0233 que prximo a 0,0245 encontrada na tabela da distribuio binomial.

Distribuies Amostrais
As populaes em geral so muito grandes para serem estudadas por inteiro, logo preciso selecionar uma amostra de um tamanho possvel para se manipular. Para se confiar em alguma concluso a partir de uma amostra ou inferncia sobre a populao ou sobre o correspondente parmetro, necessitamos da inferncia estatstica. O erro amostral a diferena entre o parmetro e a estatstica da amostra usada para estim-lo.
23

A distribuio amostral uma lista de todos os valores para uma amostra estatstica e suas respectivas probabilidades. Exemplo: Temos uma populao N = 4 mensalidades para quatro colgios. Essas mensalidades so R$100; $200; $300; e $400 para cada colgio. A mensalidade mdia pode ser calculada como = R$ 250,00. Para simplificar o nosso exemplo decidimos selecionar uma amostra n =2 observaes para estimar a mdia desconhecida da populao. Pode-se selecionar aleatoriamente uma das 4C2 = 6 amostras possveis. 4 = 4! = 4.3.2! 12/2=6 2 2! (4-2)! 2! . 2! Assim, todas as amostras possveis de tamanho n=2 de uma populao com N=4 mensalidades, ou seja, as 6 amostras diferentes e suas mdias que podem ser selecionadas so: AMOSTRAS 1 2 3 4 5 6 ELEMENTOS DA AMOSTRA Xi 100,200 100,300 100,400 200,300 200,400 300,400 Mdia da Amostra 150 200 250 250 300 350

Assumindo que cada amostra igualmente provvel de ser escolhida, a probabilidade de selecionar uma amostra com igual mdia da populao (R$ 250,00) de somente 2/6 = 33,33% (amostras no. 3 e 4 na tabela). Assim, quatro das seis amostras resultaro num erro no processo de estimao, onde este erro amostral a diferena entre e a mdia da amostra que usamos para estim-la ( ). Desta forma, podemos tirar uma amostra de n=2 observaes consistindo nos valores de R$ 100 e $ 300 (amostra no. 2 na tabela). A mdia resultante = $ 200 produz um erro amostral em relao a populao de $ 250-200 = $50. Se a mdia da populao for desconhecida nunca ser possvel calcular o erro exatamente da amostra. A distribuio amostral com as suas respectivas probabilidades para a populao N=4 mensalidades : Mdia Amostral 150 200 250 300 350 TOTAL NMERO DE AMOSTRAS 1 1 2 1 1 6 Probabilidade 1/6 1/6 2/6 1/6 1/6 1

24

A distribuio amostral para n = 2 de uma populao com N=4 mensalidades : P( ) 2/6

1/6

150 200 250 300 350

Mdia das amostras A distribuio amostral de uma lista de todas as possveis mdias amostrais e essa lista possui uma mdia chamada de mdias das mdias ou grande mdia. Ela calculada como a soma das mdias amostrais e dividida pelo nmero de observaes (amostras K). Mdia das mdias amostrais; =

Onde K o nmero de amostras na distribuio amostral. No exemplo anterior para as 6 amostras, tem-se: = 150 +200+250+250+300+350 = 250 6 Note que a mdia da distribuio amostral igual mdia da populao original = 250 e isto no coincidncia. A distribuio amostral da mdia sempre ter mdia igual da populao ( = ). No confunda no n (nmero de observaes em cada amostra) com K (nmero de amostras na distribuio amostral). Assim, a partir de uma populao N= 4 mensalidades com amostras de tamanho n=2 que geram 4C2= K = 6 amostras diferentes na distribuio amostral. Varincia e o erro padro da distribuio amostral A varincia mede a disperso das observaes individuais (mdias amostrais) ao redor de sua mdia (a grande mdia) e ela calculada por; Varincia da distribuio amostral da mdia amostral Para o problema tem-se:

= (150-250)2+(200-250)2+(250-250)2+(250-250)2+(300-250)2+(350-250)2= 4167 reais quadrados 6


25

O erro padro da distribuio amostral da mdia amostral :

Ento: = = 64,55 O erro padro da distribuio amostral uma medida de disperso das mdias amostrais em torno de , ou seja, mede a disperso de cada observao individual ao redor de sua mdia.

Uma aproximao para o clculo da varincia da distribuio amostral pode ser feita a partir da varincia da populao:

E o erro :

Onde n o nmero total da amostra e 2 varincia da populao. Quando n cresce o erro decresce, e o fato do erro amostral diminuir quando o tamanho da amostra cresce ser importante no estudo inferncia estatstica. Usando a aproximao para o exemplo anterior: Para a populao

(Populao Infinita)

= (100 250)2+(200- 250)2+(300- 250)2+(400-250)2= 50000/4 =12500 4 = = 111,8 desvio padro da populao

= 45,63 no muito prximo, mas chega perto.

As equaes acima so apropriadas quando a amostra feita com reposio, ou se a amostra retirada de uma populao muito grande (teoricamente infinita). Isso requer que a varincia da populao seja conhecida. Se a amostragem for feita sem reposio e se o tamanho da amostra for maior que 5% da populao, ento: n > 0,05N o fator de correo para uma populao finita (fcp) precisa ser aplicado. O fcp O erro usando o fcp :

(Populao Finita)

Se n relativamente pequeno em relao a N ,menos que 5%, o fcp se aproxima de 1 e portanto no altera o valor do erro padro.
26

Teorema do Limite Central possvel coletar muitas amostras de mesmo tamanho de qualquer populao, e se a populao normalmente distribuda, ento a distribuio amostral da mdia tambm ser normalmente distribuda. Na figura abaixo o grfico superior mostra a distribuio das observaes individuais de X i de uma populao normalmente distribuda com mdia = 500 e desvio padro = 50. Note que os valores das observaes XI esto no eixo horizontal. O grfico inferior representa a distribuio da mdia amostral obtida como resultado da coleta de todas as amostras de tamanho n = 25. = 50

= 10

n = 25

= = 500 Note que os valores das mdias amostrais , esto no eixo horizontal. As mdias so normalmente distribudas e centradas ao redor da mdia da populao = = 500, isto , a mdia das mdias amostrais igual mdia da populao. A disperso da populao original = 50 maior do que a mdia das mdias amostrais = = = 10. As observaes Xi so muito mais espalhadas do que a mdia amostral

desde que =

Teorema do Limite central: Quando n cresce a distribuio da mdia amostral aproxima-se de uma normal com mdia = e erro padro

O que pode acontecer com a forma da distribuio das mdias amostrais se a populao original no se distribuir como uma normal? A resposta fornecida pelo TEOREMA DO LIMITE CENTRAL, que afirma que para qualquer populao, quando n cresce, a distribuio das mdias amostrais aproxima-se de uma distribuio normal com mdia = e erro padro = .

27

Usando uma distribuio amostral Muitas decises so tomadas com base nos dados amostrais. A distribuio amostral da mdia ser normalmente distribuda por que: 1- A amostra foi coletada de uma populao normal; ou 2- n 30 e o teorema do Limite Central garante a normalidade no processo de amostragem, sendo que desvio padro pode ser usado para garantir a informao essencial no processo de tomada de deciso. Desta forma, a distribuio amostral pode ser usada para fornecer informaes probabilsticas a respeito da diferena entre a mdia da amostra e a mdia da populao. Exemplo: Numa empresa com 2500 gerentes possui uma mdia anual salarial de R$ 51.800,00 e ANUAL de R$ 4.000,00. Com a mdia populacional de R$ 51.800,00, o diretor de pessoal quer saber qual a probabilidade de estar entre R$ 51.300,00 e R$ 52.300,00, (estar numa faixa de variao de R$ 500,00 para cima ou para baixo em relao da mdia populao) usando uma amostra aleatria de 30 gerentes? n/N = 30/2500 = 0,012 Uma vez que o tamanho da amostra menor que 5% da populao, ento pode-se ignorar o fcp finitas.
=

= 730,3

Uma vez que a distribuio da amostral est normalmente distribuda, com mdia de R$ 51.800,00 e erro padro da mdia igual a 730,3, podemos suar a tabela de reas da distribuio normal para calcular a probabilidade. Z= (51.300 51.800/ 730,3 = - 0,68 a rea 0,2517 Z = (52.300 51.800/ 730,3 = + 0,68 a rea 0,2517 A probabilidade de uma mdia amostral deve estar dentro de R$ 500 da mdia da populao. Distribuio amostral de = 730,3 rea 0,2417 rea 0,2517

51.300 =51.800 52.300

Logo a probabilidade do valor da mdia estar entre 51.300 e 52.800 dado por P (51.300 52.300) = 0,2517 + 0,2517 = 0,5034. Assim, existe 1 - 0,5034 = 0,4966 de que a diferena entre a mdia da amostra e a mdia da populao = R$ 51.800,00 ser maior que R$ 500,00, e talvez um tamanho da amostra maior deva ser considerada.

28

Observao: O valor de = independente do tamanho da amostra, porm com o aumento do tamanho da amostra o erro da mdia decresce. n= 100 n= 30

= 400

= 730,3

= 51.800 Distribuio amostral para Propores

Muitos assuntos de negcios referem-se proporo da populao , e no a mdia. Uma empresa deseja saber se um cliente compra (opo 1) ou no compra um produto (opo 2). A proporo amostral p suada para estimar o parmetro desconhecido (de sucesso). A partir de qualquer populao possvel retirar muitas amostras diferentes de um mesmo tamanho. Cada amostra ter sua prpria proporo de sucessos, p. Semelhante s mdias o valor da distribuio amostral da proporo ser igual proporo de sucessos na populao: = E(p) = . Para uma amostra aleatria simples de uma populao grande, o valor de uma varivel aleatria binomial, que indica o no. de elementos contidos na amostragem que possuem a caracterstica de interesse. Uma distribuio binomial pode ser aproximada por meio de uma distribuio normal sempre que o tamanho da amostra for grande, para satisfazer as duas condies: np 5 e n (1- p) 5. O valor Esperado da Distribuio Amostral (mdia) : E (p) =

O erro padro : p =
( )( )

s uso se n/N 0,05 (populao infinita)

Se n > 0,05 N, o fcp necessrio e o erro padro torna-se: p =


( )( )

(populao finita)

29

O desvio normal distribuio para propores dado por: Z= Exemplo 1: A loja Pop perguntou a toda a populao de clientes N=4 se eles viram seu anuncio no jornal nesta manh. Uma resposta sim considerada sucesso e no fracasso. Os quatro clientes responderam S1, N2, N3 e S4. A proporo de sucesso na populao de = 0,50. Por que: = x/ N onde x o no. de elementos contidos na amostra que possuem a caracterstica de interesse. E N o tamanho da populao. = 2 (S1 e S4)/4 = 0,5. As amostras de tamanho n = 2 foram consideradas e as propores de sucesso encontradas encontram tabeladas abaixo: Distribuio Amostral da Populao Xi Nmeros de Sucesso S1, N2 1 S1, N3 1 S1, S4 2 N2, N3 0 N2, S4 1 N3, S4 1

p (proporo de sucessos) 0,5 0,5 1,00 0 0,5 0,5 3,00

O valor Esperado da Distribuio Amostral (mdia) : = E (p) =

= 3/6 = 0,50

= E(p) = Se n > 0,05 N, 2 > 0,05 X 4 2 > 0,2 Logo, o fcp necessrio e o erro padro torna-se: p =
( )( )

)(

= 0,289

O gerente desta loja que saber qual a probabilidade de obter um valor de p que se situe no intervalo de 0,05 da proporo populacional de clientes que disseram que viram o anuncio, ou seja, qual a probabilidade de obter uma amostra com uma proporo amostral p que se situe entre 0,45 (0,5-0,05) a 0,55(0,5+0,05)? np 5 e n (1- p) 5 para este caso no se aproxima da normal. Somente neste caso para efeito didtico, vamos supor uma distribuio normal de com mdia igual a 0,50 e desvio padro da proporo p = 0,289 Para = 0,45 tem-se : Z= ( 0,45 -0,50)/0,289 = - 0,1730 cuja rea = 0,0675 Para = 0,55 tem-se : Z= ( 0,55 -0,50)/0,289 = 0,1730 cuja rea = 0,0675 Deste modo, a probabilidade de selecionar uma amostra que fornea uma proporo amostral dentro de 0,05 da proporo populacional 0,0675 + 0,0675 = 0,135.

30

Exemplo: A Bells obtm componentes para os seus telefones celulares em lotes de 200 de uma firma em Manaus. Um componente tem uma taxa de defeito de 10 %. As normas recentes estabelecidas pela Bells, para os prximos carregamentos so: a) Se houver mais de 12 % de defeituosos, implicar em constatar um novo fornecedor. b) Se houver de 10 a 12% de defeituosos, implicar em considerar um novo fornecedor. c) Se houver de 5 a 10 % de defeituosos, implicar em continuar com fornecedor. Qual deciso mais provvel que a Bells poder tomar? Obs: O tamanho da populao N no fornecido, e razovel que a Bells compre muitos componentes e a amostra de tamanho n = 200 menor que 0,05 N, logo o fcp desnecessrio. O erro padro : p = Logo, p =
( )( ) ( )( )

= 0,021 P (p > 0,12) 0,4913 0,3289 0,087 0,1711 0,05 0,1 0,12

a)

Z= Z=

= 0,95 CORRESPONDE A UAM REA DE 0,3289

P (p > 0,12) = 0,500 0,3289 = 0,1711 ...Significa que tm 17,11 % a probabilidade de vir com + de 12 % de peas defeituosas.

b)

P (0,10 p 0,12)

Z= Z=

= 0,95 CORRESPONDE A UAM REA DE 0,3289. Significa que tm 32,89 %

a probabilidade de vir entre 10 % a 12 % peas defeituosas.


c)

P (0,005 p 0,10)

Z= Z=

= - 2,38 CORRESPONDE A UAM REA DE 0,4913. Significa que tem 49,13

% a probabilidade de vir entre 5 % a 10 % peas defeituosas. Como o item c forneceu a maior probabilidade, a Bell permanecer com o mesmo fornecedor.

31

Tipos de amostragem (para leitura complementar)


Existem vrios procedimentos amostrais apropriados e, portanto apenas alguns sero abordados. a) Amostragem Aleatria Simples o mtodo bsico de amostragem aleatria, pela sua facilidade de selecionar amostras, analisar dados e reduzir erros de amostragem, mas ele no pode ser aplicado sempre, e no sempre o mais apropriado. O mtodo se fundamenta no princpio de que todos os membros de uma populao tm a mesma probabilidade de serem includos na amostra. Fases do mtodo: a) listagem da populao; b) determinao do tamanho da amostra; c) uso de nmeros aleatrios (tabela ou algoritmos computacionais). Existem frmulas e tabelas para estabelecer o tamanho das amostras e as estimativas, de acordo com: tamanho da populao; o nvel de conabilidade desejvel; o ndice de preciso escolhido; o grau de disperso; a taxa de ocorrncia. b)Amostragem Sistemtica Aqui os membros da populao que participam da amostra so determinados a partir de intervalos xos, e no h a utilizao de tabelas de nmeros aleatrios. Por exemplo, numa populao de 100 peas, para obtermos 10 amostras sistemticas podemos retirar as peas de nmero 10, 20, 30, e assim por diante, at completarmos 10 amostras sistematicamente colhidas. Para encontrarmos os pontos onde faremos as coletas sistemticas das amostras, podemos seguir os seguintes passos (conforme exemplo): Dene-se o tamanho da populao: N= 1600. Dene-se o tamanho da amostragem total: n= 100

= 1600/100 = 16
Faz-se ento: Sorteia-se um nmero de 1 a 16, que ser o primeiro nmero da amostra, logo as prximas amostras sero retiradas de 16 em 16. As vantagens so: 1. Facilidade de determinao dos elementos da amostra; 2. No precisa usar nmeros aleatrios; 3. Mais rapidez para grandes populaes. As desvantagens so: 1. Cuidados com o fator posio na lista dos componentes da populao; 2. Cuidado com fenmenos sazonais. c) Amostragem Estratificada Consiste em dividir a populao em subgrupos mais homogneos (estratos) e retirar amostras aleatrias simples dos subgrupos. Por exemplo: Deseja-se estudar a aceitao de determinados mtodos de controle de natalidade em uma determinada cidade. Soluo: Aspectos relevantes nesta aceitao: regio do pas e situao socioeconmica; Uma identicao sugerida: regio do pas; norte, nordeste, centro-oeste, sudeste e sul. Uma identicao sugerida - a classe social: alta, mdia e baixa. Estratos que poderiam ser formados:
32

Norte de classe alta; Norte de classe mdia; Norte de classe baixa; Nordeste de classe alta; Nordeste de classe mdia; Nordeste de classe baixa; Centro-oeste de classe alta; Cetro-oeste de classe mdia; Centro-oeste de classe baixa Suldeste de classe alta; Suldeste de classe mdia; Suldeste de classe baixa; Sul de classe alta; Sul de classe mdia; Sul de classe baixa Retiramos amostras aleatrias simples de cada estrato, usando o processo j sugerido (listagem, nmeros aleatrios); Juntar numa s amostra a m termos uma amostra de toda a populao; A idia bsica que: um grupo homogneo requer amostra menor que um grupo heterogneo. As amostras estraticadas so divididas em trs tipos: 1. Uniforme: Na amostragem estraticada uniforme sorteia-se igual nmero de elementos de cada estrato. 2. Proporcional: Na amostra estraticada proporcional, o nmero de elementos em cada estrato proporcional ao nmero de elementos existentes no estrato. 3. tima: Na amostra estraticada tima, quando se toma em cada estrato um nmero de elementos proporcional ao nmero de elementos do estrato e tambm variao da varivel de interesse no estrato, medida pelo seu desvio padro. A tcnica de estraticar bastante til, quando a populao apresenta muita diversidade nos seus valores individuais, datas, etc; assim estabelecem-se estratos de modo que a varincia do valor do item seja o menor possvel dentro de cada estrato. d) Amostragem por Conglomerados um mtodo muito utilizado por motivos de ordem prtica e econmica, onde divide-se uma populao em pequenos grupos e sorteia-se um nmero suciente desses pequenos grupos (conglomerados), cujos elementos constituiro a amostra. Neste mtodo, existem pelo menos dois nveis de amostragem que so empregados: Nvel 1 Unidade de Amostragem; Nvel 2 Elementos Amostrados (dentro de cada conglomerado). Exemplo: Deseja-se entrevistar uma amostra representativa de pessoas que vivem numa grande rea da cidade. Extrair uma amostra aleatria simples, ou sistemtica ou estraticada de pessoas espalhadas numa grande rea implicaria em muitas viagens, alto custo e muito tempo. Soluo: Tomar, por exemplo, quarteires da cidade como unidade primria de amostragem ou conglomerado. a) Listar os quarteires b) Sortear uma amostra aleatria simples de quarteires (nmeros aleatrios); c) Entrevista-se as residncias dos quarteires selecionados. Alguns aspectos da representatividade de uma amostra probabilstica: 1. A amostra no deve ter preconceito ou tendncia; 2. Cada item da populao deve ter uma chance conhecida de ser selecionado; 3. Seu tamanho deve ser grande o bastante de modo a minimizar o risco da amostra atpica.

33

Estimando com Intervalos de Confiana


As populaes so muito grandes para serem estudadas, e consequentemente requer que amostras sejam selecionadas. H dois tipos de estimativas usadas: estimativa pontual e estimativa intervalar. Estimativa pontual: usa uma estatstica para estimar o parmetro com um nico valor ou ponto. Ex: O gerente de uma loja pode escolher uma amostra de n=500 fregueses e encontrar a mdia de gastos de = R$ 37,00. Esse valor serve como uma estima pontual para a mdia da populao. Estimador intervalar: determina a amplitude dentro da qual um parmetro desconhecido pode estar. Ex. O gerente pode decidir que a mdia da populao fique entre R$ 35,00 e R$ 38,00. Cada intervalo geralmente acompanhado de uma declarao de confiana desse intervalo. Por isso chamado de intervalo de confiana. Intervalo de confiana: fornece uma amplitude dentro da qual o parmetro pode ser encontrado e o grau de confiana com que o intervalo pode conter o parmetro. Existem trs graus usuais de confiana associados aos intervalos de confiana, que so: 99, 95 e 90 %. Esses trs graus de confiana so chamados de coeficientes de confiana e so simplesmente convencionais. Se quisermos podemos calcular um intervalo de confiana de 82%. Obs: Por causa do erro amostral provavelmente a mdia no ser igual mdia populao . Como a distribuio amostral mostra como os valores de esto distribudos nas proximidades da mdia populacional , a distribuio amostral de fornece informaes sobre as possveis diferenas entre e . Usando a tabela de reas da distribuio normal padro, pode-se afirmar que 95% dos valores de qualquer varivel aleatria normalmente distribuda est dentro de +/- 1,96 desvio padro da mdia. Desse modo, quando a distribuio amostral de est normalmente distribuda, 95 % dos valores de devem estar dentro de +/- 1,96 da mdia . Um intervalo de confiana tem um limite inferior de confiana (LIC) e um limite superior de confiana (LSC). Esses limites so uma quantidade somada em relao a , logo tem-se que saber a mdia da amostra. De qualquer populao pode-se pegar vrias amostras de um determinado tamanho com cada uma com a sua respectiva mdia (uma Distribuio Amostral). Exemplo: Se pegarmos seis amostras com as suas respectivas mdias pode-se construir os intervalos de confiana com dois erros padres acima e abaixo dessa mdia. Assim, se tem a certeza que 95,5% de certeza que o intervalo construdo possui a mdia desconhecida da populao. Observa-se no grfico que apenas a 3 e 5 esto afastados da mdia populao, cujo intervalo de +/- 2 erros padres no inclui a mdia da populao.

34

Concluso: Se a mdia da populao tem 95,5% (95,5%/2 = 0,4775) de chance de estar no intervalo de dois erros padres de todas as mdias amostrais, ento, dada qualquer amostra pode-se ter 95,5% de certeza que o intervalo de 2 erros padres ao redor da mdia dessa amostra contm a mdia desconhecida da populao. Se desejarmos uma estimativa intervalar para a mdia da populao com uma grande amostra (n 30) pode-se construir um intervalo mais convencional de 95 % em vez de 95,5%, logo quantos erros padres devemos colocar acima e abaixo da mdia amostral? Como a tabela Z contm valores apenas para a rea acima ou abaixo da mdia, devemos dividir ento 95% por dois, que resulta em 0,4750. O Z-valor correspondente a uma rea de 0,4750 Z= 1,96. O intervalo -1,96 da mdia amostral e +1,96 para cima. Intervalo de confiana de 95% para a mdia da populao

para baixo

0,95

0,4750 0,4750 =? -1,96

+1,96

Intervalo de confiana para mdia da populao Amostra grande O intervalo de confiana para quando conhecido dado por: I. C. para = +/- Z

35

Exemplo: Considere um empreendedor imobilirio que pretende construir um grande shopping. Ele pode estimar a renda mdia familiar anual na rea como um indicador das vendas futuras. Uma amostra de n= 100 famlias resultou em = R$ 35.500,00. Assuma que o desvio padro seja = R$ 7200,00. Dado que estimado como: I. C. para = 35.500 +/- (1,96)
=

um intervalo de 95 %

= R$ 34.088.80 R$ 36.911,20 O intervalo de confiana pode ser interpretado de duas maneiras: A primeira e a mais usada declara que o empreendedor tem 95% de certeza que a verdadeira e desconhecida mdia da populao est entre R$ 34.088.80 e R$ 36.911,20. Embora o verdadeiro valor para a mdia da populao permanea desconhecido, este tem 95 % de certeza que ela se encontra entre esses dois valores. A segunda interpretao reconhece que vrios intervalos de confiana podem ser construdos, ou seja, outra amostra produzir uma mdia amostral diferente por causa do erro amostral. Com um diferente o intervalo ter outro limite superior e inferior. Assim, que se todos os NCn intervalos de confiana forem construdos, 95% deles iro conter a desconhecida mdia da populao. Isso significa que 5% dos intervalos estariam errados, ou seja, eles no conteriam a mdia da populao. Esses 5 % calculados como 1 coeficiente de confiana chamado de Alfa Valor e represente a probabilidade de erro. Alfa Valor a probabilidade de erro ou a probabilidade de que um dado intervalo no contenha a mdia desconhecida da populao. Intervalo de Confiana quando desconhecido Se desconhecido ento deve ser substitudo pelo desvio padro da amostra, conforme abaixo: Intervalo de confiana para quando desconhecido dado por: I. C. para = +/- Z Onde

Exemplo: Um contador acabou de completar o imposto de renda de seus clientes e ele quer estimar a quantidade mdia que eles devem Receita Federal. Dos 50 clientes que ele escolheu para sua amostra, a quantidade mdia devida R$ 652,68. Como o desvio padro para todos os seus clientes desconhecido, este deve estimar com o desvio padro da amostra de s = R$ 217,43. Se um grau de confiana de 99% desejado, o valor de Z-valor apropriado 0,99/2 = 0,4950. Da tabela Z para uma rea de 0,4950 revela Z = 2,58. Usando a equao acima tem-se:
36

I. C. para = +/- Z

= 652,68 +/- 2,58

= 573,35 732,01
O contador pode estar 99% certo de que a quantidade mdia devida por seus clientes algum valor entre R$ 573,35 e R$ 732,01. O que aconteceria com esse intervalo se o contado aceitasse um intervalo de confiana de 95? = 652,68 +/- 1,96

= 592,41 712,96
O resultado bom ou ruim em comparao ao anterior? O intervalo de confiana de 95 % mais estreito e d maior preciso. Logo, quanto menor o intervalo, mais significativo. Porm, o contador tem apenas 95 % de certeza de que o intervalo realmente contm . Embora o intervalo seja mais preciso (estreito) a probabilidade de que ele contenha caiu de 99% para 95%. Assim, o contador abriu mo da confiana pela preciso. Controlando o tamanho da amostra Existem dois modos de construir um intervalo mais preciso: 1- diminuindo o grau de confiana e 2- aumentando o tamanho da amostra. 1- Diminuindo o grau de confiana Um aumento de preciso pode ser ganho aceitando um grau de confiana menor. Para o exemplo anterior o intervalo de confiana de 99 % variava de R$ 573,00 a R$ 732,00, enquanto o intervalo de confiana de 95$ era menor variando de R$ 592,00 a R$ 712,00. Existe uma perda envolvida nesse aumento de preciso, ou seja, o grau de confiabilidade de 95% resulta em 5% de probabilidade de erro em vez do 1% de erro associado ao intervalo de confiana de 99%. 2- Aumentando do tamanho da amostra O modo de encurtar o intervalo sem perda de confiana aumentando o tamanho da amostra, pois se diminui o erro padro = . No exemplo acima se a amostra aumentada para 80, o intervalo de 99% exibe um grau de preciso similar ao do intervalo mais curto de 95% sem perder a confiabilidade. Como n = 80, o intervalo de 99% tem-se: I. C. para = +/- Z = 652,68 +/- 2,58

= 589,96 715,39
Essa vantagem no ganha sem pagar um preo, ou seja, amostra maior significa maior tempo e mais dinheiro para coletar.
37

Intervalos de Confiana para propores da Populao Geralmente as decises dependem de parmetros binrios, ou seja duas categorias de respostas. Ex. uma empresas que saber qual a proporo de seus consumidores pagam com carto de crdito e quantos pagam em dinheiro. Para que a proporo amostral seja normal quando n e n(1-) for maior que 5. Ento a distribuio amostral ter mdia igual a proporo da populao. = E(p) = O erro padro da Distribuio da Proporo da Amostra ser dado por: p =
( )( )

O parmetro que se deseja estimar , e usa-se a proporo amostral p como um estimador para que pode ser escrito como: sp =
( )( )

O intervalo de confiana : I. C. para = p +/- Z

Exemplo: O gerente de uma estao de televiso deve determinar qual a porcentagem de moradias da cidade que tem mais de um aparelho de televiso. Uma amostra aleatria de 500 casas revelou que 275 delas tm dois ou mais aparelhos. Qual o intervalo de confiana de 90% para a proporo de casas com dois ou mais aparelhos? Temos p = 275/500 = 0,55 sp =
( )( )

)(

= 0,022

A tabela da distribuio normal fornece para um intervalo de confiana de 90 % para um valor de Z de 1,65. I. C. para = p +/- Z

= 0,55 +/- (1,65) (0,022) = 0,55 +/- 0,036 0,514 0,586 O gerente pode ter 90 % de certeza que entre 51,4 % a 58,6 % das casas da cidade tm mais de um aparelho de TV em casa. Intervalo de confiana para mdia da populao com amostra pequena Distribuio t Quando a amostra for pequena (n menor que 30 elementos) deve ser usada uma distribuio que no a normal chamada de distribuio t de Student (distribuio t). A distribuio t
38

usada: 1- amostra pequena; 2) desconhecido; e 3 a populao normalmente distribuda ou quase. Caractersticas da distribuio t: tem zero como mdia (igual a distribuio Z); simtrica em relao mdia, e sua amplitude varia de - a + . A varincia da distribuio t maior do que 1, e portanto mais achatada e dispersa que a distribuio Z (varincia da distr. Z 2 = 1). Varincia para distribuio t Uma famlia de distribuio t:
Z ou t com n 30

2 =

t com n = 15 ( 20 g.l.)

t com n = 10 (10 g.l.)

A varincia depende dos graus de liberdade (g. l.) definidos como o nmero de observaes menos o nmero de restries impostas a essas observaes, onde a restrio algum valor que essas observaes devem gerar. A estatstica t calculada: t= onde : desvio padro da amostra , a mdia da populao, e media da amostra. Onde

A eq. acima pode ser representada como um intervalo de confiana para : Intervalo de confiana para a Mdia da Populao Amostra pequena: I. C. para = +/- t

= +/- t

O valor de t pode ser encontrado na tabela. Exemplo: Uma construtora foi acusada de inflacionar os custos em seus comprovantes de um contrato com o Governo. O contrato declara que um certo tipo de trabalho deve custar em mdia R $ 11.500,00. Na poca apenas 12 diretores de agencias governamentais foram chamados para prestar depoimento sobre o caso dos comprovantes. Se atravs das
39

testemunhas chegou-se mdia de R$ 1275,00 com desvio padro de R$ 235,00, um intervalo de confiana de 95 % prova a inocncia da construtora? Suponha que os valores dos comprovantes so normalmente distribudos. Para um intervalo de confiana de 95 % e com g.l. (graus de liberdade) 12 1 = 11 (n-1), resulta pela Tabela um valor de t de 2,201. Assim: I. C. para = +/- t = . 1275 +/- (2,201) = 1275 +/- 149,31 R$ 1.125,69 1.424,31 Resp. O tribunal pode ter 95 % de certeza de que a mdia dos valores dos comprovantes est entre R$ 1125,00 e R$ 1424,00. O intervalo contm o valor contratado reafirmando a defesa da empresa. Note que o valor t para um intervalo de 95 % 2,201 (dado g.l. = 11) enquanto uma amostra maior usaria um valor Z de 1,96, logo o intervalo baseado num t valor mais largo. Determinando o tamanho da amostra O tamanho da amostra tem um importante papel na determinao da probabilidade de erros, bem como da preciso da estimativa. Depois de escolher o grau de confiabilidade dois fatores influenciam na escolha do tamanho da amostra: 1- a varincia da populao 2 (estar fora do controle do pesquisador) e 2- o tamanho do erro tolerado que os pesquisadores esto dispostos a aceitar ( possvel limitar o tamanho do erro). a) Tamanho da amostra para A distribuio normal de Z pode ser expressa como:

Z=

Isso pode ser reescrito como:

n=

Tamanho da amostra p/ intervalos da mdia da populao

Onde a diferena entre a mdia da amostra e a mdia da populao o erro (

) .

40

Exemplo: A indstria de disco deseja construir um intervalo de 95% para o tamanho mdio da pea. Uma amostra piloto ( n 30) revela um desvio padro de 6 cm. Qual deve ser o tamanho da amostra? Usa-se um intervalo de 95% utiliza um valor Z de 1,96 (erro de 2 desvios padro).

n= n=

( ( )

= 34,5 = 35 peas

A indstria deve selecionar uma amostra de 35 peas. Para essa amostra um intervalo de 95 % pode ser construdo para o dimetro mdio. LO intervalo poderia ter um erro menor que 2 cm. a) Tamanho da amostra para Vimos que: Z=

Onde o erro padro : p =


( )( )

Podemos reescrever uma expresso para o tamanho da amostra como:

n=

( )( ( )

Tamanho da amostra p/ intervalos da proporo da populao

Onde a diferena entre a proporo da amostra e a proporo da populao o erro (

) .
Como o parmetro desconhecido que desejamos estimar, ento tem dois modos de tratar. 1- Pegar uma amostra piloto para obter um valor de , ou 2- se pode simplesmente considerar = 0,5 para fins de determinar o tamanho da amostra , o que mais seguro. O n ser maximizado se = 0,5, pois ento o numerador da eq acima fica (1 ) = 0,25, pois qualquer valor diferente de 0,5 resultar um valor menor que 0,25. Exemplo:Um candidato est concorrendo para governador e quer uma estimativa com 1 ponto percentual de erro para a proporo das pessoas que iro votar nele. Ele tambm que um intervalo de confiana de 95%. Qual deve ser o tamanho da amostra?

n=

= 9.604 votantes ( ) ( ) Uma amostra de 9604 votos permitir o candidato estime com 1 ponto percentual de erro com intervalo de confiana de 95 %.
41

( )(

)(