Você está na página 1de 84

1

Estatísticas e
Distribuições de
Amostragem
Inferência Estatística
Parâmetros e Estatísticas

Fonte da imagem:
https://newonlinecourses.science.psu.edu/stat200/sites/stat200/files/inli
ne-images/InferenceGraphicSU17.png
Distribuições de
Amostragem

Fonte da imagem:
https://www.safaribooksonline.com/library/view/practical-statistics-
for/9781491952955/assets/psds_0201.png
Simulação
5

Variação Amostral e
Distribuição Amostral
Exemplo

▪ Seja 𝜇 a verdadeira quantidade média de gordura contida


em hamburgers comercializados por uma cadeia de fast-
food nacional.
▪ Para saber algo sobre 𝜇, obtemos uma amostra de 𝑛 =
50 hamburgers e determinamos a quantidade de gordura
contida em cada um.
▪ Os dados dessa amostra dão uma média 𝑥 = 28,4𝑔.

Prof. Augusto C. Souza - 2018/2


Exemplo

Quão próxima é essa média amostral da verdadeira


média populacional, 𝜇?

Prof. Augusto C. Souza - 2018/2


Exemplo

▪ Suponha que tivéssemos selecionado uma outra


amostra de 50 hamburgers e tivéssemos calculado
a quantidade média de gordura. Este segundo
valor estaria próximo ao anterior ou seria muito
diferente?
▪ Estas questões podem ser respondidas com o
estudo da distribuição amostral de 𝑥.

Prof. Augusto C. Souza - 2018/2


Definição de Estatística
▪ Uma estatística é qualquer quantidade cujo valor possa
ser calculado a partir de dados amostrais.
▪ Antes de obter os dados, há incerteza quanto ao valor de
qualquer estatística em particular. Portanto, uma
estatística é uma variável aleatória!
▪ Exemplos:
▪ Média amostral, Mediana amostral, Variância amostral,
Proporção amostral (proporção de unidades na amostra que
possuem um propriedade particular.)

Prof. Augusto C. Souza - 2018/2


Estatística e Variabilidade Amostral

▪ Seria bom se o 𝑥 = 𝜇 fosse verdade, mas isto


seria uma ocorrência rara.
▪ Além disso, não só 𝑥 ≠ 𝜇, geralmente, mas
também, os valores de 𝑥 a partir de diferentes
amostras, tipicamente diferem uma da outra.

Prof. Augusto C. Souza - 2018/2


Variabilidade amostral

▪ O valor observado de uma estatística depende da


amostra selecionada a partir da população.
▪ Normalmente, ela varia de amostra para amostra.
▪ Esta variabilidade é chamada variabilidade
amostral.

Prof. Augusto C. Souza - 2018/2


Exemplo

▪ Considere uma pequena população composta


pelos 20 alunos matriculados em uma turma de
Estatística. A quantidade de dinheiro (em dólares)
que cada um dos 20 alunos gastaram em livros
didáticos para o semestre atual é mostrado na
tabela a seguir

Prof. Augusto C. Souza - 2018/2


Exemplo
Quant. Quant. Quant.
Estudante Estudante Estudante
(US$) (US$) (US$)
1 367 8 370 15 433
2 358 9 378 16 284
3 442 10 268 17 331
4 361 11 419 18 259
5 375 12 363 19 330
6 395 13 365 20 423
7 322 14 362

13
Exemplo

▪ Para esta população


367 + 358 + ⋯ + 423
𝜇= = 360,25
20
▪ Suponha que nós não sabemos o valor da média da
população.
▪ Desejamos estimar 𝜇 selecionando uma amostra
aleatória de cinco alunos e calcular a quantidade média
da amostra com gastos em livros didáticos.

14
Variabilidade Amostral: exemplo
▪ Isto é algo razoável de se fazer?
▪ A estimativa que resulta deste cálculo é provável de
estar próxima do valor de 𝜇, a média da população?
▪ Para responder a estas questões considere um
experimento simples que nos permite examinar o
comportamento da estatística quando amostras
aleatórias de tamanho 5 são repetidamente
selecionadas.

15
Variabilidade Amostral: exemplo
▪ Selecionamos uma AAS dos seguintes 5 alunos:
17, 20, 7, 11 e 9.
▪ Para esta amostra temos:

331 + 423 + 322 + 419 + 378


𝑥1 = = 374,60
5

▪ Essa diferença é normal ou é esta amostra em particular que


está extraordinariamente longe de 𝜇?

16
Variabilidade Amostral: exemplo

Amostra 2 Amostra 3 Amostra 4 Amostra 5


Estudante X Estudante X Estudante X Estudante X
4 361 15 433 20 423 18 259
15 433 12 363 16 284 8 370
12 363 3 442 19 330 9 378
1 367 7 322 1 367 7 322
18 259 18 259 8 370 14 362
𝒙𝟐 356,60 𝒙𝟑 363,80 𝒙𝟒 354,80 𝒙𝟓 338,20

17
Variabilidade Amostral: exemplo

▪ Porque 𝜇 = 360,25, podemos ver que


1. O valor de 𝑥 varia de uma amostra aleatória para outra
(variabilidade amostral);
2. Algumas amostras geram valores de 𝑥 maiores que m
(amostras 1 e 3), enquanto outras produzem valores menores
que 𝜇 (amostras 2, 4 e 5)
3. As amostras 2, 3 e 4 geraram valores de 𝑥 que estão muito
próximos à média populacional, mas a amostra 5 resultou em
um valor $22 abaixo da média populacional.

18
Variabilidade Amostral: exemplo
Amostra Média Amostral Amostra Média Amostral Amostra Média Amostral

6 374,6 21 355,0 36 353,4


7 356,6 22 407,2 37 379,6
8 363,8 23 380,0 38 352,6
9 354,8 24 377,4 39 342,2
10 338,2 25 341,2 40 362,6
11 375,6 26 316,0 41 315,4
12 379,2 27 370,0 42 366,2
13 341,6 28 401,0 43 361,4
14 355,4 29 347,0 44 375
15 363,8 30 373,8 45 401,4
16 339,6 31 382,8 46 337
17 348,2 32 320,4 47 387,4
18 430,8 33 313,6 48 349,2
19 388,8 34 387,6 49 336,8
20 352,8 35 314,8 50 364,6
19
Variabilidade Amostral: exemplo
Densidade

20
Média amostral
Distribuição de Amostragem

▪ A distribuição que seria formada ao considerar o valor de


uma estatística da amostra para cada possível diferente
amostra de um dado tamanho é chamada a sua
distribuição de amostragem.

21
Distribuição Amostral da
Média Amostral
22
Exemplo: Derivando a Distribuição de
Amostragem de uma Estatística

▪ Uma certa marca de MP3 player é vendida em três


configurações: com 2 GB de memória, custando US$80,
um modelo de 4 GB com preço de US$100 e uma versão
de 8 GB com preço de US$120. Se 20% de todos os
compradores escolherem o modelo de 2 GB, 30%
escolherem os 4 GB e 50% escolherem o modelo de 8
GB, então a distribuição de probabilidade do custo de
uma única compra de MP3 player selecionada
aleatoriamente é dada por:

Prof. Augusto C. Souza - 2018/2


Exemplo: Derivando a Distribuição de
Amostragem de uma Estatística

𝒙 80 100 120
Pr(𝑋 = 𝑥) 0,2 0,3 0,5

𝜇 = 106

𝜎 2 = 244
Prof. Augusto C. Souza - 2018/2
Exemplo: Derivando a Distribuição de
Amostragem de uma Estatística
▪ Suponha que apenas dois tocadores de MP3 sejam vendidos hoje.
▪ Seja 𝑋1 = o custo do primeiro tocador e 𝑋2 = o custo do segundo.
Suponha que 𝑋1 e 𝑋2 sejam independentes, cada um com a
distribuição de probabilidade mostrada de 𝑋, de modo que 𝑋1 e 𝑋2
constituam uma amostra aleatória da distribuição 𝑋.
▪ A Tabela a seguir lista possíveis pares (𝑥1 , 𝑥2 ), a probabilidade de
cada par usando com referência 𝑋 e a suposição de independência
e os valores resultantes 𝑥 e 𝑠 2 .
▪ Quando 𝑛 = 2, 𝑠 2 = 𝑥1 − 𝑥 2 𝑝 𝑥1 + 𝑥2 − 𝑥 2 𝑝 𝑥2

Prof. Augusto C. Souza - 2018/2


Exemplo: Derivando a Distribuição de
Amostragem de uma Estatística
𝒙𝟏 𝒙𝟐 𝒑 𝒙𝟏 , 𝒙𝟐 𝒙 𝒔𝟐
80 80 (0,2)(0,2)=0,04 80 0
80 100 (0,2)(0,3)=0,06 90 200
80 120 (0,2)(0,5)=0,10 100 800
100 80 (0,3)(0,2)=0,06 90 200
100 100 (0,3)(0,3)=0,09 100 0
100 120 (0,3)(0,5)=0,15 110 200
120 80 (0,5)(0,2)=0,10 100 800
120 100 (0,5)(0,3)=0,15 110 200
120 120 (0,5)(0,5)=0,25 120 0
Prof. Augusto C. Souza - 2018/2
Exemplo: Derivando a Distribuição de
Amostragem de uma Estatística

▪ Distribuição de probabilidade de 𝑋

𝑃 𝑋 = 100 = 0,10 + 0,09 + 0,10 = 0,29

𝒙 80 90 100 110 120


𝑃 𝑋=𝑥 0,04 0,12 0,29 0,30 0,5

Prof. Augusto C. Souza - 2018/2


Exemplo: Derivando a Distribuição de
Amostragem de uma Estatística

▪ Distribuição de probabilidade de 𝑠 2

𝑃 𝑠 2 = 800 = 𝑃 𝑋1 = 80, 𝑋2 = 120 + 𝑃 𝑋1 = 120, 𝑋2 = 80


= 0,10 + 0,10 = 0,20

𝒔𝟐 0 200 800
𝑝𝑠 2 𝑠 2 0,38 0,42 0,20

Prof. Augusto C. Souza - 2018/2


Exemplo: Derivando a Distribuição de
Amostragem de uma Estatística

Histograma de probabilidade para a distribuição


original de 𝑋 e a distribuição 𝑋

Prof. Augusto C. Souza - 2018/2


Exemplo: Derivando a Distribuição de
Amostragem de uma Estatística

𝐸 𝑋 = 𝑥𝑝 𝑥 = 80 0,04 + ⋯ + 120 0,25 = 106 = 𝜇

𝑉 𝑋 = 𝑥 − 𝜇 2𝑝 𝑥 = 𝑥 − 106 2 𝑝 𝑥
2 2
= 80 − 106 0,04 + ⋯ + 120 − 106 0,25 = 122
244 𝜎2
Note que: 𝑉 𝑋 = 122 = =
2 𝑛
𝐸 𝑆2 = 𝑠 2 𝑝 𝑠 2 = 0 0,38 + 200 0,42 + 800 0,20 = 244 = 𝜎 2

Prof. Augusto C. Souza - 2018/2


Exemplo: Derivando a Distribuição de
Amostragem de uma Estatística

▪ Se quatro MP3 players foram comprados...


▪𝑛=4
𝒙 80 85 90 95 100 105 110 115 120
𝑝(𝑥) ,0016 ,0096 ,0376 ,0936 ,1761 ,2340 ,2350 ,1500 0,625

𝐸 𝑋 = 106 = 𝜇
𝜎2 𝜎2
𝑉 𝑋 = 61 = =
4 𝑛

Prof. Augusto C. Souza - 2018/2


Distribuição Amostral da Média Amostral

▪ Se o objetivo de um estudo é fazer inferência


sobre a média populacional, qual estatística
devemos considerar?
▪ Média amostral (𝑥)
▪ Para entendermos porque procedimentos de
inferência para 𝜇 com base em 𝑥 funcionam,
precisamos estudar a variabilidade amostral de 𝑥.
▪ Distribuição amostral de 𝑥.

32
Distribuição Amostral da Média Amostral

▪ Determinantes das propriedades da distribuição


amostral de 𝑥 :
▪ Tamanho da amostra (n);
▪ Características da população:
▪ Forma;
▪ Média (𝜇)
▪ Desvio Padrão (s)

33
Distribuição Amostral da Média Amostral

▪ Exemplo 1:
▪ Tamanho das plaquetas sanguíneas:
Um artigo apresentou dados sugerindo que a distribuição do
tamanho das plaquetas para pacientes com dor no peito não
cardíaca é aproximadamente normal com média m = 8,25 e
desvio padrão s = 0,75.

34
Distribuição Amostral da Média Amostral

▪ Exemplo 1 - Experimento:
1. Selecionar 500 amostras aleatórias da população.
▪ Tamanho de cada amostra: n = 5.
2. Calcular a média para cada amostra.
3. Fazer um histograma das 500 médias calculadas.
4. Repetir o procedimento para amostras de tamanhos: n = 10, n
= 20 e n = 30.

35
Obs.:
1. Forma
2. Centro
3. Dispersão

… 𝒙 baseada em
uma amostra de
tamanho grande
tende a estar mais
próxima de 𝝁 do que
𝒙 baseada em uma
amostra pequena …

36
Distribuição Amostral da Média Amostral

▪ Exemplo 2: População não normal


▪ Duração de prorrogação
Dados sobre a duração da prorrogação para todos os jogos de
play-off da National Hockey League de 1970 a 1993 que foram
para a prorrogação.

m = 9,841

Mediana = 8,000

37
Distribuição Amostral da Média Amostral

▪ Exemplo 2 - Experimento:
1. Selecionar 500 amostras aleatórias da população.
▪ Tamanho de cada amostra: n = 5.
2. Calcular a média para cada amostra.
3. Fazer um histograma das 500 médias calculadas.
4. Repetir o procedimento para amostras de tamanhos: n = 10, n
= 20 e n = 30.

38
Obs.:
1. Centro
2. Dispersão
3. Forma

39
Forma

A forma normal do
histograma para
𝑛 = 30 é o que é
previsto pelo
Teorema Central
Limite.

40
Teorema Central do Limite

Mesmo se a distribuição dos valores populacionais tem


nenhuma semelhança com uma curva normal, a
distribuição amostral da média amostral (𝑥) será
aproximadamente normal (em sua forma) quando o
tamanho da amostra n for razoavelmente grande.

41
Propriedades Gerais da Distribuição Amostral
de 𝑥.

Seja 𝑥 a média das observações de uma amostra aleatória


simples de uma população com média 𝜇 e desvio padrão
𝜎. Seja 𝜇𝑥 o valor da média da distribuição de 𝑥 e 𝜎𝑥 o
desvio padrão da distribuição de 𝑥. Então, as seguinte
regras valem:

42
Propriedades Gerais da Distribuição Amostral
de 𝑥.
Regra 1: 𝜇𝑥 = 𝜇
𝜎
Regra 2: 𝜎𝑥 = Esta regra é exata se a população é infinita e é
√𝑛
aproximadamente correta se a população é finita e não mais do que
10% da população está incluída na amostra.
Regra 3: Quando a distribuição da população é normal, a distribuição de
amostragem de também é normal para qualquer tamanho da amostra
n.
Regra 4: (Teorema Central do Limite) Quando n é suficientemente grande,
a distribuição amostral de 𝑥 é bem aproximada por uma curva normal,
mesmo quando a distribuição da população não é em si normal.

43
Propriedades Gerais da Distribuição Amostral
de 𝑥.

População População

44
Propriedades Gerais da Distribuição Amostral
de 𝑥.

▪ O Teorema do Limite Central (Regra 4) estabelece que,


quando n é suficientemente grande, a distribuição 𝑥 é
aproximadamente normal, não importa qual a forma da
distribuição da população.
▪ Este resultado permitiu à estatística desenvolver
procedimentos para a realização de inferências sobre
uma média populacional m usando uma grande amostra,
mesmo quando a forma da distribuição da população é
desconhecida.

45
Propriedades Gerais da Distribuição Amostral
de 𝑥.
▪ Recorde-se que uma variável é padronizada subtraindo o valor
médio e depois dividindo por seu desvio padrão. Usando as Regras
1 e 2 para padronizar 𝑥, obtemos duas importantes regras:

Se n é grande ou a distribuição populacional é normal, então, o valor


padronizado
𝑥 − 𝜇𝑥 𝑥 − 𝜇𝑥
𝑧= = 𝜎 ~𝑁 0,1
𝜎𝑥
𝑛
tem (pelo menos aproximadamente) uma distribuição normal padronizada (Z)

46
Propriedades Gerais da Distribuição Amostral
de 𝑥.

▪ Regra de ouro para decidir se n é realmente


suficientemente grande.
▪ Quão grande necessita ser o n para que a distribuição de 𝑥 se
aproxime de uma normal depende de quanto a distribuição da
população difere de uma distribuição normal.
▪ Quanto mais próxima de uma normal for a distribuição da
população, menor será o valor necessário de n para que a
aproximação pelo Teorema do Central Limite seja precisa.

47
Propriedades Gerais da Distribuição Amostral
de 𝑥.

▪ Regra de ouro para decidir se n é realmente


suficientemente grande.
▪ A literatura costuma recomendar a seguinte regra:

O Teorema do Limite Central pode


seguramente ser aplicado se n for superior a
30.

48
Exercício 1 – Duração do canto de Bluethroats
▪ Bluethroats masculinos têm um canto
complexo que parece ser usado para
atrair as fêmeas. Seja X a duração de
um canto selecionado aleatoriamente
(em segundos) para um Bluethroat do
sexo masculino.
▪ Suponha que o valor médio da
duração de um canto seja m = 13,8
seg. e que o desvio padrão da
duração do canto seja s = 11,8 seg.
▪ Estudos reportam que o conto não é
normalmente distribuído.
49
Exercício 1 – Duração do canto de Bluethroats
▪ Descreva a distribuição amostral da média amostral baseada em
uma amostra aleatória do tempo de n = 25 cantos.
1. Média da distribuição amostral da média amostral.
𝜇𝑥 = 13,8 𝑠𝑒𝑔.
2. Desvio Padrão da distribuição amostral da média amostral.
𝜎 11,8
𝜎𝑥 = = = 2,36
𝑛 25
3. Forma?

50
Exercício 1 – Duração do canto de Bluethroats

3. Forma

Porque a distribuição da população não é normal e porque


o tamanho da amostra não é maior do que 30, não
podemos assumir que a distribuição amostral de 𝒙 é
normal na sua forma.

51
Exercício 2 – Volumes de latas de refrigerantes

▪ Um fabricante de refrigerantes afirma que as suas latas


de refrigerante contêm , em média, 12 oz. Seja X o
volume real de refrigerante em uma lata selecionada
aleatoriamente. Suponha que X seja normalmente
distribuído com 𝜎 = 0,16 𝑜𝑧 . Dezesseis latas são
selecionados ao acaso e o volume de refrigerante será
determinado para cada uma. Seja 𝑥 a média amostral do
volume de refrigerante das 16 latas selecionadas.

52
Exercício 2 – Volumes de latas de refrigerantes
▪ Como a distribuição de X é normal, a distribuição amostral de 𝑥
também é normal.
▪ Se a afirmação do fabricante está correta, a distribuição amostral
de 𝑥 tem um valor médio de
𝜇𝑥 = 𝜇 = 12
e um desvio padrão de
𝜎 0,16
𝜎𝑥 = = = 0,04
𝑛 16

53
Exercício 2 – Volumes de latas de refrigerantes

▪ Qual é a probabilidade de que o volume amostral médio


de refrigerante esteja entre 11,96 oz e 12,08 oz?

▪ Para calcular uma probabilidade envolvendo 𝑥 , devemos


padronizar 𝑥 :
54
Exercício 2 – Volumes de latas de refrigerantes

▪ Padronizando 𝑥:
11,96  12
Limite inferior : LI   10
0,04

12,08 - 12
Lmite Superior : LS   2,0
0,04

55
Exercício 2 – Volumes de latas de refrigerantes
▪ Solução:

𝑃 11,96 ≤ 𝑥 ≤ 12,08 = 𝑃 −1,0 ≤ 𝑍 ≤ 2,0

= 1 − 𝑃 𝑍 > 2,0 − 𝑃 𝑍 > 1,0


𝑡𝑎𝑏𝑒𝑙𝑎 𝑡𝑎𝑏𝑒𝑙𝑎

= 1 − 0,0228 − 0,1587

= 0,8115

56
Exercício 2 – Volumes de latas de refrigerantes
▪ Qual é a probabilidade de que o volume amostral médio de refrigerante seja no
máximo 11,9 oz.

 11,9  12 
Px  11,9  P z  
 0,04 
 Pz  2,5  Pz  2,5
 ,5
0 P0  z
 2,
5 
área acima área entre
da média (zero) 0 e 2,5
 0,5  0,4938  0,0062
57
Exercício 2 – Volumes de latas de refrigerantes

▪ Se a distribuição X for como descrito pelo fabricante e a


afirmação sobre o volume médio estiver correta, uma
média amostral do volume de refrigerante com base em
16 observações é inferior a 11,9 oz em menos de 1% de
todas as referidas amostras. Assim, a observação de um
valor 𝑥 que seja menor do que 11,9 oz lançaria dúvidas
sobre a afirmação do fabricante de que o volume de
médio de latas de refrigerante é de 12 oz.

58
Exercício 3 - Teor de gordura em cachorro
quente

▪ Um fabricante de cachorro-quente afirma que uma de


suas marcas de cachorro-quente tem um teor médio de
gordura de m = 18g por cachorro-quente. Os
consumidores desta marca, provavelmente, não irão se
incomodar se a média for inferior a 18g, mas ficariam
insatisfeitos se fosse superior a 18g. Seja X o teor de
gordura de um cachorro-quente escolhido aleatoriamente
e suponha que s, o desvio-padrão da distribuição de X,
seja 1.

59
Exercício 3 - Teor de gordura em cachorro-
quente

▪ Uma organização que realiza testes independentes é


solicitada a analisar uma amostra aleatória de 36
cachorros-quentes. Seja 𝑥 o teor médio de gordura
para esta amostra. O tamanho da amostra, n = 36, é
grande o suficiente para aplicar o TCL ou TLC. Assim,

𝜎 1
𝜎𝑥 = = = 0,1667
𝑛 36

60
Exercício 3 - Teor de gordura em cachorro-
quente

▪ Se a afirmação do fabricante esta correta, sabemos que

𝜇𝑥 = 𝜇 = 18𝑔

▪ Suponha que a amostra resultou numa média de 18,4g.


Este resultado sugere que a afirmação do fabricante está
correta?

61
Exercício 3 - Teor de gordura em cachorro-
quente

▪ Podemos responder a esta pergunta olhando para a


distribuição amostral de 𝑥. Devido à variabilidade
amostral, mesmo com m = 18, sabemos que 𝑥,
geralmente, não será exatamente 18g.

▪ Mas é provável que veríamos uma média amostral pelos tão


grande quanto 18,4 quando a média da população é realmente
18g? Se a afirmação do fabricante está correta,

62
Exercício 3 - Teor de gordura em cachorro-
quente

 18,4  18 
Px  18,4  P z  
 0,1667 
 Pz  2,4  0,0082

63
64

Exercícios
1. Uma amostra aleatória simples é selecionada
de um população com média m = 100 e desvio
padrão s = 10. Determine a média e o desvio
padrão da distribuição amostral de 𝑥 para cada
tamanho de amostra a seguir:
a. n = 9 e. n = 50
b. n = 15 f. n = 100
c. n = 36 g. n = 400
d. n = 50
Exercício: Revisão

2. Para que tamanho de amostra do exercício anterior


seria razoável pensar que a distribuição amostral de 𝑥
tem uma forma aproximadamente normal?

3. Explique a diferença entre 𝜎 e 𝜎𝑥 e entre 𝜇 e 𝜇𝑥 .

65
Exercício 7: Revisão

▪ Suponha que uma amostra aleatória simples de


tamanho 64 é selecionada de uma população com
média 40 e desvio padrão 5.
a. Qual é a média e o desvio padrão da distribuição
amostral de 𝑥 ? Descreva a forma da distribuição de 𝑥.
b. Qual é, aproximadamente, a probabilidade de que 𝑥
estará afastada da média populacional no máximo 0,5?
c. Qual é, aproximadamente, a probabilidade de que 𝑥 irá diferir de 𝜇 por mais 0,7?

66
Distribuição Amostral da
proporção Amostral
67
Distribuição Amostral da Proporção Amostral
▪ O objetivo de muitas investigações estatísticas é fazer afirmações sobre a
proporção de indivíduos ou objetos em uma população que possuem
uma característica específica.
▪ Consumidores de café que consomem regularmente café descafeinado.
▪ Eleitores que têm intenção de votar em determinado candidato.

▪ S: indivíduo ou objeto que possui a propriedade de interesse (sucesso).


▪ F: indivíduo ou objeto que não possui a propriedade de interesse (falha).
𝑆
▪ p: proporção de sucessos da população. 𝜋 =
𝑆+𝐹

68
▪ Estatística p:
▪ Base para inferência sobre 𝜋.
número de sucessos na amostra #𝑆
𝑝= =
𝑛 𝑛
▪ Para fazer inferência sobre 𝜋, devemos, primeiramente, aprender
sobre as propriedades da distribuição amostral da estatística p.
▪ Por exemplo: quando 𝑛 = 5, os seis possíveis valores de p são: 0;
0,2 (de 1/5); 0,4; 0,6; 0,8 e 1.
▪ A distribuição de 𝑝 fornece a probabilidade de cada um dos seis
valores.

Prof. Augusto C. Souza - 2018/2


Distribuição Amostral da Proporção Amostral

▪ Exemplo 1: Gênero de Estudantes Universitários


▪ Em 2004, havia 16.636 estudantes matriculados em uma
determinada universidade. Destes, 6.983 eram mulheres (42%).
Seja S a representação para um estudante do gênero feminino e
F um estudante masculino. A proporção de S na população é p =
0,42.

70
Distribuição Amostral da Proporção Amostral

▪ Exemplo 1: Experimento
1. Selecionar 500 amostras aleatórias da população.
▪ Tamanho de cada amostra: n = 5.
2. Calcular a proporção de S em cada amostra.
3. Fazer um histograma das 500 proporções p calculadas.
4. Repetir o procedimento para amostras de tamanhos: n = 10, n
= 25 e n = 50.

71
Obs.:
1. Forma
2. Centro
3. Dispersão

… o valor de p
baseado em uma
grande amostra tende
a estar mais próximo
de p do que uma p
baseada em uma
amostra pequena…
72
Distribuição Amostral da Proporção Amostral

▪ Exemplo 2: Contraindo hepatite de Transfusão de Sangue


▪ O desenvolvimento de hepatite viral após uma transfusão de
sangue pode levar a graves complicações para o paciente.
Pesquisas mostram que a hepatite ocorre em 7% dos pacientes
que recebem múltiplas transfusões de sangue durante uma
cirurgia cardíaca.
▪ Vamos simular a seleção de uma AAS da população de
receptores de sangue, com S denotando um destinatário que
contraiu hepatite, p = 0,07.

73
Distribuição Amostral da Proporção Amostral

▪ Exemplo 2: Experimento
1. Selecionar 500 amostras aleatórias da população.
▪ Tamanho de cada amostra: n = 5.
2. Calcular a proporção de S em cada amostra.
3. Fazer um histograma das 500 proporções p calculadas.
4. Repetir o procedimento para amostras de tamanhos: n = 10, n
= 25 e n = 50.

74
Obs.:
1. Forma
2. Centro
3. Dispersão

* Somente com n =
100 a forma da
distribuição se
aproxima bem de
uma normal.

* A aproximação da
distribuição de p por
uma normal depende
de n e p… 75
Propriedades gerais da distribuição amotral de
p
▪ Seja p a proporção de sucessos em uma AAS de tamanho n de
uma população na qual a proporção de S é p. Seja o valor médio
de p denotado por 𝜇𝑝 e o desvio padrão de 𝜎𝑝 . Então as seguintes
regras valem:
▪ Regra 1: 𝜇𝑝 = 𝜋
𝜋 1−𝜋
▪ Regra 2: 𝜎𝑝 = . Esta regra é exata se a população é infinita e é
𝑛
aproximadamente correta se a população é finita e não mais que 10% da
população pertence à amostra.
▪ Regra 3: Quando n é grande e p não está muito próximo de 0 ou 1, a
distribuição de amostragem de p é aproximadamente normal.

76
Propriedades gerais da distribuição amostral de
p
▪ Quanto mais o valor de p se afasta de 0,5, maior deve ser o n para
que a aproximação da distribuição amostral de p pela normal seja
exata.

▪ Uma regra de ouro conservadora é que se ambos 𝑛𝜋10 e


𝑛 1 − 𝜋 10, então uma distribuição normal é uma aproximação
razoável para a distribuição amostral de p.

77
Propriedades gerais da distribuição amostral de
p
▪ Um tamanho de amostra de n=100 não é, por si só, suficiente para
justificar a utilização de uma aproximação normal.
▪ Se p = 0,01, a distribuição de p é extremamente assimétrica à direita, por
isso uma curva na forma de sino não dá uma boa aproximação.
▪ Do mesmo modo, se n = 100 e p = 0,99 (de modo que 𝑛 1 − 𝑝 = 1 <
10), a distribuição de p tem uma inclinação negativa substancial. As
condições 𝑛𝑝10 e 𝑛 1 − 𝑝 10 garantem que a distribuição amostral de
p não é muito assimétrica. Se p = 0,5, a aproximação normal pode ser
usada para n tão pequeno como 20, enquanto que para p = 0,05 ou 0,95,
n deve ser de pelo menos igual a 200.

78
Exemplos

▪ Transfusão de Sangue (continuação)


▪ A proporção de pacientes cardíacos que recebem transfusões de
sangue que contraem hepatite é 0,07.
▪ Suponha que um novo processo de triagem do sangue é testado
e acredita-se que ele reduza a taxa de incidência de hepatite.
Testes ​utilizando este procedimento é aplicado a n = 200
receptores de sangue. Apenas 6 dos 200 pacientes contraíram
hepatite. Isto parece ser um resultado favorável, uma vez que p =
6/200 = 0,03.

79
Exemplos

▪ Transfusão de Sangue (continuação)


▪ A questão de interesse aqui é:

Será que este resultado indica que a verdadeira proporção dos


pacientes (longo prazo) que contraem hepatite quando o novo
procedimento de triagem é usado é inferior a 0,07, ou este
resultado poderia ser plausivelmente atribuído à variabilidade
amostral (isto é, o fato de que p é geralmente diferente da
proporção da população, p)?

80
Exemplos

▪ Transfusão de Sangue (continuação)


▪ Se o novo procedimento de triagem do sangue é ineficiente e p =
0,07,

▪ 𝜇𝑝 = 𝜋 = 0,07

𝜋 1−𝜋 0,07 0,93


▪ 𝜎𝑝 = = = 0,018
200 200

81
Exemplos

▪ Transfusão de Sangue (continuação)


▪ Porque,

𝑛𝜋 = 200 0,07 = 14 ≥ 10
e
𝑛 1 − 𝜋 = 200 0,93 = 186 ≥ 10

a distribuição amostral de p é aproximadamente normal

82
Exemplos

▪ Transfusão de Sangue (continuação)


▪ Logo, se o procedimento de triagem é ineficiente,

0,03 − 0,07
𝑃 𝑝 < 0,03 = 𝑃 𝑧 <
0,108

= 𝑃 𝑧 < −2,22
= 0,0132

83
Exemplos

▪ Transfusão de Sangue (continuação)


▪ Assim, é improvável que uma proporção amostral de 0,03 ou
menor fosse observada se o procedimento de triagem fosse
ineficaz. O procedimento de novo triagem aparece obter uma taxa
menor de incidência para a hepatite.

84

Você também pode gostar