Você está na página 1de 13

1

CURSO: ENGENHARIA MECÂNICA PROFESSOR: MAMORU YAMADA

UNIVERSIDADE DE FRANCA DISCIPLINA: PROBABILIDADE E ESTATÍSTICA AULA 09: DISTRIBUIÇÃO AMOSTRAL

9 Introdução

A Estatística se interessa por conclusões e predições originadas de resultados eventuais que

ocorrem em experimentos ou investigações cuidadosamente planejados.

Esses resultados eventuais constituem um subconjunto ou amostra de medidas ou observações

de um conjunto maior de valores, chamado população. No entanto, nem todas as amostras prestam para

validar generalizações a respeito de populações, das quais foram obtidas.

Muitos dos métodos de inferência são baseados em amostragens aleatórias simples (AAS) com

reposição, ou seja, é permitido que uma unidade possa ser sorteada mais de uma vez. Na AAS sem

reposição, a unidade sorteada é removida da população.

Amostrar sem reposição é mais adequado, do ponto de vista da quantidade de informação contida

na amostra. Porém, a amostragem com reposição conduz a um tratamento teórico mais simples, pois ela

implica que se tem independência entre as unidades selecionadas, o que facilita o desenvolvimento das

propriedades dos estimadores que serão considerados nas aulas seguintes.

9.1 Amostragem aleatória simples com reposição

Veja o exemplo a seguir: vamos retirar uma AAS de cinco alturas (em cm) de uma população de

mulheres cujas alturas X seguem a distribuição N (167; 25).

Usando-se um gerador de números aleatórios, obtemos a seguinte amostra:

x 1 = 165, x 2 = 161,

x 3 = 168,

x 4 = 173,

x 5 = 173

Se formos gerar uma outra amostra de cinco alturas, poderemos obter valores diferentes da

amostra acima. Observe que o primeiro elemento a ser observado (que podemos indicar por X 1 ) pode ser

qualquer valor da população N (167; 25). Podemos, então, concluir que X 1 ~ N (167; 25). Como a geração

do segundo número aleatório é feita independentemente do primeiro, temos que a v.a. X 2 (valor observado

na segunda extração), também segue uma distribuição N (167; 25), e assim sucessivamente.

Formalizando: uma amostra aleatória simples com reposição de tamanho n, de uma variável aleatória

X com uma dada distribuição, é o conjunto de n variáveis aleatórias independentes X 1 , X 2 , uma com a mesma distribuição de X.

, X n , cada

9.2 Estatística e parâmetro

Obtida uma amostra, muitas vezes desejamos usá-la para produzir alguma característica

específica. Exemplo: podemos calcular a média de uma amostra.

Estatística ou estimador é qualquer função de uma amostra aleatória (fórmula ou expressão),

construída com o propósito de servir como instrumento para descrever alguma característica da amostra e

para fazer inferência a respeito da característica na população. As estatísticas mais comuns são:

2

n 1 • Média da amostra: x = ∑ n i = 1 • Variância
n
1
• Média da amostra:
x =
n
i = 1
• Variância da amostra:
2
s
=
• Proporção da amostra:
pˆ =

x

i

1 (x

n

n

x

1

i

=

1

, onde:

n

i

x)

2

(9.1)

(9.2)

(9.3)

x = número de elementos da amostra que apresentam uma característica; n = tamanho da amostra Parâmetro é uma medida usada para descrever uma característica da população. Parâmetros são funções de valores populacionais, enquanto que estatísticas são funções de valores amostrais. Os símbolos mais comuns estão representados na tabela 9.1.

Tabela 9.1 – Símbolos mais comuns utilizados para representar valores de estatísticas e de parâmetros

 

Estatística

Parâmetro

Média Variância Número de elementos Proporção

x

µ

s

2

2

σ

n

N

p

9.3 Distribuição amostral

Vamos retomar o exemplo dos gerentes da aula anterior. Neste exemplo, foram levantados todos os valores de salários anuais da população de 2.500 gerentes. Foram calculados os seguintes parâmetros:

µ = US$ 51.800,00; σ = US$ 4.000,00 Além disso, foi levantada também a informação sobre a participação dos gerentes em um treinamento gerencial. Este levantamento mostrou que 1.500 dos 2.500 gerentes participaram do treinamento, ou seja:

p = 1.500 / 2.500 = 0,60. Suponha, agora, que os dados dos 2.500 gerentes não estão disponíveis, e o diretor da corporação quer fazer uma análise sobre os salários dos gerentes. Assim, foi obtida uma AAS de 30 gerentes da corporação. Foram coletadas as seguintes variáveis: valor do salário anual e participação em treinamento gerencial. Estas informações estão relacionadas na tabela 9.2. Esta amostra nos fornece as seguintes estatísticas:

x = 51.814,00; s = 3.347,72; pˆ = 0,63.

Vamos supor, agora, que foi selecionada outra AAS de 30 gerentes da mesma corporação, sendo que as estatísticas desta segunda amostra foram:

x = 52.669,70; s = 4.239,07; pˆ = 0,70.

Os resultados da segunda amostra diferem dos da primeira. Em geral, isto deve ocorrer sempre que uma nova amostra for obtida, pois cada AAS conterá elementos diferentes da amostra anterior. Suponha, então, que repetimos o processo de amostragem aleatória simples para a população de

2.500 gerentes, até obtermos 500 amostras de 30 gerentes, e os seus respectivos valores de x , s e pˆ .

3

Tabela 9.2 – Amostra de 30 gerentes, com os salários anuais e participação em treinamento gerencial

Elemento da amostra

Salário anual (US$)

Programa de treinamento gerencial?

x

1

49.094,30

Sim

x

2

53.263,90

Sim

x

3

49.643,50

Sim

x

4

49.894,90

Sim

x

5

47.621,60

Não

x

6

55.924,00

Sim

x

7

49.092,30

Sim

x

8

51.404,40

Sim

x

9

50.957,70

Sim

x

10

55.109,70

Sim

x

11

45.922,60

Sim

x

12

57.268,40

Não

x

13

55.688,80

Sim

x

14

51.564,70

Não

x

15

56.188,20

Não

x

16

51.766,00

Sim

x

17

52.541,30

Não

x

18

44.980,00

Sim

x

19

51.932,60

Sim

x

20

52.973,00

Sim

x

21

45.120,90

Sim

x

22

51.753,00

Sim

x

23

54.391,80

Não

x

24

50.164,20

Não

x

25

52.973,60

Não

x

26

50.241,30

Não

x

27

52.793,90

Não

x

28

50.979,40

Sim

x

29

55.860,90

Sim

x

30

57.309,10

Não

Tabela 9.3 – Amostra de 30 gerentes, com os salários anuais e participação em treinamento gerencial

Número da amostra

Média da amostra ( x )

Desvio padrão da amostra (s)

Proporção da amostra ( pˆ )

1

51.814,00

3.347,72

0,63

2

52.669,70

4.239,07

0,70

3

51.780,30

4.433,43

0,67

4

51.587,90

3.985,32

0,53

.

.

.

.

.

.

.

.

.

.

.

.

500

51.752,00

3.857,82

0,50

4

Recordando: uma variável aleatória é uma descrição numérica do resultado de um experimento.

Se considerarmos o processo de seleção de uma AAS como um experimento, a média da amostra x é a

descrição numérica do resultado do experimento. Portanto, a média da amostra x é uma v.a. Assim, x tem uma média ou valor esperado, uma variância e uma distribuição de probabilidade. Como os vários valores

possíveis de x são os resultados de diferentes AAS’s, a distribuição de probabilidade de x é chamada de

distribuição amostral de x .

A partir da distribuição amostral de x e de suas propriedades, é possível fazer declarações sobre

a distância que x está da média da população µ. Voltando à tabela 9.3, podemos construir uma tabela de distribuição de frequência para a média

da amostra x (tabela 9.4), e o histograma da distribuição de frequência relativa para os valores de x (figura

9.1).

Tabela 9.4 – Distribuição de frequência de x , a partir de 500 amostras de 300 gerentes

Salário médio anual (US$)

Frequência absoluta n i

Frequência relativa f i

49.500,00 |– 49.999,99 50.000,00 |– 50.499,99 50.500,00 |– 50.999,99 51.000,00 |– 51.499,99 51.500,00 |– 51.999,99 52.000,00 |– 52.499,99 52.500,00 |– 52.999,99 53.000,00 |– 53.499,99 53.500,00 |– 53.999,99 Total

2

0,004

16

0,032

52

0,104

101

0,202

133

0,266

110

0,220

54

0,108

26

0,052

6

0,012

500

1,000

50.000 51.000 52.000 53.000 54.000 x
50.000
51.000
52.000
53.000
54.000
x

0,30

0,25

0,20

0,15

0,10

0,05

Frequência

relativa

Figura 9.1 – Histograma da distribuição de frequência relativa de x , a partir de 500 amostras de 30 gerentes

O histograma dos 500 valores de x nos fornece uma aproximação da forma da distribuição

amostral. Ela se assemelha à forma de sino de uma distribuição normal. Notamos uma maior concentração

dos valores de x e da média dos 500 valores de x em torno da média da população µ = 51.800,00. As propriedades desta distribuição amostral serão detalhadas adiante.

As figuras 9.2 e 9.3 apresentam os histogramas das distribuições de frequência dos 500 valores

do desvio padrão da amostra e da proporção da amostra, respectivamente.

5

Frequência relativa 0,30 0,25 0,20 0,15 0,10 0,05 2.600 3.000 3.400 3.800 4.200 4.600 5.000
Frequência
relativa
0,30
0,25
0,20
0,15
0,10
0,05
2.600 3.000 3.400 3.800 4.200 4.600 5.000 5.400
s

Figura 9.2 – Histograma da distribuição de frequência relativa de s, a partir de 500 amostras de 30 gerentes

Frequência

relativa

0,40

0,35

0,30

0,25

0,20

0,15

0,10

0,05

0,32 0,40 0,48 0,56 0,64 0,72 0,80 0,88 pˆ
0,32
0,40
0,48
0,56
0,64
0,72
0,80
0,88

Figura 9.3 – Histograma da distribuição de frequência relativa de pˆ , a partir de 500 amostras de 30 gerentes

Como no caso de x , tanto s quanto pˆ são variáveis aleatórias que fornecem descrições

numéricas do resultado de uma AAS. Portanto, s e pˆ têm uma média ou valor esperado, uma variância e

uma distribuição amostral de probabilidade. Os histogramas das figuras 9.2 e 9.3 mostram uma

aproximação da forma dessas distribuições amostrais.

Formalizando: toda estatística, sendo uma função de uma amostra aleatória X 1 , X 2 ,

uma v.a. e tem uma distribuição, pois, em relação a várias amostras, a estatística muda de valor de acordo com a distribuição determinada a partir daquela que controla a amostra aleatória. Com isso, o comportamento da estatística pode ser descrito por alguma distribuição de probabilidade. Assim, cada estatística é uma v.a. e sua distribuição de probabilidade é chamada de distribuição amostral da estatística.

, X n , é também

Esquematicamente, teríamos o procedimento apresentado na Figura 9.4, onde η é o parâmetro de

interesse na população e h é o valor da estatística H para cada amostra.

6

População X η
População
X
η

Amostras

1 2 h 1 h 2

1

1 2 h 1 h 2

2

h 1
h
1
h 2
h
2
X η A m o s t r a s 1 2 h 1 h 2
X η A m o s t r a s 1 2 h 1 h 2
X η A m o s t r a s 1 2 h 1 h 2

k

.

.

.

h k
h
k

População da estatística H

h 1 , h 2 , , h k η H
h 1 , h 2 ,
,
h k
η
H

Figura 9.4 – Procedimento para construção da distribuição amostral da estatística H

9.3.1 Características da distribuição amostral de x

Podemos, então, estudar algumas características de uma distribuição amostral. Vamos iniciar pela

distribuição amostral de x .

A distribuição amostral de x é definida como a distribuição de probabilidade de todos os valores

possíveis da média da amostra x .

9.3.1.1 Valor esperado de x

Pode-se provar que, se X 1 , X 2 , E(x)=µ , onde:

E(x) = valor esperado de x ;

• µ = média da população.

Ou seja, com a AAS, o valor esperado ou média para x é igual à média µ da população da qual a

, X n constitui uma AAS de uma população, então:

(9.4)

amostra foi retirada.

No exemplo dos salários dos gerentes:

Como:

µ = 51.800 E(x) = 51.800

9.3.1.2 Desvio padrão de x

Pode-se provar que, se X 1 , X 2 ,

= desvio padrão de x ;

σ

x

, X n constitui uma AAS de uma população e que:

• σ = desvio padrão da população;

n = tamanho da amostra;

N = tamanho da população.

Então:

1. Se a população é finita:

σ

N − n  σ  = ⋅     x N −
N
n  σ 
= ⋅
 
x N − 1
n 

(9.5)

7

2. Se a população é infinita:

σ

σ =

x n
x
n

A diferença entre as equações 9.5 e 9.6 é a existência do fator

N − n N − 1
N
n
N
1

(9.6)

para população finita. Este

fator é chamado de fator de correção da população finita. Em alguns casos práticos, apesar da população

ser finita, o tamanho da amostra é considerado pequeno em relação ao tamanho da população (n << N).

Nestes casos, a população pode ser considerada infinita. Assim, usa-se a equação 9.6 nas seguintes

situações:

1. quando a população é infinita;

2. quando a população é finita e

n 0,05

N

.

No exemplo dos salários dos gerentes:

Como: σ = 4.000 e

n =

N 2.500

30

=

0,012

0,05

, então:

σ

4.000

σ = = x n 30
σ =
=
x
n 30

= 730,30

.

Finalmente, observando as equações 9.5 e 9.6, conforme o tamanho da amostra n aumenta, o

tende a diminuir. Isto significa que quando n torna-se grande, pode-se esperar valores de

desvio padrão

σ

x

x mais próximos de µ, a quantidade que se pretende estimar. Em função disso, o desvio padrão

σ

x

é

chamado de erro padrão da média. Ele é útil para determinar a distância que a média da amostra pode

estar da média da população, conforme veremos adiante.

9.4 Teorema do Limite Central

A distribuição amostral de x foi caracterizada quanto ao valor esperado e ao desvio padrão. Resta

determinar a sua forma. Consideramos dois casos: um no qual a distribuição da população é distribuída

normalmente, e outra no qual a distribuição da população é desconhecida.

No primeiro caso, se x é a média de uma AAS, de tamanho n, de uma população com distribuição

normal, com média µ e variância σ 2 , sua distribuição amostral também é normal, com média µ e variância

2

σ

n

. Ou seja, a distribuição amostral de x é uma

  µ ,

N  

σ 

2

n

.

Para o segundo caso, contamos com um dos mais importantes teoremas em estatística – o

Teorema do Limite Central (TLC). O TLC pode ser anunciado da seguinte forma:

Formalizando: ao selecionar AAS’s de tamanho n a partir de uma população, a distribuição amostral da

média da amostra x pode ser aproximada pela distribuição normal de probabilidade sempre que o

tamanho da amostra for grande. Para AAS’s, o tamanho da amostra é considerado grande para n 30.

O TLC pode ser enunciado de outra forma:

Formalizando: em uma AAS de uma população arbitrária, com média µ e desvio padrão σ , a distribuição

. Em outras

de x , quando n é grande, é aproximadamente normal, com média µ e desvio padrão

σ

n
n
σ / n
σ
/
n

é aproximadamente uma N (0,1).

palavras:

z

=

x −µ

8

A figura 9.5 ilustra graficamente o TLC. As populações I, II e III possuem distribuições diversas. Para n = 2, nenhuma das três distribuições amostrais se aproxima de uma distribuição normal.

amostrais se aproxima de uma distribuição normal. Figura 9.5 – Ilustração do Teorema do Limite Central

Figura 9.5 – Ilustração do Teorema do Limite Central para três populações

Para n = 5, as distribuições começam a se aproximar da forma da distribuição normal. A distribuição amostral da população I já apresenta uma forma semelhante à distribuição normal, enquanto que as distribuições amostrais das populações II e III apresentam formas de sino com uma certa assimetria. Finalmente, para n = 30, as três distribuições amostrais se aproximam bastante da forma da distribuição normal.

Novamente: a distribuição amostral de x de qualquer população, à medida que o tamanho n da amostra aumenta, vai se aproximando da distribuição normal.

9

Assim, voltando ao exemplo dos salários dos gerentes, já havíamos determinado que E(x) = 51.800

. Como a AAS é de 30 gerentes, pelo TLC, a distribuição amostral de x é aproximadamente

e

normal (figura 9.6).

σ =

x

730,30

σ = 730,30 x 51.800
σ
= 730,30
x
51.800

Figura 9.6 – Distribuição amostral de x , para o salário médio anual de uma AAS de 30 gerentes

9.5 Utilização prática da distribuição amostral de x

Vamos exemplificar uma aplicação prática da distribuição amostral de x com o exemplo dos

salários dos gerentes. O diretor acredita que a média da amostra x será uma estimativa aceitável da média

da população µ se x estiver dentro de ±US$500,00 de µ.

Isso, porém, não é possível de garantir com certeza absoluta. Reveja a tabela 9.3 para verificar

que algumas amostras apresentam diferenças de mais de US$2.000,00 de µ.

Por isso, a questão deve ser analisada em termos de probabilidade. A preocupação do diretor

pode ser definida de seguinte forma: qual é a probabilidade de que a média da amostra de uma AAS de 30

gerentes esteja dentro de ±US$500,00 da média da população?

Agora que caracterizamos a distribuição amostral de x , podemos responder à questão acima. A

probabilidade questionada refere-se à probabilidade de x estar entre US$51.300,00 e US$52.300,00 na

distribuição amostral de x (figura 9.7).

σ = 730,30 x Área = 0,25175 Área = 0,25175 51.300 51.800 52.300
σ
= 730,30
x
Área = 0,25175
Área = 0,25175
51.300
51.800 52.300

Figura 9.7 – Probabilidade da média da amostra estar dentro de US$500,00 da média da população

Como a distribuição é normal, com média de 51.800 e desvio padrão de 730,30, podemos usar a

tabela da distribuição normal padrão para encontrar a probabilidade desejada. Para x = 51.300, temos:

z

=

51.300

51.800

730,30

=− 0,68

Na tabela da distribuição normal padrão:

Para z = 0,68 Área = 0,25175. Portanto, a probabilidade do valor de x estar entre 51.300 e

52.300 é de 0,25175 + 0,25175 (por simetria) = 0,50350.

De outro modo: existe uma probabilidade de 1 – 0,50350 = 0,49650 de que x ficará fora da média

da população por mais do que US$500,00.

10

Para melhorar a probabilidade de 0,50350, pode-se tomar uma amostra de tamanho maior. Esta

relação será descrita a seguir.

9.6 Relação entre o tamanho da amostra e a distribuição amostral de x

Vamos supor que, ao invés de selecionarmos uma AAS de 30 gerentes, nós tenhamos

selecionado uma AAS de 100 gerentes. Vamos verificar de que forma o aumento no tamanho da amostra

(de 30 para 100) afeta a análise realizada no item anterior. Primeiramente, temos que E(x) = µ = 51.800 , independentemente do tamanho da amostra.

Já o erro padrão da média é afetado pelo tamanho da amostra. O novo valor é dado por:

σ 4.000

σ = = x n 100
σ =
=
x
n 100

=

400

, ou seja,

σ

x

diminuiu de 730,30 para 400.

A figura 9.8 traz as duas distribuições amostrais de x , com n = 30 e n = 100. Como a distribuição

amostral com n = 100 tem um erro padrão menor, os valores de x têm menor variação e tendem a estar

mais próximos da média da população do que os valores de x com n = 30.

n = 100 σ = 400 x n = 30 σ = 730,30 x 51800
n = 100
σ
= 400
x
n = 30
σ
= 730,30
x
51800

Figura 9.8 – Comparação das distribuições amostrais de x para AAS’s de n = 30 e n = 100 gerentes

Com a definição da nova distribuição amostral de x com n = 100, podemos recalcular o valor de z

para x = 51.800. Assim:

z

=

51.300

51.800

400

=− 1,25

Na tabela da distribuição normal padrão:

Para z = 1,25 Área = 0,39435. Portanto, a nova probabilidade do valor de x estar entre 51.300

e 52.300 é de 0,39435 + 0,39435 (por simetria) = 0,78870.

Assim, aumentando o tamanho da amostra de 30 para 100 gerentes, aumentamos a probabilidade

de obter uma média de amostra dentro de ±US$500,00 da média da população de 0,5035 para 0,7887.

9.7 Distribuição amostral de pˆ

Vamos estudar, agora, algumas características de uma distribuição amostral da proporção pˆ de

uma população. A distribuição amostral de pˆ é definida como a distribuição de probabilidade de todos os valores

11

9.7.1 Valor esperado de pˆ

Seja X 1 , X 2 ,

pode-se provar que:

E(pˆ)= p , onde:

, X n constitui uma AAS de uma população, que possui uma proporção p. Então,

(9.7)

E(pˆ) = valor esperado de pˆ ;

p = proporção da população.

Ou seja, com a AAS, o valor esperado ou média para pˆ é igual à proporção p da população da

qual a amostra foi retirada.

No exemplo da proporção de gerentes que participaram do treinamento gerencial:

Como: p = 0,60 E() = 0,60

9.7.2 Desvio padrão de pˆ

Pode-se provar que, se X 1 , X 2 ,

proporção p e que:

σ

ˆ

p

= desvio padrão de pˆ ;

, X n constitui uma AAS de uma população, que possui uma

p = proporção da população;

n = tamanho da amostra;

N = tamanho da população.

Então:

1. Se a população é finita:

N − n p ⋅ ( 1 − p ) ⋅ N − 1 n
N
− n
p
(
1
p
)
N
− 1
n
p
(
1
p
)
n

σ =

σ =

2. Se a população é infinita:

A diferença entre as equações 9.8 e 9.9 é a existência do fator

N − n N − 1
N
n
N
1

(9.8)

(9.9)

para população finita.

Como no caso da média amostral x , este fator é chamado de fator de correção da população finita. Em

alguns casos práticos, apesar da população ser finita, o tamanho da amostra é considerado pequeno em

relação ao tamanho da população (n << N). Nestes casos, a população pode ser considerada infinita.

Assim, usa-se a equação 9.9 nas seguintes situações:

1. quando a população é infinita;

2. quando a população é finita e

n 0,05
N

.

No exemplo da proporção de gerentes que participaram do treinamento gerencial:

Como:

n =

N 2.500

30

p ⋅ ( 1 − p ) 0,60 ⋅ ( 1 − 0,60 ) =
p
(
1
p
)
0,60
(
1
0,60
)
=
n 30

=

0,012

0,05

, então:

σ =

= 0,0894

.

Finalmente, observando as equações 9.8 e 9.9, conforme o tamanho da amostra n aumenta, o

tende a diminuir. Isto significa que quando n torna-se grande, pode-se esperar valores de

é

desvio padrão

pˆ

σ

ˆ

p

mais próximos de p, a quantidade que se pretende estimar. Em função disso, o desvio padrão

σ

ˆ

p

chamado de erro padrão da proporção. Ele útil para determinar a distância que a proporção da amostra

pode estar da proporção da população, conforme veremos adiante.

12

9.7.3 Forma da distribuição amostral de pˆ

A distribuição amostral de pˆ foi caracterizada quanto ao valor esperado e ao desvio padrão. Resta

determinar a sua forma. Para isso, podemos aplicar o TLC:

Ao selecionar AAS’s de tamanho n a partir de uma população, a distribuição amostral da proporção pˆ pode ser aproximada pela distribuição normal de probabilidade sempre que o tamanho da

amostra for grande. Para AAS’s, o tamanho da amostra é considerado grande para n 30.

O TLC para a proporção pode ser enunciado de outra forma:

Em uma AAS de uma população arbitrária, com proporção p, a distribuição de pˆ , quando n é

. Em outras palavras:

p ⋅ ( 1− p ) n
p ⋅
(
1− p
)
n

grande, é aproximadamente normal, com proporção p e desvio padrão

z =

pˆ − p p ⋅ (1 p) n −
− p
p ⋅
(1 p) n

é aproximadamente uma N (0,1).

No exemplo da proporção de gerentes que participaram do treinamento gerencial:

Já havíamos determinado que E(pˆ) = 0,60 e

σ

= 0,0894

. Como a AAS é de 30 gerentes, pelo TLC,

a distribuição amostral de pˆ é aproximadamente normal (figura 9.9).

σ 0,0894 ˆ = p 0,60
σ
0,0894
ˆ =
p
0,60

Figura 9.9 – Distribuição amostral de pˆ , para a proporção de participação em treinamento gerencial de uma

AAS de 30 gerentes

9.7.4 Utilização prática da distribuição amostral de pˆ

Vamos voltar ao exemplo da proporção de gerentes que participaram do treinamento gerencial. O diretor acredita que a proporção da amostra pˆ será uma estimativa aceitável da proporção da população p

se pˆ estiver dentro de ±0,05 de p.

Esta questão deve ser analisada em termos de probabilidade. A preocupação do diretor pode ser

definida de seguinte forma: qual é a probabilidade de que a proporção da amostra de uma AAS de 30

gerentes esteja dentro de ±0,05 da proporção da população? Agora que caracterizamos a distribuição amostral de pˆ , podemos responder à questão acima. A

probabilidade questionada refere-se à probabilidade de pˆ estar entre 0,55 e 0,65 na distribuição amostral de

pˆ (figura 9.10).

σ 0,0894 ˆ = p Área = 0,21226 Área = 0,21226 0,55 0,60 0,65
σ
0,0894
ˆ =
p
Área = 0,21226
Área = 0,21226
0,55
0,60
0,65

Figura 9.10 – Probabilidade da proporção da amostra estar dentro de 0,05 da proporção da população

13

Como a distribuição é normal, com média de 0,60 e desvio padrão de 0,0894, podemos usar a tabela da distribuição normal padrão para encontrar a probabilidade desejada. Para pˆ = 0,55, temos:

z

=

0,55

0,60

0,0894

=− 0,56

Na tabela da distribuição normal padrão:

Para z = 0,56 Área = 0,21226. Portanto, a probabilidade do valor de pˆ estar entre 0,55 e 0,65 é

de 0,21226 + 0,21226 (por simetria) = 0,42452. De outro modo: existe uma probabilidade de 1 – 0,42452 = 0,57548 de que pˆ ficará fora da média

da população por mais do que 0,05.

Para melhorar a probabilidade de 0,42452, pode-se tomar uma amostra de tamanho maior.

Suponha, então, que, ao invés de selecionarmos uma AAS de 30 gerentes, nós tenhamos selecionado uma

AAS de 100 gerentes. Vamos verificar de que forma o aumento no tamanho da amostra (de 30 para 100)

afeta a análise realizada anteriormente.

Primeiramente, temos que

Já o erro padrão da proporção é afetado pelo tamanho da amostra. O novo valor é dado por:

E

(p)

ˆ

=

p

=

0,60

, independentemente do tamanho da amostra.

σ =

p ⋅ ( 1 − p ) 0,60 ⋅ ( 1 − 0,60 ) =
p
(
1
p
)
0,60
(
1
0,60
)
=
n 10

= 0,0490

, ou seja,

σ

diminuiu de 0,0894 para 0,0490.

Com a definição da nova distribuição amostral de pˆ com n = 100, podemos recalcular o valor de z

para pˆ = 0,55. Assim:

z

=

0,55

0,60

0,0490

=− 1,02

Na tabela da distribuição normal padrão:

Para z = 1,02 Área = 0,34614. Portanto, a nova probabilidade do valor de pˆ estar entre 0,55 e

0,65 é de 0, 34614 + 0, 34614 (por simetria) = 0,69228.

Assim, aumentando o tamanho da amostra de 30 para 100 gerentes, aumentamos a probabilidade

de obter uma proporção de amostra dentro de ±0,05 da proporção da população de 0,42452 para 0,69228.