Você está na página 1de 11

7

Distribuições Amostrais e
Estimação de Parâmetros

Este capítulo apresenta a base para aprenderm os a estatística indutiva, a


qual fornece procedim entos formais para tirar conclusões sobre um a população,
a partir dos dados de um a am ostra. Para isso, veremos como se relacionam es­
tatísticas (características dos elementos de um a am ostra) com parâmetros (ca­
racterísticas dos elementos de um a população).

7.1 PARAMETROS E ESTATÍSTICAS


Relembremos alguns conceitos básicos:

População: conjunto de elementos que formam o universo de nosso estu­


do e que são passíveis de ser observados, sob as mesmas condições.
A m ostra: um a parte dos elem entos de um a população.
A m ostragem : o processo de seleção da amostra.
A m ostragem a lea tó ria sim p les: o processo de seleção é feito por sor­
teio, fazendo com que todos os elem entos da população tenham a mesma
chance de serem escolhidos e, além disso, todo subconjunto de n elementos
tenha a m esma chance de fazer parte da amostra.

Quando a am ostragem é aleatória e, em especial, quando é aleatória sim­


ples, podemos fazer inferências sobre a população, com base no estudo de uma
am ostra (ver a Figura 7.1).
170 ESTATÍSTICA

AM O STRAG EM
POPULAÇAO:
co n ju n to de elem entos

AMOSTRA: u m su b co n ju n to
de n e lem en to s d a po p u lação

INFERÊNCIA

Figura 7.1 Ilustração de conceitos básicos da estatística.

Em geral, estamos pesquisando um a ou mais variáveis associadas aos ele­


m entos da população ou da amostra. Nesse contexto, tam bém podem os carac­
terizar a população e a am ostra em term os da variável em estudo. Por exemplo,
ao verificar se cada consum idor potencial de um a revendedora de automóveis
planeja (X = 1) ou não (X = 0) com prar um carro novo no próximo ano, pode­
mos representar a população pelo conjunto {jcx, x 2, x 3,..., % }, onde Xj = 0 ou 1,
dependendo se o j-ésimo indivíduo da população pretende ou não com prar um
carro novo no próximo ano. Da m esma forma, a amostra, que será form ada por
n indivíduos a serem selecionados da população, pode ser representada por {Xlf
X 2) ..., Xn}, onde X t é a variável aleatória que corresponde ao valor de X (0 ou 1)
na i-ésima observação (i = 1, 2, ...n).
No presente contexto, definimos:

P a r â m e t r o : algum a m edida descritiva (média, variância, proporção etc.)


dos valores x lf x 2) x 3,..., associados à população.

A m o s tr a a l e a t ó r i a s im p le s : conjunto de n variáveis aleatórias inde­


pendentes {Xlf X 2, ..., X J , cada um a com a m esma distribuição de probabi­
lidades de certa variável aleatória X. Essa distribuição de probabilidades
deve corresponder à distribuição de frequências dos valores da população

E s ta tís tic a : alguma medida descritiva (média, variância, proporção etc.)


das variáveis aleatórias X lf X2, ..., Xn, associadas à amostra (ver a Figura 7.2).
DISTRIBUIÇÕES AMOSTRAIS E ESTIMAÇÃO DE PARÂMETROS 171

Parâmetros Estatísticas
Proporção ^ _ rQ de elementos com o atributo - _ n Q de elementos com o atributo
N n

Média 1 yy *X: 1 n
U = — x -± j:x t
N tí

Variância a 2 = I f (x ,.-^ V
N t r }

Figura 7.2 Alguns parâmetros e estatísticas.

E statísticas e variáveis aleató rias

Vamos considerar um a am ostragem aleatória simples, o que faz com que


qualquer m edida associada à am ostra (estatística) seja um a variável aleatória.
Isso ocorre por causa da aleatoriedade introduzida pelo sorteio, na am ostra­
gem. A fim de entender m elhor esse conceito, vamos acom panhar os exemplos
seguintes.

Exem plo 7.1 Em um estudo sobre emissões de C 02, definiu-se um a popula­


ção como sendo composta por quatro ônibus de um a pequena com panhia de
transporte urbano. Dos quatro ônibus, um deles apresentava alto índice de
emissão, enquanto os outros três estavam dentro dos padrões. Assim, a popula­
ção pode ser descrita por {1, 0, 0, 0}. O parâm etro de interesse é a proporção de
veículos fora do padrão. Considere as seguintes questões acerca dessa população:

a) calcular a proporção populacional (p);


b) se for retirada um a am ostra aleatória simples, com reposição, de ta ­
m anho n = 2, qual será a proporção P de veículos fora dos padrões
na amostra?
Solução: Para a questão (a), a resposta é trivial: p = lA. Já a
questão (b) não pode ser respondida, pois a proporção am ostrai (P)
é um a variável aleatória. Assim, não podemos dizer o que vai ocor­
rer, mas tão somente o que pode ocorrer.
172 ESTATÍSTICA

c) retificando a questão (b), construir a distribuição de probabilidades


da proporção amostrai.
Solução: Seja a variável aleatória X = número de ônibus com alto
índice de emissão entre dois ônibus selecionados ao acaso. Então, X
possui distribuição binomial, já que se trata de dois eventos inde­
pendentes, com duas possibilidades cada (sucesso = ônibus com alto
índice de emissão; fracasso = ônibus dentro dos padrões). Os parâm e­
tros da distribuição são n = 2 e p = 0,25. Assim, pela distribuição
binomial (ver a Tabela I do apêndice), temos:

X P(x)
0 0,5625
1 0,3750
2 0,0625
Total 1

A proporção am ostrai é dada por:

P =X
n 2

Assim, sua função de probabilidade é dada por:

P P(P)
0 0,5625
y2 0,3750
i 0,0625
Total 1

A função de probabilidade de P tam bém é cham ada de distribuição da pro­


porção amostrai ou distribuição amostrai da proporção, pois apresenta os possí­
veis resultados de um a proporção, que é calculada sobre os elem entos de um a
am ostra a ser extraída da população em estudo. De m aneira geral, temos:

Uma estatística é um a variável aleatória e sua distribuição de probabilida­


des é cham ada de distribuição am ostrai
DISTRIBUIÇÕES AMOSTRAIS E ESTIMAÇÃO DE PARÂMETROS 173

Exem plo 7.2 Seja a população dos quatro ônibus e ~ p OO


a variável X = número de vezes que o ônibus teve um
defeito grave. Se um ônibus teve dois defeitos graves,
o outro três, o outro quatro e o último cinco defeitos
graves, então a população, em term os da variável X,
pode ser descrita pelo conjunto {2, 3, 4, 5}. A popu- z
lação tam bém pode ser descrita pela função de probabilidade ao lado - a distri­
buição da população. Essa distribuição tem os parâm etros valor esperado (m é­
dia) e variância dados por:

n = — f \ x : = - ( 2 + 3 + 4 + 5 ) = 3,5 e
N ft 4

- ^ ) 2 = *[(2 - 3’
5)2 + (3 - 3>5)2 + (4 - 3’
5)2 + (5 - 3’
5)2] = i-25

A Tabela 7.1 m ostra a construção da distribuição da m édia amostrai, con­


siderando um a am ostragem aleatória simples com n = 2 elementos, extraída
com reposição.

Tabela 7.1 Construção da distribuição de X (Exemplo 7.2).

A m o stras p o ssív eis V alor d e X P ro b a b ilid a d e

(2, 2) 2,0 Kó
(2, 3), (3, 2) 2,5 Ko
(2, 4), (3, 3), (4, 2) 3,0 Kc
(2, 5), (3, 4), (4, 3), (5, 2) 3,5
(3, 5), (4, 4), (5, 3) 4,0 %6
(4, 5), (5, 4) 4,5
(5, 5) 5,0 Kó

O valor esperado e a variância da distribuição de X são:


' 4 N ' 3 >
+ 31 A + 3,5 +4 + 4,5| — ^
16 / U6 / ,1 6 , 16

+5 = 3,5
16

V (X ) = (2 - 3 ,5 ) 2 ^ + (2,5 - 3 ,5 )2 A +.. .+ (5 - 3,5)2 = 0,625


174 ESTATÍSTICA

A Figura 7.3 m ostra a distribuição da população e a distribuição da média


amostrai. Note que ambas têm a m esma m édia (valor esperado), m as a distri­
buição da m édia am ostrai é mais concentrada (m enor variância) e tem forma
mais parecida com a distribuição normal.

Distribuição da Distribuição da
população p(x) média amostrai
pM

2 3_A 4 5
JÎ= 4
3,! EQO = 3,5
Figura 7.3 Distribuição da população do Exemplo 7.2 e a distribuição da média
amostrai, considerando amostragem aleatória simples com n = 2 ele­
mentos, extraídos com reposição.

EXERCÍCIOS

1. Refaça o Exemplo 7.1c, considerando que a am ostra seja retirada sem re­
posição.

2. Em um estudo sobre consumo de combustível, definiu-se um a população


composta por quatro ônibus de um a pequena com panhia de transporte ur­
bano. Os consumos dos ônibus (km /l), em condições padrões de teste,
eram 3,8, 3,9, 4,0 e 4,1. Uma am ostra de dois elementos será sorteada,
com reposição. Verifique todas as am ostras possíveis e, em seguida, cons­
trua a distribuição am ostrai para o consumo médio da am ostra e calcule o
valor esperado e a variância.

3. Refaça o exercício anterior considerando am ostragem sem reposição.

7.2 DISTRIBUIÇÕES AMOSTRAIS

Quando a am ostragem é aleatória simples, várias estatísticas apresentam


distribuições amostrais que se aproximam de distribuições contínuas conheci­
das, à m edida que o tam anho da am ostra cresce. É o caso da m édia e da pro­
porção que apresentam distribuições amostrais aproxim adam ente normal.
DISTRIBUIÇÕES AMOSTRAIS E ESTIMAÇÃO DE PARÂMETROS 175

7.2.1 D istribuição am ostrai da m édia


Considere o esquem a ilustrado na Figura 7.4.

Amostragem
aleatória simples

X pode ser vista como uma variável


aleatória se considerar a distribuição
de frequências da população como
uma distribuição de probabilidades -
a distribuição da população.

Figura 7.4 Esquema geral de uma amostragem aleatória simples na observação


de uma variável quantitativa X.

Seja um a am ostra aleatória simples {X1? X 2, X n} e a estatística X. A dis­


tribuição de X (distribuição da média amostrai) apresenta as seguintes proprie­
dades:

a) O valor esperado da m édia am ostrai é igual à m édia da população,


ou seja:1

EOO (7.1)

b) A variância da m édia am ostrai é inferior à variância populacional


( c j 2) e a relação é dada por

2
(se a am ostragem for com reposição, ou N (7.2)
•. i\o
/ n m uito grande ou infinito).2

2 Com as condicionantes, podemos supor independência entre X u ..., X n, donde:


176 ESTATÍSTICA

OU

(se a am ostragem for sem reposição e (7.3)


N não muito grande, N < 20n)

c) (Teorema do limite central) Se o tam anho da amostra for razoavel­


m ente grande, então a distribuição amostrai da média pode ser apro­
ximada pela distribuição normal. Em geral, para n > 30, a aproxima­
ção já é boa, porém, se a distribuição da população não for muito
distante de um a normal, a aproximação pode ser usada com n menor.

Exem plo 7.2 (co n tin u ação ) Dada a população {2, 3, 4, 5}, com parâm etros
/z = 3,5 e a 2 = 1,25, e considerando o planejam ento de um a am ostra aleatória
simples, com reposição, de n = 2 elementos, então podemos obter o valor espe­
rado e a variância da m édia am ostrai usando (7.1) e (7.2):

E(X) = ji = 3,5 e

V(x) =—=^ = 0,625


^ } n 2

Observe que são os mesmos valores encontrados anteriorm ente.

7.2.2 D istribuição am ostrai d a proporção


Quando o interesse é estudar um a proporção, tal como a proporção dos ele­
mentos que têm certo atributo A, a população pode ser vista como dividida em
dois subgrupos:

1. o subgrupo dos elem entos que têm o atributo A; e


2. o subgrupo dos elementos que não têm o atributo A, como m ostra a
Figura 7.5.

População: N = NA + NÁ elem entos

Parâmetro
p = proporção dos elem entos 0 ou 1
que têm o atributo A (0 = Sem o atributo;
1 = com o atributo)
Figura 7.5 Esquema geral de uma amostragem aleatória simples quando se ob­
serva a proporção de certo atributo A.
DISTRIBUIÇÕES AMOSTRAIS E ESTIMAÇÃO DE PARÂMETROS 177

A distribuição da população pode ser representada por um a variável alea­


tória de Bernoulli (tipo “0 -1 ”), com função de probabilidade:

X PW
0 1 - p

1 P

Como vimos no Capítulo 5, o valor esperado e a variância de um a distribui­


ção desse tipo são dados, respectivamente, por:

= Pe (7.4)
a2 = p ( 1 - p) (7.5)

Representando as observações am ostradas por

'1 se o i - ésimo elem ento tem o atributo A


X; =
0 se o i - ésimo elem ento não tem o atributo A

verificamos que

número de elementos com o atributo A


X = - ^ ---- =P (7.6)
n n

ou seja, a proporção equivale a um a m édia aritm ética para dados de variáveis


do tipo “0 -1 ”. Assim, as propriedades da distribuição am ostrai da m édia tam ­
bém são aplicadas à distribuição am ostrai da proporção. Usando as notações
próprias da proporção, temos:

a) O valor esperado da proporção am ostrai é igual à proporção da po­


pulação:

(7.7)

b) A variância da proporção am ostrai é dada por

(se a am ostragem for com reposição, ou N (7.8)


muito grande ou infinito).

ou

vcp) - p q - p ) . N - n (se a am ostragem for sem reposição (7.9)


n N -l e N não muito grande, N < 20n)
178 ESTATÍSTICA

c) Se o tam anho da am ostra for razoavelm ente grande, então a distri­


buição am ostrai da proporção pode ser aproxim ada pela distribuição
normal.3

As aplicações da distribuição da proporção am ostrai podem ser feitas no


contexto da aproximação da distribuição normal à binomial, inclusive com a
correção de continuidade (Seção 6.3.1).

EXERCÍCIOS

4. Uma fundição produz blocos para m otor de caminhões. Os furos para as


camisas devem ter diâm etro de 100 mm, com tolerância de 5 mm. Para ve­
rificar qual é o diâm etro médio no processo, a em presa vai retirar uma
am ostra com 36 blocos e m edir os diâm etros de 36 furos ( l a cada bloco).
Suponha que o desvio padrão (populacional) dos diâm etros seja conhecido
e igual a 3 mm.
a) Qual é o desvio padrão da distribuição da m édia amostrai?
b) Qual é a probabilidade de a m édia am ostrai diferir da m édia popula­
cional (desconhecida) em mais do que 0,5 mm (para mais ou para
m enos)?
c) Qual é a probabilidade de a média amostrai diferir da média populacio­
nal (desconhecida) em mais do que 1 mm (para mais ou para menos)?
d) Se alguém afirmar que a m édia am ostrai não se distanciará da média
populacional em mais do que 0,98 mm, qual é a probabilidade de essa
pessoa acertar?
e) Se alguém afirmar que a m édia am ostrai não se distanciará da média
populacional em mais do que 1,085 mm, qual é a probabilidade de
essa pessoa errar?

5. Uma em presa fabricante de pastilhas para freios efetua um teste para con­
trole de qualidade de seus produtos. Supondo que 1% das pastilhas fabrica­
das pelo processo atual apresenta desem penho deficiente quanto ao nível
de desgaste, qual é a probabilidade, em um a am ostra aleatória simples
com 10.000 pastilhas, de serem encontradas 85 ou m enos pastilhas com
problem as?

6 . Sabe-se que 50% dos edifícios construídos em um a grande cidade apresen­


tam problemas estéticos relevantes em menos de cinco anos após a entrega

3 Observamos que a distribuição exata é a binomial (ou a hipergeométrica se a am ostra­


gem for feita de população pequena e sem reposição).
DISTRIBUIÇÕES AMOSTRAIS E ESTIMAÇÃO DE PARÂMETROS 179

da obra. Considerando a seleção de um a am ostra aleatória simples com


200 edifícios com cinco anos, qual é a probabilidade de menos de 90 deles
apresentarem problemas estéticos relevantes (considerar que não tenha ha­
vido obras de reparo nos edifícios selecionados)?

7. Existem vários algoritmos computacionais que perm item gerar núm eros
aleatórios (ou, mais apropriadam ente, pseudo-aleatórios) no intervalo [0, 1],
com distribuição uniforme. Considere a geração de 100 núm eros (Xi, X2i ...,
X100) desta forma e sejaX a m édia aritm ética simples desses 100 números.
a) Qual é o valor esperado e a variância de X J
b) Qual é a probabilidade de X x assumir um valor no intervalo [0,47, 0,53]?
c) Qual é o valor esperado e a variância de X?
d) Qual é a distribuição de probabilidade de X?
e) Qual é a probabilidade de X assumir um valor no intervalo [0,47, 0,53]?

8 . Um profissional de Computação observou que seu sistem a gasta entre 20 e


24 segundos para realizar determ inada tarefa. Além disso, o tem po gasto,
X , pode ser razoavelmente representado pela seguinte função de densidade:

~ “ 5, para 20 < x < 22

f ( x ) = <6 - — para 22 < x < 24


4,
0, para x sé [20,24]

a) Numa particular rodada, qual é a probabilidade de o sistema gastar


mais que 22,4 segundos?
b) Em 30 rodadas, qual é a probabilidade de o sistem a gastar, em média,
mais que 22,4 segundos por rodada?

7.3 ESTIMAÇÃO DE PARÂMETROS


Nesta seção, estudaremos o problema de avaliar parâmetros populacionais,
a partir de operações com os dados de um a am ostra. É um raciocínio tipica­
m ente indutivo, em que se generalizam resultados da parte (amostra) para o
todo (população), conforme ilustra a Figura 7.6.

Você também pode gostar