Você está na página 1de 24

Distribuições Amostrais

Aula 14

Bussab e Morettin, 2004, Seções 10.7 a 10.10


Introdução
O problema da inferência estatística é fazer uma
afirmação sobre os parâmetros da população
através da amostra.

Definição 1. Um parâmetro de uma população é


uma função do conjunto de valores desta
população, uma característica desta população.

Vamos supor que a nossa afirmação será feita para


o parâmetro , que representa alguma
característica populacional desconhecida.
Introdução

Para tanto, usaremos uma amostra aleatória (a.a.)


composta por n elementos retirados dessa
população.

Definição 2. Uma amostra aleatória (a.a.) é uma


seqüência {X1, X2, . . ., Xn} de n v.a. independentes
e identicamente distribuídas (i.i.d.) com f.d.p., no
caso contínuo, ou f.p., no caso discreto, f(x| ).
Introdução

Dessa forma, nossa decisão, então, será baseada


numa estatística T, que, por definição, é uma
função da amostra que não depende de
parâmetros desconhecidos.

Ao coletarmos uma particular amostra, teremos


observado um particular valor de T e baseado
nesse valor é que faremos a afirmação sobre .
Introdução
Porém, a validade da nossa resposta seria melhor
compreendida se soubéssemos o que acontece com
a estatística T, quando retiramos todas as amostras
de uma população conhecida segundo o plano
amostral adotado.

Isto é, qual a distribuição de probabilidades de T


quando (X1, X2, ..., Xn) assume todos os valores
possíveis.
Introdução

Essa distribuição é chamada distribuição amostral


da estatística T e desempenha papel fundamental
na teoria da inferência estatística.
DISTRIBUIÇÕES AMOSTRAIS
Distribuição de Probabilidades:

• da Média Amostral
• da Proporção Amostral
• da Variância Amostral
DISTRIBUIÇÃO
DA
MÉDIA AMOSTRAL

Bussab e Morettin, 2004, Seção 10.8


Meyer, 1983, Seção 13.4
Exemplo 1
O preço de um produto segue determinada distribuição de

probabilidades com média 21 reais e desvio padrão 5 reais.

Foi selecionada uma amostra aleatória de 36 pontos de venda.

d) Qual é a probabilidade do preço médio dessa amostra ser

superior a 23 reais e 75 centavos?

e) Qual deve ser o tamanho amostral para que a probabilidade

encontrada no item anterior se reduza à metade?


Observação
Caso a variável aleatória de interesse, X, tivesse
distribuição normal, então

X1    X n
X
n
em que
X1, X2, ..., Xn é uma a.a. da v.a. X,
teria distribuição normal exata.

Esse resultado segue do fato de que a distribuição de uma combinação


linear de v.a. normais independentes também é normal.
Observação (cont.)

Nos casos em que a v.a. de interesse não segue uma


distribuição de probabilidades normal (ou, ainda, a distribuição
de probabilidades é simplesmente desconhecida – caso esse
muito comum na prática), para resolver o exercício anterior
precisaríamos estudar a distribuição de probabilidades de X ,
que denota o estimador da média populacional ( ).

Definição 3. Um estimador para o parâmetro , que


denotaremos por ˆ , é qualquer estatística que toma valores
dentro do espaço paramétrico, .
DISTRIBUIÇÃO DA MÉDIA AMOSTRAL

De acordo com o que foi discutido nos slides


iniciais, a distribuição de probabilidades X é
baseada nos resultados provenientes de todas
as amostras possíveis de uma população
conhecida.
DISTRIBUIÇÃO DA MÉDIA AMOSTRAL

Resultado

Quando o tamanho da amostra aumenta,


independendo da distribuição da população
original, a distribuição de probabilidades do
estimador da média populacional, X ,aproxima-
se cada vez mais de uma distribuição Normal.
DISTRIBUIÇÃO DA MÉDIA AMOSTRAL

O resultado anterior, fundamental na teoria de


Inferência Estatística, é derivado do
TEOREMA LIMITE CENTRAL (T. L. C.).
Simulações

http://www.ruf.rice.edu/%7Elane/rvls.html
ou
http://onlinestatbook.com/rvls.html
TLC (MEYER, 1983, Seção 12.4)
Teorema Limite Central. Sejam X1, X2, ..., Xn, ... uma
sequência de v.a. independentes, com E(Xi) = i e Var(Xi)
= 2, i = 1, 2, .... Ainda, considere
i

X = X1 + X2 + ... + Xn.
Assim, sob determinadas condições gerais,
 n

 X   i 
Zn   i 1 
n

 i
 2

i 1

tem, aproximadamente, a distribuição normal padrão.


TLC (MEYER, 1983, Seção 12.4)
Teorema. Sejam X1, X2, ..., Xn n v.a. independentes,
todas com a mesma distribuição. Ainda, E(Xi) = e
Var(Xi) = 2, para i = 1, 2, ...., n. Também, faça
Sn = X1 + X2 + ... + Xn.
Assim, E(Sn) = n e Var(Sn) = n 2. E, para n grande,
teremos que

S n  n
Zn   N (0,1)
 n
DISTRIBUIÇÃO DA MÉDIA AMOSTRAL

Do teorema anterior, não é difícil ver que

1
S n  n  Sn

Xn  
Zn  n  n   N (0,1)
1
n

 n  
n

n

com,
2
E( X n )   e Var ( X n ) 
n
Voltando ao Exemplo 1
O preço de um produto segue determinada distribuição de

probabilidades com média 21 reais e desvio padrão 5 reais.

Foi selecionada uma amostra aleatória de 36 pontos de venda.

d) Qual é a probabilidade do preço médio dessa amostra ser

superior a 23 reais e 75 centavos?

e) Qual deve ser o tamanho amostral para que a probabilidade

encontrada no item anterior se reduza à metade?


OBSERVAÇÃO
Seja e a v.a. que mede a diferença entre X e o
parâmetro , isto é,

e  X  .
A quantidade definida anteriormente é chamada de erro
amostral da média e, usando os resultados do slide 18,
não é difícil ver que
e
Z  N (0,1)

n
EXERCÍCIOS
ANPEC 2001 - Questão 13

Sabe-se que certa característica de uma população


tem distribuição Qui-quadrado com 18 graus de
liberdade. Tendo sido extraída uma amostra de 25
elementos desta população, qual a probabilidade
de que a média amostral X esteja no intervalo
15  X  21? Use a tabela da distribuição Normal
em anexo. Resposta em percentagem,
aproximando para o inteiro superior mais próximo.

Resp. 99
ANPEC 2004 - Questão 12
Suponha que
x1 , x2 , , x32
sejam 32 variáveis aleatórias independentes, cada uma delas
tendo distribuição de Poisson com λ = 8. Empregando o
teorema do limite central, estime a probabilidade de que a
média amostral seja

x  9.
Use a tabela da distribuição Normal Padrão anexa. Multiplique
o resultado por 100 e transcreva a parte inteira.

Resp. 97
ANPEC 2005 - Questão 13
Sejam
X 1 , X 2 , X 3 , ........, X 64

uma amostra aleatória independente da variável X, que segue


distribuição de probabilidade exponencial, com função
densidade
f ( x)  2e 2 x , para x  0

e, zero fora desse intervalo. Usando o teorema central do limite


e a tabela da distribuição normal, anexa, calcule a
probabilidade de que a média amostral X seja maior ou igual
a 0,5. Multiplique o resultado encontrado por 100.

Resp. 50

Você também pode gostar