Você está na página 1de 44

DISTRIBUIÇÃO AMOSTRAL

 Com a média de uma amostra extraída de uma população


será estimada a média dessa população.
 Entretanto, de uma mesma população pode-se tomar
muitas amostras diferentes do mesmo tamanho.
 A principal preocupação numa inferência estatística é
obter conclusões sobre a população.

 Por exemplo:
 Na determinação da vida média de uma lâmpada fluorescente
especificada pelo fabricante fazem parte:
 Do controle de qualidade da empresa.
 Se a vida média das lâmpadas fluorescentes de uma
amostra retirada de um lote de produção não atender à
especificação estabelecida, então o lote deverá ser
rejeitado.
 Do órgão de defesa do consumidor.
 Se a vida média das lâmpadas fluorescentes da amostra
retirada de diversos pontos de venda atender à
especificação do fabricante, então a reclamação dos
consumidores não deverá ser aceita.
 Avaliação de um novo produto.
 Antes de seu lançamento, em muitos casos, o novo
produto é distribuído a um grupo de consumidores
potenciais que respondem um questionário.
 Se os resultados dos questionários mostrarem que o novo
produto foi bem aceito, então o grupo de marketing terá
suporte para defender o lançamento desse novo produto.
 Previsão do tempo médio de espera dos clientes no caixa de um
banco.
 Se o tempo médio de espera de uma amostra de clientes
for maior que o tempo médio afirmado pelo gerente da
agência, então será bastante provável que as reclamações
dos clientes tenham fundamento.
 Um denominador comum nos três casos apresentados é que as
decisões que deverão ser tomadas serão apoiadas em
informações incompletas.
 No dia-a-dia, estamos acostumados a tomar decisões com
informações incompletas baseadas na própria experiência ou em
amostras.
 Por exemplo, o procedimento de degustar uma porção de
fruta ou queijo antes de comprar.
 Ao aprovar a amostra degustada e comprar uma
quantidade da fruta ou do queijo, estamos aceitando
que o resto do lote de fruta ou peça de queijo tem a
mesma característica que apreciamos na amostra.
 A experiência mostra que é mais fácil acertar no caso
do queijo que no da fruta, salvo que o pedaço de
queijo comprado seja de outra peça não amostrada.
 Seja qual for a decisão tomada, estará sendo aplicada a
distribuição das médias das amostras.
 Parâmetro é uma medida numérica que descreve
uma população.

 Estatística é uma medida numérica que descreve


uma amostra.
Exemplo
 A coordenadora do ensino de primeiro grau tem interesse em
conhecer a estatura média dos alunos da primeira série da rede
escolar.
 Se a variável estatura estivesse registrada no cadastro dos
alunos seria fácil calcular a média das estaturas dos alunos da
primeira série, entretanto, essa informação não está disponível.
 Uma tentativa de alcançar o objetivo é estimar a média de todos
os alunos utilizando a média de uma amostra dos alunos da
primeira série, tendo presente que essa amostra será
representativa da população; isto é, a amostra possuirá
características similares às que seriam observadas na
população se estivesse disponível.
 Para testar a idéia, a coordenadora preparou dez funcionários
com a tarefa individual de selecionar aleatoriamente trinta alunos
da primeira série da escola designada, medir a estatura dos
trinta alunos e finalmente calcular e registrar a média dessa
amostra.
 Terminada a tarefa, a coordenadora receberá as dez médias
amostrais
X 1 , X 2 , L, X 10

que, em geral, serão diferentes entre si devido à variabilidade


amostral. Além disso, essas dez médias deverão ser diferentes
da média da população.
Analisemos o resultado da tarefa dos dez funcionários:
 O parâmetro média da população é um valor único e
desconhecido.
 A estatística média da amostra é um valor conhecido, porém
pode variar de amostra para amostra.
 Se os dez funcionários realizarem novas amostragens aleatórias
do mesmo tamanho, as médias das novas amostras não
deverão ser iguais às dez primeiras.
 Apesar de a média da população não ter mudado, a média da
amostra dependerá de cada amostra.
 Com as médias das amostras, é possível construir a distribuição
de freqüências das médias das amostras, denominada
distribuição amostral, cuja média denomina-se média amostral e
seu desvio padrão, erro padrão.
 Embora os parâmetros média e desvio padrão da população não
sejam conhecidos, para ajudar na compreensão da distribuição
amostral, inicialmente, esses parâmetros serão considerados
como conhecidos.
O desvio padrão é conhecido como erro amostral.
 O erro padrão da distribuição das médias amostrais diminui
quando aumenta o tamanho da amostra n.
 Isso significa que à medida que n aumenta e mais informações
são utilizadas, a média da amostra se aproxima da média da
população, como pode-se ver na expressão do erro padrão.

σ
σX =
n
FORMA DA DISTRIBUIÇÃO AMOSTRAL

 Ao estudar as medidas estatísticas descritivas, foi observado


que a forma da distribuição da variável é importante.
 A distribuição amostral do Exemplo 10.1 é simétrica, embora a
distribuição da população seja uniforme.
 De forma geral, a forma da distribuição amostral depende da
forma da distribuição da população.
 Se a distribuição da população for normal N(µ, σ), a distribuição
da média amostral também será normal,
seja qual for o tamanho n da
amostra.

N ( µ, σ / n )
 Se a distribuição da população não for normal, à medida que o
tamanho da amostra aumentar, a distribuição da média amostral
se aproximará da distribuição normal.
 De acordo com o teorema central do limite, a distribuição das
médias de amostras de tamanho suficientemente grande poderá
ser considerada como normal,
seja qual for a forma da distribuição
da população.
N ( µ, σ / n )
 O teorema central do limite é muito importante, pois permite
utilizar a distribuição normal para realizar inferências da média
amostral, seja qual for a forma da distribuição da população.
 Como aplicação prática, podemos dizer que a soma de um
número de efeitos aleatórios, sem dominância de nenhum deles
sobre o resultado total, produz uma variável aleatória com
distribuição normal. Por exemplo:
 Um cabo de aço trançado utilizado num elevador é formado por
muitos fios de aço que adequadamente entrelaçados conferem
uma forte resistência ao cabo, cuja capacidade é igual à soma
das capacidades individuais dos fios de aço.
 Se o número de fios que formam o cabo for
adequadamente grande, mesmo que a distribuição da
capacidade dos fios de aço não seja normal, a distribuição
da capacidade do cabo será normal.
SIMULADOR
 O teorema central do limite pode ser verificado na prática
realizando simulações repetidas de um experimento, como o
lançamento de um dado que tem seis resultados possíveis {1, 2,
3, 4, 5, 6} com a mesma probabilidade 1/6 de ocorrer.
 O histograma desse experimento mostra que sua distribuição de
freqüências é discreta e uniforme com média igual a 3,50,
variância 2,917 e desvio padrão 1,71.
 O simulador permite realizar simulações para três tamanhos de
amostra, n=15, 30 e 50 resultados aleatórios de um dado obtidos
com a fórmula =ARRED(ALEATÓRIO()*(6-1)+1;0) registrada em
cada célula da tabela de trinta lançamentos de um dado repetido
cinco mil vezes.
 A última coluna da tabela registra a média de cada lançamento
de n=15, 30 e 50 dados. Cada vez que o botão Simulação é
pressionado, o modelo atualiza os seguintes resultados para o
tamanho n previamente definido:
 Calcula a média e o desvio padrão das médias amostrais,
intervalo de células C10:F11.
 Calcula a tabela de freqüências absolutas e apresenta o
histograma de 200, 500, 1.000 e 5.000 lançamentos de
n=15, 30 e 50 dados, como mostra o slide seguinte no
caso de n=30.
 Os quatro histogramas mostram que, ao aumentar o número de
simulações, acentua-se a concentração das médias amostrais
ao redor da média da população.
 Também se for aumentado o tamanho da amostra para n=50
essa concentração ao redor da média começa a perceber-se
com menos simulações, confirmando que à medida que n
aumenta têm-se mais informações, como mostra o slide
seguinte.
Repetindo o que já foi apresentado:
 A soma de um número de efeitos aleatórios, sem
dominância de nenhum deles sobre o resultado
total, produz uma variável aleatória com distribuição
normal.
FATOR DE CORREÇÃO FINITA
 As premissas incluídas nas expressões apresentadas
estabelecem que a população é suficientemente grande, os
valores da amostra são independentes e a amostragem é
realizada com reposição.
 Se numa população pequena for realizada uma amostragem
sem reposição de tamanho maior que 5% do tamanho da
população, no cálculo do erro padrão deverá ser incluído o fator
de correção finita
N −n
N −1
A tabela seguinte mostra valores do coeficiente de correção
finita em função do tamanho n da amostra numa população
de tamanho N=1.000.
UTILIZAÇÃO
 Quanto maior for o tamanho n da amostra, mais a média amostral
se aproximará da média da população, pois à medida que n
aumenta, o erro padrão diminui e no limite, quando n tender à
própria população, o erro padrão tenderá a zero.
 As propriedades da distribuição amostral asseguram que a média
de uma amostra é uma boa estatística para inferir sobre a média
da população µ da qual foi extraída.
 Ao mesmo tempo, o teorema central do limite estabelece que se
o tamanho da amostra n for suficientemente grande a distribuição
da média amostral será normal, qualquer que seja a forma da
distribuição da população.
 Portanto, o teorema central do limite permite aplicar a distribuição
normal para obter respostas da média de uma amostra de
tamanho suficientemente grande retirada de uma população
qualquer.
Qual o significado da probabilidade 6,68%?
 Tendo presente que a distribuição amostral fornece a distribuição
teórica de todas as possíveis amostras de tamanho nove, a
probabilidade 6,68% é a proporção de amostras de tamanho nove
que têm media menor ou igual a 149,75 centímetros cúbicos.
Qual o significado da probabilidade 0,62%?
 Considerando que a distribuição amostral fornece a distribuição
teórica de todas as possíveis amostras de tamanho vinte e cinco,
a probabilidade 0,62% é a proporção de amostras de tamanho
nove que têm media menor ou igual a 149,75 centímetros
cúbicos.
 A probabilidade 0,62% confirma que o volume de enchimento
realizado pela máquina automática é de 150 centímetros cúbicos?
Vejamos:
 Se for retirado apenas um único frasco de detergente como
amostra, a probabilidade de o volume desse frasco ser
menor ou igual a 149,75 centímetros cúbicos é 30,85%,
resultado obtido com a fórmula
=DIST.NORM(149,75;150;0,5;VERDADEIRO). A
probabilidade 30,85% é bastante alta comparada às
probabilidades com a média de uma amostra dos exemplos
anteriores.
 A probabilidade 6,68% da amostra do Exemplo 10.3 não é
suficiente para afirmar que a máquina esteja enchendo
realmente com média igual a 150, pois a proporção de
amostras de tamanho nove com media menor ou igual a
149,75 centímetros cúbicos não é pequena.
 A probabilidade da amostra do Exemplo 10.4 é pequena, o
que nos leva a aceitar que o volume médio de enchimento
da máquina seja 150.
 A aceitação do volume de enchimento da máquina automática
depende do tamanho da amostra n, pois quanto maior for n,
maior será a chance de aceitação.
Modelo Distribuição Amostral

Você também pode gostar