Escolar Documentos
Profissional Documentos
Cultura Documentos
27 de novembro de 2018
1 Introdução
Intervalo de confiança é uma estimativa de um parâmetro populacional desconhecido. A ideia é de que se
um experimento for repetido usando uma amostra aleatória n vezes, espera-se que uma porcentagem x%
(equivalente ao intervalo de confiança) destes experimentos contenham o parâmetro desconhecido. Neste
trabalho, serão feitos testes para uma análise do intervalo de confiança utilizando a média e a proporção
de uma amostra.
2 Desenvolvimento
Para o intervalo de confiança para a proporção, utilizou-se um código em R pronto para verificar a
quantidade de intervalos que continham o valor de referência p = 0.30. Ao variarmos os valores de
n entre [5, 25, 100, 400] e do intervalo de confiança [50%, 80%, 90%, 95%], obtemos a tabela abaixo que
indica a quantidade de intervalos que continham a proporção verdadeira. De verde temos a quantidade de
intervalos que continham o valor verdadeiro esperados mais ou menos 1. De amarelo, temos os resultados
em que ocorreram em até 2 intervalos a mais ou a menos e, de vermelho, os resultados em que 3 ou mais
intervalos não continham o valor verdadeiro, se comparado com a quantidade que era esperada.
Um dos experimentos perfeito ocorreu quando n = 400 e o intervalo de confiança esperado era de 95%.
Este experimento é mostrado na figura 1.
Assim, o experimento numérico mostra que o intervalo de confiança para a proporção é útil quando
se tem uma população muito grande e, a partir de uma amostra n, obtemos uma certa característica
apresentada em x elementos, fazendo com que a proporção seja p = nx . Para isso, consideramos que a
proporção segue uma distribuição normal, sendo que essa aproximação só é válida se np > 5.
No caso do código fornecido, nota-se que para n = 5 não possuímos uma boa aproximação da distribuição
normal e, portanto, os cálculos de intervalo de confiança não são adequados. Para os valores de n maiores
ou iguais a 25, a aproximação é válida, apesar de algumas divergências ocorrerem em certos casos (como
quando n = 100 e o I.C. é 90%). Nota-se também que o aumento do intervalo de confiança ou das
amostras tende a tornar a análise mais robusta.
Por fim, nota-se que os intervalos diminuem conforme o I.C. diminui, o que faz sentido já que menos
resultados dos testes conterão o valor real. Além disso, os intervalos diminuem conforme o valor de n
aumenta, uma vez que o valor da proporção se torna muito pequeno. Logo, conclui-se que o tamanho
1
Figura 1: Experimento com o intervalo de confiança para a proporção.
Para a média, utilizaremos outro código fornecido pelo professor. O valor de referência real foi de
µ = 100 e o desvio padrão foi σ = 10. Para esta distribuição, vemos um comportamento similar ao
feito na distribuição para a proporção em relação ao tamanho dos intervalos. Porém, aqui fica evidente
que um valor de n alto e um I.C. acima dos 90% nos traz resultados que condizem com a definição de
Intervalo de Confiança. Para o caso em que n = 100 e I.C. é 90%, temos a figura 2 abaixo.
Se alterarmos a linha do algoritmo que define a distribuição utilizada de t-Student para a distribuição
normal, teremos a tabela 3 abaixo como resultados.
Pela tabela 3 nota-se que, para n muito grande, a distribuição t-Student se aproxima muito da normal,
tornando os resultados idênticos. Porém, para graus de liberdade pequenos (no caso 4 para n = 5),
notamos que a aproximação pela normal gera resultados bem inferiores ao desempenho esperado.
2
Figura 2: Experimento com o intervalo de confiança para a média (aproximação por t-Student).
O resultado do teste feito com n = 5 e I.C. de 95% é mostrado na figura 3, com a aproximação pela
normal.
Figura 3: Experimento com o intervalo de confiança para a média (aproximação pela normal).
3
3 Conclusão
Neste trabalho, foram realizados testes na linguagem R com a distribuições pela média e pela proporção.
Foi possível verificar a influência do valor numérico da amostra n no gráfico de testes e observar a definição
de Intervalo de Confiança na prática. Conseguimos, ainda, ver a diferença da aproximação normal e da
distribuição t-Student para diferentes graus de liberdade na distribuição pela média.
Além disso, o trabalho proporcionou uma familiaridade ainda maior com a linguagem R, amplamente
utilizada no ramo da Estatística.
4 Bibliografia
MONTGOMERY, Douglas C.; RUNGER, George C. Applied Statistics and Probability for Engineers.
6th Edition. United States of America: Wiley, 2014.