Trabalho Estatistica Extra

Trabalho Estatística e Probabilidades - TM1
Nikolas Dias Magalhães Fantoni - 2018019400
27 de novembro de 2018
1 Introdução
Intervalo de confiança é uma estimativa de um parâmetro populacional desconhecido. A ideia é de que se
um experimento for repetido usando uma amostra aleatória n vezes, espera-se que uma porcentagem x%
(equivalente ao intervalo de confiança) destes experimentos contenham o parâmetro desconhecido. Neste
trabalho, serão feitos testes para uma análise do intervalo de confiança utilizando a média e a proporção
de uma amostra.
2 Desenvolvimento
2.1 Intervalo de confiança para proporção
Para o intervalo de confiança para a proporção, utilizou-se um código em R pronto para verificar a
quantidade de intervalos que continham o valor de referência p = 0.30. Ao variarmos os valores de
n entre [5, 25, 100, 400] e do intervalo de confiança [50%, 80%, 90%, 95%], obtemos a tabela abaixo que
indica a quantidade de intervalos que continham a proporção verdadeira. De verde temos a quantidade de
intervalos que continham o valor verdadeiro esperados mais ou menos 1. De amarelo, temos os resultados
em que ocorreram em até 2 intervalos a mais ou a menos e, de vermelho, os resultados em que 3 ou mais
intervalos não continham o valor verdadeiro, se comparado com a quantidade que era esperada.
50% 80% 90% 95%

5 12(60%) 12(60%) 17(85%) 17(85%)
25 8(40%) 16(80%) 17(85%) 19(95%)
100 11(55%) 14(70%) 15(75%) 18(90%)
400 10(50%) 15(75%) 16(80%) 19(95%)
Tabela 1: Resultados do primeiro algoritmo.
Um dos experimentos perfeito ocorreu quando n = 400 e o intervalo de confiança esperado era de 95%.
Este experimento é mostrado na figura 1.
Assim, o experimento numérico mostra que o intervalo de confiança para a proporção é útil quando
se tem uma população muito grande e, a partir de uma amostra n, obtemos uma certa característica
apresentada em x elementos, fazendo com que a proporção seja p = nx . Para isso, consideramos que a
proporção segue uma distribuição normal, sendo que essa aproximação só é válida se np > 5.
No caso do código fornecido, nota-se que para n = 5 não possuímos uma boa aproximação da distribuição
normal e, portanto, os cálculos de intervalo de confiança não são adequados. Para os valores de n maiores
ou iguais a 25, a aproximação é válida, apesar de algumas divergências ocorrerem em certos casos (como
quando n = 100 e o I.C. é 90%). Nota-se também que o aumento do intervalo de confiança ou das
amostras tende a tornar a análise mais robusta.
Por fim, nota-se que os intervalos diminuem conforme o I.C. diminui, o que faz sentido já que menos
resultados dos testes conterão o valor real. Além disso, os intervalos diminuem conforme o valor de n
aumenta, uma vez que o valor da proporção se torna muito pequeno. Logo, conclui-se que o tamanho
1
Figura 1: Experimento com o intervalo de confiança para a proporção.
do intervalo numérico é diretamente proporcional ao I.C. e inversamente proporcional ao tamanho de

n.
2.2 Intervalo de confiança para a média
Para a média, utilizaremos outro código fornecido pelo professor. O valor de referência real foi de
µ = 100 e o desvio padrão foi σ = 10. Para esta distribuição, vemos um comportamento similar ao
feito na distribuição para a proporção em relação ao tamanho dos intervalos. Porém, aqui fica evidente
que um valor de n alto e um I.C. acima dos 90% nos traz resultados que condizem com a definição de
Intervalo de Confiança. Para o caso em que n = 100 e I.C. é 90%, temos a figura 2 abaixo.
50% 80% 90% 95%

5 11(55%) 15(75%) 17(85%) 19(95%)
25 13(65%) 19(95%) 19(95%) 19(95%)
100 12(60%) 18(90%) 18(90%) 20(100%)
400 15(75%) 18(90%) 19(95%) 20(100%)
Tabela 2: Resultados do segundo algoritmo (original).
Se alterarmos a linha do algoritmo que define a distribuição utilizada de t-Student para a distribuição
normal, teremos a tabela 3 abaixo como resultados.
50% 80% 90% 95%

5 10(50%) 15(75%) 15(75%) 17(85%)
25 13(65%) 19(95%) 19(95%) 19(95%)
100 12(60%) 18(90%) 18(90%) 20(100%)
400 15(75%) 18(90%) 19(95%) 20(100%)
Tabela 3: Resultados do segundo algoritmo (modificado).
Pela tabela 3 nota-se que, para n muito grande, a distribuição t-Student se aproxima muito da normal,
tornando os resultados idênticos. Porém, para graus de liberdade pequenos (no caso 4 para n = 5),
notamos que a aproximação pela normal gera resultados bem inferiores ao desempenho esperado.
2
Figura 2: Experimento com o intervalo de confiança para a média (aproximação por t-Student).
O resultado do teste feito com n = 5 e I.C. de 95% é mostrado na figura 3, com a aproximação pela
normal.
Figura 3: Experimento com o intervalo de confiança para a média (aproximação pela normal).
3
3 Conclusão
Neste trabalho, foram realizados testes na linguagem R com a distribuições pela média e pela proporção.
Foi possível verificar a influência do valor numérico da amostra n no gráfico de testes e observar a definição
de Intervalo de Confiança na prática. Conseguimos, ainda, ver a diferença da aproximação normal e da
distribuição t-Student para diferentes graus de liberdade na distribuição pela média.
Além disso, o trabalho proporcionou uma familiaridade ainda maior com a linguagem R, amplamente
utilizada no ramo da Estatística.
4 Bibliografia
MONTGOMERY, Douglas C.; RUNGER, George C. Applied Statistics and Probability for Engineers.
6th Edition. United States of America: Wiley, 2014.

Trabalho Estatistica Extra

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Trabalho Estatistica Extra

Enviado por

Direitos autorais:

Formatos disponíveis

Trabalho Estatística e Probabilidades - TM1

Nikolas Dias Magalhães Fantoni - 2018019400

2.1 Intervalo de confiança para proporção

50% 80% 90% 95%

Tabela 1: Resultados do primeiro algoritmo.

do intervalo numérico é diretamente proporcional ao I.C. e inversamente proporcional ao tamanho de

2.2 Intervalo de confiança para a média

50% 80% 90% 95%

Tabela 2: Resultados do segundo algoritmo (original).

50% 80% 90% 95%

Tabela 3: Resultados do segundo algoritmo (modificado).

Você também pode gostar