Escolar Documentos
Profissional Documentos
Cultura Documentos
E S T A T Í S T I C A II
O campo da inferência estatística consiste nos métodos usados para tomar decisões ou tirar conclusões acerca de
uma população. Esses métodos utilizam a informação contida em uma amostra da população para extrair
conclusões.
A inferência estatística pode ser dividida em duas grandes áreas: teoria de estimação e testes de hipóteses.
Técnica de amostragem - optando por aquela que, no caso concreto, se revela mais eficiente; mediante a
escolha de um processo de amostragem aleatório e do aumento do tamanho da amostra, pode-se assegurar
a representatividade e associar os resultados com grau de confiança elevado.
Estimadores - optando por aquele que seja mais eficiente, isto é, com menor variabilidade.
O erro amostral é um erro aleatório, pois as estimativas comportam-se aleatoriamente em torno do verdadeiro valor
do parâmetro. Ou seja, não coincidem com o parâmetro, estando umas estimativas acima e outras abaixo deste -
daí o erro, mas concentram-se em torno de um valor central que coincide com o verdadeiro valor do parâmetro.
1
1.5. Estimação de Parâmetros
Estimação é o processo que consiste em utilizar dados amostrais para estimar valores para a média, desvio padrão
e proporção de uma população de parâmetros desconhecidos. Essencialmente, qualquer característica de uma
população pode ser estimada a partir de uma amostra aleatória. Entre os mais comuns as estatísticas amostrais são
utilizadas como estimativas de parâmetros populacionais que podem ser classificadas em pontual ou intervalar.
1.6.2. Parâmetro
É a quantidade de interesse da população, onde em geral são desconhecidas a média (𝜇), desvio padrão (𝜎) e
proporção (𝜋) dessa população.
∑𝑛𝑖=1 𝑋𝑖 ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 𝑋
𝑋̅ = 2
𝑆 = 𝑝=
𝑛 𝑛−1 𝑛
1.6.4. Distribuição amostral
É a distribuição de probabilidades de uma medida estatística baseada em uma amostra aleatória. Distribuições
amostrais são importantes porque fornecem uma grande simplificação, usada para inferência estatística. Mais
especificamente, elas permitem considerações analíticas serem baseadas na distribuição amostral de uma estatística,
em vez de na distribuição conjunta.
O conceito de distribuição de probabilidade de uma variável aleatória será agora utilizado para caracterizar a
distribuição dos diversos valores de uma variável em uma população.
Ao retirar uma amostra aleatória de uma população estaremos considerando cada valor da amostra como um valor
de uma variável aleatória cuja distribuição de probabilidade é a mesma da população no instante da retirada
desse elemento para a amostra.
Em consequência do fato de os valores de amostra serem aleatórios, decorre que qualquer quantidade calculada
em função dos elementos da amostra também será uma variável aleatória.
A distribuição amostral de uma estatística depende da distribuição da população, do tamanho da amostra e do
método de selecção da amostra.
Um parâmetro (𝜃) estatístico é uma função definida sobre os valores numéricos de uma população. Trata-se,
portanto, de um valor representativo que permite modelizar a realidade.
A utilidade dos parâmetros estatísticos prende-se com a dificuldade de trabalhar com uma grande quantidade de
dados individuais de uma mesma população. Este tipo de parâmetros permite obter um panorama geral da
população e realizar comparações e previsões.
2
1.6.6. Estimador
Um estimador (𝜃̂) é uma regra para calcular uma estimativa de uma determinada quantidade baseada em dados
observados: assim a regra e seu resultado (a estimativa) são distinguidos.
Um "estimador" ou "ponto estimado" é uma estatística (isto é, uma função dos dados) que é utilizada para inferir o
valor de um parâmetro desconhecido em um modelo estatístico. O parâmetro a ser estimado por vezes é chamado
estimando. Ele pode ser de dimensão finita ou infinita.
Sendo uma função dos dados, o estimador é em si uma variável aleatória, uma realização particular desta variável
aleatória chamada "estimativa". Às vezes, as palavras "estimador" e "estimativa" são usados alternadamente. A
definição coloca, praticamente sem restrições, sobre quais funções dos dados podem ser chamadas de " estimadores
". A atractividade de diferentes estimadores pode ser julgada ao olhar para as suas propriedades, tais como viés,
erro quadrático médio, consistência, distribuição assimptótica, etc.. A construção e comparação de estimadores são
os temas da teoria da estimação. No contexto da teoria da decisão, um estimador é um tipo de regra de decisão, e
seu desempenho pode ser avaliado através do uso de funções de perda.
Os estimadores podem ser:
Seja 𝑋1 , 𝑋2 , 𝑋3 , … , 𝑋𝑛 uma amostra aleatória de tamanho n de uma população (finita ou infinita), com média 𝜇 e
𝑥̅ −𝜇
variança finita 𝜎 2 . Então: 𝑍 = 𝜎/ 𝑛 ~𝑁(0,1) 𝑞𝑢𝑎𝑛𝑑𝑜 𝑛 → ∞
√
Comentários Gerais
3
b) Suficiente
̂ é suficiente, se utilizar toda informação disponível na amostra, relevante para a estimação .
O estimador 𝛉
c) Eficiente
̂ ̂
𝜃1 𝑒 𝜃2 estimadores não viciados de 𝜃 de varianças diferentes.
Se 𝑉𝑎𝑟(𝜃̂1 ) < 𝑉𝑎𝑟(𝜃̂2 ) é mais provável que 𝜃̂1 produza uma estimativa mais próxima do valor verdadeiro de 𝜃.
De entre todos estimadores centrados para o mesmo parâmetro, é eficiente aquele que tiver menor variância;
𝑉𝑎𝑟(𝜃̂1 ) < 𝑉𝑎𝑟(𝜃̂2 )
Se considerarmos todos os estimadores não tendenciosos de 𝜃, aquele com menor variança será chamado de
estimador não tendencioso de variança mínima.
d) Consitente
Um estimador 𝜃̂ é consistente se á medida em que o tamanho amostral aumenta, o seu valor esperado converge
para o parâmetro de interesse e sua variança converge para zero.
𝜎𝜃̂ = √𝑉𝑎𝑟(𝜃̂)
O erro padrão (ou de variança) do estimador está relacionado com sua precisão.
Se o erro padrão envolver parâmetros desconhecidos que possam ser estimados, então a substituição
daqueles valores produz um erro padrão estimado.
4
2. INTERVALO DE CONFIANÇA
Um intervalo de confiança para um parâmetro populacional é um intervalo com uma proporção associada p gerada
por uma amostra aleatória de uma população subjacente, de tal forma que se o experimento for repetido várias
vezes e o intervalo de confiança for recalculado para cada experimento com mesmo procedimento, uma proporção
p dos intervalos de confiança conteria o parâmetro estatístico em questão.
Os intervalos de confiança são usados para indicar a confiabilidade de uma estimativa.
São escolhas comuns para grau de confiança: 90% (𝑐𝑜𝑚 𝛼 = 0.10); 95% (𝑐𝑜𝑚 𝛼 = 0.05)𝑒 99% (𝑐𝑜𝑚 𝛼 = 0.01).
5
𝑥̅ − 𝜇
𝑍= ~𝑁(0; 1)
𝜎/√𝑛
Logo, fixando um nível de confiança (1 − 𝛼), pode –se determinar 𝑍𝛼/2 de tal forma:
𝑥̅ − 𝜇
𝑃 (−𝑍𝛼 ≤ 𝑍 ≤ 𝑍𝛼 ) = 1 − 𝛼 → 𝑃 (−𝑍𝛼 ≤ ≤ 𝑍𝛼 ) = 1 − 𝛼
2 2 2 𝜎/√𝑛 2
𝜎 𝑁−𝑛 𝜎 𝑁−𝑛
𝐼𝐶 (𝜇, 1 − 𝛼) = 𝑥̅ − 𝑍𝛼 ∗ ∗√ ≤ 𝜇 ≤ 𝑥̅ + 𝑍𝛼 ∗ ∗√
2 √𝑛 𝑁−1 2 √𝑛 𝑁−1
Onde
𝑁−𝑛
vé o factor de correcção.
𝑁−1
σ σ
IC (μ, 1 − α) = x̅ − 1.96 ∗ ≤ μ ≤ x̅ + 1.96 ∗ →
√n √n
3 3
IC (μ, 0.95) = 346 − 1.96 ∗ ≤ μ ≤ 346 + 1.96 ∗ = (346.69; 347.31)
√20 √20
Interpretação
𝜇 ∈ [346.69; 347.31]: Isto significa que se colectássemos um número infinito de amostras, a verdadeira media a
95% de nível de condianca, situaria-se entre 345.69ml a 347.31ml
6
Nota:
O comprimento do intervalo de confiança está associado à precisão, quanto menor for o comprimento
mais precisa é a média.
Se diminuímos 𝛼 , isto é, aumentarmos 1 − 𝛼 (grau de confiança), mantendo 𝑛 fixo, a vai aumentar e
consequentemente o comprimento do intervalo. Não é possível fazer 𝛼 = 0 pois nesse caso
𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑𝑒 = +∞.
2.5.2. Intervalo de confiança para uma média quando a variança é desconhecida (n grande)
Seja 𝑋1 , 𝑋2 , 𝑋3 , … , 𝑋𝑛 uma amostra aleatória de tamanho n, de uma população não normal com média 𝜇
(desconhecida) e variança 𝜎 2 (conhecida). Se assumirmos que (𝑛 ≥ 30), pelo teorema de limite central diz-se que:
𝑥̅ − 𝜇
𝑍= ~𝑁(0; 1)
𝜎/√𝑛
á medida que 𝑛 → ∞. Pode-se mostrar que esse resultado continua valendo se substituirmos 𝜎 por 𝑆.
Dada uma amostra aleatória simples 𝑋1 , 𝑋2 , 𝑋3 , … , 𝑋𝑛 de uma população 𝑋 com média 𝜇 e variança 𝜎 2 , então:
𝑥̅ − 𝜇
𝑍= ≈ 𝑁(0; 1)
𝑆/√𝑛
Para 𝑛 suficientemente grande. Nesse caso, o intervalo de confiança aproximado de nível de confiança 1 − 𝛼 para
𝜇 é:
𝑺 𝑺
𝐼𝐶 (𝜇, 1 − 𝛼) = (𝒙 ̅ − 𝒁𝜶 ∗ ≤𝝁≤𝒙 ̅ + 𝒁𝜶 ∗ )
𝟐 √𝒏 𝟐 √𝒏
A partir de uma amostra aleatória simples de tamanho 𝑛 = 100, os seguintes valores foram obtidos: 𝑥̅ = 12,36 e
𝑆 2 = 132,56. Obtenha um intervalo de confiança de nível de confiança 90% para a média populacional µ.
Solução
Como o tamanho amostral é grande, podemos usar a aproximação normal. Como 1 − 𝛼 = 0.90, em cada cauda temos
que ter 5% e,assim, devemos procurar no corpo da tabela da distribuição normal o valor mais próximo de 0,45. Resulta
que
𝑍0.05 = 1,64; o que nos dá o seguinte intervalo de confiança:
𝑆 𝑆
𝑥̅ − 𝑍𝛼 ∗ ≤ 𝜇 ≤ 𝑥̅ + 𝑍𝛼 ∗ →
2 √𝑛 2 √𝑛
11.51 11.51
12.36 − 1.64 ∗ ≤ 𝜇 ≤ 12.36 + 1.64 ∗
√100 √100
10.472 ≤ 𝜇 ≤ 14.248
Interpretação: A um nível de confiança de 90% pode-se concluir que o intervalo [10.472; 14.248] contém o
verdadeiro valor médio populacional.
7
2.5.3. Intervalo de confiança para uma média quando a variança é desconhecida (n pequeno)
O intervalo de confiança para a média de uma população normal com variância desconhecida é obtido com base
no seguinte resultado:
∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2
𝑆2 =
𝑛−1
O intervalo de confiança para 𝜇 de nível de confiança 1 − 𝛼 é:
𝑺 𝑺
̅ − 𝒕𝜶;𝒏−𝟏 ∗
𝒙 ̅ + 𝒕𝜶;𝒏−𝟏 ∗
≤𝝁≤𝒙
𝟐 √𝒏 𝟐 √𝒏
𝛼
Onde t α;n−1 é o valor crítico da distribuição t-student com 𝑛 − 1 graus de liberdade que deixa a área 2 acima dele.
2
De uma população normal com média e variância desconhecidas, extrai-se uma amostra de tamanho 15 obtendo-
se: 𝑥̅ = 12 e 𝑆 2 = 49. Obtenha um intervalo de confiança de para a verdadeira média populacional, utilizando um
nível de confiança 95%.
Solução
Os seguintes requisitos para o IC para µ são satisfeitos: a população é normal e a amostra é pequena. Dessa forma,
temos que usar a distribuição 𝑡 com 𝑛 − 1 = 14 graus de liberdade. Como o nível de confiança é de 95%, em cada
cauda da distribuição temos que ter 2,5%. Assim, devemos procurar a abscissa 𝑡 procurando na linha correspondente
a 14 graus de liberdade e na coluna correspondente à área de 0,025. Encontramos
𝑡0.025;14 = 2.145
Interpretação: Temos 95% de certeza de que o intervalo [8.1231; 15.8769] contém o verdadeiro valor médio
populacional.
8
2.5.4. Intervalo de confiança para a diferença entre duas médias quando as variâncias são conhecidas
Um intervalo de confiança 1 − 𝛼 para a diferença entre as médias pode ser construído a partir dos resultados de
amostras aleatórias de cada uma dessas populações.
Pode ser demonstrada que a variança das diferenças entre as médias vem dada por:
𝜎1 2 𝜎2 2
𝜎2 = +
𝑛1 𝑛2
𝝈𝟏 𝟐 𝝈𝟐 𝟐 𝝈𝟏 𝟐 𝝈𝟐 𝟐
(𝒙 ̅𝟐 ) − 𝒁𝜶 ∗ √
̅𝟏 − 𝒙 + ≤ 𝝁𝟏 − 𝝁𝟐 ≤ (𝒙 ̅𝟐 ) + 𝒁𝜶 ∗ √
̅𝟏 − 𝒙 +
𝟐 𝒏𝟏 𝒏𝟐 𝟐 𝒏𝟏 𝒏𝟐
Caso não se conhça as variâncias e pelos menos uma das amostras é maior ou igual que 30, pode se substituir
𝜎1 2 𝑝𝑜𝑟 𝑆1 2 𝑒 𝜎2 2 𝑝𝑜𝑟 𝑆2 2 obtendo-se:
𝑺𝟏 𝟐 𝑺𝟐 𝟐 𝑺𝟏 𝟐 𝑺𝟐 𝟐
(𝒙 𝒙𝟐 ) − 𝒁𝜶 ∗ √
̅𝟏 − ̅ + (𝒙
̅ ̅ )
≤ 𝝁𝟏 − 𝝁𝟐 ≤ 𝟏 − 𝒙𝟐 + 𝒁 ∗
𝜶 √ +
𝟐 𝒏𝟏 𝒏𝟐 𝟐 𝒏𝟏 𝒏𝟐
2.5.5. Intervalo de confiança para a diferença entre duas médias quando as variâncias são desconhecidas e
iguais
Sejam 𝑋1 𝑒 𝑋2 duas variáveis aleatórias normais com médias 𝜇1 𝑒 𝜇2 desconhecidas e variâncias 𝜎1 2 𝑒 𝜎2 2 também
desconhecidas.
Se for possível assumir que as variânças sejam iguais, ou seja, 𝜎1 2 = 𝜎2 2 uma estimativa da variança pode ser
obtida como:
(𝑛1 − 1) ∗ 𝑆1 2 + (𝑛2 − 1) ∗ 𝑆2 2 1 1
𝑆𝑃 = √ ∗√ +
𝑛1 + 𝑛2 − 2 𝑛1 𝑛2
(𝑛1 − 1) ∗ 𝑆1 2 + (𝑛2 − 1) ∗ 𝑆2 2
𝑆𝑝 2 =
𝑛1 + 𝑛2 − 2
9
(12 − 1) ∗ 0.0082 + (12 − 1) ∗ 0.0062 1 1
𝑆𝑝 = √ ∗ √( + ) =
12 + 12 − 2 12 12
𝐺𝑟𝑎𝑢𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑑𝑎𝑑𝑒 = 𝑣 = 𝑛1 + 𝑛2 − 2 = 22
𝑡0.005;22 = 2.82
1 1
(2.538 − 2.52) ± 2.82 ∗ √0.000050 ∗ √( + ) ∈ 𝜇1 − 𝜇2
12 12
A partir dos resultados de n blocos, calcula-se e usa-se a distribuição 𝑡 para construír o intervalo de confiança para
a média da diferença 𝜇𝑑 :
𝑆𝑑 𝑆𝑑
𝑑̅ − 𝑡𝛼 ∗ ≤ 𝜇𝑑 ≤ 𝑑̅ − 𝑡𝛼 ∗
2 √𝑛 2 √𝑛
Se o valor zero estiver contido neste intervalo, então não pode ser descartada a hipótese que o desempenho dos
dois sistemas seja o mesmo.
Alunos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Antes 6.5 6.7 7.0 7.0 6.5 7.3 7.8 6.9 6.7 7.2 7.5 7.5 7.2 7.0 6.8
Depois 7.5 7.7 7.9 8.0 7.4 8.3 8.8 8.9 7.7 8.2 8.5 8.5 8.2 8.0 8.8
Diferença 1.0 1.0 0.9 1.0 0.9 1.0 1.0 2.0 1.0 1.0 1.0 1.0 1.0 1.0 2.0
Solução
Pelos dados temos:
𝑑̅ = 1.12 ; 𝑆𝑑 = 0.36; 𝑡0.025;14 = 2.145
𝑆𝑑 𝑆𝑑
𝑑̅ − 𝑡𝛼 ∗ ≤ 𝜇𝑑 ≤ 𝑑̅ − 𝑡𝛼 ∗
2 √𝑛 2 √𝑛
0.36 0.36
1.12 − 2.145 ∗ ≤ 𝜇𝑑 ≤ 1.12 + 2.145 ∗
√15 √15
0.92 ≤ 𝜇𝑑 ≤ 1.32
Conclusão: Como o valor zero não está incluído no intervalo, rejeita-se a hipótese de que as notas antes e depois
sejam as mesmas, logo conclui-se que o treinamento foi eficiente.
10
2.5.7. Intervalo de confiança para uma proporção
Seja que uma amostra de n observações, 𝑋1 , 𝑋2 , 𝑋3 , … , 𝑋𝑛 , é extraída de um processo de Bernoulli, com
probabilidade de sucesso constante igual a 𝑝. Então, a soma das observações seguirá o modelo Binomial com
parâmetros 𝑛 e 𝑝. Além disso, como cada 𝑥𝑖 pode ser 0 ou 1, a média:
𝑛
1
𝑋̅ = ∗ ∑ 𝑥𝑖
𝑛
𝑖=1
1 2
Será uma variável discreta contida no espaço {0, 𝑛 , 𝑛 , … , 1}.
A distribuição pode ser obtida a partir da Binomial, uma vez que:
𝑎𝑛
𝑛
𝑃(𝑋̅ ≤ 𝑎) = 𝑃(𝑋 ≤ 𝑎𝑛) = ∑ ( ) ∗ 𝑝𝑘 ∗ (1 − 𝑝)𝑛−𝑘
𝑘
𝑘=0
Onde [𝑎𝑛] é o maior inteiro menor que 𝑎𝑛. A média e a variança de 𝑋̅ são:
𝑝 ∗ (1 − 𝑝)
𝜇𝑋̅ = 𝑝 𝑒 𝜎 2𝑋̅ =
𝑛
Logo se n é grande (𝑛 ≥ 30) 𝑒 𝑝 ≥ 0.1, então a aproximação Normal para a Binomial pode ser usada, resultando
no seguinte intervalo de confiança de 1 − 𝛼:
𝒑−𝝅
𝒁= ~𝑵(𝟎; 𝟏)
√ 𝝅 ∗ (𝟏 − 𝝅)
𝒏
𝒑 ∗ (𝟏 − 𝒑) 𝒑 ∗ (𝟏 − 𝒑)
𝒑 − 𝒁𝜶 ∗ √ ≤ 𝝅 ≤ 𝒑 + 𝒁𝜶 ∗ √
𝟐 𝒏 𝟐 𝒏
Se 𝑛 é pequeno o problema deve ser resolvido usando tabelas de distribuição binomial. Se 𝑝 é pequeno, é possível
usar a distribuição de Poisson.
Para as populações 𝑁 finitas e conhecidas, o intervalo será dado por:
𝑝 ∗ (1 − 𝑝) 𝑁−𝑛 𝑝 ∗ (1 − 𝑝) 𝑁−𝑛
𝑝 − 𝑍𝛼 ∗ √ ∗√ ≤ 𝜋 ≤ 𝑝 + 𝑍𝛼 ∗ √ ∗√
2 𝑛 𝑁−1 2 𝑛 𝑁−1
Suponha que X é uma variável aleatória Normal com média e variança desconhecida. Seja que a variança amostral
𝑆 2 é calculada para uma amostra de n observações. Então, um intervalo bilateral de confiança 1 − 𝛼 é obtido
usando-se a distribuição do Chi-quadrado:
(𝑛 − 1) ∗ 𝑆 2 2
(𝑛 − 1) ∗ 𝑆 2
≤ 𝜎 ≤
𝜒 2 𝛼;𝑛−1 𝜒 21−𝛼;𝑛−1
2 2
Solução
12
O requisito para o IC 𝜎 2 para é satisfeito, uma vez que a população é normal. Temos que usar a distribuição 𝜒 2 com
𝑛 − 1 = 14 graus de liberdade. Como o nível de confiança é de 95%, em cada cauda da distribuição temos que ter
2,5%. Assim, para a cauda superior, devemos usar o valor crítico 𝜒 2 0.025;14 , procurando na linha correspondente a
14 graus de liberdade e na coluna correspondente à probabilidade de 0,025. Encontramos que 𝜒 2 0.025;14 = 26.119
Para a cauda inferior, devemos usar o valor crítico 𝜒 2 0.975;14, procurando na linha correspondente a 14 graus de
liberdade e na coluna correspondente à probabilidade de 0,975.
Encontramos que χ
Onde 𝐹𝛼;𝑢;𝑣 são os pontos percentuais da distribuição F com u e v graus de liberdade, tais que 𝑃{𝐹 ≥ 𝐹𝛼;𝑢;𝑣 } = 𝛼
Se o valor um estiver contido neste intervalo, então não pode ser descartada a hipótese de que a variânça das duas
populações seja a mesma.
Os valores da distribuição F costumam fornecer apenas os valores de 𝐹𝛼 , mas 𝐹1−𝛼 pode ser obtido a partir da
seguinte relação:
1
𝐹1−𝛼;𝑢;𝑣 =
𝐹𝛼;𝑣;𝑢
A 91.0 90.3 90.2 92.1 91.8 91.3 89.3 91.0 91.2 89.6
B 91.8 91.2 89.4 89.2 90.7 92.6 91.3 91.2
Solução:
𝑆 2𝐴 = 0.8307 𝑒 𝑆 2 𝐵 = 1.316
1 1
𝐹0.025;9;7 = 4.82 𝑒 𝐹0.925;9;7 = = = 0.238
𝐹0.025;7;9 4.20
0.8307 𝜎 21 0.8307
∗ 0.238 ≤ 2 ≤ ∗ 4.82
1.316 𝜎 2 1.316
Conclusão: O intervalo inclui o valor 1, assim não pode ser descartada a hipótese de que a variabilidade das duas
máquinas seja a mesma.
Nota: Além de servir para a comparação de duas varianças, a distribuição F é a chave para a comparação de
vários grupos, o que é feito usando o procedimento conhecido como Análise de Variança.
13