10 - Inferência Estatística

1
Inferência Estatística
• Teste de hipóteses
Evelyn: evelyn.ramos@facens.br
(15) 99710-7617
@eng.evelynabreu
2
Teste T
Teste para variância desconhecida
Teste sobre a média de uma normal com variância desconhecida
Uma situação comum ocorre quando não se tem informação sobre a variância. Neste
caso, a variância é estimada com base nos dados da amostra e o cálculo da estatística
do teste é:
𝑛 ∙ (𝑋ത − 𝜇0 )
𝑇=
𝑆
Para este teste, a distribuição de referência é a 𝑡 de 𝑆𝑡𝑢𝑑𝑒𝑛𝑡 com 𝑛 − 1 graus de

liberdade. Para validade do teste supõe-se que os dados provenham de uma
distribuição aproximadamente normal, especialmente quando 𝑛 < 30.
Exemplo 1
Um fabricante afirma que seus cigarros contêm
não mais que 30 mg de nicotina. Uma amostra
de 25 cigarros fornece a média de 31,5 mg e
desvio padrão 3 mg. No nível de confiança de
95%, os dados refutam a afirmação do
fabricante?
Exemplo 1
n = 25
𝑋ത = 31,5
𝑑𝑎𝑑𝑜𝑠: 𝑆=3
𝛼 = 5%
𝐺𝑙 = 𝑛 − 1
𝐻0 : 𝜇 = 30
ቊ
𝐻1 : 𝜇 > 30
𝑛 ∙ (𝑋ത − 𝜇0 )
𝑇= = 𝑇𝑜𝑏𝑠
𝑆
Exemplo 1
Por que Rc = 1,71?
Vamos analisar na tabela t student.
Gl = n – 1
Gl = 25 -1
Gl = 24
Área da cauda = 5% devido nível de confiança = 95%

Exemplo 1
n = 25
ത
𝑋 = 31,5
𝑑𝑎𝑑𝑜𝑠:
𝑆=3
𝛼 = 5%
𝐻 : 𝜇 = 30
ቊ 0
𝐻1 : 𝜇 > 30
𝑛 ∙ (𝑋ത − 𝜇0 )
𝑆
25 ∙ (31,5 − 30)
𝑇𝑜𝑏𝑠 = = 2,5
3 𝐶𝑜𝑚𝑜 𝑡𝑜𝑏𝑠 > 1,71, 𝑟𝑒𝑗𝑒𝑖𝑡𝑎𝑚𝑜𝑠 𝐻0
Teste T – Exemplo 2
O tempo médio, por operário, para executar uma tarefa, tem
sido 100 minutos, com um desvio padrão de 15 minutos. Foi feita
uma modificação para melhorar esse tempo, e, após algum
tempo foi selecionada uma amostra de 16 operários, a média da
amostra foi 90 minutos e desvio padrão 12 minutos. Estes
resultados trazem evidências de melhora? Utilize nível de
confiança de 95%
Exemplo 2
𝑛 = 16
𝑋ത0 = 90
𝑆 = 12
𝛼 = 5%
𝐻 : 𝜇 = 100
ቊ 0
𝐻1 : 𝜇 < 100
𝑋 ∙ (𝑋ത − 𝜇)
𝑆
Exemplo 2
𝑛 = 16
𝑋ത0 = 90
𝑆 = 12
𝛼 = 5%
𝐻0 : 𝜇 = 100
ቊ
𝐻1 : 𝜇 < 100
𝑆𝑢𝑝𝑜𝑛𝑑𝑜 𝑞𝑢𝑒 𝑋ത ~𝑁 (𝜇, 𝜎 2 )
𝑋 ∙ (𝑋ത − 𝜇)
𝑆
16 ∙ (90 − 100)
𝑇𝑜𝑏𝑠 = = −3,33
12
Pela tabela 𝑡 de 𝑆𝑡𝑢𝑑𝑒𝑛𝑡 temos para 15 graus de liberdade de 5% 𝑡𝑡𝑎𝑏 = −1,7531. Como
𝑇𝑜𝑏𝑠 < 𝑇𝑡𝑎𝑏
Rejeitamos 𝐻0 .
Exemplo 3
O tempo para transmitir 10 MB em determinada rede de computadores varia
segundo um modelo normal, com média 7,4 segundos e variância 1,3
segundo quadrado. Depois de algumas mudanças na rede, acredita-se numa
redução no tempo de transmissão de dados, além de uma possível alteração
na variabilidade. Foram realizados 10 ensaios independente com um arquivo
de 10 MB e os dados coletados foram: 𝑥ҧ = 6,94 segundos, 𝑠 = 0,551. Existe
evidências de que o tempo médio de transmissão foi reduzido? Use nível de
significância de 5%.
Exemplo 3
𝑛 = 10
𝑋ത0 = 6,94
𝑆 = 0,551
𝛼 = 5%
𝐻 : 𝜇 = 7,4
ቊ 0
𝐻1 : 𝜇 < 7,4
𝑛 ∙ (𝑋ത − 𝜇)
𝑆
Exemplo 3
𝑛 = 10
ത
𝑋0 = 6,94
𝑆 = 0,551
𝛼 = 5%
𝐻0 : 𝜇 = 7,4
ቊ
𝐻1 : 𝜇 < 7,4
𝑆𝑢𝑝𝑜𝑛𝑑𝑜 𝑞𝑢𝑒 𝑋ത ~𝑁 (𝜇, 𝜎 2 )
𝑛 ∙ (𝑋ത − 𝜇)
𝑆
10 ∙ (6,94 − 7,4) 10(−0,46)
𝑇𝑜𝑏𝑠 = = = −2,64
0,551 0,551
Pela tabela 𝑡 de 𝑆𝑡𝑢𝑑𝑒𝑛𝑡 temos para 9 graus de liberdade de 5% 𝑡𝑡𝑎𝑏 = −1,8331. Como
𝑇𝑜𝑏𝑠 < 𝑇𝑡𝑎𝑏
Rejeitamos 𝐻0 .
Teste t pareado
Teste de Hipóteses
Teste t para duas amostras pareadas
O teste 𝑡 é apropriado para comparar dois conjuntos de dados quantitativos, em termos de seus
valores médios.
𝐻 : 𝜇 = 𝜇2
ቊ 0 1
𝐻1 : 𝜇1 ≠ 𝜇2
𝐻 : 𝜇 = 𝜇2
ቊ 0 1
𝐻1 : 𝜇1 > 𝜇2
𝐻 : 𝜇 = 𝜇2
ቊ 0 1
𝐻1 : 𝜇1 < 𝜇2
Vamos estudar um exemplo em que dois conjuntos de dados são pareados. Contudo, as
observações entre os pares devem ser independentes.
Exemplo 4: Teste 𝑡 pareado
Seja o problema de verificar se um novo algoritmo de busca em
um banco de dados é mais rápido que o algoritmo usado
atualmente. Para fazer a comparação dos dois algoritmos,
planeja-se realizar uma amostra aleatória de dez buscas
experimentais (ensaios). Em cada ensaio, uma dada busca é
realizada pelos dois algoritmos e o tempo de resposta é anotado.
Observamos que em cada ensaio os dois algoritmos são usado
em condições idênticas, caracterizando dez pares de
observações.
𝐻0 : 𝑒𝑚 𝑚é𝑑𝑖𝑎, 𝑜𝑠 𝑑𝑜𝑖𝑠 𝑎𝑙𝑔𝑜𝑟𝑖𝑡𝑚𝑜𝑠 𝑠ã𝑜 𝑖𝑔𝑢𝑎𝑙𝑚𝑒𝑛𝑡𝑒 𝑟á𝑝𝑖𝑑𝑜𝑠
ቊ
𝐻1 : 𝑒𝑚 𝑚é𝑑𝑖𝑎, 𝑜 𝑛𝑜𝑣𝑜 𝑎𝑙𝑔𝑜𝑟𝑖𝑡𝑚𝑜 é 𝑚𝑎𝑖𝑠 𝑟á𝑝𝑖𝑑𝑜 𝑑𝑜 𝑞𝑢𝑒 𝑜 𝑎𝑙𝑔𝑜𝑟𝑖𝑡𝑚𝑜 𝑒𝑚 𝑢𝑠𝑜
𝐻 : 𝜇 = 𝜇2
ቊ 0 1
𝐻1 : 𝜇1 < 𝜇2
Suponha que o experimento tenha sido realizado, gerando os dados apresentados

abaixo:
Tempo de resposta (segundos)
Ensaio
Novo 𝑿𝟏 Antigo 𝑿𝟐 Diferença 𝑫 = 𝑿𝟐 − 𝑿𝟏
1 22 25 3
2 21 28 7
3 28 26 -2
4 30 36 6
5 33 32 -1
6 33 39 6
7 26 28 2
8 24 33 9
9 31 30 -1
10 22 27 5
Como os dados são pareados, podemos verificar em cada ensaio o quanto um
tratamento (algoritmo) foi melhor do que o outro, ou seja, analisar a variável
𝐷 = 𝑋2 − 𝑋1
Em termos da variável diferença 𝐷, as hipóteses são descritas como:
𝐻0 : 𝜇𝐷 = 0
ቊ
𝐻1 : 𝜇𝐷 > 0
Onde 𝜇𝐷 é o valor esperado de 𝐷.

Utilizando a diferença o problema fica semelhante ao teste da média. Assim:
𝑑ҧ 𝑛
𝑡=
𝑠𝑑
Onde:
– 𝑛 é o tamanho da amostra (número de pares);

– 𝑑ҧ é a média das diferenças observadas; e
– 𝑠𝑑 é o desvio padrão das diferenças observadas.
Supondo que os valores de 𝐷 venham de uma distribuição aproximadamente normal o

teste pode ser realizado com distribuição 𝑡 de 𝑆𝑡𝑢𝑑𝑒𝑛𝑡 com 𝑛 − 1 graus de liberdade.
Com os valores de 𝐷 temos:
𝑛 = 10, 𝑑ҧ = 3,4 e 𝑠𝑑 = 3,81
Portanto,
𝑑ҧ 𝑛 3,4 10
𝑡= = = 2,82
𝑠𝑑 3,81
Para 9 graus de liberdade em um teste unilateral temos que valor encontrado corresponde a um p-
valor de 1%.
Podemos definir 𝑡𝑡𝑎𝑏 = 1,8331 para 𝛼 = 5%, como 𝑡𝑜𝑏𝑠 = 2,82 > 1,8331 rejeitamos a hipótese
nula.
Portanto há evidências que o novo método de busca é mais rápido que o antigo.
Teste 𝑡 para duas amostras independentes
Exemplo 5: Desejamos verificar se os catalisadores A e B tem efeitos
diferentes no rendimento de certa reação química. As hipótese são:
𝐻0 : 𝜇1 = 𝜇2
ቊ
𝐻1 : 𝜇1 ≠ 𝜇2
Para testar essas hipóteses foram realizados 10 ensaios com os catalizadores

em ordem aleatória. Segundo Fisher “a aleatoriedade dos grupos é
fundamental para resguardar a validade de um teste de significância”.
Exemplo 5
Os resultados do experimento são mostrados abaixo:
Como temos amostras do mesmo tamanho:
𝑛
𝑡 = 𝑥1ҧ − 𝑥ҧ2 .
2𝑠𝑎2
Onde:
𝑛 é o tamanho da amostra;
𝑥1ҧ é a média da amostra 1; 𝑥ҧ2 é a média da amostra 2;
𝑠12 é a variância da amostra 1; 𝑠22 é a variância da amostra 2;
𝑠𝑎2 é a variância agregada das duas amostras, dada por:
𝑠12 + 𝑠22
𝑠𝑎2 =
2
Exemplo 5
Amostra 1: 𝑛 = 10, 𝑥ҧ1 = 49,900 e 𝑠12 = 35,656
Amostra 2:𝑛 = 10, 𝑥ҧ2 = 44,700 e 𝑠22 = 42,233
35,656 + 42,233
𝑠𝑎2 = = 38,945
2
Desta forma a estatística do teste é:
𝑛
𝑡 = 𝑥ҧ1 − 𝑥ҧ2 .
2𝑠𝑎2
10
t = 49,9 − 44,7 . = 5,2 0,1284 = 1,86
2(38,94)
Graus de liberdade: 2𝑛 − 2 = 2 10 − 2 = 18
Para significância de 5% temos (para um teste bilateral) 𝑡𝑡𝑎𝑏 = 2,101, como 𝑡𝑜𝑏𝑠 = 1,86
pertence à região de aceitação, não rejeitamos 𝐻0 .
Teste para amostras de tamanhos diferentes
Para o caso de as amostras terem tamanhos diferentes (𝑛1 ≠ 𝑛2 ), os cálculos
devem ser feitos por:
2 2
𝑛1 − 1 𝑠1 + (𝑛 2 − 1)𝑠2
𝑠𝑎2 =
𝑛1 + 𝑛2 − 2
𝑥ҧ1 − 𝑥ҧ2
𝑡=
1 1
𝑠𝑎 +
𝑛1 𝑛2
Exemplo 6
Para avaliar o efeito de um brinde nas vendas de determinado produto, planeja-se comparar as vendas em
lojas que vendem o produto com o brinde, com as vendas em lojas que não oferecem o brinde. Para reduzir o
efeito de variações devidas a outros fatores, as lojas foram agrupadas em pares, de tal forma que as lojas de
um mesmo par são o mais similar possível, em termos, do volume de vendas, localidade, identidade de preços
etc. Em cada par de lojas, uma passou a oferecer o brinde e a outra, não.
Apresente as hipóteses nula e alternativa.
Os resultados das vendas, em quantidade de unidades vendidas são apresentados na tabela abaixo. Os dados
mostram evidência suficiente para se afirmar que a oferta do brinde aumenta as vendas? 𝛼 = 5%
Par de loja Vendas sem brinde Vendas com brinde

1 33 43
2 43 39
3 26 33
4 19 32
5 37 43
6 27 46
Média 30,83 39,33
Variância 73,77 33,07
Exemplo 6
As hipóteses do teste são:
𝐻 : 𝜇 = 𝜇2
ቊ 0 1
𝐻1 : 𝜇1 ≠ 𝜇2
A variância agregada é:
73,77 + 33,07
𝑠𝑎2 = = 53,42
2
E a estatística do teste é:
𝑛
𝑡 = 𝑥1ҧ − 𝑥ҧ2 .
2𝑠𝑎2
6 6
𝑡 = 30,83 − 39,33 . = −8,5 .
2(53,42) 106,84
𝑡 = −8,5 . 0,2369 = −2,01
Desta forma, ao nível de significância de 5%, para 2n-2 = 10 graus de liberdade, pela tabela 𝑡 temos: (2,5% de cada lado, teste bilateral)
𝑡𝑡𝑎𝑏 = ±2,2281
Como 𝑡𝑜𝑏𝑠 = −2,01, não pertence à região crítica, não rejeitamos a hipótese nula.
Teste para variância
Observou-se a produção diária de uma indústria durante vários anos, verificando-se que ela
obedecia a uma distribuição normal N(12.000,700). A variância sempre foi considerada elevada e
por este motivo foram aplicadas algumas melhorias e, durante 30 dias, observou-se a produção.
Após esse período, constatou-se que a média é 12.000 produtos e a variância é 400. Há razões
para acreditar que a variância está menor, ao nível de 5?
Teste de normalidade
Vamos gerar 30 observações com
distribuição log-normal e verificar se
a exponencial desses dados possui
distribuição normal. É esperado que
o teste falhe
A hipótese nula é de que os dados

são normalmente distribuídos
Teste de Normalidade
Teste de Normalidade
Referência Bibliográfica
BIBLIOGRAFIA BÁSICA
1. BARBETTA, P. A., REIS, M. M., BORNIA, A. C. Estatística para cursos de engenharia e informática. São
Paulo: Atlas, 2004
2. MORETTIN, Luiz Gonzaga. Estatística básica: probabilidade. 9. ed. São Paulo: Makron Books, 2018.
3. CRESPO, A. Arnot. Estatística fácil. 18. ed. São Paulo: Saraiva, 2006.
BIBLIOGRAFIA COMPLEMENTAR
1. TOLEDO, G. L., OVALLE, I. I. Estatística básica. 2. ed. São Paulo: Atlas, 1995.
2. OLIVEIRA, Francisco Estevam Martins de. Estatistica e probabilidade exercicios resolvidos e propostos.
3. Rio de Janeiro LTC 2017 1 recurso online ISBN 9788521633846.
3. TRIOLA, Mario F. Introdução à estatística. 10. ed. Rio de Janeiro: LTC, 2008.
55

10 - Inferência Estatística

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

10 - Inferência Estatística

Enviado por

Direitos autorais:

Formatos disponíveis

1

Para este teste, a distribuição de referência é a 𝑡 de 𝑆𝑡𝑢𝑑𝑒𝑛𝑡 com 𝑛 − 1 graus de

Área da cauda = 5% devido nível de confiança = 95%

𝑆𝑢𝑝𝑜𝑛𝑑𝑜 𝑞𝑢𝑒 𝑋ത ~𝑁 (𝜇, 𝜎 2 )

𝑇𝑜𝑏𝑠 < 𝑇𝑡𝑎𝑏

𝑆𝑢𝑝𝑜𝑛𝑑𝑜 𝑞𝑢𝑒 𝑋ത ~𝑁 (𝜇, 𝜎 2 )

𝑇𝑜𝑏𝑠 < 𝑇𝑡𝑎𝑏

Suponha que o experimento tenha sido realizado, gerando os dados apresentados

Em termos da variável diferença 𝐷, as hipóteses são descritas como:

Onde 𝜇𝐷 é o valor esperado de 𝐷.

– 𝑛 é o tamanho da amostra (número de pares);

Supondo que os valores de 𝐷 venham de uma distribuição aproximadamente normal o

𝑛 = 10, 𝑑ҧ = 3,4 e 𝑠𝑑 = 3,81

Para testar essas hipóteses foram realizados 10 ensaios com os catalizadores

Como temos amostras do mesmo tamanho:

Desta forma a estatística do teste é:

Par de loja Vendas sem brinde Vendas com brinde

𝑡 = −8,5 . 0,2369 = −2,01

A hipótese nula é de que os dados

Você também pode gostar