Você está na página 1de 28

Inferência Estatística

1 - Introdução

Diversos problemas da Engenharia e outras ciências requerem que decidamos entre aceitar ou
rejeitar uma afirmação acerca de algum parâmetro. Essa afirmação é chamada de hipótese e o
procedimento de tomada de decisão sobre a hipótese é chamado de teste de hipóteses.

Para se realizar um teste de hipótese estatística, retira-se uma amostra da população em estudo,
com base nessa amostra e utilizando um estimador não tendencioso do parâmetro toma-se a decisão
de rejeitar ou aceitar a afirmação.

De uma forma geral, a estrutura do teste de hipóteses é:

(i) H0: θ = θ0 (ou ≥) (2) H0: θ = θ0 (ou ≤) (3) H0: θ = θ0


H1: θ < θ0 H0: θ > θ0 H1: θ ≠ θ0

Nessa estrutura, H0 é chamado de hipótese nula e H1 é chamada de hipótese alternativa. Em (i),


temos o teste unilateral esquerdo, que irá testar desvios no parâmetro que sejam inferiores ao valor a
ser testado. Em (ii), temos o teste unilateral direito, que irá testar desvios no parâmetro que sejam
superiores ao valor a ser testado. Em (iii), temos o teste bilateral, que testa diferenças no parâmetro
em ambos os lados.

Um conceito importante a ser definido é o nível de significância α, que é utilizado para se definir as
regiões de aceitação e rejeição do teste de hipóteses. O valor mais utilizado é 5%, que é o valor a ser
utilizado nesse curso.

Outro importante conceito é o P-value (ou Valor P) que é o menor nível de significância que conduz à
rejeição da hipótese nula H0 com os dados fornecidos.

Quando uma estimativa de um parâmetro não fornece informação suficiente é interessante fazermos
o intervalo de confiança para um parâmetro.

2 - Inferência Estatística para uma Única Amostra

2.1 - Inferência Estatística sobre a Média


Sabemos que a média amostral é um estimador não tendencioso da média populacional µ, assim de
posse de uma amostra, deve-se calcular o valor da média amostral para se testar hipóteses sobre a
média populacional.

2.1.1 - Uso da Distribuição Normal

Para utilizar-se a distribuição normal considera-se que a população de origem seja normalmente
distribuída, ou que as condições do Teorema Central do Limite sejam satisfeitas. Assim, a distribuição
da média amostral é aproximadamente normal, com média µ e variância σ2/n.

De acordo com a estrutura apresentada anteriormente, podemos testar as seguintes hipóteses:


(1)H0: µ = µ0 (ou ≥) (2)H0: µ = µ0 (ou ≤) (3)H0: µ = µ0
H1 : µ < µ 0 H1: µ > µ 0 H1: µ ≠ µ 0

A estatística de testes a ser utilizada é:


Adotando-se um nível de significância de 5%, teremos as seguintes regiões críticas:
- Para o Teste Unilateral Esquerdo, a região crítica será: Rc = {Z < - 1,645};
- Para o Teste Unilateral Direito, a região crítica será: Rc = {Z > 1,645 };
- Para o Teste Bilateral, a região crítica sera: Rc = {│Z│> 1,96}.

(1) (2) (3)


Figura 1 – Gráficos da estatística de teste, com suas respectivas regiões críticas

Se o valor observado da Estatística de Teste pertencer à região crítica, deve-se rejeitar a hipótese
nula H0, caso contrário não rejeita-se a hipótese nula H0.

A tomada de decisão também pode ser feita utilizando-se o P-value:


- rejeita-se a hipótese nula se: P-value ≤ α
- não rejeita-se a hipótese nula se: P-value > α

Para o teste bilateral teremos o seguinte intervalo de confiança:

EXEMPLO 1

Proposta:
Testar a média de uma população, quando o desvio padrão da população for conhecido.

Problema:
Considere que uma indústria compra de um certo fabricante, pinos cuja resistência média à
ruptura é especificada em 12 kgf (valor nominal da especificação). Em um determinado dia, a
indústria recebeu um grande lote de pinos e a equipe técnica da industria deseja verificar se
o lote atende às especifições. Considere o desvio padrão como igual 4 e que a resistência à
ruptura é normalmente distribuída. Adote um nível de significância de 5%.

Tem-se interesse em testar as seguintes hipóteses:


H0: µ = 12
H1: µ ≠ 12

A região crítica será: Rc = {│Z│> 1,96}.

Ferramentas:
1-Sample Z
Fonte de dados:
TH-1.mpj

1-SAMPLE Z
1. Abra o arquivo TH-1
2. Selecione Static > Basic Statics > 1-Sample Z
3. Preencha o quadro de acordo a figura seguinte:

4. Clique em OK

SAÍDA DO MINITAB

One-Sample Z: Resistência Média à Ruptura; Resistência Média à Ruptura

Test of mu = 12 vs not = 12
The assumed standard deviation = 4

Variable N Mean StDev SE Mean 95% CI Z


P
Resistência Média 22 13,4773 3,1954 0,8528 (11,8058; 15,1487) 1,73
0,083

INTERPRETAÇÃO DOS RESULTADOS


Assim, vemos que a estatística de teste observada foi igual a 1,73. Esse valor encontrado
não pertence à região crítica, logo não rejeitamos a hipótese nula H0 e rejeitamos a hipótese
alternativa H1.
Também podemos utilizar o P-value para interpretar os resultados: nesse caso, obtivemos
um P-value igual a 0,083, que é maior que o nível de significância α adotado (0,05). Logo
não rejeitamos a hipótese nula H0.

CONCLUSÃO
Há evidências estatísticas para considerarmos que a resistência média à ruptura dos pinos
produzidos pelo fabricante seja realmente igual a 12, assim esses pinos estão dentro das
especificações estabelecidas.

INTERVALO DE CONFIANÇA
De acordo com a saída do MINITAB 14, temos o seguinte Intervalo de Confiança:

IC(µ; 0,95) = (11,8058; 15,1487)

A interpretação é que temos 95% de chances de encontrarmos valores de resistência à


ruptura dentro do Intervalo de Confiança acima.

Como o Intervalo de Confiança acima contém o 12, podemos concluir então que a resistência
média à ruptura dos pinos produzidos pelo fabricante seja realmente igual a 12.

2.1.2 Uso da Distribuição T-Student

Utilizar-se a distribuição T-Student quando o desvio-padrão é desconhecido e o tamanho da amostra


é menor que 30. Se a população for normalmente distribuída, podemos utilizar o desvio-padrão
amostral s para estimar o desvio-padrão populacional σ.

De acordo com a estrutura apresentada anteriormente, podemos testar as seguintes hipóteses:

(1)H0: µ = µ0 (ou ≥) (2)H0: µ = µ0 (ou ≤) (3)H0: µ = µ0


H1 : µ < µ 0 H1: µ > µ 0 H1: µ ≠ µ 0

A estatística de testes a ser utilizada é:

Adotando-se um nível de significância de 5%, teremos as seguintes regiões críticas:

- Para o Teste Unilateral Esquerdo, a região crítica será: Rc = {T < - t 0,05; n-1};
- Para o Teste Unilateral Direito, a região crítica será: Rc = {T > t 0,05; n-1};
- Para o Teste Bilateral, a região crítica sera: Rc = {│T│> t 0,025; n-1}.
(i) (ii) (iii)
Figura 2 – Gráficos da estatística de teste, com suas respectivas regiões críticas

Se o valor observado da Estatística de Teste pertencer à região crítica, deve-se rejeitar a hipótese
nula H0, caso contrário não rejeita-se a hipótese nula H0.

A tomada de decisão também pode ser feita utilizando-se o P-value:


- rejeita-se a hipótese nula se: P-value ≤ α
- não rejeita-se a hipótese nula se: P-value > α

Para o teste bilateral teremos o seguinte intervalo de confiança:

EXEMPLO 2
Proposta:
Testar a média da população, quando o desvio padrão da população for desconhecido (não
importando o tamanho da amostra).

Problema:
O exemplo é o mesmo anterior, só que agora o desvio-padrão não é conhecido.

Tem-se interesse em testar as seguintes hipóteses:

H0: µ = 12
H1: µ ≠ 12

A região crítica será: Rc = {│T│> t 0,025; 21} => Rc = {│T│> 2,08}.

Ferramentas
1-Sample T

Fonte de dados:
TH-1.mpj

1-SAMPLE T
1. Abra o arquivo TH-1
2. Selecione Static > Basic Statics > 1-Sample T
3. Preencha o quadro de acordo a figura seguinte:

4. Clique em OK

SAÍDA DO MINITAB

One-Sample T: Resistência Média à Ruptura

Test of mu = 12 vs not = 12

Variable N Mean StDev SE Mean 95% CI T P


Resistência Média 22 13,4773 3,1954 0,6813 (12,0605; 14,8940) 2,17 0,042

INTERPRETAÇÃO DOS RESULTADOS

Assim, vemos que a estatística de teste observada foi igual a 2,17. Esse valor encontrado
pertence à região crítica, logo rejeitamos a hipótese nula H0 e não rejeitamos a hipótese
alternativa H1.

Também podemos utilizar o P-value para interpretar os resultados: nesse caso, obtivemos
um P-value igual a 0,042, que é menor que o nível de significância α adotado (0,05), logo
rejeitamos a hipótese nula H0.

CONCLUSÃO
Há evidências estatísticas fortes para considerarmos que a resistência média à ruptura dos
pinos produzidos pelo fabricante seja diferente de 12, assim esses pinos não estão dentro
das especificações estabelecidas.

UTILIZANDO O INTERVALO DE CONFIANÇA

De acordo com a saída do MINITAB 14, temos o seguinte Intervalo de Confiança:

IC(µ; 0,95) = (12,0605; 14,8940)

A interpretação é que temos 95% de chances de encontrarmos valores de resistência à


ruptura dentro do Intervalo de Confiança acima.

Como o Intervalo de Confiança acima não contém o 12, podemos concluir então que a
resistência média à ruptura dos pinos produzidos pelo fabricante não seja igual a 12. Como o
intervalo de confiança está um pouco acima do 12, podemos considerar que o valor da
resistência média à ruptura desses pinos seja superior ao valor especificado.

2.2 - Inferência sobre a Proporção de uma População


Freqüentemente, é necessário testar hipóteses e construir intervalos de confiança para a proporção
de uma população. Se o número de sucessos e o número de fracassos forem pelo menos iguais a 5,
a distribuição de amostragem de uma proporção irá seguir aproximadamente uma normal.

As hipóteses a serem testadas são:

(1)H0: p = p0 (ou ≥) (2)H0: p = p0 (ou ≤) (3) H0: p = p0


H1: p < p0 H1: p > p0 H1: p ≠ p0

Nesse caso, a estatística de testes a ser utilizada é:

Adotando-se um nível de significância de 5%, teremos as seguintes regiões críticas:


- Para o Teste Unilateral Esquerdo, a região crítica será: Rc = {Z < - 1,645};
- Para o Teste Unilateral Direito, a região crítica será: Rc = {Z > 1,645 };
- Para o Teste Bilateral, a região crítica sera: Rc = {│Z│> 1,96}.

Se o valor observado da Estatística de Teste pertencer à região crítica, deve-se rejeitar a hipótese
nula H0, caso contrário não rejeita-se a hipótese nula H0.

A tomada de decisão também pode ser feita utilizando-se o P-value:


- rejeita-se a hipótese nula se: P-value ≤ α
- não rejeita-se a hipótese nula se: P-value > α

Para o teste bilateral teremos o seguinte intervalo de confiança:


EXEMPLO 3
Proposta:
Testar a proporção de uma população.

Problema:
Um fabricante de semicondutores produz controladores usados em aplicações no motor de
automóveis. O consumidor requer que a fração defeituosa em uma etapa crítica de
fabricação não exceda 0,05 e que o fabricante demonstre uma capacidade de processo
nesse nível de qualidade, usando um nível de significância de 5%. O fabricante dos
semicondutores retira uma amostra aleatória de 200 aparelhos e encontra que 4 deles são
defeituosos. O fabricante pode demonstrar uma capacidade de processo para o consumidor?

Tem-se interesse em testar as seguintes hipóteses:

Temos a seguinte Hipótese: H0: p = 0,05


H1: p <0,05

A região crítica será: Rc = { Z < - 1,645}

Ferramentas
1-Proportion

Fonte de Dados:

1 - PROPORTION
1. Abra o MINITAB 14;
2. Selecione Static > Basic Statics > 1-Proportion;
3. Preencha o quadro de acordo a figura seguinte:
4. Clique em Options;
5. Preencha o quadro de acordo a figura seguinte:

6. Clique em OK;

SAÍDA DO MINITAB

Test and CI for One Proportion

Test of p = 0,05 vs p < 0,05

95%
Upper
Sample X N Sample p Bound Z-Value P-Value
1 4 200 0,020000 0,036283 -1,95 0,026

INTERPRETAÇÃO DOS RESULTADOS


Assim, vemos que a estatística de teste observada foi igual a -1,95. Esse valor encontrado
pertence à região crítica, logo rejeitamos a hipótese nula H0 e não rejeitamos a hipótese
alternativa H1.

Obtivemos um P-value igual a 0,026, que é menor que o nível de significância α adotado
(0,05), logo rejeitamos a hipótese nula H0 e não rejeitamos a hipótese alternativa H1.

CONCLUSÃO
Há evidências estatísticas fortes para considerarmos que proporção defeituosa do processo
é menor que 0,05. Assim o fabricante de semicondutores demonstra uma capacidade de
processo no nível de qualidade requerida pelo seu consumidor.

UTILIZANDO O INTERVALO DE CONFIANÇA


De acordo com a saída do MINITAB 14, temos o seguinte Intervalo de Confiança:

IC(µ; 0,95) = ( ≤ 0,036283)

A interpretação é que temos 95% de chances de encontrarmos proporções de controladores


que sejam no máximo iguais a 0,036283.

2.3 - Teste de Normalidade


Em muitos casos é importante testarmos a normalidade da população estudada. Nos teste
anteriores, fazíamos a suposição de normalidade.
Para o teste de Normalidade, as hipóteses a serem testadas são:
Ho: X é aproximadamente normal – X ~ N(µ, σ2)
H1: A População X não é normalmente distribuída
No MINITAB 14, podemos plotar um gráfico de Normalidade, se os pontos estiverem bem
alinhados, pode-se considerar que a população seja normalmente distribuída.
Esse julgamento é subjetivo, podendo se também calcular o valor de 3 diferentes Estatísticas
de Teste: Anderson-Darling, Ryan-Joiner e Kolmogorov-Smirnov.

A tomada de decisão também é feita utilizando-se o P-value:


- rejeita-se a hipótese nula se: P-value ≤ α
- não rejeita-se a hipótese nula se: P-value > α

EXEMPLO 4

Proposta:

Problema:
Teste se a Resistência Media à Ruptura é normalmente distribuída.

Ferramentas:
Normality Test
Probability Plot
Fonte de dados:
TH-1.mpj

NORMALITY TEST
1. Abra o MINITAB 14
2. Selecione Static > Basic Statics > Normality Test
3. Preencha o quadro de acordo a figura seguinte:

4. Clique em OK

SAÍDA DO MINITAB
Gráfico de Normalidade para a Resistência Média à Ruptura
Normal
99
Mean 13,71
StDev 3,554
95 N 22
KS 0,085
90
P-Value >0,150
80
70
Percent

60
50
40
30
20

10

1
5,0 7,5 10,0 12,5 15,0 17,5 20,0 22,5
Resistência Média à Ruptura

INTERPRETAÇÃO DOS RESULTADOS

Obtivemos um P-value ligeiramente inferior a 0,15, que é maior que o nível de significância α
adotado (0,05), logo rejeitamos a hipótese nula H0 e não rejeitamos a hipótese alternativa H1.

CONCLUSÃO
Há evidências estatísticas para se aceditar a Resistência à Ruptura dos pinos seja normalmente
distribuída.

3 - Inferência Estatística para uma Duas Amostras


Agora iremos expandir os resultados anteriormente obtidos para comparações entre duas populações
independentes.

3.1 - Inferência Sobre Diferença de Médias


No MINITAB 14, temos apenas 2 aplicações: quando as variâncias são desconhecidas e iguais e
quando as variâncias são desconhecidas e diferentes. Devemos considerar que as 2 populações de
interesse sejam normalmente distribuídas e independentes.

3.1.1 - Inferência Sobre Diferença de Médias com Variâncias Desconhecidas e


Iguais
Nesse caso, é necessário supor que as variâncias das duas populações sejam iguais σ12 = σ22
2
=σ .
De acordo com a estrutura apresentada anteriormente, podemos testar as seguintes hipóteses:

(1)H0: µ1 – µ2 = ∆0 (ou ≥) (2) H0:µ1 – µ2 = ∆0 (ou ≤) (3) H0: µ1 – µ2 = ∆0


H1: µ1 – µ2 < ∆0 H1: µ1 – µ2 = ∆0 H1: µ1 – µ2 ≠ ∆0
A estatística de testes a ser utilizada é:

onde

Adotando-se um nível de significância de 5%, teremos as seguintes regiões críticas:


- Para o Teste Unilateral Esquerdo, a região crítica será: Rc = {T < - t 0,05; n+m-2};
- Para o Teste Unilateral Direito, a região crítica será: Rc = {T > t 0,05; n+m-2};
- Para o Teste Bilateral, a região crítica sera: Rc = {│T│> t 0,025; n+m-2}.

Se o valor observado da Estatística de Teste pertencer à região crítica, deve-se rejeitar a


hipótese nula H0, caso contrário não rejeita-se a hipótese nula H0.
A tomada de decisão também pode ser feita utilizando-se o P-value:
- rejeita-se a hipótese nula se: P-value ≤ α
- não rejeita-se a hipótese nula se: P-value > α

Para o teste bilateral teremos o seguinte intervalo de confiança:

EXEMPLO 5

Proposta:
Testar a diferença entre as médias de duas poluações.

Problema:
Dois catalisadores estão sendo analisados para determinar como eles afetam o rendimento
médio de um processo químico. Especificamente, o catalisador 1 está correntemente um
uso, mas o catalisador 2 aceitável. Já que o catalisador 2 é mais barato, ele deve ser
adotado se não alterar o rendimento do processo. Um teste é feito em uma planta piloto. Há
alguma diferença entre os rendimentos médios? Considere as variâncias iguais.

Nesse caso, as hipóteses a serem testadas são:

H0: µ1 – µ2 = 0 → H0: µ1 = µ2
H1: µ1 – µ2 ≠ 0 → H1: µ1 ≠ µ2

A região crítica será: Rc = {│T│> t 0,025; 14} => Rc = {│T│> 2,145}.


Ferramentas:
2-Sample T

Fonte de dados:
TH2.mpj

2-SAMPLE T
1. Abra o arquivo TH-2
2. Selecione Static > Basic Statics > 2-Sample T
3. Preencha o quadro de acordo a figura seguinte:

4. Clique em OK

SAÍDA DO MINITAB

Two-Sample T-Test and CI: Catalisador 1; Catalisador 2

Two-sample T for Catalisador 1 vs Catalisador 2

N Mean StDev SE Mean


Catalisador 1 8 92,26 2,39 0,84
Catalisador 2 8 92,73 2,98 1,1

Difference = mu (Catalisador 1) - mu (Catalisador 2)


Estimate for difference: -0,477500
95% CI for difference: (-3,373886; 2,418886)
T-Test of difference = 0 (vs not =): T-Value = -0,35 P-Value = 0,729 DF = 14
Both use Pooled StDev = 2,7009

INTERPRETAÇÃO DOS RESULTADOS

Assim, vemos que a estatística de teste observada foi igual a -0,35. Esse valor encontrado
não pertence à região crítica, logo não rejeitamos a hipótese nula H0 e rejeitamos a hipótese
alternativa H1.
Também podemos utilizar o P-value para interpretar os resultados: nesse caso, obtivemos
um P-value igual a 0,729, que é maior que o nível de significância α adotado (0,05), logo não
rejeitamos a hipótese nula H0.

CONCLUSÃO
Há evidências estatísticas fortes para considerarmos que o catalisador 2 não altere o
rendimento médio do processo químico, assim seu rendimento pode ser considerado como
igual ao rendimento médio do catalisador 1. Logo, por ser mais barato, o catalisador 2 pode
substituir o catalisador 1 nessa indústria.

UTILIZANDO O INTERVALO DE CONFIANÇA


De acordo com a saída do MINITAB 14, temos o seguinte Intervalo de Confiança:

IC(µ1 – µ2; 0,95) = (-3,373886; 2,418886)

A interpretação é que temos 95% de chances de encontrarmos diferenças entre o


rendimento dos catalisadores no processo químico que se encontrem dentro do intervalo de
confiança acima calculado.

Como o Intervalo de Confiança acima contém o 0, podemos concluir os rendimentos do


processo químico utilizando ambos catalisadores seja aproximadamente iguais.

3.1.1 - Inferência Sobre Diferença de Médias com Variâncias Desconhecidas e


Diferentes
Nesse caso, é necessário supor que as variâncias das duas populações sejam iguais σ12 ≠ σ22.

De acordo com a estrutura apresentada anteriormente, podemos testar as seguintes hipóteses:

(1)H0: µ1 – µ2 = ∆0 (ou ≥) (2) H0:µ1 – µ2 = ∆0 (ou ≤) (3) H0: µ1 – µ2 = ∆0


H1: µ1 – µ2 < ∆0 H1: µ1 – µ2 = ∆0 H1: µ1 – µ2 ≠ ∆0

A estatística de testes a ser utilizada é:

onde

Adotando-se um nível de significância de 5%, teremos as seguintes regiões críticas:


- Para o Teste Unilateral Esquerdo, a região crítica será: Rc = {T < - t 0,05; ν};
- Para o Teste Unilateral Direito, a região crítica será: Rc = {T > t 0,05; ν };
- Para o Teste Bilateral, a região crítica sera: Rc = {│T│> t 0,025; ν }.

Se o valor observado da Estatística de Teste pertencer à região crítica, deve-se rejeitar a hipótese
nula H0, caso contrário não rejeita-se a hipótese nula H0.
A tomada de decisão também pode ser feita utilizando-se o P-value:
- rejeita-se a hipótese nula se: P-value ≤ α
- não rejeita-se a hipótese nula se: P-value > α

Para o teste bilateral teremos o seguinte intervalo de confiança:

EXEMPLO 6
Proposta:

Problema:
Considere o exemplo anterior, mas agora temos variâncias diferentes.

Nesse caso, as hipóteses a serem testadas são:


H0: µ1 – µ2 = 0 → H0: µ1 = µ2
H1: µ1 – µ2 ≠ 0 → H1: µ1 ≠ µ2
A região crítica será: Rc = {│T│> t 0,025; 13} => Rc = {│T│> 2,16}.

Ferramentas
2-Sample T

Fonte de dados:
TH-2.mpj

2 – SAMPLE T
1. Abra o arquivo TH-2;
2. Selecione Static > Basic Statics > 2-Sample T;
3. Preencha o quadro de acordo a figura seguinte:
4. Clique em OK

SAÍDA DO MINITAB

Two-Sample T-Test and CI: Catalisador 1; Catalisador 2

Two-sample T for Catalisador 1 vs Catalisador 2

N Mean StDev SE Mean


Catalisador 1 8 92,26 2,39 0,84
Catalisador 2 8 92,73 2,98 1,1

Difference = mu (Catalisador 1) - mu (Catalisador 2)


Estimate for difference: -0,477500
95% CI for difference: (-3,394928; 2,439928)
T-Test of difference = 0 (vs not =): T-Value = -0,35 P-Value = 0,729 DF = 13

INTERPRETAÇÃO DOS RESULTADOS

Assim, vemos que a estatística de teste observada foi igual a -0,35. Esse valor encontrado
não pertence à região crítica, logo não rejeitamos a hipótese nula H0 e rejeitamos a hipótese
alternativa H1.

Também podemos utilizar o P-value para interpretar os resultados: nesse caso, obtivemos
um P-value igual a 0,729, que é maior que o nível de significância α adotado (0,05), logo não
rejeitamos a hipótese nula H0.

Conclusão
Há evidências estatísticas fortes para considerarmos que o catalisador 2 não altere o
rendimento médio do processo químico, assim seu rendimento pode ser considerado como
igual ao rendimento médio do catalisador 1. Logo, por ser mais barato, o catalisador 2 pode
substituir o catalisador 1 nessa indústria.

UTILIZANDO O INTERVALO DE CONFIANÇA


De acordo com a saída do MINITAB 14, temos o seguinte Intervalo de Confiança:

IC(µ1 – µ2; 0,95) = (-3,394928; 2,439928)

A interpretação é que temos 95% de chances de encontrarmos diferenças entre o


rendimento dos catalisadores no processo químico que se encontrem dentro do intervalo de
confiança acima calculado.

Como o Intervalo de Confiança acima contém o 0, podemos concluir os rendimentos do


processo químico utilizando ambos catalisadores seja aproximadamente iguais.

3.2 - Teste t Emparelhado


É um caso especial de testes t para duas amostras onde X e Y são variáveis que representam a
primeira e a segunda medição de uma característica de interesse. Nesse caso, espera-se que exista
alguma correlação entre essas duas medições.

Para cada par de medições deve-se calcular a diferença entre as Y e X:


Di = Yi - Xi

Supõe-se que Di ~ N(µD, σD2), onde µD = µY – µX e σD2 é a variância de Di (desconhecida).

(1)H0: µD = ∆0 (ou ≥) (2) H0: µD = ∆0 (ou ≤) (3) H0: µD = ∆0


H1: µD < ∆0 H1: µD = ∆0 H1: µD ≠ ∆0

Que equivale a:
(1)H0: µY – µX = ∆0 (ou ≥) (2) H0: µY – µX = ∆0 (ou ≤) (3) H0: µY – µX = ∆0
H1: µY – µX < ∆0 H1: µY – µX = ∆0 H1: µY – µX ≠ ∆0

A estatística de teste utilizada é:

Adotando-se um nível de significância de 5%, teremos as seguintes regiões críticas:


- Para o Teste Unilateral Esquerdo, a região crítica será: Rc = {T < - t 0,05; n-1};
- Para o Teste Unilateral Direito, a região crítica será: Rc = {T > t 0,05; n-1};
- Para o Teste Bilateral, a região crítica sera: Rc = {│T│> t 0,025; n-1}.

Se o valor observado da Estatística de Teste pertencer à região crítica, deve-se rejeitar a hipótese
nula H0, caso contrário não rejeita-se a hipótese nula H0.

A tomada de decisão também pode ser feita utilizando-se o P-value:


- rejeita-se a hipótese nula se: P-value ≤ α
- não rejeita-se a hipótese nula se: P-value > α

Para o teste bilateral teremos o seguinte intervalo de confiança:


EXEMPLO 7
Proposta:
Testar a diferença entre as médias de duas populações, quando as populações forem
dependentes.

Problema:
Um artigo no Journal of Strain Analysis (1983, Vol.18, N°2) compara vários métodos para
predizer a resistência de cisalhamento para traves planas metálicas. Dados para dois desses
métodos, os procedimentos de Karlsruhe e Lehigh, quando aplicados a nove traves
específicas, são mostrados a seguir. Considere os dados como normalmente distribuídos.

Nesse caso, as hipóteses a serem testadas são:


H0: µK – µL = 0 → H0: µD = 0
H1: µK – µL ≠ 0 → H1: µD ≠ 0
A região crítica será: Rc = {│T│> t 0,025; 8} => Rc = {│T│> 2,306}.

Ferramentas
Paired t

Arquivo de dados:
TH-3.mpj

PAIRED T
1. Abra o arquivo TH-3;
2. Selecione Static > Basic Statics > Paired t;
3. Preencha o quadro de acordo a figura seguinte:

4. Clique em OK;
SAÍDA DO MINITAB

Paired T-Test and CI: Método de Karlsruhe; Método de Lehigh

Paired T for Método de Karlsruhe - Método de Lehigh

N Mean StDev SE Mean


Método de Karlsr 9 1,34011 0,14603 0,04868
Método de Lehigh 9 1,06622 0,04938 0,01646
Difference 9 0,273889 0,135099 0,045033

95% CI for mean difference: (0,170042; 0,377736)


T-Test of mean difference = 0 (vs not = 0): T-Value = 6,08 P-Value = 0,000

INTERPRETAÇÃO DOS RESULTADOS


Assim, vemos que a estatística de teste observada foi igual a 6,08. Esse valor encontrado
pertence à região crítica, logo rejeitamos a hipótese nula H0 e não rejeitamos a hipótese
alternativa H1.

Também podemos utilizar o P-value para interpretar os resultados: nesse caso, obtivemos
um P-value aproximadamente igual a 0, que é menor que o nível de significância α adotado
(0,05), logo rejeitamos a hipótese nula H0.

CONCLUSÃO
Não há evidências estatísticas para considerarmos que dois os métodos de previsão da
resistência não forneçam resultados iguais. Os dados indicam que o método de Karlsruhe
produz, em média, previsões maiores para a resistência do que o método de Lehigh.

UTILIZANDO O INTERVALO DE CONFIANÇA


De acordo com a saída do MINITAB 14, temos o seguinte Intervalo de Confiança:

IC(µD; 0,95) = (0,170042; 0,377736)

A interpretação é que temos 95% de chances de encontrarmos diferenças nas previsões da


resistência dos que se encontrem dentro do intervalo de confiança acima calculado.

Como o Intervalo de Confiança acima não contém o 0, podemos concluir que as previsões de
resistência utilizando os 2 métodos são diferentes. Como o intervalo é positivo, concluímos
que o método de Karlsruhe produz, em média, previsões maiores para a resistência do que o
método de Lehigh.

3.3 - Inferência sobre as Variâncias de Duas Populações Normais


Devemos supor que as duas populações de origem sejam normais e independentes distribuídas, com
médias µ1 e µ2, com variâncias σ12 e σ22.

De acordo com a estrutura apresentada anteriormente, podemos testar as seguintes hipóteses:

H0: σ12 = σ22 → H0: σ12/ σ22 = 1


H1: σ12 ≠ σ22 → H1: σ12/ σ22 ≠ 1
A estatística de testes a ser utilizada é:

Adotando-se um nível de significância de 5%, teremos a seguinte região crítica:


- Rc = { F > f 0,025; n – 1; m -1 ou F < f 0,975; n – 1; m -1}.

Figura 3 – Gráficos da estatística de teste, com suas respectivas regiões críticas

Se o valor observado da Estatística de Teste pertencer à região crítica, deve-se rejeitar a hipótese
nula H0, caso contrário não rejeita-se a hipótese nula H0.

A tomada de decisão também pode ser feita utilizando-se o P-value:


- rejeita-se a hipótese nula se: P-value ≤ α
- não rejeita-se a hipótese nula se: P-value > α

Para o teste bilateral teremos o seguinte intervalo de confiança:

Onde

EXEMPLO 8
Proposta:

Problema:
Considere os exemplos 6 e 7, agora iremos testar se as variâncias dos rendimentos ao se
utilizar os catalisadores 1 e 2 são iguais. Adote um nível de 5% de significância.

Nesse caso, as hipóteses a serem testadas são:


H0: σ12 = σ22 → H0: σ12/ σ22 = 1
H1: σ12 ≠ σ22 → H1: σ12/ σ22 ≠ 1

A região crítica será: Rc = { F < f 0,975; 7; 7 ou F > f 0,025; 7; 7 }.


Rc = { F < 0,200204 ou F> 4,994909 }
Ferramentas
2 Variances

Fontes de dados:
TH-2.mpj

2 VARIANCES

1. Abra o arquivo TH-2


2. Selecione Static > Basic Statics > 2 Variances
3. Preencha o quadro de acordo a figura seguinte:

4. Clique em Options
5.Preencha o quadro de acordo com a figura seguinte

6. Clique em OK
SAÍDA DO MINITAB

Test for Equal Variances: Catalisador 1; Catalisador 2

95% Bonferroni confidence intervals for standard deviations

N Lower StDev Upper


Catalisador 1 8 1,49210 2,38502 5,46285
Catalisador 2 8 1,86648 2,98345 6,83355

F-Test (normal distribution)


Test statistic = 0,64; p-value = 0,569

Levene's Test (any continuous distribution)


Test statistic = 0,31; p-value = 0,589

INTERPRETAÇÃO DOS RESULTADOS

Assim, vemos que a estatística de teste observada foi igual a 0,64. Esse valor encontrado não
pertence à região crítica, logo não rejeitamos a hipótese nula H0 e rejeitamos a hipótese alternativa
H1.

Também podemos utilizar o P-value para interpretar os resultados: nesse caso, obtivemos um P-
value igual a 0,569, que é maior que o nível de significância α adotado (0,05), logo não rejeitamos a
hipótese nula H0.

CONCLUSÃO
Há evidências estatísticas para considerarmos as variâncias dos rendimentos do processo utilizando
os catalisadores 1 e 2 sejam iguais.

UTILIZANDO O INTERVALO DE CONFIANÇA


Analisando o gráfico dos intervalos de confiança para os catalisadores 1 e 2, podemos ver que o
ponto central do intervalo de confiança do catalisador 1 está dentro dos limites do intervalo de
confiança do catalisador 2 e vice-versa, logo, podemos considerar que as variâncias dos
catalisadores 1 e 2 sejam iguais.

3.3 Inferência sobre Proporções de Duas Populações


Freqüentemente, é necessário comparar proporções de duas populações distintas, onde há 2
parâmetros binomiais de interesse: p1 e p2. Para amostras grandes, podemos fazer a aproximação da
binomial pela normal.

As hipóteses a serem testadas são:


(1)H0: p1 - p2 = 0 (ou ≥) (2)H0: p1 - p2 = 0 (ou ≤) (3) H0: p1 - p2 = 0
H1: p1 - p2 < 0 H1: p1 - p2 > 0 H1: p1 - p2 ≠ 0

Nesse caso, a estatística de testes a ser utilizada é:

Onde

Adotando-se um nível de significância de 5%, teremos as seguintes regiões críticas:


- Para o Teste Unilateral Esquerdo, a região crítica será: Rc = {Z < - 1,645};
- Para o Teste Unilateral Direito, a região crítica será: Rc = {Z > 1,645 };
- Para o Teste Bilateral, a região crítica sera: Rc = {│Z│> 1,96}.

Se o valor observado da Estatística de Teste pertencer à região crítica, deve-se rejeitar a hipótese
nula H0, caso contrário não rejeita-se a hipótese nula H0.
A tomada de decisão também pode ser feita utilizando-se o P-value:
- rejeita-se a hipótese nula se: P-value ≤ α
- não rejeita-se a hipótese nula se: P-value > α

O Intervalo de confiança no caso bilateral será:

EXEMPLO 9
Proposta:

Problema:
Dois tipos diferentes de solução de polimento estão sendo avaliados para possível uso em
uma operação de polimento na fabricação de lentes intra-oculares usadas no olho humano
depois de uma operação de catarata. Trezentas lentes foram polidas usando a primeira
solução de polimento e desse número, 235 não tiveram defeitos induzidos pelo polimento.
Outras 300 lentes foram polidas, usando a segunda solução depolimento, sendo 196 lentes
consideradas satisfatória. Há qualquer razão para acreditar que a primeira solução de
polimento seja melhor que a segunda? Adote α=0,05.

Tem-se interesse em testar as seguintes hipóteses:


Temos a seguinte Hipótese:
H0: p1 - p2 = 0 → H0: p1 = p2
H1: p1 - p2 > 0 → H1: p1 > p2

A região crítica será: Rc = {│ Z│ < 1,645}

Ferramentas
2-Proportion

Fonte de dados:

2 – PROPORCION
1. Abra o MINITAB 14;
2. Selecione Static > Basic Statics > 2-Proportion
3. Preencha o quadro de acordo a figura seguinte:

4. Clique em Options;
5. Preencha o quadro de acordo a figura seguinte:
6. Clique em OK

SAÍDA DO MINITAB

Test and CI for Two Proportions

Sample X N Sample p
1 253 300 0,843333
2 196 300 0,653333

Difference = p (1) - p (2)


Estimate for difference: 0,19
95% lower bound for difference: 0,133131
Test for difference = 0 (vs > 0): Z = 5,36 P-Value = 0,000

INTERPRETAÇÃO DOS RESULTADOS

Assim, vemos que a estatística de teste observada foi igual a 5,36. Esse valor encontrado
pertence à região crítica, logo rejeitamos a hipótese nula H0 e não rejeitamos a hipótese
alternativa H1.

Obtivemos um P-value igual a 0,000, que é menor que o nível de significância α adotado
(0,05), logo rejeitamos a hipótese nula H0 e não rejeitamos a hipótese alternativa H1.

CONCLUSÃO
Há evidências estatísticas fortes para considerarmos que a primeira solução tenha um
desempenho superior ao da segunda lente. A proporção de lentes sem defeitos que foram
polidas com a primeira solução é maior que a proporção de lentes sem defeitos polidas com
a segunda solução.

UTILIZANDO O INTERVALO DE CONFIANÇA


De acordo com a saída do MINITAB 14, temos o seguinte Intervalo de Confiança:

IC(p1 – p2; 0,95) = ( ≥ 0,133131)


A interpretação é que temos 95% de chances de encontrarmos diferenças entre a proporção
de lentes sem defeitos utilizando a primeira solução e a utilizando a segunda solução sejam
no mínimo iguais a 0,133131.