Você está na página 1de 29

Inferência sobre variâncias

para 1 e 2 populações
Normais

Prof. Aloisio Joaquim Freitas Ribeiro


Departamento de Estatística – ICEx – UFMG
aloisio@est.ufmg.br
Disciplina: EST034
Nesta aula abordaremos a construção de testes de hipóteses
e intervalos de confiança para uma variância populacional, e
também para comparação de 2 variâncias, para populações
Normais.

Antes disto apresentaremos 2 distribuições de probabilidade,


que serão utilizadas para este fim:

Distribuição Qui Quadrado e Distribuição F


Distribuição Qui-Quadrado

Uma variável aleatória contínua, Y, tem distribuição


Qui - Quadrado com v graus de liberdade se sua
função densidade de probabilidade é dada por

 1 v/2 y /2
 y e , se y  0
f(y, v)   (v / 2)2 v/2

0 se caso contrário


onde (a )   e  y y a 1dx , se a  0
0

E(Y)  v VAR(Y)  2v
Funções densidade de probabilidade Qui-Quadrado com
Graus de liberdade iguais a 1, 3, 10 e 30.

0.00 0.05 0.10 0.15 0.20 0.25


1.5
dchisq(x, 1)

dchisq(x, 3)
1.0
0.5
0.0

0 1 2 3 4 5 0 5 10 15

x x
0.08

0.04
dchisq(x, 10)

dchisq(x, 30)
0.04

0.02
0.00

0.00

0 5 10 15 20 25 30 35 0 10 20 30 40 50 60 70

x x

Para desenhar a função densidade no R : curve(dchisq(x, df = 1) , from = 0, to = 5)


Considere uma variável Y com
distribuição Qui-Quadrado
com 5 graus de liberdade

a) Qual a probabilidade de Y
ser menor ou igual a 4?

> pchisq(x = 4, df = 5)
[1] 0.450584
b) Qual o percentil de ordem 0,10 desta distribuição?

> qchisq(p = 0.1, df = 5)

[1] 1.610308

df = degreess of freedom (graus de liberdade


Resultado Importante:

Se Y1 , Y2 ,..., Yn é uma amostra aleatória de uma N(  , 2 ), então a variável


S2
aleatória (n - 1) tem distribuição Qui - Quadrado com n - 1 graus de
 2

n
 (Yi  Y )
2

liberdade, onde S2  i 1 é o estimador de  2 .


n 1

Exemplo: Qual a probabilidade de observar uma variância amostral maior do que


45 numa amostra de tamanho 10 de uma população Normal com μ = 30 e σ = 6?

 (n  1) S 2 (n  1)45 
2

P( S  45)  P  
  P
 2 9 x 45 
     P  9  11,25  0,3569
2

   9
 36 
2 2

No R: pchisq(11.25, df = 9, lower.tail = T)
Distribuição F de Snedecor

Sejam U e V duas variáveis aleatórias independentes, cada


qual com distribuição Qui-Quadrado, com v1 e v2 graus de
liberdade respectivamente. Então a variável aleatória

𝑈ൗ
𝑣1
𝑊= 𝑉ൗ
𝑣2

tem distribuição F com parâmetros v1 e v2 , os graus de


liberdade do numerador e do denominador.
A função densidade de probabilidade de W é dada por:

 /2
( 1   2 ) / 2    1    2  / 2
1

w 1

f ( w; 1 , 2 )    ,
 1 / 2  2 / 2   2   1 
( 1  2 ) / 2

1  w 
 2 

w  0,  1 e  2 são valores inteiros positivos

Esperança e variância da Distribuição F

2 2 2 ( 1   2  2)
2
E (W )  VAR (W ) 
2  2  1  2  2 2  2  4 
df(x, 9, 29) df(x, 9, 9)

0.0 0.2 0.4 0.6 0.8 0.0 0.2 0.4 0.6

0
0
1

1
2
3

x
x

2
4
F(9,9)

F(9,29)
5

3
6

4
7

df(x, 29, 9) df(x, 29, 29)

0.0 0.2 0.4 0.6 0.8 0.0 0.2 0.4 0.6 0.8 1.0

0
0

1
1

x
x

2
2

F(29,9)
F(29,29)
Ilustração sobre forma da distribuição

3
3

4
4
Usando o R, para W~F(9,9):

a) Encontre P(W ≤1.5)

pf(x = 1.5, df1 = 9, df2 = 9)

[1] 0.7222773

b) Encontre o percentil de ordem 0,6

qf(p = 0.6, df1 = 9, df2 = 9)

[1] 1.18976
Propriedades úteis da distribuição F quando fazemos uso de tabelas

𝑃(𝐹(5,7) < 2) = P(F(7,5) > 0.5

> pf(2, df1 = 5, df2 = 7)


[1] 0.8043268

> pf(0.5, df1 = 7, df2 = 5, lower.tail=F)


[1] 0.8043268
𝐹𝛼 𝑣1 , 𝑣2 é o percentil de ordem 1 – α da distribuição F com (v1,v2), g.l.

1
Exemplo: 𝐹0,9 5,7 =
𝐹0.1 7,5

> qf(p = 0.10, v1 = 5, v2 = 7)

[1] 0.296921

> 1/qf(p = 0.9, v1= 7, v2 = 5)

[1] 0.296921
Resultado Importante

Se Y11 , Y12 ,..., Y1n é uma a.a. de uma N( 1 , 12 ),


1

S12
então (n1 - 1) tem distribuição Qui - Quadrado com n1 - 1 graus de liberdade
 2
1

Se Y22 , Y22 ,..., Y2 n é uma a.a. de uma N(  2 , 22 ),


2

S22
então (n 2 - 1) tem distribuição Qui - Quadrado com n 2 - 1 graus de liberdade
 2
2

S12 /  12
Se as amostras são independentes, então F  2 2 ~ F(n1-1, n 2 - 1)
S2 /  2

 S22 /  22 
 ou F  2 2 ~ F(n 2 -1, n1 - 1) 
 S1 /  1 
X ~ N(20, 100) e Y ~ N(30, 400)
X e Y Independentes.

Uma amostra aleatória de tamanho 10 é selecionada de X e outra de tamanho 15


de Y. Qual a probabilidade da variância amostral de X ser maior que a variância
amostral de Y?

     y 
2
P S x  S y   P 2  1  P 2 2  2   P F (9,14) 
 400 
2 2 2
 S   S /

2 2 x x x

 Sy   Sy / y  x   100 

P ( F (9,14)  4)  0.0103

 pf(4,9,14, lower = F )

[1] 0.01031871

Existem tabelas para as distribuições qui-quadrado e F. Mas elas são limitadas


Tabela Qui-quadrado
• fornece os quantis de ordem 1 - α da distribuição para diferentes g.l.
• não permite o cálculo exato de probabilidades.

1) χ 0,05;6
2
 percentil 0,95 da distribuição Qui - quadrado com 6 g.l.
χ 0,05;6
2
 12,59

2) χ 0,10;6
2
 percentil 0,90 da distribuição Qui - quadrado com 10 g.l.
χ 0,05;6
2
 15,99
Tabela F
• Não é possível calcular probabilidades usando a tabela
• Ela fornece os percentis de ordem 1 - α (na tabela abaixo α = 0,05).

F0.05;5, 7  3,9715
1 1
F0.95;5, 7  
F0.05;7 ,5 4,8759
Inferência para uma variância

Pressupost o : Y1 , Y2 ,..., Yn é uma amostra aleatória de uma população N(  , 2 )

Intervalo de 100(1 - α)% de confiança para σ2

(n  1) S 2 (n  1) S 2
 
2

 / 2
2
12 / 2

2 / 2 é o percentil de ordem 1 -  / 2 da distribuição Qui - quadrado com n - 1 g.l.


12 / 2 é o percentil de ordem  / 2 da distribuição Qui - quadrado com n - 1 g.l.

Intervalo de 100(1 - α)% de confiança para o desvio padrão σ

(n  1) S 2 (n  1) S 2
 
 / 2
2
12 / 2
Como este intervalo foi obtido?

( n  1) S 2
Sabendo que ~  n21 , podemos escrever
2

 2 ( n  1) S 2 2 
P 1 / 2    / 2   1  
  2


 ( n  1) S 2 ( n  1) S 2

P  
2
  1  
  / 2 1 / 2 
2 2


100(1 )%  ( n  1) S 2
( n  1) S 2

IC :  ; 
 
2
2 2
  /2 1 / 2 
Testes de Hipóteses

H 0 :  2   02

(n  1) S 2
Estatística de teste :  02 
 02

Distribuição de Χ 02 quando H 0 é verdadeira : Qui  Quadrado com n - 1 g.l.

Hipótese alternativa Região Crítica :


H a :  2   02  02  12- / 2,n -1 ou  02  2 / 2,n -1
H a :  2   02  02  2 ,n -1
H a :  2   02  02  12- ,n -1
Exemplo: As especificações para a produção de certo tipo de moeda estabelecem
que seu peso deve ser em média igual a 2,5 gramas e apresentar desvio padrão de
no máximo igual a 0,023 gramas. Uma amostra de 37 moedas foi observada,
encontrando-se um desvio padrão amostral de 0,03048 gramas.
a) Avalie através de um testes de hipóteses, ao nível de significância de 5%, se há
evidências de que a variância do peso das moedas fabricadas é maior do que o
especificado.

H 0 :  2  0,023 x H a :  2  0,023

Região Crítica : X 02   36;0.05


2
 50,99

0,03048 2
Estatística de teste : X 02  (37  1)  66,22
0,0232

Valor P  P(  36
2
 66,22)  0.00158

Ao nível de significância de 5% há evidências de a variância do peso das moedas


é maior do que o especificado. (p-valor = 0.00158)
b) Obtenha um intervalo de confiança unilateral de 95% para σ.

 (n  1) S 2   (36)(0,030482 ) 
 2 ;    ;    0,000656 ; 
    50,99 
Comparação de 2 variâncias

Pressupostos
Y11 , Y12 ,..., Y1n é uma amostra aleatória de uma população N( 1 , 12 )
1

Y21 , Y22 ,..., Y2 n é uma amostra aleatória de uma população N(  2 , 22 )


2

As amostras são independentes


S12 /  12
F  2 2 ~ F(n1-1, n 2 - 1)
S2 /  2

Usar este resultado para obter construir testes de hipóteses e intervalos


de confiança para comparação de 2 variâncias populacionais.
Intervalo de 100(1 - α)% de confiança para  
2
1
2
2

P F1 / 2,n 1,n 1  F  F / 2,n 1,n 1   1  


1 2 1 2


 S12 /  12 
P F1 / 2,n 1,n 1  2 2  F / 2,n 1,n 1   1  

1
S2 /  2
2


1 2


 S12 1  2
S 2
1 
P 2  2  2
1 1   1
S F 2 S 2 F1 / 2,n 1,n 1 
 2  / 2,n 1,n 11 2 1 2


 S
100 (1 )  1
2
1 S 2
1 
IC /  : 2 1
; 2 
S F 
2 2
1 2

 2  / 2 , n 1, n 11
S 2
2
F1 / 2 , n 1, n 1  1 2
Testes de hipóteses

  12 
H 0 :     2  1
2 2


2
1
2

S12
Estatística de teste : F0  2
S2

Distribuição de F0 quando H 0 é verdadeira :


F com (n1 - 1, n 2 - 1) graus de liberdade

Hipótese alternativa Região Crítica para nível de significância 


H a :  12   22 F0  F1- / 2;n -1,n -1 ou F0  F / 2;n -1,n -1
1 2 1 2

H a :  12   22 F0  F ;n -1,n -1
1 2

H a :  12   22 F0  F1 ;n -1,n -1
1 2
Hipótese alternativa P  valor

H a :  12   22 2 x P( F0  f 0 ), se f 0  1
2 x P( F0  f 0 ), se f 0  1

H a :  12   22 P( F0  f 0 )

H a :  12   22 P( F0  f 0 )

f 0 é o valor observado da estatística de teste


Retomando o exemplo utilizado na última aula sobre consumo calórico de
adolescentes bulímicas e saudáveis
Bulímicas: n1 = 24 e 𝑠12 = 23,02
Saudáveis: n2 = 14 e 𝑠12 = 45,30

Desejamos testar as hipóteses:

H 0 :  12   22 x H a :  12   22

Região Critica (α = 0,05):

𝐹0 ≤ 𝐹0,975;23,13 = 0,395 𝑜𝑢 𝐹0 ≥ 𝐹0,025;23,13 = 2,905

23,02
Estatística de teste: 𝑓0 = ൗ45,30 = 0,5082

P-valor: 2P(𝐹0 ≤ 0,5082) = 0,151 (maior do que α = 0,05)


No R

Exemplo: consumo calórico

> y1 = c(15.9,18.9,25.1,16.0,19.6,25.2,16.5,21.5,25.6,17.0,21.6,28,
17.6,22.9,28.7,18.1,23.6,29.2,18.4,24.1,30.9,18.9,24.5,30.6)

> y2 =
c(20.7,30.6,22.4,33.2,23.1,33.7,23.8,36.6,24.5,37.1,25.3,37.4,
25.7,40.8)

> var.test(y1,y2)

F test to compare two variances

data: y1 and y2
F = 0.50829, num df = 23, denom df = 13, p-value = 0.151
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.1749605 1.2863753
sample estimates: Observe que não há evidências de
ratio of variances que as variâncias sejam diferentes
0.5082872 ao nível de significância de 5%.
 O teste F para comparar 2 variâncias é muito sensível aos afastamentos do
pressuposto de normalidade, e não deve ser usado quando este
pressuposto não é validado pelos dados..

 Outros testes, mais robustos ao afastamento deste pressuposto, existem


na literatura e estão disponíveis no R.

 Para saber mais sobre estes testes e como realizá-los no R, veja:


http://www.cookbook-r.com/Statistical_analysis/Homogeneity_of_variance/

https://en.wikipedia.org/wiki/Levene%27s_test (teste de Leneve)

https://en.wikipedia.org/wiki/Bartlett%27s_test (teste de Bartlett)

Você também pode gostar