Você está na página 1de 12

Ana Pires, IST, Outubro de 2000

Probabilidades e Estatstica

Ana Pires, IST, Outubro de 2000

Probabilidades e Estatstica

Captulo 8 - Testes de hipteses 8.1 Introduo Nos captulos anteriores vimos como estimar um parmetro desconhecido a partir de uma amostra (obtendo estimativas pontuais e intervalos de confiana para o parmetro). Muitas situaes prticas tm uma natureza diferente, requerendo que em funo dos valores observados se tomem decises acerca dos parmetros (ou de outros aspectos) da populao. Exemplo: Mquina de encher pacotes de acar. O peso de cada pacote deve ser 8g (isto ,

Definio: Uma hiptese estatstica uma afirmao acerca dos parmetros de uma ou mais populaes (testes paramtricos) ou acerca da distribuio da populao (testes de ajustamento). Vamos estudar em primeiro lugar os testes paramtricos. Exemplo (cont.): temos duas hipteses: a mquina funciona correctamente ( = 8) ou a mquina no funciona correctamente ( 8): H0 : = 8 (hiptese nula) versus H1: 8 (hiptese alternativa)

= 8). Ser que a mquina est a funcionar


correctamente?

Ana Pires, IST, Outubro de 2000

Probabilidades e Estatstica

Ana Pires, IST, Outubro de 2000

Probabilidades e Estatstica

Hiptese simples: especificado apenas um valor para o parmetro. Hiptese composta: especificado mais de um valor para o parmetro. Vamos considerar sempre H0 como hiptese simples. A hiptese alternativa ( H1 ) , em geral, uma das trs seguintes: H1: 8 hiptese alternativa bilateral H1: > 8 H1: < 8 hiptese alternativa unilateral (superior) hiptese alternativa unilateral (inferior)

Definio: Teste de hipteses um procedimento que conduz a uma deciso acerca das hipteses (com base numa amostra). Exemplo (cont.): X - v.a. que representa o peso de um pacote de acar, E( X ) = , V ( X ) = 2 . H0 : = 8 versus H1: 8

Dispomos de uma amostra de 10 observaes:

( X1 ,

, X10 )

(a.a.)

Faz sentido decidir com base em X , aceitando H0 se X estiver prxima de 8 e rejeitando H0 se X estiver longe de 8.

Nota: os valores especificados nas hipteses no devem ter nada a ver com valores observados na amostra. 3 4

Ana Pires, IST, Outubro de 2000

Probabilidades e Estatstica

Ana Pires, IST, Outubro de 2000

Probabilidades e Estatstica

regio crtica "Aceitar" H1 Rejeitar H0

regio de aceitao "Aceitar" H0 No rejeitar H0

= P(erro do tipo I) =
regio crtica "Aceitar" H1 Rejeitar H0

= P( Rejeitar H0 H0 verdadeira )

A chama-se nvel de significncia.

= P(erro do tipo II) =

= P("Aceitar" H0 H0 falsa )

8c

8+c

Voltando ao exemplo, vamos admitir que fazamos


c = 0.5 e que = 1 e n = 10 .

Regio crtica: X < 8 c ou X > 8 + c Aos pontos de fronteira chamam-se valores crticos. Tipos de erro: Deciso: "Aceitar" H0 Rejeitar H0 Situao: H0 verdadeira H0 falsa no h erro erro do tipo I erro do tipo II no h erro 5

A regio crtica : X < 7.5 ou X > 8.5. 1 Supondo que X ~ N ( ,1) ento X ~ N , 10

= P( X < 7.5 ou X > 8.5 = 8) =


7.5 8 8.5 8 = + 1 = 0.1142 0.1 0.1

Ana Pires, IST, Outubro de 2000

Probabilidades e Estatstica

Ana Pires, IST, Outubro de 2000

Probabilidades e Estatstica

Se aumentarmos n, mantendo os valores crticos, diminui. Quanto a , no vamos ter um nico valor mas uma funo, ou seja, para cada de H1 podemos calcular um valor ( ) . Por exemplo, para = 9:

Se mudarmos a regio crtica, com n fixo: Se c diminuir, aumenta e, para cada , ( ) diminui. Se c aumentar, diminui e, para cada , ( ) aumenta. mais fcil controlar do que controlar (que depende de em H1 ). Logo:

(9) = P(aceitar H0 = 9) =

= P( 7.5 X 8.5 = 9) = 8.5 9 7.5 9 = = 0.0571 0.1 0.1

(10) = P(aceitar H0 = 10) =

rejeitar H0 uma concluso "forte". "aceitar" H0 uma concluso "fraca". Em vez de dizer "aceita-se H0 " prefervel dizer "no se rejeita H0 ", ou "no h evidncia suficiente para rejeitar H0 ".

= P( 7.5 X 8.5 = 10) = 8.5 10 7.5 10 = 0 0.1 0.1

Por simetria ( 7) = (9) e (6) = (10)

Ana Pires, IST, Outubro de 2000

Probabilidades e Estatstica

Ana Pires, IST, Outubro de 2000

Probabilidades e Estatstica

D e f i n i o : Chama-se potncia do teste probabilidade de rejeitar a hiptese nula quando a hiptese alternativa verdadeira ( = 1 ). No exemplo, a potncia do teste quando = 9 1 0.0571 = 0.9429 , ou seja, se a verdadeira mdia for 9, a diferena em relao a 8 ser detectada 94.29% das vezes. Como decidir entre alternativa unilateral ou bilateral? I)
H0 : = 8 versus H1: > 8

II)

H0 : = 8 versus H1: < 8 Regio crtica: X < 8 c Ponto de vista do consumidor! Quando rejeitar H0 no aceita a encomenda

III)

H0 : = 8 versus H1: 8

Regio crtica: X < 8 c ou X > 8 + c Compromisso entre os dois!

Regio crtica: X > 8 + c Ponto de vista do fabricante! Quando rejeitar H0 pra a produo para afinar a mquina. 9 10

Ana Pires, IST, Outubro de 2000

Probabilidades e Estatstica

Ana Pires, IST, Outubro de 2000

Probabilidades e Estatstica

Procedimento Geral dos Testes de hipteses 1. Pelo contexto do problema identificar o parmetro de interesse 2. Especificar a hiptese nula 3. Especificar uma hiptese alternativa apropriada 4. Escolher o nvel de significncia, 5. Escolher uma estatstica de teste adequada 6. Fixar a regio crtica do teste 7. Recolher uma amostra e calcular o valor observado da estatstica de teste 8. Decidir sobre a rejeio ou no de H0

8.2 Testes de hipteses para a mdia, varincia conhecida X populao tal que:
E( X ) =

(desconhecido) (conhecido)

V(X) = 2

( X1 ,

, Xn ) a. a. de dimenso n

X ~ N ( , 2 ) ou X qq com n grande. Teste de H0 : = 0 versus H1: 0

Sabemos j que, quando H0 verdadeira 2 2 X ~ N 0 , ou X ~ N 0 , a n n

11

12

Ana Pires, IST, Outubro de 2000

Probabilidades e Estatstica

Ana Pires, IST, Outubro de 2000

Probabilidades e Estatstica

conveniente estandardizar e usar como estatstica de teste: Z0 = X 0 n Z0 ~ N (0,1)

Seja z0 =

x 0 o valor observado da estatstica de n

teste. Ento rejeita-se H0 se z0 < a ou z0 > a e no se rejeita H0 se a z0 a Estas regras podem ser expressas em termos de x

Quando H0 verdadeira

A regio crtica deve ser bilateral porque H1 bilateral:

Z0|H0 /2 -a 1 0 a /2

rejeita-se H0 se x < 0 a

ou x > 0 + a n n

e no se rejeita H0 se 0 a

x 0 + a n n

R.C.: Z0 < a ou Z0 > a com a: P( Z > a) = 2


(recordar que = P( Rejeitar H0 H0 verdadeira ) )

Exemplo (cont.): X - v.a. que representa o peso de um pacote de acar (supe-se que X ~ N ( ,1) ). A mquina est afinada quando

= 8. Numa amostra de 25 pacotes (recolhida


aleatoriamente) observou-se x = 8.5 . 14

13

Ana Pires, IST, Outubro de 2000

Probabilidades e Estatstica

Ana Pires, IST, Outubro de 2000

Probabilidades e Estatstica

Quer-se saber se, ao nvel de significncia de 5%, se pode afirmar que a mquina continua afinada. H0 : = 8 versus H1: 8 Nvel de significncia = 5% Estatstica de teste: Z0 = X 8 1 25 (1. 2. e 3.) (4.) (5.)

Alternativas unilaterais 1) Se fosse H0 : = 0 versus H1: > 0 X 0 estatstica de teste: Z0 = n R.C.: Z0 > a onde a : P( Z > a ) =
Z0 |H0 1 0 a'

= 0.05 a = 1.96 donde


R.C.: Z0 < 1.96 ou Z0 > 1.96 Com x = 8.5 obtm-se z0 =
8.5 8 = 2.5 1 25

(6.) (7.)

2) Se fosse H0 : = 0 versus H1: < 0 estatstica de teste: a mesma R.C.: Z0 < a onde
a : P( Z > a ) =
Z0 |H0 1 -a' 0

Como z0 > 1.96 rejeita-se H0 , ou seja, existe evidncia (ao nvel de significncia considerado) de que a mquina est desafinada.

15

16

Ana Pires, IST, Outubro de 2000

Probabilidades e Estatstica

Ana Pires, IST, Outubro de 2000

Probabilidades e Estatstica

Outro mtodo: valor-p Em vez de fixar , determinar a regio crtica e, em seguida, verificar se o valor observado pertence regio crtica, pode olhar-se directamente para o valor observado da estatstica de teste e determinar para que nvel de significncia a deciso muda. Definio: Dado o valor observado da estatstica de teste, o valor-p (p-value ) o maior nvel de significncia que levaria no rejeio da hiptese nula (ou o menor que levaria rejeio). No exemplo, z0 = 2.5, para este valor H0 no rejeitada se 2[1 (2.5)] = 0.0124 , ou seja, p = 0.0124 .

Quanto mais baixo for o valor-p maior a evidncia contra a hiptese nula. Relao entre intervalos de confiana e testes de hipteses: Parmetro desconhecido . I.C. a 100 (1 )% para = [l, u] , baseado numa dada amostra e v. a. fulcral, ento a mesma amostra leva rejeio de H0 : = 0 contra H1: 0 ,

ao nvel de significncia , se e s se 0 [l, u] ou no rejeio de H0 se e s se 0 [l, u] Nota: necessrio que a v.a fulcral e a estatstica de teste sejam da mesma forma.

0.0062 -2.5 0 2.5

0.0062

17

18

Ana Pires, IST, Outubro de 2000

Probabilidades e Estatstica

Ana Pires, IST, Outubro de 2000

Probabilidades e Estatstica

Vamos ver que isto verdade para o teste que estamos a estudar (teste para a mdia com varincia conhecida): H0 : = 0 versus H1: 0 No se rejeita H0 , ao nvel de significncia , se e s se

Nota: o teste que acabmos de estudar aplicvel com 2 desconhecida (substituda por S 2 ) desde que a dimenso da amostra seja grande ( n > 30). 8.3 Testes de hipteses sobre a igualdade de duas mdias, varincias conhecidas
X1 , populao 1, com E( X1 ) = 1 e V ( X1 ) = 12 (conhecida)
2 X2 , populao 2, com E( X2 ) = 2 e V ( X2 ) = 2 (conhecida)

0 a x 0 + a n n xa 0 x + a n n 0 I . C.100 (1 )% ( )

( X1 e X2 independentes) a. a. da populao 1 X11 , , X1n1 com mdia X1

No exemplo, n = 25 , x = 8.5 , = 1 , I.C. a 95% ( = 0.05) a = 1.96 I . C.95% ( ) = [8.108;8.892] , como 0 = 8 no pertence ao I.C., rejeita-se H0 : = 8 (contra H1: 8) ao nvel = 5%. 19

( (

a. a. da populao 2 X21 , , X2 n2 com mdia X2

(e a a.a.

(X

21

(X , ,X ) )
11

, X1n1

independente da a.a.

2 n2

20

Ana Pires, IST, Outubro de 2000

Probabilidades e Estatstica

Ana Pires, IST, Outubro de 2000

Probabilidades e Estatstica

Queremos testar H0 : 1 = 2 contra uma das alternativas H1: 1 2 (bilateral) ou


H1: 1 > 2 (unilateral superior) ou

Daqui em diante tudo semelhante ao caso anterior, ou seja, dadas as amostras concretas calcula-se z0 = x1 x2
2 12 2 + n1 n2

H1: 1 < 2 (unilateral inferior) j sabemos que


2 12 2 X1 X2 ~ N 1 2 , + n1 n2

Com H1: 1 2 , rejeita-se H0 para o nvel de significncia se z0 < a ou z0 > a com a: P( Z > a) = etc. N o t a : este teste vlido para varincias 2 ) desde desconhecidas (substitudas por S12 e S2 que n1 > 30 e n2 > 30.

Ento, quando H0 verdadeira ( 1 2 = 0 )


Z0 = X1 X2
2 12 2 + n1 n2

~ N (0,1)

21

22

Ana Pires, IST, Outubro de 2000

Probabilidades e Estatstica

Ana Pires, IST, Outubro de 2000

Probabilidades e Estatstica

8.4 Testes de hipteses para a mdia de uma populao normal, varincia desconhecida Se n < 30 s possvel efectuar testes para a mdia se for possvel assumir que X ~ N ( , 2 ) . Nesse caso para testar H0 : = 0 contra uma das alternativas
H1: 0 (bilateral) ou

Ento para H1: 0 , rejeita-se H0 ao nvel de significncia se t0 = x 0 < a s n ou t0 > a

com a: P(Tn 1 > a) = etc.

H1: > 0 (unilateral superior) ou H1: < 0 (unilateral inferior) usa-se a estatstica de teste T0 = X 0 S n

Quando H0 verdadeira T0 ~ tn 1

Nota: Para os testes em que a estatstica de teste tem distribuio normal o valor-p fcil de determinar. Para outras distribuies (t e chiquadrado) esse valor s pode ser obtido usando um programa de computador ou em certas calculadoras. Recorrendo s tabelas o melhor que se consegue obter um intervalo que contm (de certeza) o valor-p.

23

24

Ana Pires, IST, Outubro de 2000

Probabilidades e Estatstica

Ana Pires, IST, Outubro de 2000

Probabilidades e Estatstica

Exemplo: Determinao da constante de acidez do cido orto-hidroxibenzico. O valor tabelado 2.81. Queremos saber se o valor determinado experimentalmente est de acordo com o valor tabelado. Ou seja, em termos de testes de hipteses e sendo Y a v.a. que representa um valor da constante determinado experimentalmente, queremos testar H0 : Y = 2.81 contra H1: Y 2.81 Admitindo que Y ~ N ( Y ,
2 Y

Valor observado da estatstica de teste: t0 = 3.1063 2.81 = 44.33 0.014946 5

O percentil mais elevado (tabelado) para a distribuio t4 t4,0.9995 = 8.61, o que corresponde a um nvel de significncia

= 2 (1 0.9995) = 0.001 = 0.1%


Mesmo para este nvel de significncia a hiptese H0 rejeitada pois 44.33 > 8.61. Podemos ainda afirmar que valor-p < 0.001.

Temos as seguintes 5 observaes (que podem ser consideradas como obtidas por amostragem aleatria): y1 = 3.0935 y2 = 3.0894
y3 = 3.1111

y4 = 3.1113 y5 = 3.1262 n = 5 y = 3.1063 sy = 0.014946 25 26

Ana Pires, IST, Outubro de 2000

Probabilidades e Estatstica

Ana Pires, IST, Outubro de 2000

Probabilidades e Estatstica

8.5 Testes de hipteses sobre a igualdade das mdias de duas populaes normais, varincias desconhecidas Exemplo: Pretende-se saber se o efeito mdio de dois catalizadores em determinado processo qumico pode ser considerado igual ou diferente. Resultados das experincias: Catalizador 1: 91.50 94.18 92.18 95.39 91.79 89.07 94.72 89.21 n1 = 8 Catalizador 2: 85.19 90.95 90.46 93.21 97.19 n2 = 8 97.04 91.07 92.75 Sejam
X1 - v.a. que representa o resultado com o cat. 1

Admitimos que (hipteses de trabalho): A primeira amostra uma concretizao de uma a.a. da populao X1 ~ N (1 , 12 ) ; A segunda amostra uma concretizao de 2 uma a.a. da populao X2 ~ N ( 2 , 2 ); X1 e X2 so independentes;
2 2 12 = 2 = 2 ( razovel se s12 e s2 forem da

mesma ordem de grandeza). Pretende-se testar:


H0 : 1 = 2

contra H1: 1 2

X2 - v.a. que representa o resultado com o cat. 2 27 28

Ana Pires, IST, Outubro de 2000

Probabilidades e Estatstica

Ana Pires, IST, Outubro de 2000

Probabilidades e Estatstica

Sabemos que: ( X1 X2 ) (1 2 ) ~ t T= n1 + n 2 2 1 1 Sp + n1 n2 Ento a estatstica de teste : X1 X2 T0 = , sob H0 1 1 Sp + n1 n2 com S


2 p

n1 + n2 2 = 14 Para = 5% vem a = t14,0.975 = 2.145. Como -2.145 < -0.35 < 2.145 no se rejeita H0 ao nvel de significncia de 5%.

T0 ~ tn1 + n2 2

Tambm se poderia concluir que 0.6< valor-p < 0.8 Output do Excel para este teste:
t-Test: Two-Sample Assuming Equal Variances
Variable 1 Variable 2

(n 1)S12 + (n2 1)S22 = 1


n1 + n2 2
x1 = 92.255 s1 = 2.39 x2 = 92.733 s2 = 2.98

Clculos:

Valor observado da estatstica de teste: t0 = 92.255 92.733 7 2.392 + 7 2.982 14 1 1 + 8 8 = 0.35

Mean Variance Observations Pooled Variance Hyp. Mean Difference df t P(T<=t) one-tail t Critical one-tail P(T<=t) two-tail t Critical two-tail

92.255 92.7325 5.68831429 8.90099286 8 8 7.29465357 0 14 -0.3535909 0.36445681 1.76130925 0.72891362 2.1447886

29

30

Ana Pires, IST, Outubro de 2000

Probabilidades e Estatstica

Ana Pires, IST, Outubro de 2000

Probabilidades e Estatstica

8.6 Testes de hipteses para a varincia de uma populao normal X ~ N ( ,


2

8.7 Testes de hipteses para uma proporo

( X1 ,


, Xn ) a.a. contra
2 H1: 2 0

( X1 ,


, Xn ) amostra aleatria de uma populao

muito grande ou infinita. Seja Y ( n) o nmero de observaes desta

2 Para testar H0 : 2 = 0

usa-se a estatstica de teste Q0 =

amostra que pertencem a uma dada categoria de interesse.


2 0

(n 1)S 2

Seja p a proporo de indivduos na populao que pertencem a essa categoria de interesse. Exemplos: Populao Peas Eleitores Categoria ser defeituosa vota no partido X

2 Quando H0 verdadeira Q0 ~ n 1

Ento, rejeita-se H0 ao nvel de significncia se q0 =

(n 1)s 2
2 0

< a ou q0 > b

com a: P(Q0 < a) =

e b: P(Q0 > b) = 2 2
31

=Y. O estimador pontual de p P n J vimos que se n for grande 32

Ana Pires, IST, Outubro de 2000

Probabilidades e Estatstica

Ana Pires, IST, Outubro de 2000

Probabilidades e Estatstica

Z=

p P ~ N (0,1) p(1 p) a n

Logo para testar H0 : p = p0 contra H1: p p0 (ou H1: p < p0 , ou H1: p > p0 ) usa-se a estatstica de teste Z0 = p0 (1 p0 ) n p P 0 , sob H0 Z0 ~ N (0,1)
a

Exemplo: Populao de eleitores portugueses. Sondagem (aleatria) a 1200 eleitores revelou que 683 tencionam votar no partido ABC. Entretanto o presidente do partido tinha afirmado "estou convencido que vamos obter mais de 50% dos votos". Concordamos com esta afirmao? = 683 1200 = 0.569 p Podemos testar H0 : p = 0.5 contra H1: p > 0.5

Para H1: p p0 , rejeita-se H0 ao nvel se z0 = p0 (1 p0 ) n p0 p < a ou z0 > a a: P( Z > a) = 2

Se rejeitarmos a hiptese nula (e isso uma concluso "forte") ento a afirmao corroborada pela sondagem. 0.569 0.5 = 4.79 valor-p = 0.000001 0.5(1 0.5) 1200 Como o valor-p muito baixo rejeita-se H0 para os z0 = nveis de significncia usuais. 33 34

Ana Pires, IST, Outubro de 2000

Probabilidades e Estatstica

Ana Pires, IST, Outubro de 2000

Probabilidades e Estatstica

8.8 Teste do qui-quadrado de ajustamento O objectivo testar a hiptese de que as observaes seguem uma determinada distribuio (discreta ou contnua, com ou sem parmetros desconhecidos) Exemplo: O lanamento de um dado 1000 vezes conduziu seguinte tabela de frequncias observadas ( oi ) xi 1 2 3 4 5 6 Total oi 174 174 154 179 154 165 1000

Ser que os resultados obtidos sustentam a hiptese de que o "dado perfeito"? X - v.a. que representa o nmero de pontos obtido num lanamento
1 H0 : P( X = i ) = , i = 1, ,6 ou 6 X ~ Unif . Disc. (1, ,6) H1: negao de H0
 

Quando H0 verdadeira sabemos calcular a probabilidade de cada valor (ou classe, em geral), que designamos por pi , e o valor esperado para o nmero de observaes em cada classe (abreviadamente, frequncias esperadas),
Ei = npi

onde n a dimenso da amostra, neste caso n = 1000 35 36

Ana Pires, IST, Outubro de 2000

Probabilidades e Estatstica

Ana Pires, IST, Outubro de 2000

Probabilidades e Estatstica

Vamos acrescentar essas duas colunas tabela:


xi
oi pi

A varivel que usada para medir o afastamento X =


2 0 i =1 k

Ei = npi 166.67 166.67 166.67 166.67 166.67 166.67 1000.02

(Oi Ei )2
Ei

1 2 3 4 5 6 Total

174 174 154 179 154 165 1000

16 16 16 16 16 16 1

(Estatstica de teste)

Pode mostrar-se que, quando H0 verdadeira,


2 2 X0 ~ k 1 a

onde k o n. de classes (no exemplo, 6) e o n. de parmetros estimados (no exemplo, 0)


2 for Deve rejeitar-se H0 se o valor observado de X0

Mesmo quando H0 verdadeira no estamos espera que as colunas oi e Ei coincidam. ento necessrio medir o afastamento entre oi e Ei e saber at que ponto esse afastamento razovel para H0 verdadeira (se determinarmos que o afastamento razovel no rejeitamos H0 , caso contrrio rejeitamos H0 ).

muito elevado, ou seja a regio crtica do teste da forma


2 R. C.: X0 >a 2 onde a: P( X0 > a) =

e o nvel de significncia do teste. 37 38

Ana Pires, IST, Outubro de 2000

Probabilidades e Estatstica

Ana Pires, IST, Outubro de 2000

Probabilidades e Estatstica

Tabela incluindo os clculos para obter o valor 2 : observado de X0

xi 1 2 3 4 5 6 Total

oi

pi

Ei = npi 166.67 166.67 166.67 166.67 166.67 166.67 1000.02

(oi Ei )2
Ei 0.322 0.322 0.963 0.912 0.963 0.017 3.499

Exemplo: Pensa-se que o nmero de defeitos por circuito, num certo tipo de circuitos, deve seguir uma distribuio de Poisson. De uma amostra (escolhida aleatoriamente) de 60 circuitos obtiveram-se os resultados seguintes: N. de def. 0 1 2 3 Total oi 32 15 9 4 60

174 174 154 179 154 165 1000

16 16 16 16 16 16 1

2 O valor observado de X0 3.499. Se fixarmos

= 0.05 , com k 1 = 5, obtm-se a = 11.07 .


Uma vez que 3.499 < 11.07, no se rejeita H0 ao nvel de significncia de 5%.

X - v.a. que representa o n. de defeitos num circuito H0 : X ~ Poisson( ) contra H1: X ~ outra dist.

39

40

Ana Pires, IST, Outubro de 2000

Probabilidades e Estatstica

Ana Pires, IST, Outubro de 2000

Probabilidades e Estatstica

desconhecido, ento deve ser estimado (pelo mtodo da mxima verosimilhana)


 

Obtm-se ento a tabela final: N. de def. 0 1

= x = 32 0 + 15 1 + 9 2 + 4 3 = 0.75 60 donde
0.75 0.750 ( X = 0) = e 1 = P p = 0.472 0!

oi

i p

i ei = np 28.32 21.24 10.44 60.00

(oi ei )2
ei 0.478 1.833 0.628 2.939

32 15 13 60

0.472 0.354 0.174 1.000

e1 = 28.32

0.75 0.751 ( X = 1) = e 2 = P = 0.354 e2 = 21.24 p 1!

2 Total

k 1 = 3 11 = 1

0.75 0.752 ( X = 2) = e 3 = P p = 0.133 e3 = 7.98 2!

= 0.05

a = 3.841

Como 2.939 < 3.841, no se rejeita H0 ao nvel de significncia de 5%.

( X 3) = 1 ( p 4 = P 1 + p 2 + p 3 ) = 0.041 p e4 = 2.46 Deve ter-se ei 5, i , se para algum i ei < 5, deve fazer-se um agrupamento de classes. 41

42

Ana Pires, IST, Outubro de 2000

Probabilidades e Estatstica

Ana Pires, IST, Outubro de 2000

Probabilidades e Estatstica

Observaes: 1) Para variveis contnuas o procedimento semelhante: As observaes devem previamente ser agrupadas em classes (intervalos). Podem usarse as regras para construo de histogramas e, partida, classes de amplitude constante.
pi 's so as probabilidades das classes.

8.9 Teste do qui-quadrado de independncia em tabelas de contingncia O objectivo testar a hiptese de que duas variveis (discretas ou contnuas) so independentes. Para isso devemos ter observaes relativas ocorrncia simultnea dos valores possveis das duas variveis. Essas observaes organizam-se numa tabela de frequncias a que se chama tabela de contingncia. Exemplo: Um estudo sobre a ocorrncia de falhas numa certa componente electrnica revelou que podem ser considerados 4 tipos de falhas (A, B, C e D) e duas posies de montagem. Em 134 componentes seleccionadas aleatoriamente obtiveram-se as frequncias absolutas registadas na tabela (de contingncia) da pgina seguinte. Ser que o tipo de falha independente da posio de montagem? 44

2) necessrio n relativamente elevado para fazer este teste (pelo menos 5 observaes por classe). 3) Existem outros testes que no requerem tantas observaes (teste de Kolmogorov-Smirnov e papel de probabilidade) mas no fazem parte do programa. 43

Ana Pires, IST, Outubro de 2000

Probabilidades e Estatstica

Ana Pires, IST, Outubro de 2000

Probabilidades e Estatstica

Montagem 1 2

A 22 4

Falha B C 46 17 18 6

D 9 12

Total 95 39

A hiptese nula (independncia) pode ser escrita como:


H 0 : P( X = i , Y = j ) = P( X = i ) P( Y = j ) i , j

ou H0 : pij = pi p j i , j Seguindo raciocnio semelhante ao usado no teste de ajustamento, precisamos de calcular a tabela de frequncias esperadas sob a hiptese nula e compar-la com a de frequncias observadas. Para isso necessrio primeiro estimar pi e p j i , j : i = p ni n
j = p n j , n

Total 26 63 24 21 134 Designamos por oij , (onde i se refere linha e j coluna) os valores do interior da tabela. Por ni os totais das colunas e por n j os totais das linhas. Tabela genrica (com as mesmas dimenses): j i 1 2
n j

1
o11 o21 n1

2
o12

3
o13

4 o14
o24

ni n1
n2

donde se obtm
j = n i p eij = np ni n j ni n j = n n n

o22
n2

o23
n3

n4

n 45 46

Ana Pires, IST, Outubro de 2000

Probabilidades e Estatstica

Ana Pires, IST, Outubro de 2000

Probabilidades e Estatstica

No exemplo em considerao obtm-se ento a seguinte tabela de frequncias esperadas: Falha Montagem 1 2 A 18.4 7.6 B 44.7 18.3 C 17.0 7.0 D

Valor observado da estatstica de teste no exemplo: x =


2 0

(22 18.4)2
18.4

+


(12 6.1)2
6.1

= 10.78

Deciso: 14.9 6.1

( (r 1)( s 1) = 3)

2 2 > a) = 0.99 a = 3,0.99 = 11.34 = 1% a: P( 3 2 = 9.348 = 2.5% a = 3,0.975

A varivel que usada para medir o afastamento (entre a tabela de frequncias observadas e a tabela de frequncias esperadas)
2 X0 = i =1 j =1 r s

ou seja, 0.01 < valor p < 0.025 O resultado no muito conclusivo, embora v no sentido da no independncia. Para ter um resultado mais convincente seria necessrio repetir a experincia, eventualmente com mais observaes.

(O

ij

Eij Eij

(Estatstica de teste)

Pode mostrar-se que, quando H0 verdadeira,


2 ~ (2r 1)( s 1) X0 a

com r=n de linhas e s = n de colunas da tabela. 47 48

Você também pode gostar