Você está na página 1de 18

8.

Testes de hipóteses

Uma outra forma de inferir sobre características de uma população é tes-


tar hipóteses previamente formuladas sobre os seus parâmetros, tendo
em conta uma amostra aleatória da população e o valor tolerável para a
probabilidade de rejeição incorrecta dessas hipóteses.

Exemplo 8.1: Uma empresa portuguesa compra usualmente parafusos


americanos e japoneses devido às suas boas condições de resistência à
tracção (X). Os americanos afirmam que a resistência à tracção dos
seus parafusos tem média 145 kg e desvio padrão 12 kg, enquanto os
japoneses dizem ter 155 kg de média e 20 kg de desvio padrão.
Um lote de parafusos será inspeccionado, desconhecendo-se a sua
proveniência (americana ou japonesa). Com base numa amostra
aleatória de 25 parafusos, calcula-se a resistência média à tracção (x̄)
a fim de investigar a origem dos mesmos.
NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 142/207

Supondo distribuição normal para as duas populações, N (145, 144)


(americana) e N (155, 400) (japonesa), pode-se considerar a seguinte
regra de decisão:
• Se x̄ ≤ 150, diz-se que os parafusos são de origem americana;
caso contrário, são de procedência japonesa (Regra 1).
0.030

N(145,144)
N(155,400)
0.020
0.010
0.000

50 100 150 200 250

NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 143/207


Na decisão do Exemplo 8.1, pode-se cometer dois tipos de erro:
Erro do tipo I: Afirmar que os parafusos não são americanos (japone-
ses) quando na realidade eles são americanos.
Erro do tipo II: Afirmar que os parafusos são americanos quando na
realidade eles são japoneses.

As probabilidades destes dois tipos de erro (Exemplo 8.1) são:

α = P (Erro tipo I) = P (X̄ > 150 | parafusos americanos)


= P (X̄ > 150 | X ∼ N (145, 144)) = P (Z > 2.08)
= 0.019

β = P (Erro tipo II) = P (X̄ ≤ 150 | parafusos japoneses)


= P (X̄ ≤ 150 | X ∼ N (155, 400)) = P (Z ≤ −1.25)
= 0.106

NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 144/207

Ao usar a regra de decisão do Exemplo 8.1 (Regra 1), a probabilidade


do erro de tipo I é superior à do erro de tipo II (α = 0.019 < β = 0.106),
“favorecendo” assim os parafusos americanos.
• Para cada regra de decisão tem-se um valor limítrofe para x̄ (de-
notado aqui por x̄c ) em vez de 150. Por conseguinte, os valores de
α e β variam consoante o valor fixado de x̄c .
• Se x̄c > 150, α diminui e β aumenta. Se x̄c < 150, α aumenta e β
diminui.
• Se x̄c = 148.75, α = β = 0.059 (ponto de equilíbrio).

Em suma, dada uma regra de decisão (i.e., um valor para x̄c ), calcula-se
as probabilidades de erros tipo I e II para avaliar o método de decisão.
Outro procedimento possível é fixar a probabilidade de um tipo de erro
e encontrar a correspondente regra de decisão. Por exemplo, α = 0.05
implica x̄c = 154.4 e β = 0.4404, favorecendo a decisão para os para-
fusos americanos.
NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 145/207
Noções básicas.
Um teste de hipóteses paramétricas usualmente visa comparar difer-
entes valores para o parâmetro desconhecido θ de uma dada população
X.

Procedimento geral de um teste de hipóteses:


1. Hipóteses de interesse:
• Hipótese nula H0 (e.g., θ = θ0 ).
• Hipótese alternativa H1 (e.g., θ 6= θ0 → teste bilateral; θ < θ0
ou θ > θ0 → testes unilaterais).

2. Erros associados à regra de decisão, cujas correspondentes proba-


bilidades são dadas por
• α = P (Erro do tipo I) = P (Rejeitar H0 |H0 verdadeiro).
• β = P (Erro do tipo II) = P (Aceitar H0 |H0 falso).

NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 146/207

3. Região crítica (RC): Região que não favorece a hipótese nula H0


na regra de decisão. Construída com base numa estatística T =
T (X1 , . . . , Xn ) (denominada estatística do teste).
• A RC é construída tal que P (T ∈ RC|H0 verdadeiro) = α,
sendo α (nível de significância do teste) fixado previamente.
Doravante, RC é denotado por RCα .
4. Decisão do teste de hipótese:
• Se T ∈ RCα , rejeita-se H0 ao nível de significância de
100α%. Caso contrário, não se rejeita H0 a 100α%.
• Quanto menor for o nível de significância do teste, tanto maior
será a precaução contra o risco de rejeição incorrecta de H0 .
Os níveis de significância são usualmente 1%, 5% e 10%.
A determinação de β exige a especificação de cada valor alternativo
para o parâmetro em teste, dado que H1 é geralmente composta (e.g.,
β = P (T ∈/ RCα |θ 6= θ0 )).
NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 147/207
Testes de hipóteses para parâmetros de popu-
lações normais
Seja X1 , . . . , Xn uma a.a. de uma população X ∼ N (µ, σ 2 ), com σ 2
conhecido. Sabe-se que o estimador MV de µ é X̄ ∼ N (µ, σ 2 /n).
Teste de hipóteses:
1. Hipóteses:
• H 0 : µ = µ0
• H1 : µ 6= µ0 (ou H1 : µ > µ0 ou H1 : µ < µ0 )

2. Estatística do teste:
X̄ − µ0 H0
Z0 = √ ∼ N (0, 1),
σ/ n

cujo valor observado é denotado por z0 .

NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 148/207

3. Região crítica: Fixado um valor para α,

RCα = {z ∈ IR : (z < −b) ∪ (z > b)},

onde b = FN−1(0,1) (1− α2 ).

−b 0 b Z

4. Conclusão:
• Se z0 ∈ RCα , rejeita-se H0 ao nível de significância de
100α%.
• Caso contrário, não há evidência para rejeitar H0 ao nível α.

NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 149/207


Exemplo 8.2: Uma máquina foi regulada para encher pacotes de café
de 500g. Seja X1 , . . . , X16 uma a.a. de X (quantidade de café por
pacote), cuja média amostral é 492g. Considerando que X segue uma
distribuição normal com variância 400g 2 , teste a regulação da máquina
ao nível de 1% de significância.
Teste de hipóteses:
1. Hipóteses: H0 : µ = 500 ≡ µ0 versus H1 : µ 6= 500
X̄−µ H0
2. Estatística do teste: Z0 = √0 ∼
σ/ n
N (0, 1), cujo valor observado
492−500
é z0 = √ = −1.6.
400/16

3. Região crítica: Fixado α = 0.01, FN−1(0,1) (0.995) = 2.58 e RC1% =


(−∞, −2.58) ∪ (2.58, ∞).
4. Conclusão: Como z0 ∈ / RC1% , não se rejeita H0 ao nível de
significância de 1%, i.e., não há evidência contra a regulação da
máquina.
NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 150/207

Seja X1 , . . . , Xn uma a.a. de uma população X ∼ N (µ, σ 2 ), com µ e σ 2


desconhecidos. Sabe-se que o estimador MV de µ é X̄ ∼ N (µ, σ 2 /n).
Teste de hipóteses:
1. Hipóteses:
• H 0 : µ = µ0
• H1 : µ 6= µ0 (ou H1 : µ > µ0 ou H1 : µ < µ0 )

2. Estatística do teste:
X̄ − µ0 H0
T0 = √ ∼ t(n−1) ,
S/ n
1
Pn
cujo valor observado é t0 , onde S 2 = n−1 2
i=1 (Xi − X̄) .

NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 151/207


3. Região crítica: Fixado um valor para α,

RCα = {t ∈ IR : (t < −b) ∪ (t > b)},

onde b = Ft−1
(n−1)
(1− α2 ).

−b 0 b T

4. Conclusão:
• Se t0 ∈ RCα , rejeita-se H0 ao nível de significância de
100α%.
• Caso contrário, não há evidência contra H0 ao nível α.

NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 152/207

Exemplo 8.2a: Seja X1 , . . . , X16 uma a.a. de X (quantidade de café


por pacote), cuja média e variância amostral são 480g e 800g 2 , respec-
tivamente. Considerando uma distribuição normal para X, teste se a
máquina está a encher pacotes de café com pelo menos 500g, ao nível
de 5% de significância.
Teste de hipóteses:
1. Hipóteses: H0 : µ ≥ 500 ≡ µ0 versus H1 : µ < 500.
X̄−µ µ=µ0
2. Estatística do teste: T0 = √0 ∼
S/ n
t(15) , cujo valor observado é
480−500
t0 = √ = −2.83.
800/16

3. Região crítica: Fixado α = 0.05, Ft−1


(15)
(0.95) = 1.753 e RC5% =
(−∞, −1.753).
4. Conclusão: Como t0 ∈ RC5% , rejeita-se H0 ao nível de significân-
cia de 5%, i.e., há evidência4contra a hipótese de enchimento de
pacotes de café com pelo menos 500g.
NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 153/207
Exemplo 8.2b: No teste de hipóteses H0 : µ ≥ 500 ≡ µ0 versus H1 :
µ < 500, a decisão do teste varia com a escolha de α, i.e.,

α RCα decisão do teste


0.05 (−∞, −1.753) rejeita-se H0
0.01 (−∞, −2.602) rejeita-se H0
0.006 (−∞, −2.857) não se rejeita H0

Assim, o menor valor do nível de significância α que conduz à rejeição


de H0 é P = P (T < −2.83|H0 ) = 0.0063.

Valor-p do teste.
Definição 8.1: O valor-p de um teste de hipóteses (P ) é a probabilidade
sob H0 de a estatística do teste tomar valores tão ou mais desfavoráveis
a H0 do que o seu valor observado. Deste modo, H0 será rejeitado a
todo nível de significância α tal que P < α e aceite no caso contrário.

NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 154/207

Seja X1 , . . . , Xn uma a.a. de uma população X ∼ N (µ, σ 2 ), com µ e


σ 2 desconhecidos. Sabe-se que Q = (n − 1)S 2 /σ 2 ∼ χ2(n−1) .

Teste de hipóteses:
1. Hipóteses:
• H0 : σ 2 = σ02
• H1 : σ 2 6= σ02 (ou H1 : σ 2 > σ02 ou H1 : σ 2 < σ02 ).

2. Estatística do teste:
(n − 1)S 2 H0 2
Q0 = ∼ χ(n−1) ,
σ02
1
Pn
com valor observado q0 e S 2 = n−1 2
i=1 (Xi − X̄) .
Pn 2
i=1 (Xi −µ)
H0
Se µ for conhecido, Q0 = σ02
∼ χ2(n) .

NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 155/207


3. Região crítica: Fixado um valor para α,

RCα = {q ∈ IR+ : (q < a) ∪ (q > b)},

onde a = Fχ−1
2 ( α2 ) e b = Fχ−1
2 (1− α2 ).
(n−1) (n−1)

0 a b Q

4. Conclusão:
• Se q0 ∈ RCα , rejeita-se H0 ao nível de significância de
100α%. Caso contrário, não há evidência contra H0 .

NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 156/207

Exemplo 8.3: Seja X1 , . . . , X10 uma a.a. de X (tensão de ruptura),


cujos resultados são 10
P P10 2
i=1 x i = 900 e i=1 xi = 81108. Considerando
uma distribuição normal para X, teste se V ar(X) = σ 2 = 10.
Teste de hipóteses:
1. Hipóteses: H0 : σ 2 = 10 ≡ σ02 versus H1 : σ 2 6= 10.
(n−1)S 2 H0
2. Estatística do teste: Q0 = σ02
∼ χ2(9) , cujo valor observado é
9×12
q0 = 10
= 10.8.
3. Valor-p: P = 2 min(P (Q0 ≥ 10.8|H0 ), P (Q0 < 10.8|H0 )) =
2 (0.71) = 10.8, Fχ2 (0.7) = 10.66 e
0.58. Note-se que Fχ−1 −1
(9) (9)

2 (0.8)
Fχ−1 = 12.24.
(9)

4. Conclusão: Rejeita-se H0 para α ≥ 0.58 e aceita-se H0 para α <


0.58. Ou seja, há forte evidência a favor da hipótese V ar(X) =
10.

NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 157/207


Duas populações normais
Sejam X11 , . . . , X1n1 e X21 , . . . , X2n2 a.a. de duas populações in-
dependentes X1 ∼ N (µ1 , σ12 ) e X2 ∼ N (µ2 , σ22 ), respectivamente,
com σ12 e σ22 conhecidos. Sabe-se que o estimador MV de µ1 − µ2 é
X̄1 − X̄2 ∼ N (µ1 − µ2 , σ12 /n1 + σ22 /n2 ).
Teste de hipóteses:
1. Hipóteses:
• H 0 : µ1 = µ2 ⇔ µ1 − µ2 = 0
• H1 : µ1 6= µ2 (ou H1 : µ1 > µ2 ou H1 : µ1 < µ2 )

2. Estatística do teste:
X̄1 − X̄2 H0
Z0 = p 2 ∼ N (0, 1),
σ1 /n1 + σ22 /n2
com valor observado z0 .

NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 158/207

3. Região crítica: Fixado um valor para α,

RCα = {z ∈ IR : (z < −b) ∪ (z > b)},

onde b = FN−1(0,1) (1− α2 ).

−b 0 b Z

4. Conclusão:
• Se z0 ∈ RCα , rejeita-se H0 ao nível de significância de
100α%. Caso contrário, aceita-se H0 ao nível α.

NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 159/207


Sejam X11 , . . . , X1n1 e X21 , . . . , X2n2 a.a. de duas populações inde-
pendentes X1 ∼ N (µ1 , σ12 ) e X2 ∼ N (µ2 , σ22 ), respectivamente, com
σ12 = σ22 = σ 2 (desconhecido).

Teste de hipóteses:
1. Hipóteses:
• H 0 : µ1 = µ2 ⇔ µ1 − µ2 = 0
• H1 : µ1 6= µ2 (ou H1 : µ1 > µ2 ou H1 : µ1 < µ2 )

2. Estatística do teste:
X̄1 − X̄2 H0
T0 = q ∼ t(n1 +n2 −2) ,
(n1−1)S12 +(n2−1)S22 1 1
n1 +n2 −2
( n1 + n2
)

1
Pni
com valor observado t0 e Si2 = ni −1 j=1 (Xij − X̄i )2 , i = 1, 2.

NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 160/207

3. Região crítica: Fixado um valor para α,

RCα = {t ∈ IR : (t < −b) ∪ (t > b)},

onde b = Ft−1
(n +n
(1− α2 ).
1 2 −2)

−b 0 b T

4. Conclusão:
• Se t0 ∈ RCα , rejeita-se H0 ao nível de significância de
100α%. Caso contrário, não há evidência contra H0 .

NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 161/207


Exemplo 8.4: Para testar a resistência de dois tipos de viga de aço (A e
B), observou-se a resistência de algumas dessas vigas de aço, obtendo
os seguintes resultados de duas amostras:

tipo tamanho média variância


A 15 70.5 81.6
B 10 84.3 85.7

Supondo que as amostras (aleatórias) são provenientes de duas pop-


ulações normais independentes X1 ∼ N (µ1 , σ 2 ) e X2 ∼ N (µ2 , σ 2 ),
teste a igualdade das médias populacionais.

Teste de hipóteses:
1. Hipóteses:
• H 0 : µ1 = µ2 ⇔ µ1 − µ2 = 0
• H1 : µ1 6= µ2 .

NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 162/207

2. Estatística do teste:
X̄1 − X̄2 H0
T0 = q ∼ t(23) ,
(n1−1)S12 +(n2−1)S22 1 1
n1 +n2 −2
( n1 + n2
)

70.5−84.3
cujo valor observado é t0 = √ = −3.71.
(83.204)(1/15+1/10)

3. Valor-p:

P = P (|T0 | ≥ 3.71|H0 ) = 2(1−Ft(23) (3.71)) = 0.0012.

4. Conclusão:
• Rejeita-se H0 para α ≥ 0.0012.
• Aceita-se H0 para α < 0.0012.
Há forte evidência contra a hipótese de igualdade entre as resistên-
cias médias dos dois tipos de viga de aço.
NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 163/207
Testes de hipóteses para parâmetros de popu-
lações não normais uniparamétricas.
Exemplo 8.5: Seja X1 , . . . , Xn uma a.a. de uma população X ∼
a
Bernoulli(p). Pelo T.L.C. (n grande), X̄ ∼ N (p, p(1 − p)/n).

Teste de hipóteses para uma proporção (em grandes amostras):


1. Hipóteses:
• H0 : p = p 0
• H1 : p 6= p0 (ou H1 : p > p0 ou H1 : p < p0 ).

2. Estatística do teste:
X̄ − p0 H0
Z0 = p ∼ N (0, 1),
p0 (1 − p0 )/n a

cujo valor observado é z0 .


NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 164/207

3. Região crítica: Fixado um valor para α,

RCα = {z ∈ IR : (z < a) ∪ (z > b)},

onde b = −a = FN−1(0,1) (1− α2 ).

−b 0 b Z

4. Conclusão:
• Se z0 ∈ RCα , rejeita-se H0 ao nível de significância de
100α%.
• Caso contrário, não há evidência contra H0 ao nível α.

NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 165/207


Exemplo 8.6: Uma estação de TV afirma que no mínimo 60% dos tele-
spectadores devem assistir o seu programa especial de Natal. A fim de
avaliar esta afirmação, 200 famílias foram inquiridas, com 104 respostas
afirmativas, sendo X1 , . . . , X200 uma a.a. de X ∼ Bernoulli(p).
Teste de hipóteses:
1. Hipóteses: H0 : p ≥ 0.6 ≡ p0 versus H1 : p < 0.6.
X̄−p0 H0
2. Estatística do teste: Pelo T.L.C., Z0 = √ ∼ N (0, 1),
p0 (1−p0 )/n a
cujo valor observado é z0 = √0.52−0.6 = −2.31.
0.6 0.4/200

3. Valor-p: P (Z0 ≤ −2.31|H0 ) = 0.0104.


4. Conclusão:
• Rejeita-se H0 para α ≥ 0.0104.
• Não se rejeita H0 para α < 0.0104.
Ou seja, há alguma evidência contra a afirmação da estação de TV.

NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 166/207

Teste de ajustamento do qui-quadrado de Pearson.

Até ao momento os procedimentos de inferência estatística tem incidido


sobre problemas paramétricos. Entretanto, pode-se também formular
hipóteses sobre a própria forma distribucional de uma dada população,
e.g., usando um teste de ajustamento do qui-quadrado de Pearson.

Construção da estatística do teste do qui-quadrado de Pearson:


1. Considere uma amostra aleatória de N elementos sobre os quais
se observa uma característica X, sendo as respectivas observações
organizadas numa partição da recta real, B1 , . . . , Bk .
2. Seja pi = P (Bi ) a probabilidade de obter uma observação na i-
ésima parte da partição, i = 1, . . . , k, tal que ki=1 pi = 1, en-
P
quanto Oi denota o número de elementos da amostra que pertence
a Bi , i = 1, . . . , k, tal que ki=1 Oi = N .
P

NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 167/207


3. O vector aleatório O = (O1 , . . . , Ok ) tem f.m.p. dada por

N! Ok
fO (o1 , . . . , ok ) = pO1 O2
1 p2 · · · pk ,
O1 ! . . . Ok !

conhecida por distribuição Multinomial (N, p = (p1 , . . . , pk )),


podendo-se provar que Oi ∼ Binomial(N, pi ), i = 1, . . . , k.
4. Hipóteses:
• H0 : X ∼ FX (·) ⇒ pi = p0i , ∀ i = 1, . . . , k.
• H1 : X ≁ FX (·) ⇒ pi 6= p0i , para algum i = 1, . . . , k.

5. Estatística do teste:
k
X (Oi − Ei )2 H0
Q0 = ∼ χ2(k−m−1) ,
i=1
Ei a

onde Ei = E(Oi |H0 ) = N p0i e m é o total de parâmetros estima-


dos.
NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 168/207

Exemplo 8.7: Acredita-se que o número X de acidentes por semana


numa dada estrada segue uma distribuição Poisson. Para testar esta
crença observou-se o número de acidentes nessa estrada durante 30 se-
manas, cujos resultados encontram-se a seguir. Teste a suposição de
distribuição Poisson para X ao nível de significância de 5%.
8 4 1 1 3 0 0 0 8 9 2 4 7 1 3
3 1 0 2 0 3 4 2 1 12 5 0 5 4 2

Teste de hipóteses:
1. Hipóteses:
• H0 : X ∼ Poisson(λ) versus H1 : X ≁ Poisson(λ).

2. Estatística do teste:
k
X (Oi − Ei )2 H0
Q0 = ∼ χ2(k−m−1) ,
i=1
Ei a

NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 169/207


95
onde Ei = 30 p0i e a estimativa MV de λ é x̄ = 30 = 3.167
(m = 1) e portanto, sob H0 , considera-se X ∼ Poisson(λ = 3.167).
Por simplicidade, escolheu-se a seguinte partição B1 , . . . , B5 .

i Bi p0i = P (X ∈ Bi |H0 ) Ei
1 [0, 1] P (X = 0) + P (X = 1) = 0.1756 5.268
2 (1, 2] P (X = 2) = 0.2113 6.339
3 (2, 3] P (X = 3) = 0.2230 6.691
4 (3, 4] P (X = 4) = 0.1766 5.297
5 (4, ∞) 1 − P (X ≤ 4) = 0.2135 6.404

O valor observado da estatística do teste é


2 2 2 2 2
q0 = (11−5.268)
5.268
+ (4−6.339)
6.339
+ (4−6.691)
6.691
+ (4−5.297)
5.297
+ (7−6.404)
6.404
= 6.237 + 0.863 + 1.082 + 0.318 + 0.055 = 8.56

NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 170/207

3. Região crítica: Fixado α = 0.05,

RC5% = {q ∈ IR+ : (q > b)},

2 (0.95) = 7.815.
onde b = Fχ−1
(3)

0 b Q

4. Conclusão:
• Como q0 = 8.56 ∈ RC5% , rejeita-se H0 ao nível de significân-
cia de 5%. Ou seja, não há evidência a favor da hipótese de
X ∼ Poisson(λ).

NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 171/207


Notas:
1. O valor-p do teste de ajustamento no Exemplo 8.7 é

P = (Q0 > 8.56|H0 ) = 0.0357,

com Fχ−1 −1
2 (0.95) = 7.815 e Fχ2 (0.975) = 9.348.
(3) (3)

Consequentemente, rejeita-se H0 para α ≥ 0.0357 e aceita-se H0


para α < 0.0357. Ou seja, há alguma evidência contra H0 .
2. Os valores Ei na estatística do teste do qui-quadrado devem ser
• Todos maiores ou iguais a 1.
• Pelo menos 80% deles devem ser no mínimo 5.
Caso contrário, deve-se fazer reagrupamento de classes.
3. Caso seja necessário estimar m parâmetros no cálculo dos Ei ,
deve-se retirar m graus de liberdade da distribuição à estatística
do teste do qui-quadrado de Pearson (χ2(k−m−1) ).

NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 172/207

Teste de independência do qui-quadrado de Pear-


son em tabelas de contingência.
Suponha que cada um dos N elementos de uma população pode ser
classificado de acordo com duas características X e Y , com r e s cate-
gorias, respectivamente.

Seja pij = P (X = i, Y = j) a probabilidade (conjunta) de um ele-


mento da população pertencer a categoria (i, j) de (X, Y ), i = 1, . . . , r,
j = 1, . . . , s.

Consequentemente, as probabilidades (marginais) das duas característi-


cas são dadas por

pi• = P (X = i) = sj=1 P (X = i, Y = j)
P

p•j = P (Y = j) = ri=1 P (X = i, Y = j).


P

NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 173/207


Para avaliar a independência das duas características pode-se construir
um teste de hipótese com base na estatística do qui-quadrado de Pear-
son, efectuando as seguintes adaptações:
• A partição Bi , i = 1, . . . , rs pode ser apresentada como a partição
Bij , i = 1, . . . , r, j = 1, . . . , s.
• pij = P (Bij ) é a probabilidade de obter uma observação na (i, j)-
Pr Ps
ésima parte da partição, tal que i=1 j=1 pij = 1.
• Oij denota o número de elementos da amostra que pertence a Bij ,
Pr Ps
tal que i=1 j=1 Oij = N .
• A estatística do teste é dada por

s
r X
X (Oij − Eij )2 H0
Q0 = ∼ χ2(r−1)(s−1) ,
i=1 j=1
Eij a

onde Eij = E(Oij |H0 ) = N p0ij .


NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 174/207

• A hipótese de independência entre X e Y é

H0 : pij = pi • × p• j , ∀ i, j.
• Sob H0 , os valores esperados da estatística são

Eij = N p0ij = N pi• × p•j .

Como pi• e p•j não são especificadas sob H0 , essas são substi-
O
tuídas pelas suas estimativas de MV: p̂i• = ONi• e p̂•j = N•j ,i.e.,
Oi• × O•j
Eij = ,
N
onde Oi• = sj=1 Oij e O•j = ri=1 Oij .
P P

• Note-se que o vector aleatório O = (O11 , . . . , Ors ) segue uma


distribuição Multinomial (N, p = (p11 , . . . , prs )) e que Oij ∼
Binomial(N, pij ), i = 1, . . . , r, j = 1, . . . , s.
NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 175/207
Exemplo 8.8: Um fabricante de automóveis suspeita que a venda dos
seus três últimos modelos está relacionada com o género dos seus com-
pradores. Com base na seguinte tabela de contingência envolvendo 500
compradores, teste a hipótese de independência entre os três modelos
de automóveis e o género dos compradores.

género modelo 1 modelo 2 modelo 3 total


masculino 160 140 40 340
feminino 40 60 60 160
total 200 200 100 500

Teste de hipóteses:
1. Hipóteses:
• H0 : pij = pi • × p• j , ∀ i, j
• H1 : pij 6= pi • × p• j , para algum i, j.

NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 176/207

P2 P3 (Oij −Eij )2 H0
2. Estatística do teste: Q0 = i=1 j=1 Eij
∼ χ2(2) ,
a
onde Eij = E(Oij |H0 ) = N p0ij
= Oi• × O•j /N . Por exemplo,
E11 = 200 × 340/500 = 136 e E23 = 100 × 160/500 = 32.
O valor observado da estatística (qui-quadrado de Pearson) é

(160 − 136)2 (60 − 32)2


q0 = + ··· + = 49.63.
136 32
3. Valor-p: P = P (Q0 > 49.63|H0 ) = 1.67 × 10−11 , com
2 (0.9995) = 15.2.
Fχ−1
(2)

4. Conclusão:
• Rejeita-se H0 para α ≥ 1.67 × 10−11 e aceita-se H0 no caso
contrário, i.e., há forte evidência a favor da dependência en-
tre a venda dos modelos de automóveis e género dos com-
pradores.
NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 177/207

Você também pode gostar