Você está na página 1de 17

4 Teste de hipóteses paramétricas

4.1 Introdução. Noções fundamentais.


Pretende-se estudar o comportamento probabilístico de determinada v.a. 𝑋, cuja distribuição, 𝐹,
apresenta características (“parâmetros”) desconhecidas.
Uma hipótese estatística é qualquer conjectura sobre características desconhecidas de 𝐹.

Exemplo
O tempo de vida de uma componente electrónica produzida segundo determinada tecnologia
considera-se uma v.a. 𝑋. Pode-se fazer as seguintes conjecturas (por exemplo):
 A função densidade de 𝑋 é um membro da família da distribuição exponencial,
𝑓 (𝑥; 𝜃) = 𝜃𝑒 −𝜃𝑥 , 𝑥 > 0, 𝜃 > 0.
 Admitindo que a duração das componentes segue uma distribuição exponencial, a sua média
é 600 horas.

1
Quando a forma da função de distribuição ou da função densidade/probabilidade é (suposta)
conhecida e a conjectura diz respeito apenas a parâmetro(s) da distribuição, a hipótese
estatística diz-se uma hipótese paramétrica. Quando a hipótese diz respeito à própria
distribuição da v.a., diz-se que se trata de uma hipótese não paramétrica.
No exemplo, a primeira conjectura é uma hipótese não paramétrica; a segunda conjectura é uma
hipótese paramétrica.

No caso paramétrico, o objectivo de um teste de hipótese consiste em decidir, com base na


informação fornecida pela amostra, sobre a rejeição ou a não rejeição de uma hipótese estatística.
A hipótese a testar designa-se hipótese nula—denota-se 𝐻0 . Usualmente, testa-se esta hipótese
contra uma hipótese alternativa—denotada 𝐻1 —que é aceite caso se rejeite 𝐻0 .

2
Exemplo
Pretende-se ajuizar se determinada moeda é equilibrada, isto é, se a probabilidade de saída de
“face”—𝜃, probabilidade de sucesso—é igual a probabilidade de saída de “coroa”, ambas iguais a
1⁄2. O resultado do lançamento de uma moeda, 𝑋, é uma v.a. que segue uma distribuição de
Bernoulli com parâmetro 𝜃, 0 < 𝜃 < 1.
A hipótese nula é 𝐻0 : 𝜃 = 1⁄2, e a hipótese alternativa é 𝐻1 : 𝜃 ≠ 1⁄2.
Se a hipótese a testar é a de que a probabilidade de sair “face” é superior ou igual à probabilidade
de sair “coroa”, tem-se 𝐻0 : 𝜃 ≥ 1⁄2, contra 𝐻1 : 𝜃 < 1⁄2.

O resultado de um teste de hipóteses consiste em aceitar ou rejeitar 𝐻0 , decisão que se toma com
base na informação fornecida por uma amostra. A rejeição (não rejeição) de 𝐻0 implica a não
rejeição (rejeição) de 𝐻1 .
Em muitos casos de interesse prático, recorre-se a uma estatística 𝑇(𝑋1 , 𝑋2 , … , 𝑋𝑛 ), designada
estatística de teste, e define-se a região de rejeição de 𝑯𝟎 ou região crítica, como o conjunto
de valores desta estatística, que conduzem à rejeição de 𝑯𝟎 .

3
Pode, pois, considerar-se os seguintes elementos de um teste de hipóteses:
 Hipótese nula, 𝐻0 .
 Hipótese alternativa, 𝐻1 , aceite se a hipótese nula é rejeitada.
 Estatística de teste, 𝑇 = 𝑇(𝑋1 , 𝑋2 , … , 𝑋𝑛 ).
 Região crítica (regra de rejeição de 𝐻0 ).

Ao decidir aceitar/rejeitar 𝐻0 , pode-se cometer um de dois tipos possíveis de erro (além de se


poder, obviamente, decidir correctamente):
 Rejeitar 𝐻0 , quando 𝐻0 é verdadeira: erro de 1ª espécie ou erro tipo I.
 Não rejeitar 𝐻0 , quando 𝐻0 é falsa: erro de 2ª espécie ou erro tipo II.

Decisão 𝑯𝟎 verdadeira 𝑯𝟎 falsa


Rejeitar 𝑯𝟎 Erro de 1ª espécie Decisão correcta
Não rejeitar 𝑯𝟎 Decisão correcta Erro de 2ª espécie

4
A probabilidade de cometer o erro de 1ª espécie designa-se dimensão ou nível do teste:
𝛼 = Pr(rejeitar 𝐻0 |𝐻0 verdadeira).
A probabilidade de cometer o erro de 2ª espécie vem dada por
1 − 𝛽 = Pr(não rejeitar 𝐻0 |𝐻0 falsa) ;
esta probabilidade não tem designação especial mas a probabilidade do acontecimento contrário
designa-se potência do teste: 𝛽 = Pr(rejeitar 𝐻0 |𝐻0 falsa).

Decisão 𝑯𝟎 verdadeira 𝑯𝟎 falsa


Rejeitar 𝑯𝟎 Erro de 1ª espécie Decisão correcta
Probabilidade = 𝛼 (dimensão) Probabilidade = 𝛽 (potência)
Não rejeitar 𝑯𝟎 Decisão correcta Erro de 2ª espécie
Probabilidade = 1 − 𝛼 Probabilidade = 1 − 𝛽

5
Só se consegue reduzir simultaneamente as probabilidades de ambos os tipos de erros
aumentando a dimensão da amostra; se não se aumenta a dimensão da amostra, deve optar-se
por uma solução de compromisso. Assume particular relevância a abordagem de Neyman-
Pearson: fixar a probabilidade associada ao erro de 1ª espécie e adoptar uma regra de decisão
que torna mínima a probabilidade do erro de 2ª espécie; ou seja, fixar a dimensão do teste e
maximizar a sua potência. De acordo com esta abordagem, é desejável que a probabilidade do
erro de 1ª espécie seja reduzida (por exemplo, 0,01, 0,05, 0,1, …), porque se considera mais grave
a possibilidade de rejeitar incorrectamente a hipótese nula (esta é a hipótese a defender, salvo
evidência convincente do contrário). O valor escolhido para 𝛼 depende da importância que se
atribui ao facto de rejeitar 𝐻0 , sendo esta verdadeira.

Hipótese simples. Hipótese composta.


A hipótese estatística diz-se simples se se refere a um único valor do parâmetro (ou um valor
isolado para cada um dos parâmetros) de interesse; de contrário, a hipótese diz-se composta.

6
Exemplo
𝑋 ~ 𝒫ℴ(𝜆); 𝐻0 : 𝜆 = 143 (hipótese simples), 𝐻1 : 𝜆 ≠ 143 (hipótese composta bilateral).
𝑋 ~ 𝒫ℴ(𝜆); 𝐻0 : 𝜆 ≤ 143 (hipótese composta unilateral esquerda), 𝐻1 : 𝜆 > 143 (hipótese
composta unilateral direita).
𝑋 ~ 𝒩 (𝜇, 𝜎 2 ); 𝐻0 : 𝜇 = 10, 𝜎 2 = 4 (hipótese simples), 𝐻1 : 𝜇 ≠ 10, 𝜎 2 > 4 (hipótese composta).

Hipótese nula simples contra hipótese alternativa composta (unilateral)


𝐻0 : 𝜃 = 𝜃0 contra 𝐻1 : 𝜃 > 𝜃0 (ou 𝐻1 : 𝜃 < 𝜃0 ).
Continua-se a pretender determinar uma região crítica, dada a probabilidade do erro de tipo I.
Todavia, com hipótese alternativa composta, não se pode falar de um valor único da potência do
teste, pois a probabilidade de rejeitar 𝐻0 quando esta é falsa depende do valor de 𝜃 (no conjunto
de valores da hipótese alternativa—seja Θ1 este conjunto). Donde, deve-se introduzir o conceito
de função potência (função do valor de 𝜃).
A função potência do teste 𝐻0 : 𝜃 = 𝜃0 contra 𝐻1 : 𝜃 > 𝜃0 (ou contra 𝐻1 : 𝜃 < 𝜃0 ) é dada por
𝛽(𝜃) = Pr(rejeitar 𝐻0 |𝜃 ), para 𝜃 ∈ Θ1 , Θ1 = ]𝜃0 , +∞[ ( ou Θ1 = ]−∞, 𝜃0 [ ).

7
Valor-𝒑

Quando se reporta a conclusão de um teste, tudo se resume a afirmar se se rejeita a hipótese nula
ou não, sem se referir se o valor da estatística de teste está longe ou perto dos limiares da região
de rejeição. O recurso ao conceito de valor-𝑝 permite reportar o resultado do teste de modo mais
informativo, deixando ao critério do leitor a conclusão do teste (aceitar ou rejeitar 𝐻0 ).

Seja 𝑇(𝑥1 , … , 𝑥𝑛 ) = 𝑡obs o valor observado da estatística de teste, a partir da amostra particular,
(𝑥1 , … , 𝑥𝑛 ). O valor-𝑝 associado a 𝑡obs é a probabilidade, calculada supondo 𝐻0 verdadeira (“sob
𝐻0 ”), de obter um valor mais desfavorável para a hipótese nula do que 𝑡obs . Donde, um valor-𝑝
“elevado” fornece indicação para aceitar 𝐻0 ; um valor-𝑝 “reduzido” sugere rejeitar 𝐻0 .

A consideração de valor-𝑝 como “elevado”/“reduzido” depende do nível de significância do


investigador (seja 𝛼 este nível de significância). Se valor-𝑝 < 𝛼, 𝐻0 é rejeitada (o investigador
considera o valor-𝑝 como reduzido); se valor-𝑝 > 𝛼, 𝐻0 não é rejeitada (o investigador considera
o valor-𝑝 como elevado).

Quanto ao modo concreto de cálculo do valor-𝑝, este depende do tipo de teste.


8
4.2 População normal: teste da média e teste da variância.
População 𝑋 ~ 𝒩 (𝜇, 𝜎 2 ); amostra casual de dimensão 𝑛, (𝑋1 , … , 𝑋𝑛 ). Dimensão do teste: 𝛼.
Seja 𝑞𝛿 : quantil de ordem 𝛿.

Testes de hipóteses a respeito da média, 𝑯𝟎 : 𝝁 = 𝝁𝟎 (variância , 𝝈𝟐 , conhecida).


Estatística de teste ̅ − 𝝁𝟎 )⁄(𝝈⁄√𝒏) ~ 𝓝(𝟎, 𝟏).
𝒁 = (𝑿
𝑯𝟎

Seja 𝒛𝐨𝐛𝐬 = (𝒙
̅ − 𝝁𝟎 )⁄(𝝈⁄√𝒏); regra de rejeição de 𝐻0 contra (ver gráficos nas págs. 11, 12)
𝐻1 : 𝜇 > 𝜇0 Rejeita-se 𝐻0 , se 𝑧obs > 𝑞1−𝛼 ⇔ 𝑥̅ > 𝜇0 + 𝑞1−𝛼 𝜎⁄√𝑛
Valor-𝑝 = Pr(𝑍 ≥ 𝑧obs |𝜇 = 𝜇0 ).
𝐻1 : 𝜇 < 𝜇0 Rejeita-se 𝐻0 , se 𝑧obs < 𝑞𝛼 ⇔ 𝑥̅ < 𝜇0 + 𝑞𝛼 𝜎⁄√𝑛
Valor-𝑝 = Pr(𝑍 ≤ 𝑧obs |𝜇 = 𝜇0 ).
𝐻1 : 𝜇 ≠ 𝜇0 Rejeita-se 𝐻0 , se |𝑧obs | > 𝑞1−𝛼⁄2 ⇔
𝑥̅ < 𝜇0 − 𝑞1−𝛼⁄2 𝜎⁄√𝑛 ∨ 𝑥̅ > 𝜇0 + 𝑞1−𝛼⁄2 𝜎⁄√𝑛
Valor-𝑝 = 2 × Pr(𝑍 ≥ |𝑧obs | | 𝜇 = 𝜇0 ).

9
Exemplo
Numa linha de engarrafamento de azeite a quantidade vertida em cada garrafa, em decilitros, é
uma v.a. 𝑋 ~ 𝒩 (𝜇, 𝜎 2 ), admitindo-se numa primeira fase 𝜎 2 conhecido, igual a 0,5. O processo de
enchimento considera-se regulado quando 𝜇 = 10 (𝐻0 ), não se desejando grandes desvios, nem
para cima nem para baixo (hipótese alternativa, 𝐻1 : 𝜇 ≠ 10). Para controlar o processo, escolhe-
se ao acaso 𝑛 = 20 garrafas da produção diária. Fixa-se a dimensão do teste em 𝛼 = 0,05.
Obtém-se 𝑞1−𝛼⁄2 = 𝑞0,975 = 1,96. Donde, a região crítica vem dada por {𝑧: 𝑧 < −1,96 ∨ 𝑧 >
1,96} ou de modo equivalente {𝑥̅ : 𝑥̅ < 9,69 ∨ 𝑥̅ > 10,31}.
Ou seja, se 𝑥̅ < 9,69 ou 𝑥̅ > 10,31, rejeita-se 𝐻0 (o processo é considerado desregulado,
carecendo de revisão).

10
Testes de hipóteses a respeito da média, 𝑯𝟎 : 𝝁 = 𝝁𝟎 (variância , 𝝈𝟐 , desconhecida).

Estatística de teste ̅ − 𝝁𝟎 )⁄(𝑺′ ⁄√𝒏) ~ 𝓽𝒏−𝟏 .


𝑻 = (𝑿
𝑯𝟎

Seja 𝒕𝐨𝐛𝐬 = (𝒙
̅ − 𝝁𝟎 )⁄(𝒔′ ⁄√𝒏); regra de rejeição de 𝐻0 , contra

𝐻1 : 𝜇 > 𝜇0 Rejeita-se 𝐻0 , se 𝑡obs > 𝑞1−𝛼 ⇔ 𝑥̅ > 𝜇0 + 𝑞1−𝛼 𝑠 ′ ⁄√𝑛

Valor-𝑝 = Pr(𝑇 ≥ 𝑡obs |𝜇 = 𝜇0 ).

11
𝐻1 : 𝜇 < 𝜇0 Rejeita-se 𝐻0 , se 𝑡obs < 𝑞𝛼 ⇔ 𝑥̅ < 𝜇0 + 𝑞𝛼 𝑠 ′ ⁄√𝑛

Valor-𝑝 = Pr(𝑇 ≤ 𝑡obs |𝜇 = 𝜇0 ).

𝐻1 : 𝜇 ≠ 𝜇0 Rejeita-se 𝐻0 , se |𝑡obs | > 𝑞1−𝛼⁄2 ⇔


𝑥̅ < 𝜇0 − 𝑞1−𝛼⁄2 𝑠 ′ ⁄√𝑛 ∨ 𝑥̅ > 𝜇0 + 𝑞1−𝛼⁄2 𝑠 ′ ⁄√𝑛

Valor-𝑝 = 2 × Pr(𝑇 ≥ |𝑡obs | | 𝜇 = 𝜇0 ).


12
Exemplo
No exemplo anterior admita-se que 𝜎 2 é desconhecido; 𝑞1−𝛼⁄2 = 𝑞0,975 = 2,093. A região crítica
2
é {𝑡: 𝑡𝑜𝑏𝑠 < −2,093 ∨ 𝑡𝑜𝑏𝑠 > 2,093}. Se na amostra 𝑥̅ = 9,65, 𝑠 ′ = 0,64, aceita-se 𝐻0 (𝑡obs =
−1,957) (no exemplo anterior, com 𝜎 2 = 0,5 conhecido, rejeitava-se 𝐻0 ).

13
Testes de hipóteses a respeito da variância, 𝑯𝟎 : 𝝈𝟐 = 𝝈𝟐𝟎 .

𝟐
Estatística de teste: 𝑸 = (𝒏 − 𝟏)𝑺′ ⁄𝝈𝟐𝟎 ~ 𝝌𝟐𝒏−𝟏 .
𝑯𝟎

2
Seja 𝑄obs = (𝑛 − 1)𝑠 ′ ⁄𝜎02 ; regra de rejeição de 𝐻0 , contra

2
𝐻1 : 𝜎 2 > 𝜎02 Rejeita-se 𝐻0 , se 𝑄obs > 𝑞1−𝛼 ⇔ 𝑠 ′ > 𝑞1−𝛼 𝜎02 ⁄(𝑛 − 1)

Valor-𝑝 = Pr(𝑄 ≥ 𝑄obs |𝜎 2 = 𝜎02 ).

14
2
𝐻1 : 𝜎 2 < 𝜎02 Rejeita-se 𝐻0 , se 𝑄obs < 𝑞𝛼 ⇔ 𝑠 ′ < 𝑞𝛼 𝜎02 ⁄(𝑛 − 1)

Valor-𝑝 = Pr(𝑄 ≤ 𝑄obs |𝜎 2 = 𝜎02 ).

𝐻1 : 𝜎 2 ≠ 𝜎02 Rejeita-se 𝐻0 , se 𝑄obs > 𝑞1−𝛼⁄2 ∨ 𝑄obs < 𝑞𝛼⁄2 ⇔


2 2
𝑠 ′ > 𝑞1−𝛼⁄2 𝜎02 ⁄(𝑛 − 1) ∨ 𝑠 ′ < 𝑞𝛼⁄2 𝜎02 ⁄(𝑛 − 1)
Valor-𝑝 = 2 vezes o menor dos valores-𝑝 anteriores.
Exemplo
Na situação anterior, suponha-se que se pretende testar 𝐻0 : 𝜎 2 = 0,5 contra 𝐻1 : 𝜎 2 > 0,5, para
2
uma dimensão de 0,025; da distribuição 𝜒19
2
, vem 𝑞0,975 = 32,8523. Tendo-se obtido 𝑠 ′ = 0,64,
vem 𝑄obs = 19 × 0,64⁄0,5 = 24,32 e não se rejeita 𝐻0 . O valor-𝑝 correspondente é 0,18416.

15
4.3 População não normal ou não especificada—testes a respeito da média.
Se a população não é normal, ou não especificada, e se pretende realizar um teste de hipóteses a
respeito da média, não se dispõe, muitas vezes, da distribuição amostral exacta da estatística de
teste. Mesmo assim, em muitas situações, se a amostra é de grande dimensão pode-se obter um
resultado aproximado recorrendo ao TLC,
𝑛
(𝑋̅ − 𝜇)⁄(𝜎⁄√𝑛) = (∑ 𝑋𝑖 − 𝑛𝜇)⁄(𝜎√𝑛) ~̇ 𝒩 (0,1).
𝑖=1

Se a variância da população é desconhecida, mostra-se que também (𝑋̅ − 𝜇)⁄√𝜎̂ 2 ⁄𝑛 ~̇ 𝒩 (0,1),


em que 𝜎̂ 2 é um estimador consistente de 𝜎 2 —por exemplo, a variância corrigida da amostra,
(𝑋̅ − 𝜇)⁄(𝑆 ′ ⁄√𝑛) ~̇ 𝒩 (0,1) .
Exemplo
População desconhecida; 𝐻0 : 𝜇 = 200 contra 𝐻1 : 𝜇 > 200.
Observada uma amostra de dimensão 𝑛 = 400, obtém-se 𝑥̅ = 197,5, 𝑠 ′ = 68,5. Nestas condições,
𝑧obs = (197,5 − 200)⁄(68,5⁄√400) = −0,73.
Valor-𝑝: Pr[(𝑋̅ − 𝜇)⁄(𝑆 ′ ⁄√𝑛) > −0,73|𝜇 = 200] ≈ 1 − Φ(−0,73) = 0,7673—não se rejeita 𝐻0 .
16
Em muitos casos de interesse prático, a população é conhecida e envolve só um parâmetro
desconhecido. Obviamente, se existirem, a média e variância dependem apenas deste parâmetro.

Exemplo
𝑋 ~ Bernoulli(𝜃); E(𝑋) = 𝜃, V(𝑋) = 𝜃 (1 − 𝜃); 𝐻0 : 𝜃 = 𝜃0 .
Pode-se utilizar qualquer das formas da estatística de teste,
𝑛
(𝑋̅ − 𝜃0 )⁄√𝜃0 (1 − 𝜃0 )⁄𝑛 = (∑ 𝑋𝑖 − 𝑛𝜃0 )⁄√𝑛𝜃0 (1 − 𝜃0 ) ,
𝑖=1

assintoticamente 𝒩 (0,1) sob 𝐻0 .

Exemplo
𝑋 ~ 𝒫ℴ(𝜆); 𝜆 = E(𝑋) = V(𝑋); 𝐻0 : 𝜆 = 𝜆0 .
Pode-se utilizar qualquer das formas da estatística de teste,
𝑛
(𝑋̅ − 𝜆0 )⁄√𝜆0 ⁄𝑛 = (∑ 𝑋𝑖 − 𝑛𝜆0 )⁄√𝑛𝜆0 ,
𝑖=1

assintoticamente 𝒩 (0,1) sob 𝐻0 .


17

Você também pode gostar