Você está na página 1de 9

2.

2 – TESTE DOS QUANTIS


2.2.1 - INTRODUÇÃO
O teste binomial pode ser usado para testar hipóteses relativas a quantis de
variáveis aleatórias.
Suponha que queiramos examinar uma amostra aleatória de uma variável aleatória X
para ver se sua mediana é igual a x*. Isto significa que, se a mediana for x*, espera-se que
50% das observações desta amostra aleatória caia abaixo de x*. Se fosse criada uma
amostra aleatória de Y, associada à amostra de X, de modo que, se Xi ≤ x*, Yi = 1 e é igual a
n
0 caso contrário, pode-se olhar a estatística ∑ Yi para o teste sobre a mediana pois, sob
i =1
n
H0, se x* for a mediana de X, ∑ Yi ~ Binomial(n,0,5).
i =1
Para o teste sobre os quantis, a escala de mensuração da variável de interesse deve
ser, no mínimo, ordinal. Apesar do teste binomial aceitar dados em escala nominal, não há
significado para quantis para os dados em escala nominal de mensuração.
Suponha que X seja uma variável aleatória contínua (ou seja, a probabilidade no ponto
é zero). Neste caso, a hipótese a ser testada seria:
H0: O quantil p* de X é x*
Esta hipótese é equivalente a
H0: P{X ≤ x*} = p*
pela definição de quantil. Olhando o resultado do experimento como uma variável aleatória
Bernoulli, onde sucesso seria Xi ≤ x*, então gostaríamos de testar
H0: p = p*
ou seja, recairíamos no teste binomial já visto. A estatística de teste seria o nº de
sucessos, ou seja, o nº de variáveis da amostra menores ou iguais a x*, e podemos usar o
teste binomial bilateral.
Quando a distribuição não é contínua, a situação não é tão simples, pois podem
existir pontos de “pulos” na distribuição acumulada em variáveis aleatórias discretas ou
mistas.
A hipótese nula
H0: O quantil p* de X é x*
passa a ser equivalente a
H0: P{X ≤ x*} ≥ p* e P{X < x*} ≤ p*

Por exemplo, se em uma distribuição quiséssemos encontrar a mediana, e observássemos


que a probabilidade acumulada até 3 é 0,4 e a probabilidade acumulada até 4 é 0,6,
P{X ≤ 4} = 0,6 ≥ 0,5 e P{X < 4*} = P{X ≤ 3} = 0,4 ≤ 0,5.

Assim, precisa-se fazer uma pequena adaptação do teste binomial para contemplar
estes casos, que será chamado de TESTE DOS QUANTIS.

1
2.2.2 – TESTE DOS QUANTIS

REQUISITOS NECESSÁRIOS
1) Seja X1,...,Xn uma amostra aleatória de uma variável aleatória X.
2) A variável aleatória X tem escala de mensuração, no mínimo, ordinal.

HIPÓTESES POSSÍVEIS, ESTATÍSTICA DE TESTE, FORMA DO TESTE E P-VALOR


A hipótese nula
H0: O quantil p* de X é x*, para 0 < p* < 1
é equivalente à hipótese
H0: P{X ≤ x*} ≥ p* e P{X < x*} ≤ p*
como já foi visto anteriormente. Se x* for mesmo o quantil p* da população, espera-se que
“cerca de” np* observações estejam abaixo de x* e “cerca de” n(1 - p*) observações
T T
estejam acima de x*. Para estimar P{X ≤ x*} e P{X < x*} pode-se usar 1 e 2 ,
n n
respectivamente, onde
T1 = nº de observações da amostra menores ou iguais a x*
T2 = nº de observações da amostra menores a x*
Usa-se, então, T1 e T2 como estatísticas de teste.

TESTE BILATERAL
H0: O quantil p* de X é x*, para 0 < p* < 1 × H1: O quantil p* de X não é igual a x*

Isto é equivalente a

H0: P{X ≤ x*} ≥ p* e P{X < x*} ≤ p* × H1: P{X ≤ x*} < p* ou P{X < x*} > p*
O teste para estas hipóteses terá a forma: rejeita-se H0 se, e somente se, t1 ≤ c1 ou
t2 > c2.
Como encontrar c1 e c2?
Para amostras pequenas (n ≤ 20)
Sob H0, T1 e T2 terão distribuição Binomial(n,p*). Assim, precisa-se usar a
distribuição exata para encontrar c1 e c2, conforme o α fixado. Neste caso, c1 será tal que
α α
P{T1 ≤ c1 } ≈ , sem ultrapassar e c2 será tal que P{T2 ≤ c2 } ≈ 1 − , chegando ao menor
2 2
α
inteiro tal que esta probabilidade ultrapasse ligeiramente 1 − .
2

Para amostras suficientemente grandes (n > 20)

2
Em casos onde a amostra é suficientemente grande, pode-se usar a aproximação
α
normal. Assim, seja z α o  1 −  quantil da normal padrão. Então, para o teste bilateral,
1−  2
2

1−
( ) 1−
( )
c1 e c2 serão dados por c1 = np * − z α np * 1 − p * e c2 = np * + z α np * 1 − p * .
2 2
Como encontrar o p-valor?
O p-valor deste teste é obtido pela menor das seguintes probabilidades:
2P{T ≤ t1 }
p − valor = 
2P{T > t2 }
onde T ~ Binomial(n,p*). Quando n ≤ 20, deve ser usada esta distribuição exata, mas se
n > 20, pode-se usar a aproximação normal com correção de continuidade, ou seja, o p-valor
será a menor das seguintes probabilidades:
  * 
2P{T ≤ t } ≈ 2PZ ≤ t1 − np + 0,5 
( )
 1  
* * 
 
 np 1 − p 
p − valor = 
  
 t2 − np * − 0,5 
2P{T ≥ t2 } ≈ 2PZ ≥
( )

  np *
1 − p * 
 

TESTE UNILATERAL INFERIOR


H0: O quantil p* de X é menor ou igual a x*, para 0 < p* < 1 × H1: O quantil p* de X é
maior do que x*

Isto é equivalente a

H0: P{X ≤ x*} ≥ p* × H1: P{X ≤ x*} < p*


O teste para estas hipóteses terá a forma: rejeita-se H0 se, e somente se, t1 ≤ c1.
Como encontrar c1?
Para amostras pequenas (n ≤ 20)
Sob H0, T1 terá distribuição Binomial(n,p*). Assim, precisa-se usar a distribuição
exata para encontrar c1, conforme o α fixado. Neste caso, c1 será tal que P{T1 ≤ c1 } ≈ α ,
sem ultrapassar.

Para amostras suficientemente grandes (n > 20)


Em casos onde a amostra é suficientemente grande, pode-se usar a aproximação
normal. Assim, seja z1 − α o (1 − α ) quantil da normal padrão. Então, para este teste, c1 será
( )
dado por c1 = np * − z1 − α np * 1 − p * .
Como encontrar o p-valor?
O p-valor deste teste é obtido por p − valor = P{T ≤ t1 }

3
onde T ~ Binomial(n,p*). Quando n ≤ 20, deve ser usada esta distribuição exata, mas se
n > 20, pode-se usar a aproximação normal com correção de continuidade, ou seja, o p-valor
 
 t1 − np * + 0,5 
será dado por p − valor = P{T ≤ t1 } ≈ P Z ≤
( )
.
* * 
 np 1 − p 

TESTE UNILATERAL SUPERIOR


H0: O quantil p* de X é maior ou igual a x*, para 0 < p* < 1 × H1: O quantil p* de X é menor do
que x*

Isto é equivalente a

H0: P{X ≤ x*} ≤ p* × H1: P{X ≤ x*} > p*

O teste para estas hipóteses terá a forma: rejeita-se H0 se, e somente se, t2 > c2.
Como encontrar c2?
Para amostras pequenas (n ≤ 20)
Sob H0, T2 terá distribuição Binomial(n,p*). Assim, precisa-se usar a distribuição
exata para encontrar c2, conforme o α fixado. Neste caso, c2 será tal que
P{T2 ≤ c2 } ≈ 1 − α , chegando ao menor inteiro tal que esta probabilidade ultrapasse
ligeiramente 1 − α .

Para amostras suficientemente grandes (n > 20)


Em casos onde a amostra é suficientemente grande, pode-se usar a aproximação
normal. Assim, seja z1 − α o (1 − α ) quantil da normal padrão. Então, para este teste , c2 será

( )
dado por c2 = np * + z1 − α np * 1 − p * .
Como encontrar o p-valor?
O p-valor deste teste é obtido por p − valor = P{T > t2 }
onde T ~ Binomial(n,p*). Quando n ≤ 20, deve ser usada esta distribuição exata, mas se
n > 20, pode-se usar a aproximação normal com correção de continuidade, ou seja, o p-valor
 
 t2 − np * − 0,5 
será dado por p − valor = P{T ≥ t2 } ≈ PZ ≥
( )

 * * 
np 1 − p 

EXEMPLOS
EXEMPLO 1:
Calouros têm sido submetidos a um determinado teste de aproveitamento do ensino
médio durante vários anos, e o quartil superior foi estabelecido como o escore 193.
Uma determinada escola de ensino médio enviou 15 de seus formandos a essa
faculdade, onde fizeram o exame. Os resultados estão a seguir:

4
189 233 195 160 212
176 231 185 199 213
202 193 166 174 248

Assume-se que estes 15 estudantes representam uma amostra aleatória de todos os


alunos do colégio que irão começar a faculdade. Gostaríamos de testar se esta escola vem
ou não de uma população com quartil superior 193.
TESTE BILATERAL:
H0: O quantil 0,75 é 193 × H1: O quantil 0,75 não é igual a 193.
Estas hipóteses podem ser escritas como:
H0: P{X ≤ 193} ≥ 0,75 e P{X < 193} ≤ 0,75 × H1: P{X ≤ 193} < 0,75 ou P{X < 193} > 0,75
O teste para estas hipóteses terá a forma: rejeita-se H0 se, e somente se, t1 ≤ c1 ou
t2 > c2, onde T1 = t1 é o nº de observações da amostra menores ou iguais a 193 e T2 = t2 é o
nº de observações da amostra menores a 193.
Para encontrarmos c1 e c2, como a amostra é pequena (n = 15 ≤ 20), usa-se a solução
para amostras pequenas. Sob H0, T1 e T2 terão distribuição Binomial(15,0,75). Assim,
precisa-se usar a distribuição exata para encontrar c1 e c2, conforme o α fixado. Neste
caso, para α = 0,05, c1 será tal que P{T1 ≤ c1 } ≈ 0,025 , sem ultrapassar e c2 será tal que
P{T2 ≤ c2 } ≈ 0,975 , chegando ao menor inteiro tal que esta probabilidade ultrapasse
ligeiramente 0,975.
Observando a distribuição acumulada da Binomial(15,0,75), para k = 0,...,15, temos
k P{X <= k}
0 0,000000
1 0,000000
2 0,000001
3 0,000012
4 0,000115
5 0,000795
6 0,004193
7 0,017300
8 0,056620
9 0,148368
10 0,313514
11 0,538713
12 0,763912
13 0,919819
14 0,986637
15 1,000000
e podemos perceber que c1 = 7 e c2 = 14. Assim, rejeita-se H0 se e somente se t1 ≤ 7 ou
t2 > 14.
Pelos resultados da pesquisa, nota-se que t1 = 7 e t2 = 6. Logo, rejeita-se H0, pois
t1 ≤ 7.
5
Para encontrarmos o p-valor, encontra-se a menor destas duas probabilidades:
2P{T ≤ t1 } = 2P{T ≤ 7}
p − valor = 
2P{T > t2 } = 2P{T > 6}
Neste caso, p − valor = 2P{T ≤ t1 } = 2P{T ≤ 7} = 2 × 0,0173 = 0,0346 < 0,05 .
Rejeita-se H0.

EXEMPLO 2:
Foram registrados 112 intervalos de tempo entre erupções de um gêiser para se
analisar se o intervalo mediano é menor ou igual a 60 min ou se este intervalo é maior do
que 60 min. Dos 112 intervalos, 8 são menores ou iguais a 60 min.
Neste caso, queremos realizar o teste UNILATERAL INFERIOR, ou seja, queremos testar
H0: O quantil 0,5 de X é menor ou igual a 60, para 0 < p* < 1 × H1: O quantil 0,5 de
X é maior do que 60. Isto é equivalente a

H0: P{X ≤ 60} ≥ 0,5 × H1: P{X ≤ 60} < 0,5


O teste para estas hipóteses terá a forma: rejeita-se H0 se, e somente se, t1 ≤ c1,
onde T1 = t1 é o nº de observações da amostra menores ou iguais a 60.
Como neste caso a amostra é suficientemente grande (n = 112), pode-se usar a
aproximação normal. Assim, seja z0,95 = 1,644854 o (0,95 ) quantil da normal padrão. Então,
para este teste, c1 será dado por
( )
c1 = np * − z1−α np * 1 − p * = 112 × 0,5 − 1,644854 112 × 0,5 × 0,5 = 47,29625 .
Então, o teste de nível aproximado 5% rejeita H0 se, e somente se, t1 ≤ 47,29625.
Como t1 = 8, rejeita-se a hipótese de que o intervalo mediano é menor ou igual a 60min.
Para encontrarmos o p-valor, calcula-se p − valor = P{T ≤ t1 }, onde
T ~ Binomial(112,0,5). Como n > 20, pode-se usar a aproximação normal com correção de
continuidade, ou seja,
 t − np * + 0,5   8 − 112 × 0,5 + 0,5 

p − valor = P{T ≤ t1 } ≈ P Z ≤ 1  = P Z ≤  = P{Z ≤ -8.98} ≈ 0,00
 np *
(
1 − p )
*
 
 112 × 0,5 2

Assim, como o p-valor é muito pequeno, rejeita-se H0.

2.2.3 – INTERVALO DE CONFIANÇA PARA UM QUANTIL


Vamos supor uma amostra aleatória X1,...,Xn. A escala de mensuração da observação
de interesse é, no mínimo, ordinal.
Define-se X(1) ≤ X(2) ≤ ... ≤ Xr ≤ ... ≤ X(s) ≤ ... ≤ X(n) como as estatísticas de ordem da
amostra, que correspondem à amostra ordenada, onde 1 ≤ r ≤ s ≤ n. Gostaríamos de definir
um intervalo de confiança para o quantil p* desconhecido, onde p* é algum valor entre 0 e 1.

MÉTODO A: PARA n ≤ 20

Sejam X(1), ..., X(n) as estatísticas de ordem de uma amostra aleatória X1,...,Xn da
função de distribuição FX(●). A distribuição marginal de X(i) é dada por:
6
{ } ∑ nj [FX (k )]j [1 − FX (k )]n−j
n
FX(i) (k ) = P X(i) ≤ k =
  j=i

{ } { }
Gostaríamos de encontrar um intervalo de confiança (X(r);X(s)) tal que
P X(r ) ≤ X * ≤ X(s ) ≥ 1 − α e se a distribuição for contínua, P X(r ) ≤ X * ≤ X(s ) = 1 − α .
} {
p p

Assim, se queremos r e s tais que 1 − α ≤ P X(r ) ≤ X ≤ X(s ) ,


p*

1 − α ≈ P{X ≤ X ≤ X } = P{X ≤ X e X ≥ X } = 1 − P{X > X ou X < X } =


devemos encontrar
(r ) (s ) (r ) (s ) (r ) (s )

= 1 − P{ X < X }− P{X > X } = P{ X ≥ X }− P{X > X }


p* p* p* p* p*

(s ) (r ) (s ) (r )

Se a distribuição de X for contínua, P{ X ≥ X } = P{X > X } e, então,


p* p* p* p*

(s ) (s )

1 − α ≈ P{X ≤ X ≤ X } ≈ P{ X > X }− P{X > X } =


p* p*

(r ) p* (s ) (s ) p* (r ) p*

( ) 
( )
n−j 
( ) ( )
n n  j n n  j s −1 n r −1  n  j
 = ∑  p * 1 − p *
n−j j n−j n− j
= 1 − ∑  p * 1 − p * −  1 − ∑  p * 1 − p *   − ∑  p * 1 − p *
j= s  j 
 j= r  j 
 j= 0  j  =0  j 
  144424443 j1 44424443
α α
Fazer esta soma ser ≈ 1− Fazer esta soma ser ≈
2 2
α
Assim, s será tal que a Binomial(n,p*) acumulada até s-1 seja próxima de 1 − e r
2
α
será tal que a Binomial(n,p*) acumulada até r-1 seja próxima de
.
2
Pode-se encontrar estes valores usando a tabela A3 do Conover ou usando a função
de distribuição acumulada pbinom(k,n,p*) do R.
OBS: Repare que os valores de r e s encontrados são ordens. A estimativa do intervalo de
confiança de 100(1-α)% para o p*-quantil é dado por (x(r),x(s)).

MÉTODO B: PARA n > 20


Para n > 20, pode-se usar a aproximação normal (pelo TCL). Assim, teremos
r * = np * − z
1−
α (
np * 1 − p * )
2

s * = np * + z
1−
α (
np * 1 − p * )
2
α
onde z α é o  1 −  quantil da normal padrão.
1−
2
 2
OBS: De novo, os valores de r e s a serem encontrados serão ordens. Neste caso, eles
serão iguais aos inteiros mais próximos maiores do que r* e s* encontrados. A estimativa do
intervalo de confiança de 100(1-α)% para o p*-quantil é dado por (x(r),x(s)).

OBS: Os intervalos de confiança unilaterais podem ser encontrados usando-se apenas r ou


s.

7
EXEMPLOS
EXEMPLO 1:
Dezesseis transistores são selecionados aleatoriamente de um grande lote de
transistores, e foram testados. Foi registrado o número de horas até a falha de cada
transistor. Gostaríamos de obter um intervalo de confiança para o quartil superior, com um
coeficiente de confiança próximo a 90%.
46,9 47,2 49,1 56,5
56,8 59,2 59,9 63,2
63,3 63,4 63,7 64,1
67,1 67,7 73,3 78,5

Assim, s será tal que a Binomial(16,0,75) acumulada até s-1 seja próxima de 0,95 e r
será tal que a Binomial(16,0,75) acumulada até r-1 seja próxima de 0,05.
Vamos, então, ver a distribuição acumulada da Binomial(16,0,75):
k Prob.Acumul.
0 0,00000
1 0,00000
2 0,00000
3 0,00000
4 0,00004
5 0,00029
6 0,00164
7 0,00747
8 0,02713
9 0,07956
10 0,18965
11 0,36981
12 0,59501
13 0,80289
14 0,93652
15 0,98998
16 1,00000
Pode-se, então, observar que s-1 = 14 s = 15 e r-1 = 8 r = 9. Logo, a estimativa do
intervalo de confiança de 90% para o quartil superior é dado por (x(9),x(15)), ou seja,
.( 63,3,73,3 )

8
EXERCÍCIOS DO TESTE DOS QUANTIS
CONOVER – SEÇÃO 3.2 – EXERCÍCIOS
1) Uma amostra aleatória de alunos de uma série resultou nos seguintes 20 pesos
observados:
142 134 98 119 131
103 154 122 93 137
86 119 161 144 158
165 81 117 128 103
Teste a hipótese de que a mediana dos pesos é 103.
2) No exercício 1, teste a hipótese de que o quartil superior é, no mínimo, 150.
3) No exercício 1, teste a hipótese de que o 3º decil não é maior do que 100.
4) No exercício 1, encontre um IC aproximado de 90% para a mediana. Qual é o
coeficiente de confiança exato? Compare também o resultado usando o método
exato com os resultados obtidos usando a aproximação para grandes amostras.
5) Deseja-se projetar um determinado automóvel para que se permita altura suficiente
para acomodar confortavelmente os 95% motoristas mais baixos da população (ou
seja, exceto os 5% mais altos). Estudos anteriores indicaram que o percentil 95 era
de 70,3 polegadas. Para comprovar se estes estudos ainda são válidos, selecionou-se
uma amostra aleatória de tamanho 100. Encontrou-se que as 12 pessoas mais altas
na amostra tinham as seguintes alturas: 72,6; 70,8; 71,1; 70,0; 76,0; 70,6; 71,3;
70,1; 71,9; 70,5; 72,5; 72,8. É razoável usar 70,3 como quantil 0,95?
6) No exercício 5, qual o IC de 95% para o percentil 95 de motoristas dos quais a
amostra foi selecionada?
7) O sargento recorda que “nos bons tempos”, o quartil superior para o tempo
necessário para se completar um circuito de obstáculos era de 42 minutos. Ele
suspeita que os novos recrutas não estão tão em forma como os recrutas de
antigamente, então ele mediu o tempo necessário para completarem o circuito de
obstáculos. O sargento observou que de 38 recrutas, apenas 10 completaram o
circuito dentro dos 42 minutos. Use o teste dos quantis para testar a hipótese de
que o quartil superior é de 42 minutos contra a alternativa unilateral apropriada.
8) Uma blindagem com espessura de 10 cm está sendo testada para ver quão
profundamente um dado projétil iria penetrar nesta blindagem. 50 projéteis foram
disparados na blindagem, e foi anotada a profundidade em que eles chegaram na
blindagem. 7 dos projéteis fizeram um buraco, logo a profundidade foi registrada
como 10+. Todos os 50 valores, do menor para o maior, são:
5,37 3,39 5,42 5,51 5,63 5,74 5,82 5,83 5,94 5,98
6,07 6,07 6,13 6,20 6,21 6,23 6,25 6,26 6,26 6,28
6,29 6,31 6,35 6,41 6,57 6,67 6,81 7,03 7,40 7,44
7,82 8,03 8,11 8,44 8,51 8,72 8,83 9,04 9,33 9,51
9,61 9,68 9,82 10+ 10+ 10+ 10+ 10+ 10+ 10+
Encontre um intervalo de confiança de 95% para a profundidade mediana dos projéteis
na blindagem.

Você também pode gostar