04 Teste Do Sinal

2.
3 – TESTE DO SINAL (PARA DADOS PAREADOS)

2.3.1 - INTRODUÇÃO
Vamos ver agora o mais antigo dos testes não paramétricos: o TESTE DO SINAL.
O Teste do Sinal é um teste binomial, com p* = 0,5. Mas o Teste do Sinal merece
consideração especial por sua versatilidade, pelo tempo que ele vem sendo usado (é de
1710) e porque p* = 0,5 = 1 - p*, o que faz dele um teste mais simples do que qualquer teste
binomial.
O Teste do Sinal é útil para se testar se uma variável aleatória de um par (X,Y)
tende a ser maior, em algum sentido, do que a outra do par.
O Teste do Sinal recebeu este nome devido ao fato de utilizar como dados os sinais
“mais” e “menos”, em vez das medidas quantitativas. Ele é indicado em situações onde, para
cada par de observações, pode-se ao menos determinar qual é o “maior” (em algum sentido).
2.3.2 – TESTE DO SINAL

Para o Teste do Sinal, serão consideradas observações de uma variável aleatória
bivariada (X1,Y1),...,(Xn’,Yn’), com n’ pares de observações. Deve existir uma base natural
para se emparelhar as observações; caso contrário, os X’s e os Y’s são independentes e o
teste de Mann-Whitney é mais apropriado.
Dentro de cada par (X,Y) uma comparação é feita, e o par é classificado como “mais”
(+), se Xi < Yi, como “menos” (-) se Xi > Yi e como “empate” (0) se Xi = Yi. Assim, a escala de
mensuração precisa ser, no mínimo, ordinal.
Os pares (Xi,Yi) são internamente consistentes, no sentido de que se
P{Xi < Yi} > P{Xi > Yi} para um par, então isto acontece para todos os pares. O mesmo é
verdade para P{Xi < Yi} < P{Xi > Yi} e P{Xi < Yi} = P{Xi > Yi}.
REQUISITOS NECESSÁRIOS
Os requisitos necessários para se usar o Teste do Sinal são:
1) As variáveis aleatórias bivariadas (Xi,Yi), i=1,2,...,n’ são mutuamente independentes.
2) A escala de mensuração é, ao menos, ordinal dentro de cada par, ou seja, cada par
pode ser determinado como “mais” (+), “menos” (-) ou “empate” (0).
3) Os pares (Xi,Yi) são internamente consistentes, no sentido de que se
P{Xi < Yi} > P{Xi > Yi} (ou seja, P(+) > P(-)) para um par (Xi,Yi), então isto acontece para
todos os pares. O mesmo é verdade para P(+) < P(-) e P(+) = P(-).
HIPÓTESES POSSÍVEIS, ESTATÍSTICA DE TESTE, FORMA DO TESTE E P-VALOR
A hipótese nula a ser tratada no teste bilateral do Teste do Sinal é que

P{Xi > Yi} = P{Xi < Yi} = 0,5. Quando H0 é verdadeira, espera-se que o número de pares
satisfazendo Xi > Yi fosse igual ao número de pares satisfazendo Xi < Yi. H0 será rejeitada
se ocorrerem muito poucas diferenças de um só tipo de sinal.
Estatística de teste:
T = número de pares com sinal “+”.
1
Sob H0, T ~ Binomial(n,0,5), onde n = número de (+) mais número de (-) = tamanho da
amostra menos o número de empates = n’ – nº de (0).
Veremos, então, como será exatamente o Teste do Sinal para cada um dos tipos de
hipótese alternativa, com um nível de significância α.
TESTE BILATERAL
As hipóteses têm três significados que, em geral, se equivalem:
H0: P{Xi < Yi} = P{Xi > Yi} = 0,5 (Teste Binomial com p* = 0,5) ×
H1: P{Xi < Yi} < P{Xi > Yi} ou P{Xi < Yi} > P{Xi > Yi}
ou
H0: E(Xi) = E(Yi) × H1: E(Xi) ≠ E(Yi)
ou
H0: A mediana de X é igual à de Y × H1: A mediana de X e Y são diferentes.
Formato do teste.
Rejeita-se H0 para valores de t tais que t ≤ c ou t ≥ n - c.
Como encontrar c?
Para amostras pequenas (n ≤ 20)
Neste caso, rejeita-se H0 se, e somente se, t≤c ou t≥n-c, pois a Binomial com
α
probabilidade de sucesso igual a 0,5 é simétrica. Assim, c será tal que P{T ≤ c} = α1 ≈
2
Para amostras suficientemente grandes (n > 20)
Para n suficientemente grande, utiliza-se a aproximação normal:
 n n
 c−  c−  
α   2 = 2c − n → c = 1  n − z
= P{T ≤ c} ≈ PZ ≤ 2 → −z
 α = α n .
2 n  1 − n n 2  1 − 
 2  2 
 4  4
1 
Logo, rejeita-se H0 se t ≤ c ou se t ≥ n – c, onde c =  n − z α n  e z α é o
2 1−  1−
 2  2
 1 − α  quantil da normal padrão.
 
 2
Como encontrar o p-valor?
Seja T~Binomial(n,0,5), sob H0, e seja t o valor observado de T.
No teste bilateral, o p-valor, para n ≤ 20, é a menor das seguintes probabilidades:
2P{T ≤ t} ou
p − valor = 
2P{T ≥ t}
Se n > 20, o p-valor é a menor das seguintes probabilidades:
  2t − n + 1 
2P{T ≤ t} ≈ 2P Z ≤  ou
  n 
p − valor = 
2P{T ≥ t} ≈ 2P Z ≥ 2t − n − 1 
  
 n 
2
TESTE UNILATERAL INFERIOR
H0: P{Xi < Yi} ≥ P{Xi > Yi} ×
H1: P{Xi < Yi} < P{Xi > Yi}
ou
H0: E(Xi) ≤ E(Yi) para todo i × H1: E(Xi) > E(Yi) para todo i
ou
H0: A mediana de X tende a ser menor do que a de Y × H1: A mediana de X tende a
ser maior do que a de Y
Formato do teste.
Rejeita-se H0 para valores de t tais que t ≤ c. Valores pequenos de T indicam que os
“-“ são mais prováveis que os “+”.
Como encontrar c?
Neste caso, rejeita-se H0 se, e somente se, t ≤ c. Assim, c será tal que
P{T ≤ c} = α 1 ≈ α
 n n
 c−  c−
α = P{T ≤ c} ≈ P Z ≤ 2  → −z
 1−α =
2
(
2 = 2c − n → c = 1 n − z
1−α n . )
 n  n n
 4  4
1
( )
Logo, rejeita-se H0 se t ≤ c, onde c = n − z1 − α n e z1 − α é o (1 − α ) quantil da
2
normal padrão.
No teste unilateral inferior, o p-valor, para n ≤ 20, é dado por p − valor = P{T ≤ t} .
 2t − n + 1 
Se n > 20, o p-valor é dado por p − valor = P{T ≤ t} ≈ P Z ≤ .
 n 
TESTE UNILATERAL SUPERIOR

H0: P{Xi < Yi} ≤ P{Xi > Yi} ×
H1: P{Xi < Yi} > P{Xi > Yi}
ou
H0: E(Xi) ≥ E(Yi) para todo i × H1: E(Xi) < E(Yi) para todo i
ou
H0: A mediana de X tende a ser maior do que a de Y × H1: A mediana de X tende a
ser menor do que a de Y
Formato do teste.
3
Rejeita-se H0 para valores de t tais que t ≥ n - c. Valores grandes de T indicam que
os “+“ são mais prováveis que os “-”.
Como encontrar c?
Neste caso, rejeita-se H0 se, e somente se, t ≥ n-c. Assim, c será tal que
P{T ≤ c} = α 1 ≈ α .
 n n
 c−  c−
α = P{T ≤ c} ≈ PZ ≤

2 → −z
 1−α =
2
(
2 = 2c − n → c = 1 n − z
1−α n . )
 n  n n
 4  4
1
( )
Logo, rejeita-se H0 se t ≥ n - c, onde c = n − z1 − α n e z1 − α é o (1 − α ) quantil da
2
normal padrão.
No teste unilateral superior, o p-valor, para n ≤ 20, é dado por p − valor = P{T ≥ t} .
 2t − n − 1 
Se n > 20, o p-valor é dado por p − valor = P{T ≥ t} ≈ P Z ≥ .
 n 
EXEMPLOS
EXEMPLO 1:
Um item A é fabricado segundo um certo processo. O item B tem a mesma função de
A, mas é fabricado usando-se um novo processo. O fabricante deseja determinar se o
consumidor prefere B a A; assim, ele seleciona uma amostra aleatória de 10 consumidores e
entrega para cada consumidor os dois itens, A e B, para avaliação durante um determinado
período de tempo. Ao fim do período da pesquisa, 8 consumidores preferiram B, 1 preferiu
A e 1 declarou não ter preferência.
Queremos testar
H0: P{Preferir B a A} ≤ P{Preferir A a B} ×
H1: P{Preferir B a A} > P{Preferir A a B}
Este teste é Unilateral Superior.
Por que esta escolha de hipóteses? Porque é a que resulta em pior erro do tipo I:
dizer que é mais provável o consumidor preferir B, quando na verdade o mais provável é que
ele prefira A e, assim, não se precisaria instalar todo um novo processo.
Vamos marcar por “+” preferir B a A e por “-“, preferir A a B. Os “empates” (não ter
preferência) marcaremos com “0”. Então, na amostra, observou-se:
8 “+”
1 “-“ e
1 “0”
Logo, t = 8. Sob H0, T~Binomial(n,0,5), onde n = 8 + 1 = 9.
4
Neste caso, rejeita-se H0 se, e somente se, t ≥ n-c, com c tal que
0,05 ≈ P{T ≤ c}. Para diversos valores de c, a distribuição acumulada da Binomial(9,0,5) é
dada por:
c Dist.Acum.
0 0,0020
1 0,0195
2 0,0898
3 0,2539
4 0,5000
5 0,7461
6 0,9102
7 0,9805
8 0,9980
9 1,0000
Assim, c = 1, com α1 = 0,0195. Então o teste fica: rejeita-se H0 se, e somente se,
t ≥ 8. Como t = 8, rejeita-se H0, optando-se pela hipótese de que a chance do consumidor
preferir B parece maior que a de preferir A.
EXEMPLO 2:
No que foi provavelmente o primeiro artigo publicado de um teste não paramétrico,
Arbuthnott(1710) examinou os registros de nascimentos disponíveis de Londres de 82 anos
e, para cada ano, comparou o n° de homens e mulheres nascidos. Se, para cada ano,
denotarmos os eventos “mais homens do que mulheres” por “+” e o evento inverso por “-”,
Arbuthnott obteve 82 sinais “+” e nenhum sinal “-” ou empate. Teste a hipótese de que
homens e mulheres são equiprováveis ao nascer.
H0: P{Nascer mais homens do que mulheres} = P{Nascer mais mulheres do que homens}
H1: P{Nascer mais homens do que mulheres} ≠ P{Nascer mais mulheres do que homens}
n = 82
t = 82
α = 0,05
Teste Bilateral:
Neste caso, rejeita-se H0 se, e somente se, t≤c ou t≥n-c. Como n > 20, utiliza-se a
1  α
aproximação normal e c será tal que c =  n − z α n  , onde z α é o  1 −  quantil da
2  1−  1−  2
 2  2
normal padrão.
(1
)
Para α = 0,05, z0,975 = 1,96 e c = 82 − 1,96 82 ≈ 32 e n – c = 82 – 32 = 50. Então, o
2
teste de nível aproximado 5% rejeita H0 se, e somente se, t ≤ 32 ou t ≥ 50. Como t = 82,
rejeita-se a hipótese de que homens e mulheres são equiprováveis ao nascer.
O p-valor para este teste será:
 2t − n − 1   2 × 82 − 82 − 1 
p − valor = 2P{T ≥ t} ≈ 2P Z ≥  = 2PZ ≥  = 2P{Z ≥ 8,95} ≈ 0 , que é
 n   82 
bem pequeno, indicando rejeição de H0.
5
EXEMPLO 3 – PARA AULA:
Como parte da Pesquisa Nacional de Exame de Saúde realizada pelo Department of
Health and Human Services, obteve-se as alturas informadas e medidas para 12 homens
com idades entre 12 e 16 anos. A seguir estão listados os resultados amostrais. Há
evidência suficiente para apoiar a afirmativa de que há uma diferença entre as alturas
auto-informadas e as alturas medidas de homens entre 12 e 16 anos de idade? Use o nível
de significância de 5%.
Altura informada 68 71 63 70 71 60 65 64 54 63 66 72
Altura medida 67,9 69,9 64,9 68,3 70,3 60,6 64,5 67 55,6 74,2 65 70,8
EXEMPLO 4 – PARA AULA – EXERCÍCIO 3 – SEÇÃO 3.4 DO CONOVER

Dois aditivos diferentes foram comparados para ver qual deles foi mais efetivo, no
sentido de melhorar a durabilidade do concreto. 100 pequenas porções de concreto foram
misturadas sob várias condições e durante a mistura cada porção foi dividida em duas
partes. Uma das partes recebeu o aditivo A e a outra recebeu o aditivo B. Depois do
endurecimento do concreto, as duas partes de cada porção foram esmagadas uma contra a
outra, e um observador determinou qual parte pareceu ser mais resistente. Em 77 casos, o
concreto com o aditivo A foi classificado como o mais durável, em 23 dos casos o concreto
com o aditivo B foi classificado como o mais durável. Existe uma diferença significativa
entre os efeitos dos dois aditivos?
EXERCÍCIOS DO TESTE DO SINAL

CONOVER – SEÇÃO 3.4 – EXERCÍCIOS
1) Seis estudantes entraram numa dieta para perda de peso, com os seguintes
resultados:
Nome Abdul Ed Jim Max Phil Ray
Peso antes 174 191 188 182 201 188
Peso depois 165 186 183 178 203 181
Esta dieta foi efetiva na perda de peso?
2) O tempo de reação antes do almoço foi comparado com o tempo de reação depois do
almoço para um grupo de 28 funcionários de um escritório. 22 funcionários
observaram que seus tempos de reação antes do almoço foram mais curtos, e dois
não detectaram diferenças. O tempo de reação depois do almoço é
significativamente maior do que o tempo de reação antes do almoço?
4) 22 clientes de uma mercearia foram convidados a provar dois tipos de queijo e
declarar sua preferência. 7 clientes preferiram o tipo 1, 12 preferiram o tipo 2 e 3
não tiveram preferência. Isto indica uma diferença significante na preferência?
5) Um obstetra declarou que mais bebês nascem à noite (de 18h às 6h) do que durante
o dia, e seu amigo estatístico diz que isso é apenas uma impressão. No ano seguinte,
eles registraram os horários de todos os partos espontâneos aos cuidados do
obstetra ara ver quem estava com a razão. Os resultados foram:
6
Intervalo de horário N° de partos Intervalo de horário N° de partos
Meia-noite às 3h 16 Meio-dia às 15h 10
3h às 6h 17 15h às 18h 11
6h às 9h 12 18h às 21h 12
9h ao meio-dia 9 21h à meia-noite 15
O estatístico estava correto?
6) Em um laboratório, insetos de certo tipo foram libertados no meio de um círculo
desenhado em uma mesa plana. Um aroma, com a intenção de atrair este tipo de
inseto, foi colocado em um extremo da mesa. Cada inseto foi libertado
individualmente e observado até atravessar o limite do círculo. Nesse instante,
registra-se se o inseto cruzou a metade em direção ao aroma ou a metade na direção
contrária. Na conclusão do experimento, 33 insetos foram na direção do aroma, 16
na direção contrária e 12 não cruzaram o limite do círculo em um tempo razoável. O
aroma realmente atrai estes insetos?

04 Teste Do Sinal

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

04 Teste Do Sinal

Enviado por

Direitos autorais:

Formatos disponíveis

2.

3 – TESTE DO SINAL (PARA DADOS PAREADOS)

2.3.2 – TESTE DO SINAL

HIPÓTESES POSSÍVEIS, ESTATÍSTICA DE TESTE, FORMA DO TESTE E P-VALOR

A hipótese nula a ser tratada no teste bilateral do Teste do Sinal é que

TESTE UNILATERAL SUPERIOR

EXEMPLO 4 – PARA AULA – EXERCÍCIO 3 – SEÇÃO 3.4 DO CONOVER

EXERCÍCIOS DO TESTE DO SINAL

Você também pode gostar