Você está na página 1de 24

Testes não paramétricos

Testes para comparação de duas amostras


• Teste dos Sinais- amostras emparelhadas
• Wilcoxon (Signed Ranks) - amostras emparelhadas
• Teste Mann-Whitney (ou Wilcoxon-rank-sum teste) - amostras
independentes

Para comparação de mais de duas amostras independentes


• Kruskal-Wallis
• Friedman

1
Teste do Sinal e Teste de Wilcoxon

-Amostras emparelhadas e a variável dependente é medida numa escala


ordinal.

-Alternativa não paramétrica ao teste T para duas amostras emparelhadas.

- O teste do sinal apenas utiliza o sinal das diferenças, enquanto que o teste de
Wilcoxon utiliza não só o sinal das diferenças mas também o seu valor
numérico.

Teste do Sinal
Hipóteses
1
H 0 : P ( + ) = P ( −) =
vs H1 : P(+)  P(−) ( teste bilateral)
2
H 0 : P(+) = P(−) vs H1 : P(+)  P(−) ( teste unilateral à direita)
H 0 : P(+) = P(−) vs H1 : P(+)  P(−) ( teste unilateral à esquerda)

Estatística de teste: T=nº de pares “+”


nº de casos não empatados é menor ou igual a 20
T B(n; 0.5)
nº de casos não empatados >20
n
T−
Z= 2 ~ N(0,1)
n
2
4

2
Teste do Sinal
Exemplo: Para testar a eficácia de uma psicoterapia breve sobre comportamentos
obsessivos, um psicólogo obteve os seguintes resultados:

Ind 1 2 3 4 5 6 7 8
Antes da psicoterapia 130 170 125 170 130 130 145 160

Depois da psicoterapia 120 163 120 135 143 136 144 120

- - - - + + - -

H0: Não existem diferenças para os valores após e antes


H1: os valores após e antes são diferentes

Estatística de teste: T=nº de pares “+”

T B(8; 0.5) 5

Teste do Sinal

p value=0,289, não se rej a hipótese nula.


Exact Sig(1-tailed)
p value=P(observar 2 ou menos diferenças positivas)=0,145 6

3
Teste de Wilcoxon-duas amostras emparelhadas

É aplicado a amostras emparelhadas e permite testar se as duas variáveis têm medianas


(médias) iguais. O teste de Wilcoxon usa não só o sinal das diferenças como o seu valor
numérico. As diferenças nulas, se existirem são, suprimidas.

Procedimento: Aplicar o teste de Wilcoxon à amostra da variável diferença D=X-Y


testando se D é nula.

Pressupostos: A variável diferença D=X-Y é continua e tem distribuição simétrica.

Hipóteses a testar

Teste de Wilcoxon

Estatística de teste quando existem empates

W+ − W−
T=
 R i2

W+=soma das ordem das diferenças positivas


W-=soma das ordem das diferenças negativas
Ri=a ordem atribuída ao módulo das diferenças.

Para amostras grandes, n≥20, a distribuição de T tende para uma normal.


8

4
Teste de Wilcoxon

Estatística de teste quando não existem empates

n (n − 1)
W+ −
T= 4
n (n + 1)(2n + 1)
24

Nota: a aproximação à normal é sempre válida quando haja empates ou o nº para


amostras grandes.
9

Teste do Wicoxon
Exemplo: Para testar a eficácia de uma psicoterapia breve sobre comportamentos
obsessivos, um psicólogo obteve os seguintes resultados:

Ind 1 2 3 4 5 6 7 8
Antes da psicoterapia 130 170 125 170 130 130 145 160

Depois da psicoterapia 120 163 120 135 143 136 144 120

H0: Os resultados são iguais antes e depois da psicoterapia


H1: Os resultados são diferentes antes e depois da psicoterapia

10

5
Teste do Wicoxon
Exemplo:
Ind. 1 2 3 4 5 6 7 8
Antes (Xi) 130 170 125 170 130 130 145 160
Depois (Yi) 120 163 120 135 143 136 144 120
│D│=│Yi-Xi│ 10 7 5 35 13 6 1 40
+ +
Ordens 5 4 2 7 6 3 1 8

Verificar a simetria da distribuição das diferenças, D

A distribuição é simétrica (-0.780/0.752=-1,037), pois


o resultado está compreendido entre -1,96 e 1,96.
11

Teste do Wicoxon
Analyze/Nonparametric Tests/Legacy Dialogs/2 Related Samples.

p value=0,250, não se rej a hipótese nula.

12

6
Teste de Wilcoxon
Exemplo: Os dados que seguem são relativos a uma amostra de 9 pacientes
diagnosticados como tendo ansiedade mista e transtorno afetivo do tipo depressivo,
que receberam determinado tranquilizante. Em cada paciente avaliou-se o fator IV
(suicida), na escala HAM-D (de Avaliação de Depressão de Hamilton), em dois
momentos: (1) na primeira visita do doente ao médico após o início da terapêutica
(X); (2) na segunda visita do doente ao médico após o início da terapêutica (Y ).

Com base nos dados, avalie se o uso deste tranquilizante induz uma melhoria do
estado dos pacientes, isto é, se há evidência de redução dos valores do Fator IV, ao
nível de 5%.

13

Teste de Wilcoxon
D=X-Y

Hipóteses: H0: D=0 vs H1: D>0

Como a maior média das ordens é para o sinal “+” o p-value unilateral à direita (SPSS)
está de acordo com o nosso teste.

Decisão: Como valor de prova=0.02<0.05, Rej H0 ao n.s. 0.05

Conclusão: Há evidência estatística, ao nível de 5%, de que o uso do tranquilizante induz


uma melhoria do estado dos pacientes. 14

7
Teste de Wilcoxon- Mann-Whitney

Teste adequado para comparar funções de distribuição de uma variável pelo menos ordinal,
medida em duas amostras independentes.

Pressupostos:
• as observações constituem uma realização de duas a.a. independentes;
• as variáveis X e Y são contínuas e têm distribuições idênticas no que respeita à forma.
Hipóteses a testar:

Estatística de teste
Tx=soma dos ranks da amostra de menor dimensão

Este teste pode ser usado como alternativa ao teste t-Student, quando os pressupostos deste teste não
15
são válidos.

Teste de Wilcoxon- Mann-Whitney

Se n>20, usamos a aproximação normal da estatística de teste Tx.

Decisão: Rej. H0 ao n.s. α0, se

16

8
Teste de Wilcoxon- Mann-Whitney

No caso de surgirem valores empatados (ties), atribui-se aos valores empatados a


mesma ordem: a média aritmética dos ranks que teriam se não fossem todos iguais.

Neste caso, se n > 20, a aproximação normal da estatística de teste deve ser corrigida
para

onde com

e = número de conjuntos de empates;


ak = número de valores empatados no k-ésimo conjunto de empates.
17

Teste de Wilcoxon- Mann-Whitney-Metodologia

1- Juntar as duas amostras e ordenar os valores;


2- Atribuir números de ordem a cada observação.
3- Se há empates (ties) calcular o nº de ordem médio para cada um desses
valores.
4-Separar as ordens pelas amostras e calcular W1 e W2, soma das ordens
na amostra 1 e amostra 2 respetivamente

18

9
Teste de Wilcoxon- Mann-Whitney
Exemplo: Julga-se que os cuidados prénatais prestados às parturientes logo a
partir do início da gravidez, podem ser determinantes na explicação do peso baixo
dos recém nascidos. Para o efeito realizou-se um estudo em que se consideraram
parturientes que procuraram cuidados prénatais logo durante o primeiro trimestre
(1º trimestre) e parturientes que só começam a receber tais cuidados de saúde
durante o terceiro trimestre de gestação (3º trimestre).

Os resultados obtidos forma os seguintes:

1º trim 2800 2810 2940 2950 3080 3210 3380 4900

3º trim 1400 1680 1700 2660 2760 2775 2790 3050 3110 3830

H0: As duas amostras têm distribuições iguais


H1: As duas amostras têm distribuições diferentes
19

Teste de Wilcoxon- Mann-Whitney

1400 1
Cuidados a Cuidados
partir de 3º desde 1º 1680 2
Trim. Trim. 1700 3
1400 2800 2660 4
2760 5
1680 2810
2775 6
1700 2940 2790 7
2660 2950 2800 8
2760 3080 2810 9
2775 3210 2940 10
2950 11
2790 3380
3050 12
3050 4900
3080 13
3110 3110 14
3830 3210 15
3380 16
3830 17
4900 18
20
W1=100 W2=71

10
Teste de Wilcoxon- Mann-Whitney

Analyze/Nonparametric Tests/Legacy Dialogs/ 2 Independent Samples

5000 13
peso do recém nascido em gramas

4000

3000

2000

1000

1º Trimestre 3º Trimestre

cuidados prénatais

21

Teste de Wilcoxon- Mann-Whitney

Ranks

cuidados prénatais N Mean Rank Sum of Ranks


peso do recém 1º Trimestre 8 12,50 100,00
nascido em gramas 3º Trimestre 10 7,10 71,00

Tabela Ranks temos o nº de observações e as médias dos ranks.


Tabela Test Statistics temos o valor observado da estatística de teste U e da estatística
W=min(100, 71)=71 e ainda os valores de p-values, bilateral e unilateral do teste
assimptótico e do teste exato.

Test Statistics

peso do recém nascido em gramas


Exact Sig.
Mann-Whitney U Wilcoxon W Z Asymp. Sig. (2-tailed) [2*(1-tailed Sig.)]
16,000 71,000 -2,132 ,033 ,034
22

11
Teste de Wilcoxon- Mann-Whitney

Decisão: Para α= 5%, teste bilateral, podemos concluir que há evidência estatística
que nos leva a concluir que as duas amostras têm distribuições diferentes.

Questão 2: Será que existe evidência estatística de que as parturientes que


procuram cuidados logo durante o primeiro trimestres de gravidez tendem a dar à
luz bebés mais pesados que as que só começam a receber tais cuidados de saúde
durante o terceiro trimestre de gestação?

23

Teste de Wilcoxon- Mann-Whitney

Ranks

cuidados prénatais N Mean Rank Sum of Ranks


peso do recém 1º Trimestre 8 12,50 100,00
nascido em gramas 3º Trimestre 10 7,10 71,00

Uma vez que a média das ordens para o 1º trimestre


é maior do que para o 3º trimestre o valor de prova
(1-tailed), o Exact sig da tabela Test Statistics é para
o teste unilateral à direita ( )) ).

Decisão: Como o p= 0,017, rej H0 , ou seja, existe evidência estatística de que as parturientes, de
bebés prematuros, que procuram cuidados logo durante o primeiro trimestre (1º trimestre) de
gravidez tendem a dar à luz bebés mais pesados que as parturientes que só começam a receber tais
cuidados de saúde durante o terceiro trimestre de gestação (3º trimestre).
24

12
Métodos não paramétricos tipo ANOVA

Objetivo: Métodos que sejam válidos para efetuar análises de tipo ANOVA mesmo
quando alguns dos pressupostos do modelo linear não são admissíveis.

Aplicáveis caso:

• se duvide da normalidade dos erros;


• se duvide da homogeneidade variâncias;

Continuamos a necessitar de observações independentes.

25

Métodos não paramétricos tipo ANOVA

▪Teste de Kruskal-Wallis - Variante não paramétrica duma ANOVA a um fator


(totalmente casualizado).

▪Teste de Friedman - Variante não paramétrica duma ANOVA a um fator com


blocos casualizados.

Ideia geral: Substituir os valores observados pelas suas ordens (ranks) (globais,
ou dentro de algum grupo).

26

13
Teste Kruskal Wallis

Teste Kruskal-Wallis para k grupos independentes é equivalente à análise de variância a um


fator (ANOVA).

Deve ser aplicado quando se duvide da normalidade dos resíduos; se


duvide da homogeneidade das variâncias; em estudos com atributos
medidos em escalas ordinais; (sendo necessário que as observações
sejam independentes)

27

Teste de Kruskal-Wallis
Pressupostos exigidos:

• Temos k grupos de observações independentes (k amostras aleatórias) sendo


os grupos independentes entre si.

• As observações são medidas numa escala pelo menos ordinal.

•Cada grupo de observações deve provir de uma população contínua.

•As populações apenas diferem na localização (portanto têm a mesma forma).

Hipótese a testar:

H0: As distribuições dos valores da variável dependente são idênticas nos k grupos
vs
H1: Existe pelo menos uma população onde a distribuição da variável dependente é
diferente de uma das distribuições das outras populações sobre estudo. 28

14
Teste Kruskal Wallis

Metodologia

1. Juntar as observações de todos os tratamentos,


2. Ordenar os valores e atribuir ordens (ranks) às observações ajustando no
caso de empates.
3. Calcular a soma e a média das ordens em cada grupo.
4. Calcular a estatística de teste
5. Rejeitar Ho para valores elevados dessa estatística (teste unilateral)

29

Teste de Kruskal-Wallis

Procedimento

Juntar as observações de todos os tratamentos, e ordenar as N observações em


conjunto. Atribuir ranks às observações.

Seja Rij o rank da observação i. Denote-se por Ri. e Ri. a soma e a média

dos ranks do grupo i, respetivamente.

Estatística de teste:

k  N +1
2 k R2
 i. − 3( N + 1).
12 12
H=  ni  Ri. −  =
N ( N + 1) i =1  2  N ( N + 1) i =1 ni

30

15
Teste de Kruskal-Wallis

Para grandes amostras (n>30), ou k> 5 tratamentos, a estatística de teste aproxima-


se de uma distribuição qui-quadrado com (k-1) graus de liberdade, ou seja:

Estatística de teste

k R2 
 i. − 3(N + 1) ~  2k −1
12
H=
N( N + 1) i =1 n i sob H 0

Decisão: Rejeita-se H0 se H  
2
;k −1
ao nível de significância α.

31

Teste de Kruskal-Wallis

Exemplo: Um investigador da área da psicologia educacional pretendeu testar a


eficácia de três metodologias de ensino A, B e C. Para o efeito considerou 3 grupos
aleatórios e independentes de alunos de uma dada escola. Para testar a eficácia das
metodologias o investigador ministrou um teste. A tabela abaixo apresenta os
resultados relativos obtidos:
A 9 13 11 12 9 11 10
B 11 13 12 15 8 11 12
C 18 13 12 16 10 16 15

Será que existem diferenças em termos de aprendizagem nas três metodologias de ensino?

Hipóteses a testar

Ho: : As distribuições dos valores da variável dependente são idênticas nos 3 grupos
vs
H1 : Existe pelo menos uma população onde a distribuição da variável dependente é diferente
de uma das distribuições das outras populações sobre estudo. 32

16
Teste de Kruskal-Wallis

1. Ordenação de todas as observações e atribuição de ordem

observações tratamento ordem

8 B 1

9 A 2,5

9 A 2,5

10 A 4.5

10 C 4.5

11 A 7

11 B 7

11 B 7

….. .. ..

33

Teste de Kruskal-Wallis

Após atribuição dos ranks é conveniente separar de novo as observações por tratamento, assim
temos:

Método A Método B Método C

x ordem x ordem x ordem

9 2,5 8 1 10 4.5
9 2,5 11 7 12
10 4.5 11 7 13 14
11 7 12 10,5 15 17,5
11 7 12 10,5 16 19,5
12 13 16
13 15 18

34

17
Teste de Kruskal-Wallis-SPSS
Menu: Analyze/ Nonparametric Tests/ k Independent Samples.

Na tabela Ranks temos a dimensão de cada grupo e


o respetivo rank. Na tabela do teste é dado o valor
a estatística de teste T, os g.l. associados e o p-
value.

Decisão: Como o valor de prova= 0,04<0,05,


rejeita-se H0, isto é, existe pelo menos uma
população onde a distribuição da variável
dependente é diferente de uma das distribuições
das outras populações sobre estudo.

35

Comparação múltipla das médias das ordens

Para identificar em qual ou quais grupos as distribuições são significativamente


diferentes é necessário proceder à comparação múltipla das médias das ordens.

Hipóteses a testar

H0: F(Xi)=F(Xj) vs H1: F(Xi)F(Xj) , i j: i,j=1,2…,k

36

18
Comparação múltipla das médias das ordens

Para isso temos de comparar cada par de amostras da seguinte maneira:

• para cada amostra, calcula-se o posto médio Ri. , dividindo a soma dos postos Ri. pelo
tamanho da amostra ni;

•determinam-se as diferenças absolutas entre cada par de postos médios

Ri. − R j. , i, j = 1,..., k

• cada diferença absoluta é comparada com o valor crítico.

 N ( N +1)  1 1 

cij = 2 , k −1  +
 12  ni n j 

2
onde,  ;k −1 é o ponto crítico usado no teste Kruskal-Wallis.
37

Comparação múltipla das médias das ordens

• Se Ri. − R j.  cij , então, considera-se significativa a diferença entre as amostras i e j,


havendo, portanto, evidência de existirem diferenças entre as populações de onde se
extraíram estas amostras.

38

19
Comparação múltipla das médias das ordens

Exemplo:

Hipóteses a testar
H0: F(Xi)=F(Xj) vs H1: F(Xi)F(Xj) , i j: i,j=12,3

Decisão: Por análise dos valores de prova conclui-se que apenas os métodos A e C
são significativamente diferentes.
39

Teste de Friedman

O teste de Friedman é o teste apropriado para comparar mais de duas


populações, de onde foram extraídas amostras emparelhadas, em que a variável
dependente em estudo é pelo menos ordinal.
É uma extensão do teste de Wilcoxon, quando é necessário utilizar três ou mais
situações experimentais

Alternativa não paramétrica ao delineamento experimental em blocos completos


aleatórios, quando não são cumpridos os pressupostos necessários à análise de
variância paramétrica.

40

20
Teste de Friedman
Hipótese a testar:

H0: As distribuições das k amostras são idênticas

vs

H1: As distribuições das k amostras não são idênticas.

Estatística de Teste

12 k 2 12 k
X2 =  Ri − 3b(k + 1) =  b( Ri − R )
2
bk (k + 1) i =1 bk (k + 1) i =1

em que Ri é a média dos nºs de ordem e R é a média global dos nºs de ordem.
41

Teste de Friedman

Para valores de k até 6 tratamentos e 10 blocos os valores críticos de X² encontram-se


tabelados.

Para valores de k e b superiores X² é aproximada pela distribuição qui-quadrado, com (k-1)


g.l.:

12 k 
X2 =  b( Ri − R )
2 ~ 2
bk ( k + 1) i =1 (k −1)
sob H 0

Decisão: Rejeita-se H0 se X 2  2
 ;k −1ao nível de significância α.

42

21
Teste de Friedman
Exemplo: Pretende-se saber se há diferenças nos tempos de reação a três
estímulos. Para o efeito forma considerados quatro estudantes. Cada um é
submetido a três estímulos e é medido o tempo até que o aluno reage a cada um
desses estímulos pressionando um botão. Os resultados obtidos são os seguintes:
Estímulo
Estudante 1 2 3
1 0.6 0.9 0.8
2 0.7 1.1 0.7
3 0.9 1.3 1
4 0.5 0.7 0.8

Hipótese a testar:

H0: As distribuições dos 3 tempos de resposta são idênticas

H1: Pelo menos duas das 3 distribuições diferem na localização.


43

Teste de Friedman
• k=3 (nº de estímulos/tratamentos)
• b=4 (nº de estudantes/ blocos)
• Ordenar as três medições para cada estudante, de 1 a 3;
• Calcular as três somas das ordens, Ri.

Estímulo
Estudante 1 2 3
1 0.6 (1) 0.9 (3) 0.8 (2)
2 0.7 (1.5) 1.1 (3) 0.7 (1.5)
3 0.9 (1) 1.3 (3) 1 (2)
4 0.5 (1) 0.7 (2) 0.8 (3)
Ri 4.5 11 8.5

44

22
Teste de Friedman- SPSS
No SPSS este teste encontra-se no menu: Analyze/ Nonparametric Tests/ k Related
Samples.

A tabela Ranks apresenta a médias dos ranks e a tabela Test Statistics apresenta o valor
de prova calculado por aproximação ao Qui-Quadrado, o valor de prova exato e a
probabilidade pontual.

Conclusão: Como o valor de prova=0,065>0,05, então não se rej. H0, ou seja, não existe
evidência estatística que nos leve a concluir que existe diferença nos tempos de resposta
aos três estímulos.
45

Comparação múltipla das médias das ordens

Para identificar em qual ou quais grupos as distribuições são significativamente


diferentes é necessário proceder à comparação múltipla das médias das ordens.

Hipóteses a testar

H0: F(Xi)=F(Xj) vs H1: F(Xi)F(Xj), i j: i,j=1,2…,k

46

23
Teste de Comparações Múltiplas

Considerando quaisquer duas amostras i e j e as sua somas de ordem, Ri e R j


podemos dizer que as amostras são significativamente diferentes se:

N  k  (k + 1)
Ri. − R j.  1,96 , para  = 5%
6
ou
N  k  (k + 1)
Ri. − R j.  2,576 , para  = 1%
6

47

24

Você também pode gostar