Você está na página 1de 22

1

Mtodos No-Paramtricos
Isabel Fraga Alves
Departamento de Estatstica e Investigao
Operacional
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
2
Programa
Introduo
Anlise de Dados Categorizados
Teste do Qui-Quadrado
Teste de Ajustamento
Tabelas de Contingncia
Teste de Independncia
Teste de Homogeneidade
Estatstica No-Paramtrica
Introduo: O problema geral da localizao relativo a 2 amostras
Amostras emparelhadas
Teste dos Sinais (pequenas e grandes amostras)
Teste de Wilcoxon (pequenas e grandes amostras)
Uso das Ordens para Comparar Populaes: Amostras Independentes
2 Populaes: O Teste de Mann-Whitney (pequenas e grandes amostras)
Mais de 2 Populaes:
O Teste de Kruskal-Wallis (pequenas e grandes amostras)
Teste de Friedman (pequenas e grandes amostras)
Uso das Ordens para Testar Independncia e Aleatoriedade
Teste de Spearman (pequenas e grandes amostras)
Teste dos Runs para Aleatoriedade (pequenas e grandes amostras)
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
3
Bibliografia
CONOVER, W. J. (1999) - Practical Nonparametric Statistics, 3rd ed. Wiley.
DANIEL, W. W. (1990) - Applied Nonparametric Statistics, 2nd ed. PWS-Kent.
Graa Martins, M. E. (2005) Introduo Probabilidade e Estatstica Com
complementos de Excel, SPE.
DeGroot, Morris H. - Probability and statistics (1986 ) - 2nd ed Massachusetts Addison-
Wesley.
Pestana e Velosa (2006) - Introduo Probabilidade e Estatstica, I, Fundao
Gulbenkian. 2 ed.
SIEGEL, S. and Castellan, N. Y. (1988) - Nonparametric Statistics for the Behavioral
Sciences. McGraw-Hill.
* Wackerly, D., Mendenhall, W. and Scheaffer, L. (2007)
Mathematical Statistics with Applications. Duxbury Press; 7th ed.
* Manual Recomendado para consulta das Tabelas ao longo dos slides.
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
4
Introduo
O que a Estatstica ?
Estudo da Incerteza
Como a quantificar? Que podemos fazer com ela?
As experincias repetidas
sob o que pensamos serem as condies
no resultam sempre da mesma forma!
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
5
Tipos de Experincias
Causais ou Determinsticas
Ex: Deixar cair uma pedra no rio
Aleatria ou Estocstica
Ex: O Tempo que vou Esperar pelo Autocarro
Como posso prever o resultado?
Com Estatstica quantificamos e medimos o imprevisvel!
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
6
Estatstica: produz afirmaes numricas relativamente a
situaes sujeitas a INCERTEZA.
Exemplos:
Quem ir ganhar as prximas eleies?
Estaro os clientes da PT satisfeitos com o servio
prestado?
Qual das duas pastas dentfricas mais eficiente que a
outra para prevenir as cries?
Qual a previso da quantidade de precipitao para o
prximo inverno?
Aps a monitorizao de pacientes com doenas
cardacas, como decidir acerca dos factores que
afectam a sua sade ?
2
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
7
Como e Que Respostas ?
Para responder a estas perguntas frequentemente usamos modelos
probabilsticos, que so modelos matemticos para lidar com incerteza.
So recolhidos Dados para explorar uma Populao, o objectivo
de nosso estudo.
Quando recolhida uma amostra grande necessrio produzir resumos
das informaes nela contidas. Existem ferramentas grficas e numricas
que so normalmente utilizadas pelos estatsticos
AMOSTRA
Estatstica Descritiva
Inferncia Estatstica - faz generalizaes vlidas para a Populao,
a partir de Amostras.
(enquanto na Previso - apresentada uma afirmao sobre o Futuro.)
Dados - observaes de determinadas quantidades de interesse.
Variveis - incerteza acerca dos seus verdadeiros valores.
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
8
Tipos de Variveis
VARIVEL
QUALITATIVA QUANTITATIVA
DISCRETA
NOMINAL ORDINAL
CONTNUA
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
9
Tipos de Variveis (cont.)
QUANTITATIVA vs. QUALITATIVA : variveis com /
sem representao numrica e ordenao natural
nica (por exemplo, a presso arterial versus religio).
DISCRETA vs. CONTNUA: variveis quantitativas
com / sem lacunas conceptuais entre os seus valores
(por exemplo, nmero de crianas numa famlia versus
presso arterial).
ORDINAL vs. NOMINAL: variveis qualitativas com
/ sem ordenao (eventualmente no nica) dos seus
valores (a satisfao do cliente versus religio).
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
10
De modo geral,
as variveis qualitativas esto mais ligadas aos
modelos no-paramtricos
enquanto que
as variveis quantitativas aos modelos
paramtricos.
Tipos de Variveis (cont.)
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
11
As variveis qualitativas podem ainda ser classificadas de acordo com:
VARIVEL CATEGORIZADA (Categrica, Nominal ou de Classe)
nomes das pessoas ou coisas; as letras do alfabeto; o sexo, masculino ou feminino,
macho ou fmea; o estado civil, solteiro, casado, divorciado, vivo; o curso, primrio,
secundrio, colegial, universitrio, ps-graduao, etc.
Representa o nvel mais simples e mais elementar de medio. Os indivduos de uma
populao ou amostra so medidos mediante uma certa caracterstica que pode ser
categoria, nome ou classe.
Caractersticas binrias ou dicotomizadas:
presente ou ausente, 1 ou 0, positivo ou negativo, vivo ou morto, sim ou no, benigno
ou maligno, etc.
Essas caractersticas so mutuamente exclusivas, isto , cada indivduo s pode se enquadrar
em um nico nome, categoria ou classe, e tambm so exaustivas, pois devem atingir todos os
indivduos da populao ou amostra em estudo, sem excepo.
A varivel categrica qualitativa e no se presta aos clculos aritmticos
comuns: soma, subtraco, multiplicao e diviso.
Apresenta as seguintes propriedades de equivalncia (=): reflexiva (x=x); simtrica
(x=y ento y=x); transitiva (x=y e y=z ento x=z).
Tipos de Variveis (cont.)
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
12
VARIVEL ORDINAL
no alfabeto, A,B,C,D ou D,C,B,A; em nmeros de ordem, 1,2,3 ou 3,2,1; no
sexo, F,M ou M,F; no curso, primrio- secundrio-superior ou superior-
secundrio-primrio; em uma quantificao, leve-moderado-intenso ou intenso-
moderado-leve; em cruzes, +,++,+++,++++ ou ++++,+++,++,+; na ordenao
de dados numricos, 11,18,23,29,35 ou 35,29,23,18,11; etc.
Os indivduos de uma populao ou amostra so classificados de acordo
com as diversas categorias de uma determinada caracterstica e em
seguida so ordenados. Esta ordenao pode ser crescente ou
decrescente, ou igualmente, ascendente ou descendente.
A varivel ordinal tambm qualitativa.
Sabe-se que um indivduo ou coisa maior ou menor do que outro, porm no se
sabe o quanto maior nem o quanto menor. So comuns as expresses
comparativas: maior, menor; superior, inferior; primeiro, ltimo; mais intenso,
menos intenso; mais alto, mais baixo; prefervel; etc.
Na escala ordinal utilizam-se as comparaes maior do que (>) e menor do
que (<). As operaes aritmticas comuns (adio, subtraco,
multiplicao e diviso) no so aplicveis.
Na ordenao, a relao maior do que (>) apresenta a propriedade transitiva (se x>y e
y>z ento x>z).
Tipos de Variveis (cont.)
3
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
13
VARIVEL INTERVALAR
os valores de idade, altura, peso, presso arterial, frequncia cardaca, exames
laboratoriais, medidas diversas, etc.
A escala intervalar verdadeiramente quantitativa. A medio feita
directamente em nmeros reais, obtidos mediante a comparao com um
determinado valor fixo, denominado unidade. O nome intervalar est
ligado aos intervalos entre as categorias da varivel e aqui se sabe
exactamente o quanto uma categoria menor ou maior que outra,
ou ainda se h igualdade entre elas.
As operaes aritmticas comuns (soma, subtraco, multiplicao e
diviso) so aplicveis.
A varivel intervalar rene todas as propriedades dos dois tipos anteriores
de mensurao: as de equivalncia (=), reflexiva (x=x), simtrica (x=y
ento y=x) e transitiva (x=y e y=z ento x=z) e a de ordenao (>),
transitiva (x>y e y>z ento x>z).
Tipos de Variveis (cont.)
ESTATSTICA NO
PARAMTRICA
Extremamente interessante para
anlises de dados qualitativos.
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
15
MEDIDAS DE TENDNCIA CENTRAL - Localizao
Mdia
Mediana
Moda
Mdia Amostral - a soma de
todos os valores de uma amostra
dividida pelo n de elementos da
amostra (dimenso).
aplicada em variveis quantitativas.
A mdia amostral a
contrapartida emprica do Valor
Mdio da Populao ou da
Varivel, .
1
1
n
i
i
X X
n
=
=

1 2
( . .) - , , ,
n
amostra aleatoria a a X X X
1 2
- , , ,
n
amostra observada x x x
1
1
n
i
i
x x
n
=
=

Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
16
Mediana Amostral - o valor da
amostra que ocupa a posio central,
quando todos os valores esto
ordenados em ordem crescente ou
decrescente.
Se n for mpar, a mediana ( Med )
ser o valor que ocupa a posio
central na amostra ordenada. Esta
posio pode ser calculada por
(n+1)/2.
Se n for par, a Med ser calculada
pela mdia aritmtica dos dois valores
centrais na amostra ordenada da
amostra. A posio de cada um desses
dois valores centrais pode ser
calculada por n/2 e n/2+1.
A Mediana muito utilizada nos
clculos no-paramtricos.
MEDIDAS DE TENDNCIA CENTRAL - Localizao
1
:
2
: 1:
2 2
1
2
n
n
n n
n n
x n impar
Med
x x n par
+
+

=


+
`
)
1: 2: :
ordenada -
n n n n
amostra observada
x x x s s s
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
17
MEDIDAS DE TENDNCIA CENTRAL - Localizao
Moda - o valor da
varivel que
corresponde
frequncia mxima.
A moda pode ter um
ou mais valores,
unimodal, bimodal,...,
multimodal, conforme
existam uma, duas, ou
mais frequncias iguais,
dos valores da varivel.
Dados:
25, 22, 28, 32, 35, 55, 83, 83, 98, 99, 43, 46, 51
(n=13)
mdia
mediana
moda
53.9 x =
1 2
-
( , , , )
(25, 22, 28, 32, 35, 55, 83, 83, 98, 99, 43, 46, 51 )
n
amostra observada
x x x =
1: 2: :
ordenada -
(22, 25, 28, 32, 35, 43, 46, 51, 55, 83, 83, 98, 99)
n n n n
amostra observada
x x x s s s =
46 Med =
83 Mo =
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
18
Localizao: Mediana vs. Mdia
Razes para usar a mediana:
menos influenciada por valores extremos
Se as distribuies so simtricas, a mdia e a
mediana populacional coincidem
Mdia vs. Mediana
5 6 6 7 7 8 10
Mdia = 7 Med = 7
5 6 6 7 7 8 50
Mdia = 8.43 Med = 7
4
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
19
Distinguir
Metodologias Paramtricas
&
Metodologias No-Paramtricas
Explicar uma
Variedade de Testes No-Paramtricos
Resolver
Problemas de Testes de Hipteses usando Testes No-
Paramtricos
Objectivos do Curso
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
20
Quadro Geral
At este ponto, todos os testes que tm utilizado esto
sujeitos a suposies sobre a distribuio subjacente aos
dados. Especificamente, assumido que os dados so normais
para usar o teste-t, por exemplo.
Poder-se-ia usar a teoria de grandes amostras e o Teorema
do Limite Central, mas isso ainda apenas se verifica
Assintoticamente
O que que acontece se no estamos dispostos ou no sensato
fazer as suposies de normalidade sobre a distribuio subjacente
e temos uma amostra de dimenso pequena ?
n
TESTE DE HIPTESES
Trata-se de uma tcnica para se
fazer a inferncia estatstica sobre
uma populao a partir de uma
amostra
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
22
E muitos mais!
Testes de Hipteses - Metodologias
Teste de
Hipteses -
metodologias
No-Paramtricas Paramtricas
Teste - z
Teste
Kruskal-Wallis
Teste
Wilcoxon
Teste - t ANOVA
etc
etc
Amostra emparelhada
Teste-t
emparelhado
Testes de Hipteses - Metodologias
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
24
Estatstica No-Paramtrica
Muitos dos testes estatsticos no-paramtricos
respondem mesma srie de questes tal como os
testes paramtricos.
Com testes no-paramtricos as hipteses podem ser
flexibilizadas consideravelmente.
Por conseguinte, so utilizados mtodos no-paramtricos
para situaes que violem os pressupostos de procedimentos
paramtricos.
5
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
25
Testes Paramtricos
Testes Paramtricos
Incidem explicitamente sobre um ou mais parmetros de uma
ou mais populaes;
A distribuio de probabilidades da estatstica de teste pressupe
uma forma particular das distribuies populacionais;
As varincias so homogneas;
Os erros ou resduos so aleatrios e independentes e tm
distribuio normal com varincia finita e constante.
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
26
Testes No-Paramtricos
Testes No Paramtricos
Requerem menos pressupostos em relao
populao;
No exigem normalidade;
No se baseiam em parmetros da distribuio (logo, no
necessitam varincias homogneas);
Ligeiramente menos eficientes que os testes
paramtricos;
Baseiam-se nas estatsticas ordinais (e no nos
valores das observaes);
Mais fceis de aplicar.
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
27
Testes No-Paramtricos
Poucos Pressupostos Relativos Populao
Facilidade de implementao
Maior Perceptibilidade
Aplicvel em Situaes No Abrangidas Pela Normal
Mais Eficientes quando as Populaes no tm Distribuio Normal
Os resultados podem ser to exactos como nos procedimentos paramtricos
Vantagens
As hipteses testadas por testes no-paramtricos tendem a ser
menos especficas;
No tm Parmetros, Dificultando Comparaes Quantitativas
entre Populaes
Escasso Aproveitamento de Informao da Amostra
Pode ser de Difcil Clculo mo para Grandes Amostras
Tabelas no amplamente disponveis
Desvantagens
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
28
No incorpora as suposies restritivas, caractersticas dos
testes paramtricos.
Os dados no precisam estar normalmente distribudos
(Distribution-Free). necessrio, apenas, que eles sejam
ordenveis.
Muitas vezes, so baseados nas ordens das observaes e no
nos seus valores, como no caso paramtrico.
Podem ser aplicados para variveis quantitativas e qualitativas.
Menos sensveis aos erros de medida e rpidos para pequenas
amostras.
Estatstica No-Paramtrica - Distribuio Livre
TESTE DE HIPTESES
Trata-se de uma tcnica para se
fazer a inferncia estatstica sobre
uma populao a partir de uma
amostra
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
30
PRINCIPAIS CONCEITOS
HIPTESE ESTATSTICA
Trata-se de uma suposio quanto ao valor de um parmetro
populacional, ou quanto natureza da distribuio de
probabilidade de uma varivel populacional.
TESTE DE HIPTESES
uma regra de deciso para rejeitar ou no rejeitar uma
hiptese estatstica com base nos elementos amostrais
6
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
31
TEORIA POPPERIANA - Falseabilidade (ou refutabilidade)
Science can't prove anything. It can only disprove things.
A cincia no pode provar nada. S pode refutar coisas.
Considere o exemplo do famoso Cisne Negro (black swan):
Um cientista gasta sua vida observando cisnes. Observa que todos
os cisnes que jamais viu so brancos. Com base nesta evidncia
emprica, ele postula uma teoria de que todos os cisnes so
brancos.
Um dia viaja para a Austrlia e v - UPS! - um Cisne Negro.
A sua teoria refutada. Mas isso no significa que no era
cincia quando a estabeleceu. Agora, pode estabelecer uma teoria
nova: Os cisnes podem ser brancos ou pretos.
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
32
Karl Popper(1902- 1994) - UM FILSOFO INOVADOR
Sir Karl Raimund Popper foi filsofo da cincia austraco naturalizado
britnico e um professor da London School of Economics.
Formou-se em matemtica, fsica e filosofia da cincia britnica.
Uma das pessoas mais influentes da filosofia da Cincia durante o sculo
XX.
POPPER E A REFUTAO
Uma hiptese s cientfica se puder ser colocada em questo
(refutada).
Isto significa que deve ser sempre possvel realizar uma observao
que prove que a hiptese falsa
Uma teoria cientfica no poder em nenhuma circunstncia ser
declarada verdadeira
A teoria cientfica mais no do que uma hiptese; uma conjectura, que um dia ser
refutada e substituda por uma outra.
What really makes science grow is new ideas, including false ideas. Karl Popper
S APRENDEMOS QUANDO ERRAMOS.
OS ESTATSTICOS NO PERGUNTAM QUAL A PROBABILIDADE DE ESTAREM CERTOS,
MAS A PROBABILIDADE DE ESTAREM ERRADOS.
Para fazerem isso estabelecem uma hiptese nula.
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
33
Data Analysis and Research for Sport and Exercise Science: A Student Guide
By Craig Williams, Chris Wragg, Routledge ed., 2003. pag 6
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
34
PRINCIPAIS CONCEITOS
TIPOS DE HIPTESES
H
0
, hiptese nula, a hiptese estatstica a ser testada
H
1
, hiptese alternativa
A HIPTESE NULA UMA AFIRMAO DE COMO O MUNDO
DEVERIA SER, SE NOSSA SUPOSIO ESTIVESSE ERRADA.
Ex: A hiptese nula expressa uma igualdade, enquanto a
hiptese alternativa dada por uma desigualdade.
0 1
: 1.5 . : 1.5 H m vs H m = =
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
35
Testes de Hipteses Erros
EXISTEM DOIS TIPOS DE ERRO:
Erro tipo 1 - rejeio de uma hiptese nula verdadeira
Erro tipo II no rejeio de uma hiptese nula falsa
no rejeiao no rejeio
A probabilidade o do erro tipo I denominada
nvel de significncia do teste.
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
36
Realidade
Deciso
H
0
verdadeira H
0
falsa
No rejeitar
H
0
Deciso
correcta
Erro tipo II
Rejeitar
H
0
Erro tipo I
Deciso
correcta
o = P( erro tipo I ) = P(rejeitar H
0
| H
0
verdadeira) = P(ET e RR | H
0
verd.)
nvel de significncia ou tamanho do teste
| = P(erro tipo II)= P(no rejeitar H
0
| H
0
falsa) = P(ET e RA | H
0
falsa)
1-| = potncia do teste Probabilidade de no cometermos um erro do tipo II
Testes de Hipteses Erros
ET:= Estatstica de Teste
RR:= Regio de Rejeio
RA:= Regio de No Rejeio
REGRA de TESTE: ETe RR ento Rejeitar H
0
7
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
37
p -Value
O resultado foi significativo?
Quo pequeno tem de ser o p-value, para se rejeitar a
hiptese nula?
Se p-value < 5 % estatisticamente significativo.
Se p-value < 1 % altamente significativo.
Os investigadores devem
resumir os dados,
dizer qual o teste usado e
reportar o p-value (em vez de apenas o comparar com os valores de 1 % ou 5 % )
No caso de se estabelecer partida o nvel de significncia o e se o
TESTE indicar a aceitao de H
0
, diz-se que
Ao nvel de significncia o no se pode rejeitar H
0 .
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
38
TIPOS DE TESTE
Qui-Quadrado
Teste dos Sinais
Teste de Wilcoxon
Teste de Mann-Whitney
Teste de Kruskal-Wallis
Teste de Spearman
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
39
TESTE DO QUI-QUADRADO- Teste de Independncia
Testes no paramtricos que medem o grau de dependncia entre
duas variveis aleatrias.
No assumem nenhum tipo de distribuio.
Assume observaes de frequncia de variveis categricas. As
variveis da amostra esto divididas em categorias.
As observaes das duas variveis so agrupadas em classes
independentes (disjuntas).
Tipicamente, os dados do teste esto representados em tabelas de
contingncia 2 x 2. No entanto podemos ter mais do que 2
dimenses.
Testes a estudar
Teste do
2
(qui-quadrado)
Teste exacto de Fisher
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
40
TESTE DO QUI-QUADRADO- Teste de Independncia
Dados bivariados (X
i
, Y
i
), i=1, ...,n, tendo (X, Y) f.d. conjunta
F(x,y) com marginais F
1
(x) = F(x,+) e F
2
(y)=F(+,y).
Pretendemos testar
H
0
: F(x,y)=F
1
(x) F
2
(y) (x,y)eR
2
vs. H
1
: F(x,y)F
1
(x) F
2
(y) para
algum (x,y)eR
2
Isto , face a uma amostra aleatria (X
i
, Y
i
), i=1,...,n,
pretendemos testar a independncia do par (X,Y).
Para obter a estatstica de teste comeamos por dividir o
suporte da varivel aleatria X em L classes A
1
, A
2
, ..., A
L
,
disjuntas e o suporte da varivel aleatria Y em C classes B
1
, B
2
,
..., B
C
, disjuntas.
Representemos por
N
ij
= # { (X
k
, Y
k
): X
k
e A
i
; Y
k
e B
j
},i=1,,L; j=1,,C.
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
41
TESTE DO QUI-QUADRADO- Teste de Independncia

X\Y
B
1
B
2
B
j
B
C
A
1
N
11
N
12
N
1j
N
1C N
1 .
A
2
N
21
N
22
N
22
N
2C
N
2 .

A
i
N
i1
N
i2 N
ij

N
iC N
i .

A
L
N
L1
N
L2
N
L2
N
LC
N
L .
N
.1
N
. 2
N
. j
N
.C
N
..
=n
[ ; ]
ij i j
p P X A Y B = e e
.
.
[ ]
[ ]
i i
j j
p X A
p Y B
= e
= e
0 . . 1 . .
: , ( , ) . : ( , ),
ij i j ij i j
H p p p i j vs H i j p p p = - =
1
L
j ij
i
N N
-
=
=

1
C
i ij
j
N N
-
=
=

Isabel Fraga Alves


FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
42
TESTE DO QUI-QUADRADO- Teste de Independncia
Com as frequncias esperadas e
ij
desconhecidas, utiliza-se
Estatstica de Teste (ET):
Regra de Deciso:
Ao nvel o , Rejeitar a hiptese nula de Independncia se o valor da
ET > (quantil da qui-quadrado com (L-1) x (C-1) graus de liberdade)
2
2
0 ( 1)
1 1
( )
, tem uma distribuio assinttica de um .
L C
ij ij
LC
i j ij
N e
sob H
e
_

= =

[ ; ]
ij i j
p P X A Y B = e e
. .
[ ] [ ]
i i j j
p X A p Y B = e = e
. . ij ij i j
e np np p = =
. . . .
. .

j i j i
ij ij i j
N N N N
e np np p n
n n n
= = = =
2
2 2
0 ( 1)( 1)
1 1
( )
, tem uma distribuio assinttica de um .

L C
ij ij
L C
i j ij
N e
X sob H
e
_

= =

1
2
( 1)( 1) L C
o
_


8
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
43
TESTE DO QUI-QUADRADO- Teste de Independncia
Regra prtica:
Como a distribuio da estatstica de teste assinttica,
convm que as clulas no tenham valores esperados
muito pequenos.
Como regra prtica, utiliza-se a seguinte:
No mximo, 20% das clulas podem ter frequncia esperada <5
e nenhuma clula deve ter frequncia esperada <1.
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
44
TESTE DO QUI-QUADRADO- Teste de Independncia
Exemplo 6: Dependncia entre bairro e escolha do
sabor de pasta de dentes
Dados: H0: a preferncia pelo sabor
independente do bairro;
H1: a preferncia pelo sabor depende do
bairro
o = 5%
_
2
(L-1)(C-1)= _
2
(4-1)(3-1) = _
2
(6)
Frequncia esperada = (soma da linha i) x (soma da coluna j)/(total de observaes)
. .

i j
ij
N N
e
n
=
Sabor
Bairros
A B C
Limo 70 44 86 200
Chocolate 50 30 45 125
Hortel 10 6 34 50
Menta 20 20 85 125
150 100 250 500
2
2 2
0 ( 1)( 1)
1 1
( )
, tem uma distribuio assinttica de um .

L C
ij ij
L C
i j ij
N e
X sob H
e
_

= =

Isabel Fraga Alves


FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
45
TESTE DO QUI-QUADRADO - Teste de Independncia
Exemplo 6: (cont.)
Tabela de frequncias esperadas
x
2
=37.88
_
2
0.95
(6)=12.6
x
2
> _
2
0.95
(6)
Deciso: rejeita-se H0.
SABOR
BAIRRO
A B C
Limo 60 40 100
Chocolate 37.5 25 62.5
Hortel 15 10 25
Menta 37.5 25 62.5
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
46
Em 1956, o nmero de pessoas que morreram de tuberculose em Inglaterra e Gales foi
5375. Destas, 3804 foram homens e 1571 eram mulheres; 3534 homens e 1319 mulheres
morreram de tuberculose do sistema respiratrio, enquanto o restante morreu de outras
formas de tuberculose. Os dados esto na seguinte tabela de contingncia:
H
0
: tipo de tuberculose (TB) que causa a morte a estes indivduos independente
do seu sexo.
e
11
= (4853 x 3804) / 5375 = 3434.6; etc.

2
= (3534 3434.6)
2
/ 3434.6 + (1319 1418.4)
2
/ 1418.4 + + (252 152.6)
2
/ 152.6 = 101.35
Para o=0.05 temos
2
0.95
(1)(1)=3.84. Rejeitamos H
0
se
2
> 3.84 o que o caso.
Concluso: H evidncia de uma associao entre tipo de TB e sexo.
Observao: p-value < 0.00001.
Exemplo com tabela de contingncia 2 x 2
Homens Mulheres Total
TB no SR 3534 1319 4853
Outras TB 270 252 522
Total 3804 1571 5375
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
47
Correco de Yates para tabelas 2x2
No caso especfico de tabelas 2 x 2 devemos usar a
Correco de Yates para continuidade.
Para o problema anterior, Yates
2
= 100.39.
2
2 2
2
1 1
( 0.5)
*

ij ij
i j ij
N e
X
e
= =

=

Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
48
No R, temos:
x<-matrix(c(3534,1319,270,252),ncol=2,byrow=T)
et<-chisq.test(x)
names(et)
et
et$expected
#quantil
qchisq(0.05,1, ncp=0, lower.tail = F)
#p-valor
pchisq(100.3915,1, ncp=0, lower.tail = F)
#density
plot(density(rchisq(500,df=1)))
points(qchisq(0.05,1, ncp=0, lower.tail = F),0,pch=19,col=2)
TESTE DO QUI-QUADRADO - Teste de Independncia
9
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
49
Teste Exacto de Fisher
O teste ideal para aplicar com tabelas de contingncia
de dados pequenos esparsos e no balanceados.
Embora seja aplicvel noutras situaes, vamos sempre
usar em tabelas 2 x 2 .
um teste exacto, portanto um p-value exacto.
A ideia geral considerando a tabela de observaes,
gerar as tabelas com as mesmas margens, que so
mais extremas que a observada, na mesma direco da
nossa observao ie, que a proporo TB do tipo SR
nas mulheres menor que proporo TB tipo SR nos
homens.
Teste Exato de Fisher
Caracterstica
(sim)
Caracterstica
(no)
Total
Population 1 a A-a A
Population 2 b B-b B
a+b A+B-a-b
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
50
H0: a proporo com a caracterstica de interesse a mesma nas duas
populaes
Bilateral
H1: a proporo com a caracterstica de interesse no a mesma nas duas
populaes (no R: fisher.test(x))
Unilateral
H1: a proporo com a caracterstica de interesse na populao 1 menor que
na populao 2 (no R: fisher.test(x,alternative=less))
H1: a proporo com a caracterstica de interesse na populao 1 maior que
na populao 2 (no R: fisher.test(x,alternative=greater))
Teste Exacto de Fisher (cont.)
Para o exemplo anterior temos no R:
x<-matrix(c(3534,1319,270,252),ncol=2,byrow=T)
fisher.test(x)
Fisher's Exact Test for Count Data
data: x
p-value < 2.2e-16
alternative hypothesis: true odds ratio is not equal
to 1
95 percent confidence interval:
2.073019 3.014822
sample estimates:
odds ratio
2.500202
Teste dos Sinais
Contrapartida no-paramtrica para
Teste-t para amostras
emparelhadas
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
53
Amostras Emparelhadas - O Teste dos Sinais
Populao X Populao Y
1 1 2 2
( , ), ( , ), , ( , )
n n
X Y X Y X Y
0 1
: localizaao de localizaao de . : localizaao de localizaao de
( > ) ou ( < )
H X Y vs H X Y = =
| | | |
0
, 0 0 1/ 2; sobH P D P D > = < =
{ }
| |
0
: =# : 0 ; , ( , 1/ 2),
com :
i i
M D D sob H M Binomial n p
p P X Y
> =
= >
Diferenas: : ; : ;
i i i
D X Y D X Y = =
0 1
: ( ) 0 . : ( ) 0
( > ) ou ( < )
H Med D vs H Med D = =
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
54
Amostras Emparelhadas - O Teste dos Sinais
(pequenas amostras)

Regio de Rejeio para:


Unilateral Rejeitar para os maiores valores de M (m)
Unilateral Rejeitar para os menores valores de M (m)
Bilateral Rejeitar para os menores e maiores valores de M (m)
No R:
P[Binomial(n,1/2)<=m]=pbinom(q=m,size=n,prob=.5,lower.tail = F)
Observao: Sempre que se verificarem ligaes, isto e, valores Xi=Yi, esses valores
so desprezados, diminuindo-se a dimenso da amostra.
| | ( ,1/ 2) , P Binom p valu ia m l n e = >
0 1
: 1/ 2 . : 1/ 2 (ou 1/ 2 ou 1/ 2) H p vs H p p p = > < =
| | ( ,1/ 2) , P Binom p valu ia m l n e = s
1
: 1/ 2 H p >
1
: 1/ 2 H p <
1
: 1/ 2 H p =
| | | | 2 ( ,1/ 2) 2 ( ,1/ 2) , p value m P Binomial n ou P Binomial n m = s = >
10
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
55
Exemplo - Cancro pancretico
Quando os pacientes tm Cancro pancretico, muitas vezes a
cirurgia necessria para remover a parte do pncreas que tem o
cancro. Quando estas cirurgias so concludas, o cirurgio tem a
opo de fazer uma cirurgia mais complexa para preservar o bao
(preservao bao) ou para remover o bao como parte de
cirurgia (Esplenectomia).
Um estudo foi feito para comparar as duas opes cirrgicas em
termos de resultados de sade, nus de custo e tempo na equipa
cirrgica.
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
56
Questo
Uma pergunta para cada tcnica determinar o efeito da cirurgia
sobre a contagem de plaquetas em pacientes. As plaquetas esto
envolvidas na coagulao dos pacientes; por vezes, aos pacientes
em cirurgia so dados medicamentos para limitar a quantidade de
coagulao durante a cirurgia.
Uma grande mudana no nmero de plaquetas pode ser um sinal
de que a cirurgia foi particularmente difcil.
Para cada tcnica, os cirurgies pretendiam determinar se h uma
diferena significativa na pre e post contagem de plaquetas de
cirurgia.
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
57
Exemplo - Cancro pancretico(cont.)
Em primeiro lugar, vamos ver o
grupo de preservao bao
Observe que temos
observaes emparelhadas para
cada um dos pacientes
Estamos interessados na
diferena entre duas medies
Ser que efectivamente h uma
diferena?
Paciente Pre Post Dif
1 260 223 37
2 216 149 67
3 427 224 203
4 217 181 36
5 613 708 -95
6 245 197 48
7 371 303 68
8 236 168 68
9 421 312 109
10 677 521 156
11 363 202 161
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
58
Histograma
Uma vez que temos dados
emparelhados, poderamos
utilizar o teste-t emparelhado.
O que se pode dizer sobre a
distribuio das diferenas?
A suposio de normalidade
do t-teste emparelhado
parece adequada?
A diferena na contagem de
plaquetas pode ser varivel e
conter outliers
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
59
A hiptese nula para a nossa investigao que no h
nenhuma diferena na contagem de plaquetas, antes e aps a
cirurgia.
Para o t-teste de duas amostras, isto seria escrito como
H
0
: diferena mdia (pre-post) igual a zero (d = 0)
Neste caso, temos outliers, portanto, a mdia no uma boa
medida de tendncia central.
Que medida se deve usar alternativamente?
Como podemos estabelecer e testar a hiptese nula
adequada?
Exemplo - Cancro pancretico(cont.)
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
60
Teste dos Sinais
O teste no-paramtrico mais simples o
Teste dos Sinais
H
0
: mediana de diferenas (pre-post) = 0
H
1
: mediana de diferenas (pre-post) 0
Sob a hiptese nula, seria de esperar o mesmo nmero de sinais
positivos e negativos.
Se a maioria ou todas as diferenas so positivas, haveria algumas provas
contra a hiptese nula.
At que ponto podem ser significativas?
| | | |
0
: ; , 0 0 1/ 2;
i i i i i
D X Y sobH P D P D = > = < =
{ }
| |
0
: =# : 0 ; , ( , 1/ 2),
com :
i i
M D D sob H M Binomial n p
p P X Y
> =
= >
11
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
61
Teste dos Sinais
Agora inclumos a coluna
dos SINAIS
Se no houve realmente
nenhum efeito da terapia,
seria de esperar que iria
haver um nmero igual de
sinais (+ , - )
O que se pode ver sobre
os sinais das diferenas?
H uma diferena
significativa entre os dois
grupos?
Como se pode calcular o
p-value ?
Paciente Pre Post Dif SINAL
1 260 223 37
+
2 216 149 67
+
3 427 224 203
+
4 217 181 36
+
5 613 708 -95
-
6 245 197 48
+
7 371 303 68
+
8 236 168 68
+
9 421 312 109
+
10 677 521 156
+
11 363 202 161
+
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
62
Teste dos Sinais
O p-value a probabilidade de se obter o valor observado ou algo mais
extremo sob a hiptese nula
(p = 1/2).
Para o Teste dos Sinais, esta a probabilidade do nmero observado de
sinais positivos ou mais. Para fazer o teste bilateral, devemos ter em
conta tambm os valores extremos do outro lado.
Hiptese nula e alternativa:
p-value:
0 1
: 1/ 2 . : 1/ 2 H p vs H p = =
| | 2 ( ,1/2) , 11, 10 P Binomial n p valu n e m m = = = >
> 2*pbinom(q=10, size=11, prob=.5, lower.tail = F)
[1] 0.0009765625
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
63
Exemplo - Cancro pancretico(concluso)
Teste dos Sinais
Dados Emparelhados, o = 5%
Hipteses
H
0
: mediana das diferenas = 0 (p = 1/2)
H
1
: mediana das diferenas 0 (p 1/2)
M teve o valor observado de m = 10 (# sinais +)
p-value = 0.001
Rejeitar a hiptese nula
Concluso:
H uma diferena significativa entre os valores de plaquetas pr e
ps-cirurgia para pacientes que tinham a cirurgia de
preservao bao.
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
64
Teste dos Sinais Grandes amostras
n grande , ie, n +
Nas aplicaes, para n > 25
/ 2
(0,1)
(1 ) 1/ 2
d
M np M n
np p n

=

N
/ 2
(0,1)
1/ 2
M n
Z
n

~ N
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
65
Teste dos Sinais Grandes amostras
Hiptese nula e alternativa
bilateral:
p-value:
Regio de Rejeio, ao nvel
de significncia o :
0 1
: 1/ 2 . : 1/ 2 H p vs H p = =
| |
| |
/ 2 / 2 / 2
2 2 2{1 ( )},
1/ 2 1/ 2 1/ 2
/ 2 / 2
2 2 2 ( ).
1/ 2 1/ 2
M n n n
P P Z z z z
n n n
M n n
ou P
m m
p value
m
P Z z z
n n
(
= > ~ > = u =
(

(
= s ~ s = u
(

1
/2 /2 /2
, : (1 /2), quantil da Normal(0,1) Z z ou Z z z
o o o
o

> s =u
/ 2 o / 2 o
/ 2
z
o / 2
z
o

Isabel Fraga Alves


FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
66
Teste dos Sinais Grandes amostras
Hiptese nula e alternativa unilateral :
p-value:
Regio de Rejeio, ao nvel de significncia o :
0 1
: 1/ 2 . : 1/ 2 H p vs H p = >
| |
/ 2 / 2 / 2
1 ( ), .
1/ 2 1/ 2 1/ 2
m m
p
M n n n
P P Z z z z
n n n
value
(
= > ~ > = u =
(

1
/ 2
, : (1 ), quantil da Normal(0,1), :
1/ 2
M n
Z z z Z
n
o o
o


> = u =
o
z
o
12
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
67
Teste dos Sinais Grandes amostras
Hiptese nula e alternativa unilateral :
p-value:
Regio de Rejeio, ao nvel de significncia o :
0 1
: 1/ 2 . : 1/ 2 H p vs H p = <
| |
/ 2 / 2 / 2
( ), .
1/ 2 1/ 2 1/ 2
m m
p
M n n n
P P Z z z z
n
value
n n
(
= s ~ s = u =
(

1
/ 2
, : (1 ), quantil da Normal(0,1), :
1/ 2
M n
Z z z Z
n
o o
o


s = u =
o
z
o

Isabel Fraga Alves


FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
68
Teste dos Sinais Grandes amostras
EXEMPLO - Sessenta alunos matricularam-se num curso de ingls. Na primeira aula aplica-se um
teste que mede o conhecimento da lngua. Aps seis meses, aplica-se um segundo teste. Os
resultados mostram que 35 alunos apresentaram melhora (35 +), 20 se conduziram melhor no
primeiro teste (20 -) e 5 no apresentaram modificaes (5 0). Ser que o curso melhorou o
conhecimento de ingls?
H0: O curso no alterou o conhecimento de ingls
H1: O curso melhorou o conhecimento de ingls
o= 5%
Clculo da varivel
m - nmero de sinais positivos (35);
n tamanho da amostra descontado os empates (60-5=55)
Z
1-0.05
= Z
0.95
= 1.64, logo se rejeita Ho, ie, o curso no melhorou o conhecimento de ingls
No R: > qnorm(0.95)
/ 2
1/ 2
M n
Z
n

=
/ 2 35 55/ 2
2.02
1/ 2 1/ 2 55
n
z
m
n

= = =
Teste de Wilcoxon
Contrapartida no-paramtrica para
Teste-t para amostras
emparelhadas
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
70
Amostras Emparelhadas - O Teste de Wilcoxon
(pequenas amostras)
Populao X Populao Y

O Teste de Wilcoxon uma extenso do Teste de Sinais. mais interessante


pois leva em considerao a magnitude da diferena para cada par.
O teste de sinal analisa apenas o sinal das diferenas, mas o Teste de Wilcoxon
usa o sinal e ordena as diferenas.
1 1 2 2
( , ), ( , ), , ( , )
n n
X Y X Y X Y
0 1
: distribuiao de distribuiao de . : localizaao de localizaao de

(Teste Bilateral)

H X Y vs H X Y = =
( > ) ou ( < ) (Teste Uni late ral)
: ; : ;
i i i
Diferenas D X Y D X Y = =
0 1
: ( ) 0 . : ( ) 0
( > ) o
(Teste Bilateral
u ( < )
)
(Teste Unilateral)
H Med D vs H Med D = =
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
71
Teste de Wilcoxon (Pequenas Amostras Emparelhadas)
1. Obter as diferenas, D
i
= X
i
- Y
i
2. Obter os Valores Absolutos das diferenas, |D
i
|
3. Desprezar as diferenas de Valor 0 (empates)
diminuindo do mesmo nmero de unidades, a
dimenso da amostra.
4. Atribuir Ordens, onde a Menor = 1
5. Atribuir Ordens para diferenas - e +
6. Somar as Ordens + (T
+
) & Ordens - (T
-
)
Estatstica de Teste
T
-
ou T
+
(Teste Unilateral)
Estatstica de Teste
T:=min(T
-
, T
+
) (Teste Bilateral)
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
72
Teste de Wilcoxon (Pequenas Amostras Emparelhadas)
Motivao para a Regio de Rejeio:
Sob a validade de H
0
,
de esperar que a soma das ordens positivas (T
+
) no
difira grandemente da soma das ordens negativas (T
-
).
Uma soma grande para as ordens positivas (T
+
)
relativamente a soma das ordens negativas (T
-
),
implica que a Mediana das Diferenas, Med(D), tenha
uma pequena probabilidade de ser igual a zero.
13
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
73
Teste de Wilcoxon (Pequenas Amostras Emparelhadas)
Rejeitar H
o
se T T0 (Tabela 9), com
T:=min(T
-
, T
+
)
H
o
: Med(D) =0 (As distribuies de X e de Y so idnticas)
Teste Bilateral
H
1
: Med(D)= 0 (As distribuies de X e de Y diferem na localizao)
No R:
wilcox.test(x,y,alternative = c("two.sided"),paired =T)
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
74
Teste de Wilcoxon (Pequenas Amostras Emparelhadas)
Rejeitar H
0
se T
-
T0
H
o
: Med(D) = 0 (As distribuies de X e de Y so idnticas)
Teste Unilateral
H
1
: Med(D) > 0
(A distribuio de X tem
localizao direita da
localizao de Y)
H
1
: Med(D) < 0
(A distribuio de Y tem
localizao direita da
localizao de X)
Rejeitar H
0
se T
+
T0
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
75
Teste de Wilcoxon (Grandes Amostras Emparelhadas)
n grande , ie, n +
Nas aplicaes, para n > 25
( 1) / 4
(0,1)
( 1)(2 1) / 24
d
T n n
n n n
+
+

+ +
N
( 1) / 4
(0,1)
( 1)(2 1) / 24
T n n
Z
n n n
+
+
~
+ +
N
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
76
Teste de Wilcoxon (Grandes Amostras Emparelhadas)
1
/ 2 / 2 / 2
, : (1 / 2), z ou z z
o o o
o

> s = u Z Z quantil da N(0,1)


ie, Rejeitar H
o
se |Z| > z
o/2
Teste Bilateral
H
o
: Med(D) = 0 (As distribuies de X e de Y so idnticas)
H
1
: Med(D)= 0 (As distribuies de X e de Y diferem na localizao)
( 1) / 4
:
( 1)(2 1) / 24
n n
n n n
+
=
+ +
+
T
Z
p-value:
Regio de Rejeio, ao nvel de significncia o :
| | 2 2{1 ( )}. P Z z z = > = u
/ 2 o / 2 o
/ 2 zo / 2 zo
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
77
Teste de Wilcoxon (Grandes Amostras Emparelhadas)
1
, : (1 ) z z
o o
o

> = u Z
Teste Unilateral
H
o
: Med(D) = 0 (As distribuies de X e de Y so idnticas)
H
1
: Med(D)> 0
(localizao de X direita
da localizao de Y)
p-value:
Regio de Rejeio, ao nvel de significncia o :
| | 1 ( ). P z z > = u Z
H
1
: Med(D)< 0 (localizao
de X esquerda da
localizao de Y)
1
, : (1 ) z z
o o
o

s = u Z
| | ( ). P z z = u s Z p-value:
o
zo
o
zo
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
78
Exemplo - Cancro pancretico
Agora, podemos analisar o
grupo que teve interveno
cirrgica com Esplenectomia
Novamente, temos
observaes emparelhadas
sobre cada um dos
pacientes, e estamos
interessados na diferena
entre duas medies de
plaquetas.
Ser que h uma diferena
significativa?
Patient Pre Post
1 492 375
2 297 382
3 272 325
4 367 585
5 206 181
6 284 237
7 338 273
8 212 243
9 161 147
10 384 326
11 224 214
12 251 292
13 224 263
14
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
79
Exemplo - Cancro pancretico - Teste de Wilcoxon
A hiptese nula para a nossa
investigao que no h nenhuma
diferena na contagem de plaquetas, antes e
aps a cirurgia com Esplenectomia .
H
0
: Med(D) = 0
H
1
: Med(D) 0
Rejeitar Ho se T T
0
(Tabela 9),
com
T:=min(T- , T+)
Valor observado de T = 44
T
0
(Tabela 9): n=13
Two-sided p=0.10
T
0
=21
Ento: T >T
0,
no se rejeita H
0.
Concluso: No h nenhuma evidncia de
uma diferena entre o pr e ps contagem
plaquetas para os pacientes que tinham
uma Esplenectomia durante sua cirurgia.
Pacient
e
Pre Post Di |Di| Ordem T+ T-
1 492 375 117 117 12 12
2 297 382 -85 85 11 11
3 272 325 -53 53 8 8
4 367 585 -218 218 13 13
5 206 181 25 25 3 3
6 284 237 47 47 7 7
7 338 273 65 65 10 10
8 212 243 -31 31 4 4
9 161 147 14 14 2 2
10 384 326 58 58 9 9
11 224 214 10 10 1 1
12 251 292 -41 41 6 6
13 224 263 -39 39 5 5
44 47
No R:
x=c(492,297,272,367,206,284,338,212,161,384,224,251,224)
y=c(375,382,325,585,181,237,273,243,147,326,214,292,263)
wilcox.test(x, y ,alternative = c("two.sided"),paired =T)
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
80
Concluses
Os nossos testes de hipteses mostram que:
os doentes a partir do grupo de preservao bao tinham uma
mudana significativa na sua contagem de plaquetas aps cirurgia (rej H0)
e os pacientes do grupo Esplenectomia no tm uma mudana
significativa na sua contagem de plaquetas aps cirurgia (no rej H0).
Estes resultados podem mostrar que a cirurgia de
preservao bao difcil para o paciente e outras
medidas devem ser investigadas para garantir que esta
cirurgia no excessivamente agressiva para os de
pacientes.
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
81
Comentrios
Quando ns temos dados emparelhados e os pressupostos
de um teste-t emparelhado no forem pressupostos, temos
duas maneiras para elaborar o teste de hipteses sobre a
localizao:
O Teste de Wilcoxon sempre preferido ao Teste dos
Sinais j que usa mais informao contida nos dados (j que usa as
ordens).
O Teste de Wilcoxon tem muito mais potncia do que o
Teste dos Sinais para detectar uma diferena significativa.
No h uma grande perda de potncia no Teste de Wilcoxon
comparado a um teste-t quando se mantm a suposio de
normalidade.
Por outro lado, o Teste de Wilcoxon muito mais potente do que
o teste-t quando no vlida a suposio de normalidade.
Teste Mann-Whitney
Contrapartida no-paramtrica para
Teste-t para amostras
independentes
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
83
Teste Mann-Whitney pequenas amostras independentes
1. Testes para Duas Populaes, X e Y, Independentes
2. Corresponde ao Teste-t para 2 valores mdios
3. Pressupostos
Amostras Aleatrias Independentes (dimenses n
1
e n
2
)
Populaes Contnuas
4. Aproximao Normal se n
i
> 10
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
84
Teste Mann-Whitney pequenas amostras independentes
H
0
: X e Y tm distribuio idntica
H
1
: As distribuies de X e Y diferem na Localizao
T
1
= Soma das Ordens das Observaes da amostra 1
na amostra conjunta de dimenso n=n
1
+ n
2
T
2
= Soma das Ordens das Observaes da amostra 2
na amostra conjunta de dimenso n=n
1
+ n
2
15
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
85
U
1
= n
1
n
2
+ - T
1
n
1
(n
1
+ 1)
2
U
2
= n
1
n
2
+ - T
2
n
2
(n
2
+ 1)
2
Teste Mann-Whitney pequenas amostras independentes

Isabel Fraga Alves


FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
86
Teste Mann-Whitney procedimento
1. Atribuir Ordens para as n=n
1
+ n
2
Observaes
Amostrais
Se n
1
n
2
, considera-se o ndice 1 para a menor
dimenso (n
1
)
Menor Ordem = 1, Maior Ordem = n
Valores Iguais (ligaes) so subsitudos pela
respectiva mdia das ordens.
2. Somar as Ordens, T
i
, i=1,2, para cada Amostra
A distribuio exacta da ET, U , pode ser calculada
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
87
Teste Bilateral
H
1
: As duas populaes, X e Y, diferemna localizao
Rejeitar H
0
ao nvel ose o valor observado de U , u, for tal que
p-value = 2 P[U < u ] s o
Teste Mann-Whitney pequenas amostras independentes
Procedimento:
1. Assumir que n
1
n
2
(inverter as amostras se
necessrio)
2. Determinar U
1
e U
2
3. U := min (U
1
,U
2
)
4. Usar os valores da Tabela 8 para testar H
0
vs H
1
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
88
Procedimento:
1. Assumir que n
1
n
2
(inverter as amostras se
necessrio)
2. Determinar U
1
e U
2
3. Usar os valores da Tabela 8 para testar H
0
vs H
1
Teste Unilateral
H
1
: A populao 1 (X) est
localizada direita da
populao 2 (Y)
Rejeitar H
0
ao nvel o se o valor
observado de U
1
, u
1
, for tal
que
p-value=P[U < u
1
]s o, com
U = U
1
Teste Unilateral
H
1
: A populao 1 (X) est
localizada esquerda da
populao 2 (Y)
Rejeitar H
0
ao nvel o se o valor
observado de U
2
, u
2
, for tal
que
p-value=P[U < u
2
]s o, com
U = U
2
Teste Mann-Whitney pequenas amostras independentes
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
89
Z:=
U
2
-
U
o
U
2
2
Teste Mann-Whitney grandes amostras independentes
Aproximao Normal

n
1
n
2
2

U
=
2
n
1
n
2
(n
1
+ n
2
+ 1)
12
o
U
=
2
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
90
Teste Mann-Whitney grandes amostras independentes
Rejeitar H
o
se | Z| > Z
o/2
H
1
: As distribuies de X e Y diferem na Localizao
Teste Bilateral
H
0
: X e Y tm distribuio idntica
Determine U
2
= n
1
n
2
+ - T
2
n
2
(n
2
+ 1)
2
Z
o/2
:= u
-1
(1- o/2), u(.) f.d. da N(0,1)
/ 2 o / 2 o
/ 2 zo / 2 zo
16
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
91
Teste Mann-Whitney grandes amostras independentes
H
0
: X e Y tm distribuio idntica
Determinar U
2
= n
1
n
2
+ - T
2
n
2
(n
2
+ 1)
2
Teste Unilateral
H
1
: A populao 1 (X) est
localizada direita da
populao 2 (Y)
Rejeitar H
0
se Z> z
o
Teste Unilateral
H
1
: A populao 1 (X) est
localizada esquerda
da populao 2 (Y)
Rejeitar H
0
se Z< -z
o
o
zo
o
zo
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
92
Teste Mann-Whitney Exemplo
Suponha que um gestor de produo e est interessado em investigar
se as taxas de produo de 2 fbricas so iguais. Para a fbrica 1, as
taxas (% de capacidade) so 71, 82, 77, 92, 88. Para a fbrica 2, as
taxas so 85, 82, 94, 97. Tero as taxas de produo das 2 fbricas a
mesma distribuo de probabilidade ao nvel de .10 ?
H0: Distribuio Idntica
Ha: Localizao Diferente
o = .10
n1 = 4 n2 = 5
Pontos crticos:
Estatstica de Teste :
Deciso:
Concluso:
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
93
Teste Mann-Whitney Exemplo
Fbrica 1 Fbrica 2
Taxa Ordem Taxa Ordem
71 85
82 82
77 94
92 97
88 ... ...
Soma
das Ordens
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
94
Teste Mann-Whitney Exemplo
Fbrica 1 Fbrica 2
Taxa Ordem Taxa Ordem
71 1 85
82 82
77 94
92 97
88 ... ...
Soma
das Ordens
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
95
Teste Mann-Whitney Exemplo
Fbrica 1 Fbrica 2
Taxa Ordem Taxa Ordem
71 1 85
82 82
77 2 94
92 97
88 ... ...
Soma
das Ordens
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
96
Teste Mann-Whitney Exemplo
Fbrica 1 Fbrica 2
Taxa Ordem Taxa Ordem
71 1 85
82 3 82 4
77 2 94
92 97
88 ... ...
Soma
das Ordens
17
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
97
Teste Mann-Whitney Exemplo
Fbrica 1 Fbrica 2
Taxa Ordem Taxa Ordem
71 1 85
82 3 3.5 82 4 3.5
77 2 94
92 97
88 ... ...
Soma
Das Ordens
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
98
Teste Mann-Whitney Exemplo
Fbrica 1 Fbrica 2
Taxa Ordem Taxa Ordem
71 1 85 5
82 3 3.5 82 4 3.5
77 2 94
92 97
88 ... ...
Soma
Das Ordens
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
99
Teste Mann-Whitney Exemplo
Fbrica 1 Fbrica 2
Taxa Ordem Taxa Ordem
71 1 85 5
82 3 3.5 82 4 3.5
77 2 94
92 97
88 6 ... ...
Soma
Das Ordens
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
100
Teste Mann-Whitney Exemplo
Fbrica 1 Fbrica 2
Taxa Ordem Taxa Ordem
71 1 85 5
82 3 3.5 82 4 3.5
77 2 94
92 7 97
88 6 ... ...
Soma
Das Ordens
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
101
Teste Mann-Whitney Exemplo
Fbrica 1 Fbrica 2
Taxa Ordem Taxa Ordem
71 1 85 5
82 3 3.5 82 4 3.5
77 2 94 8
92 7 97
88 6 ... ...
Soma
das Ordens
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
102
Teste Mann-Whitney Exemplo
Fbrica 1 Fbrica 2
Taxa Ordem Taxa Ordem
71 1 85 5
82 3 3.5 82 4 3.5
77 2 94 8
92 7 97 9
88 6 ... ...
Soma
Das Ordens
18
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
103
Teste Mann-Whitney Exemplo
Fbrica 1 Fbrica 2
Taxa Ordem Taxa Ordem
71 1 85 5
82 3 3.5 82 4 3.5
77 2 94 8
92 7 97 9
88 6 ... ...
Soma
Das Ordens
19.5 25.5
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
104
Teste Mann-Whitney Exemplo
Suponha que um gestor de produo e est interessado em investigar
se as taxas de produo de 2 fbricas so iguais. Para a fbrica 1, as taxas
(% de capacidade) so 71, 82, 77, 92, 88. Para a fbrica 2, as taxas so
85, 82, 94, 97. Tero as taxas de produo das 2 fbricas a mesma
distribuo de probabilidade ao nvel de .10 ?
H0: Distribuio Idntica
Ha: Localizao Diferente
o = .10
n1 = 4 n2 = 5
Estatstica de Teste :
T1 = 5 + 3.5 + 8+ 9 = 25.5
(Amostra de dimenso mais pequena)
p-value= 2P[ U1< 4.5 ] >2P[ U1< 4] =2x 0.0952
Deciso:
No Rejeitar ao nvel de o = 10%
Concluso:
No existe evidncia estatstica que nos permita duvidar que as 2
Fbricas tm Taxas de Produo Idnticas, ao nvel de 10%.
1 1
1 1 2 1
( 1) 4 5
4 5 25.5 4.5
2 2
n n
U n n T
+
= + = + =
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
105
Teste Mann-Whitney Exemplo
Suponha que um gestor de produo e est interessado em investigar
se as taxas de produo de 2 fbricas so iguais. Para a fbrica 1, as taxas
(% de capacidade) so 71, 82, 77, 92, 88. Para a fbrica 2, as taxas so
85, 82, 94, 97. Tero as taxas de produo das 2 fbricas a mesma
distribuo de probabilidade ao nvel de .10 ?
H0: Distribuio Idntica
Ha: Localizao Diferente
o = .10 n1 = 4 n2 = 5
No R:
x<-c(71, 82, 77, 92, 88)
y<-c(85, 82, 94, 97)
wilcox.test(x, y ,alternative = c("two.sided"),paired =F)
Wilcoxon rank sum test with continuity correction
data: x and y
W = 4.5, p-value = 0.2187
alternative hypothesis: true location shift is not equal to 0
Teste de Kruskal-Wallis
Contrapartida no-paramtrica para
ANOVA completely
randomized
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
107
Teste de Kruskal-Wallis
A anlise da varincia leva em considerao que
as variveis so independentes,
tem uma distribuio normal com uma varincia
comum (homogeneidade das varincias)
mdia constante em cada coluna.
O teste Kruskal-Wallis um mtodo no
paramtrico.
No leva em considerao formas especficas de
distribuio.
Contrapartida no-paramtrica para
ANOVA completely randomized
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
108
Teste Kruskal-Wallis
Trata-se de um teste para decidir se
k amostras de dimenses ni, i=1,,k, (k>2) independentes
provmde
Ho: k populaes com distribuies idnticas.
versus
H1: pelo menos duas das k populaes diferem
na localizao.
Considerar a amostra global das n = n
i
observaes e
atribua Ordens.
Calcular as Somas das Ordens R
i
, para cada amostra
i=1,,k.
19
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
109
Teste Kruskal-Wallis
Estatstica de Teste:
Semempates
Com empates( Siegel & Castellan 88, pg.210)
g := n de grupos de empates distintos
tj := n de valores empatados no grupo j de
empates, j=1,,g
2
* 2
1 1
12 12
3( 1) ( ) ,
( 1) ( 1)
/ e ( 1) / 2
k k
i
i i
i i i
i i i
R
H H n n R R
n n n n n
R R n R n
= =
= = + =
+ +
= = +

*
3
1
3
( )
1
g
j j
j
H
H
t t
n n
=
=

Isabel Fraga Alves


FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
110
Teste Kruskal-Wallis Grandes Amostras
Sob a hiptese nula, Estatstica de Teste H
segue aproximadamente um Qui-Quadrado com g.l.= k-1
Deciso: Rejeitar Ho se o valor da ET de K-W
grande
Rejeitar hiptese nula Ho se H >
2
k-1, 1-

2
k-1, 1-
Deve-se usar apenas quando a mais pequena das
dimenses n
i
5.
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
111
Teste Kruskal-Wallis Pequenas Amostras
Quando k= 3 e n
i
s 5, sem empates:
os Quantis w
c
, c =0.90, 0.95, 0.99 da
distribuio exacta da ET K-W esto
tabelados na
Tabela A8 (Conover 80)
Deciso: (ao nvel )
Rejeitar hiptese nula Ho se H > w
1-
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
112
Teste de Kruskal-Wallis
Primeiramente, os dados so convertidos em ordens.
Considere os 4 Tratamentos seguintes, A, B, C, D, cada
um com cinco rplicas.
Podemos dizer que esses valores so provenientes da
mesma distribuio?
Ou seja, no existe uma diferena significativa entre os
Tratamentos?
Tratamentos A B C D
27 48 11 44
14 18 0 72
8 32 3 81
18 51 15 55
7 22 8 39
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
113
Teste de Kruskal-Wallis
Ordenao
Nota:
As diferenas nos pontos mdios (Ri/ni) indicam diferenas nos grupos.
i
i
i
i
i
i
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
114
Teste de Kruskal-Wallis
A hiptese nula que todos os grupos vem da
mesma populao.
Seja n = 20, o tamanho da amostra total.
A Estatstica de Teste
Para nosso exemplo
2
*
1
12
3( 1)
( 1)
k
i
i i
R
H n
n n n
=
= +
+

| |
*
12
259.2 884.45 92.45 1479.2 3 (21) 14.6
20 21
H
(
= + + + =
(

20
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
115
Teste de Kruskal-Wallis
Factor de Correco:
Com g = 2 (valores 8 e 18), t1 = t2 = 2 (dois valores 8 e dois valores 18),
A Estatstica de Teste corrigida
Para nosso exemplo
14.6
14.622
0.9985
H = =
*
2
3
1
3
( )
1
j j
j
H
H
t t
n n
=
=

2
3
3
1
3 3
( )
2(2 2) 12
1 1 1 0.9985
20 20 7980
j j
j
t t
n n
=

= = =

Isabel Fraga Alves


FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
116
Teste de Kruskal-Wallis
DECISO:
Logo, a hiptese nula deve ser rejeitada, ou seja,
as amostras no pertencem a mesma populao.
Comparao deste valor com o quantil _2 com (k -1=3)
graus de liberdade.
Da tabela do _2 com 3 graus de liberdade temos

2
3, 0.95
=7.81 para 95%.
Como H = 14.622

2
3
7.81 14.5

2
3, 0.95
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
117
Teste de Kruskal-Wallis
No R:
aa <- c(27,14,8,18,7) # tratamento A
bb <- c(48,18,32,51,22) # tratamento B
cc <- c(11,0,3,15,8) # tratamento C
dd <- c(44,72,81,55,39) #tratamento D
grupo <- factor(rep(1:4, each=5),labels = c("A","B","C","D"))
grupo
r<-rank(c(aa,bb,cc,dd))
R<-tapply(r,grupo,sum)
R
n=20
hstar= (12/(n*(n+1))) * sum(R^2/5) - 3*(n+1)
hstar
#Fator de correo
t=c(2,2)
correction=1-sum(t^3-t)/(n^3-n)
correction
h=hstar/correction
h
#h sob ho segue qui-quadrado com k-1 graus de liberdade=3
p.valor<-pchisq(h,df=3,lower.tail=F)
p.valor
quantil<-qchisq(p=0.95, df=3, lower.tail = TRUE)
quantil
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
118
Teste de Kruskal-Wallis
No R:
kruskal.test(list(aa,bb,cc,dd))
Outro exemplo
## Mucociliary efficiency from the rate of removal of
## dust in normal subjects, subjects with obstructive
## airway disease, and subjects with asbestosis.
x <-c(2.9, 3.0, 2.5, 2.6, 3.2) # normal subjects
y <-c(3.8,2.7,4.0,2.4)# with obstructive airway disease
z <-c(2.8, 3.4, 3.7, 2.2, 2.0) # with asbestosis
Teste do Coeficiente de
correlao ordinal de
Spearman
contrapartida no-paramtrica do
coeficiente de correlao
amostral de Pearson
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
120
Populao X Populao Y (contnuas)
1 1 2 2
( , ), ( , ), , ( , )
n n
X Y X Y X Y
0
: relao ( ) entre e , ie,
e
No existe associaao
independente s o s
H X Y
X Y
Teste do Coef de correlao ordinal de Spearman
1
. : entre exi e ste associaao (Teste Bilateral) vs H X Y
1
. : entre exist e e associaao directa (Teste Unilateral) vs H X Y
1
. : entre existe associaao inversa (Teste Unilateral) e vs H X Y
21
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
121
Teste do Coef de correlao ordinal de Spearman
O coeficiente de correlao ordinal de
Spearman Rs a contrapartida no-paramtrica do
coeficiente de correlao amostral de Pearson, em que
os Xis e os Yis sao substitudos pelas suas ordens.
Para obter r(Xi)=ordem de Xi e r(Yi)= ordem de Yi,
ordenam-se as amostras dos Xis e os Yis separadamente.
Observao:
Num modelo paramtrico e Normal, X e Y so independentes sse o
coeficiente de correlo =corr(X,Y)=0, ie,
testar Ho equivalente a testar Ho: =0, pelo que e natural usar o coeficiente
de correlacao amostral.
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
122
Teste do Coef de correlao ordinal de Spearman
Coeficiente de correlao ordinal de Spearman Rs:
Observao: Se o n de empates for pequeno relativamente ao
n de pares (Xi,Yi) o erro resultante desta ltima expresso
pequeno.
=
=

2
1
2
na Se houver ,
6
1 ,
( 1)
com ( )
o
( ).
n
i
i
i i i
S
d
n n
d r x r
empat
y
es
R
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
123
Teste do Coef de correlao ordinal de Spearman
Regio de Rejeio (Pequenas Amostras):
p-value= 2 min[P(R
S
r
S
), P(R
S
r
S
)] (Teste Bilateral)
= P(R
S
r
S
)
= P(R
S
r
S
) (Testes Unilaterais)
Observao: Se o n de empates for pequeno relativamente ao n
de pares (Xi,Yi) o erro resultante desta ltima expresso pequeno.
Grandes Amostras: para um n de pares (Xi,Yi) elevado,
pode ser aproximada pela N(0,1). n-1
S
R
> s >
> s
0
0 0 0 0
0 0
Tabela 11,
Teste Bilateral

Com escolhido criteriosamente na
Rejeitar H , se { } | |
} { Testes Unilater { } a s i
S S S
S S
r
r ou r r
r ou r
R R R
R R
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
124
Teste de Spearman - Exemplo
Cinco professores de Cincias do
ensino bsico foram classificados
por um jri de acordo com sua
capacidade pedaggica.
Esses mesmos professores
realizaram um "exame nacional
para professores".
Existe acordo entre a classificao
do jri e a classificao no exame?
Se a Ordenao do Jri baixa
(melhor professor), seria de
esperar a Classificao elevada
no exame para professores;
pelo que colocamos na hiptese
alternativa uma associao inversa
entre as variveis Ordenao do
Jri e Classificao no Exame.
Professor 1 2 3 4 5
Ordenao
do Jri
4 2 3 1 5
Classificao
no Exame
72 69 82 93 80
0
1
: ) entre e
.
: entre e

No existe associaao
e

xiste as

sociaao inversa
(Teste Unilateral)
H X Y
vs
H X Y
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
125
Professor
1 2 3 4 5
Ordenao do Jri 4 2 3 1 5
Classificao no Exame 72 69 82 93 80
R(xi) 4 2 3 1 5
R(yi) 2 1 4 5 3
di 2 1 -1 -4 2
Teste de Spearman - Exemplo
Ordenar os Resultados dos Exames (a 1 variavel j est na
forma ordenada). No h empates.
0
1
) entre e
.
entre e

No exis

te associaao
existe asso

ci

aao inversa
(Teste Unilateral)
:

:

H
H
X Y
vs
X Y
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
126
Teste de Spearman - Exemplo
Com nvel de significncia=0.05, n=5
Rejeita-se H0 se Rs <=0
2
2
1
2 2
6
6 6(26)
1 1 1 0.3.
( 1) ( 1) 5(25 1)
S
n
i
i i
d
d
n n n n
r
=

= = =

22
Teste de Spearman - Exemplo
No R:
a <- c(4,2,3,1,5)
b <- c(72, 69,82,93,80)
cor.test(a, b, method="spearman",alternative="less")
Spearman's rank correlation rho
data: a and b
S = 26, p-value = 0.3417
alternative hypothesis: true rho is less than 0
sample estimates:
rho
-0.3
> ?cor.test
Teste de Spearman - Exemplo
Deciso: No Rejeitar Ho.
No existe evidncia suficiente que indique uma
associao negativa entre Ordenao do Jri e
Classificao no Exame, ao nvel de significncia de
5%.