Você está na página 1de 70

ESTATSTICA II

1
2010


Estatstica II
Teoria e exerccios passo-a-passo

Este manual apresenta as estatsticas no paramtricas e os
critrios de deciso para verificao de hipteses. Pretende-
se com esta compilao de testes e teorias, capacitar o leitor
para a aplicao estatstica investigao em cincias
humanas (sociais, mdicas, psicolgicas, etc) e biolgicas

Margarida Pocinho
17-09-2010

ESTATSTICA II

2
2010
ndice Geral

I - INTRODUO.................................................................................................................... 7
ESTATSTICA PARAMTRICA E NO PARAMTRICA: REVISES ............................................... 7
TESTES NO PARAMTRICOS ....................................................................................... 13
TESTES PARA AMOSTRAS INDEPENDENTES: ........................................................... 14
TESTE DO QUI-QUADRADO .................................................................................................... 14
TESTE U DE MANN-WHITNEY ............................................................................................... 22
TESTE DE KRUSKAL-WALLIS ................................................................................................ 28
TESTES PARA AMOSTRAS RELACIONADAS .............................................................. 33
TESTE DE FRIEDMAN ............................................................................................................. 44
MEDIDAS DE CORRELAO E SUAS PROVAS DE SIGNIFICNCIA ............................................. 47
COEFICIENTE DE CORRELAO RHO DE SPEARMAN-RANK .................................................... 48
TESTES NO PARAMTRICOS NO SPSS ...................................................................... 50
O TESTE DE MANN-WHITNEY ....................................................................................... 50
O TESTE DE WILCOXON: ................................................................................................ 55
TESTE H DE KRUSKAL-WALLIS: .................................................................................. 57
ANEXOS ................................................................................................................................ 60



ESTATSTICA II

3
2010

Programa da Unidade Curricular
2010-2011
Licenciatura:
Psicologia
Ano:
2.
Semestre: 1
Unidade
Curricular:
Estatstica II
Docente:
Margarida Tenente dos Santos Pocinho
Pgina Web:
http://docentes.ismt.pt/~m_pocinho/
Contacto do
Docente:
916784049

Objectivos Gerais:
Esta Unidade Curricular (UC) visa estender os conhecimentos adquiridos em Estatstica I, bem
como fornecer aos alunos conhecimentos tericos e prticos relativos a metodologias de inferncia
estatstica no paramtrica. O contedo programtico da unidade curricular compreende
instrumentos de inferncia estatstica no paramtrica como as ordens, as estatsticas, as estatsticas
de ordem, os estimadores e as distribuies de amostragem, a estimao no paramtrica pontual e
por intervalos e os testes de hipteses no paramtricos. So igualmente tratados aspectos
essenciais de distribuies assintticas. Os alunos devem ficar a conhecer os estimadores pontuais e
as suas propriedades, construir intervalos de confiana no paramtricos e realizar testes de
hipteses no paramtricos. Relativamente a cada procedimento no paramtrico, os alunos devem
saber claramente as suas condies de aplicabilidade.
Esta UC tem ainda como objectivo o tratamento estatstico dos dados recolhidos, e sua anlise, bem
como, aprofundar o tratamento computacional de dados.

Competncias a Desenvolver:
1. Aprofundar os conhecimentos sobre a estatstica paramtrica e no paramtrica
aplicada psicologia iniciada em Estatstica I,
2. Aprofundar as estratgias estatsticas paramtricas e no paramtricas adequadas
resoluo de determinado problema e aplicar as estratgias estatsticas no
paramtricas quando as paramtricas no se aplicarem
3. Organizar dados em matriz informtica (SPSS) para anlise de dados a partir de
qualquer meio de recolha de dados
4. Analisar dados e interpretar resultados resultantes quer dos clculos manuais quer
ESTATSTICA II

4
2010
dos outputs informticos
Contedos Programticos:
Introduo: Inferncia Estatstica. Escala nominal, ordinal, intervalar e de razo. Populao,
amostra, parmetro, estatstica, estatstica de ordem. Mtodos paramtricos, mtodos robustos e
mtodos no paramtricos. Estimao pontual e intervalar. Testes de hipteses. P-value.
Comparao de duas populaes. Amostras independentes e emparelhadas. Teste dos sinais. Teste
de Wilcoxon. Teste de Mann-Whitney.
Comparao de mais de duas populaes. Amostras independentes ou relacionadas. Teste de
Kruskal-Wallis. Comparaes a posteriori. Teste de Cochran. Teste de Friedman. Teste do qui-
quadrado para diferenas de probabilidades. Aleatoriedade e independncia. Medidas e testes de
associao. Teste do qui-quadrado em tabelas de contingncia, para independncia.. Coeficientes
de correlao de Spearman. Teste de McNemar. Anlise de ajustamento. Teste do qui-quadrado.
Teste de Kolmogorov-Smirnov. Teste de Shapiro-Wilk.
Calculo dos testes em SPSS e interpretao de resultados
Metodologia de Avaliao:
Avaliao Continuada:
Elemento de Avaliao Peso (%) Mnimos
(%) *
Data e Hora Sala
Construo de uma base de dados e respectiva
transformao (0,5 valor)
2,5
- Lab de Informtica
Sintaxe dos clculos efectuados (0,5 valor) 2,5 - Lab de Informtica
Frequncia terica (9 valores) 45 - Qualquer
Avaliao Prtica (6) 30 - Lab de Informtica
Avaliao Final:
Elemento de Avaliao Peso (%) Mnimos (%) * Data e Hora Sala
Componente terica (inclui a escolha de testes
estatsticos adequados s variveis em estudo
e hipteses colocadas bem como a correcta
deciso de hipteses)

50% 50% Normal:.
Recurso:.
Qualquer
Componente prtica (ser avaliada atravs do
clculo de estatsticas no paramtricas
manualmente e com recurso ao suporte
informtico spss)
50% 50% Normal:.
Recurso:.
Laboratrio
Informtica
Outras Notas sobre a Avaliao:
ESTATSTICA II

5
2010
Embora as faltas sejam um aspecto ponderado na avaliao (cumprimento de tarefas), a aluna ou aluno que
faltar fica duplamente penalizado: por no ter assistido matria e por no estar presente nas tarefas pedidas
e por isso no sendo avaliado nessas tarefas. Assim no necessrio o estabelecimento de percentagem de
aulas obrigatrias, para que o sistema de avaliao seja justo.

Poltica Anti Cpia e Anti Plgio:

Nesta disciplina, os alunos podem e devem consultar vrias fontes de informao, assim como
trocar ideias com colegas acerca dos contedos das aulas e dos trabalhos. No entanto, os
trabalhos finais apresentados pelos alunos devero ser da sua exclusiva autoria.
No contexto da disciplina, considera-se cpia ou plgio quando parte ou a totalidade de um teste
ou de um trabalho entregue ao docente contm materiais no referenciados que no so da autoria
do aluno mas que so apresentados como tal.
A cpia e o plgio so inaceitveis, e todos os trabalhos onde feita cpia ou plgio, parcial ou
total, devem ser desclassificados. Tal aplica-se a quem copia ou plagia contedos alheios, assim
como a quem, deliberadamente, permite a cpia do teste ou trabalho, parcial ou integralmente. Em
caso de dvida sobre o que considerado plgio ou cpia, o aluno dever contactar o docente
para obter esclarecimentos adicionais.

Gesto da Carga Horria:
N.
Aula
Tipo Data Prevista Contedo Metodologia
1 PL 14-09-2010 Apresentao da disciplina e do docente
1 T 17-09-2010
Pr-requisitos da estatstica paramtrica e princpios da
estatstica no paramtrica
Expositiva com resoluo de exerccios
2 PL 21-09-2010
Iniciao construo da matriz de dados em SPSS que
servir de base ao trabalhos e tarefas do mdulo prtico
da disciplina
DEMONSTRATIVA (MEIOS
INFORMTICOS)
2 T 24-09-2010
Pr-requisitos da estatstica paramtrica e princpios da
estatstica no paramtrica (continuao)
Expositiva com resoluo de exerccios
3 PL 28-09-2010
Continuao da construo da matriz de dados em SPSS
que servir de base ao trabalhos e tarefas do mdulo
prtico da disciplina
DEMONSTRATIVA (MEIOS
INFORMTICOS)
3 T 01-10-2010 Ordenaes: somatrios e mdias. Algoritmo e clculo Expositiva com resoluo de exerccios
4 T 08-10-2010 Clculo das frequncias esperadas Expositiva com resoluo de exerccios
4 PL 12-10-2010
Verificao de pr-requisitos para deciso das estratgias
estatsticas em SPSS. Analise descritiva dos dados e
registo de procedimentos na sintaxe
DEMONSTRATIVA (MEIOS
INFORMTICOS)
5 T 15-10-2010
Qui-quadrado da aderncia (X2) e qui-quadrado da
Expositiva com resoluo de exerccios
ESTATSTICA II

6
2010
independncia
5 PL 19-10-2010
Aumento da base de dados e clculo da variveis
transformadas
DEMONSTRATIVA (MEIOS
INFORMTICOS)
6 T 22-10-2010
Clculo do x2 da aderncia, da independncia
(CONTINUAO)
Expositiva com resoluo de exerccios
6 T 29-10-2010 Clculo do u de mann-whitney Expositiva com resoluo de exerccios
7 PL 02-11-2010
Clculo do x2 da aderncia, da independncia e u de
mann-whitney, em SPSS
DEMONSTRATIVA (MEIOS
INFORMTICOS)
7 T 05-11-2010 teste H de kruskal-wallis e W de wilcoxon Expositiva com resoluo de exerccios
8 PL 09-11-2010 teste H de kruskal-wallis e W de wilcoxon em SPSS
DEMONSTRATIVA (MEIOS
INFORMTICOS)
8 T 12-11-2010
Interpretao dos testes, diferena das leituras resultantes
dos procedimentos informticos relativamente ao
procedimento manual e tabelado
Expositiva com resoluo de exerccios e
exemplos
9 PL 16-11-2010
Interpretao dos testes, diferena das leituras resultantes
dos procedimentos informticos relativamente ao
procedimento manual e tabelado
DEMONSTRATIVA (MEIOS
INFORMTICOS)
9 T 19-11-2010 Teste das mudanas de macnemar e q de cochran
Expositiva com resoluo de exerccios e
exemplos
10 PL 23-11-2010
Calculo do teste das mudanas de macnemar e q de
cochran em SPSS
DEMONSTRATIVA (MEIOS
INFORMTICOS)
10 T 26-11-2010
Friedman e esclarecimentos sobre duvidas para a
frequncia
Expositiva com resoluo de exerccios e
exemplos
11 PL 30-11-2010
Clculo do teste Friedman em SPSS e esclarecimentos
sobre duvidas para a frequncia
EXPOSITIVA E DEMONSTRATIVA
(MEIOS INFORMTICOS)
11 T 03-12-2010 revises para a Frequncia terica
Utilizao de papel, caneta e lpis,
calculadora, consulta de tabelas de
valores crticos e de tabelas de deciso
12 PL 07-12-2010 revises para a Frequncia pratica
DEMONSTRATIVA (MEIOS
INFORMTICOS)
12 T 10-12-2010 Frequncia terica
Utilizao de papel, caneta e lpis,
calculadora, consulta de tabelas de
valores crticos e de tabelas de deciso
13 PL 14-12-2010 Frequncia pratica
Utilizao de papel, caneta e lpis,
computador com SPSS, consulta de
tabelas de deciso
13 T 17-12-2010 Correco da frequncia terica
Utilizao de papel, caneta e lpis,
calculadora, consulta de tabelas de
valores crticos e de tabelas de deciso

ESTATSTICA II

7
2010

I - INTRODUO

ESTATSTICA PARAMTRICA E NO PARAMTRICA: REVISES

Paramtricos: calcula as diferenas numricas exactas entre os resultados.
No paramtricos: apenas consideram se certos resultados so superiores ou inferiores a outros
resultados.
PR-REQUISITOS PARA UTILIZAO DE TESTES

Testes paramtricos
1. que a varivel tenha sido mensurada num nvel mnimo intervalar;
2. que a distribuio seja simtrica (e por vezes mesocurtica);
3. que a caracterstica estudada (varivel) tenha distribuio normal numa dada populao.
4. Pressupostos
Para saber se uma varivel simtrica dividimos o coeficiente assimetria (Skewness) pelo erro padro
e se o resultado estiver entre 2 e -2 a distribuio simtrica.
Para saber se uma varivel mesocurtica dividimos o coeficiente de achatamento (Kurtosis) pelo erro
padro e se o resultado estiver entre 2 e -2 a distribuio mesocurtica.
Mas se os resultados de um teste paramtrico, no cumpriram com os requisitos (no mnimo dados
intervalares; distribuio simtrica, mesocurtica e normal), ento no tm interpretao significativa.
Quando acontecem estes factos, a maioria dos investigadores opta por testes de significncia no-
paramtricos.

Sempre que no se pode, honestamente, admitir a simetria e a normalidade de distribuio, ou os
dados foram recolhidos num nvel de mensurao inferior ao intervalar, devemos recorrer a testes que
no incluem a normalidade da distribuio ou nvel intervalar de mensurao. Esses testes chamam-se
no paramtricos
Testes no-paramtricos: podem ser utilizados, mesmo quando os seus dados s podem ser medidos
num nvel ordinal, isto , quando for apenas possvel orden-los por ordem de grandeza) podem ser
utilizados mesmo quando os seus dados so apenas nominais, i.e., quando os sujeitos podem apenas
ser classificados em categorias.



ESTATSTICA II

8
2010
PODER DE UM TESTE
O poder de um teste a probabilidade de rejeitarmos a H0 quando ela realmente nula
Os testes mais poderosos (os que tm maior probabilidade) de rejeio de H0, so testes que possuem
pr-requisitos mais difceis de satisfazer (testes paramtricos como t e F).
As alternativas no paramtricas exigem muito menos pr-requisitos mas produzem testes de
significncia com menos poder que os correspondentes paramtricos.

Em consequncia
Ao rejeitar-se a H0 sem preencher as exigncias mnimas dos testes paramtricos, mais provvel que
essa rejeio seja falsa (se rejeitar a H0 quando ela verdadeira comete um erro de tipo I; se aceitar a
H0 quando ela falsa comete um erro de tipo II). Quando os requisitos de um teste paramtrico so
violados, torna-se impossvel conhecer o seu poder e a sua dimenso (o)
obvio que os investigadores querem, a todo o custo, rejeitar a H0 quando ela mesmo falsa,
evitando um erro de tipo I.
O teste ideal seria aquele que o=0 e |=1, o que implicaria que o teste conduziria sempre deciso
correcta, contudo o teste ideal raramente existe.
A probabilidade do erro de 1 espcie deve ser reduzida, fixando o terico em 0,1; 0,05 ou 0,01. o
valor fixado para o depende da importncia que se d ao facto de rejeitar a H0 quando esta
verdadeira.
Uma ilustrao deste ponto de vista pode ser feita com o seguinte exemplo:
Uma pessoa inocente at prova do contrrio
H0: A pessoa inocente
H1: A pessoa culpada
Erro I: A pessoa condenada mas est inocente
Erro II: A pessoa absolvida mas culpada

Naturalmente a justia procura reduzir a possibilidade de ocorrer o erro de 1 espcie, pois entende-se
que mais grave condenar inocentes que absolver criminosos.
Para certos sistemas judiciais um o = 0,1 demasiado elevado, optando por o=0,01; noutros sistemas
judiciais pode admitir que o= 0,05 um valor razovel.

ASSIM
Fixada a probabilidade do erro de tipo I (dimenso do teste), o teste mais potente aquele em que a
escolha da regio crtica minimiza a probabilidade do erro de 2 espcie. Diz-se tambm que esta
regio crtica a mais potente.
ESTATSTICA II

9
2010
Facilmente se conclui que o teste mais potente aquele que, uma vez fixada a probabilidade de
rejeitar a H0, quando ela verdadeira, maximiza a potncia ou a capacidade para rejeitar a mesma
hiptese quando esta falsa.

ESTRATGIAS ESTATISTICAS DE ANLISE DE DADOS

Para escolher qualquer tipo de teste estatstico
Distinguir se a nossa amostra constituda pelos mesmos sujeitos em todas as situaes ou se
formada por diferentes sujeitos para cada situao

Inter-sujeitos ou design no-relacionado
este tipo de design utilizado quando um indivduo ou objecto avaliado apenas uma vez. A
comparao efectuado entre os grupos de sujeitos/ objectos cujos resultados so no-relacionado.
Desvantagem: conjunto das diferenas individuais na forma como os sujeitos reagem ou respondem
tarefa.

Intra-sujeitos ou design relacionado
A comparao feita entre os mesmos sujeitos (sujeitos do mesmo grupo).
A importncia destes designs a eliminao de quaisquer particularidades individuais, uma vez que
ficam igualizadas em todas as situaes.
Desvantagem: Efeito de memria e aprendizagem.

Amostras emparelhadas
Igualizam-se sujeitos diferentes mas emparelhados, em termos de idade, sexo, profisso e outras
caractersticas gerais que parecem importantes para cada pesquisa em particular.
estes tipos de designs podem ser considerados de designs relacionados, uma vez que controlado nas
suas caractersticas relevantes.
Desvantagem: Dificuldade em encontrar sujeitos que permitam o emparelhamento de todas as
caractersticas relevantes.
Dificuldades arranjar grandes amostras.


A maioria dos investigadores principiantes enfrenta srias dificuldades quando tem de usar a anlise
estatstica. apontado como provveis causas o ensino de Estatstica que, frequentemente, tem um
enfoque matemtico ou de receita que no conduzem ao aproveitamento desta ferramenta e o
consequente despoletar de uma ansiedade matemtica, que pode levar os estudantes a evitar o seu
ESTATSTICA II

10
2010
uso. Essa situao conduz, no raras vezes, dependncia de outros para seleccionar a estatstica
adequada ao seu projecto. O objectivo desta lio ajudar a ter uma ideia da potencialidade da
estatstica apropriada a sua pesquisa.
Primeiro examine seu estudo, identifique o que quer com sua anlise estatstica, devendo, para isso,
especificar claramente as vrias questes a que quer que sua anlise estatstica responda (conhecer a
associao ou verificar as diferenas). Comece por escrever as suas questes de pesquisa e hipteses.
Depois identifique a varivel dependente e independente bem como os seus nveis de mensurao.
Aps estar na posse dessa informao consulte a figura que se segue e vai ver que tudo comea a ficar
mais fcil.




Como segundo passo na escolha da estatstica apropriada, verifique se sua varivel dependente
adequada para a estatstica paramtrica. A estatstica paramtrica envolve pelo menos dois
ESTATSTICA II

11
2010
pressupostos iniciais: o primeiro se a varivel dependente segue uma distribuio normal e, o
segundo se os dados entre diferentes sujeitos so independentes ou emparelhados/relacionados.
Portanto, uma varivel dependente qualitativa ou categrica no se enquadra neste tipo de estatstica,
devendo usar o enfoque da estatstica no paramtrica.

Assim recorremos a estatstica paramtrica quando analisamos variveis dependentes contnuas.
Se essas variveis violam os pressupostos e no tem como corrigir essa violao, ento deve utilizar a
estatstica no paramtrica. S tem duas opes: ou aprende a lidar com a Estatstica no
paramtrica ou ento aumenta o tamanho da amostra.
Examine cada varivel dependente uma por uma nesse processo. Nem todas tero as mesmas
caractersticas. Um erro comum, por exemplo, assumir que pode usar sempre o mesmo teste
estatstico se os grupos experimentais so equivalente em idade, gnero, anos de estudos e outras
variveis demogrficas. Idade e anos de estudo so duas variveis geralmente analisadas com
estatstica paramtrica. O gnero e a etnia so variveis nominais e por isto devem ser analisadas com
Estatstica no paramtrica.

Definir quais as estratgias estatsticas a utilizar exige o conhecimento das lies anteriores. As mais
robustas estratgias estatsticas exigem que as variveis apresentem propriedades intervalares para que
sejam obtidos resultados fidedignos. Contudo na investigao com seres humanos nem sempre
possvel termos variveis quantitativas, por isso para cada teste estatstico paramtrico existe um
equivalente no paramtrico mas destes ltimos existem vrios que no tem equivalente paramtrico.
Por exemplo se tanto a nossa varivel dependente (VD) quanto a independente (VI) forem nominais e
quisermos conhecer a associao entre elas podemos recorrer ao qui-quadrado (x
2
) da independncia;
se ambas forem ordinais podemos recorrer ao rho de spearman mas se forem quantitativas e
cumprirem com os restantes pr-requisitos da estatstica paramtrica (simtricas, mesocurticas e
distribuio normal) podemos utilizar o teste r de Pearson.

Se em vez de querermos ver umas associao ou correlao pretendermos verificar se existem
diferenas na distribuio de uma varivel (VD) em funo de outra com nvel de mensurao
nominal e dicotmica (VI) ento podemos utilizar o teste t de student para amostras independentes
(caso estejam cumpridos os pr-requisitos impostos VD isto , quantitativa, simtrica e apresente
distribuio aproximadamente normal) ou o seu equivalente no paramtrico u de Mann-Whitney
(caso no estejam cumpridos os pr-requisitos da estatstica paramtrica mas a VD tenha um nvel de
mensurao no mnimo ordinal).
Se a figura anterior no o deixou muito esclarecido experimente consultar o quadro que se segue. Os
testes estatsticos paramtricos esto assinados com um asterisco (*)
ESTATSTICA II

12
2010



Testes para
uma amostra
NIVEIS DE MENSURAO
Nominal Ordinal/ grupo Quantitativa
TESTE DE QUI-QUADRADO DA
ADERNCIA
TESTE DE KOLMOROGOV-
SMIRNOV
TESTE DE QUI-QUADRADO DA
ADERNCIA
-TESTE DE KOLMOROGOV-
SMIRNOV
-TESTE T PARA UMA
AMOSTRA *





Variveis Independentes
Qualitativas Quantitativa
V
a
r
i

v
e
i
s

D
e
p
e
n
d
e
n
t
e
s

Nominal
Nominal/ dicotmica/ grupo Ordinal/ Grupo
Qui-Quadrado da Independencia
Qui-Quadrado da Independencia
(Variveis Grupo)

Kappa de Cohen (Tabelas Quadradas)
Macnemar (2x2)
Q de Cochran (Dicotmicas)
Ordinal
Teste Qui-Quadrado da Independencia Rho de Spearman
Rho de Spearman
Teste U de Mann-Whitney W de Wilcoxon (Igual Escala)
Teste H de Kruskal-Wallis
Kappa de Cohen (Tabelas
Quadradas)

Qui-Quadrado da Independencia
(Variveis Grupo)
Quantitativa
t de Student p/ dados Independentes *
Rho de Spearman
T de Student p/ dados
Emparelhadas *
U de Mann-Whitney W de Wilcoxon
Anova a um critrio e respectivo Post-
Hoc * R de Pearson *
H de Kruskal-Wallis e U Por Grupo
Rho de Spearman
Anova Para Medidas Repetidas
*
Friedman

Supondo que suas variveis dependentes tivessem uma distribuio normal ou que sua amostra fosse
suficientemente grande, deve verificar todas as possibilidades de anlise: univariada, bivariada,
mltipla e multivariada, se for o caso. A anlise univariada quando a varivel analisada per se,
anlise bivariada quando uma varivel dependente relacionada com uma nica varivel
independente, anlise mltipla quando se analisa uma varivel dependente em funo de vrias
variveis independentes, e anlise multivariada, quando se analisa vrias variveis dependentes
contnuas em funo de variveis independentes categricas ou quando se analisa a estrutura das
variveis, visando a reduo do nmero de variveis.
O quadro anterior no esgota as analises estatsticas, alis existem outras tantas quantas as que
apresentamos aqui, contudo mostra as mais utilizadas nas anlises univariadas e bivariadas.

ESTATSTICA II

13
2010

TESTES NO PARAMTRICOS

Frank Wilcoxon (1892 - 1965) tornou-se conhecido por ter desenvolvido dois testes no
paramtricos muito utilizados: o Teste de Soma de Postos Wilcoxon Rank Sum Test que
equivalente ao teste de Mann-Whitney, e o Teste de Postos com Sinais ou Wilcoxon Signed Rank
Test (Rosner, 1995).
A estatstica no paramtrica de distribuio livre:
No incorpora as suposies restritivas, caractersticas dos testes paramtricos.
Os dados no precisam estar normalmente distribudos (Free Distribution). necessrio,
apenas, que eles sejam ordenveis.
So baseados em postos das observaes e no em seus valores, como no caso dos
paramtricos.
Podem ser aplicados para variveis quantitativas, falsas intervalares( tambm chamadas de
semi-quantitativas) e qualitativas.
Desvantagens
Menos sensveis aos erros de medida e rpidos para pequenas amostras.
Se as suposies bsicas de um teste paramtrico so satisfeitas, ento os testes no-
paramtricos so menos poderosos do que a tcnica paramtrica correspondente (exigir
uma amostra maior);
As hipteses testadas por testes no-paramtricos tendem ser menos especficas;
Por usarem postos, em vez do valor da observao, esses testes no aproveitam toda a
informao disponvel sobre a distribuio dos dados;
Se existem muitas distribuies empatadas, as estatsticas sero superestimadas, exigindo
correes.

O posto de uma observao a sua posio relativa s demais observaes, quando os dados esto
em ordem crescente. uma forma de medir a posio relativa da observao, sem usar o valor
observado diretamente.
Os postos correspondentes s observaes de uma varivel X
1
, X
2
,..., X
n
so:
Colocam-se as observaes em ordem crescente, X
1
< X
2
,...,< X
n
.
Associam-se valores, correspondendo s suas posies relativas na amostra. O primeiro
elemento recebe o valor 1, o segundo o valor 2, e assim por diante, at que a maior
observao receba o valor n.
ESTATSTICA II

14
2010
Se todas as observaes so distintas, ou seja, se X
i
= X
j
para todo i, j, os postos R
1
, R
2
,...,R
n

so iguais aos valores associados s observaes no passo anterior. Para observaes iguais,
associam-se postos todos iguais mdia de suas posies relativas na amostra.

Exemplo: Considere uma amostra de 8 idades de crianas do ambultorio do IC, apresentada na
tabela abaixo:

Os postos devem ser cuidadosamente atribudos, pois os testes sero baseados nesses valores.



TESTES PARA AMOSTRAS INDEPENDENTES:

TESTE DO QUI-QUADRADO
O Qui-quadrado (X
2
) um teste estatstico no paramtrico, sendo um dos mais utilizados e bastante
aplicado em diferentes planos experimentais. O X
2
muito usado mesmo ao nvel da estatstica
multivariada (no sentido de obter o grau de aderncia entre o modelo obtido e o terico).
Existem vrios testes baseados no qui-quadrado, contudo s dois tem esse nome: o teste do qui-
quadrado da aderncia ou ajustamento (para uma amostra) e o teste do qui-quadrado da
independncia.
O Qui-quadrado (X
2
) de aderncia consiste em comparar os dados obtidos experimentalmente com os
dados esperados de acordo com a lei. Das comparaes surgem diferenas que podem ser grandes ou
pequenas: se forem grandes, a hiptese nula (H0) que pressupe um bom ajustamento dever ser
rejeitada em favor da hiptese alternativa (H1); se forem pequenas, a hiptese nula no ser rejeitada e
as diferenas so atribuveis ao acaso. O objectivo comparar frequncias observadas com
frequncias tericas ou esperadas, ou seja, verificar o seu grau de aproximao, que pode ser grande
(=0) ou pequeno (> 0).





ESTATSTICA II

15
2010
Utiliza-se quando os dados so nominais, pelo que em vez de se medirem resultados dos sujeitos
apenas se podem distribuir os sujeitos por uma ou mais categorias.
O Qui-quadrado (X
2
) testa a hiptese experimental que prev quantos sujeitos de cada grupo so
distribudos por uma determinada categoria.

O X
2
de independncia serve para ajudar a decidir se as duas variveis esto ou no "amarradas" uma
outra por uma relao de dependncia.
Utiliza-se quando os dados so qualitativos e se pretende saber como que se comportam os dados
quando as variveis se cruzam, isto qual a contingncia entre as variveis.
O objectivo comparar as frequncias observadas em cada uma das clulas de uma tabela de
contingncia com as diferenas esperadas. O teste compara o nmero de sujeitos que se distribuem por
uma determinada categoria com o nmero de sujeitos que se esperaria se distribussem por essa
mesma categoria, caso no existissem diferenas.
O teste do X
2
reflecte o tamanho das diferenas entre as frequncias observadas e esperadas. Para ser
significativo, o valor de X
2
dever ser igual ou superior aos valores crticos da tabela.

TESTE DO QUI-QUADRADO DA ADERENCIA PASSO-A-PASSO
1. Calcular as frequncias esperadas (E) para cada clula, somando as frequncias observadas e
dividindo pelo nmero total de categorias.

Em que
O = frequncias observadas para cada categoria
C = nmero de categorias

2. Calcular X
2
:

3. Calcular os graus de liberdade:
g.l. = (C-1)
Se X
2
observado > X
2
crtico rejeita-se H0 Se X
2
observado <X2 crtico aceita-se H0

ESTATSTICA II

16
2010
Exemplo: A depresso acontece mais em homens ou em mulheres. Estudo efectuado com
base na recolha de dados provenientes de uma amostra aleatria de indivduos diagnosticados
com depresso nos ltimos 5 anos, que foram ou esto a ser acompanhados na consulta de um
determinado hospital central.
FO FE Resduos
Feminino 45 50 -5
Masculino 55 50 +5
100/2=50

X
2 =
((-5)
2
/50)

+ (( 5)
2
/50)
X
2
= 1
O X
2
observado igual a 1
O X
2
crtico igual a 3,84
O valor observado inferior ao valor crtico, logo, aceito a hiptese nula: a distribuio de
deprimidos por sexo homognea.

TESTE DO QUI-QUADRADO DA INDEPENDENCIA PASSO-A-PASSO

1. Numerar as "clulas" que representam cada uma das categorias e calcular as frequncias
esperadas (E) para uma, multiplicando os dois totais parciais relevantes para cada uma e
dividindo pelo nmero total de sujeitos.





ESTATSTICA II

17
2010


2. Calcular X
2
:

em que
O = frequncias observadas para cada clula
E = frequncias esperadas para cada clula

3. Calcular os graus de liberdade: g.l. = (r-1) (c-1)
em que
r = nmero de linhas da tabela de contingncia
c = nmero de colunas da tabela de contingncia
Exemplificando: para uma tabela de dupla entrada 2*2:
g.l. = (nmero de colunas - 1) (nmero de linhas - 1) = 1*1 = 1
consulta-se a tabela dos valores critico e,
Se X
2
observado > X
2
crtico rejeita-se H0 Se X
2
observado < X
2
crtico aceita-se H0



Exemplo: Suponha que quer saber se os estudantes de cincias sociais utilizam um mtodo de estudo
significativamente diferente daquele que utilizado pelos estudantes de tecnologia. A amostra
prevista ficou constituda por dois grupos, um composto por 50 estudantes de cincias sociais e o
outro por 50 estudantes de tecnologia. Enviou-se, ento, via mail, um questionrio aos 100 estudantes
ESTATSTICA II

18
2010
pedindo-lhes que indicassem se o seu mtodo de estudo era regular (dirio), irregular (s em pocas
de avaliaes) ou misto (estudar diariamente um pouco com maior intensidade nos perodos de
avaliaes). Foram recebidas 44 respostas dos estudantes de cincias sociais e 42 dos estudantes de
tecnologia.
A hiptese experimental (H
1
) era:
H
1
: O tipo de estudo varia em funo curso frequentado
Os resultados so apresentados na forma de uma tabela 2*3, designada por tabela de contingncia
(crosstab).
Tipo de estudo
Regular Irregular Misto
Grupo 1-Estudantes de Cincias Sociais 6 15 23
Grupo 2-Estudantes de Tecnologia 10 8 24

Instrues Passo-a-Passo: enumerar as clulas, obter os totais e calcular as frequncia esperadas (E)

Tipo de estudo
Regular Irregular Misto Total
Grupo 1
E1=
6
E2=
15
E3=
23

44
Grupo 2
E4=
10
E5=
8
E6=
24

42
Totais

16

23

47

N=86

Resolva:
ESTATSTICA II

19
2010

Confira:
Clula 1: E1 = 16X44 / 86 = 8,19
Clula 2: E2 = 23X44 / 86 = 11,77
Clula 3: E3 = 47X44 / 86 = 24,05
Clula 4: E4 = 16X42 / 86 = 7,81
Clula 5: E5= 23X42 / 86 = 11,23
Clula 6: E6 = 47X42 / 86 = 22,95

2. Aplicar a frmula do x
2
e proceder ao clculo do teste


X
2
= (6-8,19)
2
+ (15-11,77)
2
+ (23-24,05)
2
+ (10-7,81)
2
+ (8-11,23)
2
+ (24-22,95)
2

8,19 11,77 24,05 7,81 11,23 22,95
X
2
= 0,59 + 0,89 + 0,05 + 0,61 + 0,93 + 0,05 = 3,12

3. Calcular os graus de liberdade (gl)
g.l. = (r - 1) (c - 1) = (2 -1) (3 - 1) = 2

4. Consultar a tabela dos valores crticos
Para p=0,05 e gl=2 x
2
critico=5,99

Concluses: Dado que o valor observado de X
2
apenas de 3,12, ou seja, inferior ao valor crtico de
5,99 para p < 0,05, o resultado da experincia no significativo. Aceita-se hiptese nula de que os
padres de estudo dos estudantes de cincias sociais e de tecnologia no diferem, rejeitando-se desta
forma a nossa hiptese experimental (H
1
).

ESTATSTICA II

20
2010


Ao estudarmos as diferenas entre dois grupos podemos utilizar grupos relacionados/emparelhados ou
grupos independentes. No caso de duas amostras independentes determinamos se as diferenas nas
amostras constituem uma evidncia convincente de uma diferena nos processos de tratamento a elas
aplicados.
Apesar do uso de duas amostras relacionadas em projectos de pesquisa ter mritos indiscutveis, a sua
aplicao, em geral, no prtica. Frequentemente, a natureza da varivel dependente impede a
utilizao dos indivduos como seus prprios controlos, tal como ocorre quando a varivel dependente
o suicdio tentado; um problema que pode acontecer uma nica vez. Pode ser tambm impossvel
delinear um projecto que utilize pares de dados, talvez por desconhecimento, por parte do
investigador, de variveis teis que possam formar pares, ou pela impossibilidade de obter
mensuraes adequadas de alguma varivel de reconhecida importncia ou, enfim, porque
simplesmente no se dispe de pares adequados.
Quando a utilizao de duas amostras relacionadas no prtica ou adequada, podemos utilizar duas
amostras independentes. Em tais projectos, as duas amostras podem ser obtidas por um de dois
mtodos:
Podem ser extradas aleatoriamente de duas populaes;
Podem decorrer da atribuio aleatria de dois tratamentos aos membros de uma amostra de origem
arbitrria.

Nota: Em nenhum destes casos se exige que as amostras tenham o mesmo tamanho.


PROCEDIMENTOS PARA ORDENAO DE RESULTADOS

Os testes no paramtricos U de Mann-Whitney; Wilcoxon; H de Kruskal-Wallis; rho de Spearman;
tau de Kendall e Friedman, exigem o recurso a ordenaes de resultados para efectuar os seus
clculos. Neste sentido comearemos por explicar os procedimentos de ordenao de resultados
Ordenamento global de resultados (designs no-relacionados para sujeitos diferentes), utilizados nas
estatsticas U de Mann-Whitney, H de Kruskal-Wallis e rho de Spearman:




ESTATSTICA II

21
2010


Para se ordenar resultados, atribui-se a ordem 1 (ordem mais baixa) ao sujeito que fuma menos, a
ordem 2 ao seguinte, e por a adiante, tal como no exemplo que se segue:
n. de cigarros/ dia ordem
6 4
3 1
12 7
4 2
7 5
5 3
8 6

n. de cafs/ dia ordem
1
3
2
4
6
5
8


Sempre que exista um resultado 0 (zero) contado como o valor observado mais baixo, sendo-lhe
atribuda a ordem 1, tal como no exemplo que se segue:
n. de consultas ordem
2. feira 6 5
3. feira 3 2
4. feira 0 1
5. feira 4 3
6. feira 5 4

n. de telefonemas ordem
2. feira 60
3. feira 30
4. feira 40
5. feira 24
6. feira 75
Sbado 15
Domingo 0


ESTATSTICA II

22
2010
Quando existem resultados iguais so-lhe atribudas a mdia das posies ou das ordens, calculadas
com base na globalidade das ordens que deviam ter sido atribudas a estes resultados, tal como no
exemplo que se segue:
absentismo no ms de Dezembro ordem
1 2
2 4
1 2
4 6,5
1 2
3 5
4 6,5
6 9
5 8
Assim os sujeitos com uma falta so 3 (1+1+1) que ocupariam o 1. - 2. - 3. lugar, ento
3+2+1=6:(1+1+1)=2; com 4 faltas temos 2 sujeitos que ocupariam o 6. e 7. lugar, ento
6+7=13:(1+1)=6,5

Refeies de carne ordem Refeies de peixe ordem
100

120
200

230
111

11
412

42
111

121
30

30
412

30
600

30
500

120



TESTE U DE MANN-WHITNEY


Quando Utilizar
Dadas duas amostras, de tamanhos n1 e n2, possvel, mediante a prova U de Mann-Whitney, saber
se ambas as amostras podem ser consideradas provenientes da mesma populao.
Como j se sabe, a estatstica paramtrica s pode ser usada desde que os dados tenham sido
mensurados, no mnimo, no nvel intervalar. Alm disso, as amostras devem ser aleatrias,
independentes e a varivel observacional precisa de ter distribuio normal na populao.
ESTATSTICA II

23
2010
O teste U de Mann-Whitney deve ser utilizado em designs com duas situaes, no-relacionado,
quando so utilizados sujeitos diferentes em cada uma das situaes experimentais.

MANN-WHITNEY-WILCOXON: TESTE PARA PEQUENAS AMOSTRAS

O clculo da estatstica do teste (U critico), e a consequente regra de deciso, depende do tamanho
da amostra. Se qualquer dos grupos (n
A
ou n
B
) menor que 10 o valor crtico obtido da tabela.


Vejamos um exemplo em que o grupo A tem 4 sujeitos e o grupo B 5 e se pretende verificar se tm
desempenhos significativamente diferentes.
Um conjunto de 9 atletas 4 da equipa A e 5 da Equipa B vo em competio e chegara meta nas
seguintes posies

Os tempos foram contabilizados e os atletas ordenados da seguinte forma:

Qual o valor de U critico?
Para o obter somamos as posies da equipa A e as posies da equipa B e obtemos


U
B
=9+8+6+3+2= 28 U
A
=7+5+4+1= 17
ESTATSTICA II

24
2010
A seguir vamos tabela dos valores crticos e cruzamos o nmero de indivduos de uma equipa com o
nmero de indivduos da outra:


Como podemos observar os valores de aceitao da H
0
( que no existem diferenas entre os grupos)
esto entre 11 e 29 e os valores observados so 17 e 28 o que est dentro do intervalo. Logo podemos
concluir que as equipas no tm desempenhos significativamente diferentes.
Exerccio: Um estudo visa a comparar, ao nvel de significncia de 5 %, se a taxa de creatinina a mesma em
dois grupos de pacientes renais: um grupo com 6 indivduos que apresentavam insuficincia renal aguda (IRA),
e outro, com 5 indivduos, que no apresentavam IRA.
H
0
: os grupos no so estatisticamente diferentes.
H
A
: os grupos so estatisticamente diferentes.

Ordene, confira com as solues e conclua com base na consulta da tabela


Paciente com IRA sem IRA
1 3,3 0,9
2 3,0 0,8
3 4,0 0,6
4 1,5 0,7
5 2,4 0,8
6 0,9
Taxa de Creatinina (mg/100ml)
1 0 9 1 1 7 8 5 , 5 5 0 , 5
A
R = + + + + + =
5, 5 3, 5 1 2 3, 5 15, 5
B
R = + + + + =
ESTATSTICA II

25
2010

MANN-WHITNEY-WILCOXON: TESTE PARA GRANDES AMOSTRAS
Se ambos os grupos tm pelo menos dez observaes, podemos usar a chamada forma assinttica do
teste, na qual a estatstica do teste pode ser aproximada por uma Normal.
Procedimento:
Calculam-se as estatsticas padronizadas U
A
e U
B
, onde:

U
A



U
B



U = min (U
1
, U
2
)

Mann-Whitney-Wilcoxon Forma Assinttica

Calculam-se a mdia e a varincia de U, dadas por:



Calcula-se a varivel padronizada z
U
, dada por:

Compara-se o valor absoluto de z
U
com o valor de z crtico (tabela z), para o nvel de
significncia desejado.


( ) 0, 5
;
var( )
U
U E U
z
U

=
( )
2
A B
n n
E U

=
( 1)
var( ) ;
12
A B A B
n n n n
U
+ +
=
( 1)
2
B B
A A B B
n n
U n n R
+
= +
( 1)
;
2
A A
B A B A
n n
U n n R
+
= +
ESTATSTICA II

26
2010

Exemplo:Considere as distribuies de scores de idade mental normalizados de duas populaes de
crianas que sofrem de fenilcetonria. Indivduos com essa disfuno so incapazes de metabolizar a
protena fenilalanina. Desconfia-se de que um elevado nvel srico dessa protena aumenta a
probabilidade de deficincia mental da criana. Deseja-se comparar dois grupos de crianas: um com
baixa exposio fenilalanina (menos que 10 mg/dl dirios) e outro com alta exposio (acima de 10
mg/dl dirios).

No h evidncias de que os scores normalizados de idade mental sejam normalmente distribudos nos
pacientes com essa disfuno.
Os scores de idade mental normalizados para as duas amostras de crianas sofrendo de fenilcetonria
esto na tabela abaixo:


As estatsticas padronizadas de U
A
so:






Para o de 5% (bicaudal), o Z
U
de -1,205
1
, o que conclui?

1
Test Statistics
b

FENIL
Mann-Whitney U 83,500
Wilcoxon W 203,500
Z -1,205
Asymp. Sig. (2-tailed) ,228
Exact Sig. [2*(1-tailed Sig.)] ,233
a

Baixa Exp. Alta Exp.
39.5 35.0
40.0 37.0
45.5 37.0
47.0 43.5
47.0 44.0
47.5 45.5
48.7 46.0
49.0 48.0
51.0 48.3
51.0 48.7
52.0 51.0
53.0 52.0
54.0 53.0
54.0 53.0
55.0 54.0
ESTATSTICA II

27
2010



Racional:
O racional que est por trs do teste U de Mann-Whitney bastante semelhante ao do teste de
Wilcoxon. A diferena fundamental entre as duas reside no facto do segundo se aplicar a designs
relacionados e o U se aplicar a designs no-relacionado, utilizando, portanto, sujeitos diferentes. O
teste de Wilcoxon analisa as diferenas entre a performance dos mesmos sujeitos (ou pares de sujeitos
emparelhados) submetidos a duas situaes experimentais. Com um design no-relacionado no temos
uma base que nos permita comparar diferenas entre pares de resultados. Assim, o teste U de Mann-
Whitney ordena os resultados de todos os sujeitos em ambas as situaes como se fossem apenas um
conjunto simples de resultados.


ESTATSTICA II

28
2010
Se as diferenas entre as situaes forem aleatrias, como postulado pela hiptese nula, ento os
resultados devem ser aproximadamente os mesmos e, consequentemente, as ordens devem ser tambm
aproximadamente as mesmas para as duas situaes. Se houver uma preponderncia de ordens altas
ou baixas numa situao ou na outra, ento porque a diferena no total dos resultados ordenados
para cada situao devida aos efeitos previstos da varivel independente e no ao acaso. Se a soma
total das ordens for muito baixa para uma das situaes, ento ter de haver uma preponderncia de
ordens elevadas na outra situao. Quanto menor for U mais significativas sero as diferenas entre
as ordens das duas situaes.

O investigador pode precisar de decidir se diversas variveis independentes devem ser consideradas
como procedentes da mesma populao. Os valores amostrais quase sempre so um tanto diferentes e
o problema determinar se as diferentes amostras observadas sugerem realmente diferenas entre as
populaes ou se so apenas variaes casuais que podem ser esperadas entre amostras aleatrias da
mesma populao.
Apresentamos tcnicas para comparar a significncia de diferenas entre trs ou mais grupos de
amostras independentes, ou seja, para comprovar a hiptese de nulidade de que K amostras
independentes tenham sido extradas da mesma populao ou de populaes idnticas.
As provas no-paramtricas tm a vantagem de permitir estudar, quanto significncia, dados que so
inerentemente classificados (escala nominal) ou se apresentam em postos (escala ordinal).

Exercicio: Suponha que quer investigar o n. de queixas dolorosas durante um tratamento a um mesmo problema
teraputico (controlada a gravidade e a extenso da leso) em que se utilizaram duas tcnicas diferentes. A
hiptese experimental supe que durante a utilizao da tcnica B que o doente se apresenta mais queixoso.
Paciente A Ordem (T1) B Ordem (T2)
1 3 3 9 11
2 4 4 7 9
3 2 1,5 5 5,5
4 6 7,5 10 12
5 2 1,5 6 7,5
6 5 5,5 8 10
TOTAL 22 T1=23 45 T2=55
MDIA 3,67 7,5

TESTE DE KRUSKAL-WALLIS

Requisitos para o uso do teste de Kruskal-Wallis
O teste de Kruskal-Wallis pressupe as seguintes condies para o seu adequado uso:
1. Comparao de trs ou mais amostras independentes;
ESTATSTICA II

29
2010
2. O teste de Kruskal-Wallis no pode ser usado para testar diferenas numa nica amostra de
respondentes mensurados mais de uma vez;
3. Dados cujo nvel de mensurao seja no mnimo ordinal;
4. Esta prova exige dados que possam ser ordenados e aos quais, por isso mesmo, seja possvel
atribuir postos ou ordens;
5. O tamanho mnimo de cada amostra deve ser de 6 para se poder recorrer ao x
2
.
Quando n > 5 por grupo de respondentes, a significncia de H pode ser determinada por recorrncia Tabela do Qui-quadrado (Anexo I). Para
testar diferenas entre amostras de tamanho inferior a 6, deve recorrer a tabelas especiais (Anexo IV).

Quando utilizar
Este teste pode ser considerado uma extenso do teste U de Mann-Whitney quando necessitamos de
utilizar trs ou mais situaes. Deve ser utilizado em designs no-relacionado quando sujeitos
diferentes so distribudos por trs ou mais situaes.

Exemplo: Suponha que estamos interessados em descobrir se existem diferenas no acesso a uma
pgina da internet em funo da caracterstica: muito ilustrada, com algumas ilustraes e, sem
ilustraes. Alocmos trs pginas na internet com o mesmo assunto e titulo durante 4 meses. A seguir
verificmos o nmero de vezes que foram acedidas durante quatro sbados seguidos. Os resultados
foram.
Sujeitos do grupo 1
(pgina muito ilustrada)
Sujeitos do grupo 2
(pgina com algumas
ilustraes)
Sujeitos do grupo 3
(Pgina sem ilustraes)
Resultados Ordem Resultados Ordem Resultados Ordem
Sbado 1 19 10 14 6 12 3,5
Sbado 2 21 11 15 7 12 3,5
Sbado 3 17 9 9 1 13 5
Sbado 4 16 8 10 2
TOTAL 73 38 38 14 47 14
MDIA 18,25 12,67 11,75

Racional
Este teste pretende determinar se os resultados so significativamente diferentes para trs ou mais
grupos. Uma vez que todos os resultados foram, em princpio, obtidos por sujeitos diferentes a nica
forma de verificarmos as diferenas entre as situaes orden-las em conjunto, como se tratassem
apenas de um conjunto de resultados, tal como havamos efectuado no teste U de Mann-Whitney. Isto
acontece porque, no temos uma base para comparar resultados dos mesmos sujeitos ou de sujeitos
emparelhados em diferentes situaes, como com o teste U de Mann-Whitney para designs
relacionados. Este ordenamento global, quando posteriormente adicionamos as ordens de cada coluna
em separado, permite-nos obter o total das ordens para cada situao. Se existirem apenas diferenas
aleatrias entre as situaes, como postulado na hiptese nula, de esperar que ordens altas e baixas
se distribuam de forma aproximadamente equivalente pelas diferentes situaes. Mas, se pelo
ESTATSTICA II

30
2010
contrrio, houver uma preponderncia de altos ou baixos resultados em qualquer uma das situaes,
provvel que tal facto reflicta diferenas significativas devidas varivel independente.
O valor das diferenas entre os totais das ordens dado pela estatstica designada por H. Desde que
a hiptese experimental preveja a existncia de diferenas significativas entre as situaes, o valor
que obtivermos de H dever ser igual ou superior ao valor crtico da Tabela, para que possa ser
considerado significativo.

Instrues passo-a-passo para calcular H
Ordene todos os grupos do design como se tratasse apenas de um conjunto de resultados,
atribuindo a Ordem 1 ao menor resultado e assim sucessivamente.
Para um ordenamento global dos resultados, veja as colunas ordem para os grupos 1, 2 e 3, em que
todos os resultados so considerados em conjunto
Adicione os totais das ordens para cada situao.
Calcule o valor de H a partir da frmula

OU
em que:
Nmero total de sujeitos N=11
n
c
nmero de sujeitos em cada grupo n
1
=4
;
n
2
=3; n
3
=4
T
c
=total de ordens para cada situao, ou seja, os totais das ordens para cada coluna T
1
=38;T
2
=14;T
3
=14
T
c
2
=total das ordens para cada situao, cada um elevado ao quadrado T
1
2
=38
2
;T
2
2
=14
2
;

T
3
2
=14
2

E =soma dos quadrados dos totais das ordens para cada situao dividido pelo nmero de sujeitos dessa situao (nc)


ESTATSTICA II

31
2010


Clculo de H








Calcule os graus de liberdade, ou seja, o nmero de situaes/categorias (C) menos uma.
gl = C 1 = 3 1 = 2


Consulta da significncia na tabela
A Tabela (Anexo IV) utiliza-se em experincias com trs grupos de sujeitos, e com um mximo de
cinco sujeitos em cada grupo. Para um maior nmero de sujeitos, deve ser utilizada a Tabela do
Qui-quadrado (Anexo I). Quando no so utilizados mais de trs grupos, poder localizar na coluna
da esquerda da Tabela o nmero de sujeitos de cada grupo. Localize ento a combinao que
procura (no nosso caso: 4, 4, 3). Note que a ordem do nmero de sujeitos no importante, mas a
combinao apropriada na Tabela 4, 4 e 3. Para essa combinao encontrar os valores crticos de
H para vrias probabilidades. Se o valor de H que obteve for igual ou superior ao valor crtico de
um determinado nvel de significncia pode rejeitar a hiptese nula. No nosso exemplo, o valor
obtido de H=7,26 superior ao valor crtico de 7,1439 para p<0,01, pelo que podemos aceitar a
hiptese experimental a este nvel de significncia.
Se possuir mais de trs situaes, e/ou sujeitos em cada situao, dever procurar o valor crtico na
Tabela do Qui-quadrado. Repare que para isso ter que calcular os graus de liberdade. Localize os
ESTATSTICA II

32
2010
valores dos graus de liberdade (no nosso exemplo, gl=2) ao longo da coluna do lado esquerdo e
verifique ao longo da linha os valores crticos para as diferentes probabilidades. O valor que
obtivemos H=7,26 superior ao valor crtico de 5,99 para p<=0,05, pelo que podemos aceitar que
o resultado significativo a este nvel. Dar conta que esta probabilidade menos significativa de
que quando utilizamos a Tabela anterior. Isso acontece porque essa Tabela especialmente
concebida para nos dar as probabilidades com um pequeno nmero de sujeitos e de situaes.
Notar tambm que o teste de Kruskal-Wallis apenas lhe pode dizer que existem diferenas globais
nos resultados entre as situaes experimentais. Na tabela apresentada parece existir uma tendncia
para consultar pginas com mais ilustraes do que sem ilustraes. Mas para poder testar se essa
tendncia realmente existe, ter de utilizar um teste de tendncia.


ESTATSTICA II

33
2010
TESTES PARA AMOSTRAS RELACIONADAS

Empregam-se as provas estatsticas de duas amostras quando o investigador deseja determinar se dois
tratamentos so diferentes ou se um tratamento melhor do que o outro. Em cada caso, compara-se
o grupo em que se aplicou o tratamento com outro que no sofreu nenhum tratamento ou que sofreu
tratamento diferente.
Em tais comparaes de dois grupos observam-se, por vezes, diferenas significativas que no so
resultantes do tratamento aplicado.
Uma das maneiras de superar a dificuldade decorrente da introduo de diferenas extrnsecas entre
dois grupos consiste em utilizar na pesquisa duas amostras relacionadas, isto , relacionar de alguma
forma as duas amostras estudadas. Tal relacionamento pode ser conseguido utilizando-se cada
indivduo como seu prprio controlo ou ento formando pares de indivduos e, em seguida, associando
os dois membros de cada par s duas condies. Quando um indivduo serve como o seu prprio
controlo, ele submetido a ambos os tratamentos em ocasies diferentes. Quando se utiliza o mtodo
do emparelhamento devem procurar seleccionar-se, para cada par, indivduos que sejam to
semelhantes quanto possvel em relao a quaisquer variveis extrnsecas que possam influenciar os
resultados da pesquisa.
Sempre que possvel, o mtodo de utilizao do indivduo como o seu prprio controlo
(contrabalanando a ordem em que se aplicam os tratamentos ou mtodos) prefervel ao mtodo de
emparelhamento. E a razo disso que limitada a nossa capacidade para formar os pares
adequadamente, em consequncia do nosso desconhecimento das variveis relevantes que determinam
o comportamento. A validade por emparelhamento est na razo directa do investigador para
determinar como formar os pares, e essa capacidade quase sempre muito limitada. Essa dificuldade
contornada quando se utiliza cada indivduo como seu prprio controlo; no se pode pretender
relacionamentos mais precisos do que a prpria identidade.

Ordenamento de diferenas entre resultados (designs relacionados para os mesmos sujeitos ou
emparelhados):
Em geral, a atribuio de ordens s diferenas entre resultados efectua-se tal como fizemos para os
resultados, sendo atribuda a ordem mais baixa menor diferena e por a adiante;
Diferenas idnticas entre resultados so ordenadas da mesma forma que resultados idnticos,
atribuindo-se uma ordem mdia resultante da globalidade de ordens que essas diferenas deveriam
ocupar;
Resultados nulos de 0 so contados como o resultado mais baixo possvel quando se calculam
diferenas entre resultados;
ESTATSTICA II

34
2010
Contudo, quando existe igualdade entre resultados que originem uma diferena nula entre as situaes
experimentais, estes no so ordenados, sendo retirados da anlise;
Diferenas positivas e negativas so ordenadas em conjunto como se tratasse de um ordenamento
simples de resultados, ignorando os sinais positivos e negativos.

Exemplo: Suponha que quer ordenar as diferenas entre o nmero de frases correctas que um grupo de
crianas com suspeita de perda auditiva produziu antes da colocao de um aparelho auditivo e aps a
colocao daquele.

Quadro 14: Ordenao para Amostras Relacionadas ou Emparelhadas


Ao contrrio do que acontece nos casos das amostras relacionadas quando a diferena entre 2
situaes nula nas amostras relacionas a este tipo de resultado no atribuda nenhuma ordem,
sendo que o resultado nem sequer considerado na anlise. No ordenamento de resultados negativos
em amostras relacionadas ignoram-se os sinais quando se ordenam os resultados.

PROVA DE MCNEMAR PARA A SIGNIFICNCIA DE MUDANAS

Quando utilizar
A prova de McNemar para a significncia de mudanas particularmente aplicvel aos planeamentos
do tipo antes e depois, em que cada indivduo utilizado como o seu prprio controlo e a
mensurao se faz ao nvel de uma escala nominal ou ordinal. Pode, assim, ser usada para testar a
eficincia de determinada tcnica (reunies, folhetos, visita, etc.) sobre as preferncias eleitorais a
respeito de vrios candidatos.
Nestes casos, cada pessoa pode servir como o seu prprio controlo, utilizando-se a mensurao em
escala nominal para avaliar as alteraes da situao aps em relao situao antes.
8 5 6 1 10
9 6 7 1 9
- 0 4 4 8
6,5 4 5 1 7
5 3 5 2 6
2 1 5 4 5
6,5 4 5 1 4
2 1 3 2 3
4 2 7 5 2
2 1 6 5 1
ordem diferenas
N de frases correctas
depois do aparelho
auditivo
N de frases correctas
antes do aparelho
auditivo
Sujeitos
8 5 6 1 10
9 6 7 1 9
- 0 4 4 8
6,5 4 5 1 7
5 3 5 2 6
2 1 5 4 5
6,5 4 5 1 4
2 1 3 2 3
4 2 7 5 2
2 1 6 5 1
ordem diferenas
N de frases correctas
depois do aparelho
auditivo
N de frases correctas
antes do aparelho
auditivo
Sujeitos
ESTATSTICA II

35
2010
Racional
Para comparar a significncia de qualquer mudana observada, por este mtodo, constri-se uma
tabela de frequncias de 4 casas para representar o 1 e o 2 conjunto de reaces dos mesmos
indivduos. As caractersticas gerais desta tabela so as que se apresentam a seguir, em que se utilizam
os sinais + e - para indicar diferentes reaces.
ANTES
- +
DEPOIS + A B
- C D

Note-se que os casos que acusam modificaes entre a 1 e a 2 reaco aparecem nas clulas A e D.
Um indivduo localizado na clula A se passou de + para - e na clula D se passou de - para
+. Na ausncia de modificao, o indivduo classificado na clula B (reaco + antes e depois)
ou na clula C (reaco - antes e depois).
Como A e D representa o nmero total de indivduos que acusam modificao, a perspectiva, sob a
hiptese de nulidade, seria que (A+D) acusassem modificaes num sentido e (A+D) acusassem
modificaes noutro sentido. Ou seja, (A+D) a frequncia esperada, sob H0, tanto na clula A
como na clula D.
Na prova de McNemar de significncia de mudana, estamos interessados apenas nas clulas A e D.
Portanto,
A=nmero de casos observados na clula A,
D=nmero de casos observados na clula D e
(A+D)=nmero esperado de casos tanto nas clulas A como D,

Ento

com graus de liberdade=1



CORRECO DE CONTINUIDADE

A aproximao, pela distribuio do Qui-quadrado, da distribuio amostral da frmula torna-se
excelente se introduzir uma correco de continuidade. Tal correco necessria, porque se utilizou
um distribuio contnua (Qui-quadrado) para aproximar uma distribuio discreta. Quando todas as
frequncias esperadas so pequenas, tal aproximao pode ser fraca. A correco de continuidade
(Yates, 1934) constitui uma tentativa de remoo dessa fonte de erro.
Com a correco de continuidade, tem-se:

com graus de liberdade=1


ESTATSTICA II

36
2010

Esta expresso indica que se deve subtrair 1 do valor absoluto da diferena entre A e D antes de elevar
ao quadrado. O grau de significncia de qualquer valor observado de Qui-quadrado, tal como
calculado atravs da frmula, determinado mediante referncia a uma Tabela (Anexo I). Se o valor
observado de Qui-quadrado igual a, ou maior do que, o valor exibido na Tabela para determinado
nvel de significncia com gl=1, a implicao que existe efeito significativo nas reaces antes e
depois.

Instrues passo-a-passo para calcular x
2

Enquadrar as frequncias observadas numa tabela de 4 casas.
Determinar as frequncias esperadas nas clulas A e D
E=1/2 (A+D)
Se as frequncias esperadas so inferiores a 5, empregar a prova binomial em
substituio prova de McNemar.
Se as frequncias esperadas no so inferiores a 5, calcular o valor de X
2
atravs
da frmula



Mediante referncia Tabela (Anexo I), determinar a probabilidade, sob H0, associado a um valor to
grande quanto o valor observado de X
2
. Se trata de uma prova unilateral, dividir por 2 o valor da
probabilidade exibido na Tabela. Se o valor de p, dado pela Tabela para o valor observado de X
2
com
gl=1, no supera p, rejeita-se H0 em favor de H1.

Exemplo: Suponha que um profissional de sade est interessado em estudar os comportamentos
resultantes da iniciao de obesos prtica do exerccio fsico. Este profissional observou ao longo
dos anos que os obesos utilizam preferencialmente o elevador para se dirigirem sua consulta cujo
consultrio era no 1. andar. Coloca a hiptese de que os obesos que tiveram com teraputica
exerccio fsico comeariam a usar preferencialmente as escadas. A fim de testar a hiptese o tcnico
observa 25 doentes em que ministrou como exerccio fsico caminhar uma hora por dia cinco vezes
por semana. Decorrido um ms de exerccio observa os mesmos 25 doentes e faz a classificao
comportamentos. Os dados so os seguintes:

Preferncia aps 30 dias de exerccio
Escadas Elevador
Preferncia antes da
teraputica
Elevador 4 (A) 14 (B)
Escadas 4 (C) 3 (D)

ESTATSTICA II

37
2010
Hiptese de nula (H0): Para os obesos que modificaram a sua atitude, a probabilidade de mudar o
percurso do elevador para as escadas (PA) igual probabilidade de mudar de mudar das escadas
para o elevador (PD) e ambas so iguais a . Isto ,
H0: PA=PD=1/2 H1: PA>PD

Prova estatstica:
Utiliza-se a prova de McNemar para significncia de mudanas, porque o estudo utiliza duas amostras
relacionadas, do tipo antes-e-depois e utiliza a escala de medida nominal (classificativa).

Nvel de significncia:
p=0,05 N=25

Distribuio amostral:
A distribuio Qui-quadrado com 1 grau de liberdade d uma boa aproximao da distribuio
amostral de Qui-quadrado, tal como calculada pela frmula.

Regio de Rejeio:
Como H1 especifica o sentido da diferena prevista, a regio de rejeio unilateral. Consiste de
todos os valores de Qui-quadrado que so to grandes que acusem uma probabilidade unilateral,
associada sua ocorrncia sob H0 no superior a 0,05.

Deciso:
Estamos interessados nos obesos cujo comportamento acusa alterao: representados nas clulas A e D.
Para os dados, temos:




Sendo 0 valor observado de x
2
=0, devemos consultar a tabela (Anexo I) para obter o valor crtico, no
esquecendo que temos uma amostra unicaudal a um nvel de 0,05. consultando a tabela observamos
um x
2
critico de 5,41.


ESTATSTICA II

38
2010
TESTE DOS SINAIS DE WILCOXON

Teste de Wilcoxon ou Wilcoxon Signed Rank Test
ou
Teste de postos com sinais (equivalente do teste t emparelhado)

Quando utilizar
O teste de Wilcoxon deve ser utilizado num design experimental relacionado, com duas situaes
experimentais quando so utilizados os mesmos sujeitos ou sujeitos emparelhados em ambas as
situaes.
Exemplo: Suponha que quer investigar se existe alguma diferena na quantidade de vocabulrio
utilizado por crianas que usam um aparelho auditivo ou por crianas que no usam. Este um bom
exemplo dum caso em que essencial a utilizao de sujeitos emparelhados. Como bvio, no
possvel utilizar os mesmos sujeitos, uma vez que nenhuma criana que no precisa de usar aparelho
auditivo usa um mesmo tempo. Por outro lado, no podemos escolher aleatoriamente os sujeitos para
cada grupo. Pode dar-se o caso, por exemplo, de os sujeitos que usam aparelho auditivo serem mais
velhos. Qualquer efeito encontrado neste grupo pode ficar a dever-se unicamente a esta diferena. Os
dois grupos com aparelho e sem aparelho necessitam de ser emparelhados em termos de idade,
sexo, inteligncia e todas as outras variveis que achemos necessrio serem controladas.
Apresentamos depois s crianas um teste que mea o seu vocabulrio, traduzindo-o em resultados, tal
como mostrado na tabela seguinte.

Par de
sujeitos
Situao A
(com aparelho)
Situao B
(sem aparelho)
d (A-B) Ordem de d
Ordem das
diferenas
positivas
Ordem das
diferenas
negativas
1 3 5 -2 5(-) 5
2 4 5 -1 2(-) 2
3 3 2 +1 2(+) 2
4 1 5 -4 8,5(-) 8,5
5 5 4 +1 2(+) 2
6 2 5 -3 7(-) 7
7 3 5 -2 5(-) 5
8 4 4 0 -
9 1 5 -4 8,5(-) 8,5
10 3 5 -2 5(-) 5
TOTAL 29 45 4 41

RACIONAL
O objectivo do teste dos sinais de Wilcoxon comparar as performances de cada sujeito (ou pares de
sujeitos) no sentido de verificar se existem diferenas significativas entre os seus resultados nas duas
situaes. Os resultados da Situao B so subtrados dos da Situao A e diferena resultante (d)
ESTATSTICA II

39
2010
atribudo o sinal mais (+) ou, caso seja negativa, o sinal menos (-). Estas diferenas so ordenadas em
funo da sua grandeza (independentemente do sinal positivo ou negativo). O ordenamento assim
obtido depois apresentado separadamente para os resultados positivos e negativos. O menor dos
valores d-lhe o valor de uma estatstica designada por W, que pode ser consultada na Tabela de
significncia apropriada.
A ideia que se existirem apenas diferenas aleatrias, tal como postulado pela hiptese nula, ento
haver aproximadamente o mesmo nmero de ordens elevadas e de ordens inferiores tanto para as
diferenas positivas como negativas. Caso se verifique uma preponderncia de baixos resultados para
um dos lados, isso significa a existncia de muitos resultados elevados para o outro lado, indicando
uma diferena em favor de uma das situaes, superior quilo que seria de esperar se os resultados se
devessem ao acaso. Dado que a estatstica W reflecte o menor total de ordens, quanto menor for o W
mais significativas sero as diferenas nas ordenaes entre as duas situaes.

INSTRUES PASSO-A-PASSO PARA CALCULAR W
Calcule a diferena d entre cada par de resultados, atribuindo o sinal mais ou menos.
Veja a coluna d(A-B)
Ordene as diferenas por ordem de grandeza desde a ordem inferior at superior, ignorando os sinais
positivos e negativos.
Veja a coluna ordenamento de d
Em separado, junte tambm a ordenao correspondente aos sinais diferentes (+ ou -).
Veja os totais para ordenamentos de diferenas positivas e de diferenas negativas nas respectivas
colunas
Considere o menor dos totais das ordens como W.
Valor observado de W=4, uma vez que o total das ordens para as diferenas positivas o menor
Conte o nmero de pares de sujeitos N (no considere as igualdades).
N=10-1=9

Consulta da significncia na tabela
A tabela anexada (Anexo III) apresenta-lhe o nvel de significncia de w tanto para os testes
unicaudais como bicaudais. Na coluna da esquerda encontra os valores de N. Uma vez que no
efectumos uma previso da direco (como por exemplo, que obteramos melhores resultados no
vocabulrio de criana em jardim de infncia) teremos de utilizar os nveis de significncia para uma
hiptese bicaudal. Seleccione o valor adequado N=9 e verifique ao longo dessa linha se o valor de W
significativo. Uma vez que se convencionou utilizar o menor valor das ordens, ento o valor obtido
de W ter de ser igual ou inferior ao valor crtico da Tabela. Como o valor obtido W=4 inferior ao
ESTATSTICA II

40
2010
valor crtico de 6 para p<0,05 (bicaudal), pode rejeitar a hiptese nula e concluir que existe uma
diferena significativa entre os resultados no vocabulrio dos dois grupos de sujeitos emparelhados.
Suponha que tinha efectuado uma previso numa dada direco, por exemplo, que as crianas que
usam aparelho auditivo (Situao B) obtm resultados mais elevados no teste de vocabulrio. O valor
obtido de W=4, inferior a 6, que o valor crtico de W para p<0,025 (hiptese unicaudal), uma
probabilidade inferior e, consequentemente, mais significativa do que o nvel de significncia para
uma hiptese bicaudal p<0,05.

As estatsticas para K amostras relacionadas servem para comprovar a significncia de
diferenas entre trs ou mais grupos, ou seja, para comparar a hiptese de nulidade de que K (3 ou
mais) amostras tenham sido extradas da mesma populao ou de populaes idnticas.
As circunstncias exigem, por vezes, o recurso a um experimento que nos permita estudar
simultaneamente mais de duas amostras ou condies. Quando se trata de comparar trs ou mais
amostras ou condies de um experimento, necessrio aplicar uma prova estatstica que indique se
h alguma diferena global entre as K amostras ou condies, antes que possamos cogitar de
comprovar a significncia da diferena entre duas amostras quaisquer.
S quando uma prova global (prova de K amostras) nos autoriza a rejeitar a hiptese nula que
podemos empregar um processo para determinar diferenas significativas entre duas quaisquer das K
amostras.
Estas provas no-paramtricas tm a vantagem de permitir o estudo da significncia de dados que,
inerentemente, se apresentam apenas sob a forma classificativa ou em postos.
H dois planos bsicos para comparar K grupos:
No primeiro deles, as K amostras de igual tamanho so postas em correspondncia de acordo com
determinado(s) critrio(s) que podem afectar os valores das observaes. Nalguns casos, essa
correspondncia obtm-se comparando os mesmos indivduos ou casos sob todas as K condies ou
ento cada um dos N grupos pode ser mensurado sob todas as K condies. Em tais planos, devem
usar-se provas estatsticas para K amostras relacionadas;
O segundo plano envolve K amostras aleatrias independentes (no necessariamente do mesmo
tamanho), uma de cada populao. Em tais casos, devemos usar as provas estatsticas para K amostras
independentes.

ESTATSTICA II

41
2010
PROVA DE COCHRAN

Quando utilizar
A prova de McNemar para duas amostras pode ser estendida para aplicao a pesquisas que envolvem
mais de duas amostras. Essa extenso, que constitui a prova Q de Cochran para K amostras
relacionadas, proporciona um mtodo para comparar se trs ou mais conjuntos correspondentes de
frequncias ou propores diferem entre si significativamente. A correspondncia pode basear-se
em caractersticas relevantes dos diferentes indivduos ou no facto de os mesmos indivduos serem
observados sob condies diferentes. A prova Q de Cochran adapta-se especialmente ao caso em que
os dados se apresentam numa escala nominal ou sob a forma de informao ordinal dicotomizada.
Exemplo: Suponha que estamos interessados em saber se a atitude de um entrevistador influencia a aceitao de participao num estudo por
inqurito. Poderemos treinar o entrevistador para efectuar as suas entrevistas de trs maneiras diferentes:
Demonstrando interesse, cordialidade, entusiasmo;
Demonstrando formalismo, reserva e cortesia;
Demonstrando modo abrupto, formalismo e aspereza.

Exemplo: O entrevistador visitaria 3 grupos de 18 casas, aplicando o tipo 1 de entrevista a um grupo, o tipo 2 a outro grupo e o 3 ao terceiro
grupo. Teramos, assim, 18 conjuntos de potenciais inquiridos com trs deles correspondendo em cada conjunto. Em cada conjunto atribuir-se-
iam aleatoriamente aos trs membros as trs condies (tipos de entrevista). Teramos, ento, 3 amostras relacionadas (correspondentes) com 18
elementos cada uma (N=18). Poderamos, pois, comprovar se as diferenas fundamentais nos tipos de entrevista influenciariam o nmero de
respostas afirmativas sim dadas para aceitao de participao pelos 3 grupos de correspondentes.

Conjunto Resposta entrevista 1 Resposta entrevista 2 Resposta entrevista 3
1 1 1 1
2 2 2 1
3 1 2 1
4 1 1 1
5 2 1 1
6 2 2 1
7 2 2 1
8 1 2 1
9 2 1 1
10 1 1 1
11 2 2 2
12 2 2 2
13 2 2 1
14 2 2 1
15 2 2 1
16 2 2 2
17 2 2 1
18 2 2 1
Respostas Sim (1) e No (2) dadas por donas de casa a trs tipos de entrevistas
Hiptese nula: A probabilidade de um Sim a mesma para os trs grupos de entrevistas.
H1: As probabilidades de um Sim diferem conforme o tipo de entrevista.
Prova estatstica:
Escolhe-se a prova Q de Cochran, porque os dados se referem a mais de dois grupos relacionados (K=3) e apresentam-se dicotomizados sob a
forma Sim e No.

Nvel de significncia: p=0,01 N=18
ESTATSTICA II

42
2010
Deciso:
Recodificmos Sim por 1 e No por 0.
Conjunto Resposta entrevista 1 Resposta entrevista 2 Resposta entrevista 3 Li
(soma emlinha)
Li
2

1 0 0 0 0 0
2 1 1 0 2 4
3 0 1 0 1 1
4 0 0 0 0 0
5 1 0 0 1 1
6 1 1 0 2 4
7 1 1 0 2 4
8 0 1 0 1 1
9 1 0 0 1 1
10 0 0 0 0 0
11 1 1 1 3 9
12 1 1 1 3 9
13 1 1 0 2 4
14 1 1 0 2 4
15 1 1 0 2 4
16 1 1 1 3 9
17 1 1 0 2 4
18 1 1 0 2 4
Total

G1=13 G2=13 G3=3 ELi=29 E Li2=63

Li=nmero total de respostas Sim para cada linha
K=nmero de colunas Nmero de linhas
Substituindo estes valores na frmula, vem:






Em que K= n. de grupos
Gj= n. total de sucessos

A Tabela (Anexo I) indica que Q > 16,7 tem uma probabilidade de ocorrncia, sob H0, p < 0,001,
quando gl=K-1=3-1=2. Essa probabilidade inferior ao nvel de significncia de p=0,01. O valor de Q
est na regio de rejeio e, consequentemente, a nossa deciso rejeitar H0 em favor de H1,
concluindo que o nmero de respostas Sim difere significativamente em relao aos tipos 1, 2 e 3 de
entrevista.
ESTATSTICA II

43
2010

Racional
Se os dados de uma pesquisa se dispem numa tabela de dupla entrada com N linhas e K colunas,
possvel testar a hiptese de nulidade de que a proporo ou frequncia de respostas de determinado
tipo seja a mesma em cada coluna, exceptuando as diferenas devidas ao acaso. Cochran mostrou que
se a hiptese de nulidade verdadeira, isto , se no h diferena na probabilidade, digamos de
Sucesso sob cada condio (o que equivale a dizer que os Sucessos ou Fracassos se distribuem
aleatoriamente pelas linhas e colunas da tabela de dupla entrada), ento, se o nmero de linhas muito
pequeno



tem distribuio aproximadamente Qui-quadrado com gl=K-1, em que:
Gj=nmero total de Sucessos na coluna j
G=mdia dos Gj
Li=nmero total de sucessos na linha i
Uma expresso equivalente frmula anterior, e facilmente dedutvel dela, mas que simplifica os
clculos :



Instrues passo-a-passo para calcular Q
Para dados dicotomizados, atribuir a pontuao 1 a cada Sucesso e 0 a cada Falha.

Dispor os dados numa tabela K.N, com K colunas e N linhas (Nmero de condies em cada um dos
grupos).

Determinar o valor de Q, aplicando a frmula.
A significncia do valor observado de Q pode ser determinada mediante a observao do Anexo I,
pois Q recorre distribuio do Qui-quadrado com gl=K-1. Se a probabilidade associada ocorrncia,
sob H0, de um valor to grande quanto um valor observado de Q no supere p, rejeita-se H0.


ESTATSTICA II

44
2010

TESTE DE FRIEDMAN

Quando utilizar
Este teste pode ser considerado uma extenso do teste de Wilcoxon, quando necessrio utilizar trs
ou mais situaes experimentais. Deve ser utilizado para um design relacionado quando os mesmos
sujeitos (ou sujeitos emparelhados) so distribudos por trs ou mais situaes experimentais.

Exemplo: Suponha que um editor de livros de estatstica produziu uma srie de livros e quer escolher
de entre trs tipos de ilustraes, aquele que mais eficaz para os estudantes.
pedido a oito universitrios que classifiquem as obras numa escala de cinco pontos, desde nada
boa at muito boa.

Obtiveram-se os resultados apresentados na tabela seguinte.

Sujeitos Situao 1 (Ilustrao A) Situao 2 (Ilustrao B) Situao 3 (Ilustrao C)
Resulta. Ordem Resulta. Ordem Resulta. Ordem
1 2 1 5 3 4 2
2 1 1 5 3 3 2
3 3 1 5 2,5 5 2,5
4 3 2 5 3 2 1
5 2 1 3 2 5 3
6 1 1 4 2,5 4 2,5
7 5 3 3 2 2 1
8 1 1 4 3 3 2
TOTAL 18 11 34 21 28 16
MDIA 2,25 4,25 3,50



Racional
Uma vez que se trata de um design relacionado no qual o mesmo sujeito obtm resultados em todas as
situaes, permitido comparar os resultados de cada sujeito atravs de todas as situaes, no sentido
de verificarmos em que situao obtm maiores e menores resultados.
Uma vez que existem mais do que duas situaes, no possvel calcular as diferenas nos resultados
de duas situaes, como era o caso do teste de Wilcoxon. Pelo contrrio, o ordenamento dos
resultados de cada sujeito para as trs condies ser feita horizontalmente ao longo das linhas, tal
como mostra a tabela. Por exemplo, aos resultados do sujeito 1, respectivamente 2 na Situao 1, 5 na
Situao 2 e 4 na Situao 3, so atribudas trs ordens, do menor resultado para o maior: Ordem 1
para a Situao 1, Ordem 2 para a Situao 3 e Ordem 3 para a Situao 2; este procedimento
ESTATSTICA II

45
2010
semelhante para todos os sujeitos. Claro que se existissem quatro situaes experimentais, os
resultados de cada sujeito seriam ordenados de 1 a 4.
O prximo passo calcular os totais de ordens para cada situao. Se existirem apenas diferenas
aleatrias entre os resultados de todas as situaes, como postulado pela hiptese nula, de esperar
que estes totais sejam aproximadamente iguais partindo do princpio de que surgiriam algumas ordens
baixas (baixos resultados) e algumas ordens altas (altos resultados). Contudo, se as situaes forem
significativamente diferentes, de esperar que se obtenham totais das ordens significativamente
diferentes, com algumas situaes a terem uma preponderncia de ordens baixas e outras, uma
preponderncia de ordens altas. O tamanho das diferenas entre os totais das ordens -nos dado por
uma estatstica designada por Xr
2
. Se o valor de Xr
2
for igual ou superior aos valores crticos das
Tabelas C e D (Anexo V), isso implica que as diferenas nos totais das ordens so suficientemente
grandes para que se possam considerar significativas.

Instrues passo-a-passo para calcular w
Ordene os resultados de cada sujeito em separado, ao longo de cada linha, atribuindo a Ordem 1 ao
menor resultado e por a adiante.
(Veja as colunas das Ordens na tabela. Note que a ordem para cada linha de resultados corresponde s
ordens 1,2 e 3, dado existirem trs situaes)
Calcule o total das ordens para cada situao.

Calcule o valor de X
R
2
ou F
r
a partir da frmula
1 ( 3
) 1 (
12
1
2
+
(

+
=

=
k N R
k Nk
F
k
j
j r


ou



em que
C=nmero de situaes C=3
Nmero de sujeitos N=8
T
c
=total de ordens para cada situao T
1
=11;T
2
=21;T
3
=16
T
c
2
=quadrado do total de ordens para cada situao T
1
2
=11
2
;T
2
2
=21
2
;

T
3
2
=16
2

ET
c
2
=soma dos quadrados dos totais das ordens para cada situao: 11
2
+21
2
+16
2


ESTATSTICA II

46
2010

Clculo de X
R
2



Calcule os graus de liberdade, ou seja, o nmero de situaes menos uma.
(gl = C 1 = 3 1 = 2)
Consulta da significncia na tabela
Existem duas tabelas para consultar os valores crticos de Xr
2
. Uma delas, a Tabela C (Anexo V),
utilizada quando o nmero de situaes e de sujeitos pequeno. A Tabela C (1) apresenta os valores
de Xr
2
para trs situaes quando N (nmero de sujeitos) se situa entre 2 e 9. A Tabela C (2) apresenta
os valores de Xr
2
para quatro situaes quando N (nmero de sujeitos) de 2, 3 ou 4. A Tabela D
(Anexo V) a tabela de distribuio do Qui-quadrado; pode utiliz-la quando a amostra de sujeitos for
superior s das Tabelas C (1) e C (2), uma vez que o Xr
2
tem uma distribuio semelhante do Qui-
quadrado.
A Tabela que deve utilizar para consultar o valor de Xr
2
, no caso desta experincia, a Tabela C (1),
uma vez que se trata de 8 sujeitos expostos a 3 situaes experimentais. Aquilo que temos de fazer
encontrar a coluna apropriada para N (nmero de sujeitos ou pares de sujeitos emparelhados) e
descobrir na coluna p a probabilidade mais prxima que seja inferior aos nveis de significncia
convencionais. Consultando as probabilidades para N=8, o valor obtido de Xr
2
=6,25 equivalente a
uma probabilidade de p<0,047, que inferior aos nveis de significncia convencionais (p<0,05=).
Para considerarmos o nvel de significncia de p<0,01 o nosso valor de Xr
2
teria de ser 9,00, dado que
p<0,009 inferior a p<0,01. Se o valor de Xr
2
no for apresentado na Tabela, dever considerar o
valor seguinte mais prximo quando consulta as probabilidades. Por exemplo, se o valor de Xr
2
for
5,95 ter de considerar a probabilidade apresentada para 5,25, ou seja, p<0,079, que superior a
p<0,05 e, consequentemente, no significativa. Para consultar os valores da Tabela C (2) dever
proceder tal como para a Tabela C (1).
Se tiver mais situaes e/ou sujeitos e tiver de consultar a Tabela D, aquilo que tem a fazer localizar
os valores dos graus de liberdade ao longo da coluna da esquerda (no nosso exemplo, gl=2, ou seja,
nmero de situaes-1). Depois siga ao longo da linha de probabilidades at que encontre um dos
nveis de significncia convencionais. O valor que obtivemos de Xr
2
=6,25 superior ao valor crtico
de 5,99 apresentado na Tabela do Qui-quadrado, pelo que podemos aceitar que os nossos resultados
ESTATSTICA II

47
2010
so significativos ao nvel de significncia de p<0,05. Apesar disso, e dado que o nosso valor de Xr
2

inferior ao valor crtico de 9,21 para p<0,01, no podemos rejeitar a hiptese nula a este nvel de
significncia.
A partir da anlise estatstica da experincia pode concluir que as crianas mostram preferncias
significativamente diferentes pelos trs tipos de ilustraes. Em funo das mdias apresentadas na
tabela, sabemos que preferem a Ilustrao B, que recolheu as ordens mais elevadas, seguindo-se a
Ilustrao C e, por ltimo, a Ilustrao A. Contudo, o teste de Friedman pode apenas indicar que
existem diferenas globais entre as situaes. Para verificar se existe uma tendncia para uma
determinada ordem de preferncia das Ilustraes, necessita de utilizar um teste de tendncia.

MEDIDAS DE CORRELAO E SUAS PROVAS DE SIGNIFICNCIA


Frequentemente, o investigador quer saber se dois resultados esto relacionados e qual o grau desse
relacionamento.
Apresentam-se medidas no-paramtricas de correlao e de provas estatsticas para determinar a
probabilidade associada ocorrncia de uma correlao to grande quanto a observada na amostra,
sob a hiptese de nulidade de que as variveis sejam no-relacionadas na populao.
Mas de muito maior interesse poder afirmar se determinada associao observada numa amostra
indica, ou no, a probabilidade de associao entre as variveis na populao da qual se extraiu a
amostra. O coeficiente de correlao, por si s, representa o grau de associao. As provas de
significncia sobre aquele coeficiente determinam, a um certo nvel de probabilidade, se existe a
associao na populao da qual se extraiu a amostra que serviu de base para o clculo do coeficiente.
Interpretao:
O coeficiente de correlao obtido pode se interpretado com base em:
Para Cardoso:
r s 0,2 Correlao muito baixa (valores desprezveis)
0,2 < r s 0,5 Correlao baixa
0,5 < r s 0,7 Valores significativos
0,7 < r s 0,9 Alta correlao
0,9 < r s 1 Muito alta correlao

ESTATSTICA II

48
2010
Para Borg:
0,20 < r s 0,35 Ligeira relao entre as variveis, embora j possam ser
estatisticamente significativas
0,35 < r s 0,65 Correlao estatisticamente significativa para alm do nvel de 1%
0,65 < r s 0,85 Correlaes que tornam possveis predies do grupo de que so dignas
r > 0,85 ntima relao entre as variveis correlacionadas

Para Bryman e Cramer (1995), citando Cohen e Holliday (1982)
se Eta, r, rho, phi:
s 0,2 Correlao muito fraca e sem significncia
0,2 < r s 0,39 Correlao fraca
0,4 < r s 0,69 Correlao moderada
0,7 < r s 0,89 Correlao forte
0,9 < r s 1 Correlao muito elevada

Coeficiente de correlao d-nos:
A direco que indicada pelo sinal + ou -
A intensidade ou fora que dada pelo valor que varia entre -1 e 1. Se a correlao for zero no existe
correlao entre as variveis (exemplo: cor dos olhos e inteligncia).

COEFICIENTE DE CORRELAO RHO DE SPEARMAN-RANK

Condies de utilizao
Este tipo de coeficiente de correlao utiliza-se quando temos:
Teste no paramtrico (semelhante a uma distribuio livre), isto , no coloca restries quanto
forma da distribuio;
Escala de medida no mnimo ordinal.

Pode acontecer que os caracteres estudados no sejam mensurveis, mas podem ser ordenados ou
classificados. Por exemplo, quando se considera um grupo de candidatos a um certo lugar, eles podem
ESTATSTICA II

49
2010
ser examinados segundo dois pontos de vista: conhecimentos e personalidade. Estas duas qualidades
no podem ser medidas, mas possvel para cada uma delas efectuar uma classificao dos
candidatos. Podemos, assim, examinar se existe correlao entre estes dois caracteres; cada par de
dados (xi, yi) formado pelas ordens ocupadas por um candidato nas duas classificaes.


Em que:
di= diferena entre as posies nas duas variveis, isto , di=xi-yi
Para tal, temos que dar valores s posies: pontuao mais baixa damos o valor 1 e assim
sucessivamente. Quando os valores so iguais a mdia dessas duas posies.
Ento, -1 s s 1

Se as duas classificaes so iguais, di sempre zero e ento r=1 e a correlao perfeita. Se as
ordens mais altas de uma classe esto associadas s mais baixas da outra r torna-se negativo e se as
duas classificaes so inversas =-1.

Exemplo: Calcule , sabendo que:
xi 18 17 14 13 13 12 11 9 7 5
yi 24 27 17 22 19 20 14 11 3 6

xi posio yi posio di di
2

18 1 24 2 -1 1
17 2 27 1 1 1
14 3 17 6 -3 9
13 4,5 22 3 1,5 2,25
13 4,5 19 5 -0,5 0,25
12 6 20 4 2 4
11 7 14 7 0 0
9 8 11 8 0 0
7 9 3 10 -1 1
5 10 6 9 1 1
E=19,5






ESTATSTICA II

50
2010

TESTES NO PARAMTRICOS NO SPSS
Mais especificamente, veremos como realizar os testes:

Teste de Mann-Whitney U para comparar duas amostras independentes;
Teste de Wilcoxon para comparar duas amostras relacionadas;
Teste de Kruskal-Wallis H para comparar duas ou mais amostras independentes;



s vezes no podemos assumir normalidade e, outras vezes os dados que dispomos no nos
permite calcular a mdia (e.g. quando os dados so ordinais). Os Mtodos No Paramtricos
so aplicveis em tais situaes. Em particular, ns os usaremos principalmente quando no
pudermos afirmar que a nossa amostra foi retirada de uma populao normal.
Como regra geral, recomenda-se o uso de um teste paramtrico ao invs de um no
paramtrico, uma vez que os testes paramtricos tendem a discriminar mais e a ser mais
poderosos. Entretanto, os no paramtricos devem ser usados quando os dados no respeitam
as premissas bsicas que embaam os procedimentos estatsticos (e.g. normalidade ou
homogeneidade de varincias).

O TESTE DE MANN-WHITNEY

O teste de Mann-Whitney a alternativa mais comum ao teste t para amostras independentes.
Pode se utilizar este teste para testar a hiptese nula que afirma que as mdias populacionais
so as mesmas para os dois grupos. Este teste no exige que as populaes tenham a mesma
varincia.
Para fins ilustrativos, usaremos o seguinte exemplo:

Um grupo 5 de ratos foi treinado para imitar o rato lder em um labirinto a procura de
alimento e outro grupo de 4 ratos (controle) foi submetido a mesma situao, porm sem
ESTATSTICA II

51
2010
treinamento prvio. O nmero de tentativas o critrio de comparao entre os grupos. Existe
diferena entre os dois grupos.

Treinados 78 64 75 45 82
No treinados 110 70 53 51


No SPSS...


Figura 1: Entrada dos dados no programa.

Em todo software estatstico, as colunas representam variveis. No exemplo em questo,
temos apenas uma varivel (n tentativas dos ratos), ento digitaremos os dados numa coluna
apenas. Criaremos uma segunda varivel, ensinado, para discriminar a origem dos dados
(amostra pertencente).
ESTATSTICA II

52
2010
Feito isso, para realizar o teste, devemos clicar em:

ANALYSE/ NONPARAMETRIS TESTS/ 2 INDEPENDENT SAMPLES.. .


Como consequncia, surgir a seguinte caixa de dilogo:

Figura 2: Caixa de dilogo referente ao teste de Mann-Whitney.

ESTATSTICA II

53
2010


Devemos clicar em Define Groups...


Aps clicar em Continue e em Ok

MANN-WHITNEY TEST



ESTATSTICA II

54
2010


Ao observar a tabela acima, vemos que a estatstica teste Mann-Whitney U = 9,000 tem uma
significncia (P-valor) de 0,806. Assim, conclumos que no h evidncia estatstica de
diferena entre os grupos de ratos.

ESTATSTICA II

55
2010

O TESTE DE WILCOXON:

Este teste a verso no paramtrica do teste t para amostras emparelhadas. Em particular,
ns usamos este teste quando temos medies repetidas de uma amostra, mas a populao
original no tem necessariamente o formato de uma Normal.
Como o teste U de Mann-Whitney, o teste de Wilcoxon pode ser usado com dados ordinais,
intervalares ou proporcionais.
Os dados para esse teste consistem dos diferentes registos das medies repetidas. Essas
diferenas so ento classificadas da menor para a maior em valores absolutos (sem
considerar o sinal). Se existir uma diferena real entre as duas medies, ou tratamentos,
ento os diferentes registos sero consistentemente positivos ou negativos. Por outro lado, se
no houver diferena entre os tratamentos, ento os diferentes registos sero misturados
regularmente.
A hiptese nula que a diferena entre os registos no sistemtica e, deste modo, no existe
diferena entre os tratamentos.

Como ilustrao, usaremos o exemplo:
Um fabricante de cigarros afirma que o contedo de nicotina dos cigarros Y menor do que o
dos cigarros X. Um laboratrio fez as seguintes determinaes do contedo de nicotina (em
miligramas) das duas marcas:
X: 1,0, 1,3, 1,5, 1,1, 1,6
Y: 0,8, 1,2, 1,4, 0,9, 1,0
Concorda com a afirmao do fabricante? Por qu?




ESTATSTICA II

56
2010

No SPSS...

CLICAR EM ANALYSE/ NONPARAMETRIS TESTS/ 2 RELATED SAMPLES. ..



Clicando em OK...

WILCOXON SIGNED RANKS TEST

ESTATSTICA II

57
2010

A estatstica teste de Wilcoxon, convertida num score z = -2,041 tem uma significncia (P-
valor) de 0,041. Assim, conclumos que os grupos so estatisticamente diferentes.

TESTE H DE KRUSKAL-WALLIS:

O teste H de Kruskal-Wallis a verso no-paramtrica para medies da ANOVA de um
factor independente. Ns usamos esse teste quando temos mais de duas amostras
independentes e podemos assumir que elas so de populaes com o mesmo formato, no
necessariamente Normal. O teste H de Kruskal-Wallis pode ser usado com dados ordinais,
intervalares ou proporcionais.
Como o teste U de Mann-Whitney, o teste H de Kruskal-Wallis classifica todos os resultados
observados. Se existirem diferenas entre os grupos, ento os resultados das vrias amostras
sero sistematicamente agrupados (cluster) em ordem de classificao. Alternativamente, se
no existirem diferenas entre os grupos, os resultados sero misturados com toda a ordem de
classificao. A hiptese nula estabelece que mo h diferena entre os grupos, logo os
resultados no iro se agrupar sistematicamente.
Exemplo:
Considerem os dados abaixo para estudar a hiptese da igualdade das mdias do aumento dos
pesos dos porcos alimentados com as raes A, B e C. Use = 0,01.
A: 3 1 5 2 4
B: 8 7 10 6 9
C: 14 13 12 11

ESTATSTICA II

58
2010

>ANALYSE > NONPARAMETRIC TESTS >K INDEPENDENT SAMPLES. ..



>Clique em Define Range (definir variao).... A prxima caixa de dilogo nos leva a
designar valores mximo e mnimo para a varivel agrupada. No nosso arquivo de dados, os
grupos foram rotulados de 1 a 3.



Clicando em Continue e em OK...



ESTATSTICA II

59
2010
KRUSKAL-WALLIS TEST




A estatstica teste de Kruskal-Wallis (Qui-quadrado) igual a 11,571 com significncia
de 0,003. Assim, conclumos que h evidncia estatstica de aumento de peso devido ao
tipo de rao.




ESTATSTICA II

60
2010


ANEXOS



ESTATSTICA II

61
2010

ANEXO I
Tabela do Quiquadrado (x
2
):Valores crticos

gl
0,995 0,99 0,975 0,95 0,9 0,1 0,05 0,025 0,01 0,005
1 0,000 0,000 0,001 0,004 0,016 2,706 3,841 5,024 6,635 7,879
2 0,010 0,020 0,051 0,103 0,211 4,605 5,991 7,378 9,210 10,597
3 0,072 0,115 0,216 0,352 0,584 6,251 7,815 9,348 11,345 12,838
4 0,207 0,297 0,484 0,711 1,064 7,779 9,488 11,143 13,277 14,860
5 0,412 0,554 0,831 1,145 1,610 9,236 11,070 12,832 15,086 16,750
6 0,676 0,872 1,237 1,635 2,204 10,645 12,592 14,449 16,812 18,548
7 0,989 1,239 1,690 2,167 2,833 12,017 14,067 16,013 18,475 20,278
8 1,344 1,647 2,180 2,733 3,490 13,362 15,507 17,535 20,090 21,955
9 1,735 2,088 2,700 3,325 4,168 14,684 16,919 19,023 21,666 23,589
10 2,156 2,558 3,247 3,940 4,865 15,987 18,307 20,483 23,209 25,188
11 2,603 3,053 3,816 4,575 5,578 17,275 19,675 21,920 24,725 26,757
12 3,074 3,571 4,404 5,226 6,304 18,549 21,026 23,337 26,217 28,300
13 3,565 4,107 5,009 5,892 7,041 19,812 22,362 24,736 27,688 29,819
14 4,075 4,660 5,629 6,571 7,790 21,064 23,685 26,119 29,141 31,319
15 4,601 5,229 6,262 7,261 8,547 22,307 24,996 27,488 30,578 32,801
16 5,142 5,812 6,908 7,962 9,312 23,542 26,296 28,845 32,000 34,267
17 5,697 6,408 7,564 8,672 10,085 24,769 27,587 30,191 33,409 35,718
18 6,265 7,015 8,231 9,390 10,865 25,989 28,869 31,526 34,805 37,156
19 6,844 7,633 8,907 10,117 11,651 27,204 30,144 32,852 36,191 38,582
20 7,434 8,260 9,591 10,851 12,443 28,412 31,410 34,170 37,566 39,997
21 8,034 8,897 10,283 11,591 13,240 29,615 32,671 35,479 38,932 41,401
22 8,643 9,542 10,982 12,338 14,041 30,813 33,924 36,781 40,289 42,796
23 9,260 10,196 11,689 13,091 14,848 32,007 35,172 38,076 41,638 44,181
24 9,886 10,856 12,401 13,848 15,659 33,196 36,415 39,364 42,980 45,558
25 10,520 11,524 13,120 14,611 16,473 34,382 37,652 40,646 44,314 46,928
26 11,160 12,198 13,844 15,379 17,292 35,563 38,885 41,923 45,642 48,290
27 11,808 12,878 14,573 16,151 18,114 36,741 40,113 43,195 46,963 49,645
28 12,461 13,565 15,308 16,928 18,939 37,916 41,337 44,461 48,278 50,994
29 13,121 14,256 16,047 17,708 19,768 39,087 42,557 45,722 49,588 52,335
30 13,787 14,953 16,791 18,493 20,599 40,256 43,773 46,979 50,892 53,672
31 14,458 15,655 17,539 19,281 21,434 41,422 44,985 48,232 52,191 55,002
32 15,134 16,362 18,291 20,072 22,271 42,585 46,194 49,480 53,486 56,328
33 15,815 17,073 19,047 20,867 23,110 43,745 47,400 50,725 54,775 57,648
34 16,501 17,789 19,806 21,664 23,952 44,903 48,602 51,966 56,061 58,964
35 17,192 18,509 20,569 22,465 24,797 46,059 49,802 53,203 57,342 60,275
36 17,887 19,233 21,336 23,269 25,643 47,212 50,998 54,437 58,619 61,581
37 18,586 19,960 22,106 24,075 26,492 48,363 52,192 55,668 59,893 62,883
38 19,289 20,691 22,878 24,884 27,343 49,513 53,384 56,895 61,162 64,181
39 19,996 21,426 23,654 25,695 28,196 50,660 54,572 58,120 62,428 65,475
40 20,707 22,164 24,433 26,509 29,051 51,805 55,758 59,342 63,691 66,766


ESTATSTICA II

62
2010

ANEXO II
Tabela de U para 0,05
This table gives critical values of U. Decide on n
2
, the number of data belonging to the
majority group, and n
1
, the number of data belonging to the minority group. n
1
and n
2
may be
the same. Look up the corresponding critical value of U. E.g., for n
2
=6 and n
1
=3, the critical
value is 2. If the calculated value of U is equal to or less than this value, then the majority
group and the minority group are significantly different.
Thus in the example given above, the value of U=2 for n
2
=6 and n
1
=3, and the two groups are
significantly different from one another.

n
2

n
1
3 4 5 6 7 8
3 0 0 1 2 2 3
4 1 2 3 4 5
5 4 5 6 8
6 7 8 10
7 11 13
8 15
Note: The table gives critical values for rejecting, as having a probability of 0.05 or less, the
null hypotheses that the average values of the majority group and the minority group are the
same.

ESTATSTICA II

63
2010
Tabela Z

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,00000 0,00399 0,00798 0,01197 0,01595 0,01994 0,02392 0,02790 0,03188 0,03586
0,1 0,03983 0,04380 0,04776 0,05172 0,05567 0,05962 0,06356 0,06749 0,07142 0,07535
0,2 0,07926 0,08317 0,08706 0,09095 0,09483 0,09871 0,10257 0,10642 0,11026 0,11409
0,3 0,11791 0,12172 0,12552 0,12930 0,13307 0,13683 0,14058 0,14431 0,14803 0,15173
0,4 0,15542 0,15910 0,16276 0,16640 0,17003 0,17364 0,17724 0,18082 0,18439 0,18793
0,5 0,19146 0,19497 0,19847 0,20194 0,20540 0,20884 0,21226 0,21566 0,21904 0,22240
0,6 0,22575 0,22907 0,23237 0,23565 0,23891 0,24215 0,24537 0,24857 0,25175 0,25490
0,7 0,25804 0,26115 0,26424 0,26730 0,27035 0,27337 0,27637 0,27935 0,28230 0,28524
0,8 0,28814 0,29103 0,29389 0,29673 0,29955 0,30234 0,30511 0,30785 0,31057 0,31327
0,9 0,31594 0,31859 0,32121 0,32381 0,32639 0,32894 0,33147 0,33398 0,33646 0,33891
1,0 0,34134 0,34375 0,34614 0,34849 0,35083 0,35314 0,35543 0,35769 0,35993 0,36214
1,1 0,36433 0,36650 0,36864 0,37076 0,37286 0,37493 0,37698 0,37900 0,38100 0,38298
1,2 0,38493 0,38686 0,38877 0,39065 0,39251 0,39435 0,39617 0,39796 0,39973 0,40147
1,3 0,40320 0,40490 0,40658 0,40824 0,40988 0,41149 0,41308 0,41466 0,41621 0,41774
1,4 0,41924 0,42073 0,42220 0,42364 0,42507 0,42647 0,42785 0,42922 0,43056 0,43189
1,5 0,43319 0,43448 0,43574 0,43699 0,43822 0,43943 0,44062 0,44179 0,44295 0,44408
1,6 0,44520 0,44630 0,44738 0,44845 0,44950 0,45053 0,45154 0,45254 0,45352 0,45449
1,7 0,45543 0,45637 0,45728 0,45818 0,45907 0,45994 0,46080 0,46164 0,46246 0,46327
1,8 0,46407 0,46485 0,46562 0,46638 0,46712 0,46784 0,46856 0,46926 0,46995 0,47062
1,9 0,47128 0,47193 0,47257 0,47320 0,47381 0,47441 0,47500 0,47558 0,47615 0,47670
2,0 0,47725 0,47778 0,47831 0,47882 0,47932 0,47982 0,48030 0,48077 0,48124 0,48169
2,1 0,48214 0,48257 0,48300 0,48341 0,48382 0,48422 0,48461 0,48500 0,48537 0,48574
2,2 0,48610 0,48645 0,48679 0,48713 0,48745 0,48778 0,48809 0,48840 0,48870 0,48899
2,3 0,48928 0,48956 0,48983 0,49010 0,49036 0,49061 0,49086 0,49111 0,49134 0,49158
2,4 0,49180 0,49202 0,49224 0,49245 0,49266 0,49286 0,49305 0,49324 0,49343 0,49361
2,5 0,49379 0,49396 0,49413 0,49430 0,49446 0,49461 0,49477 0,49492 0,49506 0,49520
2,6 0,49534 0,49547 0,49560 0,49573 0,49585 0,49598 0,49609 0,49621 0,49632 0,49643
2,7 0,49653 0,49664 0,49674 0,49683 0,49693 0,49702 0,49711 0,49720 0,49728 0,49736
2,8 0,49744 0,49752 0,49760 0,49767 0,49774 0,49781 0,49788 0,49795 0,49801 0,49807
2,9 0,49813 0,49819 0,49825 0,49831 0,49836 0,49841 0,49846 0,49851 0,49856 0,49861
3,0 0,49865 0,49869 0,49874 0,49878 0,49882 0,49886 0,49889 0,49893 0,49896 0,49900
3,1 0,49903 0,49906 0,49910 0,49913 0,49916 0,49918 0,49921 0,49924 0,49926 0,49929
3,2 0,49931 0,49934 0,49936 0,49938 0,49940 0,49942 0,49944 0,49946 0,49948 0,49950
3,3 0,49952 0,49953 0,49955 0,49957 0,49958 0,49960 0,49961 0,49962 0,49964 0,49965
3,4 0,49966 0,49968 0,49969 0,49970 0,49971 0,49972 0,49973 0,49974 0,49975 0,49976
3,5 0,49977 0,49978 0,49978 0,49979 0,49980 0,49981 0,49981 0,49982 0,49983 0,49983
3,6 0,49984 0,49985 0,49985 0,49986 0,49986 0,49987 0,49987 0,49988 0,49988 0,49989
3,7 0,49989 0,49990 0,49990 0,49990 0,49991 0,49991 0,49992 0,49992 0,49992 0,49992
3,8 0,49993 0,49993 0,49993 0,49994 0,49994 0,49994 0,49994 0,49995 0,49995 0,49995
3,9 >0,49995 etc ...
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09


Tabela da Distribuio Normal Padro
ESTATSTICA II

64
2010
P(Z<z)
z 0,0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767
2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990
3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993
3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995
3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997
3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998
3,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998
3,6 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,7 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,8 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
P(Z<z)

ESTATSTICA II

65
2010

z 0,0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641
-0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247
-0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859
-0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483
-0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121
-0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776
-0,6 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451
-0,7 0,2420 0,2389 0,2358 0,2327 0,2296 0,2266 0,2236 0,2206 0,2177 0,2148
-0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867
-0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611
-1,0 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379
-1,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170
-1,2 0,1151 0,1131 0,1112 0,1093 0,1075 0,1056 0,1038 0,1020 0,1003 0,0985
-1,3 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823
-1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0721 0,0708 0,0694 0,0681
-1,5 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559
-1,6 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455
-1,7 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367
-1,8 0,0359 0,0351 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294
-1,9 0,0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0239 0,0233
-2,0 0,0228 0,0222 0,0217 0,0212 0,0207 0,0202 0,0197 0,0192 0,0188 0,0183
-2,1 0,0179 0,0174 0,0170 0,0166 0,0162 0,0158 0,0154 0,0150 0,0146 0,0143
-2,2 0,0139 0,0136 0,0132 0,0129 0,0125 0,0122 0,0119 0,0116 0,0113 0,0110
-2,3 0,0107 0,0104 0,0102 0,0099 0,0096 0,0094 0,0091 0,0089 0,0087 0,0084
-2,4 0,0082 0,0080 0,0078 0,0075 0,0073 0,0071 0,0069 0,0068 0,0066 0,0064
-2,5 0,0062 0,0060 0,0059 0,0057 0,0055 0,0054 0,0052 0,0051 0,0049 0,0048
-2,6 0,0047 0,0045 0,0044 0,0043 0,0041 0,0040 0,0039 0,0038 0,0037 0,0036
-2,7 0,0035 0,0034 0,0033 0,0032 0,0031 0,0030 0,0029 0,0028 0,0027 0,0026
-2,8 0,0026 0,0025 0,0024 0,0023 0,0023 0,0022 0,0021 0,0021 0,0020 0,0019
-2,9 0,0019 0,0018 0,0018 0,0017 0,0016 0,0016 0,0015 0,0015 0,0014 0,0014
-3,0 0,0013 0,0013 0,0013 0,0012 0,0012 0,0011 0,0011 0,0011 0,0010 0,0010
-3,1 0,0010 0,0009 0,0009 0,0009 0,0008 0,0008 0,0008 0,0008 0,0007 0,0007
-3,2 0,0007 0,0007 0,0006 0,0006 0,0006 0,0006 0,0006 0,0005 0,0005 0,0005
-3,3 0,0005 0,0005 0,0005 0,0004 0,0004 0,0004 0,0004 0,0004 0,0004 0,0003
-3,4 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0002
-3,5 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002
-3,6 0,0002 0,0002 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
-3,7 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
-3,8 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
-3,9 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000




ESTATSTICA II

66
2010

ANEXO III
Tabela de Wilcoxon Valores crticos:
TABLE: WILCOXON SIGNED RANK TEST (CI % = 95%)
Critical values:
Wilcoxon Signed-Ranks Test Critical values
Number (n) 2 sided 1 sided
6 0 2
7 2 3
8 3 5
9 5 8
10 8 10
11 10 13
12 13 17
13 17 21
14 21 25
15 25 30
16 29 35
17 34 41
18 40 47
19 46 53
20 52 60
21 58 67
22 65 75
23 73 83
24 81 91
25 89 100
Critical values: Wilcoxon Signed-Ranks test p=0.05 (CI% = 95%). Significant, if the calculated values
presented in this table [the sum of the positive ranks or the negative ranks] is too small.



ESTATSTICA II

67
2010

ANEXO IV
Tabela H
Null Hypothesis versus Alternative Hypothesis
H
o
: Populations are identical vs. H
a
: At least one pair of populations is different
(Right-Tailed)
Procedure
Step 1 Rank all the data from smallest to largest (imagine they all are in one sample). Tied
scores are assigned the rank equal to the mean of the rank positions that they normally
occupy.
Step 2 Calculate the rank sums of each sample
Step 3 Calculate H

Step 4: If the sample sizes are 5 or more then H is a _
2
distribution with degrees of freedom
(k 1).
For a chi-squared distribution, the following table is needed:
Chi-Squared Table
Step 5 Compare H (found in step 3) with the number found in step 4


ESTATSTICA II

68
2010

ANEXO V
Tabelas A a D (Tabelas de Friedman)
Testa a hiptese de que vrios grupos relacionados tm, todos, a mesma distribuio uma
alternativa par a anlise de varincia com duas classificaes.
Aplicar este teste se possuir poucos dados amostrais e/ou as pressuposies, exigidas pela
anlise de varincia, estiverem seriamente comprometidas.
Exigncia: as observaes precisam ser medidas pelo menos em escala ordinal.



Valores Crticos para a anlise de varincia por nmero de ordem de Friedman*

k N o s 0.10 o s 0.05 os 0.01
3 3 6.00 6.00
4 6.00 6.50 8.00
5 5.20 6.40 8.40
6 5.33 7.00 9.00
7 5.43 7.14 8.86
8 5.25 6.25 9.00
9 5.56 6.22 8.67
10 5.00 6.20 9.60
11 4.91 6.54 8.91
12 5.17 6.17 8.67
13 4.77 6.00 9.39

4.61 5.99 9.21
4 2 6.00 6.00
3 6.60 7.40 8.60
4 6.30 4.80 9.60
5 6.36 7.80 9.96
6 6.40 7.60 10.00
7 6.26 7.80 10.37
8 6.30 7.50 10.35

6.25 7.82 11.34
5 3 7.47 8.53 10.13
4 7.60 8.80 11.00
5 7.68 8.96 11.52

7.78 9.49 13.28
* Adaptado de Siegel, S. e Castellan Jr., N. J. Nonparametric statistics for the Behavioral
Sciences, McGraw-Hill, 1988

) 1 ( 3
) 1 (
12
1
2
+
(

+
=

=
k N R
k Nk
F
k
j
j r
ESTATSTICA II

69
2010
RHO DE SPEARMAN


There are several kinds of correlation coefficient. The Spearman rank correlation
coefficient demonstrated here, can safely be used with any kind of data that can be arranged
in a sequence (i.e. can be ranked).
The first three columns contain 'raw' data. In the example, column 1 is species names, the
second column is the abundance of each species in sample 1, and column three is the
abundance of species in sample 2. The test can, however, be used for any sets of paired values
that can be ranked. So column two could be 'phi'-50, and column three could be macrobenthic
biomass.
In column 4, put the ranks of the abundances in column 2. In column 5 put the ranks of the
abundances in column 3. Notice in column 5, the two ranks of 6=, which are given a score of
6.5. Because there are two rows ranked 6=, there is no rank 7. Column 6 is the difference
between the ranks, and column 7 is the difference squared.
- SAMPLE 1 SAMPLE 2 SAMPLE 1 SAMPLE 2 - -
species abundance abundance rank rank rank difference rank difference squared
A 5 3 4 5 -1 1
B 22 4 3 4 -1 1
C 3 1 6 6= (6.5) -0.5 0.25
D 1 0 8 8 0 0
E 567 24 1 2 -1 1
F 4 7 5 3 2 4
G 102 25 2 1 1 1
H 2 1 7 6=(6.5) -0.5 0.25
The formula for calculating the value of the Spearman coefficient is:

ou


SRDS is the 'sum of rank differences squared, 8.5 in the example;
N is the number of rows of data, 8 in the present case, so (N x (N
2
-1) = 8 x 63 = 504;
So, the example value of the rank correlation coefficient is +0.899
ESTATSTICA II

70
2010
Note the positive sign, implying a positive correlation - the coefficient may have any value
between -1.0 and +1.0.
To decide if the coefficient's value is significant (i.e. if the correlation is meaningful), look up
the critical value in the following table:
N critical value
5 0.9
6 0.829
7 0.714
8 0.643
9 0.6
10 0.564
12 0.506
16 0.425
20 0.377
Then compare the absolute value of the coefficient with the critical value. If the calculated
value exceeds the critical value, then the correlation coefficient is significant. (To get the
'absolute' value of a negative value, replace the negative sign by a positive sign.)
The critical value is 0.643 for N=8, so the example value of 0.899 is significant. There is a
real correlation between the ranks of the species abundances in sample1 and sample 2. (If the
calculated coefficient were -0.899, it would also be significant, but now would imply an
inverse correlation. If the calculated coefficient were between -0.642 and +0.642, it would not
be significant - i.e. no correlation would be apparent.)
To be more precise, the hypothesis that the apparent relationship between sample 1 and
sample 2 is only a result of chance, can be rejected in the exemplified case where the
calculated coefficient is 0.899 for N=8, since the observed relationship would have occurred
solely by chance less than 1 time in 20 (i.e. with a probability of less than 0.05).

Você também pode gostar