Você está na página 1de 31

Testes não-paramétricos

04 e 05 janeiro 2022
David Wilson Russo Ramilo
p6199@ulusofona.pt
Testes não-paramétricos

Testes Não-Paramétricos – Introdução


➢ Em muitas situações, os pressupostos dos testes paramétricos não são cumpridos:

✓ Amostras cujo n < 30


✓ Amostras sem distribuição normal ou aproximadamente normal
✓ Variância não é homogénea entre grupos (heterocedasticidade)

➢ Neste caso, podemos recorrer a testes não-paramétricos → Não dependem do conhecimento da distribuição da
variável na população

➢ Também chamados de testes de distribuição livre, pois não fazem quaisquer pressupostos relativamente à
distribuição dos dados
Testes não-paramétricos

Testes Não-Paramétricos – Vantagens


➢ Podem ser usados quando:

✓ Se desconhece a distribuição dos dados na população


✓ A distribuição é assimétrica (e não se deseja realizar uma transformação de dados)
✓ Existe heterogeneidade nas variâncias (heterocedasticidade)
✓ Na comparação entre tratamentos, a distribuição é normal em alguns grupos e assimétrica noutros

➢ São indicados quando a variável é medida numa escala ordinal ou nominal

➢ Quando os pressupostos dos testes paramétricos não são satisfeitos, os métodos não-paramétricos são mais
eficientes
Testes não-paramétricos

Testes Não-Paramétricos – Desvantagens


➢ Nas situações em que os pressupostos dos testes paramétricos são satisfeitos, estes últimos são mais eficientes
que os testes não-paramétricos → Para se detetar uma diferença real entre duas populações, o tamanho
amostral deve ser um pouco maior num teste não-paramétrico do que num teste paramétrico correspondente

➢ Estes testes extraem menos informação da experiência porque usam escalas não quantitativas (nominal ou
ordinal) → Perda de informação relativamente à variabilidade da característica

➢ As técnicas operatórias destes testes são, embora simples, morosas se a quantidade de dados for grande →
Problema resolvido se existir um programa de computador que efetue os cálculos
Testes não-paramétricos

Testes Paramétricos vs. Testes Não-Paramétricos


Testes Paramétricos Testes Não-Paramétricos
Teste t para uma amostra Teste dos sinais
Teste t para duas amostras independentes Teste U de Wilcoxon-Mann-Whitney (WMW)
Teste t para duas amostras emparelhadas Teste T de Wilcoxon
One-way ANOVA (> 2 amostras) Teste de Kruskal-Wallis
Testes não-paramétricos

Teste dos sinais – 1 amostra (I)


➢ Teste substituto do teste t para uma amostra → Pressuposto da Normalidade violado

➢ O teste dos sinais investiga se uma amostra de valores provém de uma população com uma mediana específica

➢ Este teste determina se a maioria dos valores é superior (ou inferior) a esta mediana

➢ Se a mediana das observações na amostra é aproximadamente igual ao valor da mediana da população


(especificada na H0) → É expectável que exista um igual número de observações acima e abaixo desse valor

➢ H0: “Metade das observações da amostra são superiores a uma mediana específica”
Testes não-paramétricos

Teste dos sinais – 1 amostra (II)


➢ Pressupostos:

✓ A variável sob investigação está medida numa escala ordinal ou quantitativa


✓ Os dados constituem uma amostra aleatória da população em estudo

➢ Especificar a H0: “A verdadeira proporção de diferenças positivas é 0,5”

➢ Recolher os dados e contar o número de observações acima ou abaixo duma mediana específica e anotar a
diferença mais pequena (k)

➢ Se 𝑛 ≤ 20, usar a tabela ao lado:

✓ 𝑘 = 𝑛. º 𝑑𝑒 𝑑𝑖𝑓𝑒𝑟𝑒𝑛ç𝑎𝑠 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑎𝑠 𝑜𝑢 𝑛𝑒𝑔𝑎𝑡𝑖𝑣𝑎𝑠


✓ 𝑛 = 𝑛. º 𝑑𝑒 𝑑𝑖𝑓𝑒𝑟𝑒𝑛ç𝑎𝑠 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒𝑠 𝑑𝑒 𝑧𝑒𝑟𝑜
✓ As probabilidades inferiores a 0,001 não aparecem
Testes não-paramétricos

Teste dos sinais – 1 amostra (III)


➢ Se 𝑛 > 20, usar o seguinte teste estatístico (z):

𝑇𝑒𝑠𝑡𝑒 𝑍 = 2 × 𝑝 − 0,5 × 𝑛

✓ 𝑛 = 𝑛. º 𝑑𝑒 𝑑𝑖𝑓𝑒𝑟𝑒𝑛ç𝑎𝑠 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒𝑠 𝑑𝑒 𝑧𝑒𝑟𝑜


✓ 𝑝 = 𝑘Τ𝑛 → Proporção observada de pares positivos (ou negativos) dentro dos pares diferentes de zero

➢ Usar o valor de Z para decidir relativamente à aceitação ou rejeição da H0 (geralmente, rejeita-se a H0 se 𝑍 >
±1,96 )
Testes não-paramétricos

Exemplo 1
➢ Diz-se que numa determinada clínica veterinária, a duração de cada consulta tem uma mediana de 12 minutos. Para confirmar esta
hipótese, um aluno estagiário nessa clínica observou a duração de 43 consultas. Os resultados encontram-se na tabela em baixo.

Duração da consulta Número de casos


Menos de 12 minutos 22
12 minutos 6
Mais de 12 minutos 15
Total 43

➢ H0: “A verdadeira mediana da duração da consulta são 12 minutos” ou “A verdadeira proporção de consultas acima de 12 minutos é
0,5”; H1: “A proporção de consultas acima de 12 minutos não é 0,5”

➢ Aplicação do teste:
15
𝑇𝑒𝑠𝑡𝑒 𝑍 = 2 × − 0,5 × 37 = 2 × −0,0946 × 37 = 1,15 1,15 < 1,96 → logo, aceita-se a H0
37

➢ Os dados são consistentes com a hipótese nula que a duração da mediana de cada consulta são 12 minutos e não existe evidência
para a rejeitar.
Testes não-paramétricos

Exercício 1
➢ Um professor de estatística afirma que a mediana da nota do último teste dos seus estudantes é 58 (em 100). A
pontuação de 18 testes escolhidos ao acaso estão na lista abaixo. Pode-se rejeitar a afirmação do professor com
um 𝛼 = 0,05?

58 62 55 53 52 52
59 55 55 60 56 57
61 58 63 63 55 55

𝑇𝑒𝑠𝑡𝑒 𝑍 = 2 × 𝑝 − 0,5 × 𝑛
Testes não-paramétricos

Exercício 1 - Resolução
➢ H0: “A mediana dos testes é 58”; H1: “A mediana dos testes é diferente de 58”

Notas Número de casos


Menos de 58 valores 10
58 valores 2
Mais de 58 valores 6
Total 18

➢ Como 𝑛 = 18, usamos a tabela ao invés da fórmula

➢ Escolher a diferença de valores mais pequena (𝑘 = 6)

➢ Pela tabela, 𝑝 = 0,554 → Logo, aceita-se a H0

➢ Conclusão: A mediana dos testes é 58


Testes não-paramétricos

Teste U de Wilcoxon-Mann-Whitney – Duas amostras independentes


➢ Teste desenvolvido por F. Wilcoxon (1945) para comparar tendências centrais de 2 amostras independentes de
tamanhos iguais

➢ Em 1947, H. B. Mann e D. R. Whitney generalizaram para amostras de tamanhos diferentes

➢ O teste U é um substituto do teste t para amostras independentes:

✓ As duas amostras são aleatórias e as observações são independentes (dentro e entre amostras)
✓ A variável de interesse tem uma distribuição subjacente contínua (incluíndo variáveis ordinais)

Frank Wilcoxon Henry Mann Donald Whitney


(1892-1965) (1905-2000) (1915-2007)
Testes não-paramétricos

Teste U de Wilcoxon-Mann-Whitney – Duas amostras independentes


➢ Raciocínio do teste U:

✓ Duas amostras: A e B
✓ Se na amostra A os valores são, no geral, menores que na amostra B → Quando se ordenam os valores do
menor para o maior juntando as duas amostras → Postos ocupados pelos indivíduos da amostra A são, em
geral, menores do que os postos ocupados pelos indivíduos da amostra B
✓ O posto médio da amostra A é menor que o posto médio da amostra B
✓ Uma diferença estatisticamente significativa entre os 2 postos médios → A população A tem um valor de
tendência central menor do que a população B

➢ H0: “As duas amostras provêm de populações que têm uma distribuição similar, com a mesma mediana ou da
mesma população”; H1: “As duas amostras não provêm da mesma população”
Testes não-paramétricos

Teste U de Wilcoxon-Mann-Whitney – Duas amostras independentes


➢ Passos para a realização do teste U (I):

✓ Identificar a amostra menor como 1 e a maior como 2

✓ Determinar o tamanho das amostras: 𝑛1 e 𝑛2

✓ Considerando o total dos valores das amostras, colocar os postos ou ranks → Quando há empate entre
postos, calcula-se a média dos postos, atribuindo o mesmo valor aos empates:
Testes não-paramétricos

Teste U de Wilcoxon-Mann-Whitney – Duas amostras independentes


➢ Passos para a realização do teste U (II):

✓ Obter 𝑅1 e 𝑅2 , que são a soma dos postos nas amostras 1 e 2, respetivamente

✓ Calcula-se o valor de 𝑈1 e 𝑈2 , usando as seguintes expressões:

𝑛1 + 1 𝑛2 + 1
𝑈1 = 𝑅1 − 𝑛1 𝑈2 = 𝑅2 − 𝑛2
2 2

✓ No caso do exemplo: 𝑈1 = 9,5 𝑒 𝑈2 = 62,5

✓ Considerar o menor dos 2 valores calculados

✓ Formular as hipóteses nula e alternativa

✓ Comparar o valor U obtido com o valor U crítico tabelado (U*)

✓ 𝑈𝛼;𝑛1 ;𝑛2 → onde α = 0,05; 𝑛1 = 8 e 𝑛2 = 9


Testes não-paramétricos

Teste U de Wilcoxon-Mann-Whitney – Duas amostras independentes


➢ 𝑈𝛼;𝑛1 ;𝑛2 → onde α = 0,05; 𝑛1 = 8 e 𝑛2 = 9
Testes não-paramétricos

Teste U de Wilcoxon-Mann-Whitney – Duas amostras independentes


➢ Passos para a realização do teste U (III): ➢ Quando a amostra 1 é inferior a 10 unidades e a
amostra 2 é inferior a 15 unidades, usar a tabela U de
✓ 𝑈0,05;8;9 = 15 Mann-Whitney

✓ 𝑈𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 9,5 ➢ Caso contrário, usar a tabela Z

✓ No exemplo dado, 𝑈𝑐𝑎𝑙𝑐 < 𝑈0,05;8;9

✓ Como o valor calculado é menor que o valor


crítico, rejeita-se a H0

✓ População de pacientes com carcinoma invasivo


difere da população controlo quanto ao score 1A

✓ Mediana→ É menor em mulheres com carcinoma


→ As células do tipo 1A são mais raras em
mulheres com esse tipo de carcinoma
Testes não-paramétricos

Exemplo 2
➢ Realizaram-se 2 testes de Biomatemática a duas turmas diferentes e os resultados obtidos estão na tabela abaixo:

Turma A Posto Turma B Posto


Turma A Turma B
4 1,5 10 5,5
6 18
4 1,5 12 7,5
8 16
6 3 14 9
4 10
8 4 16 10
12 20
10 5,5 18 11
4 14
12 7,5 20 12
10 12
𝑺𝒐𝒎𝒂 𝑹𝑨 23 𝑺𝒐𝒎𝒂 𝑹𝑩 55

➢ H0: “As duas turmas têm notas medianas iguais”; H1: “As duas turmas têm notas medianas diferentes”; α = 0,05

➢ Atribuíram-se os respetivos postos/ranks às notas das duas turmas. Aos empates foram atribuídos os valores médios.

➢ Calculou-se o somatório dos postos para cada turma (𝑅𝐴 e 𝑅𝐵 )


Testes não-paramétricos

Exemplo 2
➢ Calculou-se os valores de U para cada turma:

6+1 6+1
𝑈𝐴 = 23 − 6 =2 𝑈𝐵 = 55 − 6 = 34
2 2

➢ Selecionou-se o valor de U mais pequeno (𝑈𝐴 = 2) e


comparou-se com o valor tabelado:

➢ Como 𝑈𝑐𝑎𝑙𝑐 < 𝑈* (2 < 5), rejeita-se a H0

➢ Conclusão: A turma A apresentou um pior desempenho


no teste de Biomatemática que a turma B
Testes não-paramétricos

Exercício 2
➢ A tabela abaixo mostra o número de dias que cães e gatos levam a ser adotados de um determinado abrigo
depois de serem recolhidos. Estas duas espécies animais demoram o mesmo número de dias a serem adotados
depois da sua recolha? Utilize o teste não-paramétrico U de Mann-Whitney para responder à questão colocada,
usando um α = 0,05.

Cães Gatos
6 9
7 28
19 28
14 22
11 18
12 30
20 16
16 -

1. Qual a hipótese nula e a hipótese alternativa?


Testes não-paramétricos

Exercício 2 - Resolução
➢ H0: “Os cães e os gatos demoram o mesmo número de dias a serem adotados”; H1: “Os cães e os gatos não
demoram o mesmo número de dias a serem adotados”
Cães Posto Gatos Posto
2. Determine os postos dos dias
6 1 9 3
3. Determine a soma dos postos por espécie animal 7 2 16 7,5
𝑼𝟏 𝑼𝟐 11 4 18 9
4. Calcule o valor de U para ambas as espécies animais:
10,5 45,5 12 5 22 12
14 6 28 13,5
5. Determine o valor de U crítico (U*):
16 7,5 28 13,5
19 10 30 15
20 11 - -
𝑼* Soma 46,5 Soma 73,5
10
𝑛1 + 1
𝑈1 = 𝑅1 − 𝑛1
2
Testes não-paramétricos Cães Gatos
6 9
Exercício 2 - Resolução 7 16
6. Compare o valor de U* com o valor de U calculado e decida sobre a hipótese nula 11 18
12 22
10,5 > 10 , logo não se rejeita a H0 14 28
16 28
7. Conclua sobre a pergunta colocada 19 30
20 -
O número de dias desde a entrada no abrigo até à adoção do animal é igual para cães e gatos

8. Calcule a mediana de dias desde a recolha até à adoção para os cães e os gatos daquele abrigo

Cães = 13 dias
Gatos = 22 dias
Testes não-paramétricos

Teste T de Wilcoxon – Duas amostras emparelhadas


➢ Teste desenvolvido também por F. Wilcoxon em 1945 → Teste substituto do teste t para duas amostras emparelhadas

➢ Baseia-se nos postos das diferenças intrapares, dando maior importância às diferenças maiores

➢ Princípio do teste:

✓ Se o tratamento A produz valores maiores do que o tratamento B, as diferenças (A – B) de sinal positivo serão maiores
em número e grau do que as diferenças de sinal negativo.
✓ Se ambos os tratamentos têm o mesmo efeito, as diferenças positivas e negativas devem-se anular.

➢ Pressupostos do teste:

✓ Os dados são pareados entre si, mas são independentes entre os pares
✓ A variável tem de ser medida, no mínimo, numa escala ordinal
✓ As diferenças intrapares são uma variável contínua, com distribuição simétrica ao redor da mediana
Testes não-paramétricos

Teste T de Wilcoxon – Duas amostras emparelhadas


➢ Passos do teste T (I):

✓ Especificar as hipóteses nula e alternativa → H0: “As amostras vêm de populações com distribuições
idênticas e com a mesma mediana ou da mesma população”; H1: “As amostras provêm de populações
diferentes”

✓ Recolher os dados e dispô-los como se faz para o teste t para duas amostras emparelhadas

✓ Descobrir a diferença entre cada par de observações, indicando se a diferença é positiva ou negativa

✓ Ordenar as diferenças obtidas ignorando os sinais das diferenças, por ordem crescente de magnitude (tal
como se faz para o teste U de Mann-Whitney)

✓ Começar a ordenação com o número 1, fazendo a média para as diferenças iguais e ignorando aquelas cujo
resultado é zero → Excluir os elementos da amostra cujo resultado é zero
Testes não-paramétricos

Teste T de Wilcoxon – Duas amostras emparelhadas


➢ Passos do teste T (II):

✓ Começar a ordenação com o número 1, fazendo a média para as diferenças iguais e ignorando aquelas cujo
resultado é zero → Excluir os elementos da amostra cujo resultado é zero

✓ Para cada posto atribuído, dar um sinal positivo (+) ou negativo (-) ao resultado da diferença

✓ Somar o número de postos com uma diferença positiva e uma diferença negativa → Selecionar a soma
mais pequena

✓ Quando 𝑛 < 30 utilizar a tabela T de Wilcoxon; Quando 𝑛 ≥ 30 utilizar a tabela Z (para obtenção do valor
crítico)

✓ Perante o resultado obtido, decidir acerca da H0 e concluir sobre a questão colocada


Testes não-paramétricos

Exemplo 3
➢ Uma nova dieta para ratos de laboratório foi testada para verificar se esta possuía um potencial para promover
um rápido crescimento. Foram usados 18 pares de ratos; cada elemento de um par foi colocado no grupo
controlo e o outro na dieta a testar. Aos 60 dias de idade, os ratos foram pesados, tal como está descrito na
tabela abaixo.

➢ H0: “O peso dos ratos é o mesmo no controlo e no grupo da


dieta nova”; H1: “O peso dos ratos é diferente no controlo e
no grupo da dieta nova”

➢ Realizar a diferença entre pares, indicando o sinal da


diferença

➢ Ordenar as diferenças por posto, ignorando o seu sinal e as


diferenças cujo resultado é zero (n = 18 → n = 16)

➢ Registar o número de diferenças por sinal e escolher a mais


pequena (4 diferenças negativas vs. 12 diferenças positivas)

➢ Fazer o somatório dos postos as diferenças negativas


Testes não-paramétricos

Exemplo 3
➢ 11 + 13 + 3,5 + 3,5 = 31

➢ Comparar o valor obtido com o valor crítico da tabela T de


Wilcoxon. Como 31 > 29, não se rejeita a hipótese nula.

➢ A nova dieta não promove um crescimento mais rápido dos


ratos que a consomem
Testes não-paramétricos

Exercício 3
➢ A obesidade é um problema dos cães tidos como pets no mundo Ocidental. Uma nova deita foi desenvolvida
para combater este problema. Para testar a nova dieta, um médico veterinário investigou 18 cães que se
apresentaram para a consulta. O médico veterinário pesou os animais à data da consulta e 8 semanas após a
administração dessa nova dieta (ver tabela). Usando o teste T de Wilcoxon, verifique se a dieta foi eficaz na
redução do peso dos animais.
Testes não-paramétricos Peso Peso
Animal Antes Depois Diferença Postos
(kg) (kg)
Exercício 3 - Resolução
1 26,5 24,3 +2,2 16
➢ H0: “Os animais apresentam o mesmo peso antes e após o consumo da 2 16,5 16,1 +0,4 5,5
nova dieta”; H1: “Os animais apresentam uma diferença de peso antes e
3 36,1 31,8 +4,3 17
após o consumo da nova dieta”
4 28,0 27,0 +1,0 11
➢ Fazer a diferença dos pesos e atribuir os postos por ordem crescente 5 23,5 21,4 +2,1 15
começando no número 1
6 8,3 9,7 -1,4 13
➢ Às diferenças iguais são atribuídos postos médios e as diferenças iguais a 7 17,7 18,9 -1,2 12
zero são descartadas 8 15,8 15,1 +0,7 9,5
9 14,3 14,3 0 -
➢ No exemplo, a amostra inicial de 18 elementos passa a ter apenas 17
10 12,1 11,7 +0,4 5,5
➢ Temos menos diferenças negativas (4) que positivas (13) 11 17,4 17,7 -0,3 3,5
12 21,1 20,4 +0,7 9,5
➢ Somar os postos das diferenças negativas: 3,5 + 3,5 + 12 + 13 = 32
13 19,2 19,0 +0,2 1,5
➢ Consultar a tabela para definir o valor crítico: 34 (𝑛 = 17; 𝛼 = 0,05) 14 13,1 13,4 -0,3 3,5
15 16,0 15,4 +0,6 8
➢ Como 32 < 34, rejeitamos a H0
16 29,1 27,3 +1,8 14
➢ Conclusão: Os animais apresentam um peso inferior após o consumo da 17 13,1 12,6 +0,5 7
nova dieta 18 19,0 18,8 +0,2 1,5
Testes não-paramétricos

Referências
➢ Callegari-Jacques SM. (2003). Bioestatística – Princípios e Aplicações. Artmed Editora.

➢ Petrie A, Watson P. (1999). Statistics for Veterinary and Animal Science. Blackwell Publishing.
Testes não-paramétricos

Obrigado pela vossa atenção!

Você também pode gostar