Você está na página 1de 18

Testes de hipóteses não

paramétricos
PESQUISA TECNOLÓGICA QUALITATIVA E QUANTITATIVA
Recordando...
Vimos na aula passada que os testes de hipóteses podem ser classificados em três grupos:
paramétricos, não paramétricos e de proporção.
Testes de hipóteses paramétricos devem ser utilizados para analisar associação de variáveis
métricas que apresentam distribuição normal.
◦ Teste t de diferença de médias (uma amostra, duas amostras independentes e duas amostras
emparelhadas);
◦ Análise da variância (duas ou mais amostras independentes);
◦ Correlação de Pearson (duas variáveis).
Testes não paramétricos
Quando as variáveis não apresentam distribuição normal, devemos utilizar testes de hipóteses
não paramétricos:
◦ Testes de média para variáveis métricas ou ordinais;
◦ Testes de proporção para variáveis nominais.

Dos diversos testes não paramétricos existentes, vamos destacar os mais utilizados para
substituir os testes paramétricos estudados na aula passada, além dos testes utilizados para
analisar variáveis nominais (testes de proporção).
Testes de média não paramétricos
Os testes de média não paramétricos são recomendados para analisar variáveis métricas (de
razão ou intervalar) que não se adéquam aos pressupostos dos testes paramétricos (distribuição
e/ou homogeneidade das variâncias) e até para variáveis ordinais.
Os principais testes de média não paramétricos utilizam postos (e sinais):
◦ As observações são organizadas de acordo com o valor original da variável;
◦ É atribuído um valor numérico para cada observação, de acordo com sua posição no ranking;
◦ São calculadas estatísticas de testes considerando o posto da observação, e não seu valor original;
◦ Os testes de hipóteses são realizados a partir das estatísticas de testes de postos (e sinais).

Veremos quatro testes não paramétricos que utilizam esta mesma sistemática:
◦ Teste de sinais de Wilcoxon;
◦ Teste de Mann-Whitney;
◦ Teste de Kruskal-Walls;
◦ Coeficiente de correlação de Spearman.
Teste de sinais de Wilcoxon
O teste de sinais de Wilcoxon reporta a estatística T, que representa os postos obtidos das
diferenças positivas e negativas de uma variável métrica entre dois grupos.
◦ A partir da média e do desvio padrão de T é calculado o escore Z (distribuição normal padronizada)
◦ Por se tratar de um teste de distribuição Z, os testes e hipóteses podem ser unicaudais e bicaudais.

Quando queremos fazer comparações entre uma média amostral com um valor hipotetizado
(uma amostra), ou comparar duas médias de uma mesma amostra (amostras emparelhadas), o
teste não paramétrico de sinais de Wilcoxon é o mais utilizado:
◦ Teste de sinais de Wilcoxon para uma amostra;
◦ Teste de sinais de Wilcoxon para duas amostras emparelhadas.
Teste de sinais de Wilcoxon
TESTE DE WILCOXON DE UMA AMOSTRA
Verifica se a média dos dados é estatisticamente diferente de um valor alegado (constante):
◦ Hipótese nula: Média da amostra = constante
◦ Hipótese alternativa: Média da amostra ≠ constante

Exemplo: Verificar se o tempo médio de conclusão de um processo de depósito de patente no


Brasil é igual a 3.000 dias
◦ Hipótese estatística: O tempo médio de conclusão de um processo de depósito de patente no Brasil é
de 3.000 dias
◦ Hipótese nula: Média = 3.000
◦ Hipótese alternativa: Média ≠ 3.000
Teste de sinais de Wilcoxon
TESTE DE WILCOXON PARA DUAS AMOSTRAS EMPARELHADAS
Verifica se há diferença nos valores de duas variáveis extraídas da mesma amostra
(emparelhada):
◦ Hipótese nula: Diferença entre as médias = 0
◦ Hipótese alternativa: Diferença entre as médias ≠ 0

Exemplo: verificar se o tempo médio de conclusão de um processo de depósito de patente no


Brasil durante a pandemia foi diferente de antes da pandemia
◦ Hipótese estatística: O tempo médio de conclusão de um processo de depósito de patente no Brasil
durante a pandemia foi diferente de antes da pandemia
◦ Hipótese nula: Média antes da pandemia = Média durante a pandemia
◦ Hipótese alternativa: Média antes da pandemia ≠ Média durante a pandemia
Teste de Mann-Whitney
O teste de Mann-Whitney calcula a estatística U, que representa a média da diferença de postos
de uma variável entre dois grupos.
É o teste não paramétrico utilizado para comparação de média de duas amostras independentes
com distribuição Z (normal):
◦ Hipótese nula: Média de grupo 1 = média do grupo 2
◦ Hipótese alternativa: Média do grupo 1 ≠ média do grupo 2

Exemplo: Verificar se o tempo médio de conclusão de um processo de depósito de patente no


Brasil é igual à Argentina
◦ Hipótese estatística: O tempo médio de conclusão de um processo de depósito de patente no Brasil é
igual à Argentina
◦ Hipótese nula: Média Brasil = Média Argentina
◦ Hipótese alternativa: Média Brasil ≠ Média Argentina
Wilcoxon também desenvolveu um teste para estes casos (teste de postos de Wilcoxon), com o teste de
hipótese reportando a mesma significância estatística do teste de Mann-Whitney
Teste de Kruskal-Walls
O teste de Kruskal-Walls é útil para verificar se k amostras (k>2) independentes provêm de uma
mesma população, sendo uma alternativa não paramétrica à análise da variância (Anova).
◦ Hipótese nula: Média 1 = Média 2... = Média n
◦ Hipótese alternativa: ao menos um grupo apresenta média diferente dos demais.

De forma semelhante ao teste de Mann-Whitney, o teste de Kruskal-Walls considera em sua


análise os postos de uma variável de k grupos.
◦ A partir dos postos é calculada a estatística H, que apresenta distribuição X2 (qui-quadrado);
◦ A distribuição X2 , assim como a F (da Anova), não tem valores negativos, sendo os testes de hipóteses
apenas unicaudais.
Teste de Kruskal-Walls
Exemplo: verificar se o tempo médio de conclusão de um processo de depósito de patente na
América do Sul está associado ao país de depósito
◦ Hipótese estatística: O tempo médio de conclusão de um processo de depósito de patente na América
do Sul está associado ao país de depósito
◦ Hipótese nula: O tempo médio de conclusão de um processo de depósito de patente é igual para todos
os países da América do Sul
◦ Hipótese alternativa: Ao menos em um país da América do Sul o tempo médio de conclusão de um
processo de depósito de patente é diferente dos demais
Coeficiente de correlação de Spearman
Derivado do coeficiente r de Pearson, o coeficiente de correlação de Spearman (rs) é o teste não
paramétrico utilizado para analisar a correlação entre duas variáveis.
De forma semelhante aos demais testes não paramétricos, o coeficiente rs considera os postos
das observações, e não seu valor original.
A interpretação do coeficiente de Spearman é igual ao coeficiente de Pearson:
◦ Apresenta um valor que vai de -1 (correlação negativa perfeita) a +1 (correlação perfeita positiva;
◦ Utiliza o teste t para identificar a significância estatística da correlação (para amostras maiores que 10).
Coeficiente de correlação de Spearman
Exemplo: verificar a existência de associação positiva entre número composições registradas e
idade do compositor.
◦ Hipótese estatística: O número composições registradas está positivamente associada à idade do
compositor.
◦ Hipótese nula: Existe correlação nula ou negativa entre número composições registradas e idade do
compositor.
◦ Hipótese alternativa: Existe correlação positiva entre número composições registradas e idade do
compositor
Teste de diferença de proporções
Até aqui vimos testes de hipóteses não paramétricos utilizados para variáveis métricas e
ordinais.
Entretanto, há casos que queremos fazer análises de variáveis nominais, como a nacionalidade
do inventor e o país de depósito da patente.
Para estes casos são utilizados testes não paramétricos de proporções.
Nesta disciplina iremos tratar do teste de proporções mais conhecido (qui-quadrado) e de uma
análise gráfica das associações existentes entre categorias (análise de correspondência).
Teste qui-quadrado de Pearson
O teste qui-quadrado de Pearson verifica se frequências observadas de categorias para uma
variável nominal diferem de valores esperados e uma estatística de teste de distribuição qui-
quadrado (X2).
Embora seja considerado um teste não paramétrico, deve-se observar dois pressupostos para
realizar o teste qui-quadrado:
◦ Independência das observações;
◦ Frequências esperadas maiores do que 5 em cada célula.

De acordo com o número de variáveis categóricas analisadas, o teste qui-quadrado pode


comparar proporções de categorias em uma única variável ou proporções de categorias em duas
ou mais variáveis.
Teste qui-quadrado de Pearson
TESTE QUI-QUADRADO PARA PROPORÇÕES DE UMA VARIÁVEL
Quando se analisa uma única variável categórica, o objetivo do teste qui-quadrado é verificar se
a proporção de casos das categorias da variável são iguais ou diferentes:
◦ Hipótese nula: As categorias apresentam a mesma frequência (proporção)
◦ Hipótese alternativa: Ao menos uma categoria apresenta frequência (proporção) diferente

Exemplo: Verificar se há diferença no número de patentes (observações) depositadas por um


único inventor (categoria 1) e mais de um inventor (categoria 2)
◦ Hipótese estatística: o número de depósitos de patentes está associado ao número de inventores
◦ Hipótese nula: Frequência de patentes com um inventor = Frequência de patentes com mais de um
inventor
◦ Hipótese alternativa: Frequência de patentes com um inventor = Frequência de patentes com mais de
um inventor
Teste qui-quadrado de Pearson
TESTE QUI-QUADRADO PARA PROPORÇÕES DE UMA DUAS OU MAIS VARIÁVEIS
Quando se analisa mais de uma variável categórica, o objetivo do teste qui-quadrado é verificar
se existe associação entre as duas variáveis categóricas:
◦ Hipótese nula: As variáveis não estão associadas
◦ Hipótese alternativa: As variáveis estão associadas

Exemplo: Verificar se o tipo de patente está associado ao país de depósito da patente


◦ Hipótese estatística: o tipo de patente está associado ao país de depósito da patente
◦ Hipótese nula: a frequência das categorias do tipo de patente é igual para todas as categorias de país de
depósito de patente
◦ Hipótese alternativa: ao menos uma frequência de categoria do tipo de patente é diferente para ao
menos uma categoria de país de depósito de patente
Análise de correspondência (Anacor)
Uma vez que o teste qui-quadrado para duas proporções é significante do ponto de vista
estatístico, infere-se que há associação entre as variáveis analisadas.
Entretanto, não se identifica pelo teste quais categorias das variáveis estão analisadas.
◦ Por exemplo: quais tipos de patentes estão associadas a quais países de depósitos?

A análise de correspondência (Anacor) é uma forma de se analisar graficamente associações


entre categorias de duas variáveis nominais, devendo ser observado que só deve ser processada
quando a teste qui-quadrado for significante.
◦ A anacor reporta um gráfico com 2 dimensões, indicando as proximidades entre as categorias das duas
variáveis analisadas;
◦ Por meio da análise do gráfico é possível identificar grupos de categorias que estão mais associados.
◦ Quanto mais próximas estão as categorias, maior é a associação existente entre elas.
RESUMO
Objetivo Análise Teste paramétrico Teste não paramétrico
Verificar pressupostos para testes Distribuição de variável - Kolmogorov-Smirnov
paramétricos de variáveis Homogeneidade da variância Levene -
métricas
Uma amostra Teste t Sinais de Wilcoxon
Duas amostras independentes Teste t Mann-Whitney
Comparar médias de
variáveis métricas ou ordinais Duas amostras emparelhadas Teste t Sinais de Wilcoxon
Três ou mais amostras Análise da variância (Anova) Kruskal-Walls
independentes
Analisar associação entre Duas variáveis Correlação de Pearson Correlação de Spearman
variáveis métricas ou ordinais
Comparar proporções de Uma variável - Qui-quadrado
variáveis nominais Duas ou mais variáveis - Qui-quadrado

Você também pode gostar