Você está na página 1de 46

Métodos de Técnicas de Investigação

o Testes de comparação de médias/medianas


Bibliografia Aconselhada:
- Pereira, A. (2008). SPSS Guia Prático de Utilização – Análise de dados para as ciências sociais e psicologia, Edições Sílabo.
- Maroco, J. (2010). Análise Estatística - Com a Utilização do SPSS (3 ed.). Lisboa: Edições Sílabo.

AIB & AIC <MGP> 2022/2023 1


Alguns Testes de Hipóteses – Paramétricos:

•Teste t para o valor médio de 1 população.


•Testes à igualdade de variâncias de 2 populações.
•Testes t para a diferença de valores médios de 2 populações (independentes
ou emparelhadas, com variâncias populacionais: iguais ou diferentes).
•Teste ANOVA para a igualdade de valores médios de 3 ou mais populações.
•Testes de comparação múltipla de médias (post hoc).

AIB & AIC <MGP> 2022/2023 2


Alguns Testes de Hipóteses – não-Paramétricos:

Testes de qualidade do ajuste (H0: as variáveis seguem uma distribuição normal):


¶ Teste de Kolmogorov-Smirnov
¶ Teste de Shapiro-Wilk

Testes de localização:
¶ Teste do Sinal(H0: η = 0 )
¶ Teste Mann-Whitney (H0: η1 = η2)
¶ Teste Kruskal-Wallis (H0: η1 = η2 = … = ηk)

Testes de Associação:
¶ Teste de correlação ordinal de Spearman ou Kendal
¶ Testes de independência em tabelas de contingência (χ2)

AIB & AIC <MGP> 2022/2023 3


Comparação de médias – testes t
Os testes t permitem testar hipóteses sobre as médias de uma variável
quantitativa em um ou dois grupos, formados a partir de uma variável
qualitativa.

Os testes t, para amostras de dimensão inferiores ou1iguais a 30, exigem que


o(s) grupo(s) em análise tenham distribuição normal.

O SPSS apresenta três testes t para comparação de médias:


• Teste t para uma amostra
• Teste t para duas amostras independentes
• Teste t para duas amostras emparelhadas
1
Uma visão mais conservadora pressupõe também a condição de normalidade da distribuição
para amostras de dimensão superior a 30.

AIB & AIC <MGP> 2022/2023 4


Teste t para 1 amostra
Este teste aplica-se sempre que não se conhece a variância
populacional e se pretende testar se a média da população
assume um determinado valor, ou seja, o teste t compara os
valores observados com um valor pré-definido pelo investigador.

Pressupostos:
• As variáveis devem ser quantitativas;
• Quando n<30, os dados devem ter uma distribuição
normal (utilizam-se os testes K-S e S-W)

AIB & AIC <MGP> 2022/2023 5


Teste t para 1 amostra
Exemplo emprego.sav
Verificar se a média de horas de trabalho dos trabalhadores duma
empresa é igual a 40h semanais.

Dado que o n.º de observações é superior a 30 (n=741) não é


imperativo testar a normalidade dos dados.

As hipóteses a testar são:


• H0: µℎ𝑜𝑟𝑎𝑠 = 40
• H1: µℎ𝑜𝑟𝑎𝑠 ≠ 40

AIB & AIC <MGP> 2022/2023 6


Teste t para 1 amostra

Valor a testar

7
AIB & AIC <MGP> 2022/2023
Teste t para 1 amostra

O nível médio de horas de trabalho dos empregados desta amostra é


de 46,29.
Pretende-se saber se esta diferença é estatisticamente significativa, ou
seja, se a média amostral provém de uma população com média 40
horas.

AIB & AIC <MGP> 2022/2023 8


Teste t para 1 amostra

O nível de significância de 0,000, valor inferior a 0,05, leva à rejeição de


H0, ou seja, à conclusão de que as horas médias trabalhadas pelos
empregados desta empresa são estatisticamente diferentes (e
superiores) às horas medias trabalhadas pelos empregados
portugueses.
O zero não estar incluído no intervalo de confiança a 95%, confirma a
rejeição de Ho.
AIB & AIC <MGP> 2022/2023 9
Teste t para 1 amostra
Analyze… Compare means… One Sample t tests…
Test Variable horas1
Test Value 40
Options… Confidence Interval 95%
Missing Values… Exclude cases analysis by analysis…
Continue… Ok

AIB & AIC <MGP> 2022/2023 10


Teste t para 2 amostras independentes
Este teste aplica-se sempre que se pretenda comparar as médias de uma
variável quantitativa em dois grupos diferentes de sujeitos e se
desconhecem as respetivas variâncias populacionais.

Pressupostos:
• As variáveis devem ser quantitativas;
• Os resultados devem ter uma distribuição normal
(quando 𝑛 < 30 é imperativo fazer um teste de normalidade – utilizam-se os
testes K-S e KS);
• Homogeneidade das variâncias (utiliza-se o teste de Levene).

AIB & AIC <MGP> 2022/2023 11


Teste t para 2 amostras independentes
Exemplo:
emprego.sav
Considere-se a base de dados. Pretende comparar-se as idades de
744 indivíduos classificados em dois grupos: muito satisfeitos e
não muito satisfeitos.

Procedimento
Box plot ou outros gráficos
Teste t para 2 amostras independentes

AIB & AIC <MGP> 2022/2023 12


Teste t para 2 amostras independentes
A representação gráfica é uma outra forma que permite efetuar a leitura
dos resultados.
90

148
80
99
117
176
736

Graph... Box plot... Simple....


89 545
120 373
70

60 Variable (idade do
50
respondente)... Category Axis
(satisfação no emprego)...
Idade do respondente

40

30

20 Parece haver uma diferença


10
N= 325 419
entre as médias.
Muito satisfeito Não muito satisfeito

Satisfação no emprego

AIB & AIC <MGP> 2022/2023 13


Teste t para 2 amostras independentes
42,0

41,5

41,0
Graph... Line... Simple....
Other summary function
Mean Idade do respondente

40,5
(MEAN: idade do
respondente)... Category
40,0 Axis (satisfação no
emprego)...
39,5

39,0
Muito satisfeito Não muito satisfeito

Satisfação no emprego

Parece haver uma diferença entre as médias.

AIB & AIC <MGP> 2022/2023 14


Teste t para 2 amostras independentes
Exemplo 1:
emprego.sav
Considere-se a base de dados. Pretende comparar-se as idades de 744
indivíduos classificados em dois grupos: muito satisfeitos e não muito
satisfeitos (sat_emp2).
Procedimentos:
Dado que o número de observações é superior a 30, não é imperativo
utilizar o teste K-S para verificar a normalidade de cada grupo.

As hipóteses a testar são:


• H0:μMs= μNMs(as idades dos muito satisfeitos e dos não muito satisfeitos
não diferem)
• H1:μMs≠ μNMs(as idades dos muito satisfeitos e dos não muito satisfeitos
diferem)
AIB & AIC <MGP> 2022/2023 15
Teste t para 2 amostras independentes

Analyze → Compare Means → Independent Samples T Test


AIB & AIC <MGP> 2022/2023 16
Teste t para 2 amostras independentes

• Vamos verificar se os dois grupos têm iguais variâncias


(homogeneidade das variâncias - Teste de Levene)
• H0:σMs= σ NMs
• H1: σ Ms≠ σ NMs

Analyze... Compare means... Independent-Samples t Test… Test


variable (Idade respondente)… Grouping variable (satisfação no
emprego)... Define groups (Group1:1 e Group2:2)...

AIB & AIC <MGP> 2022/2023 17


Teste t para 2 amostras independentes
Leitura da tabela:
• O nível de significância do teste de Levene é de 0.540, valor
superior a 0.05, levando à não rejeição da hipótese nula (da
igualdade das variâncias) e em consequência considerar o teste
t, apresentado na linha Equal variances assumed.
• O nível de significância do teste t, 0.019, valor inferior a 0.05,
leva à rejeição da igualdade das idades nos dois grupos
observados (muito satisfeitos e não muito satisfeitos).
• Quando o teste t leva à rejeição de H0, isso significa que a
diferença de médias nos dois grupos não é zero. Assim, o
intervalo de confiança para a diferença de médias não inclui a
diferença nula, ou seja, o valor zero, como comprova o quadro
anterior.

AIB & AIC <MGP> 2022/2023 18


Teste t para 2 amostras independentes

Exemplo 2:

Os dados dizem respeito a uma investigação sobre os rendimentos e nível de dívidas, em


milhares de euros, de 700 indivíduos. O ficheiro fornece informação sobre a idade dos
indivíduos (idade), o seu nível de educação (nivel_educ), o número de anos no emprego
atual (anos_emp), o número de anos na morada atual (anos_morada), o rendimento
familiar (rend_fam), o rácio da dívida face ao rendimento (racio_div), a dívida em cartão
de crédito (div_cartao), outras dívidas (div_outras) e se já foi incumpridor previamente
(incumpr).

Verificar, ao nível de 5%, se a dívida em cartão de crédito difere, em média, entre os


incumpridores previamente e os não incumpridores:

AIB & AIC <MGP> 2022/2023 19


Teste t para 2 amostras independentes

No SPSS:

Inserir variável factor (a


que divide a variável a
testar em grupos)

AIB & AIC <MGP> 2022/2023 20


Teste t para 2 amostras independentes

Output: Analisando o intervalo de confiança da diferença de


médias, com 95% de confiança, entre os não
incumpridores previamente (0) e os incumpridores
previamente (1), como varia entre dois valores
negativos, podemos concluir que, em média, os clientes
que não são incumpridores previamente têm uma divida
no cartão de crédito inferior aos que já foram
incumpridores previamente.

Como o valor de prova é inferior ao nível de


significância 5%, rejeita-se a hipótese nula do
Teste de Levene, com 95% de confiança. O que Como o valor de prova é inferior ao nível de
significância 5%, rejeita-se a hipótese nula do
significa que não se deve assumir a igualdade
das variâncias. Teste t, com 95% de confiança. O que significa
que se rejeita a igualdade das médias da divida
no cartão de crédito entre os não incumpridores
previamente (0) e os incumpridores
previamente (1).

AIB & AIC <MGP> 2022/2023 21


Teste t para 2 amostras emparelhadas
Este teste é utilizado quando o mesmo grupo de sujeitos é
analisado duas vezes, antes e depois de um tratamento ou
intervenção.

Testa-se se a diferença entre os dois grupos é ou não igual a zero.

Pressupostos:
◦ As variáveis devem ser quantitativas;
◦ Os resultados devem ter uma distribuição normal
(Se n<30 utiliza-se o teste K-S e S-W).

AIB & AIC <MGP> 2022/2023 22


Teste t para 2 amostras emparelhadas
Exemplo 1
droga.sav
Pretende analisar-se os resultados dos tempos de reação obtidos numa
amostra aleatória de 7 indivíduos, antes e depois de ingerirem droga.

Procedimento:
dado que o n.º de observações é inferior a 30, é imperativo utilizar o teste
K-S para verificar a normalidade de cada grupo.

As hipóteses a testar são:


• H0: as variáveis (antes e depois) seguem uma distribuição normal
• H1: as variáveis (antes e depois) não seguem uma distribuição normal

AIB & AIC <MGP> 2022/2023 23


Teste t para 2 amostras emparelhadas
Tests of Normality
Kolmogorov-Smirnova Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
s_droga ,156 7 ,200* ,967 7 ,874
c_droga ,158 7 ,200* ,956 7 ,782
*. This is a lower bound of the true significance.
a. Lilliefors Significance Correction

Os níveis de significância associados ao teste Shapiro-Wilk são


ambos superiores 0,05, logo não rejeitámos a hipótese nula.
Conclusão: ambas as distribuições, sem e com droga, podem ser
consideradas aproximadamente normais.

Analyze… Descriptive Statistics… Explore…


Plots: Normality plots with tests…

AIB & AIC <MGP> 2022/2023 24


Teste t para 2 amostras emparelhadas
As hipóteses a testar são:
• H0: µΔ=0 (não há diferença entre as reações médias antes e depois de ingerir droga)
• H1: µΔ≠0 (há diferença entre as reações médias antes e depois de ingerir droga)

Paired Samples Statistics


Std. Error
Mean N Std. Deviation Mean
Pair s_droga 28,14 7 7,755 2,931
1 c_droga 25,14 7 5,210 1,969

A reacção média antes de ingerir droga é de 28,14.

A reacção média depois de ingerir droga é de 25,14.

AIB & AIC <MGP> 2022/2023 25


Teste t para 2 amostras emparelhadas
Paired Samples Correlations Como 0,008<0,05,
N Correlation Sig. rejeito a hipótese
Pair 1 s_droga & c_droga 7 ,886 ,008 das variáveis serem
independentes.

Paired Samples Test


Pair 1
s_droga - c_droga O intervalo de
Mean 3,000 confiança para a
Std. Deviation 3,958 diferença entre as
médias inclui o valor
Paired Differences Std. Error Mean 1,496 zero.
95% Confidence Interval Lower -,661
O teste t associado
of the Difference Upper 6,661 um nível de
t 2,005 significância é
df 6 superior a 0,05, o
Sig. (2-tailed) ,092 que leva à não
rejeição de H0.
AIB & AIC <MGP> 2022/2023 26
Teste t para 2 amostras emparelhadas
Exemplo 2: Suponhamos que queremos testar o efeito de uma dieta em 10 indivíduos.

Ao nível de 5%, podemos concluir que houve diminuição do peso médio pela aplicação da dieta?

H0: µ1 = µ2 ou H0: µ1 - µ2 = 0

H1: µ1 ≠ µ2 ou H1: µ1 - µ2 ≠ 0

AIB & AIC <MGP> 2022/2023 27


Teste t para 2 amostras emparelhadas

Como o valor de prova é


Com 95% de confiança, podemos concluir que a
inferior ao nível de significância,
diferença entre a média dos pesos antes e depois da 5%, rejeita-se a hipótese nula
dieta é superior a zero. O que leva a concluir que a (igualdade de médias dos pesos
dieta teve um efeito positivo na diminuição de peso antes e depois da dieta, com
médio. 95% de significância. Ou seja,
houve efeito da dieta.

AIB & AIC <MGP> 2022/2023 28


Teste t para 2 amostras emparelhadas

Analyze… Compare means… Paired Samples t tests…


Current Selections
Variable 1 s_droga Variable 2 c_droga
Paired Variables s_droga - c_droga
Options… Confidence Interval 95%
Exclude cases analysis by analysis… Continue… Ok

AIB & AIC <MGP> 2022/2023 29


ANOVA one-way
Teste paramétrico: ANOVA (Analysis of Variance) a um factor (one-way).

ANOVA diferencia-se dos testes t porque é um teste que pode ser


utilizado para testar diferenças de média para duas ou mais variáveis.

Exemplos de utilização da ANOVA (Pereira, 2008:147):


• Estudar quatro métodos para ensinar matemática e comparar
os resultados médios obtidos em cada um dos quatro grupos;
• Testar sete métodos diferentes de tratamento para baixar o
colesterol e comparar os valores médios finais e obtidos;

AIB & AIC <MGP> 2022/2023 30


ANOVA one-way
Este teste aplica-se sempre que se pretenda comparar as médias,
obtidas através de variáveis quantitativas, de dois ou mais grupos.

Pressupostos:
• As variáveis devem ser quantitativas;
• As variáveis devem ter uma distribuição normal (Quando n<30
é imperativo utilizar o teste K-S ou SW);
• Homogeneidade das variâncias.

AIB & AIC <MGP> 2022/2023 31


ANOVA one-way
Exemplo: compararam-se o número de horas trabalhadas na
semana passada (variável horas1) de 741 indivíduos classificados
de acordo com as habilitações literárias (variável grau) emprego.sav

Procedimentos:
Dado que o número de observações é superior a 30, não é
imperativo utilizar o teste K-S para verificar a normalidade de
cada grupo.
As hipóteses a testar são:
• H0:μIES= μES= μUniv= μBach = μLic (a média de horas
trabalhadas por cada grupo não difere)
• H1: Existe pelo menos um grupo cuja média de horas
trabalhadas difere das outras

AIB & AIC <MGP> 2022/2023 32


ANOVA one-way

Os valores de prova são todos inferiores a 0,05, pelo que a um nível de significância de 5%, a
normalidade é rejeitada em todos os grupos.
Assim, não seria possível fazer a comparação de médias através do teste ANOVA.

No entanto, como a amostra em todos


os grupos é superior a 30, não é
imperativo fazer os testes de
normalidade.

AIB & AIC <MGP> 2022/2023 33


ANOVA one-way

Analyze... Compare means... One-Way ANOVA… Dependent list


(horas1)… Factor (grau)...

34
AIB & AIC <MGP> 2022/2023
ANOVA one-way
Na análise da variabilidade é analisada:
- A variabilidade das observações dentro de cada grupo em
torno da média;
- A variabilidade entre as médias dos diferentes grupos;

Analyze... Compare means... One-Way ANOVA… Dependent


list (n.º horas trabalhadas na semana passada)… Factor (grau
mais elevado)...

AIB & AIC <MGP> 2022/2023 35


ANOVA one-way
Leitura da tabela:
• O nível de significância do teste é de 0.006, valor inferior a
0.05, levando à rejeição da hipótese nula (da igualdade das
médias nos diferentes grupos observados).
• Quando a variabilidade entre os grupos é bastante grande
quando comparada com a variabilidade dentro dos grupos,
rejeita-se a hipótese nula. No nosso caso, temos uma
variabilidade entre os grupos de 456,479 e uma variabilidade
dentro dos grupos de 125,201. Assim, a relação entre estas
variabilidades é de 3,646 (456,479/125,201) e o nível de
significância do teste F é de 0,006, levando à rejeição de Ho.
• Conclui-se que é pouco provável que o número médio de horas
trabalhadas na semana passada seja igual para todos os grupos
da população.

AIB & AIC <MGP> 2022/2023 36


Testes de comparação múltipla de médias
Quando na ANOVA rejeitamos Ho (como no exemplo anterior),
concluímos que pelo menos uma das médias populacionais é diferente
das restantes.

Através da ANOVA não sabemos qual ou quais os pares de médias que


são diferentes. Para obter esta informação, devemos usar testes que
permitam comparar as k médias, duas a duas.

Exemplos de testes post-hoc:


- teste de Tukey (para amostras grandes)
- teste de Bonferroni (para amostras pequenas)

AIB & AIC <MGP> 2022/2023 37


Testes de comparação múltipla de médias

Analyze... Compare means... One-Way ANOVA… Dependent list


(horas1)… Factor (grau)... Post Hoc

38
AIB & AIC <MGP> 2022/2023
Testes de comparação múltipla de médias

39
AIB & AIC <MGP> 2022/2023
Testes de comparação múltipla de médias
Teste Tukey

AIB & AIC <MGP> 2022/2023 40


Testes de comparação múltipla de médias
Leitura da tabela:
• A tabela compara, duas a duas, as médias obtidas.
• Verifica-se que existe uma diferença significativa no número
médio de horas trabalhadas na semana passada entre os
seguintes grupos de trabalhadores:
• Licenciados vs Inferior à Escola Secundária
• Licenciados vs Escola Secundária

Analyze... Compare means... One-Way ANOVA… Dependent


list (n.º horas trabalhadas na semana passada)… Factor (grau
mais elevado)... Post Hoc (Tukey)

AIB & AIC <MGP> 2022/2023 41


ANOVA one-way

• A representação gráfica é uma outra forma que permite efectuar a


leitura dos resultados.

Graph... Box plot...


Simple.... Variable
(número de horas
trabalhadas na
semana passada)...
Category Axis
(grau mais
elevado)...

AIB & AIC <MGP> 2022/2023 42


Testes não paramétricos
• Os testes não paramétricos não necessitam de requisitos tão
exigentes quando comparados com os testes paramétricos.

• Devem ser usados quando temos amostras de pequena dimensão


que não cumprem os pressupostos dos testes paramétricos.

• A desvantagem deste tipo de testes face aos testes paramétricos é


não serem tão robustos, ou seja, não encontram tantas diferenças
entre os dados quando elas efetivamente existem.

AIB & AIC <MGP> 2022/2023 43


Teste Mann-Whitney
Este teste é a alternativa mais comum aos testes t para amostras
independentes.

• Os dados têm que provir de amostras independentes mas que não


necessitam de ter distribuições normais.

• As hipóteses a testar são:


• H0:hA= h B (as medianas da população são as mesmas para os dois
grupos)
• H1:μA≠ μB (as medianas da população são diferentes nos dois grupos)

Analyze… Nonparametric tests… Independent Samples…


Settings… Choose tests… Mann-Whitney U (2 samples)

AIB & AIC <MGP> 2022/2023 44


Teste dos sinais
Este teste é a alternativa mais comum aos testes t para amostras
emparelhadas.

• A hipótese nula para o teste dos sinais afirma que a diferença


mediana entre os dois membros de um par é zero.
• H0: h Δ=0 (diferença média entre os dois membros de um par é zero)
• H1: h Δ≠0 (diferença média entre os dois membros de um par é diferente de zero)

• Não há requisitos quanto à forma da distribuição dos dados (não


necessitam de ter distribuições normais).

Analyze… Nonparametric tests… Related Samples… Settings…


Choose tests… Sign test (2 samples)

AIB & AIC <MGP> 2022/2023 45


Teste Kruskal-Wallis
Este teste é a alternativa mais comum ao teste ANOVA.

• Os dados têm que provir de amostras independentes mas que não


necessitam de ter distribuições normais.

• As hipóteses a testar são:


• H0: h A= h B = h C= h D (as medianas da população são as mesmas
para os diferentes grupos)
• H1: Existe pelo menos uma mediana de um grupo que difere das
medianas dos outros grupos

Analyze… Nonparametric tests… Independent Samples… Settings…


Choose tests… Kruskal-Wallis 1-way ANOVA (K samples)

AIB & AIC <MGP> 2022/2023 46

Você também pode gostar