Você está na página 1de 5

EST AV PSI Resposta Contı́nua e Preditores categóricos DMat 2022

Em muitos estudos experimentais, pretende-se estudar o eventual efeito que uma, ou várias

variáveis, provocam numa variável resposta.

Seja Y a variável resposta, quantitativa e numa escala, no mı́nimo, intervalar. Seja X uma

variável categórica ou fator.

1 X dicotómica: testes t

Se X é dicotómica, então toma apenas dois valores. Para estudar o efeito que X tem na

resposta Y , podemos recorrer a testes t de Student para a diferença de valores médios em

populações independentes, se os dados da resposta em cada uma das categorias de X forem

Normais. Quer a Estatı́stica de Teste T , quer os graus de liberdade da ET, dependem se as

variâncias das duas populações são iguais ou diferentes.

Neste sentido, quando se procede no SPSS à comparação de médias em amostras indepen-

dentes, é devolvido também o restultado de um teste de homogeneidade de variâncias (teste

de Levéne). Este teste tem como H0 : as variâncias das duas populações são iguais (σ12 = σ22 )

e H1 : as variâncias das duas populações são diferentes (σ12 ̸= σ22 ).

Se a H0 deste teste não é rejeitada, ou seja, se as variâncias são iguais, a ET do teste T para

a igualdade de valores médios, H0 : µ1 − µ2 = 0 (não existe efeito de X na resposta Y ) vs.

H1 : µ1 − µ2 ̸= 0 (existe efeito de X na resposta Y ) é


r
Y1 − Y2 nm
T = ∼ tn+m−2
S∗ n+m

com
(n − 1)S12 + (m − 1)S22
S ∗2 =
n+m−2
n e m são as dimensões das amostras associadas a Y1 e Y2 , respetivamente. A variável Y1

representa a variável associada à resposta Y no nı́vel 1 do fator X, e, de maneira análoga,

Y2 representa a variável associada à resposta Y no nı́vel 2 do fator X.

DMat 2022 1 cecilia castro


EST AV PSI Resposta Contı́nua e Preditores categóricos

Caso as variâncias não sejam iguais (rejeição da H0 no teste de Levéne), tem-se uma correção

de Welch para os graus de liberdade da Estatı́stica de Teste

Y1−Y2
T =q 2 ∼ tν
S1 S22
n
+ m

com
S2 S22 2
( n1 + m
)
ν= S14 S24
n2 (n−1)
+ m2 (m−1)

As duas estatı́sticas de teste, T , coincidem quando as amostras têm a mesma dimensão

(n = m), havendo apenas que corrigir os graus de liberdade quando as variâncias não são

iguais.

2 X policotómica: ANOVA

Se X toma valores em mais do que duas categorias, então, para estudar o efeito que X tem

na resposta Y , podemos recorrer a testes F de Fisher para a diferença de valores médios

em mais do que duas populações independentes, se os dados da resposta em cada uma das

categorias de X forem Normais.

As hipóteses que se pretendem testar são as seguintes:

H0 : µ1 = µ2 = . . . = µk vs. H1 : µi ̸= µj para algum i ̸= j

Na H0 estabelece-se que X não produz efeito em Y . Na H1 estabelece-se que existe efeito

de X em Y . Note que, se rejeitar H0 apenas conclui que existe efeito, não sendo possı́vel

identicar que nı́vel, ou nı́veis de X são responsáveis por esse efeito.

Tal como nos testes t acima, a ET depende se as as variâncias das k populações, Y1 , Y2 , . . . , Yk

são iguais ou diferentes.

Sejam as variâncias iguais, σ12 = σ22 = . . . = σk2 .

Para testar estas hipóteses recorre-se a uma análise das variâncias dos k grupos. A ideia é

DMat 2022 2 cecilia castro


EST AV PSI Resposta Contı́nua e Preditores categóricos DMat 2022

comparar a variabilidade da resposta explicada pelo modelo (variância entre grupos, variância

sistemática), com a variabilidade não explicada pelo modelo (variância dentro dos grupos,

variância não sistemática).

Variância dentro dos grupos (within)


k Ni
1 XX
σ2
b = (yij − y i )2 = M SE
n − k i=1 j=1
| {z }
SSE

Variância entre grupos (between)


k
1 X 2
b2 =
σ Ni y i − y = M SA
k − 1 i=1
| {z }
SSA
A ET, caso em H0 é verdadeira, é

M SA
F = ∼ Fk−1,n−k
M SE
Rejeita-se H0 se o valor de F for grande, ou seja se a variabilidade entre os grupos (causada

pela variável independente) for maior que a variabilidade dentro dos grupos (residual, resul-

tante do processo de amostragem).

df SS MS F

A (fator: between) k-1 SSA MSA MSA/MSE

E (residual: within) n-k SSE MSE

T (total) n-1 SST


A soma dos quadrados do modelo, SSA é uma medida da variabilidade dos dados que pode

ser explicada pela variável independente (categórica), e SSE é uma medida da quantidade

de variabilidade total que não pode ser explicada pelos grupos.

2.1 Testes post hoc

Caso a H0 seja rejeitada, para se perceber que grupos são responsáveis pelas diferenças,

procede-se a comparações múltiplas, testando cada grupo contra todos os outros grupo (testes

DMat 2022 3 cecilia castro


EST AV PSI Resposta Contı́nua e Preditores categóricos

post hoc), usando testes t, por exemplo. Com este procedimento, a probabilidade de cometer

erro tipo I no teste global aumenta. Uma solução é corrigir o nı́vel de significância dos

testes parciais. O teste de comparações múltiplas de Bonferroni implementado no SPSS

já inclui essas correções. Nem sempre o teste é conclusivo. Pode acontecer que nenhuma

das comparações dos valores médios dos grupos, dois a dois, sejam significativas (o que vai

contra a decisão de rejeição da igualdade dos valores médios da ANOVA) ou que existam

incongruências nas comparações. Quando isto acontece, pode-se estar a cometer erro tipo II

nalguma das comparações (não rejeitar H0 quando ela é falsa).

3 ANOVA – variâncias diferentes

Uma das condições de aplicabilidade do teste F da ANOVA descrito anteriormente, é a

igualdade das variâncias nos k grupos. Caso se rejeite esta hipótese (teste de Levéne), deve

usar-se uma versão do teste F adaptada a esta situação (tal como se faz no teste t). Esta

versão, designada teste de Welch, encontra-se implementada no SPSS e deve ser usada caso

a hipótese de homogeneidade das variâncias seja rejeitada.

4 ANOVA – não normalidade

No caso em que os dados em cada uma das k categorias da variável categórica não são normais

ou as amostras são de pequena dimensão, deve usar-se uma alternativa não paramétrica à

ANOVA como, por exemplo, o teste de Kruskal-Wallis, ou ANOVA das ordens, implementado

no SPSS. O objetivo é comparar as medianas dos k grupos de observações.

Este procedimento pode ser usado nas seguintes condições:

1. A variável resposta Y é proveviente de uma distribuição contı́nua.

2. As observações da variável resposta Y encontram-se numa escala pelo menos ordinal.

DMat 2022 4 cecilia castro


EST AV PSI Resposta Contı́nua e Preditores categóricos DMat 2022

3. As observações estão organizadas em k grupos de observações independentes entre si.

4. As populações diferem apenas na localização (portanto têm a mesma forma).

5 Exercı́cios

1. Considere os dados do ficheiro sono. Verifique se a prática de exercı́cio fı́sico produz

efeito na qualidade do sono.

2. Relativamente aos dados do ficheiro student-mat

(a) verifique se sex, higher, romantic e internet produzem efeito nas notas do

terceiro perı́odo, G3 .

(b) verifique se a ação conjunta dos fatores sex e romantic produzem efeito sig-

nificativo nas notas do terceiro perı́odo. Em caso afirmativo, indique os nı́veis

responsáveis pelo efeito.

(c) verifique se a educação da mãe produz efeito nas notas do terceiro perı́odo. Indique

o teste que deve utilizar, justificando. Proceda a comparações múltiplas, caso seja

pertinente. Comente todos os resultados obtidos.

3. Relativamente aos dados Employee.sav, pode concluir que os salários dependem da

categoria de emprego? Justifique completamente. Os sálários dependem do género e

da etnia? Apresente gráficos elucidativos.

4. Verifique se a espécie dos lı́rios produz um efeito significativo na largura da sépala

(dados iris). Em caso afirmativo, pode concluir que a setosa é a espécie que apresenta

maior largura da sépala? Justifique completamente. Apresente gráficos elucidativos.

DMat 2022 5 cecilia castro

Você também pode gostar