Você está na página 1de 13

REGRESSÃO LINEAR

A regressão é um modelo estatístico usado para prever o comportamento


de uma variável quantitativa (variável dependente ou Y) a partir de uma
ou mais variáveis independentes (X), informando sobre as margens de
erro dessas previsões

❖Apenas uma variável X (independente) Regressão Linear Simples.

❖Mais do que do que uma variável independente Regressão Linear


Múltipla.

Enquanto que a correlação apenas mede a “força” da associação entre 2


variáveis a regressão linear vai mais longe e verifica a relação de cada
variável independente controlando as outras VI colocadas na equação,
evitando assim a existência de relações espúrias . A Regressão permite
também fazer previsões.
REQUISITOS :

✔A variável dependente tem de ter escala quantitativa e distribuição


normal. (Se o N > a 30 o Teorema do Limite Central é aplicável
havendo uma aproximação à normalidade. Se N ≤ 30 tem de se
averiguar a normalidade com o teste de Shapiro).

✔As variáveis independentes: Preferencialmente devem ter escala


quantitativa e distribuição normal (a distribuição normal deve ser
averiguada em N ≤ 30 com o teste de shapiro). Podemos contudo
incluir escalas qualitativas (nominais e ordinais) desde que nas
nominais haja os seguintes cuidados : As nominais dicotómicas têm de
ser codificadas com 0 e 1 e as policotómicas devem ser desdobradas nas
várias alternativas de resposta usando também 0/1 (ex Estado civil é
uma variável nominal policotómica e deve ser desdobrada em 4
variáveis ou seja nas 4 alternativas de resposta : Solteiro, Casado,
Divorciado e Viúvo, usando 0/1 para a ausência/presença desse atributo.
Multicolinearidade – Não devem haver correlações
muito altas entre as variáveis independentes. Deve
observar-se no output o valor de VIF de cada
variável que não deve ser superior a 10. Se isso
acontecer uma das varáveis tem de ser retirada do
modelo. Por exemplo Idade e Anos de Experiência
profissional é natural que tenham uma correlação
muito forte, por isso se o VIF de uma dessas
variáveis for superior a 10 isso indica que essa
variável tem problemas de Multicolinearidade e terá
ser retirada da análise.
COMANDOS DO SPSS :
Analyze/Regression/Linear/no “dependent” colocar a variável
dependente e no “ independent” colocar a(s) variável(is) independente
(s)/ No Statistics selecionar Colinearity Diagnostics/OK

Exemplo: Um Investigador pretende averiguar se


Rendimento Liquido Mensal dos fisioterapeutas é um bom
preditor do nível de insatisfação profissional destes técnicos
de saúde. A amostra é composta por 212 fisioterapeutas. O
Rendimento Liquido Mensal é medido na seguinte escala : 1
– Menos de 700 euros, 2 – [700-1000 euros], 3 –
]1000-1500], 4 – ]1500-2000], 5 – Mais de 2000.
A insatisfação é medida numa escala de 0-10, resultado da
diferença entre a expectativa do profissional (“como acha
que deveria ser”) e a realidade (“como é”), quanto mais
perto tiver de 10 maior a discrepância entre expectativas e
realidade e maior a insatisfação.
Qual o tratamento estatístico mais adequado ?

Resposta : O investigador pretende prever o


comportamento de uma Variável dependente (Insatisfação
Profissional) a partir de uma Variável independente
(Rendimento Liquido Mensal). A Variável Dependente é
quantitativa e como a amostra é superior a 30 (N= 212) o
teorema do limite central é aplicável havendo uma
aproximação à normalidade. A Variável Independente é
ordinal. Podemos assim usar uma Regressão Linear
Simples uma vez que só temos uma variável Independente
(e é aceitável que esta seja qualitativa ordinal).
Outputs do SPSS – Como Interpretar

1º Output a interpretar “Model


Sumary” : o R2 ajustado a multiplicar
por 100 dá a variância explicada. O
rendimento mensal liquido explica em
9,3% a insatisfação dos fisioterapeutas

2º output a interpretar
“ANOVA”: se o valor do sig for ≤
0,05 então existe uma relação
linear entre as variáveis. Neste
caso existe uma relação linear
dado sig = 0,000

3º output a interpretar : Ver o


valor do Beta e de Sig. O Sig é
≤ 0,001 por isso há uma relação
extremamente significativa.
Olhando para o valor de Beta
(-0,312) vê-se se a relação é
negativa ou positiva e a sua
magnitude. Neste caso
constata-se que a relação é
negativa fraca (Beta = -0,312).
Como fazer o texto da interpretação ?

A variável independente (rendimento mensal


liquido) explica em 9,3% (R2 ajustado = 0,093) a
variação da variável dependente (insatisfação
Profissional). A ANOVA revelou a existência de
uma relação linear [F (1) = 22,720, p = 0,000]
entre as duas variáveis. O coeficiente da
regressão revela uma relação negativa fraca entre
as duas variáveis (Beta = -0, 312, p = 0,000):
Quanto maior o rendimento mensal liquido menor
o nível de insatisfação a nível profissional
REGRESSÃO LINEAR MULTIPLA

Este modelo corresponde à generalização do modelo de regressão


linear simples, uma vez que permite a análise da relação entre uma
variável dependente e um conjunto de variáveis independentes.

A regressão linear múltipla requer que as variáveis tenham escala


quantitativa, no entanto esta restrição não é absoluta, visto que as
variáveis independentes de nível qualitativo podem ser introduzidas no
modelo (desde que as nominais tenham escala 0/1).

Exemplo : Suponhamos que o mesmo investigador introduzia na


análise além do Rendimento Liquido Mensal dos fisioterapeutas, outras
variáveis independentes (Idade/Género/Anos de experiência
profissional/Trabalhar em mais do que um local/Numero de profissionais a
trabalhar na unidade/ Trabalhar na função publica/número de horas de
trabalho por dia/numero médio de utentes atendidos individualmente/
número médio de utentes atendidos por dia em grupo) para averiguar qual
ou quais são boas preditoras do nível de insatisfação profissional destes
técnicos de saúde.
Qual o tratamento estatístico mais adequado ?

Resposta : O investigador pretende prever o comportamento de uma Variável dependente


(Insatisfação Profissional) a partir de um conjunto Variáveis independentes. A Variável
Dependente é quantitativa e como a amostra é superior a 30 (N= 212) o teorema do
limite central é aplicável havendo uma aproximação à normalidade. As Variáveis
Independentes têm diferentes tipos de escala (qualitativas e quantitativas):

Rendimento Mensal Liquido : (1 – Menos de 700 euros, 2 – [700-1000 euros], 3 –


]1000-1500], 4 – ]1500-2000], 5 – Mais de 2000) /Anos de experiência profissional
(1-”Menos de 5 anos”, 2-”5 – 10 anos” 3-”11-15 anos”, 4- “16-20 anos” e 5 – “Mais
de 20 anos”– Têm Escala Ordinal

Género (0-M, 1–F)/Trabalhar em mais do que um local (0- Não/1-Sim)/ Trabalhar na


função publica (0- Não/1-Sim) – Têm Escala Nominal (codificadas com 0 e 1)

Idade /Nº de profissionais a trabalhar na unidade/Número de horas de trabalho por


dia/Numero médio de utentes atendidos individualmente/ Número médio de utentes
atendidos por dia em grupo/Anos de exercício profissional no local onde trabalha mais
horas - Têm escala Quantitativa ( e segundo o Teorema do Limite Central
aproximação à normalidade)

Podemos assim usar uma Regressão Linear Múltipla uma vez que a VD é quantitativa e
temos um conjunto de variáveis Independentes quantitativas e qualitativas, tendo havido
Outputs do SPSS – Como Interpretar

1º Output a interpretar “Model Sumary” : o


R2 ajustado a multiplicar por 100 dá a
variância explicada. O Conjunto de variáveis
independentes nesta regressão explicam em
18,4% a insatisfação dos fisioterapeutas.

2º output a interpretar
“ANOVA”: Como o valor
do sig é ≤ 0,05 então existe
pelo menos uma relação
linear entre as variáveis.
Outputs do SPSS – Como Interpretar

3º output a interpretar :
Não há nenhuma variável
com VIF superior a 10
como tal não temos de
eliminar da análise
qualquer variável por
problemas de
Multicolinearidade.
Para interpretar a
regressão ver o valor do
Beta e de Sig. Os Sig é ≤
0,05 indicam as variáveis
significativas. Olhando
para os valores de Beta
dessas variáveis
verifica-se se a relação é
negativa ou positiva e a
magnitude da relação .
Nota : a magnitude é
moderada a partir de
0,40, abaixo disso é
Como fazer o texto da interpretação ?

O conjunto de variáveis Independentes explicam em 18,4% (R2 ajustado =


0,184) a variação da variável dependente (Insatisfação com a Realização
Pessoal e Profissional e Desempenho Organizacional). A ANOVA revelou a
existência de pelo menos uma relação linear [F (11) = 5,509, p = 0,000]
entre as variáveis. Os coeficientes de regressão que se revelaram
significativos foram :
•Trabalhar na Função publica (Beta = 0,158, p = 0,045), sendo a relação
positiva fraca: os que trabalham na função publica revelam maior
insatisfação.
•Número de horas de trabalho por dia (Beta = -0,186, p = 0,008) e
Rendimento Mensal Liquido (Beta = -0,167, p = 0,047) sendo a relação
negativa fraca com a insatisfação : Quanto maior numero de horas de
trabalho por dia e maior o rendimento mensal menor a insatisfação.
•Número médio de utentes atendidos individualmente (Beta = 0,317, p =
0,000) e em grupo (Beta = 0,159, p = 0,020), sendo a relação positiva fraca,
: Quanto maior o número de utentes atendidos individualmente ou em grupo
maior a insatisfação.
De realçar que o Beta mais elevado é o referente ao numero de utentes
atendidos individualmente sendo esta a variável que tem mais peso na
insatisfação dos fisioterapeutas.
Vídeo Tutorial

https://youtu.be/_lGneR0qwpc

Você também pode gostar