Você está na página 1de 12

1

Material 4 - Correlao e Regresso linear


Exemplo: Um pesquisador est interessado em determinar os fatores explicadores da
inteligncia. Ele aplicou um teste de inteligncia para seis pessoas e perguntou a elas o
nmero de horas mensais que elas se dedicam aos estudos. Ele tinha como hiptese que o
nmero de horas mensais dedicadas ao estudo podem interferir no QI. Os dados esto na
tabela abaixo.
Nmero de horas mensais
dedicadas ao estudo x
36 48 51 54 57 60
Quociente de inteligncia y
86 90 91 93 94 95
4.1 Grfico de disperso (em ingls: scatterplot)
Antes de comear a anlise de correlao e regresso, importante iniciar com a
elaborao do grfico, que ao trmino da analise ser usado para publicao.
Em um sistema cartesiano, faa um diagrama de disperso desses dados. Para isto:
Coloque no eixo x (abscissa) o nmero de horas dedicadas ao estudo e no eixo y
(ordenada) a pontuao do quociente de inteligncia.
Crie uma escala adequada para representar o nmero de horas dedicadas ao estudo e
para representar a pontuao de QI. As escalas no precisam ser as mesmas.
Para cada par ordenado (x, y), coloque um ponto no sistema cartesiano. Por exemplo,
para o par ordenado (36; 86), que se refere a 36 horas de estudo, com 86 pontos de QI,
coloque um ponto no grfico. Faa o mesmo para os outros cinco pares ordenados.


















Responda: Os dados (pontos) se assemelham uma reta?
2
Se sim, a anlise de correlao nos permitir entender se esta relao entre QI e horas de
estudo forte ou fraca.
Se no, a anlise de correlao provavelmente nos permitir verificar que no h relao
linear entre QI e horas de estudo.
Mas, lembre-se: o grfico um INDICATIVO do que acontecer na correlao e na
regresso.
4.2 Correlao linear de Pearson
A correlao linear permite que se verifique se duas variveis quantitativas esto linearmente
relacionadas, ou seja, se medida que os valores de uma varivel aumentam, os valores da
outra varivel aumentam na mesma proporo. Para a nossa situao, se a correlao linear
for significativa, teremos que medida que as horas de estudo aumentam, tambm h
aumentos nos valores de QI (ou quanto mais horas se estuda, maior o QI).
Vamos aplicar a correlao de Pearson para verificar se a correlao (ou no) significativa
entre QI e horas de estudo. Para isto, siga os passos:
A hiptese nula da correlao de Pearson Ho :
0
(l-se ro igual a zero), ou seja,
no existe relao linear significativa entre as duas variveis quantitativas.
No nosso exemplo, Ho: no existe relao linear significativa entre o nmero de horas
dedicadas ao estudo e o valor de QI.
a) Faa os clculos indicados na tabela a seguir. Eles sero necessrios para o clculo do
coeficiente de correlao de Pearson. Para seu trabalho, utilize o Excel para realizar esses
clculos.
Variveis
Soma
( )

Nmero de horas
de estudo (x
i
)
36 48 51 54 57 60
i
x
306
QI ( y
i
)
86 90 91 93 94 95
i
y
549
x
i
. y
i

i i
y x
x
i
2

2
i
x
y
i
2

2
i
y
b) Com os resultados obtidos na tabela do item a (ultima coluna), calcule o coeficiente de
correlao de Pearson a partir da frmula:
3

1
1
1
1
1
]
1

,
_


1
1
1
1
1
]
1

,
_

n
i
n
i
i
i
n
i
n
i
i
i
n
i
i
n
i
i
n
i
i i
n
y
y
n
x
x
n
y x
y x
r
1
2
1 2
1
2
1 2
1 1
1
O valor obtido na frmula chamado de coeficiente de correlao de Pearson, ou
simplesmente r observado e simbolizado por r
o.
r
o
= ________
c) Obtenha o valor padronizado do coeficiente de correlao de Pearson na Tabela 1. Esse
coeficiente chamado de r crtico e simbolizado por r
c
. Para isto, voc vai precisar do N
(nmero de pares da situao em anlise) e o nvel de significncia, que na nossa
disciplina escolhemos 5% (0,05).
r
c
= ________
Tabela 1: Valores crticos do Coeficiente de Correlao de Pearson (baseado em Triola, 1999)
N = 0,05 ou 5% = 0,01 ou 1%
4 0,950 0,999
5 0,878 0,959
6 0,811 0,917
7 0,754 0,875
8 0,707 0,834
9 0,666 0,798
10 0,632 0,765
11 0,602 0,735
12 0,576 0,708
13 0,553 0,684
14 0,532 0,661
15 0,514 0,641
16 0,497 0,623
17 0,482 0,606
18 0,468 0,590
19 0,456 0,575
20 0,444 0,561
25 0,396 0,505
30 0,361 0,463
35 0,335 0,430
40 0,312 0,402
45 0,294 0,378
50 0,279 0,361
60 0,254 0,330
70 0,236 0,305
80 0,220 0,286
90 0,207 0,269
100 0,196 0,256
4

d) Vamos tomar a deciso de aceitar ou rejeitar Ho.
Regra de deciso: se |r
o
| r
c
, rejeita-se H
o
.
Sua deciso : _______________ pois ____________________________________
e) Elabore sua concluso a partir da regra de deciso. Saiba que:
Se voc aceitar Ho, voc vai concluir que no h relao linear significativa entre QI e
horas de estudo.
Se voc rejeitar Ho, voc vai concluir que h relao linear significativa entre QI e horas
de estudo.
Sua concluso : ______________________________________________
OBS.1 : Se o valor obtido de r for positivo, significa que existe uma relao linear positiva
entre o nmero de horas dedicadas ao estudo e o QI, ou seja, quanto mais horas so dedicadas
ao estudo, maior o valor de QI da pessoa. Se o valor for negativo, significa que existe uma
relao linear negativa entre o nmero de horas dedicadas ao estudo e o valor de QI, ou seja,
quanto mais horas dedicadas ao estudo, menor o QI.
OBS. 2: O valor de r pode oscilar entre -1 at +1. Se for zero, significa que no existe relao
linear entre nmero de horas dedicadas ao estudo e QI. Quanto mais prximo de +1 for o
valor de r, mais forte a relao linear positiva. Quanto mais prximo de -1 for o valor de r,
mais forte a relao linear negativa. Mas o valor do coeficiente de correlao de Pearson
que vai confirmar se h (ou no) relao linear significativa entre as duas variveis
quantitativas.

5
4.3 Regresso linear
Quando a correlao entre duas variveis quantitativas no significativa, terminamos a
anlise pois uma varivel no tem relao (associao) com a outra.
Quando a correlao entre as duas variveis quantitativas significativa, aplicamos a
regresso linear para modelar essa situao, ou seja, para verificar o quanto uma varivel pode
ser explicada pela outra. No nosso exemplo, aplicamos a regresso para verificar o quanto do
QI pode ser explicado pelas horas de estudo. No estudo de regresso, encontramos uma reta
que melhor explica a varivel y (QI) a partir da varivel x (o nmero de horas dedicadas ao
estudo).
Vamos fazer a anlise de regresso linear para o nosso exemplo. Para isto, siga os passos a
seguir.
a) Calcule o coeficiente angular (chamado de b). Para fazer o clculo, utilize os dados da
tabela de clculos da correlao linear (pgina 2 deste material)

,
_

n
i
n
i
i
i
n
i
i
n
i
i
n
i
i i
n
x
x
n
y x
y x
b
1
2
1 2
1 1
1
Essa reta chamada de reta de regresso, que simbolicamente bx a y +
, onde:
y
a previso de valores y a partir de valores de x (previso de QI conforme o nmero
de horas que estuda)
a o coeficiente linear (tambm chamado de intercepto)
b o coeficiente angular e
x o valor da varivel que explica y (valor do nmero de horas que explica o QI)
6
b) Calcule o coeficiente linear (chamado de a).
x b y a
, onde:
y
a mdia dos valores da varivel y (no nosso exemplo, QI)
b o coeficiente angular
x a mdia dos valores da varivel x ( no nosso exemplo, horas de estudo).
c) Com os valores obtidos dos coeficientes angular e linear, escreva a reta de regresso:
bx a y +

y = __+__x.
d) Encontre os valore de
y
para o menor valor de x (36 ). Para isto, basta substituir o valor
de 36 na reta de regresso que voc obteve no item c.
e) Encontre os valores de
y
para o maior valor x (60 ).
f) Voc encontrou dois pares ordenados: (36;
y
) e (60;
y
). Coloque estes dois pontos no
grfico de disperso, que voc fez na pgina 1 desse material. Com o auxlio de uma
rgua, una estes dois pontos. Pronto! Voc encontrou a reta de regresso que modela a
relao entre o nmero de horas dedicadas ao estudo e o QI. A reta de regresso deve
passar no meio da nuvem de pontos do grfico de disperso. Verifique seu grfico!
g) Vamos analisar o coeficiente angular (b). Este coeficiente indica o quanto de uma
varivel explicada pela outra.
No nosso exemplo, a anlise : para cada hora a mais de estudo(aumento de uma unidade
na varivel x) , h uma previso de aumento de ____ pontos de QI (b unidades na
varivel y) .
Observe que se o sinal de b for negativo, a previso de diminuio na varivel QI.
h) Vamos analisar o coeficiente linear (a). Este coeficiente indica que quando a varivel x
zero, o valor previsto da varivel y o valor obtido em a.
No nosso exemplo, quando o nmero de horas de estudo zero (ou seja, quando uma
pessoa no estuda nada), a previso de QI ____ (valor obtido em a).
Veja que existem situaes prticas em que no faz sentido fazer a anlise do coeficiente
a, por exemplo, altura de uma pessoa (quando a altura de uma pessoa zero absurdo!!!)
7
i) Para saber o quanto de uma varivel explicada pela outra, vamos calcular o coeficiente
de determinao, que simbolicamente chamado de R
2
. Na correlao linear de
Pearson, para obter o coeficiente de determinao, basta elevar ao quadrado o valor do
coeficiente de correlao de Pearson.
R
2
= r
2
.100 = _______%
Com o valor obtido para o R
2
, complete a frase que usada para interpretar esse valor.
Anlise do coeficiente de determinao: ___% (valor do R
2
) da variao de QI
explicada pela variao do nmero de horas de estudo. O restante (100% menos R
2
)
explicada por outras variveis.
j) Com o uso da reta de regresso, voc pode querer estimar o valor do QI de uma pessoa a
partir do conhecimento do nmero de horas que ela estuda. Para isto, substitua o nmero
de horas que ela estudo (x ) na reta de regresso (
bx a y +

) e encontre o valor de y
(que a estimativa de QI). Vamos estimar o QI de uma pessoa que estuda 55 horas por
ms.
Para x = 55,
y
_______
4.4 Correlao e Regresso linear no Excel
Para realizar o trabalho do segundo semestre, voc j sabe que pode utilizar o Excel para fazer
os clculos parciais, ou seja, calcular mdias, varincias e desvios padro, somas,
multiplicaes, grficos, etc.. No entanto, o Excel tambm faz o clculo da correlao e da
reta de regresso. Como o objetivo da disciplina Estatstica ensinar a correlao e a
regresso, importante ressaltar que NO SERO ACEITOS TRABALHOS CUJA
CORRELAO E REGRESSO TENHAM SIDO OBTIDAS VIA FERRAMENTA
DE ANALISE DO EXCEL. Para o trabalho, voc deve fazer o grfico no Excel (Passo 9
da rotina de Excel, a seguir) e pode CONFERIR se voc calculou corretamente a
correlao e a regresso.
Em outras disciplinas do curso de Psicologia voc vai precisar utilizar a correlao e a
regresso. Da a importncia de voc aprender como calcular na ferramenta de anlise do
Excel
Para isto, siga os passos a seguir.
8
Passo 1 Montagem da tabela
Passo 2 Clculo do coeficiente de correlao de Pearson na ferramenta Anlise de Dados
do Excel. Selecione Dados, Analise de Dados, Correlao, como mostra a figura.
9
Passo 3 Selecione as duas variveis quantitativas
Passo 4 - Interpretar os resultados da correlao linear. O valor do coeficiente de correlao
linear de Pearson 0,99.
10
Passo 5 O calculo da reta de regresso ser feito a partir do grfico de disperso no Excel.
Para fazer o grfico, selecione as duas variveis quantitativas e selecione a opo inserir,
grfico, disperso (selecione a primeira opo de grfico de disperso, que tem apenas os
pontos).
Passo 6- Resultado do grfico est apresentado na tela a seguir. Veja que o Excel no coloca o
titulo dos eixos, essencial para a interpretao do grfico. Para isto, voc vai precisar arrumar
o grfico na opo design, layout de grfico, selecionar a primeira (das trs) opes. Digite
os ttulos e delete a legenda e o ttulo que o Excel coloca. Pronto, seu grfico est pronto para
publicao.
11
Passo 7 Selecione qualquer ponto do seu grfico, clicando apenas uma vez em qualquer
ponto. Veja que todos os pontos ficam marcados.
Passo 8 Clique com o boto direito do seu mouse e selecione a opo adicionar linha de
tendncia, selecionar: linear, exibir equao no grfico, exibir valor de R-quadrado no
grfico.
12
Passo 9 Resultado da equao de regresso e do coeficiente de determinao.
Observe que eu mudei a escala do eixo x (nmero de horas de estudo). Eu cliquei no eixo,
apertei o boto direito do mouse e selecionei a opo formatar eixo. Nesta tela, solicitei que o
menor valor fosse 30 e que a unidade principal (escala) fosse 3 (de 3 em 3). Este o grfico
que deve ir na publicao.

Você também pode gostar