Você está na página 1de 8

Disciplina de Estatstica 2012/2

Professora Ms. Valria Espndola Lessa

REGRESSO E CORRELAO
1. INTRODUO
A regresso e a correlao so duas tcnicas estreitamente relacionadas que envolvem
uma forma de estimao. Mais especificamente, a anlise de correlao e regresso
compreende a anlise de dados amostrais para saber se e como duas ou mais variveis esto
relacionadas uma com a outra.
A correlao mede o grau, ou fora, de relacionamento de duas variveis.
A regresso d uma equao que descreve o relacionamento em termos matemticos.
2. DIAGRAMA DE DISPERSO
Primeiramente precisamos visualizar atravs de um grfico se as variveis em questo
demonstram algum tipo de relacionamento. Construmos ento o Diagrama de disperso.
Diagrama de disperso simplesmente uma representao de pontos de dados em
um grfico xy. O eixo y utilizado para representar a varivel dependente que interessa a
quem toma as decises, enquanto o eixo x para representar uma varivel que pode ser
controlada ou medida por quem toma a deciso.
Exemplo 1: A tabela abaixo nos fornece o valor investido em propaganda (em R$) e
valores de venda (em R$) numa semana, que imagino estarem relacionadas de alguma
forma. Neste caso a varivel independente valor em propaganda, pois, as vendas
dependem das propagandas realizadas.
Propaganda
(em R$)
5
6
9
10
12
14
16
22
28
32

Vendas (em
R$)
80
70
80
90
95
140
140
230
250
280

O diagrama nos sugere que pode existir uma relao entre as vendas e os custos de
propaganda. Em particular ele sugere que, quanto mais dinheiro for gasto em propaganda,
maior ser o valor das vendas (propaganda a varivel independente e a venda a varivel
dependente). O padro dos pontos forma aproximadamente uma linha reta, sugerindo que
possvel que exista uma associao linear entre as duas variveis.

3. COEFICIENTE DE CORRELAO DE PEARSEN


Nosso prximo passo ser medir a fora desse relacionamento entre as variveis
atravs do coeficiente de correlao de Pearsen. Esse coeficiente resulta sempre em um valor
entre 1 e 1 e sua interpretao depende do seu valor numrico e do seu sinal. Quanto mais
prximo de 1 e 1, mais forte o grau de relao linear existente entre X e Y e, quanto mais
prximo de 0, mais fraco o grau desta relao. Uma correlao linear negativa indica que
quando o valor de uma varivel aumenta, o valor da outra diminui (decrescente) e, uma
correlao linear positiva, indica que quando o valor de uma varivel aumenta, o valor da
outra tambm aumenta (crescente).
Para uma amostra de tamanho n, o coeficiente calculado por:

n x. y x y

n x

No Excel:
1) Digitar a tabela
2) Digitar numa clula qualquer

x . n y2 y
2

=CORREL(coluna x; coluna y)

enter.

Assim:
Valores prximos de +1 sugerem forte associao positiva entre as variveis.
(se aproxima de uma reta crescente)
Valores prximos de -1 sugerem forte associao negativa entre as variveis.
(se aproxima de uma reta decrescente)
Valores prximos a 0 sugerem possivelmente nenhuma correlao entre as
variveis uma no depende da outra. (no se aproxima de uma reta).

Calculando o coeficiente de correlao do Exemplo 1:


1) organizar a tabela com colulas x, y, xy, x 2 e y2
2) Aplicar a frmula.
Propaga
nda
x
5
6
9
10
12
14
16
22
28
32
154

Vend
as
y
80
70
80
90
95
140
140
230
250
280
1455

n x.y x y

r
x2
25
36
81
100
144
196
256
484
784
102
8960
4
288 313
00
0
xy
400
420
720
900
1140
1960
2240
5060
7000

y2
6400
4900
6400
8100
9025
19600
19600
52900
62500

n x

x . n y2 y
2

10 28800 154 1455

10 3130 154 10 267825 1455


2

63930
63930
63930

0,98
7584 561225
4256330400 65240,56

Portanto, h uma forte associao


positiva entre as variveis

78400
2678
25

Exemplo 2 : Verifique se existe correlao e encontre o valor de r dos dados da tabela:


Investimento
(R$)
1,00
1,50
2,30
3,50
4,00
5,00
Soluo:
1) Construir o diagrama,
X investimento
Y - Lucro

Lucro
(R$)
5,00
6,10
6,30
7,00
8,10
8,50

2) Organizar a tabela com os valores da


frmula:
Inves Lucr
tio
ment
o
X
Y
XY
X2
1
5
5
1
1,5
6,1
9,15 2,25
2,3
6,3 14,49 5,29
3,5
7
12,2
24,5
5
4
8,1
32,4
16
5
8,5
42,5
25
128,0 61,7
17,3
41
4
9

Y2
25
37,21
39,69
49
65,61
72,25
288,7
6

3) Aplicar a frmula
Somente visualizando o grfico conclumos que existe correlao, verifiquemos agora a
intensidade, encontrando o r.

6 128,04 17,3 41
r forte relao entre as variveis.
0,97
Conclumos que existe
2
2
6 61,79 17,3 . 6 288,76 41
Do que foi apresentado, podemos observar que o coeficiente de correlao de Pearson
uma ferramenta til para a investigao de relao linear entre duas variveis
quantitativas. A ausncia de relao linear, quando indicada por este coeficiente, no implica
na ausncia de relao entre elas. Outro tipo de relao pode estar presente, como, por
exemplo, a no-linear (curvas, parbolas...).

4. REGRESSO
Depois de concludo que existe uma correlao entre os dados, podemos encontrar uma
frmula que os descreve para prever valores futuros, a regresso.
No caso dos dados estarem distribudos linearmente (reta), cuja frmula geral
y=
a.x + b precisamos encontrar os valores de a e b, sendo:
a = inclinao da reta (funo INCLINAO)
b = o valor que intercepta o eixo y (funo INTERCEPTAO)
Para calcular os valores dos parmetros a e b utilizamos as frmulas:

n x.y x. y
2
n x2 x

A tabela j fornece
os dados

b y ax

preciso calcular a
mdia da coluna x e
y.

onde :
x mdia dos valores de x
y mdia dos valores de y

Reta de Regresso Linear do Exemplo 1:

n x.y x. y 63930

8,4296
2
7584
n x2 x
b 145,5 8,4296 15,4 15,684
a

y ax b
y 8,4296 x 15,684

Reta de Regresso Linear do Exemplo 2:

n x.y x. y 58,94

0,8249
2
71,45
n x2 x
b 6,83 0,8249 2,88 4,4543
a

y ax b
y 0,823 x 4,454

Se quisemos descobrir o valor do lucro se o investimento for x = 10,50, substitui o valor


de x na funo e encontro y que representa o lucro, ou seja,
Y = 0,825 . 10,50 + 4,46
Y = 13,12

5. EXERCCIOS
Importante: Nos exerccios voc pode utilizar os recursos do Excel para facilitar e
verificar os clculos, porm importante que voc aprenda a fazer os clculos com as
frmulas.
1) Nas tabelas abaixo verifique a correlao entre as variveis x e y construindo o diagrama
de disperso.
a)

b)
X 2
Y 5

3
6,
5

4
7

5
7,
9

6
8,
9

X 5 1
0
Y 5 1
2

c)

1
4
1
5

1
5
1
7

1
9
2
0

d)
X
Y

4 6 8 10 12
10 3 12 5
7

X 1

Y 2
0

1
7

1
0
1
4

1
5
1
1

2 25 30
0
8
5
2

2) Um grupo de pessoas fez uma avaliao de peso aparente de alguns objetos. Com o peso
real e a mdia dos pesos aparentes, dados pelo grupo, obteve-se a tabela:
Peso Real
Peso
Aparente

1
8
1
0

3
0
2
3

4
2
3
3

6
2
6
0

7
3
9
1

9
7
9
8

12
0
15
9

Calcule o ndice (coeficiente)de correlao.


3) A tabela abaixo apresenta valores que mostram como o comprimento de uma barra de ao
varia conforme a temperatura, encontre o coeficiente de correlao:
Temperatura C 10

15

20

25

30

Comprimento
(mm)

100 100 101 101 101


3
5
0
1
4
Resp. 0,98

4) Considere os resultados de dois


X 1
1
Y 1
3

testes,
1 1
4 9
1 1
4 8

X e Y,
1 2
9 2
1 2
5 2

obtidos por um grupo de alunos da escola A:


2 3 3 3 3
8 0 1 4 7
1 2 2 2 2
7 4 2 4 5

a) Verifique, pelo diagrama, se existe correlao retilnea.


b) Em caso afirmativo, calcule o coeficiente de correlao.
Resp: 0,89
5) Encontre a reta de regresso linear dos trs exerccios anteriores, usando as frmulas.
Depois faa o grfico da disperso com a reta de regresso no Excel.

6) Para o exerccio (3) calcule:


a) o valor estimado do comprimento da barra para a temperatura de 18C.
Resp. 1007,5 mm
b) o valor estimado do comprimento da barra para a temperatura de 35C.
Resp. 1017 mm
7) Verifique se possvel encontrar uma equao que descreva aproximadamente bem os
dados da tabela abaixo. Se sim, encontre essa equao.
X 1 2 3 4 5
Y 7 5 4 2 1
8) O lucro mensal de certa empresa varia com o investimento em propaganda. A funo que
representa essa relao
Lucro = 6,2 . Investimento + 170, ou seja, y = 6,2.x+170. Calcule:
a) o lucro obtido para um investimento de R$ 100,00.
Resp: R$
790,00
b) se a meta da empresa lucrar R$ 2.000,00 no ms, quanto dever investir?
Resp: R$ 295,16

9) A tabela abaixo apresenta os custos (Reais por hora) de manuteno de mquinas


conforme sua idade (meses). Determinar a reta dos custos sobre a idade e fazer uma previso
de custo para uma mquina de 45 meses.
Resp. y = 0,4x + 8,4, R$ 26,40 por hora
Idade
(meses)
Custos

15

24

33

42

9, 16, 19, 19, 26,


7
5
3
2
9

10) A partir da tabela:

X 1
Y 7
0

2
5
0

3
4
0

4
3
0

5
2
0

a) calcule o
Resp: -0,99
b) determine a reta ajustada.
-11,4.X+76,6
c) estime o valor de Y para X = 0.

6
1
0

coeficiente de correlao,
Resp: Y =
Resp: 76,6

11) Certa empresa, estudando a variao da demanda de seu produto em relao variao
de preo de venda, obteve a tabela:
Preo (X)
Demanda
(Y)

38 42 50 56 59 63 70 80 95 11
0
35 32 29 27 25 24 23 22 21 20
0
5
7
0
6
6
8
3
5
8

a) Determine o coeficiente da correlao.


b) Estabelea a equao da reta ajustada.
+ 386,8
c) Estime Y para X = 60 e X = 120.
162,4

Resp. - 0,90
Resp. y = -1,87x
Resp. 274,6 e