6.1 – INTRODUÇÃO
Correlação e regressão são duas técnicas estreitamente relacionadas que envolvem uma
forma de estimação. A diferença entre essas duas técnicas e o tipo de estimação, estudados
anteriormente, é que as anteriores foram utilizadas para estimar um único parâmetro, enquanto as
técnicas apresentadas agora se referem a estimação de uma relação que possa existir na
população.
A análise de correlação dá um número que resume o grau de relacionamento entre duas
variáveis e, a análise de regressão tem como resultado uma equação matemática que descreve o
relacionamento entre elas. Esta equação é utilizada para estimar ou predizer valores futuros de
uma variável quando se conhece os valores da outra variável. A análise de correlação é útil em
trabalhos exploratórios, ou quando um pesquisador procura determinar quais variáveis são
potencialmente importantes, sendo que o interesse está no grau ou força do relacionamento. Esta
técnica é utilizada quando não há dependência funcional entre as variáveis, embora possam ser
correlacionadas.
Existem situações nas quais interessa estudar o comportamento conjunto de duas
variáveis. Por exemplo, dados de peso e altura de pessoas. Pode haver interesse em estabelecer
em que medida aumenta o peso, quando a altura aumenta. O comportamento conjunto de duas
variáveis quantitativas pode ser observado graficamente através do Diagrama de Dispersão, e
numericamente através do Coeficiente de Correlação.
O termo CORRELAÇÃO significa até que ponto duas variáveis estão correlacionadas entre si.
7.2 – CORRELAÇÃO
Y Y Y
X X X
O coeficiente de correlação tem como objetivo mensurar o grau de correlação entre duas
variáveis. É definido como:
X Y
XY
n
r Corr(X, Y) , 1 Corr(X, Y) 1
X
2
X
2
. Y
2
Y
2
n
n
Reta de Regressão: Para ajustar uma reta de regressão linear simples aos dados é preciso obter
os coeficientes angular e linear da reta.
X Y
XY
n
Coeficiente Angular (b) – dá a inclinação da reta: b
X 2
X2 n
Coeficiente Linear (a) – é a ordenada do ponto em que a reta corta o eixo das ordenadas.
a Y bX
Reta de Regressão: Ŷ a bX
Exemplo:
Suponha que 5 empresas de seguro de automóveis realizem um estudo para verificar a relação
existente entre o tempo de mercado e a quantidade de clientes atendidos. Sejam as variáveis:
X = número de anos de atendimento ao público e Y = número de clientes atendidos.
Após o levantamento dos dados os resultados abaixo foram observados. Aplique as técnicas de
correlação e regressão para verificar se há algum tipo de relação existente entre as variáveis
estudadas. Analise os resultados e faça previsões para 7 e 10 anos de mercado.
X Y X.Y X2 Y2 80
Número de Clientes
2 48 96 4 2304 60
4 56 224 16 3136
40
5 64 320 25 4096
6 60 360 36 3600 20
8 72 576 64 5184 0
25 300 1576 145 18320 0 2 4 6 8 10
Anos de Atendimento
Reta de Regressão:
X Y
1576
(25)(300 )
XY
n 5 3,8
b
X 2
145
( 25 ) 2
Reta de Regressão Estimada:
X2 n 5
Ŷ a bX 41 (3,8 ).X
a Y bX 60 (3,8).(5) 41
Nos exercícios a seguir verifique o comportamento conjunto das variáveis, de forma gráfica e
numérica e ajuste a reta de regressão de modo que se torne possível à realização de previsões
futuras. Para alcançar esse objetivo determine as medidas abaixo e analise os resultados obtidos.
a) Diagrama de Dispersão; d) Ajuste da Reta de Regressão;
b) Coeficiente de Correlação; e) Previsões;
c) Coeficiente de Determinação;
1. Os dados a seguir referem-se ao peso seco e ao peso úmido, em gramas, de glóbulos hepáticos
observados em uma amostra de ratos.
Peso Seco (X) Peso Úmido (Y)
2,0 6,7
2,2 7,7
2,0 6,5
2,2 7,4
1,9 6,1
2,3 7,4