Escolar Documentos
Profissional Documentos
Cultura Documentos
Ficha de Correlação e Regressão
Ficha de Correlação e Regressão
1. Introdução
Por vezes certos fenómenos em estudo não se descrevem apenas através de uma variável,
sendo necessária a observação de duas (ou mais) variáveis para se ter uma visão global
do problema. Quando tal ocorre, cada unidade estatística contribui com um conjunto de
dois valores (ou variáveis) passando a trabalhar-se com dados bivariados (os
anteriormente estudados eram univariados).
11-08-2022 1
4. Diagrama de dispersão ou nuvem de pontos
É uma representação gráfica para os dados bivariados, em que num sistema de eixos
cartesianos marcamos os valores xi e yi nos respectivos eixos e obtemos a representação
dos pontos correspondentes aos pares ordenados (xi,yi).
Através dos diagramas podemos ter uma ideia de tipo de relação entre variáveis
estudadas.
X 18 20 21 21 22 23 23 23 24 25 25 26 26 26 28 28
Y 17 20 20 22 22 21 22 23 23 24 25 23 25 27 26 27
Este diagrama, de forma intuitiva, permite-nos concluir que talvez exista uma correlação
(linear) entre as duas variáveis em estudo.
Exemplo 3: através dos gráficos seguintes pode concluir-se que existe uma,
5.1 Correlação
A correlação é uma unidade estatística que mostra o grau de relacionamento (associação)
entre as variáveis.
Quando o coeficiente de correlação for calculado para duas variáveis dizemos que a
correlação é simples e quando é calculado para mais de duas variáveis dizemos que a
correlação é múltipla.
Nesta definição está implícita a definição de uma medida que dá uma ideia da
variabilidade conjunta entre as variáveis e que se denomina covariância amostral:
11-08-2022 3
1 n
xy xi x yi y
n 1 i 1
Deste modo podemos rescrever o coeficiente de correlação como:
xy xy
rxy
x2 y2 x . y
-0,5
Correlação linear negativa (forte)
11-08-2022 4
6 Regressão
A regressão tem por objectivo descrever através de um modelo matemática a relação
entre duas ou mais variáveis escrevendo a equação desse relacionamento.
O modelo geral de equação de regressão linear entre duas variáveis tem a seguinte forma:
y f ( x) ou y a bx ou y x
a é o ponto de intersecção com o eixo oy, ele mede ou caracteriza o nível médio do
índice do resultado y quando a variável de causa x é igual a zero, isto é, se x = 0 implica
que y = b.
Um dos métodos usados para ajustar uma recta a um conjunto de dados, é o método dos
mínimos quadrados que consiste em determinar a recta que minimiza a soma dos
quadrados dos desvios (erros ou resíduos) entre os verdadeiros valores das ordenadas y e
os obtidos a partir da recta, que se pretende ajustar:
yi ŷi = axi +b
ei
ŷi
xi
O modelo matemático que expressa a relação linear é a recta de regressão ŷi = axi +b,
obtida de tal modo que os desvios ou resíduos (ei = yi - ŷi) quadráticos das observações
em relação à recta sejam mínimos (MMQ).
11-08-2022 5
n 2 n 2
min yi yˆ i min yi b xi
i 1 i 1
2. Cálculo de a e de b
a Y bX a Y bX
n n n
n X iYi Yi X i Y
b i 1 i 1 i 1 b rxy
n
n
2
x
n X i
2
Xi
i 1 i 1
Ou
n n
i y nb a xi
i 1 i 1
n n n
i 1
x y
i i b
i 1
x i a
i 1
xi2
Altura(cm) 155 160 180 135 165 168 178 160 132 145 139 152
Peso (Kg) 70 63 72 60 66 70 74 65 62 67 67 68
11-08-2022 6
Analisemos estas duas variáveis através de um diagrama de dispersão e do coeficiente de
correlação linear:
Diagrama de Dispersao
100
80
Peso (kg)
60
40
20
0
100 110 120 130 140 150 160 170 180 190
Altura (cm)
802 1850
a y bx 0,231733 31,10778
12 12
11-08-2022 7
Graficamente, podemos ver esta recta ajustada à nuvem de pontos:
R e c ta d e r e g r e s s ã o
100
90
80
70
Peso(Kg)
60
50
40
30
20
10
0
Altu r a (c m )
Exercícios
Amostra 2:
X 10 8 13 9 11 14 6 4 12 7 5
11-08-2022 8
Y 9.14 8.14 8.75 8.77 9.26 8.10 6.13 3.10 9.13 7.26 7.74
3. Considera os dados bivariados, (- 0.2, 0.96); (0.2, 1.14); (0.4, 1.56); (0.6, 1.74); (0.7,
1.96); (0.8, 2.04).
a) Represente os dados através de um diagrama de dispersão;
b) Ajuste a recta de regressão aos dados;
c) Calcule o coeficiente de correlação e comente a qualidade do ajustamento
anterior.
Densidade (Veic./km) 43 55 40 52 39 33 50 33 44 21
Velocidade (Km/h) 27 23 31 24 35 41 27 40 32 51
x i 160 ; x 2
i 2874; x y i i 3496; y i 198; y 2
i 4324
11-08-2022 9
Sabendo que um dos valores observados para a variável x foi 333 diga, justificando, se é
possível obter uma estimativa do correspondente valor de y.
7. Diga, justificando, qual dos valores abaixo indicados se aproxima mais do coeficiente
de correlação dos dados descritos nas seguintes nuvens de pontos:
.
y . y . . .
. . . .
. . ..
. . ..
. .
x x
. . . . a) 0
y .. .. . . ..
. . .. . . b) 1
.. .. . . c) – 0.5
. .. . d) 2
. . .. .
x
11-08-2022 10