Você está na página 1de 30

Correlação: Há um Relacionamento entre as

variáveis?
Elas vão juntas? Aumentando uma variável, então
aumenta também a outra?

Exº de variáveis
X ... Horas de estudo
Y ... Notas na Prova
Exemplo 1:
Notas vs Horas de estudo
• Variável independente é o
número de horas estudadas. Aluno Horas Nota
estudadas
• A nota do aluno é a var.
A 6 82
dependente.
• A nota do aluno depende do B 2 63
nº de horas que ele estuda? C 1 57
• Essas variáveis se relacionam?
D 5 88
E 3 68
F 2 75
Diagrama de Dispersão

• Por convenção, a variável independente é


considerada no eixo horizontal x.

• A dependente é considerada no eixo vertical y.


Exemplo de Diagrama de Dispersão

Diagrama de Dispersão: Notas vs Horas de Estudo


Horas Notas
90 88
1 57
85 82
2 63
80
2 75 75
75
3 68 70
C2

68

5 88 65 63

6 82 60 57
55

50

0 1 2 3 4 5 6
C1

C1: Horas de Estudo ; C2: Notas dos Alunos


Correlação Positiva Linear
y y y

x x x
(a) Positiva (b) Forte (c) Perfeita
positiva positiva
Correlação Negativa Linear
y y y

x x x
(d) Negative (e) Strong (f) Perfect
negative negative
Correlação Não Linear
y y

x x
(g) Nenhuma Correlação (h) Correlação Não linear
Exemplos Quanto à Intensidade do
Relacionamento
Definição:
Coeficiente Correlação Linear
r
• Mede aforça do relacionamento linear entre
valores pareados x e y na amostra
Fórmula do Coeficiente de
Correlação Linear

nSxy – (Sx)(Sy)
r=
n(Sx2) – (Sx)2 n(Sy2) – (Sy)2
Notação: Coeficiente de Correlação Linear

n número de pares de dados presentes.


S soma.
Sx soma de todos os valores de x.
S x2 indica que cada x deve ser elevado ao quadrado e então
aqueles quadrados somados.
(Sx)2 indica que x deve ser somado e o total é elevado ao quadrado.
Sxy indica que cada x deve ser primeiro multiplicadopor seu
correspondente y. Após obter todos os produtos, somamos.
r coeficiente correlação linear para a amostra
Exemplo 2: Idade vs Pressão

Aluno Age Blood Age*


age2 BP2
• Dados de idade Pressure BP
e pressão A 43 128 5504 1849 16384

sanguínea. B 48 120 5760 2304 14400

• Calculamos: x, C 56 135 7560 3136 18225


y, xy, x2 e D 61 143 8723 3721 20449
y2.
E 67 141 9447 4489 19881

F 70 152 10640 4900 23104

Soma 345 819 47634 20399 112443


Exemplo 2: Cálculo de r

• Substituímos na fórmula e resolvemos para r:


r= {(6*47634)-(345*819)}/{[(6*20399)-
3452][(6*112443)-8192]}0.5.
r= 0.897 = 0.90 aprox.

• O coeficiente de correlação sugere um


relacionamento forte positivo entre a idade e
a pressão sanguínea.
interpretação do “r”

• A correlação é 0.9
• Há um relacionamento
positivo e forte

Age
• entre idade e pressão
sanguínea Blood Pressure 0.90
Propriedades de r
–1  r  1
Sendo: r = -1 : Correlação Linear Negativa Perfeita
r = 1 : Correlação Linear Positiva Perfeita
Cuidado:
Por exemplo, para n = 2 (2 pontos), r será sempre
igual a 1 ou -1
No entanto, neste caso, a amostra é tão pequena
que não podemos tirar nenhuma conclusão
r mede a força de um relacionamento linear
Correlação

O que se pode dizer sobre a intensidade do


relacionamento entre x e y ?
A magnitude refere-se à força de associação
entre x e y. Por exemplo:
Correlação Interpretação
r = 0.00 Não há relacionamento entre x e y
r = 0.20 Baixo, relacionamento entre x e y
r = 0.40 Moderado relacianamento entre x e y
r = 0.70 Alto relacionamento entre x e y
r = 1.00 Perfeita correspondência entre x e y
Correlação
Quanto à direção da relação entre x e y ?

A direção se refere ao como os altos e baixos


valores em x e y estão associados. Por exemplo:

Positiva Negativa Nenhuma


Correlação Correlação Correlação
r = +1.0 r = -1.0 r = 0.00

y y y

x x x
Regressão
• Analisa o relacionamento entre uma
dependente variável e uma independente
variável.
• Tenta explicar o relacionamento por ajustar
uma linha (relacionamento linear).

• É estabelecida uma equação: Y = a + bx

independente
dependente
Linha de Regressão e Equação de Regressão
Variável Dependente (Y)

Regressão
equação:
Inclinação = b Y = a + b.X
Intercepto = a

Variável Independente (X)


Modelo Regressão Linear
Uma linha reta que melhor ajusta ou descreve
os dados é dada pela equação:

Y = a + bX

a = é o intercepto em Y (valor de Y quando X = 0)


b = é a inclinação da linha (taxa de mudança)

Você também pode gostar