Escolar Documentos
Profissional Documentos
Cultura Documentos
GRADUAÇÃO EM PSICOLOGIA
DISCPLINA: BIOESTATÍSTICA APLICADA A PSICOLOGIA
AULA 04 – CORRELAÇÃO E
REGRESSÃO
VARIÁVEIS PROPORCIONAIS
CORRELAÇÃO E
pessaP
REGRESSÃO LINEAR
Prof. Paulo W.P. Antunes
INTRODUÇÃO
•Existem situações nas quais há interesse em estudar o comportamento conjunto de uma ou
mais variáveis;
•Em muitos casos, a explicação de um fenômeno de interesse pode estar associado a outros
fatores (variáveis) que contribuem de algum modo para a ocorrência deste fenômeno.
•O comportamento conjunto de duas variáveis quantitativas pode ser observado por meio do
gráfico de dispersão.
ATENÇÃO!!!!
Correlação não implica
relação de causa-efeito
INTRODUÇÃO
• DIAGRAMA DE DISPERSÃO: eixo cartesiano com as variáveis quantitativas consideradas.
CORRELAÇÃO E REGRESSÃO
CORRELAÇÃO
Grau de relacionamento entre
duas variáveis.
R2 = 0,5937
REGRESSÃO
Equação matemática que descreve o
relacionamento entre variáveis.
y = 0,6033x – 41,714
CORRELAÇÃO
x
CORRELAÇÃO
•Uma medida do grau e do sinal da correlação linear entre duas variáveis (X,Y) é dado
pelo Coeficiente de Correlação Linear de Pearson, definido por:
• POSITIVO:
VARIÁVEIS DIRETAMENTE
PROPORCIONAIS
• NEGATIVO
VARIÁVEIS INVERSAMENTE
PROPORCIONAIS
EXEMPLO:
CORRELAÇÃO
A tabela abaixo apresenta os preços médios das ações e títulos divulgados pela Bolsa
de Nova York entre 1950 e 1959. Calcule o coeficiente de correlação de Pearson e
interprete o resultado.
ANO AÇÕES (X) TÍTULOS (Y) X.Y X2 Y2
1.950 35,22 102,43 3.607,58 1.240,45 10.491,90
1.951 39,87 100,43 4.004,14 1.589,62 10.086,18
1.952 41,85 97,43 4.077,45 1.751,42 9.492,60
1.953 43,23 97,81 4.228,33 1.868,83 9.566,80
1.954 40,06 98,32 3.938,70 1.604,80 9.666,82
1.955 53,29 100,07 5.332,73 2.839,82 10.014,00
1.956 54,14 97,08 5.255,91 2.931,14 9.424,53
1.957 49,12 91,59 4.498,90 2.412,77 8.388,73
1.958 40,71 94,85 3.861,34 1.657,30 8.996,52
1.959 55,15 94,65 5.219,95 3.041,52 8.958,62
∑ 452,64 974,66 44.025,03 20.937,69 95.086,72
-919,77
r= = -0,4561
2.016,75
AGORA É COM VOCÊS......
CORRELAÇÃO
Existe correlação entre o número de faltas e a nota final? De que forma?
= EQUAÇÃO DE REGRESSÃO
VARIÁVEL DEPENDENTE
REGRESSÃO
• O modelo em que busca explicar uma variável Y como uma função linear de
apenas uma variável X é denominado de modelo de regressão linear simples.
DADOS DA REGRESSÃO:
Tipo: Linear
Equação: y1 = α + βx1 + ξ1
Coef. de Correl. de Pearson (r): 0,9993
Coef. de Determinação: (r2): 0,9985
β = coef. angular = 0,067
α = interseção com eixo y = 185
ξ1 = erro aleatório = 63
REGRESSÃO LINEAR
DETERMINAÇÃO DOS PARÂMETROS DA EQUAÇÃO: y1 = α + βx1 + ξ1
α = valor de x1 quando y1 = 0.
REGRESSÃO LINEAR
DETERMINAÇÃO DOS PARÂMETROS DA EQUAÇÃO: y1 = α + βx1 + ξ1
tg β
tg β
β
β
REGRESSÃO
DETERMINAÇÃO DOS PARÂMETROS DA EQUAÇÃO: y1 = α + βx1 + ξ1
A diferença entre os valores observados e os preditos
ξ1 – ERROA ALEATÓRIO
é denominado resíduo do modelo de regressão
REGRESSÃO
DETERMINAÇÃO DOS PARÂMETROS DA EQUAÇÃO: y1 = α + βx1 + ξ1
R2 – COEFICIENTE DE DETERMINAÇÃO
Determinação da medida descritiva da proporção da variação de Y que pode ser explicada por
variações em X, segundo o modelo de regressão especificado.
0 ≤ R2 ≤ 1
Sempre positiva
+ próximo de 1 → ↑ grau de
explicação
EX01. Assinale cada afirmação a seguir como verdadeira (V) ou falsa (F).
a) Antes de calcularmos um coeficiente de correlação, precisamos construir o gráfico da dispersão entre X
e Y para observarmos se a relação entre as variáveis pode ser considerada linear.
b) Para calcularmos o coeficiente de correlação entre X e Y, essas variáveis precisam ser previamente
transformadas para uma mesma unidade de me-dida.
c) O gráfico de dispersão entre X e Y serve também para observarmos se há valores atípicos na relação
entre essas variáveis. Valores atípicos podem influenciar o valor do coeficiente de correlação.
d) Podemos calcular um coeficiente de correlação entre uma variável qualitativa, como o sexo (masculino
e feminino) e uma variável quantitativa, como a circunferência da cintura, em centímetros.
e) Em uma pesquisa, o coeficiente de correlação de Pearson entre o índice de massa corporal (IMC) e o
HDL é –0,428. Concluímos, então, que o IMC elevado causa uma redução no valor do HDL, dado que o
coeficiente é menor que zero.
f) A covariância entre as variáveis X e Y pode assumir valores negativos.
EX01. Assinale cada afirmação a seguir como VERDADEIRA (V) ou FALSA (F).
a) Antes de calcularmos um coeficiente de correlação, precisamos construir o gráfico da dispersão entre
X e Y para observarmos se a relação entre as variáveis pode ser considerada linear.
b) Para calcularmos o coeficiente de correlação entre X e Y, essas variáveis precisam ser previamente
transformadas para uma mesma unidade de medida.
c) O gráfico de dispersão entre X e Y serve também para observarmos se há valores atípicos na relação
entre essas variáveis. Valores atípicos podem influenciar o valor do coeficiente de correlação.
d) Podemos calcular um coeficiente de correlação entre uma variável qualitativa, como o sexo
(masculino e feminino) e uma variável quantitativa, como a circunferência da cintura, em centímetros.
e) Em uma pesquisa, o coeficiente de correlação de Pearson entre o índice de massa corporal (IMC) e o
HDL é –0,428. Concluímos, então, que o IMC elevado causa uma redução no valor do HDL, dado que o
coeficiente é menor que zero.
f) A covariância entre as variáveis X e Y pode assumir valores negativos.
EX02. Os dados a seguir referem-se ao peso ao nascer de 16 crianças (em gramas) e a idade da mãe, em
anos completos.
Sendo as variáveis X e Y, respectivamente, a idade da mãe e o peso ao nascer, temos média x = 24,875
anos, média y = 1.05,625 g, sX = 6,407 anos, sY = 273,82 e ∑nn+1 xiyi= 649,255.
a) Esboce um gráfico de dispersão entre as variáveis X e Y.
b) Encontre o coeficiente de correlação de Pearson entre X e Y.
c) Escreva uma interpretação para o coeficiente encontrado no item anterior.
EX02. a) Dispersão entre as variáveis X e Y.
3.000
2.500
Peso ao nascer (g)
2.000
1.500
1.000
500
0
0 5 10 15 20 25 30 35 40
Idade materna (anos)
EX02. b) coeficiente de correlação de Pearson entre X e Y.
r = 0,5858
EX02. c) Escreva uma interpretação para o coeficiente encontrado no item anterior.
r = 0,5858
EX03. Quantidade de procaína hidrolisada, em 10 moles/litro, no plasma humano, em função do tempo
decorrido após sua administração.
a) Existe uma relação linear entre a quantidade de procaína e o tempo decorrido após sua administração?
Qual o grau dessa relação?
b) Determine a reta de regressão que explica a quantidade de procaína em função do tempo. Calcule o
coeficiente de determinação do modelo.
c) Qual a quantidade de procaína hidrolisada após 6 minutos de sua administração? E após 13 minutos?
d) Calcule o erro de estimação para cada valor de X.
EX03.
35
30
25
20
Tempo
15
10
5
0
0 2 4 6 8 10 12 14 16
y = 2,1606x - 0,985 R² = 0,9939 Procaína Hidrolisada
EX04 A tabela abaixo apresenta os preços médios das ações e títulos divulgados pela Bolsa de Nova York
entre 1950 e 1959.
a) Calcule o coeficiente de correlação de Pearson e
interprete o resultado.
b) Determine a reta de regressão que explique os títulos
divulgados em função do preço médio das ações. Calcule
o coeficiente de determinação do modelo.
c) Qual o número de títulos divulgados para um preço
médio da ação de 45,00? E para um preço médio de
50,00?
EX05. Considere um experimento em que se analisa a octanagem da gasolina (Y) em função da adição de
um novo aditivo (X). Para isso, foram realizados ensaios com os percentuais de 1, 2, 3, 4, 5 e 6% de
aditivo. Os resultados são mostrados no gráfico de dispersão.
.
a) Existe uma relação linear entre a adição de um novo
aditivo e a octanagem da gasolina? Qual o grau dessa
relação?
b) Determine a reta de regressão que explica a octanagem
da gasolina em função da adição do novo aditivo. Calcule
o coeficiente de determinação do modelo.
c) Se adicionarmos 5,5% de aditivo, qual o índice de
octanagem esperado?