Você está na página 1de 33

MULTIVIX – CAMPUS VILA VELHA

GRADUAÇÃO EM PSICOLOGIA
DISCPLINA: BIOESTATÍSTICA APLICADA A PSICOLOGIA

AULA 04 – CORRELAÇÃO E
REGRESSÃO
VARIÁVEIS PROPORCIONAIS

Prof. Paulo W.P. Antunes


MULTIVIX – CAMPUS VILA VELHA
GRADUAÇÃO EM FISIOTERAPIA
DISCPLINA: MATEMÁTICA E BIOESTATÍSTICA

CORRELAÇÃO E
pessaP

REGRESSÃO LINEAR
Prof. Paulo W.P. Antunes
INTRODUÇÃO
•Existem situações nas quais há interesse em estudar o comportamento conjunto de uma ou
mais variáveis;

•Em muitos casos, a explicação de um fenômeno de interesse pode estar associado a outros
fatores (variáveis) que contribuem de algum modo para a ocorrência deste fenômeno.

•O comportamento conjunto de duas variáveis quantitativas pode ser observado por meio do
gráfico de dispersão.

ATENÇÃO!!!!
Correlação não implica
relação de causa-efeito
INTRODUÇÃO
• DIAGRAMA DE DISPERSÃO: eixo cartesiano com as variáveis quantitativas consideradas.
CORRELAÇÃO E REGRESSÃO
CORRELAÇÃO
Grau de relacionamento entre
duas variáveis.
R2 = 0,5937

REGRESSÃO
Equação matemática que descreve o
relacionamento entre variáveis.
y = 0,6033x – 41,714
CORRELAÇÃO

x
CORRELAÇÃO
•Uma medida do grau e do sinal da correlação linear entre duas variáveis (X,Y) é dado
pelo Coeficiente de Correlação Linear de Pearson, definido por:

• O valor de “r” estará sempre no intervalo de -1 a 1.


CORRELAÇÃO
CORRELAÇÃO
• COEFICIENTE É ADIMENSIONAL
INDEPENDE DAS UNIDADES DE
MEDIDAS DAS VARIÁVEIS

• POSITIVO:

VARIÁVEIS DIRETAMENTE
PROPORCIONAIS

• NEGATIVO

VARIÁVEIS INVERSAMENTE
PROPORCIONAIS
EXEMPLO:
CORRELAÇÃO
A tabela abaixo apresenta os preços médios das ações e títulos divulgados pela Bolsa
de Nova York entre 1950 e 1959. Calcule o coeficiente de correlação de Pearson e
interprete o resultado.
ANO AÇÕES (X) TÍTULOS (Y) X.Y X2 Y2
1.950 35,22 102,43 3.607,58 1.240,45 10.491,90
1.951 39,87 100,43 4.004,14 1.589,62 10.086,18
1.952 41,85 97,43 4.077,45 1.751,42 9.492,60
1.953 43,23 97,81 4.228,33 1.868,83 9.566,80
1.954 40,06 98,32 3.938,70 1.604,80 9.666,82
1.955 53,29 100,07 5.332,73 2.839,82 10.014,00
1.956 54,14 97,08 5.255,91 2.931,14 9.424,53
1.957 49,12 91,59 4.498,90 2.412,77 8.388,73
1.958 40,71 94,85 3.861,34 1.657,30 8.996,52
1.959 55,15 94,65 5.219,95 3.041,52 8.958,62
∑ 452,64 974,66 44.025,03 20.937,69 95.086,72

r= 10 x 44.025,03 – (452,64 x 974,66)


√(10 x 20.937,69 – (452,64)2) . √(10 x 95,086,72 – (974,66)2)

-919,77
r= = -0,4561
2.016,75
AGORA É COM VOCÊS......
CORRELAÇÃO
Existe correlação entre o número de faltas e a nota final? De que forma?

FALTAS (X) NOTAS (Y)


8 78
2 92
5 90
12 58
15 43
9 74
6 81
n FALTAS (X) NOTAS (Y) X.Y X2 Y2
1 8 78 624 64 6.084
2 2 92 184 4 8.464
3 5 90 450 25 8.100
4 12 58 696 144 3.364 r = - 0,9748
5 15 43 645 225 1.849
6 9 74 666 81 5.476
7 6 81 486 36 6.561
∑ 57 516 3.751 579 39.898
REGRESSÃO
• ANALISE DOS DADOS: sugere existência de relação funcional entre as variáveis

PROBLEMA: Qual a função matemática que expressa essa relação?

= EQUAÇÃO DE REGRESSÃO

• Função que explica grande parte da variação de Y por X.

• Parcela da variabilidade de Y não explicada por X é atribuída ao acaso (erro aleatório)

VARIÁVEL EXPLANATÓRIA OU INDEPENDENTE

VARIÁVEL DEPENDENTE
REGRESSÃO
• O modelo em que busca explicar uma variável Y como uma função linear de
apenas uma variável X é denominado de modelo de regressão linear simples.

Variável independente, X Variável dependente, Y


Número de sessões de fisioterapia Renda (R$)
Renda (R$) Consumo (R$)
Número de questões erradas Nota da prova
Taxa de isolamento social Infectados por COVID-19
Infectados por COVID-19 Mortos por COVID-19
REGRESSÃO
REGRESSÃO

Regressão Linear Simples Regressão Exponencial Regressão polinomial


(não linear) (não linear)
EXEMPLO:
REGRESSÃO LINEAR
Relação entre o número de casos confirmados pela COVID-19 e o número de óbitos.

DATA N° DE SEMANAS n CASOS CONFIRMADOS ÓBITOS CONFIRMADOS


03/05/2020 67 1 101.147 7.025
04/05/2020 68 2 107.708 7.321
05/05/2020 69 3 114.715 7.921
06/05/2020 70 4 125.218 8.536
07/05/2020 71 5 135.106 9.146
08/05/2020 72 6 145.328 9.897
09/05/2020 73 7 155.939 10.627
10/05/2020 74 8 162.699 11.123
REGRESSÃO LINEAR

DADOS DA REGRESSÃO:
Tipo: Linear
Equação: y1 = α + βx1 + ξ1
Coef. de Correl. de Pearson (r): 0,9993
Coef. de Determinação: (r2): 0,9985
β = coef. angular = 0,067
α = interseção com eixo y = 185
ξ1 = erro aleatório = 63
REGRESSÃO LINEAR
DETERMINAÇÃO DOS PARÂMETROS DA EQUAÇÃO: y1 = α + βx1 + ξ1

α – Coeficiente linear (interseção com eixo y)

α = valor de x1 quando y1 = 0.
REGRESSÃO LINEAR
DETERMINAÇÃO DOS PARÂMETROS DA EQUAÇÃO: y1 = α + βx1 + ξ1

β – Coeficiente angular (inclinação da reta)

tg β

tg β
β

β
REGRESSÃO
DETERMINAÇÃO DOS PARÂMETROS DA EQUAÇÃO: y1 = α + βx1 + ξ1
A diferença entre os valores observados e os preditos
ξ1 – ERROA ALEATÓRIO
é denominado resíduo do modelo de regressão
REGRESSÃO
DETERMINAÇÃO DOS PARÂMETROS DA EQUAÇÃO: y1 = α + βx1 + ξ1
R2 – COEFICIENTE DE DETERMINAÇÃO
Determinação da medida descritiva da proporção da variação de Y que pode ser explicada por
variações em X, segundo o modelo de regressão especificado.

0 ≤ R2 ≤ 1

R2 = (coeficiente de correlação de Pearson) 2

Sempre positiva

+ próximo de 1 → ↑ grau de
explicação
EX01. Assinale cada afirmação a seguir como verdadeira (V) ou falsa (F).
a) Antes de calcularmos um coeficiente de correlação, precisamos construir o gráfico da dispersão entre X
e Y para observarmos se a relação entre as variáveis pode ser considerada linear.
b) Para calcularmos o coeficiente de correlação entre X e Y, essas variáveis precisam ser previamente
transformadas para uma mesma unidade de me-dida.
c) O gráfico de dispersão entre X e Y serve também para observarmos se há valores atípicos na relação
entre essas variáveis. Valores atípicos podem influenciar o valor do coeficiente de correlação.
d) Podemos calcular um coeficiente de correlação entre uma variável qualitativa, como o sexo (masculino
e feminino) e uma variável quantitativa, como a circunferência da cintura, em centímetros.
e) Em uma pesquisa, o coeficiente de correlação de Pearson entre o índice de massa corporal (IMC) e o
HDL é –0,428. Concluímos, então, que o IMC elevado causa uma redução no valor do HDL, dado que o
coeficiente é menor que zero.
f) A covariância entre as variáveis X e Y pode assumir valores negativos.
EX01. Assinale cada afirmação a seguir como VERDADEIRA (V) ou FALSA (F).
a) Antes de calcularmos um coeficiente de correlação, precisamos construir o gráfico da dispersão entre
X e Y para observarmos se a relação entre as variáveis pode ser considerada linear.
b) Para calcularmos o coeficiente de correlação entre X e Y, essas variáveis precisam ser previamente
transformadas para uma mesma unidade de medida.
c) O gráfico de dispersão entre X e Y serve também para observarmos se há valores atípicos na relação
entre essas variáveis. Valores atípicos podem influenciar o valor do coeficiente de correlação.
d) Podemos calcular um coeficiente de correlação entre uma variável qualitativa, como o sexo
(masculino e feminino) e uma variável quantitativa, como a circunferência da cintura, em centímetros.
e) Em uma pesquisa, o coeficiente de correlação de Pearson entre o índice de massa corporal (IMC) e o
HDL é –0,428. Concluímos, então, que o IMC elevado causa uma redução no valor do HDL, dado que o
coeficiente é menor que zero.
f) A covariância entre as variáveis X e Y pode assumir valores negativos.
EX02. Os dados a seguir referem-se ao peso ao nascer de 16 crianças (em gramas) e a idade da mãe, em
anos completos.

Sendo as variáveis X e Y, respectivamente, a idade da mãe e o peso ao nascer, temos média x = 24,875
anos, média y = 1.05,625 g, sX = 6,407 anos, sY = 273,82 e ∑nn+1 xiyi= 649,255.
a) Esboce um gráfico de dispersão entre as variáveis X e Y.
b) Encontre o coeficiente de correlação de Pearson entre X e Y.
c) Escreva uma interpretação para o coeficiente encontrado no item anterior.
EX02. a) Dispersão entre as variáveis X e Y.

3.000

2.500
Peso ao nascer (g)

2.000

1.500

1.000

500

0
0 5 10 15 20 25 30 35 40
Idade materna (anos)
EX02. b) coeficiente de correlação de Pearson entre X e Y.

r= 10 x 694.255 – (398 x 27.290)


√(10 x 10.516 – (398)2) . √(10 x 47.671.100 – (27.290)2)

r = 0,5858
EX02. c) Escreva uma interpretação para o coeficiente encontrado no item anterior.

r = 0,5858
EX03. Quantidade de procaína hidrolisada, em 10 moles/litro, no plasma humano, em função do tempo
decorrido após sua administração.

a) Existe uma relação linear entre a quantidade de procaína e o tempo decorrido após sua administração?
Qual o grau dessa relação?
b) Determine a reta de regressão que explica a quantidade de procaína em função do tempo. Calcule o
coeficiente de determinação do modelo.
c) Qual a quantidade de procaína hidrolisada após 6 minutos de sua administração? E após 13 minutos?
d) Calcule o erro de estimação para cada valor de X.
EX03.

35
30
25
20
Tempo

15
10
5
0
0 2 4 6 8 10 12 14 16
y = 2,1606x - 0,985 R² = 0,9939 Procaína Hidrolisada
EX04 A tabela abaixo apresenta os preços médios das ações e títulos divulgados pela Bolsa de Nova York
entre 1950 e 1959.
a) Calcule o coeficiente de correlação de Pearson e
interprete o resultado.
b) Determine a reta de regressão que explique os títulos
divulgados em função do preço médio das ações. Calcule
o coeficiente de determinação do modelo.
c) Qual o número de títulos divulgados para um preço
médio da ação de 45,00? E para um preço médio de
50,00?
EX05. Considere um experimento em que se analisa a octanagem da gasolina (Y) em função da adição de
um novo aditivo (X). Para isso, foram realizados ensaios com os percentuais de 1, 2, 3, 4, 5 e 6% de
aditivo. Os resultados são mostrados no gráfico de dispersão.

.
a) Existe uma relação linear entre a adição de um novo
aditivo e a octanagem da gasolina? Qual o grau dessa
relação?
b) Determine a reta de regressão que explica a octanagem
da gasolina em função da adição do novo aditivo. Calcule
o coeficiente de determinação do modelo.
c) Se adicionarmos 5,5% de aditivo, qual o índice de
octanagem esperado?

Você também pode gostar