Você está na página 1de 13

Bioestatística

Correlação e Regressão Linear

2º Bimestre
Farmácia /2011
Profa Dra Leila Ribeiro
Introdução

Em pesquisas, frequentemente, procura-se verificar se


existe relação entre duas ou mais variáveis, isto é, saber
se as alterações sofridas por uma das variáveis são
acompanhadas por alterações nas outras.

Por exemplo, peso vs. idade, consumo vs. renda, altura


vs. peso, de um indivíduo.

O termo correlação significa relação em dois sentidos


(co + relação), e é usado em estatística para designar a
força que mantém unidos dois conjuntos de valores.

A verificação da existência e do grau de relação entre as


variáveis é o objeto de estudo da correlação.
Coeficiente de Correlação Linear
O instrumento empregado para a medida da correlação linear é o
coeficiente de correlação.

Esse coeficiente deve indicar o grau de intensidade da correlação entre


duas variáveis e, ainda, o sentido dessa correlação (positivo ou
negativo).

O coeficiente de correlação determinado por Pearson considera:

covariância (x, y)
rx , y =
desvio padrão x . desvio padrão y

∑ x. ∑ y
∑ xy −
r= n
 (∑ x) 2   (∑ y ) 2 
 ∑ x −
2
 . ∑ y −
2
 onde n é o número de observações
 n  n 
A partir de X e Y são determinadas todas as somas necessárias para este cálculo:

O coeficiente de correlação rxy linear é um número puro que varia de –1 a +1 e sua


interpretação dependerá do valor numérico e do sinal, como segue:

rxy = -1 → Correlação perfeita negativa


-1< rxy <0 → Correlação negativa
rxy = 0 → Correlação nula
0 < rxy <1 → Correlação positiva
→ Correlação perfeita positiva
rxy = 1
O diagrama de dispersão mostrará que a correlação será tanto mais forte
quanto mais próximo estiver o coeficiente de –1 ou +1, e será tanto mais
fraca quanto mais próximo o coeficiente estiver de zero.

a) Correlação perfeita negativa (rxy = -1):


Quando os pontos estiverem perfeitamente alinhados, mas em sentido
contrário, a correlação é denominada perfeita negativa.

b) Correlação negativa (-1 < rxy < 0):


A correlação é considerada negativa quando valores crescentes da
variável X estiverem associados a valores decrescentes da variável Y, ou
valores decrescentes de X associados a valores crescentes de Y.

c) Correlação nula (rxy = 0):


Quando não houver relação entre as variáveis X e Y, ou seja, quando os
valores de X e Y ocorrerem independentemente, não existe correlação
entre elas.
d) Correlação positiva (0 < rxy < 1):
Será considerada positiva se os valores crescentes de X
estiverem associados a valores crescentes de Y.

e) Correlação perfeita positiva (rxy = 1):


A correlação linear perfeita positiva corresponde ao caso anterior,
só que os pontos (X, Y) estão perfeitamente alinhados.

Correlação positiva (0 < rxy < 1) Correlação negativa (-1 < rxy < 0) Correlação nula (rxy = 0)
Exemplo
:
Consumo individual Coeficiente de
País diário de proteínas Natalidade

Formosa 4,7 45,6


Malásia 7,5 39,7 ∑ x. ∑ y
Índia 8,7 33,0 ∑ xy −
Japão 9,7 27,0
r= n
Iugoslávia 11,2 25,9
Grécia 15,2 23,5  (∑ x) 2   (∑ y ) 2 
Itália 15,2 23,4  ∑ x −
2
 . ∑ y −
2

Bulgária 16,8 22,2  n  n 
Alemanha 37,3 20,0
Irlanda 46,7 19,1
Dinamarca 56,1 18,3
Austrália 59,9 18,0
Estados Unidos 61,4 17,9
Suécia 62,6 15,0

r= -0,77

Correlação negativa (-1 < rxy < 0)

Isso ocorre quando os valores crescentes


da variável X estão associados a valores
decrescentes da variável Y,
Regressão Linear
Quando duas variáveis possuem certo grau de relacionamento
(verificado pela correlação), podemos aplicar a análise de regressão
que vai nos permitir descrever através de um modelo matemático, a
relação entre duas variáveis, partindo de n observações das
mesmas.

Para executarmos a regressão, as variáveis serão divididas em


variável dependente e variável independente.

Para o eixo x, indicamos a variável independente e para o eixo y, a


dependente.

No Diagrama de Dispersão, unindo os pontos correspondentes para


cada par de valores de X e Y obtemos um segmento de reta
(reta de regressão)

Dessa forma temos: Y = α + βx


α é o coeficiente linear, que dá a altura em
que a reta corta o eixo das ordenadas

Y = α + βx β é o coeficiente angular, que é a tangente


trigonométrica do ângulo θ , formado pela reta
Y=α +β X e uma paralela ao eixo das
abscissas, de ordenada igual a α .
O coeficiente angular (β ) é dado por:

onde :
n = é o número de observações
x = é a média dos valores de x
O coeficiente linear (α ) é dado por:
y = é a média dos valores de y
Exemplo
:
Para entendermos melhor regressão, veja o exemplo da quantidade de
procaína hidrolisada no plasma humano em função do tempo decorrido
após a sua administração.
Tempo Quantidade x y Xy X2
(Minutos) Hidrolisada 2 3,5 7,0 4
3 5,7 17,1 9
2 3,5
5 9,9 49,5 25
3 5,7
8 16,3 130,4 64
5 9,9
10 19,3 193,0 100
8 16,3
12 25,7 308,4 144
10 19,3
14 28,2 394,8 196
12 25,7
15 32,6 489,0 225
14 28,2 69 141,2 1589,2 767
15 32,6
Σ x Σ y Σ xy Σ x2

Aplicando as fórmulas , temos:


1589,2 − 69141,2
8 371,35 141,2 69
β= 2
= = 2,16 α= − 2,16 = −0,98
69 171,88 8 8
767 −
8

Assim, a equação da reta de regressão é: Y = − 0,98 + 2,16x


A equação da reta de regressão, permite calcular os valores de Y para
quaisquer valores de X dentro do intervalo estudado, mesmo que estes valores
não existam na amostra.

Por exemplo:

Para x=13

Y = − 0,98 + 2,16.13 = 27,10


O valor de Y = 27,10 é uma previsão para a quantidade de procaína que estaria
hidrolisada 13 minutos após a sua administração.
Referências Bibliográficas

Bioestatística : Princípios e Aplicações,Callegari-Jaques,


S. M., Editora artmed, 2003

Introdução à Bioestatística: para simples mortais, Doria


Filho, U., Editora Elsevier, 1999

Apostila Capitulo 14 - Estatística e Pesquisa UVB