Bioestatistica - Correlação e Regressão

Bioestatística
Correlação e Regressão Linear
2º Bimestre
Farmácia /2011
Profa Dra Leila Ribeiro
Introdução
Em pesquisas, frequentemente, procura-se verificar se

existe relação entre duas ou mais variáveis, isto é, saber
se as alterações sofridas por uma das variáveis são
acompanhadas por alterações nas outras.
Por exemplo, peso vs. idade, consumo vs. renda, altura

vs. peso, de um indivíduo.
O termo correlação significa relação em dois sentidos

(co + relação), e é usado em estatística para designar a
força que mantém unidos dois conjuntos de valores.
A verificação da existência e do grau de relação entre as

variáveis é o objeto de estudo da correlação.
Coeficiente de Correlação Linear
O instrumento empregado para a medida da correlação linear é o
coeficiente de correlação.
Esse coeficiente deve indicar o grau de intensidade da correlação entre

duas variáveis e, ainda, o sentido dessa correlação (positivo ou
negativo).
O coeficiente de correlação determinado por Pearson considera:
covariância (x, y)
rx , y =
desvio padrão x . desvio padrão y
∑ x. ∑ y
∑ xy −
r= n
 (∑ x) 2   (∑ y ) 2 
 ∑ x −
2
 . ∑ y −
2
 onde n é o número de observações
 n  n 
A partir de X e Y são determinadas todas as somas necessárias para este cálculo:
O coeficiente de correlação rxy linear é um número puro que varia de –1 a +1 e sua

interpretação dependerá do valor numérico e do sinal, como segue:
rxy = -1 → Correlação perfeita negativa

-1< rxy <0 → Correlação negativa
rxy = 0 → Correlação nula
0 < rxy <1 → Correlação positiva
→ Correlação perfeita positiva
rxy = 1
O diagrama de dispersão mostrará que a correlação será tanto mais forte
quanto mais próximo estiver o coeficiente de –1 ou +1, e será tanto mais
fraca quanto mais próximo o coeficiente estiver de zero.
a) Correlação perfeita negativa (rxy = -1):

Quando os pontos estiverem perfeitamente alinhados, mas em sentido
contrário, a correlação é denominada perfeita negativa.
b) Correlação negativa (-1 < rxy < 0):

A correlação é considerada negativa quando valores crescentes da
variável X estiverem associados a valores decrescentes da variável Y, ou
valores decrescentes de X associados a valores crescentes de Y.
c) Correlação nula (rxy = 0):

Quando não houver relação entre as variáveis X e Y, ou seja, quando os
valores de X e Y ocorrerem independentemente, não existe correlação
entre elas.
d) Correlação positiva (0 < rxy < 1):
Será considerada positiva se os valores crescentes de X
estiverem associados a valores crescentes de Y.
e) Correlação perfeita positiva (rxy = 1):

A correlação linear perfeita positiva corresponde ao caso anterior,
só que os pontos (X, Y) estão perfeitamente alinhados.
Correlação positiva (0 < rxy < 1) Correlação negativa (-1 < rxy < 0) Correlação nula (rxy = 0)
Exemplo
:
Consumo individual Coeficiente de
País diário de proteínas Natalidade
Formosa 4,7 45,6

Malásia 7,5 39,7 ∑ x. ∑ y
Índia 8,7 33,0 ∑ xy −
Japão 9,7 27,0
r= n
Iugoslávia 11,2 25,9
Grécia 15,2 23,5  (∑ x) 2   (∑ y ) 2 
Itália 15,2 23,4  ∑ x −
2
 . ∑ y −
2

Bulgária 16,8 22,2  n  n 
Alemanha 37,3 20,0
Irlanda 46,7 19,1
Dinamarca 56,1 18,3
Austrália 59,9 18,0
Estados Unidos 61,4 17,9
Suécia 62,6 15,0
r= -0,77
Correlação negativa (-1 < rxy < 0)
Isso ocorre quando os valores crescentes

da variável X estão associados a valores
decrescentes da variável Y,
Regressão Linear
Quando duas variáveis possuem certo grau de relacionamento
(verificado pela correlação), podemos aplicar a análise de regressão
que vai nos permitir descrever através de um modelo matemático, a
relação entre duas variáveis, partindo de n observações das
mesmas.
Para executarmos a regressão, as variáveis serão divididas em

variável dependente e variável independente.
Para o eixo x, indicamos a variável independente e para o eixo y, a

dependente.
No Diagrama de Dispersão, unindo os pontos correspondentes para

cada par de valores de X e Y obtemos um segmento de reta
(reta de regressão)
Dessa forma temos: Y = α + βx

α é o coeficiente linear, que dá a altura em
que a reta corta o eixo das ordenadas
Y = α + βx β é o coeficiente angular, que é a tangente

trigonométrica do ângulo θ , formado pela reta
Y=α +β X e uma paralela ao eixo das
abscissas, de ordenada igual a α .
O coeficiente angular (β ) é dado por:
onde :
n = é o número de observações
x = é a média dos valores de x
O coeficiente linear (α ) é dado por:
y = é a média dos valores de y
Exemplo
:
Para entendermos melhor regressão, veja o exemplo da quantidade de
procaína hidrolisada no plasma humano em função do tempo decorrido
após a sua administração.
Tempo Quantidade x y Xy X2
(Minutos) Hidrolisada 2 3,5 7,0 4
3 5,7 17,1 9
2 3,5
5 9,9 49,5 25
3 5,7
8 16,3 130,4 64
5 9,9
10 19,3 193,0 100
8 16,3
12 25,7 308,4 144
10 19,3
14 28,2 394,8 196
12 25,7
15 32,6 489,0 225
14 28,2 69 141,2 1589,2 767
15 32,6
Σ x Σ y Σ xy Σ x2
Aplicando as fórmulas , temos:

1589,2 − 69141,2
8 371,35 141,2 69
β= 2
= = 2,16 α= − 2,16 = −0,98
69 171,88 8 8
767 −
8
Assim, a equação da reta de regressão é: Y = − 0,98 + 2,16x

A equação da reta de regressão, permite calcular os valores de Y para
quaisquer valores de X dentro do intervalo estudado, mesmo que estes valores
não existam na amostra.
Por exemplo:
Para x=13
Y = − 0,98 + 2,16.13 = 27,10

O valor de Y = 27,10 é uma previsão para a quantidade de procaína que estaria
hidrolisada 13 minutos após a sua administração.
Referências Bibliográficas
Bioestatística : Princípios e Aplicações,Callegari-Jaques,

S. M., Editora artmed, 2003
Introdução à Bioestatística: para simples mortais, Doria

Filho, U., Editora Elsevier, 1999
Apostila Capitulo 14 - Estatística e Pesquisa UVB

Bioestatistica - Correlação e Regressão

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Bioestatistica - Correlação e Regressão

Enviado por

Direitos autorais:

Formatos disponíveis

Bioestatística

Correlação e Regressão Linear

Em pesquisas, frequentemente, procura-se verificar se

Por exemplo, peso vs. idade, consumo vs. renda, altura

O termo correlação significa relação em dois sentidos

A verificação da existência e do grau de relação entre as

Esse coeficiente deve indicar o grau de intensidade da correlação entre

O coeficiente de correlação determinado por Pearson considera:

O coeficiente de correlação rxy linear é um número puro que varia de –1 a +1 e sua

rxy = -1 → Correlação perfeita negativa

a) Correlação perfeita negativa (rxy = -1):

b) Correlação negativa (-1 < rxy < 0):

c) Correlação nula (rxy = 0):

e) Correlação perfeita positiva (rxy = 1):

Formosa 4,7 45,6

Correlação negativa (-1 < rxy < 0)

Isso ocorre quando os valores crescentes

Para executarmos a regressão, as variáveis serão divididas em

Para o eixo x, indicamos a variável independente e para o eixo y, a

No Diagrama de Dispersão, unindo os pontos correspondentes para

Dessa forma temos: Y = α + βx

Y = α + βx β é o coeficiente angular, que é a tangente

Aplicando as fórmulas , temos:

Assim, a equação da reta de regressão é: Y = − 0,98 + 2,16x

Y = − 0,98 + 2,16.13 = 27,10

Bioestatística : Princípios e Aplicações,Callegari-Jaques,

Introdução à Bioestatística: para simples mortais, Doria

Apostila Capitulo 14 - Estatística e Pesquisa UVB

Você também pode gostar