Você está na página 1de 7

Correlao e regresso______________________________________________________________________ 24

Captulo 2 - Correlao e Regresso

2.1 Introduo
2.2 Correlao
2.2.1 Diagrama de disperso
2.2.2 Correlao positiva e negativa
2.2.3 Coeficientes de correlao
2.3 Regresso
2.3.1 Coeficiente de determinao
Exerccios

_____________________________________________________________________________________
Maria Clara Rocha

Correlao e regresso______________________________________________________________________ 24

2.1 INTRODUO
Quando se afirma que duas variveis esto relacionadas, pode-se querer dizer que existe entre elas
uma conexo bem definida e invarivel ou, diferentemente, que a ligao mais indefinida e algo
varivel.
Por exemplo, a rea de uma circunferncia e o seu raio esto relacionados. A relao que os liga
bem definida, invarivel, e pode traduzir-se pela expresso matemtica:
A= r2 , em que A representa a rea e r o raio.
A relao entre a rea e o raio da circunferncia permite determinar, com a preciso desejada, a rea
da circunferncia a partir do seu raio ou o comprimento do seu raio a partir da sua rea.
J num estudo, por exemplo, entre a nota de um exame e o tempo de estudo, a nota no pode ser
determinada com exactido a partir do tempo de estudo. O que pode dizer-se que, em mdia, quanto
mais se estuda melhor ser a nota do exame. Trata-se, agora, de uma relao menos precisa, mais vaga
e sujeita a variaes. esta a relao com interesse para o estudo estatstico e que se designa por
relao estatstica.
Assim, perante dois quaisquer fenmenos, pode-se afirmar que ou esto ligados atravs de uma
relao invarivel ou de uma relao estatstica, ou no esto ligados atravs de qualquer relao. A
relao estatstica exprime o meio-termo, no grau de relao entre variveis, entre a relao invarivel
e a ausncia de relao.
Por outro lado, neste tipo de problemas admitimos que, se um processo observado durante um
perodo suficientemente longo obedece, de forma aproximada, a um modelo matemtico, podemos
utilizar esse modelo para predizer a evoluo futura do fenmeno. Note-se que a soluo obtida merece
sempre uma reflexo crtica baseada na experincia que o investigador tem do fenmeno em estudo e
na quantidade de informao disponvel.

2.2 CORRELAO
Numa populao ou amostra podem estudar-se simultaneamente dois atributos quantitativos X e Y
distintos, ou seja, a cada indivduo pode fazer-se corresponder um par (x, y) de nmeros reais que o
caracterize. O par (X,Y) denomina-se varivel estatstica bidimensional.
Em pesquisas que envolvem a considerao de duas variveis, pode-se estudar a correlao ou
associao entre elas, isto , quer-se saber se as alteraes sofridas por uma das variveis (varivel
independente) so acompanhadas por alteraes na outra varivel (varivel dependente). Por exemplo,
podem medir-se, ao mesmo tempo, a altura e o peso de cada indivduo e pode interessar averiguar se
medida que aumenta a altura aumenta o peso.

2.2.1 DIAGRAMA DE DISPERSO


Suponha-se que X e Y representam, respectivamente, a altura e o peso de crianas; ento uma
amostra de n indivduos ter as alturas x1, x2,...., xn e os pesos y1, y2,...., yn.
representao grfica de todos os pontos (x1, y1), (x2, y2),...., (xn, yn) num sistema cartesiano de
coordenadas, d-se o nome de diagrama de disperso (Figura1).
O diagrama de disperso permite descobrir graficamente a relao entre X e Y.

_____________________________________________________________________________________
Maria Clara Rocha

Correlao e regresso______________________________________________________________________ 24

Figura1- Diagramas de disperso

Da observao do diagrama de disperso pode visualizar-se uma curva que se adapta, ou no, ao
conjunto dos dados. Caso a relao entre as variveis parea ser bem aproximada por uma recta, diz-se
que existe uma correlao linear entre as variveis; caso contrrio, a relao diz-se correlao nolinear.

2.2.2 CORRELAO POSITIVA E NEGATIVA


No caso de duas variveis X e Y apresentarem variaes no mesmo sentido, diz-se que entre elas
existe correlao positiva; quando as variaes so em sentidos contrrios, trata-se de correlao
negativa; no caso das duas variveis no estarem relacionadas, a correlao nula (Figura 2).

Correlao positiva

Correlao negativa

Correlao nula

Figura 2- Direco da correlao


Note-se que uma correlao positiva entre duas variveis mostra apenas que essas varveis crescem
no mesmo sentido; no indica que o aumento de uma das variveis cause aumentos na outra varivel. O
mesmo se passa na correlao negativa.

2.2.3 COEFICIENTES DE CORRELAO


A representao grfica da disperso muito til para obter uma noo visual da relao existente
entre variveis, embora seja necessria uma descrio mais quantitativa.
Os coeficientes de correlao tambm designados por medidas de associao quantificam a
intensidade e a direco da associao entre variveis. Uma correlao mede apenas a associao entre
variveis sem qualquer implicao de causa e efeito.

_____________________________________________________________________________________
Maria Clara Rocha

Correlao e regresso______________________________________________________________________ 24
Podem-se definir as correlaes como
bivariadas se envolvem duas variveis;
multivariadas se envolvem mais de duas variveis.
Os coeficientes de correlao bivariados mais usados, definidos em funo da escala de medida
das variveis utilizadas, so:
Coeficiente de correlao de Pearson (-1 r 1) : uma medida de associao de tipo
linear entre duas variveis contnuas com distribuio normal.
A escala de correlao dada por :

Se r =-1 , diz-se que as variveis tm correlao perfeita negativa;

Se 1< r <0, a correlao negativa e ser tanto mais forte quanto mais r se aproxima de
1;

Se 0< r <1, a correlao positiva e ser tanto mais forte quanto mais r se aproxima de 1;

Se r =1 , diz-se que as variveis tm correlao perfeita positiva;

Se r =0 , no existe correlao entre as duas variveis.

Intensidade da correlao (Bryman & Cramer, 2003):

r< 0,20 muito baixa

0,20 r < 0,40 baixa

0,40 r < 0,70 moderada

0,70 r < 0,90 alta

0,90 muito alta


Coeficiente de correlao de Sperman (-1 1) : uma medida de associao entre duas
variveis pelo menos ordinais.
Coeficiente de correlao V de Cramer (0 V 1) : este coeficiente mede a intensidade de
associao entre duas variveis nominais. Estas variveis encontram-se geralmente
organizadas em tabelas de contingncia. No caso de variveis dicotmicas o coeficiente V
de Cramer pode ser substituido pelo Coeficiente Phi ().

2.3 REGRESSO

_____________________________________________________________________________________
Maria Clara Rocha

Correlao e regresso______________________________________________________________________ 24
O objectivo da correlao verificar se existe relao entre os fenmenos em estudo e avaliar o
grau dessa relao. Se se concluir que existe dependncia entre as variveis ( X e Y ), haver interesse
em determinar uma estimativa do valor de uma das variveis (Y) conhecido o valor da outra (X). Para
isso utiliza-se uma funo ou modelo matemtico Y=f (X).
O modelo mais simples a regresso linear simples de Y em X, dado por Y* = a + bX .

O problema que se coloca determinar a e b de forma a que yi* (valor ajustado), i=1,...n, seja a
melhor aproximao de yi (valor observado), i=1,...n.
O mtodo utilizado o mtodo dos mnimos quadrados. Designando por ei o desvio entre um valor
observado yi e um valor ajustado yi* , ou seja, ei = yi yi* (denominado resduo), determinam-se a e b de
n

modo que seja mnima a soma

2
i

. Isto , a e b so os valores

que minimizam

i =1

n
2
* 2 n
(y i y i ) = y i (a + bx i ) . Demonstra-se que a soluo deste problema dada por:
i =1
i =1

xi yi n x y

b = i =1
n 2
2
xi n x
i =1

_
e

a=

-b

_
x.

__________________________________________________________________________________________
Exemplo 1
Ao valor 2 da varivel x corresponde a estimativa de 1, 7 para
a varivel y; ao valor 10 da varivel x corresponde a estimativa
de 8 para a varivel y .

__________________________________________________________________________________________

_____________________________________________________________________________________
Maria Clara Rocha

Correlao e regresso______________________________________________________________________ 24
Nota : Para o coeficiente de correlao existe simetria, ou seja, a correlao existente entre X e Y a
mesma que entre Y e X. J na regresso, o valor de b (coeficiente de regresso) da recta
ajustada de Y em X diferente do da recta ajustada de X em Y, isto , as rectas so diferentes.

2.3.1.

COEFICIENTE DE DETERMINAO

O quadrado do coeficiente de correlao, r2 (0 r2 1), mede a proporo de variao de Y, que


explicada atravs do ajuste do modelo linear. Para um valor fixo de observaes, quanto melhor o
ajuste dos dados tanto maior o valor de r2, denominado coeficiente de determinao. Assim, r2 avalia
o poder explicativo da recta de regresso, podendo ser visto como uma medida descritiva da qualidade
de ajuste obtido.
Por exemplo, se r2 = 0,803, conclui-se que a recta de regresso permite explicar em 80,3% a varivel
dependente Y custa da varivel independente X.
O valor de r2 que se considera produzir um ajustamento adequado algo subjectivo. Nas cincias
sociais, para um valor r2 >0,5 considera-se aceitvel o ajustamento do modelo aos dados. No caso das
cincias exactas, so aceites como indicadores de um bom ajustamento apenas valores r2 >0,9.

Exerccios:
1.

Assinale a opo verdadeira:

a)

As variveis X e Y esto relacionadas nos diagramas A,B e D

b)

As variveis X e Y no esto relacionadas nos diagramas A e D

c)

A relao entre X e Y no linear no diagrama A

d)

No diagrama B a correlao entre X e Y negativa

2. Foi feito um estudo acerca da associao existente entre duas variveis quantitativas, X e Y, tendose encontrado o seguinte valor
r = 0,14
Como classifica a intensidade e o sentido da relao linear existente entre as duas variveis na amostra
estudada? Justifique.

_____________________________________________________________________________________
Maria Clara Rocha

Correlao e regresso______________________________________________________________________ 24
3. Foi feito um estudo acerca da associao existente entre duas variveis quantitativas, X (varivel
independente) e Y (varivel dependente), tendo-se encontrado os seguintes valores
b = 11,31

a = -24,9

a) Como classifica o sentido da relao linear (Y= aX+b) existente entre as duas variveis na amostra
estudada? Justifique.
b) Sabendo que r = -0,94, ser correcto utilizarmos a funo preditiva da regresso ? Porqu? Se sim,
faa uma estimativa do valor de x para y=15.
c) Calcule o coeficiente de determinao e interprete o resultado obtido.

_____________________________________________________________________________________
Maria Clara Rocha