Você está na página 1de 5

CORRELAO E REGRESSO LINEAR SIMPLES INTRODUO Muitas vezes, na pratica, necessitamos estudar o relacionamento de duas variveis, coletadas como

pares de valores, para resolver questes, como por exemplo: - O sucesso de um emprego pode ser predito com base no resultado de testes: - Quanto maior for a produo, maior ser o custo total. - Quanto maior for a idade de um imvel, menor ser seu preo de venda. Problemas como esses podem ser estudados atravs uma analise de correlao simples, onde podemos determinar a fora do relacionamento entre asa duas variveis estudadas. As variveis estudadas sero: X, denominada de varivel independente, e Y, denominada de varivel dependente. Se o relacionamento entre X e Y for consistente e necessitamos fazer uma predio para o valor de Y, conhecido um valor de X, atravs de uma formula matemtica adequada, podemos aplicar a chamada anlise de regresso simples. DIAGRAMA DE DISPERSO E um grfico no qual cada ponto plotado representa um par observado de valores para as variveis estudadas (X ,Y), num sistema de eixos cartesianos. Atravs do diagrama de disperso podemos ter uma idia do tipo de relao entre as variveis estudadas. A seguir temos alguns exemplos de diagramas de disperso.

(a) Relao linear direta

(b) Relao linear inversa

(c) Relao curvilnea direta

(c) No h relao

COEFICIENTE DE CORRELAO LINEAR Mede o grau e o tipo do relacionamento entre as variveis estudadas Esta medida e tambm chamada de coeficiente de correlao de Pearson, em homenagem ao seu criador. Simbologia: R (amostra) ou (populao). O valor de R, pode ser calculado por:

R=

nXY XY n(X ) (X ) 2
2

n(Y 2 ) (Y ) 2

Onde n e o numero de pares de valores (X,Y) observados. Observe-se que -1,0 R 1,0. O mesmo ocorre com o valor de A partir dos valores de R ou , podemos verificar o tipo da correlao existente entre as variveis estudadas, conforme tabela seguinte:
Valor de R ou 0,0 0,0 ----| 0,3 0,3 ----| 0,6 0,6 ----| 0,9 0,9 ----| 0,99 1,0 Correlao nula fraca media forte fortssima perfeita

COEFICIENTE DE DETERMINAO LINEAR Mede a proporo de variaes de Y que so explicadas direta ou indiretamente pelas correspondentes variaes de X. expresso em porcentagem. Simbologia R (amostra) ou (populao).

R = (R)

SIGNIFICNCIA DO COEFICIENTE DE CORRELAO LINEAR De modo geral,. a hiptese nula de interesse e que o coeficiente de correlao populacional seja igual a zero, pois se essa hiptese for rejeitada ao nvel de significncia estipulado, podemos concluir que efetivamente existe uma relao entre as variveis estudadas. Na maioria das vezes utilizamos a distribuio de Student, com gl = n - 2, para testar a significncia do coeficiente de correlao linear populacional, sendo que a estatstica de teste ser calculada por: tt = R 1 R2 n2

EQUAO DE REGRESSO LINEAR SIMPLES a equao algbrica que nos possibilita predizer um valor para Y, conhecido um valor para X. A equao de regresso linear simples populacional dada por: Y = + X + u Onde u o componente aleatrio que representa a influncia de outros fatores, bem como os erros de medio da varivel Y. Este componente surge devido variabilidade dos valores de Y para cada valor de X.

+ + + + + + + +

Y= + X+u
+ +

Quanto ao componente aleatrio, so admitidas as seguintes hipteses: 1 A varivel aleatria u tm distribuio normal. 2 u uma varivel aleatria com mdia igual a zero, isto , E(u) = 0.

3 A varivel u tem varincia igual a u

para todos os valores de X.

ESTIMADORES DE E PARA O MODELO DE REGRESSO LINEAR Os estimadores dos coeficientes angular ( ) e linear ( ) sero designados respectivamente por b e a, se o modelo escolhido for uma forma linear. Ento a estimativa do modelo adotado, ser dada por:

Y = a + bX
Os valores de a e b sero determinados, atravs do Mtodo dos Mnimos Quadrados (MMQ), aplicado na amostra selecionada, utilizando-se as seguintes frmulas:

b=

XY nX .Y X 2 n( X ) 2

a = Y bX

importante observar que: - A reta de mnimos quadrados (MMQ) passa pelo ponto ( X ; Y ), isto quando X = X , temos que Y = Y . - b mede a variao que ocorre em Y por unidade de variao de X.] - Quando no houver relao entre X e Y teremos Y = Y , pois b=0 - Quando as relaes entre X e Y forem proporcionais, a reta passa na origem e a = 0, logo Y = bX VARINCIA RESIDUAL E DESVIO PADRO RESIDUAL O valor de u , pode ser estimado atravs dos dados amostrais, atravs da seguinte frmula:
2

Y Y = n 2
2 u

O desvio padro residual estimado dado por

2 u = u

O valor do desvio padro residual estimado pode ser calculado pela seguinte frmula alternativa:

u =

Y 2 a Y b XY n 2

ESTIMATIVAS E PREVISES ATRAVS DA EQUAO DE REGRESSO LINEAR O modelo de regresso linear simples uma suposio sobre a relao entre X e Y. Usando o mtodo dos mnimos quadrados, obtemos a equao0 de regresso linear simples. Se os resultados mostram uma relao estatisticamente significante entre X e Y, e se o ajuste dado pela equao de regresso linear estimada for bom, podemos ter uma boa estimativa e previso. Podemos, portanto usar a equao de regresso para desenvolver uma estimativa pontual do valor mdio de Y para um dado valor de X, ou para prever um valor individual de Y correspondente a um dado valor de X.. As estimativas pontuais, nesses dois casos, feitas pela reta de regresso sero as mesmas. As estimativas pontuais no nos do nenhuma informao da preciso a elas associadas. Para isso devemos desenvolver estimativas por intervalos, levando em conta os erros associados a estas estimaes. INTERVALO DE ESTIMAO DO VALOR MDIO DE Y A partir de uma estimativa pontual do valor mdio de Y, dado pela equao de regresso estimada, obteremos um intervalo de confiana. A estimativa do desvio padro do valor mdio de Y, dado pela equao de regresso dada por:

y = u

1 + n

(X X)
X
2

( X )2
n

Ento o intervalo de confiana para o valor mdio de Y, utilizando-se a distribuio de Student, ser dado por:
Y t cY

Com um nmero de graus de liberdade igual a gl = n 2.

INTERVALO DE ESTIMAO PARA UM VALOR INDIVIDUAL DE Y A partir de uma estimativa pontual do valor de Y, dado pela equao de regresso estimada, obteremos um intervalo de confiana. A estimativa do desvio padro do valor de Y, dado pela equao de regresso dada por:

Yi = u

1 1+ + n

(X X)
X
2

( X )2
n

Ento o intervalo de confiana para o valor de Y, utilizando-se a distribuio de Student, ser dado por: Y t cY
i

Com um nmero de graus de liberdade igual a gl = n 2.

PERIGOS E LIMITAES ASSOCIADOS COM AS ANLISES DE REGRESSO E DE CORRELAO 1- Na anlise de regresso, um valor de Y no poder ser legitimamente estimado, se o valor de X estiver fora do intervalo de valores que serviam de base para a equao de regresso. 2 Se a predio de Y envolve um resultado que ainda no ocorreu, os dados histricos que serviram de base para a equao de regresso podem no ser relevantes para futuros eventos. 3 O uso de um intervalo de predio ou de confiana est baseado na hiptese de que as distribuies condicionais de Y so normais e possuem varincias iguais. 4 Um coeficiente de correlao significante no indica, necessariamente, causao, mas pode indicar, isto sim, uma ligao comum a outros eventos. 5 Uma correlao significante no necessariamente uma correlao importante. Dada uma grande amostra, uma correlao de, digamos, R = +0,10 pode ser significantemente diferente de 0 a = 0,05.

Você também pode gostar