Você está na página 1de 4

PONTIFCIA UNIVERSIDADE CATLICA DO RIO GRANDE DO SUL FACULDADE DE MATEMTICA DEPT DE ESTATSTICA DISCIPLINA: ESTATSITCA APLICADA ADM II

ANLISE DE REGRESO LINEAR E CORRELAO LINEAR REGRESSO LINEAR 1. Objetivos e hipteses da Anlise de Regresso O objetivo principal da anlise de regresso predizer o valor da varivel dependente Y dado que seja conhecido o valor da varivel independente X. A equao de regresso a frmula algbrica pela qual se determina Y. A Anlise de Regresso Simples diz respeito predio de Y por uma nica varivel X. A Anlise de Regresso Mltipla diz respeito predio de Y por mais de uma varivel X ( x1, x2, ....). As hipteses gerais so: 1. Y uma varivel aleatria obtida de uma amostra; 2. Y e X esto associadas linearmente; 3. homocedasticidade as varincias das distribuies condicionais de Y dado X so todas iguais. Se em conjunto com a anlise de regresso, utiliza-se a estimao por intervalo, necessria a hiptese de que as distribuies condicionais de Y dado X so todas distribudas normalmente para os valores da populao. 2. Diagrama de disperso um grfico no qual cada ponto representa um par de valores (x;y). Os valores de X so colocados no eixo horizontal e Y no vertical. Transformao Linear se a relao ente X e Y for curvilnea, usa-se logaritmos para transforma-la em linear e aplicar a Anlise de Regesso Linear. Para voltar escala original usa-se o antilogartmo. Se o diagrama indica uma relao linear, ento ajusta-se aos dados uma linha que seja a melhor funo ajustante. A localizao precisa desta linha determinada pelo Mtodo dos Mnimos Quadrados (MMQ). Exemplos de diagramas de disperso:

3. Mtodo dos Mnimos Quadrados (MMQ) A frmula geral na populao

Y = + x + u
onde

= coeficiente linear ou intercepto-Y; = coeficiente angular;


u = variaes aleatrias. A frmula geral na amostra

Y = a + bx
onde a= estimador do coeficiente linear; b= estimador do coeficiente angular; Pelo MMQ, a reta resultante tem duas caractersticas importantes: 1. A soma dos desvios verticais dos pontos em relao a reta zero. 2. A soma dos quadrados desses desvios mnima. As frmulas de clculo para a e b so:

sxy sxx a = y b.x b= n ( x ) sxx = x n ( y ) syy = y n


2 2

sxy = xy

x. y
2

A estimao de Y deve ser feita apenas dentro do intervalo de variao de X originalmente amostrado. A equao fornece a base de uma estimativa por ponto.

CORRELAO LINEAR DE PEARSON 1.Objetivos e Hipteses A anlise de correlao mede o grau de relacionamento entre as variveis. Estudaremos a Anlise de Correlao Simples, a qual diz respeito medida entre X e Y. Hipteses: a. a relao entre X e Y linear; b. ambas so variveis aleatrias; c. homocedasticidade; d. as distribuies condicionais de Y dado X tm distribuio Normal; e. as duas distribuies, de X e de Y, tm distribuio Normal na populao. 2.O coeficiente de Determinao

2 - coeficiente de determinao na populao


r2 - coeficiente de determinao na amostra O coeficiente de determinao para a amostra :
2

a y + b xy n( y ) Amostra: r = y n( y )
2 2

Tem uma leve tendenciosidade positiva. Interpretao: a proporo da varincia de Y explicada pelo conhecimento da variao de X ( e vice-versa). 3. O coeficiente de correlao Muito embora o coeficiente de determinao seja relativamente fcil de interpretar, ele no pode ser testado estatisticamente. Contudo, a raiz quadrada do coeficiente de determinao, que o coeficiente de correlao (r), pode ser testada estatisticamente, pois est includa em uma estatstica de teste que distribuda segundo uma distribuio t, quando a correlao populacional =0. Alm disso, o sinal aritmtico associado com o coeficiente de correlao, que

sempre o mesmo sinal associado com na equao de regresso, indica a direo da relao X e Y (positivo=direta; negativo=inversa). Por tais razes o coeficiente de correlao mais freqentemente usado como medida de relao entre as variveis. O coeficiente de correlao para dados populacionais : Populao: O coeficiente de correlao para dados amostrais :

Amostra:

r= r

Pode-se elevar o coeficiente de correlao ao quadrado para se obter o coeficiente de determinao. Frmula Alternativa para o coeficiente de correlao amostral,

r=

sxy sxx . syy

que no requer o conhecimento dos coeficientes a e b da equao de regresso. O sinal do coeficiente obtido diretamente, sem necessidade de observar ou calcular a declividade da linha de regresso. O coeficiente amostral de correlao r tem uma leve tendenciosidade como um estimador de

4. Significncia do coeficiente de correlao Hipteses:

H0 : = 0 H1 : 0

H0 : 0 H : <0

H0 : 0 H : >0

1 1 ou ou Se a hiptese nula, ao nvel de significncia , for rejeitada podemos concluir que efetivamente existe uma relao entre as variveis. A estatstica de teste

tc =

r n2 1 r 2
com n-2 graus de liberdade na tabela t

Você também pode gostar