Escolar Documentos
Profissional Documentos
Cultura Documentos
Aula18 Analise Regressao
Aula18 Analise Regressao
ANLISE DE REGRESO LINEAR E CORRELAO LINEAR REGRESSO LINEAR 1. Objetivos e hipteses da Anlise de Regresso O objetivo principal da anlise de regresso predizer o valor da varivel dependente Y dado que seja conhecido o valor da varivel independente X. A equao de regresso a frmula algbrica pela qual se determina Y. A Anlise de Regresso Simples diz respeito predio de Y por uma nica varivel X. A Anlise de Regresso Mltipla diz respeito predio de Y por mais de uma varivel X ( x1, x2, ....). As hipteses gerais so: 1. Y uma varivel aleatria obtida de uma amostra; 2. Y e X esto associadas linearmente; 3. homocedasticidade as varincias das distribuies condicionais de Y dado X so todas iguais. Se em conjunto com a anlise de regresso, utiliza-se a estimao por intervalo, necessria a hiptese de que as distribuies condicionais de Y dado X so todas distribudas normalmente para os valores da populao. 2. Diagrama de disperso um grfico no qual cada ponto representa um par de valores (x;y). Os valores de X so colocados no eixo horizontal e Y no vertical. Transformao Linear se a relao ente X e Y for curvilnea, usa-se logaritmos para transforma-la em linear e aplicar a Anlise de Regesso Linear. Para voltar escala original usa-se o antilogartmo. Se o diagrama indica uma relao linear, ento ajusta-se aos dados uma linha que seja a melhor funo ajustante. A localizao precisa desta linha determinada pelo Mtodo dos Mnimos Quadrados (MMQ). Exemplos de diagramas de disperso:
Y = + x + u
onde
= a + bx Y
onde a= estimador do coeficiente linear; b= estimador do coeficiente angular; Pelo MMQ, a reta resultante tem duas caractersticas importantes: 1. A soma dos desvios verticais dos pontos em relao a reta zero. 2. A soma dos quadrados desses desvios mnima. As frmulas de clculo para a e b so:
sxy = xy
x. y
2
A estimao de Y deve ser feita apenas dentro do intervalo de variao de X originalmente amostrado. A equao fornece a base de uma estimativa por ponto.
CORRELAO LINEAR DE PEARSON 1.Objetivos e Hipteses A anlise de correlao mede o grau de relacionamento entre as variveis. Estudaremos a Anlise de Correlao Simples, a qual diz respeito medida entre X e Y. Hipteses: a. a relao entre X e Y linear; b. ambas so variveis aleatrias; c. homocedasticidade; d. as distribuies condicionais de Y dado X tm distribuio Normal; e. as duas distribuies, de X e de Y, tm distribuio Normal na populao. 2.O coeficiente de Determinao
a y + b xy n( y ) Amostra: r = y n( y )
2 2
Tem uma leve tendenciosidade positiva. Interpretao: a proporo da varincia de Y explicada pelo conhecimento da variao de X ( e vice-versa). 3. O coeficiente de correlao Muito embora o coeficiente de determinao seja relativamente fcil de interpretar, ele no pode ser testado estatisticamente. Contudo, a raiz quadrada do coeficiente de determinao, que o coeficiente de correlao (r), pode ser testada estatisticamente, pois est includa em uma estatstica de teste que distribuda segundo uma distribuio t, quando a correlao populacional =0. Alm disso, o sinal aritmtico associado com o coeficiente de correlao, que
sempre o mesmo sinal associado com na equao de regresso, indica a direo da relao X e Y (positivo=direta; negativo=inversa). Por tais razes o coeficiente de correlao mais freqentemente usado como medida de relao entre as variveis. O coeficiente de correlao para dados populacionais : Populao: O coeficiente de correlao para dados amostrais :
Amostra:
r= r
Pode-se elevar o coeficiente de correlao ao quadrado para se obter o coeficiente de determinao. Frmula Alternativa para o coeficiente de correlao amostral,
r=
que no requer o conhecimento dos coeficientes a e b da equao de regresso. O sinal do coeficiente obtido diretamente, sem necessidade de observar ou calcular a declividade da linha de regresso. O coeficiente amostral de correlao r tem uma leve tendenciosidade como um estimador de
H0 : = 0 H1 : 0
H0 : 0 H : <0
H0 : 0 H : >0
1 1 ou ou Se a hiptese nula, ao nvel de significncia , for rejeitada podemos concluir que efetivamente existe uma relao entre as variveis. A estatstica de teste
tc =
r n2 1 r 2
com n-2 graus de liberdade na tabela t