Você está na página 1de 5

REGRESSO LINEAR SIMPLES

1. INTRODUO A regresso e a correlao so tcnicas utilizadas para estimar uma relao que possa existir na populao, enquanto as tcnicas anteriormente estudadas (Medidas de Tendncia Central e de Disperso: Mdia, Desvio Padro, Varincia, etc.) servem para estimar um nico parmetro populacional. A anlise de correlao e regresso compreende a anlise de dados amostrais para saber se e como duas ou mais variveis esto relacionadas uma com a outra numa populao. A correlao mede a fora, ou grau, de relacionamento entre duas variveis; a regresso d a equao que descreve o relacionamento em termos matemticos. Os dados para anlise de regresso e correlao provm de observaes de variveis emparelhadas. Na regresso pressupe-se alguma relao de causa e efeito, de explanao do comportamento entre as variveis. Ex. a idade e a altura de cada indivduo; a alquota de imposto e a arrecadao; preo e quantidade. 2. REGRESSO LINEAR 2.1. Introduo A regresso linear simples constitui uma tentativa de estabelecer uma equao matemtica linear (linha reta) que descreva o relacionamento entre duas variveis. Da mesma forma como usamos a mdia para resumir uma varivel aleatria, a reta de regresso usada para resumir a estimativa linear entre duas variveis aleatrias (Lapponi, 1997, p.344). H diversas formas de utilizao de equaes de regresso: Estimar valores de uma varivel, com base em valores conhecidos da outra. Em situaes em que as duas variveis medem aproximadamente a mesma coisa, mas uma delas relativamente dispendiosa, ou difcil de lidar, enquanto que a outra no. Explicar valores de uma varivel em termos da outra, ou seja, confirmar uma relao de causa e efeito entre duas variveis.

Predizer valores futuros de uma varivel. Ex. aplicar testes para avaliar o sucesso de um ingressante na escola ou no emprego. 2.2. A Equao Linear (a reta de regresso) Principais caractersticas: 1) O coeficiente angular da reta dado pela tangente da reta e se denomina b. 2) A cota da reta em determinado ponto o coeficiente linear denominado a, que o valor de Y quando X=0.

Frmula:

= a + bX Y

Nesse modelo se verifica que: (Lapponi, p. 345) 1) Para um valor Xi podem existir um ou mais valores de Yi amostrados. i . 2) Para esse mesmo valor Xi se ter apenas um valor projetado Y i , 3) Para cada valor de Xi existir um desvio di (ou erro ei) dos valores de Y conforme indicado nas figuras da apresentao. 4) Sempre teremos observaes que no so pontos da reta. 2.3 Deciso por um tipo de relao Nem todas as situaes so bem aproximadas por uma equao linear. Quando os dados no podem ser aproximados por um modelo linear, as alternativas so procurar um modelo no-linear conveniente, ou transformar os dados para a forma linear. Por exemplo, a converso de uma ou de ambas escalas em logaritmos d por vezes um modelo linear. 3. DETERMINAO DA EQUAO MATEMTICA Na regresso, os valores y so preditos com base em valores dados ou conhecidos de x. A varivel y chamada varivel dependente, e a varivel x, varivel independente. Que critrio devemos aplicar para obter os valores dos coeficientes a e b? Existem 2 critrios (Lapponi, p.345):

1) Ajustar um reta horizontal de valor igual mdia dos valores de y, isto , Y , pois a mdia uma reta de regresso com b = 0. 2) Ajustar um reta que divida os pontos observados de forma que a soma dos desvios seja nula. No entanto, a simples soma dos desvios leva compensao dos desvios positivos e negativos, como j se viu no clculo da varincia. 3.1. O mtodo dos mnimos quadrados O critrio encontrar os coeficientes a e b da reta de regresso que minimizem a soma dos quadrados dos desvios. (Lapponi, p. 346) Caractersticas importantes: 1) A soma dos desvios verticais dos pontos em relao reta zero 2) A soma dos quadrados desses desvios mnima (isto , nenhuma outra reta daria menor soma de quadrados de tais desvios). Simbolicamente, o valor que minimizado :

d
Onde:

= ( yi yc )

yi = valor observado de y yc = o valor calculado de y utilizando-se a equao de mnimos quadrados com o valor de x correspondente a yi. Os coeficientes so calculados pelas frmulas abaixo. Tendo presente que Cov(x,y) = rxy x y, o coeficiente b ser igual a estas quatro frmulas possveis: Fatos importantes da equao de regresso: 1) trata-se de uma mdia 2) seria muito arriscado extrapolar essa equao para fora do mbito dos dados 3) a reta de regresso tem a interessante propriedade de passar sempre pelo ponto (x, y).

b=

n ( xy ) ( x ) ( y ) n

( x ) ( x)
2

Cov ( x, y ) Var ( x )

rxy X Y = rxy Y 2 X X

a=

y b x = Y bX
n

Uma vantagem adicional destas vrias formas de clculo que com os mesmos dados possvel calcular as duas possveis retas de regresso linear, permutando as variveis de dependente (Y) para independente (X) e vice-versa, tendo presente que: 1) O valor do coeficiente b obtido como resultado da diviso da covarincia das duas variveis aleatrias pela varincia da varivel independente. 2) O valor do coeficiente a obtido como resultado da subtrao da mdia da varivel dependente menos o produto do coeficiente b pela mdia da varivel independente. 3) Isto poder indicar o sentido da relao causa-efeito ou explanatria. Minimizar a soma dos quadrados dos desvios no garante que se tenha obtido a melhor reta ajustada, apenas uma propriedade desejada de ajuste de reta. (Lapponi, p. 346) O mtodo de ajuste dos mnimos quadrados prefervel por que: 1) Obtm as melhores estimaes, isto , as estimativas no tero tendenciosidade. 2) Onera os desvios maiores, fato desejvel que evita grandes desvios. 3) Permite realizar testes de significncia na equao de regresso. 4) A reta de regresso passa pelo ponto formado pelos valores das mdias das duas sries de observaes. 3.2. Usando o Excel As funes estatsticas que correspondem aos conceitos vistos at aqui so: INTERCEPO, INCLINAO, PREVISO e TENDNCIA. 1. INTERCEPO (srie y; srie x): d como resultado o valor do coeficiente de regresso a, denominado intercepto da reta de regresso linear, ou quando X = 0. seja, d o valor de Y 2. INCLINAO (srie y; srie x): d como resultado o valor do coeficiente b da reta de regresso linear.

da 3. PREVISO (x; srie y; srie x): d como resultado o valor projetado Y reta de regresso linear simples para um nico valor X. Deve-se ter o cuidado de escolher valores de X dentro da faixa de valores observados da varivel independente. 4. TENDNCIA (srie y; srie x; xs; constante): d como resultado o valor da reta de regresso linear simples, para um nico ou um projetado Y grupo de valores de X, denominado como Xs, quando conhecidas as duas sries de dados. Quando o argumento constante for: a. VERDADEIRO (ou omitido) a funo fornecer um nico ou um grupo = a + bx. de valores da reta de regresso Y b. FALSO, a funo TENDNCIA fornece os resultados da reta de = bx, isto , com a = 0. regresso Y A ferramenta mais completa a Regresso (Anlise de Dados) que ser vista em mais detalhes em seguida, com a validao da regresso.