Introdução À Regressão Linear

Introduo Regresso Linear Consideremos uma coleo de pares ordenados obtidos em funo de algum experimento, como: x x1 y y1 x2 y2 x3 y3 x4 y4 x5 y5 ... ...
. xn-1 yn-1 xn yn
A colocao destes pares ordenados num plano cartesiano, depende dos valores de xi e yi, (i=1..n) e pode fornecer um grfico como:
Um fato que atrai pesquisadores aplicados das mais diversas reas a possibilidade de obter uma funo real que passe nos pontos ou pelo menos passe prximo dos pontos (xi,yi) dados. Estudando uma Matemtica mais aprofundada existe a Teoria de
Interpolao que a rea que estuda tais processos para obter funes que passam exatamente pelos pontos dados, enquanto que a Teoria de Aproximao estuda processos para obter funes que passem o mais prximo possvel dos pontos dados. bvio que se pudermos obter funes que passem prximas dos pontos dados e que tenham uma expresso fcil de ser manipulada, teremos obtido algo positivo e de valor cientfico. Dentre os processos matemticos que resolvem tal problema, com certeza, um dos mais utilizados o Mtodo dos Mnimos Quadrados, que serve para gerar o que se chama em Estatstica: Regresso Linear ou Ajuste Linear. As curvas mais comuns utilizadas pelos estatsticos so:
Ordem 1 2 3 4
Funo y = ao+a1 x y = ao+a1 x+a2 x y = ao+a1 x+a2 x+a3 x
Nome Reta Parbola Cbica
y = ao+a1 x+a2 x+a3 x+a4 x4 Qurtica
A idia bsica para qualquer uma das funes acima citadas tentar descobrir quais so os valores dos coeficientes ao, a1, a2 e a3, de tal modo que a soma dos quadrados das distncias (tomadas na vertical) da referida curva y=f(x) a cada um dos pontos dados (yi) seja a menor possvel, da o nome Mtodo dos Mnimos Quadrados. Para obter tais coeficientes, deve-se conhecer conceitos de Derivadas Parciais, a Teoria de Mximos e Mnimos de funes de vrias variveis e as caractersticas de formas quadrticas positivas definidas de funes de vrias variveis envolvidas com o Teorema de Sylvester. Tais teoremas so normalmente encontrados em bons livros de lgebra Linear e Clculo Avanado. Para no nos perdermos em consideraes tericas, apresentarei aqui as frmulas para a obteno da Regresso Linear para a Reta, a Parbola e a Cbica. Observao: Se voc est interessado em aprender o "processo", fique atento s mudanas que ocorrem quando passamos da reta para a parbola e da parbola para a cbica. No construiremos o processo para a qurtica, mas julgo que voc saber constru-lo com o material apresentado. Notaes usadas na sequncia

n=Nmero de pares ordenados SX=x1+x2+x3+...+ xn = Soma dos xi SY=y1+y2+y3+...+yn = Soma dos yi SXY=x1 y1+x2 y2+x3 y3+...+xn yn = Soma dos xiyi
SX2=(x1)+(x2)+(x3)+...+(xn) = Soma dos xi SX3=(x1)+(x2)+(x3)+...+(xn) = Soma dos xi SX4=(x1)4+(x2)4+(x3)4+...+(xn)4 = Soma dos xi4 SX5=(x1)5+(x2)5+(x3)5+...+(xn)5 = Soma dos xi5 SX6=(x1)6+(x2)6+(x3)6+...+(xn)6 = Soma dos xi6 SX2Y=(x1)y1+(x2)y2 +...+(xn)yn=Soma dos xiyi SX3Y=(x1)y1+(x2)y2+...+(xn)yn=Soma dos xiyi
Para obter a reta dos mnimos quadrados, basta resolver o sistema linear com 2 equaes e 2 incgnitas ao e a1 : ao n+a1 SX = SY ao SX+a1 SX2 = SXY Na forma matricial este sistema pode ser escrito como: n SX . SX SX2 a1 a0 = SXY SY
Para resolver este sistema, existem vrios mtodos, mas a Regra de Cramer d uma resposta rpida para os coeficientes: ao = (SY.SX2-SX.SXY)/(n SX2-SX.SX) a1 = (n SXY-SX.SY) / (n SX2-SX.SX) A parbola dos mnimos quadrados Para obter a parbola de melhor ajuste, basta resolver o sistema com as 3 incgnitas ao, a1 e a2: ao n+a1 SX+a2 SX2 = SY ao SX+a1 SX2+a2 SX3 = SXY ao SX2+a1 SX3+a2 SX4 = SX2Y Este sistema pode ser escrito na forma matricial como: n SX SX2 . a0 = SY
SX SX2 SX3 SX2 SX3 SX4
a1 a2
SXY SX2Y
Observao: Encontre as diferenas entre este sistema e o sistema obtido no caso anterior da reta. Como todos os termos da primeira matriz (matriz dos coeficientes) e da ltima matriz (matriz das constantes) so conhecidos, fica fcil resolver o sistema pelo processo de inverter a primeira delas e multiplicar pela ltima para obter os coeficientes ao, a1 e a2 . A cbica dos mnimos quadrados Para obter a cbica dos mnimos quadrados resolve-se o sistema de equaes com 4 equaes e 4 incgnitas ao, a1, a2 e a3, colocado na forma matricial: n SX SX2 SX3 a0 a1 . SX2 SX3 SX4 SX5 SX3 SX4 SX5 SX6 a2 a3 = SX2Y SX3Y SY SXY
SX SX2 SX3 SX4
Como os termos da primeira e ltima matrizes so conhecidos, pode-se resolver o sistema invertendo a primeira matriz e multiplicando pela ltima. A qurtica dos mnimos quadrados Observao: Observe novamente as diferenas entre o sistema obtido para a cbica e os sistemas obtidos nos casos da reta e da parbola. De posse de tais informaes, voc estaria capacitado a produzir a curva qurtica de melhor ajuste dos mnimos quadrados apenas com o material apresentando aqui? possvel estender o mtodo para a construo de uma superfcie de melhor ajuste no espao tridimensional.
Regresso Linear no espao Agora estudaremos uma situao no espao R onde conhecido um conjunto de pontos (ternos) dados por: C = { (xi, yi, zi) : i=1,2,3,...,n } Desejamos ajustar uma superfcie da forma z = f(x,y) = a+b x+c y+d x+e xy+f y Usando procedimentos semelhantes ao caso do plano, poderemos construir uma funo: S(a,b,c,d,e,f) = Soma (z-zi)
onde esta soma tomada sobre todos os i=1,2,3,4,...,n. Esta funo S no negativa e diferencivel, assim podemos garantir que o ponto de mnimo para S ocorrer quando o gradiente da funo S for nulo, isto , quando: Sa = Sb = Sc = Sd = Se = Sf = 0 o que equivale a: Sa = 2 Soma (z-zi).(1) = 0 Sb = 2 Soma (z-zi).(xi) = 0 Sc = 2 Soma (z-zi).(yi) = 0 Sd = 2 Soma (z-zi).(xi) = 0 Se = 2 Soma (z-zi).(xiyi) = 0 Sf = 2 Soma (z-zi).(yi) = 0 A notao Sm usada significa a derivada parcial da funo S em relao varivel m, onde m pode ser a,b,c,d,e ou f. Temos aqui um sistema com 6 equaes e 6 incgnitas, que pode ser reescrito como:
Soma (a+bxi+cyi+dxi+exiyi+fyi - zi) = 0 Soma (a+bxi+cyi+dxi+exiyi+fyi - zi)(xi) = 0 Soma (a+bxi+cyi+dxi+exiyi+fyi - zi)(yi) = 0 Soma (a+bxi+cyi+dxi+exiyi+fyi - zi)(xi) = 0 Soma (a+bxi+cyi+dxi+exiyi+fyi - zi)(xiyi) = 0 Soma (a+bxi+cyi+dxi+exiyi+fyi - zi)(yi) = 0 Passando as constantes para o segundo membro da igualdade de cada equao, teremos o sistema com 6 equaes e 6 incgnitas: an + b X1Y0 + c X0Y1 + d X2Y0 + e X1Y1 + f X0Y2 = Z1X0Y0
a X1Y0 + b X2Y0 + c X1Y1 + d X3Y0 + e X2Y0 + f X1Y2 = Z1X1Y0 a X0Y1 + b X1Y1 + c X0Y2 + d X2Y0 + e X1Y2 + f X0Y3 = Z1X0Y1 a X2Y0 + b X3Y0 + c X2Y1 + d X4Y0 + e X3Y1 + f X2Y2 = Z1X2Y0 a X1Y1 + b X2Y1 + c X1Y2 + d X3Y1 + e X2Y2 + f X1Y3 = Z1X1Y1 a X0Y2 + b X1Y2 + c X0Y3 + d X2Y2 + e X1Y3 + f X0Y4 = Z1X0Y2 onde n o nmero de ternos ordenados e

XpYq = x1p y1q + x2p y2q + ...+xnp ynq Z1XpYq = z1x1p y1q + z2x2p y2q +...+ znxnp ynq
sendo que p e q podem assumir os valores 0,1,2,3 ou 4. Este sistema pode ser escrito na forma matricial: n X1Y0 X0Y1 X2Y0 X1Y1 X0Y2 a b c . X2Y0 X3Y0 X2Y1 X4Y0 X3Y1 X2Y2 X1Y1 X2Y1 X1Y2 X3Y1 X2Y2 X1Y3 X0Y2 X1Y2 X0Y3 X2Y2 X1Y3 X0Y4 d e f = Z1X2Y0 Z1X1Y1 Z1X0Y2 Z1X0Y0 Z1X1Y0 Z1X0Y1
X1Y0 X2Y0 X1Y1 X3Y0 X2Y0 X1Y2 X0Y1 X1Y1 X0Y2 X2Y0 X1Y2 X0Y3
Para resolver este sistema, sugiro que utilize uma planilha de clculo. Existem muitas disponveis gratuitamente na Internet. Em qualquer uma delas, deve-se montar a planilha como a que aparece abaixo, dando uma forte nfase na ltima linha que a mais importante e que contem as somas necessrias montagem do sistema. ABCD E F G H 1 2 3 4 ... n n+1 Soma Aps a construo da tabela acima, deve-se construir uma segunda tabela com a matriz aumentada do sistema. Nesta nova tabela aparecero todas as somas calculadas na tabela anterior (indicadas na linha em amarelo) e pode-se observar que a nova matriz ser simtrica: n X1Y0 X0Y1 X2Y0 X1Y1 X0Y2 Z1X0Y0 I J K L M N O P Q R S T
x y z x xy y xy xy xy x y xy x4 xy xy zx zy zx zxy zy
X1Y0 X2Y0 X1Y1 X3Y0 X2Y0 X1Y2 Z1X1Y0 X0Y1 X1Y1 X0Y2 X2Y0 X1Y2 X0Y3 Z1X0Y1 X2Y0 X3Y0 X2Y1 X4Y0 X3Y1 X2Y2 Z1X2Y0
X1Y1 X2Y1 X1Y2 X3Y1 X2Y2 X1Y3 Z1X1Y1 X0Y2 X1Y2 X0Y3 X2Y2 X1Y3 X0Y4 Z1X0Y2 Matriz dos coeficientes Matriz das constantes
Na sequncia, deve-se obter a inversa da matriz dos coeficientes e multiplic-la pela matriz das constantes para obter uma matriz com 6x1, que exatamente a matriz dos coeficientes procurados: a b c = d e f ... ... ... ... ... ...
Resoluo de um problema prtico Consideremos os dados fornecidos na tabela: X 30 30 30 30 10 10 10 10 4 Y 1,5 2 3 5 1,5 2 3 4 4 4 1 1 1 1
5 1,5 2 3 5 1,5 2 3 5
Z 73 41,2 18,4 6,8 43,5 23,7 10,5 3,9 26,7 15 6,8 2,2 13,5 7 3,7 1,5 Pergunta: Qual a funo matemtica que relaciona as variveis x e y com a varivel z? Resposta: Tentei obter uma funo quadrtica da forma: z = a + b x + c y + d x + e xy + f y que se ajustasse aos dados. Como a soma dos quadrados dos erros ficou muito grande, alterei a estratgia de anlise. Observei que os dados x e z eram grandes em relao aos dados y, assim, tomei os logaritmos naturais dos dados x e z e refiz todas as operaes e obtive um ajuste muito bom! Na sequncia eu apresento alguns detalhes dos clculos. Os coeficientes calculados so: a=-0,08519, b=0,069359, c=0,349672, d=-0,0096, e=-0,01209, f=0,000927 A funo deveria ser a seguinte: z=-0,08519+0,069359x+0,349672y-0,0096x-0,01209xy+0,000927y mas como eu usei Ln(x) e Ln(z), respectivamente nos lugares de x e z, ento a forma que resolve o problema com grande preciso : Ln(z)=-0,08519+0,069359Ln(x)+0,349672y-0,0096(Ln(x))0,01209y.Ln(x)+0,000927y Para obter o valor de z, calculamos a exponencial de Ln(z) uma vez que a funo exponencial a inversa da funo logaritmo natural.

Introdução À Regressão Linear

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Introdução À Regressão Linear

Enviado por

Direitos autorais:

Formatos disponíveis

Introduo Regresso Linear Consideremos uma coleo de pares ordenados obtidos em funo de algum experimento, como: x x1 y y1 x2 y2 x3 y3 x4 y4 x5 y5 ... ...

Funo y = ao+a1 x y = ao+a1 x+a2 x y = ao+a1 x+a2 x+a3 x

Nome Reta Parbola Cbica

y = ao+a1 x+a2 x+a3 x+a4 x4 Qurtica

SX SX2 SX3 SX2 SX3 SX4

SX SX2 SX3 SX4

Resoluo de um problema prtico Consideremos os dados fornecidos na tabela: X 30 30 30 30 10 10 10 10 4 Y 1,5 2 3 5 1,5 2 3 4 4 4 1 1 1 1

Você também pode gostar