Escolar Documentos
Profissional Documentos
Cultura Documentos
1.1 Introduo
Cap. Cap.
Anlise de regresso uma tcnica de modelagem utilizada para analisar a relao entre uma varivel dependente (Y) e uma ou mais variveis independentes X1, X2, X3, , Xn ! o"#etivo dessa tcnica identi$icar (estimar) uma $uno %ue descreve, o mais pr&'imo poss(vel, a relao entre essas variveis e assim podermos predizer o valor %ue a varivel dependente (Y) ir assumir para um determinado valor da varivel independente X )'emplos de relao entre variveis so o consumo em relao * ta'a de in$lao+ a produo de leite e temperatura am"iente+ a resist,ncia de um material e sua composio %u(mica+ o n-mero de peas com de$eitos e a e'peri,ncia+ receita e gasto com pu"licidade e etc ! modelo de regresso poder ser escrito genericamente como. Y = f ( X 1, X 2, X 3, , Xn) + , onde o termo representa uma pertur"ao aleat&ria na $uno, ou o erro da apro'imao ! n-mero de variveis independentes varia de uma aplicao para outra, %uando se tem apenas uma varivel independente c/ama0se 1odelo de 2egresso 3imples, %uando se tem mais de uma varivel independente c/ama0se de 1odelo de 2egresso 1-ltipla A $orma da $uno f ( ) tam"m varia, podendo ser representada por um modelo linear, polinomial ou at mesmo uma $uno no linear A $igura a"ai'o mostra um modelo linear para representar a relao entre a produo de leite e o (ndice pluviomtrico de um munic(pio
Produo de Leite x ndice Pluviomtrico y = 0.8x + 8.9
R2 = 0.7853 35 30 25 20 20 22 24 26 28 30
4or sua vez, os dados somente de e'portao de carne de $rango podero ser representados por um modelo polinomial con$orme mostrado na $igura a"ai'o
Yi = b6 + b1 X i + ,
32 30 28 26 24 22 20 20 22 24 26 28 30
! gr$ico acima uma representao desse modelo 7eri$ica0se pelo mesmo %ue nem todos os pontos tocam a reta, e essa di$erena o erro (), %ue pode ter sido ocasionado por um erro de leitura dos dados+ uma venda a"ai'o do preo real de mercado+ uma produo a"ai'o do esperado por uma estiagem no comum+ retrao do consumo por uma su"ida inesperada na ta'a de #uros+ e assim vai 1as sup8e0se %ue em mdia esses erros tendem a se anular, ou se#a. )( i ) = 6 9ma vez escol/ido o modelo de regresso, deve0se estimar seus par:metros, neste caso os coe$icientes da e%uao da reta, b6 , b1 ;sso pode ser $eito a partir da aplicao do 1todo dos 1(nimos <uadrados =irando a mdia so"re a e%uao acima, temos.
Y = b6 + b1 X
5/amando de > e ' as di$erenas centradas nas mdias, (Yi Y ) e ( X i X ) respectivamente, temos %ue.
y i = b1 xi + i
ou ainda,
i = y i b1 xi
( )
i i
= ( y i b1 xi )
( ) ( )
i
5omo o o"#etivo estimar uma e%uao %ue minimize os erros, devemos ento derivar a e%uao acima em relao a b1 e igualar a zero ) como no se tem os verdadeiros valores e sim uma amostra , ou se#a o valor a ser determinado um estimador do @ 5om isso temos. verdadeiro valor populacional, a nova nomenclatura para b1 ser b 1
@ 6 = 2xi y i + 2b xi2 1
@ = Y b @ X b o 1
2esoluo
1BC6 1BC1 1BC2 1BC3 1BCA 1BCE 1BCD 1BCC 1BCF 1BCB
Soma Mdia
Y 2D 2E 31 2B 2C 31 32 2F 36 36
X 23 21 2F 2C 23 2F 2C 22 2D 2E
>
-2.9 -3.9 2.1 0.1 -1.9 2.1 3.1 -0.9 1.1 1.1 0 0
'
-2 -4 3 2 -2 3 2 -3 1 0 0 0
>2
8.41 15.21 4.41 0.01 3.61 4.41 9.61 0.81 1.21 1.21 48.9 4.89
'2
4 16 9 4 4 9 4 9 1 0 60 6
'>
5.8 15.6 6.3 0.2 3.8 6.3 6.2 2.7 1.1 0 48 4.8
@ = b 1
x y x
i 2 i
@ = AF = 6 F , assim b 1 D6
@ = Y b @ X b o 1
, %ue
@ = 2F,B 6 F 2E =F,B b o
1as ser %ue a e%uao do e'emplo $oi "em estimada, ou mel/or, ser %ue ela representa "em a relao entre as variveisG 9ma maneira de avaliar atravs da 4ro$ 5ludio 3erra, )sp A
@ ), essa di$erena entre os valores amostrais reais (Y) e os valores estimados ( Y di$erena damos o nome de res(duo 5ontinuando o e'emplo,
Continuao do exemplo 1
1BC6 1BC1 1BC2 1BC3 1BCA 1BCE 1BCD 1BCC 1BCF 1BCB
Soma Mdia
Y 2D 2E 31 2B 2C 31 32 2F 36 36
289 28.9
X 23 21 2F 2C 23 2F 2C 22 2D 2E
250 25
>
-2.9 -3.9 2.1 0.1 -1.9 2.1 3.1 -0.9 1.1 1.1 0 0
'
-2 -4 3 2 -2 3 2 -3 1 0 0 0
>2
8.41 15.21 4.41 0.01 3.61 4.41 9.61 0.81 1.21 1.21 48.9 4.89
'2
4 16 9 4 4 9 4 9 1 0 60 6
'>
5.8 15.6 6.3 0.2 3.8 6.3 6.2 2.7 1.1 0 48 4.8
@ Y 27.3 25.7 31.3 30.5 27.3 31.3 30.5 26.5 29.7 28.9 289 28.9
@ Y0 Y
@ )2 (Y0 Y
-1.3 -0.7 -0.3 -1.5 -0.3 -0.3 1.5 1.5 0.3 1.1 0 0
1.69 0.49 0.09 2.25 0.09 0.09 2.25 2.25 0.09 1.21 11 1
@ ) so relativamente pe%uenas 9ma anlise 4odemos perce"er %ue as di$erenas (Y0 Y mais cuidadosa pode ser $eita atravs da aplicao de testes estat(sticos, nesse caso AJ!7A (teste de vari:ncia) e teste t03tudent 5omearemos pela AJ!7A, para tanto vamos precisar montar a ta"ela a"ai'o.
=a"ela AJ!7A
3oma dos <uadrados Kraus de Hi"erdade (g l ) <uadrados 1dios (<1)
@ 2 x2 3<)L b 1 i @ 3<2L Y Y
3<=L
=este ?
!"s. ! grau de li"erdade em relao ao 3<) devido a termos apenas uma varivel independente+ )m relao a 3<=, os graus devem ser iguais a vari:ncia amostral, ou se#a, n01 (onde n o n-mero da elementos da amostra)+ ) o grau de li"erdade para 3<2 seria dado pela di$erena entre este, ou se#a n02
1 n02 n01
3<)medM3<2med
2 i
3oma dos %uadrados e'plicados @ 2 x2 = b @ 2 x2 @2 = b SQE = Y i 1 i 1 i 3oma dos %uadrados dos res(duos
@ SQR = Y Y
9m outro par:metro utilizado constantemente o coe$iciente de determinao, 22, %ue e'plica percentualmente a relao entre as variveis do pro"lema
R2 = SQE SQT
1 F C
3F A 1 3F C 6D
2C F3
Agora %ue # temos o valor de ?, precisamos testar a /ip&tese nula %ue as vari:ncias so di$erentes, ou se#a, Oo L 12 Adotaremos um n(vel de signi$ic:ncia () de EP 5om esse valor e os n-meros de graus de li"erdade, ac/a0se na ta"ela um valor cr(tico de E 32 5omo o ? calculado maior %ue o ? cr(tico ento se re#eita a /ip&tese Oo, o %ue tam"m %uer dizer %ue as vari:ncias so iguais, e conse%Qentemente o modelo de regresso vlido
2esoluo
A varivel dependente (Y) ser o (ndice Produo de Leite x ndice pluviomtrico, sendo a produo de leite Pluviomtrico tipo c a varivel independente (X) 35 ! gr$ico dos dados do e'emplo 1 30 pode ser visto ao lado 4elo gr$ico o 25 20 a#uste linear pode ser poss(vel, mas talvez 20 22 24 26 28 30 um a#uste polinomial seria mais indicado, mas de %ual%uer $orma, ser testado um a#uste linear 3er utilizada a $erramenta 2egresso do so$tRare )'cel, %ue pode ser acionado pelo seguinte camin/o. ?erramenta Anlise de Sados 2egresso )m T;ntervalo Y de entrada.U devemos selecionar na planil/a o con#unto de clulas da varivel dependente 4or sua vez, em T;ntervalo X de entrada.U devemos selecionar na planil/a o con#unto de clulas da varivel independente Jesta #anela, tam"m podemos selecionar as op8es relativas aos res(duos 9ma vez selecionado as clulas, "asta clicar no "oto de T!VU %ue sero gerados os dados na planil/a
4ara o e'emplo em %uesto, podemos destacar das ta"elas geradas, as seguintes in$orma8es. Ja estat(stica padro. R-quadadro = 0.7852 Ja Anova. gl total = !=2 .25 ) por $im. ;nterseo 8. "ari#$%l X& 0.8 Assim a e%uao do modelo poder ser escrita como.
@ = F B + 6 FX Y 1i
! resultado mostrado gra$icamente a"ai'o )nto para um (ndice de 2Amm a produo de leite seria de 2F 1 mil/8es de litros de leite W importante ressaltar %ue o a#uste no $oi to "om, seria importante veri$icar um novo modelo
9ma outra maneira de $azer essa anlise, porm sem as mesmas in$orma8es seria utilizar o recurso de 'di(ionar )in*a d% T%nd+n(ia... Jo menu Kr$ico da "arra de menu do )'cel 3elecionado o modelo Hinear, clicamos na a"a T!p8esU e marcamos as op8es. Exibir %qua,-o no gr#fi(o e Exibir $alor do R-quadrado no gr#fi(o
Jo se es%uea, para inserir uma Hin/a de tend,ncia o gr$ico deve estar selecionado previamente
Produo de Leite x ndice Pluviomtrico y = 0.8x + 8.9
R2 = 0.7853 35 30 25 20 20 22 24 26 28 30
Se acordo com a Associao Xrasileira de )'portadora dos 4rodutores e )'portadores de ?rango, AX)?, a produo "rasileira de carne de $rango (em mil toneladas) para o mercado interno e e'terno no per(odo de 1BFB a 2663 dada pela ta"ela a"ai'o.
Ano 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 Mer ado ! n"erno 1,811 1,968 2,200 2,351 2,710 2,930 3,617 3,483 3,812 4,262 4,755 5,070 5,486 5,917 5,921 #x$or"a%&o 244 299 322 372 433 481 429 569 649 612 771 907 1,249 1,600 1,922 'o"a( 2,055 2,267 2,522 2,727 3,143 3,411 4,050 4,052 4,461 4,875 5,526 5,977 6,736 7,517 7,843
)on"e* A+#) - A,,o ia%&o +ra,i(eira do, -rod."ore, e #x$or"adore, de )ran/o, 0111.a2e3. om.2r4.
2esoluo
! primeiro passo para avaliar se os dados podem ser a#ustados por um modelo linear plotar suas variveis em um gr$ico
-rod.de arne de 3ran/o 10,000 8,000 6,000 4,000 2,000 0 5 10 15 20
4elo gr$ico perce"e0se uma tend,ncia %ue a relao entre a produo de carne de $rango (varivel dependente, Y) e o tempo (varivel independente, X) se#a dado por uma e%uao linear 4ara determinar essa e%uao ser utilizado o so$tRare )'cel Jo )'cel ser utilizada a $erramenta 2egresso %ue um m&dulo do 3uplemento Anlise de Sados
Acionando0se essa $erramenta, o passo seguinte ser preenc/er a cai'a de dilogo da 2egresso con$orme os dados !nde na opo ;ntervalo Y de )ntrada dever ser colocado o valor da varivel dependente, e na opo ;ntervalo X de )ntrada, dever ser colocado os valores da varivel independente
Ap&s o preenc/imento das cai'as de dilogo "asta pressionar o "oto de ./, e o resultado aparecer em uma nova planil/a A $igura a"ai'o mostra o resultado para o e'emplo em %uesto
16
Sessa planil/a se destacam os seguintes valores. Ja estat(stica padro. R-quadadro = 0. 087 Ja Anova. gl total =&1 !=102.25& ) por $im. ;nterseo &&103 "ari#$%l X 1&0320 Assim a e%uao do modelo poder ser escrita como.
@ = 11AD,BB + A1D,36 X Y 1i
4ode0se agora plotar os dados dos valores verdadeiros com os valores do modelo =am"m se pode $azer progn&stico para valores $uturos 4or e'emplo, para o ano de 266A o modelo prev, uma produo de C F6C toneladas de carne de $rango
Re/re,,&o 5inear
-rod.6arne e )ran/o
13
11
9ma outra maneira de $azer essa anlise, porm sem as mesmas in$orma8es seria utilizar o recurso de 'di(ionar )in*a d% T%nd+n(ia... no 1enu Kr$ico da "arra de menu do )'cel 3elecionado o modelo Hinear, clica0se na a"a !p8es e marca0se as op8es. Exibir %qua,-o no gr#fi(o e Exibir $alor do R-quadrado no gr#fi(o
15
11
Jo se es%uea, para inserir uma Hin/a de tend,ncia o gr$ico deve estar selecionado previamente
Produo brasileira de carne de frango milhes de t oneladas
9 8 7 6 5 4 3 2 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 )on"e* A+#) 0111.a2e3. om.2r4. Ano
Mi(78e, de "one(ada,
12
<ue $orma na realidade um sistema linear, %ue podermos escrever na $orma de matriz como.
) (X Y )
1 Y
4ela e%uao acima, / necessidade %ue o produto X4X, ten/a uma matriz inversa, o %ue implica na condio o"rigat&ria %ue nen/uma coluna da matriz X se#a com"inao linear das outras
2esoluo
Jesse caso ser $eito diretamente anlise sem plotar o gr$ico ! procedimento no so$tRare )'cel . ?erramenta Anlise de Sados 2egresso Jo campo ;ntervalo X de )ntrada deve ser preenc/ida com a $ai'a de valores das variveis independentes, %ue nesse caso so a %uilometragem e o tempo do camin/o Sa planil/a de resultados se destacam os seguintes valores.
1A
Ja estat(stica padro. R-quadadro = 0. Erro 5adr-o6 2.&00 Ja Anova. gl total =8 !=5050&.22 ) por $im. ;nterseo &7.72 "ari#$%l X& 1.00 % X2 8.507 Assim a e%uao do modelo poder ser escrita como.
@ = 1C C3 + A 6D X + BF E6C X Y 1i 2i
Assim para um camin/o com E anos com %uilometragem de 16 666 mil/as, o custo de manuteno ser de ZEE6 FB
1E
Ano 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003
Mer ado ! n"erno 1,811 1,968 2,200 2,351 2,710 2,930 3,617 3,483 3,812 4,262 4,755 5,070 5,486 5,917 5,921
#x$or"a%&o 244 299 322 372 433 481 429 569 649 612 771 907 1,249 1,600 1,922
'o"a( 2,055 2,267 2,522 2,727 3,143 3,411 4,050 4,052 4,461 4,875 5,526 5,977 6,736 7,517 7,843
)on"e* A+#) - A,,o ia%&o +ra,i(eira do, -rod."ore, e #x$or"adore, de )ran/o, 0111.a2e3. om.2r4.
2esoluo
Jesse e'emplo ser avaliada somente a produo para o mercado e'terno, o gr$ico %ue representa essa produo ao longo do ano pode ser visto logo a"ai'o
Produo para o mercado interno de carne de frango
2,500 2,000 1,500 1,000 500 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 :ado, reai,
Analisando o gr$ico acima, veri$ica0 se %ue o a#uste linear talvez no se#a o mel/or modelo para representar esses dados Assim, escol/e0se dentre os provveis o modelo polinomial de 3o grau
1D
Alm disso, na a"a .5,7%8 marca0se as cai'as Exibir %qua,-o no gr#fi(o e Exibir $alor d% R-quadrado no gr#fi(o 5om isso $eito o resultado pode ser visto na $igura seguinte 2epare na %ualidade do a#uste, o valor do coe$iciente de determinao $oi de 6 BB
Produo para o mercado interno de carne de frango
2,500 2,000 1,500 1,000 y = 1.5329x3 - 25.198x2 + 157.04x + 79.16 R2 = 0.9914 :ado, reai, A;.,"e -o(inomia(
Assim, pode0se ento 500 estimar a produo para o 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 mercado e'terno de carne de $rango para 266A ! valor previsto por esse modelo d ordem de 2A1B FC, pelo 8it% da AX)? (RRR a"e$ com "r) veri$icou0se %ue essa associao previa 211E, e a e'portao real em 266A $oi de 2AC6
1C
1F