Escolar Documentos
Profissional Documentos
Cultura Documentos
1
13.1 Introdução a regressão simples:
causalidade e os erros de previsão.
• A regressão demonstra quantitativamente a força atrás de uma
causalidade ou um simples relacionamento que ocorre de Xt para Yt.
2
Figura 13.1 - A reta estimada de
regressão no gráfico de dispersão
X-Y.
Yt Ŷt e t Ŷt â b̂X t
erros residuais
positivos et > 0
Yt Ŷt e t
erros residuais
negativos et < 0
3
13.2 Regressão simples com a
variável tempo.
Uma das maneiras mais fáceis de construir uma equação de regressão é
através da utilização de uma variável artificial que representa tempo como
variável independente Xt. Imaginando por exemplo que Yt represente o
preço médio mensal de um quilo de banana (Preçot), durante um ano terá
doze preços mensais em seqüência. Para 12 meses, a variável Xt = t
corresponderia à seqüência de
t = 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12
ˆ +e
Preço t aˆ bt
A equação de regressão seria a seguinte: t
t 1 t 1
â
Y t b̂ X t
Yt b̂X t
T
6
13.4 Exemplo: Previsão de vendas
VENDAS VENDAS ERRO
MES
MENSAIS ESTIMADAS RESIDUAL
1 1102 -4195,17 -5297,17
2 2030 -1681,17 -3711,17
Tabela 13.1 – 3 5838 832,8333 -5005,17
4 6995 3346,833 -3648,17
Vendas de 5 6283 5860,833 -422,167
camisetas e 6 1719 8374,833 6655,833
7 25263 10888,83 -14374,2
previsões 8 19244 13402,83 -5841,17
9 23171 15916,83 -7254,17
10 19146 18430,83 -715,167
11 37174 20944,83 -16229,2
12 16691 23458,83 6767,833
13 4235 25972,83 21737,83
14 15077 28486,83 13409,83
15 11791 31000,83 19209,83
16 17497 33514,83 16017,83
17 11353 36028,83 24675,83
18 3646 38542,83 34896,83
19 56471 41056,83 -15414,2
20 44973 43570,83 -1402,17
21 66937 46084,83 -20852,2
22 59371 48598,83 -10772,2
23 84512 51112,83 -33399,2
24 52661 53626,83 965,8333
7
Figura 13.2 - A reta de regressão para a
demanda de camisetas
Os valores de
a ( = - 6709) e
b ( = 2514)
são os melhores
estimativos
considerando o critério
de minimização da
soma dos erros
quadrados. Qualquer
outra reta com outros
valores de a e b será
associada a uma soma
de quadrados dos erros
residuais maior.
8
Tabela 13.2– Previsões para a venda de camisetas
MES VENDAS
FUTURAS
Para calcular previsões fora da
amostra observada para os 25 56140,0
meses 25 e 26, 26 58654,0
utiliza-se a equação estimada. 27 61168,0
28 63682,0
O valor da previsão para o mês 29 66196,0
25 é 56.140 camisetas 30 68710,0
(= - 6709 + 2514*25), 31 71224,0
e para mês 26, 58.654 32 73738,0
camisetas. 33 76252,0
34 78766,0
35 81280,0
36 83794,0
9
Ŷ
13.5 Coeficiente de determinação - R2.
t 1
n
(Y Y) 2
Variância = SY2 = i = SQT/(n – 1)
i 1 n 1
11
Figura 13.3 – A reta de regressão e o
erro total e o da regressão
12
6; 11,2 8; 9,6 10; 11
10 ERRO
REGRESSÀO ERRO
8 TOTAL
3; 7,1
Y 6
9; 5,3
2; 4,4 7; 5,9
4; 5,8
4
1; 2,7 5; 3,5
2
0; 1
0
0 1 2 3 4 5 6 7 8 9 10 11
X
12
Continuação: Coeficiente de
determinação - R2.
T
SQT Yt Y = 1,3E+10
2
t 1
T
SQE Yt Ŷt
2
= 5,74E+09
t 1
13
13.6 Natureza estatística da reta
estimada
Veja na Figura 13.4 (próxima transparência) a relação entre as variáveis Xt e
Yt e a distribuição normal que está relacionada à aleatoriedade de Yt.
Y
X
15
13.7 Normalidade, independência e a
constância da variância dos erros residuais.
Foram apresentados no capítulo 6 os testes de Bera-
Jarque e testes visuais como o da linha reta entre
valores teóricos e observados e o histograma.
1
Erro residual
-1
-2
-3
-4
17
13.8 Desvio padrão (erro padrão) dos estimadores dos
coeficientes e intervalo de confiança.
Y Ŷ t
2 2
e
se t t
T2 T2
Inferior Superior
Coeficientes Erro padrão 95% 95%
Interseção a = -220.156 = 126.015 -481.496 41.183
PIB b = 2294 = 1.180 -152 4.742
P aˆ t 0,025, 22s aˆ a aˆ t 0,025, 22s aˆ 95%
24
ANOVA - Estatística F: a dureza
de Brinell
ANOVA
gl SQ MQ F Valor P
Regressão 1 5297,513 5297,513 506,5062 2,16E-12
Resíduo 14 146,425 10,45893
Total 15 5443,938
25
13.12 Teste de hipótese, o exemplo de coeficientes individuais
de regressão.
Um teste de hipótese pode ser montada para cada coeficiente individualmente, no caso de regressão
simples para a e b. A hipótese nula segue em geral o valor zero para o coeficiente sob investigação,
por exemplo,
H0 : b = 0
A hipótese alternativa H1, para onde o pesquisador gostaria de apontar a verdade com suas
conjecturas, muitas vezes é simplesmente:
H1: b ≠ 0
Dependendo do caso, H1 pode assumir outras formas como b > 0 ou b < 0. É importante na análise
de regressão, e Estatística em geral, que as hipóteses nulas e alternativas sejam bem definidas, e em
áreas de estudo como as engenharias ou as ciências exatas, que as hipóteses sejam colocadas nos
relatórios e artigos explicitamente e em destaque.
26
Continuação: 13.12 Teste de hipótese, o exemplo de
coeficientes individuais de regressão.
Estatística de regressão
R-Quadrado 0,87
Erro padrão 4,06
Observações 25
ANOVA
gl SQ MQ F valor-p
Regressão 1 2627,43 2627,43 159,36 0,00
Resíduo 23 379,21 16,49
Total 24 3006,64
Coeficiente Erro
s padrão Stat t valor-p
Interseção 51,95 2,13 24,41 0,00
PRESSÃO -0,40 0,03 -12,62 0,00
30
Continuação: 13.13 Não linearidade, e
retornando ao exemplo do Boyle
Aparentemente, os resultados comprovam uma forte relação inversa
31
Figura 13.6 – Erros residuais como a diferença
entre volume e a previsão
60
50
40
30 VOLUME
Previsto
20
10
0
20 100 120 140
-10 32
Continuação: 13.13 Não linearidade, e
retornando ao exemplo do Boyle
Na figura 13.6, nos primeiros valores do eixo horizontal de
pressão, volume previsto é sempre menor que volume observado
e, portanto o resíduo é sempre positivo.
33
Continuação: 13.13 Não linearidade, e
retornando ao exemplo do Boyle
Para resolver o problema da previsibilidade dos erros, podemos
questionar em primeiro lugar a linearidade da equação
estimada.
1/V = a + bP,
34
Tabela 13.9 – Resultados da regressão de
pressão sob a inversa de volume, adaptados
do Excel 2002.
Estatística de regressão
R-Quadrado 0,9999
Erro padrão 0,0002
Observações 25,0000
ANOVA
gl SQ MQ F valor-p
Regressão 1,0000 0,0081 0,0081 210329 0,0000
Resíduo 23,0000 0,0000 0,0000
Total 24,0000 0,0081
Erro
Coeficientes padrão Stat t valor-p
Interseção 0,0000 0,0001 -0,0163 0,9871
PRESSÃO 0,0007 0,0000 459 0,0000
35
Continuação: 13.13 Não linearidade, e
retornando ao exemplo do Boyle
Comparando os resultados das tabelas 13.8 e 13.9, a utilização
da inversa de volume melhora os resultados em quase todas
as categorias, principalmente na estatística F, de 159,36 para
210.329.
37
Figura 13.7 – Erros residuais para o modelo
inversa de volume.
0,0005
0,0004
0,0003
0,0002
0,0001
Resíduos
0
-0,0001 0 5 10 15 20 25 30
-0,0002
-0,0003
-0,0004
-0,0005
1/V previsto
38
Continuação: 13.13 Não linearidade, e
retornando ao exemplo do Boyle
A questão agora é como resolver esse problema de
heterocedasticidade.
1/VP = a(1/P) + b. 39
Tabela 13.10 – Resultados da regressão
1/VP = a(1/P) + b, adaptados do Excel 2002.
Estatística de regressão
R-Quadrado 0,0059
Erro padrão 3,187E-06
Observações 25
ANOVA
gl SQ MQ F valor-p
Regressão 1 1,40E-12 1,4E-12 0,13756 0,71411
Resíduo 23 2,34E-10 1,02E-11
Total 24 2,35E-10
40
Figura 13.8 – Erros residuais para o modelo
1/VP = a(1/P) + b
0,000006
0,000004
0,000002
Resíduos
0
-0,000002
-0,000004
-0,000006
1/VP previsto
41
13.14 Conclusões
42