ECONOMETRIA
Regressão Linear Simples
Regressão Potencial; Exponencial;
Hiperbólica
Regressão Linear Múltipla
CONCEITO DE ECONOMETRIA
1.- CONCEITO
Ela surgiu da seguinte forma: no início, a Teoria Econômica não tinha muitas
preocupações com a parte empírica, mas sim, com a construção de uma arcabouço
teórico, ou seja; a partir das hipóteses que ela estabelecia, procurava tirar proposições que
deveriam explicar o comportamento dos agentes econômicos, sem preocupações com a
parte empírica.
Foi justamente para cobrir esses dois aspectos, que surgiu a Econometria.
Dessa forma a Econometria surgiu com o objetivo de dar conteúdo empírico à Teoria
Econômica, isto é, dar resposta quantitativa às perguntas que os economistas não
poderiam dar apenas com a Teoria Econômica.
2.- CAMPOS
O Estudo da Econometria divide-se em dois grandes campos:
Y = C + 1 (Condição de equilíbrio)
C = a + bY (Função consumo)
A estimação dos parâmetros deve serfeita simultâneamente com duas (ou mais) equações.
A principal técnica econométrica consiste na Análise de Regressão Linear, que pode ser
Simples (apenas uma variável explicativa), ou Múltipla (mais de uma variável
explicativa).
1.- INTRODUÇÃO
b) a renda per capita da comunidade, que chamaremos de X2; a medida em que a renda
aumenta, há um número maior de pessoas em condições de adquirir o bem “A”,
aumentando consequentemente suas vendas, desde que “A” não seja um bem inferior.
c) os gastos com propaganda, que chamaremos de X3; a medida em que os gastos com
propaganda aumentam, há uma expansão das vendas do produto “A”, caso a propaganda
seja realmente eficiente.
d) poder-se-ia considerar ainda uma série de outras variáveis X4, X5, ........ Xn, tais
como: gosto dos consumidores, qualidade do produto “A”, qualidade dos prosutos
concorrentes, etc., que podem ser qualificáveis ou não.
Portanto, já sabemos que existe uma série de variáveis (X1, X2, ........... Xn) que
influenciam Y, mas na análise de regressão linear simples, trabalhamos apenas uma
variável explicativa X (*). Para superar este problema, isolamos a variável que parece ser
mais explicativa, desde que seja quantificável e trabalhamos com esta variável. Por
exemplo, se estamos interessados em analisar o comportamento das vendas de
automóveis no Brasil, poderemos utilizar a renda per capita como variável explicativa.
Neste caso, a quantidade vendida de automóveis é uma função de renda per capita.
caficamente:
Y=α +βX.+U
onde:
Y = Y observado = variável dependente
X = variável independente ou variável explicativa
α = intercepto
β = declividade ou coeficiente angular
U = componente aleatória (ou desvio ou componente errática ou erro)
Nesta variável “U” estão contidos os efeitos de todas as variáveis que atuam sobre Y,
além de X. Neste exemplo citado, poder-se-ia considerar como contidos em “U”, os
efeitos de variáveis como a taxa de juros cobrada no financiamento de automóveis, o
preço da gasolina (variáveis quantificáveis), qualidade dos automóveis, gosto dos
consumidores, etc. (variáveis não quantificáveis). A soma de todos estes efeitos é a
componente aleatória “U”. Claramente, estes problemas causam desvios em torno da reta
Y = α + β X + U, onde:
(α + β X) é a parcela livre das causas aleatórias (no exemplo, é a parcela explicada pela
renda per capita).
1
Na regressão linear múltipla, podemos trabalhar com uma série de variáveis explicativas, mas este
método será objeto de estudo mais adiante (parte III).
y = y estimado
a = estimativa do intercepto
b = estimativa da declividade
x = variável explicativa
e = estimativa do erro
Graficamente:
Y = A + BX
2
3. Os passos da Análise de Regressão Linear Simples
A especificação do modelo na regressão linear simples consiste de duas fases: seleção de
variáveis e especificação da forma funcional.
Como vimos, a regressão linear simples procura estabelecer relações entre variáveis.
Sempre que estamos interessados em analisar o comportamento de uma variável
dependente “Y” para estabelecer previsões sobre seu futuro comportamento, precisamos
selecionar uma variável independente “X”, que julgamos explicar o máximo possível o
comportamento desta variável “Y”. Exemplos:
2º) Se queremos analisar a venda de automóveis marda FORD, tipo Corcel, podemos
selecionar como variável explicativa o preço relativo do Corcel, isto é, P.Corcel . Então
P.Concor.
Qvc = f (Pcorcel); a medida em que o preço relativo do Corcel aumenta, deve reduzir sua
quantidade vendida.
Às vezes, informações sobre nossa variável explicativa não estão disponíveis por falta de
estatísticas. Para solucionar problemas como este, pode ser utilizada uma variável
“proxy”, que é uma variável que substitui aproximadamente a que estamos procurando.
Por exemplo, podemos medir a renda per capita de uma dada cidade (informação não
disponível) pela arrecadação de impostos (imposto de renda ou imposto sobre produtos
industrializados) ou ainda pelo consumo de energia elétrica.
2
O estudo de Regressão Linear Simples está consubstanciado em algumas hipóteses básicas, que serão
discutidas no capítulo VII.
a) o tamanho da amostra,
c) o período escolhido para a amostragem deve ser tal que outras condições que possam
influir no problema hajam permanecido aproximadamente as mesmas.
Nesta fase do processo, estamos interessados em saber a forma pela qual a variável
independente exerce influência sobre a variável independente. Uma vez selecionadas as
variáveis, devemos descobrir qual a função que melhor descreve o comportamento de
“Y”, quando “X” varia.
Nós sabemos que a quantidade vendida do produto “A”, é uma função dos gastos com
propaganda efetuadas pela empresa “A”, mas, muitas vezes, não temos condição de saber
se esta função é uma reta, uma exponencial ou uma potência.
A especificação da forma funcional entre “Y” e “X” pode ser feita de duas formas. Às
vezes, a teoria subjacente ao desenvolvimento do problema pode sugerir precisamente a
forma funcional a ser utilizada, ou então, poderá sugerir a forma funcional a ser utilizada,
ou então, poderá sugerir certas condições parciais sobre o intercepto, declividade ou
curvatura da função. Neste caso, estaremos partindo de uma especificação “a priori”.
Outra forma de especificar a forma funcional entre “X” e “Y” é o emprego do diagrama
de dispersão. O diagrama de dispersão é a “nuvem” de pontos que obtemos quando
colocamos os pares de valores das variáveis no gráfico. Para cada observação da amostra
, teremos tanto um valor de Y observado com um de X observado. Por exemplo,
considere o preço do prosuto “A” (preço relativo) e a quantidade vendida deste produto
nos anos de 1965 a 1974.
FÓRMULAS
( Σ X . Σ Y)
Σ XY - _____________
n
RXY = __________________________________________
____________________________________________________
| 2 2 |
_ | 2 (ΣX) 2 (ΣY)
\ | Σ X - ________ . Σ Y - __________
\ n n
TABELA DE CORRELAÇÃO
1---------------> perfeita
0,8 -------|0,99 forte OBS.: Pode ser positiva
0,6 -------| 0,8 média ou negativa
0,3 -------| 0,6 fraca
0 ---------| 0,3 fraquíssima
0----------| nula
_ ΣX
Média de X : X = _____
n
_ ΣY
Média de Y : Y = ______
n
_ _
Σ xy - n (x) . (y)
b= ________________
2 _ 2
Σ x - n(x)
ERRO PADRÃO
__________________________________
| 2 |
| Σ y - a Σ y - b Σ xy
Sxy = _ | ______________________________
\ | n - 2
\ |
2
Poder Explicativo da Regressão - R
2 _ 2
2 a Σ y + b Σ xy - n y
R = _________________________ . 100
| Σ y 2 - n y2
b x + b
y=a.x y=a.b y = a - __
x
ln y = U
ln x = V U = A + b.V
ln a = A OBS.: LN = LOGARÍTIMOS
NEPERIANOS
LOGO : X = V
Y = U
2 2
Sequência da Tabela : X, Y, V, U, V , Y , UV
ΣU
Média de U = _______
n
ΣV
Média de V = ______
n
2
2 (ΣU)
SUU = Σ U - ________
n
2
2 (Σ V)
SVV = Σ V - _________
n
(ΣU. ΣV)
SUV = Σ UV - ____________
n
_ _
Cálculo de A A=U -b V
SUV
Cálculo de B B= _______
SVV
2
2 b . SVV OBS.: VARIA DE 0 A 100% , E QUAN-
R = ____________ . 100 TO MAIS O RESULTADO SE
APRO-
SUU XIMAR DE 100%, MAIS CONFIÁ-
VEL SÃO AS PROJEÇÕES.
________________
| 2 |
Correlação = - | R
\ | _____
\| 100
( Σ X´) . (Σ Y)
_ Σ X´ Σ YX´ - ______________
X´ = _____ B= n
n ____________________________
2 2
Σ X´ = (Σ X´ )
_ Σ Y´ ______
Y´ = _____ n
n _ _
A= Y - b . X
Y = a+ b
- ____
X
_ 2
2 a Σ Y + b Σ X´ Y - n . Y
R = _________________________ . 100
2 _2
ΣY - n . Y
___________
| 2 |
X´ Y = - | R
\ | _____
\| 100
x y x2 y2 x.y
825 3,5 680.625 12,25 2.887,5
215 1,0 46.225 1,00 215,0
1.070 4,0 1.144.900 16,00 4.280,0
550 2,0 302.500 4,00 1.100,0
480 1,0 230.400 1,00 480,0
920 3,0 846.400 9,00 2.760,0
1.350 4,5 1.822.500 20,25 6.075,0
325 1,5 105.625 2,25 487,5
670 3,0 448.900 9,00 2.010,0
1.215 5,0 1.476.225 25,00 6.075,0
somatório 7.620 28,5 7.104.300 99,75 26.370,0
x = 762
y = 2,85
correlação:
(Sx.Sy)
rxy = S xy - n
(Sx2- (Sx)2).(Sy2-(Sy)2)
n n
(7.620 . 28,5)
rxy = 26.370- 10
(7.104.300- (58.064.400)).(99,75-812,25)
10 10
equação de regressão:
b = 0,003 0,0036
a = 0,5 0,564
y = a + bx
EXEMPLO
x = 285,4
y = 70,1
correlação:
(Sx.Sy)
rxy = S xy - n
(Sx2- (Sx)2).(Sy2-(Sy)2)
n n
equação de regressão:
b = Sxy - n (x).(y)
Sx2 - n (x)2
b = 0,1
a = y - bx
a = 41,6
erro padrão:
Sxy = 7
equação de projeção:
y = a + bx
y = 101,6 milhões
Respostas:
EXEMPLO NÚMERO 2
A tabela a seguir mostra uma relação entre a nota final de
estatística
e o número de horas que os alunos estudaram.
y x
notas horas y2 x2 x.y
estudo
9 30 81 900 270
8 25 64 625 200
7 20 49 400 140
6 15 36 225 90
5 14 25 196 70
4 14 16 196 56
3 10 9 100 30
2 5 4 25 10
1 3 1 9 3
somatório 45 136 285 2.676 869
Pede-se:
(Sx2- (Sx)2).(Sy2-(Sy)2)
n n
média:
x = 15,1
y = 5,0
b = Sxy - n (x).(y)
Sx2 - n (x)2
b = 0,3
a = y - bx
a = 0,5
y = a + bx
erro padrão:
Sxy = 0,5
Respostas:
Exercício:
x y
x = 4,0
y = 30,3
correlação:
(Sx.Sy)
rxy = S xy - n
(Sx2- (Sx)2).(Sy2-(Sy)2)
n n
equação de regressão:
b = Sxy - n (x).(y)
Sx2 - n (x)2
b = -6,7
a = y - bx
a = 57,1
erro padrão:
Sxy = 4
equação de projeção:
y = a + bx
para 95 y = 3,5
para 96 y = -3,2
EXERCÍCI
O
x y
quantidade
horas de micros x2 y2 x.y
c/defeito
18 9 324 81 162
12 8 144 64 96
10 7 100 49 70
8 6 64 36 48
6 5 36 25 30
5 4 25 16 20
4 3 16 9 12
somatório 63 42 709 280 438
x = 9,0
y = 6,0
correlação:
(Sx.Sy)
rxy = S xy - n
(Sx2- (Sx)2).(Sy2-(Sy)2)
n n
equação de regressão:
b = Sxy - n (x).(y)
Sx2 - n (x)2
b = 0,4
a = y - bx
a = 2,4
erro padrão:
Sxy = 1
equação de projeção:
y = a + bx
A idéia central da análise de Regressão Linear Simples era a de encontrar uma função
(estimada) que descrevesse (de forma mais perfeita possível) o comportamento de uma
variável que estivéssemos interessados em analisar. Para estimarmos esta função,
selecionávamos uma variável explicativa (X), a quela que julgássemos explicar o
máximo possível o comportamento da variável independente (Y), a ser analisada.
Ao tratarmos com três variáveis, deixaremos de usar o gráfico plano (X,Y), para nos
referirmos a um diagrama de dispersão de pontos em três dimensões (X, Y, Z); mas o
problema continua sendo o de encontrar um plano (uma reta na regressão linear simples)
que melhor se ajuste, no sentido de menores desvios dos pontos observados.
O MODELO VERDADEIRO DE R. L. M.
MODELO ESTIMADO
Dado o fato que sempre trabalhamos com amostras, não podemos conhecer o verdadeiro
modelo, mas apenas uma estimativa deste, além disso não conhecemos o resíduo “Σ” . A
partir de uma particular amostra, procuraremos obter valores estimados dos parâmetros
populacionais.
Y = valor estimado de y
a = estimativa do intercepto
b = estimativa de declividade relativa à x (coef. angular)
1 1
b = estimativa de declividade relativa à x (coef. angular)
2 2
x , x = variáveis explicativas
1 2
Σ = resíduo (ERRO)
FÓRMULAS
Tabela (sequência)
2 2 2
Y;X ;X ; X ; X ; Y ; X . X ; Y. X ; Y . X
1 2 1 2 1 2 1 2
ΣY . ΣX
1
SY = Σ Y . X - ______________
1 1
n
ΣY . ΣX
2
SY = Σ Y . X - ______________
2 2
n
2
(ΣX )
2 1
S = ΣX - ___________
11 1 n
ΣX . ΣX
1 2
SY = SY = Σ (X . X ) - ______________
12 21 1 2
n
2
(ΣX )
2 2
S = ΣX - ___________
22 2 n
2
2 (ΣY)
S = ΣY - ___________
yy n
SY . S - SY . S
1 22 2 12
b = _____________________________
1 2
S . S - (S )
11 22 12
SY . S - SY . S
2 11 1 21
b = _____________________________
2 2
S . S - (S )
11 22 12
_ _ _
a= Y - b x - b x
1 1 2 2
Poder Explicativo :
b . SY + b . SY
2 1 1 2 2
R = _____________________________
S
yy
Correlação:
___________
| 2 |
R = - | R
xy \ | _____
\| 100
EXERCÍCIOS
1-) VENDAS (Y) Gastos com tv (x1) Gastos com Jornal (x2)
6 3 1
7 4 2
15 8 3
18 8 5
20 10 8
23 11 6
2-) Y X1 X2
128 1 100
150 2 200
78 3 300
162 4 400
134 5 500
175 6 600
208 7 700
x y x2 y2 x.y
825 3,5 680.625 12,25 2.887,5
215 1,0 46.225 1,00 215,0
1.070 4,0 1.144.900 16,00 4.280,0
550 2,0 302.500 4,00 1.100,0
480 1,0 230.400 1,00 480,0
920 3,0 846.400 9,00 2.760,0
1.350 4,5 1.822.500 20,25 6.075,0
325 1,5 105.625 2,25 487,5
670 3,0 448.900 9,00 2.010,0
1.215 5,0 1.476.225 25,00 6.075,0
somatório 7.620 28,5 7.104.300 99,75 26.370,0
762
x =
2,85
y =
correlação:
(Sx.Sy)
rxy = S xy - n
(Sx2- (Sx)2).(Sy2-(Sy)2)
n n
(7.620 . 28,5)
rxy = 26.370- 10
(7.104.300- (58.064.400)).(99,75-812,25)
10
10
equação de regressão:
b = Sxy - n (x).(y)
b=26.370 -
10(762).(2,85)
b = 0,003
0,0036
a = 0,5 0,564
y = a + bx
EXEMPLO
Uma empresa levantou os seguintes dados para avaliar as suas vendas e os gastos
com promoção.
x y
gastos com vendas
promoção em x2 y2 x.y
em US$1.000 US$milhões
1º ano 140 50 19.600 2.500 7.000
2º ano 200 57 40.000 3.249 11.400
3º ano 238 67 56.644 4.489 15.946
4º ano 270 69 72.900 4.761 18.630
285,4
x =
70,1
y =
correlação:
(Sx.Sy)
rxy = S xy - n
(Sx2- (Sx)2).(Sy2-(Sy)2)
n n
equação de regressão:
b = Sxy - n (x).(y)
Sx2 - n (x)2
b = 0,1
a = y - bx
a = 41,6
erro padrão:
Sxy = 7
equação de projeção:
y = a + bx
101,6 milhões
y =
Respostas:
EXEMPLO NÚMERO 2
A tabela a seguir mostra uma relação entre a nota final de estatística
e o número de horas que os alunos estudaram.
y x
(Sx.Sy)
rxy = S xy - n
(Sx2- (Sx)2).(Sy2-(Sy)2)
n n
média:
15,1
x =
5,0
y =
b = Sxy - n (x).(y)
Sx2 - n (x)2
b = 0,3
a = y - bx
a = 0,5
y = a + bx
erro padrão:
Sxy = 0,5
Respostas:
Exercício:
x y
4,0
x =
30,3
y =
correlação:
(Sx.Sy)
rxy = S xy - n
(Sx2- (Sx)2).(Sy2-(Sy)2)
n n
equação de regressão:
b = Sxy - n (x).(y)
Sx2 - n (x)2
b = -6,7
a = y - bx
a = 57,1
erro padrão:
Sxy = 4
equação de projeção:
y = a + bx
para 95 3,5
y =
para 96 -3,2
y =
EXERCÍCIO
x y
quantidade
horas de micros x2 y2 x.y
c/defeito
18 9 324 81 162
12 8 144 64 96
10 7 100 49 70
8 6 64 36 48
6 5 36 25 30
5 4 25 16 20
4 3 16 9 12
somatório 63 42 709 280 438
9,0
x =
6,0
y =
correlação:
(Sx.Sy)
rxy = S xy - n
(Sx2- (Sx)2).(Sy2-(Sy)2)
n n
equação de regressão:
b = Sxy - n (x).(y)
Sx2 - n (x)2
b = 0,4
a = y - bx
a = 2,4
erro padrão:
Sxy = 1
equação de projeção:
y = a + bx