Escolar Documentos
Profissional Documentos
Cultura Documentos
Estatística
Luciane Bonatto
Universidade Corporativa Petrobras
Luciane.bonatto@petrobras.com.br
Chave:clw3
Outubro/2005
Tópicos do Curso
Estimação de Parâmetros
Regressão Linear
Introdução à Simulação
2
Análise de Séries Históricas
Objetivo:
Definir métodos para a escolha da distribuição de probabilidade da
variável analisada e para estimar os parâmetros a partir dos seus dados
históricos.
Identificar a relação entre as séries analisadas
Série Histórica:
Brent Platts Dated US$/bbl de jul/87 –abril/05.
A variável de incerteza que deve ser analisada não é o nível de preço, mas
a variação com relação ao preço de atual.
rt=(St-St-1)/St-1
Ou,
Rt=ln(St/St-1)
usando composição contínua ao invés de discreta. Para dados diários
existe pouca diferença entre Rt e rt.
3
Dependência e Independência de v.a.
Definição:
Duas v.a. X e Y são independentes se o conhecimento de uma
não altera a distribuição de probabilidades da outra.
Propriedades:
Se X e Y são independentes, então o valor esperado do
produto é igual ao produto dos valores esperados, isto é:
E[X . Y] = E[X] . E[Y]
Além disso, se X e Y são independentes, então para quaisquer
funções g(X) e h(X), temos:
E[g(X) . h(Y)] = E[g(X)] . E[h(Y)]
4
Dependência e Independência de v.a.
5
Covariância
Mede a dependência linear entre 2 variáveis:
X Y X.Y
-2 4 -8
Exemplo :
-1 1 -1
Cov(X,Y) = 0 e X e Y são dependentes. 0 0 0
1 1 1
Y = X2 para X=-2,-1,0,1,2. 2 4 8
Média 0 2 0
Excel...
6
Coeficiente de Correlação
É uma medida padronizada da covariância
Não considera a causalidade entre as variáveis
Conhecido como coeficiente de correlação de Pearson
∑ (x i − x )( yi − y )
ρ XY =
n
i =1
n
e − 1 ≤ ρ XY ≤ 1
(
∑ ix − x )2
. (
∑ iy − y )2
i =1 i =1
7
Coeficiente de Correlação
r=0
r = 0,70 r = - 0,70
400 200
350 150
300 100
250 50
200 0
-100 -50 0 100 200 300 400
150
100 -100
50 -150
0 -200
0 100 200 300 400 -250
8
Coeficiente de Correlação Parcial
Mede o grau de associação entre 2 variáveis, eliminando
(controlando) o efeito causado por outras variáveis. Não
considera a causalidade entre as variáveis
ρ xy − ρ xz .ρ yz
ρ xy , z =
1 − ρ xz2 1 − ρ yz2
Exemplo Excel...
9
Estimação de Parâmetros
Dado que temos uma amostra i.i.d de T observações,
podemos estimar os parâmetros de interesse, média,
variância e outros momentos.
1 T
m =µ̂ = ∑ xi
T i =1
Atribuímos o mesmo peso 1/T para todas as observações
porque todas tem a mesma probabilidade.
10
Estimação de Parâmetros
A variância também poder ser estimada pela variância da
amostra:
T
1
s =σˆ =
2 2
∑
(T − 1) i =1
( xi − µˆ ) 2
X 1 + X 2 + ...... + X n
X=
n
tem distribuição aproximadamente Normal com
média µ e variância σ2 /n
Exemplo Excel...
12
Estimação de Parâmetros
Assim,a distribuição da variância da amostra,
quando X é normal é Chi-quadrado com (T-1) grau
de liberdade.
(T − 1)σˆ 2
~ χ 2 (T − 1)
σ 2
13
Regressão Linear
Objetivo :
Estabelecer e quantificar relação linear entre as variáveis;
Fazer previsão dos valores futuros.
Forma Geral:
yi = α + βxi + εi , i= 1, ...., n.
Onde :
yi = variável dependente ou variável resposta;
xi = variável independente ou explicativa;
εi = erro aleatório;
α e β = parâmetros desconhecidos do modelo:
α : Coeficiente linear ( Intercepto ou termo constante);
β : Coeficiente angular
14
Mínimos Quadrados Ordinários
Hipóteses Básicas:
15
Mínimos Quadrados Ordinários
Gráfico de Dispersão
160
155
150
145
140
135
130
125
relação entre Y e X é
aquela que minimiza a
soma dos quadrados dos
Gráfico de Dispersão
Y
erros.
160
155
150
145
e8
140
135 e4
130
125
120 e1
115
110
1 2 3 4 5 6 7 8 9 10 11 12 13
X
16
Mínimos Quadrados Ordinários
Método dos Mínimos Quadrados Ordinários
n n 2
i =1 i =1
Derivando em relação a α :
dSQ n
= ∑ 2( yi − α − βxi ) = 0
dα i =1
∑ yi − nα − β ∑ xi = 0
^ ^
α = y−β x
17
Mínimos Quadrados Ordinários
Derivando em relação a β :
dSQ n
= ∑ 2( yi − α − βxi )xi = 0
dβ i =1
∑ y x −α ∑ x − β ∑ x
2
i i i i =0
i =1
n
⎛ ^
⎞ ^
∑ yi xi − ⎜ y − βx ⎟∑ xi − β ∑ xi = 0
2
i =1 ⎝ ⎠
β = ∑ i 2i
^ y x − nx y Cov( y, x )
=
∑ xi − nx 2
σ x2
18
Mínimos Quadrados Ordinários
Assim, temos:
Resíduos: ei = yi - yˆ i
n n
σ e2 = i =1
= i =1
n−2 n−2
19
Propriedades dos Resíduos
i) ∑e =0
i
∑ ( y − (αˆ + βˆx )) = ∑ ( y
i i i − ( y − βˆx + βˆxi )) =
∑ y − ny − nβˆx − βˆnx = 0
i
ii) ∑ x e =0 i i
∑ x ( y − αˆ − βˆx ) = 0
i i i
∑ (αˆ + ∑ ∑
ˆx )e = αˆ e + βˆ x e = 0
β i i i i i
20
Propriedades dos estimadores de MQO:
São combinações lineares de yi
São não tendenciosos
Têm variância mínima
Variabilidade total
R2 = 1−
∑i
e 2
∑ i
( y − y ) 2
2
Raj = 1 −
∑ i /(n − 2)
e 2
R 2 ajustado
∑ i
( y − y ) 2
/(n − 1) 22
Regressão Linear Múltipla
Forma geral :
yi = β 0 + β1 x1 + β 2 x2 + ..... + β p −1 x p −1 + ε i
23
Regressão Linear Múltipla
y = Xβ + ε
24
Regressão Linear Múltipla
Estimador de Mínimos Quadrados :
δ
( y − Xβ )′( y − Xβ ) = 0
δβ
e′.e
β̂ = ( X ′X ) X ′y
−1 σ =
2
e
n− p
ˆ ′
β ~ N (β ,σ e ( X X ) )
2 −1
25
Diagnósticos de Regressão
Má especificação da função de regressão
40
exX
Y 180
e
160
140
Y x X 20
120
100
80 0
60
40
-20
20
0
-20 4 6 8 10 12 14 16 -40
X X
Solução :
i) Mudar o modelo teórico, corrigindo a função de regressão
26
Diagnósticos de Regressão
Presença de ‘outliers’
e
Y1614
12
10
8
6
4
2
0
4 6 8 10 12 14 16 -3
X X
Solução :
i) Identificar a origem do outlier e refazer a modelagem
27
Diagnósticos de Regressão
Heterocedasticidade
60
270
Y e
250 40
230
20
210
0
190
170 -20
150
-40
130
-60
110
90 -80
1 6 11 16 21 26
X
X
Solução :
i) Identificar comportamento do sigma , p.ex.: σ i2 = k 2 . xi2
yi α εi
ii) Fazer transformação nas variáveis : = +β +
xi xi xi
28
Diagnósticos de Regressão
Não Normalidade dos erros
Quando a hipótese ei ~Normal não é válida
2,5
Percentil Normal
1,5
0,5
-0,5
-1,5
-2,5
-2,5 -1,5 -0,5 0,5 1,5 2,5
Resíduos
29
Diagnósticos de Regressão
Autocorrelação dos erros
PDF’s de entrada
46
45
44
43
42
41
40
39
38
37 Varrer todos Calcular todos
36
pontos
35
34
33
32
31
pontos
30
29
28
27
26
25
24
23
de saída
22
21
20
19
18
17
16
15
14
13
12
11
109
87
de entrada
6
54
32
01
PDF’s de saída
45
40
35
25
20
Processo 15
de Entrada de Saída 10
0
1° T r i m
31
Passos da Simulação de Monte Carlo
32
Simulação de Monte Carlo
33
Simulação de Monte Carlo
Relação entre x , F(x) e F-1(x)
0.8
0.6
X F(X)
0.4 F--1(X) X
0.2
25 35 45 55
34
Simulação de Monte Carlo
⎧ 2( x − min)
⎪ (max− min)(moda − min) min ≤ x ≤ moda
⎪
f ( x) = ⎨
⎪ 2(max− x)
moda ≤ x ≤ max
⎪⎩ (max− min)(max− moda)
⎧ ( x − min)2
⎪ min ≤ x ≤ moda
⎪ (max− min)(moda − min)
Pr( X ≤ x) = F ( x) = ⎨
⎪1 − (max− x) 2
moda ≤ x ≤ max
⎪⎩ (max− min)(max− moda)
⎧ moda− min
−1
⎪⎪min+ u(max− min)(moda− min) u≤
max− min
F (u) = ⎨
⎪max− (1 − u)(max− min)(max− moda) max− moda
u ≥1 −
⎪⎩ max− min 35
Simulação de Monte Carlo
36
Simulação de Monte Carlo
Métodos de Amostragem
0.8
0.6
F(x)
0.4
0.2
0
25 35 45 55
x
38
Análise de Projeto de Investimento
Método de Avaliação
FC0
n
E ( FC k ) onde j=0;0,5 ;1 (posição do vetor)
E (VPL ) = E ( FC 0 ) + ∑
k =1 (1 + tma ) k − j
Indicadores
• VPL esperado [ E(VPL) ]
• VaR 95% [ E(VPL) – VPL5% ]
• Pr(VPL <0) 39