Escolar Documentos
Profissional Documentos
Cultura Documentos
2. Repaso de Probabilidad
Rafael Snchez F.
Agosto 2015
Econometra I
Agosto 2015
1 / 49
Introduccin
La teora econmica sugiere importantes relaciones entre variables, a
menudo con implicancias de poltica pblica, sin embargo
practicamente nunca sugiere las magnitudes de los efectos causales.
Para estimar dichas magnitudes, idealmente a uno le gustara contar
con un experimento (similares a los utilizados con los frmacos en
bio-qumica y medicina).
Sin embargo rara vez ello ocurre con economa. Mucho mas comn
en economa es contar con datos quasi-experimentales (tambin
conocidos como observacionales).
Por ello es que este curso introductorio se centra en herramientas y
metodologas que buscan lidiar de la mejor forma posible con las
dicultades que surgen al utilizar datos quasi-experimentales para
estimar efectos causales.
Econometra I
Agosto 2015
2 / 49
Introduccin (cont.)
Ya vimos una pequea introduccin en la clase anterior, sin embargo
para poder avanzar de mejor manera en el curso, antes de entrar de
lleno al contenido realizaremos un breve repaso de probabilidades y
estadstica. Ntese la palabra breve.
Este repaso DEBE ser complementado con las lecturas sealadas en el
programa del curso u otras adicionales si el alumno lo estima
conveniente. Ello es particularmente importante si el alumno
encuentra que su conocimiento de estadstica es dbil e incompleto.
Para el que esta con conociemientos muy dbiles se recomienda
repasar de su material del curso estadstica II.
Para estar mas seguros del manejo de esta materia el primer control
del curso ser de probabilidad y estadstica. Adicionalmente los
alumnos contarn con una ayudanta y una gua de ejercicios del tema
(Gua 1 en webcursos).
Rafael Snchez F. (UAI)
Econometra I
Agosto 2015
3 / 49
Motivacin
Econometra I
Agosto 2015
4 / 49
Motivacin (cont.)
Con un Grco?
Econometra I
Agosto 2015
5 / 49
Motivacin (cont.)
Quizs con alguna medida numrica?....por ejemplo mostrando que
aquellas comunas con escuelas con menos estudiantes por curso les va
mejor en el SIMCE? (Clculo de promedios)
Quizs podramos calcular los puntajes SIMCE promedio de aquellas
comunas que tienen escuelas con cursos pequeos versus aquellas con
cursos grandes y de ah pdramos testear la hiptesis nula de que
ambos promedios son similares versus la hiptesis alternativa de que
ambos son diferentes? (test de hiptesis)
Los mecanismos de estimacin y test de hiptesis deberan ser
familiares.
Estos conceptos sern relevantes para el anlisis de regresin que
viene a continuacin en el curso.
Debido a ello revisaremos brevemente la teora que esta detrs de la
estimacin y test de hiptesis para luego extender el anlisis al
modelo de regresin.
Rafael Snchez F. (UAI)
Econometra I
Agosto 2015
6 / 49
Motivacin (cont.)
Estimacin
Testeo de hiptesis.
Econometra I
Agosto 2015
7 / 49
Conceptos Bsicos
El gnero de la prxima persona que conozca, su calicacin en un
examen y el nmero de veces que su computador se estropeara
mientras redacta un trabajo, presentan todos ellos un componente de
azar o aleatoriedad.
En cada uno de estos ejemplos, existe algo que no es todava
conocido pero que a la larga se revelar.
Los resultados potencialmente excluyentes de un proceso aleatorio se
denominan resultados. Por ejemplo su computador puede no
estropearse nunca, o puede estropearse 2 veces, etc. Solo uno de
estos resultados puede ocurrir en realidad (los resultados son
mutuamente excluyentes), y los resultados no necesariamente son
igualmente probables.
La probabilidad de un resultado es la proporcin de veces que el
resultado ocurre a largo plazo. Si la probabilidad de que su
computador no se estropee mientras redacta un documento es del
80%, entonces durante el proceso de redactar muchos trabajos el 80%
de las veces terminar sin averas.
Econometra I
Agosto 2015
8 / 49
Econometra I
Agosto 2015
9 / 49
Econometra I
Agosto 2015
10 / 49
f(x)
1
2
3
4
5
6
Rafael Snchez F. (UAI)
Econometra I
Agosto 2015
11 / 49
Econometra I
Agosto 2015
12 / 49
Econometra I
1
2
Agosto 2015
13 / 49
Econometra I
Agosto 2015
14 / 49
F (x )
f (x )dx = 1
Econometra I
Agosto 2015
15 / 49
X < b ) = P (a < X
b ) = F (b )
Econometra I
F (a )
Agosto 2015
16 / 49
Econometra I
Agosto 2015
17 / 49
xj f (xj )
j =1
Econometra I
Agosto 2015
18 / 49
xj f (xj )
j =1
k
xj Prj
j =1
k
E (X + a ) =
(xj + a)Prj =
j =1
j =1
xj Prj +
j =1
| {z }
E (X )
aPrj =
j =1
| {z }
k
Pr
j =1
E (X ) + a
Rafael Snchez F. (UAI)
Econometra I
Agosto 2015
19 / 49
xj Prj
j =1
E (aX ) =
j =1
j =1
Econometra I
Agosto 2015
20 / 49
Var (X ) = 2x = E [(X
)2 ] =
( Xj
)2 Prj
j =1
Donde E (X ) =
Tambin se puede expresar como:
2x = E [(X )2 ] = E [(X 2 2X + 2 )]
2x = E (X 2 ) 2E (X ) + 2 = E (X 2 ) 2 + 2
2x = E (X 2 ) 2 = E (X 2 ) E (X )2
Econometra I
Agosto 2015
21 / 49
Demostrar:
1
Var (X + a) = Var (X )
E [(X + a) ( + a)]2 = E [(X
Var (aX ) = a2 Var (X )
E [(aX a)2 ] = E [a2 (X
Var (X )
a2
2
)
]
= E [ a12 (X
a
)2 ] = Var (X )
)2 ] = a2 E [(X
)2 ] = a2 Var (X )
Var ( Xa ) =
E [( Xa
)2 ] =
1
E [(X
a2
Econometra I
)2 ] =
Var (X )
a2
Agosto 2015
22 / 49
Econometra I
Agosto 2015
23 / 49
Asimetra=
Econometra I
Agosto 2015
24 / 49
Econometra I
Agosto 2015
25 / 49
Econometra I
Agosto 2015
26 / 49
Lluvia (X=0)
0.15
0.15
0.30
Econometra I
No Lluvia (X=1)
0.07
0.063
0.70
Total
0.22
0.78
1.00
Agosto 2015
27 / 49
Econometra I
Agosto 2015
28 / 49
Pr(Y = y ) =
Pr(X
= xi , Y = y )
i =1
Rafael Snchez F. (UAI)
Econometra I
Agosto 2015
29 / 49
= 0, 85
= 0, 15
= 0, 70
= 0, 30
Econometra I
Agosto 2015
30 / 49
Econometra I
Agosto 2015
31 / 49
E (Y jX = x ) =
yi P (Y
i =1
= yi jX = x )
Propiedades de E (Y jX ) :
1
Econometra I
Agosto 2015
32 / 49
Econometra I
Agosto 2015
33 / 49
Econometra I
Agosto 2015
34 / 49
Econometra I
(X
X ) Y ] =
Agosto 2015
35 / 49
Econometra I
Agosto 2015
36 / 49
XY
X Y
Econometra I
Agosto 2015
37 / 49
E (X + Y ) = E (X ) + E (Y ) = X + Y
E (aX + bY ) = aE (X ) + bE (Y ) = aX + bY
Var (X + Y ) = Var (X ) + Var (Y ) + 2Cov (X , Y )
Var (aX + bY ) = a2 Var (X ) + b 2 Var (Y ) + 2abCov (X , Y )
Si X e Y no estn correlacionadas, i.e.
Cov (X , Y ) = 0 : Var (X + Y ) = Var (X
Y ) = Var (X ) + Var (Y )
Econometra I
Agosto 2015
38 / 49
Demostrar que:
Var (aX + bY ) = a2 Var (X ) + b 2 Var (Y ) + 2abCov (X , Y )
o
n
Var (aX + bY ) = E [(aX + bY ) (aX + bY )]2
n
o
Var (aX + bY ) = E [a (X X ) + b (Y Y )]2
Var
h (aX + bY ) =i
E a2 (X X )2 + 2E [ab (X
|
{z
} |
a 2 Var (X )
X )(Y
{z
2abCov (X ,Y )
b 2 Var (Y )
2
2
a Var (X ) + b Var (Y ) + 2abCov (X , Y )
Var (aX + bY ) =
Var (aX + bY ) = a2 2x + b 2 2y + 2abxy
h
i
Y )] + E b 2 (Y Y )2
} |
{z
}
Econometra I
Agosto 2015
39 / 49
La Distribucin Normal
La distribucin normal es la distribucin ms habitual en estadstica y
econometra, porque (i) frecuentemente se cumple; y (ii) suponer que
una v.a. tiene distribucin normal simplica los clculos
probabilsticos.
Si la media de una v.a. con distribucin normal es y su varianza es
2 , se dice que x N (, 2 )
Econometra I
Agosto 2015
40 / 49
En trminos matemticos: f (x ) =
p1 exp
2
(x )2
22
, donde
= E (x ) y
= Var (x ).Algunas variables aleatorias parecen seguir
poco ms o menos una distribucin normal. Las estaturas y los pesos
de los seres humanos y las puntuaciones de test son algunos ejemplos.
Un caso particular de la distribucin normal se llama distribucin
normal estandar. Tal como su nombre lo indica es igual a la
distribucin normal pero estandarizada. Por convencin se
estandarizan con media = 0 y varianza = 1 y sus v.a.s se denominan
con letra Z. La FDP de la distribucin normal estndar se denomina
(z ) y la FDA se denomina (z ).
Econometra I
Agosto 2015
41 / 49
Econometra I
Agosto 2015
42 / 49
Si x N (, 2 ) entonces 2
N (0, 1). Ejemplo: suponga que
x N (3, 4) y que se quiere calcular P (x 1).Para esto se debe restar
la media y dividir por la varianza:
1 3 ) = P( x 3
1
P (x 1) = P (x 3 1 3) = P ( x 4 3
4
4
2 )=
x 3
P(
1) = P (Z
1) = ( 1) = 0, 159
2 }
| {z
Z
Si x N (, 2 ) entonces ax + b N (a + b, a2 2 ) Ejemplo: si
x N (1, 9) y se quiere estimar la distribucin de y = 2x + 3.Sabemos
que su distribucin ser normal con media: 2E (x ) + 3 = 5 y varianza:
22 9 = 36 por lo tanto y N (5, 36)
Econometra I
Agosto 2015
43 / 49
Econometra I
Agosto 2015
44 / 49
La Distribucin Chi-Cuadrado
Esta distribucin se obtiene de la suma de variables normales estandar
(al cuadrado):
Si z1 , .....zn v.a.s y zi
N (0, 1) y son independientes, entonces:
n
i =1
Econometra I
Agosto 2015
45 / 49
Econometra I
Agosto 2015
46 / 49
Econometra I
Agosto 2015
47 / 49
La Distribucin t de Student
Esta es la distribucin mas utilizada en econometra y en estadstica,
principalmente para estimar y probar una media y una diferencia de
medias cuando no se conoce la desviacin estandar poblacional (y por
lo tanto se debe estimar con la muestral). Se obtiene a partir de la
razon entre una distribucin normal estandar y una chi-cuadrado. Si
z1 N (0, 1) y z2 2n entonces las v.a. T se dene como:
tn
T = pz1z2
n
Econometra I
Agosto 2015
48 / 49
La Distribucin F
Para el anlisis de regresin mltiple que veremos ms adelante, la
distribucin F nos ser de gran utilidad. Esta distribucin surge de la
razn de dos distribuciones chi-cuadrado.
En particular, sean: x1 y x2 v.a.s independientes, y sean
x1 2m y x2 2n entonces la dsitribucin F se dene:
F =
x1
m
x2
n
F(m,n )
Econometra I
Agosto 2015
49 / 49