Você está na página 1de 49

Econometra I

2. Repaso de Probabilidad

Rafael Snchez F.

Agosto 2015

Rafael Snchez F. (UAI)

Econometra I

Agosto 2015

1 / 49

Introduccin
La teora econmica sugiere importantes relaciones entre variables, a
menudo con implicancias de poltica pblica, sin embargo
practicamente nunca sugiere las magnitudes de los efectos causales.
Para estimar dichas magnitudes, idealmente a uno le gustara contar
con un experimento (similares a los utilizados con los frmacos en
bio-qumica y medicina).
Sin embargo rara vez ello ocurre con economa. Mucho mas comn
en economa es contar con datos quasi-experimentales (tambin
conocidos como observacionales).
Por ello es que este curso introductorio se centra en herramientas y
metodologas que buscan lidiar de la mejor forma posible con las
dicultades que surgen al utilizar datos quasi-experimentales para
estimar efectos causales.

Rafael Snchez F. (UAI)

Econometra I

Agosto 2015

2 / 49

Introduccin (cont.)
Ya vimos una pequea introduccin en la clase anterior, sin embargo
para poder avanzar de mejor manera en el curso, antes de entrar de
lleno al contenido realizaremos un breve repaso de probabilidades y
estadstica. Ntese la palabra breve.
Este repaso DEBE ser complementado con las lecturas sealadas en el
programa del curso u otras adicionales si el alumno lo estima
conveniente. Ello es particularmente importante si el alumno
encuentra que su conocimiento de estadstica es dbil e incompleto.
Para el que esta con conociemientos muy dbiles se recomienda
repasar de su material del curso estadstica II.
Para estar mas seguros del manejo de esta materia el primer control
del curso ser de probabilidad y estadstica. Adicionalmente los
alumnos contarn con una ayudanta y una gua de ejercicios del tema
(Gua 1 en webcursos).
Rafael Snchez F. (UAI)

Econometra I

Agosto 2015

3 / 49

Motivacin

Comencemos con una pregunta emprica para motivar el repaso:


Cul es el efecto de reducir el tamao de la clase en un estudiante
por curso sobre los puntajes del SIMCE?....Cual sera el efecto de
reducir la clase en 8 alumnos por curso?
Para responder esta pregunta debemos utilizar datos......o existe otra
forma de responder esta pregunta?....

Rafael Snchez F. (UAI)

Econometra I

Agosto 2015

4 / 49

Motivacin (cont.)

Con un Grco?

Rafael Snchez F. (UAI)

Econometra I

Agosto 2015

5 / 49

Motivacin (cont.)
Quizs con alguna medida numrica?....por ejemplo mostrando que
aquellas comunas con escuelas con menos estudiantes por curso les va
mejor en el SIMCE? (Clculo de promedios)
Quizs podramos calcular los puntajes SIMCE promedio de aquellas
comunas que tienen escuelas con cursos pequeos versus aquellas con
cursos grandes y de ah pdramos testear la hiptesis nula de que
ambos promedios son similares versus la hiptesis alternativa de que
ambos son diferentes? (test de hiptesis)
Los mecanismos de estimacin y test de hiptesis deberan ser
familiares.
Estos conceptos sern relevantes para el anlisis de regresin que
viene a continuacin en el curso.
Debido a ello revisaremos brevemente la teora que esta detrs de la
estimacin y test de hiptesis para luego extender el anlisis al
modelo de regresin.
Rafael Snchez F. (UAI)

Econometra I

Agosto 2015

6 / 49

Motivacin (cont.)

Por lo tanto lo que viene a continuacin es:


1

Conceptos bsicos de probabilidad para inferencia estadistica

Estimacin

Testeo de hiptesis.

Rafael Snchez F. (UAI)

Econometra I

Agosto 2015

7 / 49

Conceptos Bsicos
El gnero de la prxima persona que conozca, su calicacin en un
examen y el nmero de veces que su computador se estropeara
mientras redacta un trabajo, presentan todos ellos un componente de
azar o aleatoriedad.
En cada uno de estos ejemplos, existe algo que no es todava
conocido pero que a la larga se revelar.
Los resultados potencialmente excluyentes de un proceso aleatorio se
denominan resultados. Por ejemplo su computador puede no
estropearse nunca, o puede estropearse 2 veces, etc. Solo uno de
estos resultados puede ocurrir en realidad (los resultados son
mutuamente excluyentes), y los resultados no necesariamente son
igualmente probables.
La probabilidad de un resultado es la proporcin de veces que el
resultado ocurre a largo plazo. Si la probabilidad de que su
computador no se estropee mientras redacta un documento es del
80%, entonces durante el proceso de redactar muchos trabajos el 80%
de las veces terminar sin averas.

Rafael Snchez F. (UAI)

Econometra I

Agosto 2015

8 / 49

Conceptos Bsicos (cont.)

Variables aleatorias (v.a.): Una variable aleatoria puede ser discreta


o continua. Una v.a. discreta es un resumen numrico de un
resultado aleatorio. El nmero de veces que su computador se
estropea mientras redacta un documento es aleatorio y toma un valor
numrico, por lo que es una v.a..
Una v.a. discreta toma valores solamente sobre un conjunto discreto,
como: 0,1, 2, .... etc, mientras que una v.a. contnua toma valores en
un contnuo de posibles valores.
En el ejemplo del tamao de la clase sobre los puntajes SIMCE
tendramos como variables aleatorias: el promedio de los tamaos de
las clases de cada colegio de la comuna y tambin el promedio de los
puntajes SIMCE de cada colegio de la comuna.

Rafael Snchez F. (UAI)

Econometra I

Agosto 2015

9 / 49

Conceptos Bsicos (cont.)

Otro ejemplo: si se dene la variable aleatoria X = nmero de puntos


en la cara del dado que d hacia arriba en un lanzamiento tendremos
que esta variable aleatoria X podr tomar uno de los siguientes
valores = {1,2,3,4,5,6}.
Es decir, se sabe que ser uno de esos valores pero no se sabe cul de
ellos ocurrir en el lanzamiento del dado (por eso es aleatoria). En el
caso del lanzamiento de una moneda X={0=cara, 1=sello}. No se
sabe cual va a salir, pero uno de esos dos resultados se tiene que dar.
En el caso de una aerolinea, la variable aleatoria es cuntas personas
utilizaran su reserva del pasaje. Ello por cuanto, antes de un vuelo no
se sabe cuantas reservas (de 100%) se utilizarn. El nmero
resultante puede estar entre 0% o 100% de las reservas.

Rafael Snchez F. (UAI)

Econometra I

Agosto 2015

10 / 49

Conceptos Bsicos (cont.)


Funcin de Distribucin de Probabilidad de una variable
aleatoria (v.a.): en el caso de las v.a. discretas, la distribucin de
probabilidad es una relacin de todos los valores posibles de la
variable junto con la probabilidad de que ocurra cada valor. Esas
probabilidades suman 1.
Mas formalmente, la Funcin de Distribucin de Probabilidad
(fdp): es una funcin f (xj ) que asigna una probabilidad a cada valor
xj de las variable aleatoria X . f (xj ) = pj = P (X = xj ) = P (xj )
Donde f (xj ) se puede expresar como una frmula, un grco o una tabla.
Resultado

f(x)

1
2
3
4
5
6
Rafael Snchez F. (UAI)

Econometra I

Agosto 2015

11 / 49

Conceptos Bsicos (cont.)


f(x)

Donde la gura representa un histograma (grco de distribucin de


probabilidades. Se lee como que el valor 1 tiene una probabilidad de
1
1
6 , el valor 2 tambin tiene una probabilidad de 6 y as
sucesivamente.Para otros ejemplos el histograma puede tomar otras
formas, dependiendo de las probabilidades con las que puedan resultar
ciertos valores.
Rafael Snchez F. (UAI)

Econometra I

Agosto 2015

12 / 49

Conceptos Bsicos (cont.)


Probabilidad de los sucesos: puede calcularse a travs de la
distribucin de probabilidad (fdp). Por ejemplo: la Pr(x=1 o
x=2)=Pr(x=1)+Pr(x=2)= 16 + 16 = 26 = 13
Distribucin de Probabilidad Acumulada (fda): es la probabilidad de
que la v.a. sea menor o igual a un cierto valor.Mas formalmente,
funcin de densidad acumulada (fda): se denomina F (x ) y
especica que, para cada valor de x, la probabilidad que
X
x : F (x ) = P (X
x ) = P (1) + P (2) + P (3) + ....... + P (x )
En el ejempo del lanzamiento del dado: Cul es la probabilidad que
uno lance un dado y obtenga 3 puntos o menos?.
F (x ) = P (X
F (3) = P (X

x ) = P (1) + P (2) + P (3) + ....... + P (x )


3) = P (1) + P (2) + P (3) = 61 + 16 + 16 =

Rafael Snchez F. (UAI)

Econometra I

1
2

Agosto 2015

13 / 49

Conceptos Bsicos (cont.)


Debido a que una v.a. continua puede tomar sus valores posibles en
un continuo, la fdp utilizada para variables discretas, que presenta la
probabilidad de cada posible valor de la v.a., no es aplicable a las
variables contnuas. En su lugar, la probabilidad viene recogida por la
funcin de densidad de probabilidad. El rea bajo la funcin de
densidad de probabilidad entre dos puntos cualquiera es la
probabilidad de que la variable aleatoria se encuentre entre esos dos
puntos. La fdp tambin se conoce como densidad.

Rafael Snchez F. (UAI)

Econometra I

Agosto 2015

14 / 49

Conceptos Bsicos (cont.)

Para el caso de una v.a. contnua tenemos que su fda se dene


exactamente igual a como se hizo con la v.a. discreta. Es decir, la
distribucin de probabilidad acumulada de una v.a. es la probabilidad
de la la v.a. sea menor o igual a un cierto valor.
Formalmente: la fda estima la probabilidad de que X
x, se expresa
como F (x ) y debe cumplir las siguientes condiciones :
1. 0
2.

F (x )

f (x )dx = 1

Rafael Snchez F. (UAI)

Econometra I

Agosto 2015

15 / 49

Conceptos Bsicos (cont.)

Propiedades para cualquier constante c:


P (X
c ) = F (c )
p (X > c ) = 1 F (c )
Para cualquier par de constantes a y b donde a<b:
P (a

X < b ) = P (a < X

Rafael Snchez F. (UAI)

b ) = F (b )

Econometra I

F (a )

Agosto 2015

16 / 49

Conceptos Bsicos (cont.)

Un ejemplo de v.a. contnua: la distribucin uniforme. sta ocurre


cuando la probabilidad de todos los valores de una variable debieran
ser el mismo.
Por ejemplo si yo quisiera estudiar el RUT que es un nmero de 8
dgitos para la poblacin de menos de 45 aos. Los valores van entre
10.000.000 y 22.000.000 aproximadamente. El nmero de RUT es
una v.a. que puede tener 12 millones de valores posibles para sta
muestra y ningn valor es ms probable que otro. Por lo tanto, las
probabilidades de los valores del RUT son uniformes (todas iguales).

Rafael Snchez F. (UAI)

Econometra I

Agosto 2015

17 / 49

Momentos de una Distribucin: Media

Media o Valor Esperado: El valor esperado de una v.a. X ,


denominado como E (X ), es el valor que X toma en promedio luego
de varias repeticiones del experimento (i.e. es el valor medio de largo
plazo).
Caso de v.a. discreta:

E (X ) = x1 f (x1 ) + x2 f (x2 ) + ........ + xk f (xk ) =

xj f (xj )

j =1

Rafael Snchez F. (UAI)

Econometra I

Agosto 2015

18 / 49

Momentos de una Distribucin: Media (cont.)


Regla del valor esperado: el valor esperado es lineal
Demostrar que:
E (X + a ) = E (X ) + a
Sabemos que:
k

E (X ) = x1 f (x1 ) + x2 f (x2 ) + ........ + xk f (xk ) =

xj f (xj )

j =1
k

E (X ) = x1 Pr1 + x2 Pr2 + ..... + xk Prk =

xj Prj

j =1
k

E (X + a ) =

(xj + a)Prj =

j =1

[xj Prj + aPrj ] =

j =1

xj Prj +

j =1

| {z }
E (X )

aPrj =

j =1

| {z }
k

Pr

j =1

E (X ) + a
Rafael Snchez F. (UAI)

Econometra I

Agosto 2015

19 / 49

Momentos de una Distribucin: Media (cont.)


En forma similar podemos demostrar que: E (aX ) = aE (X ).
Sabemos que:
k

E (X ) = x1 Pr1 + x2 Pr2 + ..... + xk Prk =

xj Prj

j =1

E (aX ) =

j =1

j =1

(axj )Prj = a xj Prj = aE (X )


| {z }
E (X )

Ejemplo: suponga que X toma los valores -1, 0 y 2 con probabilidades


1 1
3
8 , 2 y 8 respectivamente. Entonces
E (X ) = 1 ( 81 ) + 0 ( 12 ) + 2 ( 83 ) = 58
Cul sera el valor esperado de g (X ) = X 2 ?. En este caso sera
E (X 2 ) = ( 1)2 ( 81 ) + (0)2 ( 12 ) + (2)2 ( 83 ) = 13
8
Tarea: Calcule la esperanza (i.e. valor esperado) de una v.a.
Bernoulli
Rafael Snchez F. (UAI)

Econometra I

Agosto 2015

20 / 49

Momentos de una Distribucin: Varianza y Desviacin


Estndar

La varianza y la desviacin estndar (i.e. desviacin tpica) miden la


dispersin de una distribucin de probabilidad. La varianza de una
v.a. X se expresa como:
k

Var (X ) = 2x = E [(X

)2 ] =

( Xj

)2 Prj

j =1

Donde E (X ) =
Tambin se puede expresar como:
2x = E [(X )2 ] = E [(X 2 2X + 2 )]
2x = E (X 2 ) 2E (X ) + 2 = E (X 2 ) 2 + 2
2x = E (X 2 ) 2 = E (X 2 ) E (X )2

Rafael Snchez F. (UAI)

Econometra I

Agosto 2015

21 / 49

Momentos de una Distribucin: Varianza y Desviacin


Estndar

Demostrar:
1

Var (X + a) = Var (X )
E [(X + a) ( + a)]2 = E [(X
Var (aX ) = a2 Var (X )
E [(aX a)2 ] = E [a2 (X
Var (X )
a2
2
)
]
= E [ a12 (X
a

)2 ] = Var (X )

)2 ] = a2 E [(X

)2 ] = a2 Var (X )

Var ( Xa ) =
E [( Xa

Rafael Snchez F. (UAI)

)2 ] =

1
E [(X
a2

Econometra I

)2 ] =

Var (X )
a2

Agosto 2015

22 / 49

Momentos de una Distribucin: Varianza y Desviacin


Estndar
Debido a que la varianza incluye trminos al cuadrado, su
interpretacin es complicada. Por lo tanto, es usual medir la
dispersin mediante la desviacin estndar o desviacin tpica que es
simplemente
la raz cuadrada
de la varianza. Se expresa como:
p
p
+
= 2 (raz positiva) = 2
La media y d.s. miden dos caractersticas importantes de una
distribucin: su centro (la media) y su dispersin (la desviacin
tpica).
Adicionalmente existen otras caractersticas de las distribuciones que
son tiles:
1
2

Asmetra (o sesgo): que mide la falta de simetra de una distribucin.


Curtosis: que mide el grosor o el peso de sus colas.

Todas estas caractersticas (media, varianza, asimetra y curtosis) se


denominan momentos de una distribucin.
Rafael Snchez F. (UAI)

Econometra I

Agosto 2015

23 / 49

Momentos de una Distribucin: Asimetra y Curtosis


E [ (X )3 ]
3
E [ (X )4 ]
Curtosis=
4

Asimetra=

Rafael Snchez F. (UAI)

Econometra I

Agosto 2015

24 / 49

Momentos de una Distribucin: Asimetra y Curtosis

Rafael Snchez F. (UAI)

Econometra I

Agosto 2015

25 / 49

Dos Variables Aleatorias: Dist. Conjunta

La mayora de las cuestiones econmicas implican dos o ms variables.


Por ejemplo:Cmo es la distribucin de ingresos de las mujeres
comparadas con la de los hombres?.
Esta pregunta atae a las distribuciones de dos variables aleatorias,
considerandolas en forma conjunta (ingresos y gnero). Para
responder a estas preguntas se requiere la comprensin de los
conceptos de distribucin de probabilidad conjunta, marginal y
condicional.

Rafael Snchez F. (UAI)

Econometra I

Agosto 2015

26 / 49

Dos Variables Aleatorias: Dist. Conjunta

Distribucin Conjunta: a usted le podra interesar la probabilidad que


llueva y adems la probabilidad que haya mucho trco. Es decir,
ambas probabilidades en conjunto.

Mucho Trco (Y=0)


Poco Trco (Y=1)
Total

Rafael Snchez F. (UAI)

Lluvia (X=0)
0.15
0.15
0.30

Econometra I

No Lluvia (X=1)
0.07
0.063
0.70

Total
0.22
0.78
1.00

Agosto 2015

27 / 49

Dos Variables Aleatorias: Dist. Conjunta


Para este tipo de problemas es til la distribucin de probabilidad
conjunta de dos v.a..
Esta distribucin es la probabilidad de que ambas v.a.
simultneamente tomen valores especcos llamense x e y.
La distribucin de probabilidad conjunta se denomina
P (X = x, Y = y ) para el caso discreto y fx ,y (x, y ) = Px ,y (x, y ) para
el caso contnuo.
La suma de las probabilidades de todas las posibles combinaciones de
x e y debe ser igual a 1.
Ejemplo: la probabilidad de que llueva y haya mucho trco se
expresa como P (X = 0, Y = 0) = 0, 15 o 15%.Los cuatro eventos
son mutuamente excluyentes y sus probabilidades suman 1.

Rafael Snchez F. (UAI)

Econometra I

Agosto 2015

28 / 49

Dos Variables Aleatorias: Dist. Marginal


La distribucin marginal de una v.a. Y es otro nombre para su fdp.
Se utiliza solamente para distinguir entre la probabilidad de Y
solamente de la distribucin conjunta de Y y otra variable aleatoria.
Se puede obtener la probabilidad marginal de Y desde su distribucin
conjunta con otra variable (digamos, X) sumando las probabilidades
de todos los eventos para los que Y toma un valor especco.
En nuestro ejemplo: la probabilidad de mucho trco con lluvia es
0,15 y la probabilidad de mucho trco sin lluvia es 0,07 entonces la
probabilidad marginal de mucho trco (con o sin lluvia) es
0,15+0,07 = 0,22 22%.
Mas generalmente: si X puede tomar m diferentes valores
x1 , x2 , .......xm , entonces la probabilidad de que Y tome valor y es:
m

Pr(Y = y ) =

Pr(X

= xi , Y = y )

i =1
Rafael Snchez F. (UAI)

Econometra I

Agosto 2015

29 / 49

Dos Variables Aleatorias: Dist. Condicional


La distribucin de una v.a. Y condicionada a que otra v.a. X tome un
valor especco se denomina distribucin condicional de Y dado X. La
probabilidad condicional de que Y tome el valor y cuando X toma el
valor x se expresa como: Pr (Y = y jX = x ) o fY jX (y j x ).
La distribucin condicionada de Y dado X es:
Pr (X =x ,Y =y )
probabilidad conjunta
= probabilidad
Pr (Y = y j X = x ) =
marginal de
Pr (X =x )

Ejemplo: Lanzamiento de tiros libres en basquetbol. Sea X una v.a.


Bernoulli iguala 1 si el jugador anota el primer tiro libre y 0 si falla.
Sea Y una v.a. Bernoulli igual a 1 si el jugador anota el segundo tiro
libre. Suponga que la densidad condicional es:
fY j X ( 1 j 1 )
fY j X ( 0 j 1 )
fY j X ( 1 j 0 )
fY j X ( 0 j 0 )

= 0, 85
= 0, 15
= 0, 70
= 0, 30

Rafael Snchez F. (UAI)

Econometra I

Agosto 2015

30 / 49

Dos Variables Aleatorias: Dist. Condicional

Esto signica que la probabilidad de que un jugador anote en el


segundo tiro libre depende de si anot o no el primero: si anot ste,
la probabilidad de que anote el segundo es 0,85 pero si fall el
primero la probabilidad de anotar el segundo es slo 0,70. Esto
signica que X e Y no son independientes, son dependientes.
En este caso se podra calcular P (X = 1, Y = 1) siempre y cuando se
conozca P (X = 1). Suponga que la probabilidad de anotar el primer
tiro libre P (X = 1) es 0,80. Entonces se tiene que:
P (X = 1, Y = 1) = P (Y = 1jX = 1) P (X = 1) = 0, 85 0, 80 = 0, 68

Rafael Snchez F. (UAI)

Econometra I

Agosto 2015

31 / 49

Dos Variables Aleatorias: Esperanza y Varianza Condicional


Esperanza Condicional: cuando conocemos los valores que toma X
podemos calcular el valor promedio que tomar Y. Se dene como
E (Y jX = x ) o E (Y jX ).Donde
m

E (Y jX = x ) =

yi P (Y

i =1

= yi jX = x )

Propiedades de E (Y jX ) :
1

E [E (Y )jX ] = E (Y ).Ley de esperanzas iteradas.


E [E (Y )jX ] = E (Y jX = xi )P (X = xi ). Ej: El peso promedio de
i =1

los adultos es igual al peso promedio de los adultos hombres por la


probabilidad de ser adulto y hombre mas el peso promedio de ser
adulto y mujer por la probabilidad de ser mujer.
Si X e Y son independientes entonces: E (Y jX ) = E (Y )

Varianza Condicional: dadas X e Y, la varianza de Y dado que X=x:


Var (Y jX = x ) = E (Y 2 jX ) E [(Y jX )]2
Rafael Snchez F. (UAI)

Econometra I

Agosto 2015

32 / 49

Dos Variables Aleatorias: Independencia


Se dice que dos variables aleatorias (X ,Y ) son independientes si al
conocer el valor de una de ella no ofrece informacin respecto de la
otra.
Especicamente, v.a.s X e Y son independientes si la distribucin
condicionada de Y dado X es igual a la distribucin marginal de Y :
Independencia: P (Y = y jX = x ) = P (Y = y )

Intuicin: el hecho que X tome un valor no afecta la probabilidad de


que Y tome valores, y viceversa.
El concepto de independencia es til pues en estos casos la
probabilidad conjunta se puede obtener de las marginales. En
particular: P (X = x, Y = y ) = P (X = x ) P (Y = y )
En palabras: la probabilidad de que X =x e Y =y (en conjunto) es el
producto de probabilidades de que P(X =x) e P(Y =y ).
Rafael Snchez F. (UAI)

Econometra I

Agosto 2015

33 / 49

Dos Variables Aleatorias: Independencia (cont.)


Ejemplo: Lanzamiento de un tiro libre en basquetbol. Sea X una v.a.
Bernoulli iguala 1 si el jugador anota el primer tiro libre y 0 si falla.
Sea Y una v.a. Bernoulli igual a 1 si el jugador anota el segundo tiro
libre. Suponga que en tiros libres el jugador tiene una probabilidad de
acertar de 80%. Entonces P (X = 1) = P (Y = 1)=0,8.
Cul es la probabilidad de que el jugador anote los dos tiros libres?.
Si X e Y son independientes entonces
P (X = 1, Y = 1) = P (X = 1) P (Y = 1)=0,8*0,8=0,64. Por lo
tanto, la probabilidad de que anote los dos tiros libres es de 64%.
Si X e Y no fuesen independientes, quiere decir que las
probabilidades de anotar el segundo tiro libre depende de si acerto o
no el primero, por lo que ya no sera posible hacer el clculo
utilizando la metodologa recin descrita.

Rafael Snchez F. (UAI)

Econometra I

Agosto 2015

34 / 49

Dos Variables Aleatorias: Covarianza y Correlacin


Para entender como dos v.a. evolucionan conjuntamente se utilizan la
covarianza y la correlacin. stas miden la relacin lineal entre dos
variables aleatorias tratndolas simtricamente.
Covarianza: mide el grado de dependencia lineal entre dos variables
aleatorias.
Si tiene signo positivo se mueven juntas mientras que si tiene signo
negativo se mueven en sentido contrario.
Su magnitud no es fcil de interpretar. Se denomina XY
Cov (X , Y ).
Sean X e Y dos v.a con E (X ) = X , E (Y ) = Y :
Cov (X , Y ) E [(X X )(Y Y )] = E [(X X )Y
E [(XY ) (Y X ) (X Y ) + X Y ]
= E (XY ) E (Y )X E (X )Y + X Y =
E (XY ) Y X X Y + X Y = E (XY ) X Y
Rafael Snchez F. (UAI)

Econometra I

(X

X ) Y ] =

Agosto 2015

35 / 49

Dos Variables Aleatorias: Covarianza y Correlacin


Si X e Y son independientes entonces la covarianza es 0.
La Covarianza a pesar de ser til por la informacin que entrega
respecto de la asociacin entre dos v.a., presenta un grave
problema.....que su valor depender de las unidades en que se midan
las v.a.!!!
Esto es, que dadas las constantes a1 , b1 , a2 , b2 :
Cov (a1 X + b1 , a2 Y + b2 ) = a1 a2 Cov (X , Y )
Esto es importante en economa pues hay mltiples variables que
pueden ser denidas en diversas unidades de medicin sin que esto
cambie su signicado. Por esta razn los economistas utilizan con
mayor frecuencia el coeciente de correlacin.
Suponga que se quiere conocer la relacin entre el peso (X) y la
estatura (Y) de una persona y se calcula su covarianza. El problema
es que la respueta que se obtenga va a depender de como se midan
estatura y peso. Aparte como el resultado son mezclas de ambas
unidades son diciles de interpretar.
Rafael Snchez F. (UAI)

Econometra I

Agosto 2015

36 / 49

Dos Variables Aleatorias: Covarianza y Correlacin

Correlacin: es un ndice que ajusta por unidad de medicin al


dividir la covarianza por las desviaciones estandar.
Cov (X ,Y )
Corr (X , Y ) = XY = p
=
Var (X )Var (Y )
Corr (X , Y ) = 0 slo si Cov (X , Y ) = 0
Rango: 1 XY
1

XY
X Y

Esta medida esta libre del problema de unidades! y es de fcil


interpretacin.

Rafael Snchez F. (UAI)

Econometra I

Agosto 2015

37 / 49

Dos Variables Aleatorias: Operaciones con Medias y


Varianzas de v.a.

E (X + Y ) = E (X ) + E (Y ) = X + Y
E (aX + bY ) = aE (X ) + bE (Y ) = aX + bY
Var (X + Y ) = Var (X ) + Var (Y ) + 2Cov (X , Y )
Var (aX + bY ) = a2 Var (X ) + b 2 Var (Y ) + 2abCov (X , Y )
Si X e Y no estn correlacionadas, i.e.
Cov (X , Y ) = 0 : Var (X + Y ) = Var (X

Y ) = Var (X ) + Var (Y )

Sean {X1 , X2 , .....XN g v.a. incorrelacionadas entre s, i.e.


Cov (Xi Xj ) = 0 8i 6= j y fa1 , a2 , .....aN g son constantes:
Var (a1 X1 + a2 X2 + .....aN XN ) =
2 Var (X )
a12 Var (X1 ) + a22 Var (X2 ) + ........ + aN
N

Rafael Snchez F. (UAI)

Econometra I

Agosto 2015

38 / 49

Dos Variables Aleatorias: Operaciones con Medias y


Varianzas de v.a.

Demostrar que:
Var (aX + bY ) = a2 Var (X ) + b 2 Var (Y ) + 2abCov (X , Y )
o
n
Var (aX + bY ) = E [(aX + bY ) (aX + bY )]2
n
o
Var (aX + bY ) = E [a (X X ) + b (Y Y )]2

Var
h (aX + bY ) =i
E a2 (X X )2 + 2E [ab (X
|
{z
} |
a 2 Var (X )

X )(Y
{z

2abCov (X ,Y )

b 2 Var (Y )
2
2
a Var (X ) + b Var (Y ) + 2abCov (X , Y )

Var (aX + bY ) =
Var (aX + bY ) = a2 2x + b 2 2y + 2abxy

Rafael Snchez F. (UAI)

h
i
Y )] + E b 2 (Y Y )2
} |
{z
}

Econometra I

Agosto 2015

39 / 49

La Distribucin Normal
La distribucin normal es la distribucin ms habitual en estadstica y
econometra, porque (i) frecuentemente se cumple; y (ii) suponer que
una v.a. tiene distribucin normal simplica los clculos
probabilsticos.
Si la media de una v.a. con distribucin normal es y su varianza es
2 , se dice que x N (, 2 )

Rafael Snchez F. (UAI)

Econometra I

Agosto 2015

40 / 49

La Distribucin Normal (cont.)

En trminos matemticos: f (x ) =

p1 exp
2

(x )2
22

, donde

= E (x ) y
= Var (x ).Algunas variables aleatorias parecen seguir
poco ms o menos una distribucin normal. Las estaturas y los pesos
de los seres humanos y las puntuaciones de test son algunos ejemplos.
Un caso particular de la distribucin normal se llama distribucin
normal estandar. Tal como su nombre lo indica es igual a la
distribucin normal pero estandarizada. Por convencin se
estandarizan con media = 0 y varianza = 1 y sus v.a.s se denominan
con letra Z. La FDP de la distribucin normal estndar se denomina
(z ) y la FDA se denomina (z ).

Rafael Snchez F. (UAI)

Econometra I

Agosto 2015

41 / 49

La Distribucin Normal (cont.)

La tabla de FDA de desviacin normal estndar permite encontrar la


probabilidad de que Z sea < o > a algn valor:
Pr (Z < z ) = (z )
Pr (Z > z ) = 1 (z )
Pr (Z < z ) = (z ) = Pr (Z > z ) = 1 (z )
Pr (a Z
b ) = (b ) (a )
Pr (jZ j > c ) = Pr (Z > c ) + Pr (Z < c ) 8c >
0, esto es lo mismo que 2Pr (Z > c ) = 2 [1 (c )]
Por tanto, la probabilidad de que el valor absoluto de Z sea mayor que
alguna constante positiva c es simplemente el doble de la probabilidad
Pr (Z > c ); esto reeja la simetra de la distribucin normal estndar.

Rafael Snchez F. (UAI)

Econometra I

Agosto 2015

42 / 49

La Distribucin Normal (cont.)

Propiedades de la distribucin normal estndar


1

Si x N (, 2 ) entonces 2
N (0, 1). Ejemplo: suponga que
x N (3, 4) y que se quiere calcular P (x 1).Para esto se debe restar
la media y dividir por la varianza:
1 3 ) = P( x 3
1
P (x 1) = P (x 3 1 3) = P ( x 4 3
4
4
2 )=
x 3
P(
1) = P (Z
1) = ( 1) = 0, 159
2 }
| {z
Z

Si x N (, 2 ) entonces ax + b N (a + b, a2 2 ) Ejemplo: si
x N (1, 9) y se quiere estimar la distribucin de y = 2x + 3.Sabemos
que su distribucin ser normal con media: 2E (x ) + 3 = 5 y varianza:
22 9 = 36 por lo tanto y N (5, 36)

Rafael Snchez F. (UAI)

Econometra I

Agosto 2015

43 / 49

La Distribucin Normal (cont.)


Toda combinacin lineal de v.a.s normales independientes e
identicamente distribuidas (i.i.d.), tiene una distribucin normal.
Ejemplo: sea xi , donde i = 1, 2, 3 v.a.s independientes con
distribucin normal N (, 2 ).Se dene W = x1 + 2x2 3x3 .Entonces
W esta distribuida normalmente, solo falta estimar su media y
varianza.
E (W ) = E (x1 ) + 2E (x2 ) 3E (x3 ) = + 2 3 = 0
Var (W ) = Var (x1 ) + 4Var (x2 ) + 9Var (x3 ) = 142
La propiedades anteriores tambin implican que el promedio de
variables aleatorias independientes y normalmente distribuidas tiene
una distribucin normal. Si y1 , ....yn son variables aleatorias
independientes y cada una tiene una distribucin normal
2
N (, 2 ) entonces: y N (, n )
Rafael Snchez F. (UAI)

Econometra I

Agosto 2015

44 / 49

La Distribucin Chi-Cuadrado
Esta distribucin se obtiene de la suma de variables normales estandar
(al cuadrado):
Si z1 , .....zn v.a.s y zi
N (0, 1) y son independientes, entonces:
n

zi2 = z12 + z22 + ..... + zn2

i =1

2n esta suma distribuye chi-cuadrado

con n grados de libertad.


De acuerdo a la frmula anterior, es claro que las variables aleatorias
chi-cuadrado son siempre no negativas, y que, a diferencia de la
distribucin normal, la distribucin Chi-cuadrada no es simtrica
respecto a ningn punto. Se puede demostrar que si x 2n entonces
el valor esperado de x es n y la varianza de x es 2n.

Rafael Snchez F. (UAI)

Econometra I

Agosto 2015

45 / 49

Los Grados de Libertad

Los grados de libertad estn dados por el nmero de valores que


pueden ser asignados de forma arbitraria, antes de que el resto de las
variables tomen un valor automticamente, producto de establecerse
las que son libres, esto, con el n de compensar e igualar un resultado
el cual se ha conocido previamente.
Ejemplo: Si tenemos que escoger a 10 personas de un grupo grande
de modo tal que el peso promedio sea de 60 Kg, tenemos la libertad
de elegir a los diez que nosotros consideremos. Obviamente pueden
existir muchas muestras de diez diferentes personas, pero siempre
debemos tener en cuenta que el promedio de los pesos debe ser 60 Kg.

Rafael Snchez F. (UAI)

Econometra I

Agosto 2015

46 / 49

Los Grados de Libertad (cont.)

Fcilmente nos podemos dar cuenta que solo podemos elegir


libremente a las primeras 9 personas, dado que para elegir al dcimo
este debe ser elegido de manera tal que el promedio del grupo no sea
mayor ni menor de 60 Kg. Es decir, podemos elegir con libertad a los
9 primeros, y el dcimo queda automticamente restringido por la
condicin de que su peso debe ser tal que la media de los diez pesos
debe ser 60 Kg. Por lo tanto, para una muestra de 10 personas
escogidas al azar, bajo la condicin de que la media de los pesos sea
60 Kg, tenemos 9 grados de libertad.
En trminos de economtricos, los grados de libertad son el nmero
de observaciones n menos el nmero de variables utilizadas para la
proyeccin.

Rafael Snchez F. (UAI)

Econometra I

Agosto 2015

47 / 49

La Distribucin t de Student
Esta es la distribucin mas utilizada en econometra y en estadstica,
principalmente para estimar y probar una media y una diferencia de
medias cuando no se conoce la desviacin estandar poblacional (y por
lo tanto se debe estimar con la muestral). Se obtiene a partir de la
razon entre una distribucin normal estandar y una chi-cuadrado. Si
z1 N (0, 1) y z2 2n entonces las v.a. T se dene como:
tn
T = pz1z2
n

A medida que va aumentando el nmero de observaciones, ceteris


paribus, la distribucin t es cada vez ms parecida a la normal
estndar, o alternativamente, a medida que aumentan los grados de
libertad la distribucin t se tiende a parecer a la distribucin normal
estandar). En general se observa que con n 30 se aproxima
bastante a la normal estndar.

Rafael Snchez F. (UAI)

Econometra I

Agosto 2015

48 / 49

La Distribucin F
Para el anlisis de regresin mltiple que veremos ms adelante, la
distribucin F nos ser de gran utilidad. Esta distribucin surge de la
razn de dos distribuciones chi-cuadrado.
En particular, sean: x1 y x2 v.a.s independientes, y sean
x1 2m y x2 2n entonces la dsitribucin F se dene:
F =

x1
m
x2
n

F(m,n )

Rafael Snchez F. (UAI)

Econometra I

Agosto 2015

49 / 49

Você também pode gostar