Escolar Documentos
Profissional Documentos
Cultura Documentos
Repaso de estadı́stica
Erix Ruiz
Variables aleatorias
discretas
Variables aleatorias
continuas
Esperanzas y
momentos
Econometrı́a I
Distribuciones
Repaso de estadı́stica multivariadas
Distribuciones
condicionales
La distribución normal
Erix Ruiz Distribuciones
relacionadas
Abril de 2011
Econometrı́a I
Contenido Repaso de estadı́stica
Erix Ruiz
Variables aleatorias
discretas
Variables aleatorias discretas
Variables aleatorias
continuas
Distribuciones
multivariadas
Esperanzas y momentos
Distribuciones
condicionales
Distribuciones
relacionadas
La distribución normal
Distribuciones relacionadas
Pruebas de hipótesis
Econometrı́a I
Variables aleatorias discretas Repaso de estadı́stica
Erix Ruiz
I Una variable aleatoria es una variable que puede tomar diferentes Variables aleatorias
discretas
valores (resultados) dependiendo del “estado de la naturaleza”. Variables aleatorias
continuas
I Por ejemplo, el resultado de lanzar un dado es aleatorio, con 6
Esperanzas y
posibles resultados. Si Y denota el resultado de lanzar un dado, la momentos
probabilidad de cada resultado es 1/6, lo cual se puede denotar Distribuciones
multivariadas
como:
Distribuciones
P {Y = y } = 1/6, y = 1, 2, · · · , 6. condicionales
I La función que relaciona los posibles resultados con sus La distribución normal
f (y ) = P {Y = y }
I La función f (y ) tiene la propiedad de que si la sumamos sobre
todos sus posible resultados, el resultado es uno. Esto es:
X
f (yj ) = 1.
j
Econometrı́a I
Variables aleatorias discretas Repaso de estadı́stica
Erix Ruiz
Variables aleatorias
discretas
Variables aleatorias
continuas
I El valor esperado de una variable aleatoria discreta es un promedio Esperanzas y
ponderado de todos los posibles resultados, donde las momentos
j Distribuciones
relacionadas
posibles resultados.
I Una distribución es degenerada si esta es concentrada en un único
punto, esto es, si P {Y = y } = 1 para un valor particular de y y
cero para otros valores.
Econometrı́a I
Variables aleatorias continuas Repaso de estadı́stica
Erix Ruiz
Variables aleatorias
discretas
Variables aleatorias
I Una variable aleatoria continua puede tomar un número infinito continuas
Pruebas de hipótesis
I En un gráfico, P {a ≤ Y ≤ b} es el área bajo la función f (y ) entre
los puntos a y b. Tomando la integral de f (y ) sobre todos los
posibles resultados, se tiene que:
Z ∞
f (y )dy = 1.
−∞
Econometrı́a I
Variables aleatorias continuas Repaso de estadı́stica
Erix Ruiz
Variables aleatorias
discretas
I Si Y toma valores sólo dentro de cierto rango, se asume
Variables aleatorias
implı́citamente que f (y ) = 0 para todos los valores fuera de este continuas
rango. Esperanzas y
momentos
I La función de densidad acumulada (cdf) se define como: Distribuciones
Z y multivariadas
F (y ) = P {Y ≤ y } = f (t)dt Distribuciones
condicionales
−∞
La distribución normal
Erix Ruiz
Variables aleatorias
discretas
Variables aleatorias
continuas
Erix Ruiz
Variables aleatorias
discretas
I Si Y y X son variables aleatorias y a y b son constantes, se cumple Variables aleatorias
que. continuas
E {aY + bX } = aE {Y } + bE {X } , Esperanzas y
momentos
I La esperanza es un operador lineal. Similares resultados no Distribuciones
multivariadas
necesariamente se obtienen si consideremos una transformación no
Distribuciones
lineal de una variable aletoria. Para una función no lineal g , no se condicionales
cumple en general que E {g (Y )} = g (E {Y }). Si g es cóncava La distribución normal
(g 00 (Y ) < 0), la desigualdad de Jensen dice que: Distribuciones
relacionadas
Erix Ruiz
Variables aleatorias
discretas
Variables aleatorias
I La varianza de una variable aleatoria, usualmente denotada por σ 2 , continuas
Esperanzas y
es una medida de dispersión de la distribución y es definida como: momentos
Distribuciones
σ 2 = Var [Y ] = E [(Y − µ)2 ] multivariadas
Distribuciones
I La varianza es usualmente denominada el segundo momento condicionales
Distribuciones
E [(Y − µ)2 ] = E [Y 2 ] − 2E [Y ]µ + µ2 = E [Y 2 ] − µ2 . relacionadas
Pruebas de hipótesis
Erix Ruiz
Variables aleatorias
discretas
I Para una distribución continua, se tiene que : Variables aleatorias
continuas
Z ∞
Esperanzas y
Var [Y ] = (y − µ)2 f (y )dy . momentos
−∞ Distribuciones
multivariadas
I Usando estas definiciones es fácil verificar que: Distribuciones
condicionales
2
Var [aY + b] = a Var [Y ]. La distribución normal
Distribuciones
I Otra medida es la desviación estándar, denotada por σ y se define relacionadas
E [(Y − µ)k ], k = 1, 2, · · ·
Econometrı́a I
Esperanzas y momentos Repaso de estadı́stica
Erix Ruiz
Variables aleatorias
discretas
Variables aleatorias
continuas
Esperanzas y
momentos
I En particular, el tercer momento central es una medida de Distribuciones
asimetrı́a de una distribución alrededor de su media, mientras en multivariadas
Erix Ruiz
La distribución normal
P[a1 < Y < b1 , a2 < X < b2 ] = P[a1 < Y < b1 ]P[a2 < X < b2 ]. Distribuciones
relacionadas
función de densidad
Z ∞
f (y ) = f (y , x)dx.
−∞
Erix Ruiz
Variables aleatorias
discretas
Variables aleatorias
continuas
I La covarianza entre Y y X es una medida de dependencia lineal Esperanzas y
entre dos variables. Esta es definida como: momentos
Distribuciones
σxy = Cov [Y , X ] = E [(Y − µy )(X − µx )]. multivariadas
Distribuciones
condicionales
I O de manera equivalente:
La distribución normal
Pruebas de hipótesis
I El coeficiente de correlación está dado por la covarianza
estandarizada por las dos desviaciones estándar, es decir:
Cov [Y , X ] σxy
ρyx = p = .
Var [Y ]Var [X ] σx σy
Econometrı́a I
Distribuciones multivariadas Repaso de estadı́stica
Erix Ruiz
Variables aleatorias
discretas
I El coeficiente de correlación está siempre entre −1 y 1 y no es Variables aleatorias
continuas
afectado por la escala de las variables. Si Cov [Y , X ] = 0, Y y X
Esperanzas y
están no correlacionadas. Cuando a, b, c, d son constantes, se momentos
La distribución normal
I Adicionalmente:
Distribuciones
relacionadas
Cov [aY +bX , X ] = aCov [Y , X ]+bCov [X , X ] = aCov [Y , X ]+bVar [X ].
Pruebas de hipótesis
Erix Ruiz
Variables aleatorias
I Si consideramos un vector de dimensión K de variables aleatorias discretas
Y = (Y1 , · · · , YK )0 , se puede definir la esperanza del vector como: Variables aleatorias
continuas
E [Y1 ] Esperanzas y
momentos
..
E [Y] =
. Distribuciones
multivariadas
E [YK ] Distribuciones
condicionales
I Mientras su matriz de varianza-covarianza (o simplemente matriz La distribución normal
de covarianzas es: Distribuciones
relacionadas
· · · Cov [Y1 , YK ]
Var [Y1 ] Pruebas de hipótesis
.. .. ..
Var [Y] =
. . .
Cov [YK , Y1 ] · · · Var [YK ]
I Nótese que esta matriz es simétrica. Si consideremos más
combinaciones de los elementos en Y, por ejemplo RY, donde R es
de dimensión J × K , se cumple que:
Erix Ruiz
Variables aleatorias
discretas
I Una distribución condicional describe la distribución de una Variables aleatorias
variable, digamos Y , dado el resultado de otra variable X . continuas
Esperanzas y
I Por ejemplo, si lanzamos dos dados, X podrı́a denotar el resultados momentos
del primer dado y Y el resultado del segundo. Entonces podrı́amos Distribuciones
multivariadas
estar interesados en la probabilidad de de obtener la suma de 7 si el
Distribuciones
primer dado tiene un resultado de 3, o un resultado menor o igual condicionales
a 3. La distribución normal
I La distribución condicional es implicada por la distribución Distribuciones
relacionadas
conjunta de las dos variables. Es decir:
Pruebas de hipótesis
f (y , x)
f (y |X = x) = f (y |x) = .
f (x)
I Si Y y X son independientes, se obtiene que f (y |x) = f (y ) . De la
definición previa se cumple que:
f (y , x) = f (y |x)f (x).
Econometrı́a I
Distribuciones condicionales Repaso de estadı́stica
Erix Ruiz
Variables aleatorias
discretas
Variables aleatorias
continuas
Esperanzas y
I La distribución conjunta de dos variables puede ser descompuesta momentos
Distribuciones
I La esperanza condicional de Y dado X = x es el valor esperado relacionadas
Erix Ruiz
Variables aleatorias
discretas
I La esperanza condicional es una función de x a menos que Y y X Variables aleatorias
sean independientes. Similarmente, se define la varianza continuas
Distribuciones
condicionales
La cual se puede escribir como:
La distribución normal
2 2
Var [Y |x] = E [Y |x] − (E [Y |x]) . Distribuciones
relacionadas
Pruebas de hipótesis
Con lo cual se cumple que:
Erix Ruiz
Variables aleatorias
discretas
I Consideremos la relación entre dos variables aleatorias Y y X , Variables aleatorias
continuas
donde E [Y ] = 0. Entonces, se sabe que Y y X son no
Esperanzas y
correlacionadas si momentos
Distribuciones
E [YX ] = Cov [Y , X ] = 0. multivariadas
Distribuciones
I Si Y es independiente en la media condicional de X significa que condicionales
: La distribución normal
E [Y |X ] = E [Y ] = 0. Distribuciones
relacionadas
I Esta condición es más fuerte que la cero correlación debido a que Pruebas de hipótesis
Erix Ruiz
Variables aleatorias
discretas
Variables aleatorias
I En econometrı́a la distribución normal juega un papel importante. continuas
La distribución normal
I Lo cual se escribe como Y ∼ N (µ, σ 2 ). Se puede verificar que una Distribuciones
relacionadas
distribución normal es simétrica. La distribución normal estándar se
Pruebas de hipótesis
obtiene para µ = 0 y σ = 1. Notese que la variable estandarizada
(Y − µ)/σ es N (0, 1) si Y ∼ N (µ, σ 2 ). La densidad de una
distribución normal estandarizada, φ, está dada por:
1 1
φ(y ) = √ exp − y 2 .
2π 2
Econometrı́a I
La distribución normal Repaso de estadı́stica
Erix Ruiz
Variables aleatorias
discretas
Variables aleatorias
continuas
I Un propiedad útil de la distribución normal es que una función Esperanzas y
lineal de una variable normal también es normal. Es decir, si momentos
AY + b ∼ N (aµ + b, a2 σ 2 ). Distribuciones
condicionales
La distribución normal
I La función de densidad acumulada de una distribución normal no
Distribuciones
tiene una expresión en forma cerrada. Se tiene: relacionadas
Pruebas de hipótesis
Y −µ y −µ
y − µ Z (y −µ)/σ
P[Y ≤ y ] = P ≤ =Φ = φ(t)dt,
σ σ σ −∞
Erix Ruiz
Variables aleatorias
discretas
Variables aleatorias
continuas
Esperanzas y
momentos
I La simetrı́a también implica que el tercer momento de una Distribuciones
multivariadas
distribución normal es cero. Se puede mostrar que el cuarto
Distribuciones
momento central de una distribución normal está dado por condicionales
La distribución normal
E [(Y − µ)4 ] = 3σ 4 .
Distribuciones
relacionadas
4 4
I Notese que esto implica que E [Y ] = 4σ . Tı́picamente estas Pruebas de hipótesis
propiedades del tercer y cuarto momento central son usados para
hacer pruebas de normalidad.
Econometrı́a I
La distribución normal Repaso de estadı́stica
Erix Ruiz
Variables aleatorias
discretas
Variables aleatorias
Figura: Distribuciones normales N (0, 1) y N (0.5, 1.3) continuas
Esperanzas y
momentos
Distribuciones
multivariadas
Distribuciones
condicionales
La distribución normal
Distribuciones
relacionadas
Pruebas de hipótesis
Econometrı́a I
La distribución normal Repaso de estadı́stica
Erix Ruiz
Variables aleatorias
discretas
Erix Ruiz
Variables aleatorias
discretas
Esperanzas y
µy |x = µy +( σyx /σx2 )(x − µx ), momentos
Distribuciones
I σy2|x es la varianza condicional de Y dado X y se define como: multivariadas
Distribuciones
condicionales
σy2|x = σy2 − σyx
2
/σx2 = σy2 (1 − ρ2yx ),
La distribución normal
Erix Ruiz
Variables aleatorias
discretas
I Entonces, si Y y X tienen una distribución normal conjunta con
Variables aleatorias
correlación cero, son automáticamente independientes. continuas
Distribuciones
aY + bX ∼ N (aµy + bµx , a2 σy2 + b 2 σx2 + 2abσyx ). condicionales
La distribución normal
Y ∼ N (µ, Σ),
RY ∼ N (Rµ, RΣR 0 ).
Econometrı́a I
Distribuciones relacionadas Repaso de estadı́stica
Erix Ruiz
Variables aleatorias
discretas
I Además de la distribución normal, existen otras distribuciones que
Variables aleatorias
son importantes. continuas
Distribuciones
J
X condicionales
j=1 Distribuciones
relacionadas
Erix Ruiz
Variables aleatorias
discretas
Esperanzas y
momentos
Distribuciones
multivariadas
Distribuciones
condicionales
La distribución normal
Distribuciones
relacionadas
Pruebas de hipótesis
Econometrı́a I
Distribuciones relacionadas Repaso de estadı́stica
Erix Ruiz
Variables aleatorias
I Si Y = (Y1 , · · · , YJ )0 es un vector de variables aleatorias que tienen discretas
una distribución normal conjunta con vector de medias µ y matriz Variables aleatorias
continuas
de covarianzas (no singular) Σ, se cumple que: Esperanzas y
momentos
ξ = (Y − µ)0 Σ−1 (Y − µ) ∼ χ2J . Distribuciones
multivariadas
I Si ξ tiene un distribución Chi-cuadrado con J grados de libertad, se Distribuciones
condicionales
cumple que E [ξ] = J y Var [ξ] = 2J.
La distribución normal
I Ahora consideremos la distribución t (Student). Si X ∼ N (0, 1), y Distribuciones
ξ ∼ χ2J y si X y ξ son independientes, el ratio relacionadas
Pruebas de hipótesis
X
t= p
ξ/J
tiene una distribución t con J grados de libertad. Similar a la
distribución normal estándar, la distribución t es simétrica es
alrededor de cero, pero tiene colas mas anchas, particularmente
para valores pequeños de J. Si J tiene a un valor muy grande, la
distribución t se aproxima a una distribución normal.
Econometrı́a I
Distribuciones relacionadas Repaso de estadı́stica
Erix Ruiz
Variables aleatorias
discretas
Esperanzas y
momentos
Distribuciones
multivariadas
Distribuciones
condicionales
La distribución normal
Distribuciones
relacionadas
Pruebas de hipótesis
Econometrı́a I
Distribuciones relacionadas Repaso de estadı́stica
Erix Ruiz
Variables aleatorias
discretas
Variables aleatorias
I Si ξ1 ∼ χ2J1 y ξ2 ∼ χ2J2 y si ξ1 y ξ2 son independientes, se cumple continuas
que : Esperanzas y
momentos
ξ1 /J1
f = Distribuciones
ξ2 /J2 multivariadas
Erix Ruiz
Variables aleatorias
discretas
Variables aleatorias
continuas
I Cuando J1 = 1, ξ1 es una variable normal cuadrada, es decir, Esperanzas y
ξ1 = X 2 , y se cumple que. momentos
Distribuciones
!2 multivariadas
X ξ1
t2 = p = = f ∼ FJ12 . Distribuciones
ξ2 /J2 ξ2 /J2 condicionales
La distribución normal
I Es decir, con un grado de libertad en el numerador, la distribución Distribuciones
relacionadas
F es el cuadrado de una distribución t. Si J2 es grande, la
Pruebas de hipótesis
distribución de
ξ1
J1 f =
ξ2
es bien aproximada por una distribución Chi-cuadrado con J1
grados de libertad.
Econometrı́a I
Distribuciones relacionadas Repaso de estadı́stica
Erix Ruiz
Variables aleatorias
discretas
Variables aleatorias
continuas
Esperanzas y
momentos
I Finalmente, consideremos la distribución lognormal. Si log Y tiene Distribuciones
una distribución normal con media µ y varianza σ 2 , entonces multivariadas
Pruebas de hipótesis
1
E [Y ] = exp µ + σ 2 .
2
Econometrı́a I
Pruebas de hipótesis Repaso de estadı́stica
Erix Ruiz
Variables aleatorias
I Una hipótesis estadı́stica es una afirmación sobre los valores de discretas
aleatorio.
I La hipótesis que estamos probando es la hipótesis nula, H0 . La
hipótesis alternativa es denotada por H1 .
I La probabilidad de rechazar H0 , cuando esta es cierta, se conoce
como el nivel de significancia. Para probar si la diferencia
observada entre los datos y lo que uno espera bajo H0 es
significativa, usamos estadı́sticos de prueba.
Econometrı́a I
Pruebas de hipótesis Repaso de estadı́stica
Erix Ruiz
Variables aleatorias
discretas
Variables aleatorias
I Un criterio deseable para el estadı́stico de prueba es que su continuas
distribución muestral sea tratable, de preferencia con Esperanzas y
momentos
probabilidades tabuladas. Ası́, generalmente se utilizan las
distribuciones normal, t, χ2 y F para realizar estos estadı́sticos. Distribuciones
multivariadas
H0 : µ = 7
contra
H1 : µ 6= 7
Econometrı́a I
Pruebas de hipótesis Repaso de estadı́stica
Erix Ruiz
Variables aleatorias
discretas
Variables aleatorias
continuas
I El estadı́stico de prueba a usar es: Esperanzas y
momentos
√
n(ȳ − µ) Distribuciones
t= multivariadas
S
Distribuciones
condicionales
que tiene una distribución t con (n − 1) grados de libertad. Si
La distribución normal
n = 25, ȳ = 10, S = 5, bajo H0 el valor observado de t es t0 = 3,
Distribuciones
mientras el P − value es (dado los grados de libertad) relacionadas
Pruebas de hipótesis
P = Prob[t24 > 3].
I Es una práctica común mencionar simplemente que el resultado de
la prueba es (estadı́sticamente) significativo o no significativo y no
reportar los P − values
Econometrı́a I
Pruebas de hipótesis Repaso de estadı́stica
Erix Ruiz
Esperanzas y
I Estadı́sticamente no significativo: la variabilidad de la muestra es momentos
una explicación probable de la discrepancia entre el valor de la Distribuciones
multivariadas
hipótesis nula y en valor muestral.
Distribuciones
I Es usual rechazar la hipótesis nula, H0 , cuando el estadı́stico de condicionales
significancia. H0 puede ser cierta o falsa. Ası́, se pueden tener las Distribuciones
relacionadas
siguientes posibilidades:
Pruebas de hipótesis
Erix Ruiz
Erix Ruiz
Variables aleatorias
discretas
Variables aleatorias
continuas
Distribuciones
multivariadas
Distribuciones
condicionales
La distribución normal
Distribuciones
relacionadas
Pruebas de hipótesis