EstadÃ-sticas y EconometrÃ-A Financiera Solucionario Completo High

Estadísticas y
Econometría Financiera
Solucionario de
los Problemas
Propuestos
Eduardo Court Monteverde
Erick Williams Rengifo
C a pí t ulo
Estadística descriptiva
1) ¿Cuál es la diferencia entre parámetro y un estadístico?

La diferencia es que el Parámetro describe alguna característica de una población y Es-
tadística lo hace de una muestra.
2) ¿Por qué una muestra tiene que ser representativa de la población de la cual ha sido to-
mada?
Una muestra debe ser representativa, es decir, debe asemejarse lo más posible a la pobla-
ción de la cual se toma, para: a) poder ser empleada para hacer inferencias acerca de las
características de la población; b) reducir el error muestral.
3) ¿El error muestral puede siempre disminuirse aumentando el tamaño de la muestra?
Se puede disminuir el error muestral incrementando el tamaño de la muestra si y solo si
no se ha cometido un error sistemático. Si se ha cometido un error sistémico, sin im-
portar el tamaño de la muestra, el error muestral no podrá ser disminuido.
4) ¿El muestreo probabilístico es usado comúnmente para realizar estudios exploratorios?
Comente.
No. El muestreo no-probabilístico es el que comúnmente se utiliza para realizar estu-
dios exploratorios, donde el objetivo principal es familiarizarse con la población a estu-
diar. Es importante recordar que en estos estudios exploratorios, el objetivo no es
generalizar los resultados para lo cual se usa el método probabilístico.
1
Estadísticas y Econometría Financiera
5) El muestreo aleatorio simple, el muestreo sistemático y el muestreo basado en el juicio

del analista, son todos muestreos probabilísticos.
El muestreo aleatorio simple y el muestreo sistemático son métodos probabilísticos. El
muestreo basado en el juicio del analista no es un método probabilístico. Los resultados
de este último método dependen en gran medida del criterio y conocimiento de la
persona bajo cuyo juicio se realizó el muestreo.
6) Explique cuál es el principal problema del muestreo sistemático.
El principal problema de este método es el conocido como periodicidad o estacionarie-
dad. Este problema se da cuando el factor de selección (k) coincide con estos periodos,
lo que puede llevar al analista a obtener conclusiones erróneas. Por ejemplo, se desea
hacer inferencias acerca de las ventas anuales de helados. Se supone que se cuenta con
datos trimestrales. Si se decide emplear el método sistemático y se determina como fac-
tor de selección, se puede acabar seleccionando solo aquellas ventas producidas en al-
guna estación del año, con lo cual los resultados obtenidos no podrán ser utilizados
para hacer inferencias acerca de las ventas anuales.
7) Explique las características de una tabla de frecuencias adecuadamente estructurada
(mutuamente excluyente y exhaustivas).
Las clases deben ser excluyentes y exhaustivas, es decir que cada elemento del conjunto
debe pertenecer a una sola clase y, a su vez, todo elemento debe pertenecer a alguna
clase. O sea que todo elemento debe quedar dentro de una clase pero no puede estar en
dos clases a la vez.
8) Si se tienen los siguientes datos que corresponden al número de horas por día, pasadas
frente al televisor, por un grupo de 20 niños: 2.0, 2.5, 3.0, 1.2, 2.9, 3.2, 2.5, 1.7, 2.3,
1.5, 4.1, 2.9, 3.1, 3.2, 4.4, 3.2, 4.1, 3.5, 2.8, 3.6. Con estos datos construya la tabla de
distribución de frecuencias que incluya las frecuencias, frecuencias acumuladas, las fre-
cuencias relativas y las frecuencias relativas acumuladas. Para la construcción de las
clases empiece en 1 y que el rango de las clases sea también 1, es decir, la primera clase
será [1,2).
2
capítulo 1 Estadística descriptiva
Frecuencia
Frecuencia Frecuencia acumulada
Datos Bin Clase Frecuencia relativa acumulada relativa % acumulado
1,2 1 1 0 0,00%
1,5 2 2 3 0,15 3 0,15 15,00%
1,7 3 3 7 0,35 10 0,50 50,00%
2,0 4 4 7 0,35 17 0,85 85,00%
2,3 5 5 3 0,15 20 1,00 100,00%
2,5 y mayor... 0 100,00%
2,5 20 1 100,00%
2,8
2,9
2,9 Histograma
3,0
3,1 8 120,00%
3,2 7 100,00%
3,2 6
Frecuencia
5 80,00%
3,2 Frecuencia
4 60,00%
3,5 3 % acumulado
3,6 40,00%
2
4,1 1 20,00%
4,1 0 0,00%
4,4
Clase
9) Basados en la pregunta 8, grafique el histograma, el polígono de frecuencias, y el grá-

fico de las frecuencias relativas acumuladas.
10) Basados en la pregunta 8 responda las siguientes preguntas:

a. ¿Cuál es el porcentaje de niños que ven televisión menos de 3 horas?
50% (Ver cuadro de Distribución de Frecuencias Pregunta 8.)
b. ¿Cuántos niños ven televisión entre 2 y 3 horas?
7 (Ver cuadro de Distribución de Frecuencias Pregunta 8.)
3
c. ¿Cuántos niños ven televisión entre 2 y 4 horas?

14 (Ver cuadro de Distribución de Frecuencias Pregunta 8.)
d. ¿Cuál es el porcentaje de niños que ven televisión tres horas o más?
50% (Ver cuadro de Distribución de Frecuencias Pregunta 8.)
11) Desarrolle el ejercicio 8 usando Excel.
Frecuencia
Frecuencia Frecuencia acumulada
Datos Bin Clase Frecuencia relativa acumulada relativa % acumulado
1,2 1 1 0 0,00%
1,5 2 2 3 0,15 3 0,15 15,00%
1,7 3 3 7 0,35 10 0,50 50,00%
2,0 4 4 7 0,35 17 0,85 85,00%
2,3 5 5 3 0,15 20 1,00 100,00%
2,5 y mayor... 0 100,00%
2,5 20 1 100,00%
2,8
2,9
2,9 Histograma
3,0
3,1 8 120,00%
3,2 7 100,00%
3,2 6
Frecuencia
5 80,00%
3,2 Frecuencia
4 60,00%
3,5 3 % acumulado
3,6 40,00%
2
4,1 1 20,00%
4,1 0 0,00%
4,4
Clase
12) Basados en los datos del ejercicio 8 calcule las siguientes medidas de tendencia central:
a. La media
Media Promedio() 2,885
b. La mediana
Mediana Mediana() 2,950
c. La moda
Moda Moda() 3,200
13) Basados en los datos del ejercicio 8 calcule las siguientes medidas de dispersión:
a. El rango
Rango Max()-Min() 3,200
4
b. Los cuartiles
1er Cuartil, Q posición = ( N + 1) / 4 → (20 + 1) / 4 =
5, 25
Luego:
Q1 = [ 2,3 + 0, 25 × (2,5 − 2,3) ] ⇒ Q1 = 2,35
2do Cuartil, Q posición = 2 × ( N + 1) / 4 → 2 × (20 + 1) / 4 =

10,5
En consecuencia:
Q2 = [ 2,9 + 0,5 × (3, 0 − 2,9) ] ⇒ Q2 = 2,95
(Nótese que este valor corresponde a la mediana)
3er Cuartil, Q posición = 3 × ( N + 1) / 4 → 3 × (20 + 1) / 4 =15, 75

De esta forma:
Q3 = [3, 2 + 0, 75 × (3,5 − 3, 2) ] ⇒ Q3 = 3,425
c. El rango inter-cuartil
El rango inter-cuartil es: Q3 − Q1 =
1, 075
d. La desviación del cuartil

La desviación del cuartil es: (Q3 − Q1 ) / 2 =
0,5375
e. La desviación media absoluta

La desviación media absoluta es: Desvprom() = 0, 658
f. La varianza muestral
La varianza muestral es: Var () = 0, 7413
g. La desviación estándar muestral

La desviación estándar muestral es: Desvest () = 0,8610
14) Basadosen los datos del ejercicio 8 calcule la variable estandarizada (z) y demuestre que
su media es 0 y su varianza 1.
5
g. La desviación estándar muestral
La desviación estándar muestral es: Desvest ()  0,8610
14)y Basados
Estadísticas Econometríaen los datos del ejercicio 8 calcule la variable estandarizada (z) y
Financiera
demuestre que su media es 0 y su varianza 1.
Teniendo
Teniendo la base
la base de datos
de datos se calcula
se calcula el valor
el valor estandarizado
estandarizado para dato:
para cada cada dato:
Datos 𝑋𝑋𝑖𝑖 − 𝑚𝑚𝑒𝑒𝑑𝑑𝑖𝑖𝑎𝑎

Datos
Horas frente 𝑍𝑍𝑖𝑖 =
Horas frente televisor 𝑆𝑆
televisor
1,2 1,2 -1,96
-1,96
1,5 1,5 -1,61
-1,61
1,7 1,7 -1,38
-1,38
2,0 2,0 -1,03
-1,03
2,3 2,3 -0,68
-0,68
2,5 -0,45
2,5 -0,45
2,5 -0,45
2,5 -0,45
2,8 -0,10
2,8 2,9 -0,10
0,02
2,9 2,9 0,02
0,02
2,9 3,0 0,13
0,02
3,0 3,1 0,25
0,13
3,1 3,2 0,37
0,25
3,2 0,37
3,2 0,37
3,2 0,37
3,2 0,37
3,5 0,71
3,2 3,6 0,37
0,83
3,5 4,1 0,71
1,41
3,6 0,83
4,1 1,41
4,1 1,41
4,4 1,76
Media 2,885 0,000 m
Desviación
0,861 1,000 S
estándar
15) Basados en los datos del ejercicio 8 calcule el coeficiente de variación.

CV =
S / Media ⇒ (0,861/ 2,885) =
0, 2984
16) Se tiene dos muestras. La media y desviación estándar de la primera es igual a 0,25 y
0,1, respectivamente. La media y desviación estándar de la segunda es igual a 210 y 5,
respectivamente. Comparando la desviación estándar de ambas se puede concluir que
la primera muestra es menos dispersa que la segunda. ¿Es esta conclusión válida? ¿Por
qué? ¿Cuál sería la manera correcta de determinar cuál de las muestras presenta más
dispersión?
Desviación Coeficiente
Descripción Media
estándar de variación
Muestra 1 0,25 0,10 0,400
Muestra 2 210,00 5,00 0,024
6
Basados únicamente en la desviación estándar no se puede concluir qué variable es más

dispersa. La manera correcta de determinar cuál muestra presenta más dispersión es en
base al coeficiente de variación que da la relación de la desviación estándar respecto de
la media. La muestra que presenta más dispersión es la muestra 1.
17) ¿Aqué se refiere el problema de la media referido a los valores extremos (outliers)? Pre-
sente un ejemplo simple en el que se demuestre este problema.
Pesos en Kg. Pesos en Kg.
Varones de 30-35 años Varones de 30-35 años
73,0 73,0
75,9 75,9
77,8 77,8
78,0 78,0
79,0 79,0
79,3 79,3
80,0 80,0
80,5 80,5
81,5 81,5
82,0 250,00
Mediana 79,15 79,15
Media 78,70 95,50
El problema de la media referido a los valores extremos, se pone de manifiesto cuando

un dato es considerablemente mayor o menor que el resto de observaciones. En el ejem-
plo se tiene un valor extremo positivo, lo que hace que la media se mueva hacia la dere-
cha.
18) ¿La mediana se ve afectada por los valores extremos?
a mediana no se ve afectada por los valores extremos, debido a que su valor corres-
L
ponde a la ubicación central de una muestra de datos ordenada. Eso se puede observar
en el ejemplo anterior.
19) (Ejercicioen Excel) En la Tabla 10 se muestran los datos del producto interno bruto, de
los gastos en consumo personales y de la inversión bruta en construcción residencial en
los Estados Unidos durante los años 2000 al 2009.Los datos se obtuvieron del Bureau
of Economic Analysis. Utilice estos datos para realizar lo siguiente:
7
a) Hacer el diagrama de series de tiempo del PBI y de los gastos en consumo persona-
les:
Gastos en consumo Inversión bruta en
Año Producto bruto interno
personales construcción residencial
2000 9.951,50 6.830,40 449,00
2001 10.286,20 7.148,80 472,40
2002 10.642,30 7.439,20 509,50
2003 11.142,10 7.804,00 577,60
2004 11.867,80 8.285,10 680,60
2005 12.638,40 8.819,00 775,00
2006 13.398,90 9.322,70 761,90
2007 14.077,60 9.826,40 629,00
2008 14.441,40 10.129,90 477,20
2009 14.256,30 10.089,10 361,00
Diagrama de series de tiempo del PBI y de los gastos en consumo personales.
Series de tiempo del PBI y Gastos en consumos

personales
16000
14000
12000
Billones de US$
10000
8000
6000
4000
2000
0
Años
Producto bruto interno Gastos en consumo personales
b)
b) Hacer
Hacer eleldiagrama
diagrama de dispersión
de dispersión entre
entre el PBI y loselgastos
PBI eny consumo
los gastos en consumo
personales. Asumir
personales. Asumir es
que la variable endógena que la en
gastos variable
consumoendógena es gastos
personales. Añadir la línea en consumo
de tendencia y
personales. Añadir la línea de tendenciay mostrar la ecuación de
mostrar la ecuación de la misma, así como el coeficiente de determinación (R ). 2la misma,
así como elcoeficiente de determinación (R2).
8
Diagrama de dispersión entre PBI y Gastos en

consumos personales
11.000,00
y=0,721 x - 284,2
10.000,00 R2=0,998
Gastos en consumos
en Billones US$
9.000,00
personales
8.000,00
7.000,00
6.000,00
9.000,00 11.000,00 13.000,00 15.000,00
Gastos en consumo personales Lineal (Gastos en consumo personales)
PBI en Billones US$
Hacer el diagrama de dispersión entre el PBI y la inversión bruta en construcción resi-

dencial. Asumir que la variable endógena es la inversión bruta en construcción residen-
cial. Añadir la línea de tendencia, y mostrar la ecuación de la misma así como el
coeficiente de determinación (R 2).
Se observa que con una ecuación lineal el coeficiente de determinación es bajo, la varia-
ble endógena es explicada con un valor muy bajo por la ecuación lineal.
c) Calcular el coeficiente de correlación entre el PBI y los gastos en consumo personales.
Explique su resultado en términos del signo y la magnitud del coeficiente de correla-
ción.
Se observa que el coeficiente de correlación (r = 0,992), es positivo y refleja que el PBI
se relaciona directamente con los gastos en consumo personal de manera bastante
fuerte (el valor del coeficiente de correlación es bastante cercano a 1).
d) Calcular el coeficiente de correlación entre el PBI y la inversión bruta en construcción
residencial. Explique su resultado en términos del signo y la magnitud del coeficiente
de correlación.
Se observa que el coeficiente de correlación (r = 0,1396), es positivo pero no tan fuerte
como en el caso anterior (el valor del coeficiente es cercano a 0).
e) Explique la relación entre la ecuación de la línea calculada en la pregunta b) y el coefi-
ciente de correlación estimado en la pregunta d).
La ecuación calculada en “b”
= es Y 0, 7216 X − 284, 27 con R 2 = 0,9984.
El coeficiente de correlación estimado en “d” es R = 0,9992
9
La variable Y (gasto en consumo personales) es explicada por la variable X (PBI) en re-

lación directa. Esto está de acuerdo con el coeficiente de correlación que también in-
dica una relación directa y positiva.
20) (Ejercicioen Excel) Basados en los datos presentados en el ejercicio anterior construya
una tabla que contenga la media, la mediana, el rango, el valor máximo, el valor mí-
nimo, la varianza y la desviación estándar de cada una de las variables incluidas en el
archivo, es decir, del producto interno bruto, de los gastos en consumo personales y de
la inversión bruta en construcción residencial.
Inversión bruta
Producto Bruto Gastos en consumo
Año en construcción
Interno personales
residencial
2000 9.951,50 6.830,40 449,00
2001 10.286,20 7.148,80 472,40
2002 10.642,30 7.439,20 509,50
2003 11.142,10 7.804,00 577,60
2004 11.867,80 8.285,10 680,60
2005 12.638,40 8.819,00 775,00
2006 13.398,90 9.322,70 761,90
2007 14.077,60 9.826,40 629,00
2008 14.441,40 10.129,90 477,20
2009 14.256,30 10.089,10 361,00
Media Promedio() 12.270,25 8.569,46 569,32

Mediana Mediana() 12.253,10 8.552,05 543,55
Rango Max() - Min() 4.489,90 3.299,50 414,00
Valor máximo Max() 14.441,40 10.129,90 775,00
Valor mínimo Min() 9.951,50 6.830,40 361,00
Varianza Var() 2.970.239,09 1.548.966,60 19.415,22
Desviación estándar Desvest() 1.723,44 1.244,57 139,34
21) ¿Qué información nos proporciona el coeficiente de correlación?

El coeficiente de correlación proporciona como varía la variable endógena (Y) cuando
varía la variable exógena (X). Recuerde que el coeficiente de correlación solo muestra la
dependencia lineal entre dos variables.
22) ¿Cuál es la diferencia entre el coeficiente de correlación y el coeficiente de determina-
ción?
El coeficiente de determinación explica en porcentaje la variación de la variable endó-
gena explicada por la variación de las variables exógenas.
10
C a pí t ulo
Probabilidades
1. ¿Qué es una variable aleatoria?

Una variable aleatoria es aquella variable cuyos posibles valores son conocidos antes de
realizar un experimento pero cuyo valor final solo puede ser conocido una vez realizado
el experimento.
2. ¿Cuál es la diferencia entre una variable aleatoria discreta y una continua?
Variable aleatoria discreta: Es una variable aleatoria que puede tomar solo ciertos
valores en un determinado intervalo, con separaciones entre esos valores.
Variable aleatoria continua: Una variable aleatoria continua es aquella que puede
tomar cualquier valor en un determinado intervalo.
3. Se lanzan dos dados a la vez y se observan los resultados del lanzamiento. En base a
esto definir:
a) El experimento: Lanzar los dados.
b) La variable aleatoria relacionada con el experimento: Todos los resultados posibles
de lanzar los 2 dados a la vez son:
{(1,1), (1,2), (1,3), (1,4), (1,5), (1,6), (2,1), (2,2), (2,3), (2,4), (2,5), (2,6), (3,1), (3,2),
(3,3), (3,4), (3,5), (3,6), (4,1), (4,2), (4,3), (4,4), (4,5), (4,6), (5,1), (5,2), (5,3), (5,4),
(5,5), (5,6), (6,1), (6,2), (6,3), (6,4), (6,5), (6,6)}.
11
c) El espacio muestral del experimento: estará dado por los 36 posibles resultados pre-
sentados en la pregunta b).
d) Un evento cualquiera: Sacar un resultado de “2” al lanzar ambos dados.
e) La probabilidad de obtener 7: La probabilidad de obtener 7 es 6/36 = 0,1667. El
número 7 puede ser obtenido de las siguientes maneras:
{ (1,6), (2,5), (3,4), (4,3), (5,2), (6,1) }.
4. Se sabe que en un salón de clases hay 25 personas, de las cuales 15 son mujeres y 10
hombres. Si se elige aleatoriamente a una persona, empleando la forma clásica de calcu-
lar las probabilidades, ¿cuál es la probabilidad que la persona elegida sea un hombre?
La probabilidad calculada fue la siguiente:
Cantidad de hombres: 10
Cantidad total de personas: 25
P(A) = 10/25 = 0,4
5. ¿Cuál es el complemento de la probabilidad de la pregunta anterior?
P(A’) = 1 – P(A) = 1 – 0,4 = 0,6
6. Explique la ley que permite que se suponga que las frecuencias relativas sean considera-
das como probabilidades.
La ley de los grandes números dice que si se realiza un número grande de pruebas, la
frecuencia relativa con la que ocurre un evento se acercará a la probabilidad de que ocu-
rra para una sola prueba. Por ejemplo, si se lanza una moneda una vez, el resultado será
cara o cruz. Con un solo lanzamiento, la frecuencia relativa para sacar cara será 0 o 1.
Sin embargo, si se lanza la moneda muchas veces, la frecuencia relativa se aproximará a
0,5, que en teoría es “lo que debe ser”.
7. Si se tiene una moneda adecuadamente balanceada y se la tira una vez, ¿cuál será la
probabilidad de obtener cara?
Respuesta: P(A) = ½ = 0,5
8. Se quiere crear un carnet de miembros de un determinado club. Se desea que este car-
net tenga una identificación de 5 posiciones compuestas de letras y números. Se quiere
que la primera posición tenga una vocal y que las siguientes 4 posiciones tengan núme-
ros. ¿Cuántas identificaciones distintas se pueden crear? (Suponga que los números dis-
ponibles van del 0 a 9).
En A solo hay 5 posibilidades (a, e, i, o, u), y en las siguientes posiciones hay 10 posibi-
lidades (0, 1, 2, 3, 4, 5, 6, 7, 8, 9), entonces:
12
9. Se quiere realizar una promoción para un producto determinado. Se puede
hacer un descuento del 10%, 15% o del 20%. Se puede anunciar en una
revista especializada mediante un aviso pequeño, mediano
capítulo o grande y se
2 Probabilidades
puede o no poner paneles de propaganda en la tienda. ¿Cuántas opciones se
tienen para la realización de la promoción?
3
A B C D E
5Respuesta:
10 Las
10 opciones
10 que
10 se tienen para la realización de la promoción
serán 3 (descuentos) x 3 (tamaños) x 2 (paneles) = 18.
Identificaciones pueden =
Respuesta: Seposibles 5 ×50.000
crear 10 × 10 × 10 × 10 =distintas.
identificaciones 50.000
10. Se tiene un guardarropa en el que solo se pueden colocar tres pantalones a la
9. Respuesta: Se pueden
Se quiere realizar crear 50.000
una promoción paraidentificaciones distintas.
un producto determinado.
vez. Si se tienen 5 pantalones, ¿de cuántas formasSediferentes
hacer un descuento del 10%, 15% o del 20%. Se puede anunciar en una
puede
se los podrá
9. colocar?
Se quiere
revista realizar una promoción
especializada mediante unpara avisounpequeño,
productomediano
determinado.
o grandeSeypuede
se hacer un
descuento
puede odelno 10%, 15% o del
poner paneles 20%. Se puede
de propaganda anunciar
en la tienda. en una
¿Cuántas revistaseespecializada
opciones
tienen
mediante paraaviso
De acuerdo
un la realización
apequeño, demediano
lo descritola promoción?
son 5 pantalones
o grande y se puedey seopueden
no ponercolocar
paneles de3 apropa-
la vez.
ganda en la tienda.
Respuesta: ¿Cuántasque
Las opciones opciones se tienen
se tienen para lapara la realización
realización de la promoción?
de la promoción
serán 3 (descuentos) x 3 (tamaños) x 2 (paneles) = 18.
A B C
Respuesta: Las opciones que se tienen para la realización de la promoción serán 3
Se5tiene
4 un guardarropa
10. (descuentos)3× 3 (tamaños)
en el × 2 (paneles)
que = 18.colocar tres pantalones a la
solo se pueden
vez. Si se tienen 5 pantalones, ¿de cuántas formas diferentes se los podrá
10. Se tiene un guardarropa en el que solo se pueden colocar tres pantalones a
colocar? la vez. Si se
Por lo tanto, las formas en que las que se pueden colocar
tienen 5 pantalones, ¿de cuántas formas diferentes se los podrá colocar? los tres pantalones
De acuerdo a lo descrito son 5
serán iguales a 5 x 4 x 3 = 60.pantalones y se pueden colocar 3 a la vez.
De acuerdo a lo descrito son 5 pantalones y se pueden colocar 3 a la vez.
A B C
11.ASe 5 4B3
tiene unC estante de un supermercado donde se pueden colocar 10
5productos.4 Si
3 se cuenta con 15 productos, ¿de cuántas maneras distintas se
los lopodrá
Por tanto, colocar?
las formas en que las que se pueden colocar los tres pantalones
Por serán
lo tanto, las formas
iguales a 5 x 4 xen
3 =que
60. las que se pueden colocar los tres pantalones serán igua-
les aDe
5 ×acuerdo
4 × 3 = 60. a ello se deben realizar permutaciones de 15 en 10.
11. Se tiene un estante de un supermercado donde se pueden colocar 10
11. productos.
Se tiene Si se cuenta
un estante de un con 15 productos,
supermercado ¿de cuántas
donde maneras
se pueden distintas
colocar se
10 productos. Si se
15
𝑃𝑃
los podrá
= colocar?
10.897.286.400
cuenta10con 15 productos, ¿de cuántas maneras distintas se los podrá colocar?
De acuerdo
De acuerdo a ello
a ello se se deben realizarpermutaciones
permutaciones de 15
15enenque
10.
Respuesta: Ladeben realizar
cantidad de formas endelas 10. se pueden colocar los 15
15
productos es 10.897.286.400.
𝑃𝑃10 == 10.897.286.400
10.897.286.400
Respuesta: La La cantidad de formas
formas en
en las que sesepueden
puedencolocar los
los15
15productos es
12. Respuesta:
Si en el ejemplo cantidad de
anterior el orden las no
quees colocar
importante, ¿de cuántas maneras se
productos es 10.897.286.400.
10.897.286.400.
podrán colocar estos 15 productos en el estante de capacidad para 10
12. Si productos?
12.en
Sielenejemplo anterior
el ejemplo el el
anterior orden
ordenno
noesesimportante,
importante, ¿de cuántas manerasse
cuántas maneras se podrán co-
podrán colocar estos 15 productos en el estante de capacidad
locar estos 15 productos en el estante de capacidad para 10 productos? para 10
productos?
De acuerdo a ello se deben4realizar combinaciones de 15 en 10:
De acuerdo a ello se deben realizar combinaciones de 15 en 10:
De acuerdo a ello se deben realizar combinaciones de 15 en 10:
15 = 3.003
𝐶𝐶10 3.003
15
= 3.003
Respuesta:
𝐶𝐶10 La cantidad de formas en las que se pueden colocar los 15
productos,
Respuesta: La cantidad
considerando de formas
el orden en que en
se las coloca
que se es
pueden
3.003.colocar los 15 productos,
considerando el orden en que se las coloca es 3.003.
13. Se tienen 8 prototipos de un determinado producto. Solo se pueden lanzar al
13. Se tienen 38aprototipos
mercado la vez. De de un determinado
cuántas producto.
formas posibles Sololanzar:
se pueden se pueden lanzar al mercado
3 a la vez. De cuántas formas posibles se pueden lanzar:
a) Considerando el orden:
𝑃𝑃38 == 336
336
b) Sin considerar el orden:
13
𝐶𝐶38 = 56
14. Se tienen 3 tareas para la casa. ¿De cuántas maneras se las puede realizar?
8
𝑃𝑃3 = 336 Financiera
Estadísticas y Econometría

𝐶𝐶38 = 56
= 56
14. Se tienen
14. Se tienen 33 tareas
tareas para
paralalacasa.
casa.¿De
¿De cuántas
cuántasmaneras
manerasseselas
laspuede
puederealizar?
realizar?
De acuerdo a lo descrito son 3 tareas, las cuales se deben realizar sin un orden especí-
De acuerdo a lo descrito son 3 tareas, las cuales se deben realizar sin un
fico. específico.
orden
A B C
A B C
3 2 1
3 2 1
Respuesta: La cantidad total es de 3! = 3 × 2 × 1 = 6

La cantidad total es de 3!= 3 x 2 x 1 = 6
15. Se tiene una góndola con capacidad para 3 productos. Se quieren colocar 6 productos
15. Se
(A, tiene
B, C,unaD, góndola conestando
E, F) pero capacidad para que
seguros 3 productos.
en uno deSelos
quieren colocar
extremos 6
se tiene
B y en el
productos (A, B, C, D, E, F) pero estando seguros que en uno de los extremos
otro
se C, B
tiene ¿dey en
cuántas
el otromaneras se puede
C, ¿de cuántas ordenarselapuede
maneras góndola?
ordenar la góndola?
Existen 2 series de posibilidades como las que se muestran en la tabla siguiente:
Existen 2 series de posibilidades como las que se muestran en la tabla
siguiente:
1 2 3
B 4 C
1 C 2 43 B
5
B 4 C
C Respuesta:
4 B La cantidad de formas
5 en que se puede ordenar la góndola es 2 (B o C)
× 4 (A, D, E, F) × 1 (una vez seleccionado B o C solo queda 1 opción para esta po-
5 se pueden colocar los libros?
a) ¿De cuántas maneras diferentes
sición) = 8.
Respuesta: La cantidad de formas en que se puede ordenar la góndola es 2 (B
oa)C)¿De cuántas
x 4 (A,10 D, E, maneras
F) x 1 (unadiferentes se puedenBcolocar
vez seleccionado o C solo losqueda
libros?1 opción para
16. Se tiene 𝑃𝑃un =estante
30.240 con 5 espacios y se tienen 10 libros:
esta posición)
5 = 8
a) ¿De cuántas maneras diferentes se pueden colocar los libros?
a) 𝑃𝑃 10 cuántas maneras diferentes se pueden colocar los libros?
¿De
b)5 ¿De= 30.240
cuántascon maneras se pueden colocarlos sin considerar el orden?
16. Se tiene un estante 5 espacios y se tienen 10 libros:
10
𝑃𝑃5 = 30.240
= 30.240
b) ¿De cuántas maneras se pueden colocarlos sin considerar el orden?
10
b) ¿De
b) 𝐶𝐶cuántas
5 = 252maneras
¿De cuántas maneras se se pueden colocarlossin
pueden colocarlos sinconsiderar
considerarelelorden?
orden?
10
17. 𝐶𝐶
Un = 252 financiero tiene 12 clientes, pero solo puede atender a 4 en un día
= 252
5 asesor
10
𝐶𝐶
determinado.
5 = 252 ¿Detiene
cuántas maneras pueden ser seleccionados esosdía4 determi-
17.Un
17. asesor
Un clientes?
asesor financiero
financiero tiene 12clientes,
12 clientes, pero
pero solopuede
solo puede atender
atender a 4a en
4 en
unundía
nado. ¿De
determinado. cuántas
¿De maneras
cuántas pueden
maneras ser seleccionados
pueden esos 4
ser seleccionados
17. Un asesor financiero tiene 12 clientes, pero solo puede atender a 4 en un día
clientes? esos 4
clientes?
Como el orden
determinado.
Como el orden¿De nono es determinante
escuántas maneras
determinante para
para esta labor:
pueden
esta ser seleccionados esos 4
labor:
clientes?
Como12el orden no es determinante para esta labor:
𝐶𝐶4 = 495 495
Como el orden no es determinante para esta labor:
12
R𝐶𝐶espuesta:
= 495 La cantidad
4 Respuesta: La cantidad de maneras
de manerasque pueden
que pueden ser seleccionados esos clientes
ser seleccionados esos es 495.
12clientes es 495.
18. Se
𝐶𝐶4tienen
= 4954 días de vacaciones y se puede ir a tres ciudades, se puede ir en avión, tren,
Respuesta: La cantidad de maneras que pueden ser seleccionados esos
bus
18. o
clientes
Se automóvil
es 495.
tienen
Respuesta: La particular
4 días dey se
de vacaciones
cantidad puede
manerasy sehospedar
puede
que ir en
pueden laser
a trescasa de un amigo,
ciudades, se puede
seleccionados en irlaen
esos casa de un
familiar
avión,
clientes es o en
tren,
495.un hotel. ¿Cuántas posibles formas de organizar nuestras vacaciones se
bus o automóvil particular y se puede hospedar en la casa de un
18. Se amigo,
tienen 4endías de vacaciones
la casa y se opuede
de un familiar en unirhotel.
a tres¿Cuántas
ciudades,posibles
se puede ir en de
formas
pueden
avión, obtener?
tren, bus o automóvil particular y se puede hospedar en la casa de un
18. Se organizar
tienen 4 días nuestras vacacionesy se
de vacaciones se pueden
puede irobtener?
a tres ciudades, se puede ir en
amigo, en la casa de un familiar o en un hotel. ¿Cuántas posibles formas de
La cantidad
avión, tren, busde formas para organizar
o automóvil particular ynuestras
se puede vacaciones
hospedar es casa×de3 un
en4la(días) (ciudades) × 4
organizar nuestras
La cantidad devacaciones
formas parase organizar
pueden obtener?
nuestras vacaciones es formas
4 (días) x 3
amigo,
(medios en la casa
de transporte) de un familiar o en
× 3de(alojamientos)un hotel. ¿Cuántas
=(alojamientos)
144. posibles de
(ciudades) x 4 (medios transporte)
organizar nuestras vacaciones se pueden obtener? x 3 = 144.
La cantidad de formas para organizar nuestras vacaciones es 4 (días) x 3
(ciudades)
19. x 4una(medios de transporte) x 3 (alojamientos) = 144.
La Se posee
cantidad góndola
de formas con organizar
para capacidad para 4 productos
nuestras vacacionesy sees tienen 8 productos
4 (días) x 3
(A, B, C,x D,
(ciudades) E, F, G, de
4 (medios H).transporte)
Se quiere que el primer espacio
x 3 (alojamientos) esté reservado para el
= 144.
19. Se posee
producto unaA.góndola con capacidad para 4 productos y se tienen 8 productos
14 (A, B, C, D, E, F, G, H). Se quiere que el primer espacio esté reservado para el
19. Se posee una góndola con capacidad para 4 productos y se tienen 8 productos
producto A.
(A, a)
B, C,¿De D, cuántas
E, F, G, maneras se puede
H). Se quiere que elordenar la góndola,
primer espacio estéteniendo
reservado enpara
cuenta
el el
producto orden
A. de los productos?
organizar nuestras vacaciones se pueden obtener?
(ciudades) x 4 (medios de transporte) x 3 (alojamientos) = 144.
(ciudades) x 4 (medios de transporte) x 3 (alojamientos) = 144.
capítulo 2 Probabilidades
(A, B, C, D, E, F, G, H). Se quiere que el primer espacio esté reservado para el
producto A.
(A, B, C, D, E, F, G, H). Se quiere que el primer espacio esté reservado para el
productouna
19. Se A. góndola con capacidad para 4 productos y se tienen 8 productos (A, B, C,
a) posee
¿De cuántas maneras se puede ordenar 6 la góndola, teniendo en cuenta el
D, E, F, G,deH).
orden losSeproductos?
quiere que el primer espacio esté reservado para el producto A.
a) ¿De cuántas maneras se puede 6 ordenar la góndola, teniendo en cuenta el
a) ¿De
orden cuántas
de losmaneras se puede ordenar la góndola, teniendo en cuenta el orden de
productos?
7
20. Un los𝑃𝑃consultor
3 productos?
= 210 financiero tiene 4 clientes (A, B, C, D) que visitará en un día
20. Un consultor
b)
𝑃𝑃37 ==financiero
determinado.
¿De
210 El consultor
210
cuántas
tiene se
maneras
selecciona
4 clientes (A, B,
puede ordenar
aleatoriamente
C, D) que
la góndola,
el orden
visitará
sinvisitas
tener en
en en día
un
cuenta
que los
el A, D} o
visitará.
determinado. ¿Cuál es la
Elde consultor probabilidad
selecciona que el orden
aleatoriamente de las sea: {B, C,
b) ¿De
orden cuántaslosmaneras
productos?se puede ordenar la góndola, sineltener
orden en que
en cuenta los de
el orden
{A,
visitará. B,
b)¿Cuál
¿De C,cuántas
D}?la probabilidad
es maneras se que
puede el ordenar
orden la góndola,
de las visitassinsea:
tener{B,
enC,cuenta
A, D} elo
los productos?
orden de los productos?
{A, B, C, D}?
𝐶𝐶37 == 35
35
1º 7 2º 3º 4º
20. Un
1º 2º
𝐶𝐶
consultor
4 3 3º 3= 35 financiero
2
4º 1 tiene 4 clientes (A, B, C, D) que visitará en un día determi-
nado. El consultor selecciona aleatoriamente el orden en que los visitará. ¿Cuál es la
4 3 2 1
probabilidad que el orden de las visitas sea: {B, C, A, D} o {A, B, C, D}?
El resultado de calcular la cantidad total de posibles visitas es igual a 4!
El resultado1º de 2º calcular 3º la cantidad
4º total de posibles visitas es igual a 4!
P({B,
4 C, A, 3 D}) =2 1/4! +1 1/4! = 1/24
P({B, C, A, D}) = 1/4! + 1/4! = 1/24
El resultado
Algo similardeocurre
calcular
conla cantidad total de posibles visitas es igual a 4!
la otra probabilidad:
Algo similar ocurre
P({B, C, A,con D}) la otra+probabilidad:
= 1/4! 1/4! = 1/24
P({A, B, C, D}) = 1/4! + 1/4! = 1/24
Algo similar ocurre con la otra probabilidad:
P({A, B, C, D}) = 1/4! + 1/4! = 1/24
Respuesta:
P({A, B, C, LaD})probabilidad
= 1/4! + 1/4!es la suma de las dos anteriores, o sea de 1/12.
= 1/24
Respuesta:
tiene La probabilidad
Respuesta: es la suma
La probabilidad de las dos
es contingencias:
la suma de las dosanteriores,
anteriores, oo sea
seadede 1/12.
1/12.
21. Se la siguiente tabla de
21. Se 21. Se la
tiene tiene la siguiente
siguiente tabla
tabla dede contingencias:
contingencias:
Tabla 8
Tabla 8 Tabla 8
Futbolistas (C) Basquetbolistas (D) Total
Futbolistas (C) Basquetbolistas (D)8 Total
Varones (A)Futbolistas 20
(C) Basquetbolistas (D) Total 28
Varones Mujeres
(A) (B)
Varones (A)
20 204 8
8 12 28
28 16
Mujeres Total Mujeres
(B) (B)
4 24
4 12
12 20 16
16 44
Total 24 20 44
Total 24 20 44
a) Construir la tabla de contingencias en términos de frecuencias relativas.
Futbolistas
Futbolistas (C) (C)Basquetbolistas
Basquetbolistas
(D) (D)
Total Total
Varones
Varones(A)
(A)Futbolistas 0,46
(C) Basquetbolistas
0,46 0,18 0,18(D) 0,64 Total 0,64
Mujeres
Varones (A) (B)
Mujeres (B) 0,46 0,090,09 0,18
0,27 0,27 0,36 0,64 0,36
Mujeres Total
(B) Total 0,09 0,55 0,55 0,45 0,45
0,27 1,00 0,36 1,00
Total 0,55 0,45 1,00
b)
b) Hallar 𝑃𝑃(𝐴𝐴 ∩ 𝐷𝐷):
b) Hallar 𝑃𝑃(𝐴𝐴 ∩ 𝐷𝐷):= 0,18
𝑃𝑃 𝐴𝐴 ∩ 𝐷𝐷 = 0,18
𝑃𝑃 𝐴𝐴 ∩ 𝐷𝐷 = 0,18
c) Hallar 𝑃𝑃(𝐵𝐵 ∪ 𝐶𝐶):
𝑃𝑃(𝐵𝐵 ∪ 𝐶𝐶) = 0,36 + 0,55 - 0,09 = 0,82
15
𝑃𝑃(𝐵𝐵 ∪ 𝐶𝐶) = 0,36 + 0,55 - 0,09 = 0,82
d) Hallar 𝑃𝑃(𝐷𝐷′):
Total 0,55 0,45 1,00
b) Hallar 𝑃𝑃(𝐴𝐴 ∩ 𝐷𝐷): 7
𝑃𝑃 𝐴𝐴 ∩ 𝐷𝐷 = 0,18
𝑃𝑃 𝐴𝐴 ∩ 𝐷𝐷 = 0,18 7
Estadísticas y E𝑃𝑃 𝐴𝐴 ∩ 𝐷𝐷 F=
conometría 0,18
inanciera 7
𝑃𝑃 𝐴𝐴 ∩ 𝐷𝐷 = 0,18
c) Hallar 𝑃𝑃(𝐵𝐵 ∪ 𝐶𝐶): 7
Hallar= 𝑃𝑃(𝐵𝐵
c) 𝑃𝑃(𝐷𝐷′) 1 - 0,45∪ 𝐶𝐶):= 0,55
c) Hallar 𝑃𝑃(𝐵𝐵 ∪ 𝐶𝐶): 7 = 0,82
𝑃𝑃(𝐷𝐷′)c) =Hallar
1 - 0,45 𝑃𝑃(𝐵𝐵=∪0,55 𝐶𝐶): = 0,36 + 0,55 - 0,09
𝑃𝑃(𝐷𝐷′)∪ =𝐶𝐶)1 =- 0,45
𝑃𝑃(𝐵𝐵 0,36 = + 0,55 - 0,097 = 0,82
e) Hallar
𝑃𝑃(𝐵𝐵 ∪ 𝑃𝑃(𝐶𝐶𝐶𝐶) =∪0,36 𝐷𝐷): ++0,55
0,36 0,55− -0,09
0,09 = 0,82
= 0,82
𝑃𝑃(𝐷𝐷′)∪ =𝐶𝐶)1 =- 0,45
𝑃𝑃(𝐵𝐵 0,36 = + 0,55 - 0,09 = 0,82
e) Hallar 𝑃𝑃(𝐶𝐶d) ∪ 𝐷𝐷) :
Hallar 𝑃𝑃(𝐷𝐷′):
e)
d)
d) Hallar 𝑃𝑃(𝐷𝐷′) 𝑃𝑃(𝐶𝐶 ∪: 𝐷𝐷):
d) 𝑃𝑃(𝐶𝐶
𝑃𝑃(𝐷𝐷′)
Hallar ∪= 𝐷𝐷) 1 =- 0,45
𝑃𝑃(𝐷𝐷′) 0,55
: = + 0,55
0,45 = 1,00 (son complementarios y mutualmente
e) Hallar 𝑃𝑃(𝐷𝐷′)
d) 𝑃𝑃(𝐶𝐶 ∪:=𝐷𝐷)1: − 0,45 = 0,55
𝑃𝑃(𝐶𝐶
𝑃𝑃(𝐷𝐷′) ∪ excluyentes)
𝐷𝐷)1 =- 0,45
= 0,55 = + 0,55
0,45 = 1,00 (son complementarios y mutualmente
𝑃𝑃(𝐶𝐶 ∪ 𝐷𝐷) = 0,55 + 0,45 = 1,00 (son complementarios y mutualmente
e)
e) Hallar 𝑃𝑃(𝐶𝐶 ∪ 𝐷𝐷):
excluyentes)
𝑃𝑃(𝐶𝐶 ∪ excluyentes)
𝐷𝐷) = 0,55 + 0,45 = 1,00 (son complementarios y mutualmente
e) Hallar f) Hallar
𝑃𝑃(𝐶𝐶 ∪ 𝐷𝐷) := ∩0,55
𝑃𝑃(𝐴𝐴 𝐵𝐵):+ 0,45 = 1,00 (son complementarios y mutualmente excluyentes)
excluyentes)
f) Hallar 𝑃𝑃(𝐶𝐶 𝑃𝑃(𝐴𝐴 ∪ 𝐵𝐵): = 0,55 + 0,45 = 1,00
∩ 𝐷𝐷) (son complementarios y mutualmente
f)f) Hallar 𝑃𝑃(𝐴𝐴 ∩ 𝐵𝐵):
excluyentes)
𝑃𝑃(𝐶𝐶 ∪ 𝑃𝑃(𝐴𝐴
𝐷𝐷) =∩0,55 𝐵𝐵) =+Φ0,45 (vacío, son mutuamente
= 1,00 excluyentes) y mutualmente
(son complementarios
f) Hallar 𝑃𝑃(𝐴𝐴 ∩ 𝐵𝐵):= Φ (vacío, son mutuamente excluyentes)
∩ 𝐵𝐵) = Φ (vacío, son mutuamente excluyentes)
excluyentes)
𝑃𝑃(𝐴𝐴
𝑃𝑃(𝐴𝐴 ∩ 𝐵𝐵) = Φ (vacío, son mutuamente excluyentes)
g)
f)g) Hallar
Hallar 𝑃𝑃(𝐶𝐶)𝑃𝑃(𝐴𝐴 ∩ : 𝐵𝐵):
𝑃𝑃(𝐴𝐴 ∩ 𝐵𝐵) = Φ (vacío, son mutuamente excluyentes)
g)
f) Hallar 𝑃𝑃(𝐶𝐶) 𝑃𝑃(𝐴𝐴 ∩ :=𝐵𝐵) :
0,55
g) Hallar 𝑃𝑃(𝐶𝐶):
𝑃𝑃(𝐴𝐴 ∩=𝐵𝐵)
𝑃𝑃(𝐶𝐶) 0,55= Φ (vacío, son mutuamente excluyentes)
g) 22.
Hallar 𝑃𝑃(𝐶𝐶)la: siguiente tabla de contingencias que presenta las ventas en miles de unidades
𝑃𝑃(𝐴𝐴Se
𝑃𝑃(𝐶𝐶) ∩=tiene
0,55
𝐵𝐵) = Φ (vacío, son mutuamente excluyentes)
de 𝑃𝑃(𝐶𝐶)
un = 0,55vendido en tres presentaciones diferentes (paquete de 2, 4 y 6 unida-
producto
22. Se g) tiene
Hallar la𝑃𝑃(𝐶𝐶)
siguiente
: tabla de contingencias que presenta las ventas en miles
𝑃𝑃(𝐶𝐶) =
des), 0,55
realizadas por tres tiendas de unavendido
cadenaque dada:
22. Se tiene
g) Hallar de la𝑃𝑃(𝐶𝐶)
unidades
siguiente
: de
tabla undeproducto
contingencias en tres presentaciones
presenta las ventas en miles diferentes
22. Se tiene la siguiente tabla de contingencias que presenta las ventas en miles
(paquete
de unidades 𝑃𝑃(𝐶𝐶) = de de
0,55un2, 4producto
y 6 unidades),
vendidorealizadas
en tres por tres tiendas diferentes
presentaciones de una cadena
22. Se Tabla
tienede 9launidades
siguiente de tabla undeproducto
contingenciasvendido que en tres presentaciones
(paquete
𝑃𝑃(𝐶𝐶)dada:= de
0,55 2, 4 y 6 unidades), realizadas por tres tiendas de una cadena
(paquetede
de unidades de un 2, 4producto
y 6 unidades),
vendidorealizadas
en tres por tres tiendas diferentes
presentaciones de una cadena
22. Se tiene la siguiente tabla de contingencias que presenta las ventas en miles
dada:
(paquete dada: de 2, 4Presentación
y 6 unidades), realizadas2 (E)
1 (D) Presentación porPresentación
tres tiendas 3 (F) de unaTotalcadena
22. Se tiene de launidades
siguiente de tabla undeproducto
contingencias Tablaque
vendido 9 en tres presentaciones
dada: Tienda 1 (A)
(paquetede
de unidades de un 16
2, 4producto Tabla139realizadas
y 6 unidades),
vendido en tres por
22
de51una cadena
tres tiendas diferentes
presentaciones
Tabla 9
Tienda
(paquete dada: 2 (B)
de 2, 4 Presentación 12
y 6 unidades), 11
1 realizadas
Presentación 18
2 Presentación
por tres tiendas de una 3 41cadena
Tabla159 Total
dada: Tienda 3 (C)
Presentación 21(D)1 Presentación (E)2 Presentación 24 (F)3 60
Presentación 1 Presentación 2 Presentación 3Total
Tienda Total1 (A) (D) 4916 (E)39Tabla
13 9 (F)
64 22 152 Total
51
(D)
Presentación 1 Presentación 2 Presentación 3 (E) (F)
TiendaTienda
1 (A) 2 (B) 16 12 Tabla
13 9 22 Total
51 41
Tienda 1 (A)
a) Construir (D)
la tabla16 de contingencias(E) en 1113 (F)
términos 2de frecuencias
18
22 relativas. 51
2 (B) 3 (C) Presentación
TiendaTienda 12 21 1 Presentación
11 15 Presentación
18 24 3 41 60
Total
TiendaTienda
1 (A) 2 (B) 16 12 Presentación
(D) 13 112 Presentación
(E) 22 18 51 41
3 (C) Presentación
TiendaTotal 21
Presentación 4911 (D) 15
Presentación 39 24 3 (F)
2 (E) Presentación 643
(F) 60 152
Total
Total
TiendaTienda
2 (B) 3 (C) 12
(D) 21 11
(E) 15 18
(F) 24 41 60
51
Total Tienda
Tienda 11(A)(A) 49 0,1116 390,09 13 64
0,14 22 152
0,34
Tienda 3
TiendaTotal (C)
1Tienda
Tienda(A) 2 (B) 21
16 49
12 15
13 39
11 24
22 64
18 60
51 152
41
a) 2Construir
(B) la tabla
0,08 de contingencias 0,07 en términos 0,12de frecuencias relativas.
0,27
Total
Tienda 2Tienda
(B) 33(C)(C) 49
12de0,14 39
11en 64
18 152
41 60
a) Tienda
Construir la tabla 21
contingencias 15
0,10términos de frecuencias
0,16 24 relativas.
0,39
TiendaTotal a)
3 (C) Construir la
21 tabla de contingencias
150,26 39 en términos 24 de frecuencias relativas.
60 152
Total Presentación 49 1 Presentación 2 Presentación 64 31,00
a) Construir la tabla de0,32 contingencias en 0,42
términos de frecuencias relativas. Total
Total Presentación 49 (D)1 Presentación 39 (E)2 Presentación 64 (F)3 152
Presentación 1 Presentación 2 Presentación 3Total
Tienda a)
b) Construir
1 (A) es la(D)
¿Cuál la tabla
0,11de contingencias
probabilidad en términos
(E) el producto
de vender 0,09 en la (F) de frecuencias
0,14 2?
presentación relativas.
Total
0,34
Presentación (D)1 Presentación (E)2 Presentación (F)3
a) Tienda
Tienda Construir
1 (A) 2 (B) la= tabla
0,11de 0,08 contingencias 0,09en términos de frecuencias
0,14 0,12 relativas. Total
0,34 0,27
(E) 0,07
P(E) 0,26
Tienda 1 (A) (D) 0,11 0,09 (F) 0,14 0,34
TiendaTienda
2 (B) Presentación
0,08 1 Presentación
0,07el producto 2 Presentación 3
0,16 1 o 3?0,27
TiendaTienda
1 (A) 3 (C) es la
c) ¿Cuál
2 (B) 0,11 0,14 de vender
probabilidad
0,08 0,09 0,10
0,07 en la0,12
0,14
presentación
0,12 0,34 0,39
Total
0,27
TiendaTotal
3 (C) Presentación
0,14 (D)1 Presentación
0,32 0,10 0,26 (E)2 Presentación0,16 0,42 (F)3 0,39 1,00
TiendaTienda P(D∪F)
2 (B) 3 (C) 0,08 = 0,32 + 0,42 = 0,74 0,07 0,12 Total
0,27 0,39
Total Tienda 1 (A) 0,32 (D) 0,14 0,11 (E) 0,10
0,26 0,09 (F) 0,16
0,42 0,14 1,00 0,34
Tienda 3
1 (C)
TiendaTotal
Tienda(A) 2 (B) esesla0,14
¿Cuál
d) ¿Cuál 0,11 0,32
probabilidad
0,08 que de la0,10
tienda
0,09 0,26
1 venda
0,07 0,16
el producto
0,14 0,42
en
0,12 0,39
0,34 2?
la presentación 1,00
1?
0,27
b) la probabilidad vender el producto en la presentación
Total
Tienda P(A∩D)
2 (B) es =0,32
0,11
0,08 0,14de vender 0,26
0,07 0,42
0,12 1,00
0,27 0,39
b) Tienda
¿Cuál 3 (C)la probabilidad 0,10
el producto en la 0,16
presentación 2?
TiendaTotal b) ¿Cuál es0,14
3 (C) la probabilidad
0,32 de0,10
vender 0,26 el producto 0,16 en la presentación
0,42 2?
0,39 por1,00
P(E) = 0,26
e) ¿Cuál es la probabilidad que el producto en la presentación 3 sea vendida las
b) ¿Cuál
Total P(E) =tiendas es la probabilidad de vender el producto en la presentación 2?
0,26 2 0,32 y 3? 0,26 0,42 1,00
P(E) = 0,26
c)
b) ¿Cuál es∩la
(P(F∩B) probabilidad
P(F∩C)) = P(F∩B) de×vender
P(F∩C el ) =producto
0,12 × 0,16 en= la presentación 12?o 3?
0,0192
P(E) = 0,26
b) ¿Cuál es la probabilidad de vender el producto en la presentación 12?o 3?
c)
c) ¿Cuál es la probabilidad de vender el producto en la presentación 1 o 3?
P(DUF)
P(E) = 0,26 = 0,32 + 0,42 = 0,74
P(DUF)
P(E) = 0,26 = 0,32 + 0,42 = 0,74
P(DUF) = 0,32 + 0,42 = 0,74
16 P(DUF) = 0,32 + 0,42 = 0,74
P(DUF) = 0,32 + 0,42 = 0,74
¿Cuál es la probabilidad que el producto en la presentación 2 sea vendida por las

f)
tiendas 1 o 3?
(P(E∩A) ∪ P(E∩C)) = 0,09 + 0,10 = 0,19
g) ¿Cuál es la probabilidad que el producto en la presentación 1 no sea vendida por la
tienda 2?
1 - P(D∩B) = 1 − 0,08 = 0,92
23. Si se utilizan los datos de la pregunta 22, un cliente para realizar una compra del pro-
ducto decide secuencialmente de la siguiente forma: primero, la tienda donde comprará
y, luego, decide la presentación del producto que comprará.
a) Construir el diagrama del árbol correspondiente. Incluir las probabilidades margi-
nales, las condicionales y las conjuntas.
0,11
P( D
| A)  0, 32 P( A  D) 
0,11
0, 34
P( A  E ) 
0, 09
P( E | A)  0, 27
P(A)=0,34 P( F | A)  0, 41 P( A  F ) 
0,14
P( D | B)  0,30 P( B  D) 
0, 08
P( B  E ) 
0, 07
P( E | B)  0, 26
P(B)=0,27
P( F | B)  0, 44 P( B  F ) 
0,12
P(C)=0,39 P( D | C )  0,36 P(C  D) 

0,14
P(C  E ) 
0,10
P( E | C )  0,33
P( F | C )  0,31 P(C  F ) 
0,16
¿Cuál es la probabilidad que el cliente seleccione la tienda 2?

b)
P(B) = 0,27
¿Cuál es la probabilidad que el cliente no seleccione la tienda 3?
c)
P(C›) = 1 − P(C) = 1 − 0,39 = 0,61
¿Cuál es la probabilidad que el cliente seleccione la tienda 1 y compre el producto
d)
en la presentación 2?
P(A∩E) = 0,09
¿Cuál es la probabilidad que el cliente compre el producto en la presentación 2 dado
e)
que seleccionó la tienda 3?
P(E|C) = 0,33
17
¿Cuál es la probabilidad que el cliente compre el producto en la presentación 1 dado

f)
que seleccionó la tienda 2?
P(D|B) = 0,30
¿Cuál es la probabilidad que el cliente compre el producto en la presentación 2 o 3
g)
dado que seleccionó la tienda 1?
P(E|A) ∪ P(F|A) = P(E|A) + P(F|A) = 0,27 + 0,41 = 0,68
24. Utilizando los datos de la pregunta 22, calcule mediante el teorema de Bayes la proba-
bilidad que el cliente compre el producto en la presentación 3 dado que seleccionó la
tienda 1. Verifique su respuesta utilizando la fórmula de las probabilidades condiciona-
les.
P( A | F ) × P ( F )
P( F | A) =
P( A | D) × P ( D) + P( A | E ) × P ( E ) + P( A | F ) × P( F )
Reemplazando,
0,14
× 0, 42
0, 42 0,14
P ( F=
| A) = = 0, 412
0,11 0, 09 0,14
× 0,32 + × 0, 26 + × 0, 42 0,34
0,32 0, 26 0, 42
Se demuestra que es igual que el valor obtenido usando la fórmula de la probabilidad

condicional:
P( F  A) 0,14
P ( F=
| A) = = 0, 412
P( A) 0,34
25. Se lanza un dado dos veces:

a) ¿Se trata de eventos estadísticamente independientes? ¿Por qué?
Sí, porque la probabilidad de ocurrencia de un lanzamiento no influye en la proba-
bilidad del siguiente lanzamiento.
b) Construya el diagrama del árbol correspondiente. Incluya las probabilidades margi-
El gráfico es similar al de la pregunta 23 a), con la diferencia que los eventos son esta-
dísticamente independientes. Es decir, que en general la probabilidad condicional es
igual a la probabilidad marginal. Por ejemplo, la P(salga 4|salió 6) = P(salga 4).
¿Cuál es la probabilidad que salga la siguiente secuencia: {2,1}?
c)
P(2∩1) = P(2) × P(1) = (1/6) × (1/6) = 1/36
¿Cuál es la probabilidad que salga la siguiente secuencia: {6,6}?
d)
P(6∩6) = P(6) × P(6) = (1/6) × (1/6) = 1/36
18
¿Cuál es la probabilidad que salga 4 dado que en el primer lanzamiento salió 1?

e)
P(4|1) = P(4) = 1/6
¿Cuál es la probabilidad que salga 6 dado que en el primer lanzamiento salió 6?
f)
P(6|6) = P(6) = 1/6
¿Cuál es la probabilidad que salga 1 o 6 dado que en el primer lanzamiento salió 3?
g)
(P(1|3) ∪ P(6|3)) = P(1|3) + P(6|3) = P(1) + P(6) = (1/6) + (1/6) = 2/6
26. Setiene una caja con 10 bolas: 4 son rojas y 6 son negras. Se seleccionan al azar 3 bolas,
1 a la vez, y se anota el color de la misma. El experimento se realiza con reemplazo, es
decir, que una vez que se saca una bola y se anota su color, se le devuelve a la caja antes
de realizar la siguiente selección.
a) Construir el diagrama del árbol correspondiente. Incluir las probabilidades margi-
Note que en este ejemplo con reemplazo, los eventos son independientes.
P ( R | R, R)  4 / 10 P( R  R  R) 0, 064
P ( R | R )  4 / 10
P ( N | R, R )  6 / 10 P( R  R  N ) 0, 096
P(R)=4/10 P ( R | R, N )  4 / 10 P( R  N  R) 
0, 096
P ( N | R )  6 / 10
P ( N | R, N )  6 / 10 P( R  N  N ) 
0,144
P ( R | N , R)  4 / 10 P( N  R  R) 0, 096
P ( R | N )  4 / 10
P(N)=6/10 P ( N | N , R )  4 / 10 P( N  R  N ) 0,144
P ( R | N , N )  4 / 10 P( N  N  R) 
0,144
P ( N | N )  6 / 10
P ( N | N , N )  6 / 10 P( N  N  N ) 
0, 216
¿Cuál es la probabilidad que se saquen 3 bolas rojas?

b)
P(R∩R∩R) = 0,064 = 6,4%
¿Cuál es la probabilidad que se saquen 2 bolas rojas y 1 bola negra?
c)
P(R∩R∩N) + P(R∩N∩R) + P(N∩R∩R) = 0,096 × 3 = 0,288 = 28,8%
¿Cuál es la probabilidad que se saquen 3 bolas negras?
d)
P(N∩N∩N) = 0,216 = 21,6%
19
¿Cuál es la probabilidad que se saquen las bolas en la siguiente secuencia: {roja, roja,
e)
negra}?
P(R∩R∩N) = 0,096 = 9,6%
¿Cuál es la probabilidad que la segunda bola sea negra dado que la primera fue ne-
f)
gra?
P(N|N) = 0,6 = 60%
¿Cuál es la probabilidad que la tercera bola sea roja dado que la primera fue negra y
g)
la segunda fue roja?
P(R|N,R) = 0,4 = 40%
27. Siguiendo con los datos de la pregunta 26, pero esta vez asumiendo que el experimento
se realiza sin reemplazo, es decir, que una vez que se saca una bola y se anota su color,
no se le devuelve a la caja antes de realizar la siguiente selección.
a) Construya el diagrama del árbol correspondiente. Incluya las probabilidades margi-
Note que en este ejemplo sin reemplazo, los eventos NO son independientes.
P( R | R, R)  2 / 8 P( R  R  R) 0, 033
P( R | R)  3 / 9
P( N | R, R)  6 / 8 P( R  R  N ) 0,100
P(R)=4/10 P( R | R, N )  3 / 8 P( R  N  R) 
0,100
P( N | R )  6 / 9
P( N | R, N )  5 / 8 P( R  N  N ) 
0,170
P( R | N , R)  3 / 8 P( N  R  R) 0,100
P( R | N )  4 / 9
P(N)=6/10 P( N | N , R)  5 / 8 P( N  R  N ) 0,167
P( R | N , N )  4 / 8 P( N  N  R) 
0,167
P( N | N )  5 / 9
P( N | N , N )  4 / 8 P( N  N  N ) 
0,167
¿Cuál es la probabilidad que se saquen 3 bolas rojas?

b)
P(R∩R∩R) = 0,033
¿Cuál es la probabilidad que se saquen 2 bolas rojas y 1 bola negra?
c)
P(R∩R∩N) + P(R∩N∩R) + P(N∩R∩R) = 0,10 × 3 = 0,30 = 30%
¿Cuál es la probabilidad que se saquen 3 bolas negras?
d)
P(N∩N∩N) = 0,167 = 16,7%
20
¿Cuál es la probabilidad que se saquen las bolas en la siguiente secuencia: {roja, roja,
e)
negra}?
P(R∩R∩N) = 0,10 = 10%
¿Cuál es la probabilidad que la segunda bola sea negra dado que la primera fue ne-
f)
gra?
P(N|N) = 5/9 = 0,56 = 56%
¿Cuál es la probabilidad que la tercera bola sea roja dado que la primera fue negra y
g)
la segunda fue roja?
P(R|N,R) = 3/8 = 0,375 = 37,5%
28. Lasiguiente tabla presenta la distribución de probabilidades referida al número de litros
de agua consumidos semanalmente por 10.000 familias:
Tabla 10
Consumo de agua en litros por semana P(x)

14 0,1
16 0,2
17 0,3
18 0,3
21 0,1
¿Cuál es la cantidad de litros de agua semanales de consumo promedio?

a)
Promedio = (0,1) × (14) + (0,2) × (16) + (0,3) × (17) + (0,3) × (18) + (0,1) × (21) = 17,2
¿Cuál es la varianza de la cantidad de litros de agua consumidos semanalmente?
b)
Var = (0,1) × (14 − 17,2)2 + (0,2) × (16 − 17,2)2 + (0,3) × (17 − 17,2)2 + (0,3) × (18
−17,2)2 + (0,1) × (21 − 17,2)2 = 2,96
¿Cuál es la desviación estándar de la cantidad de litros de agua consumidos sema-
c)
nalmente?
desv_est = (2,96)0,5 = 1,72
d) ¿Por qué se prefiere utilizar la desviación estándar frente a la varianza?
Porque la desviación estándar tiene la misma unidad de medida que la variable ori-
ginal.
29. Se tiene la siguiente tabla:
Tabla 11
Escenario Probabilidad Acciones (X) Renta Fija (Y)

Expansión 0,3 + 600 + 200
Estabilidad 0,5 + 500 + 80
Recesión 0,2 - 450 - 110
21
a) Calcular la covarianza entre los instrumentos de renta fija y las acciones.
µ x E (=
= x) (0,30) × (600) + (0,5) × (500) + (0, 20) × (−450)
= $ 340
µ= E (=
y ) (0,30) × (200) + (0,5) × (80) + (0, 20) × (−110)
= $ 78
y
Por lo tanto, la covarianza entre las acciones e instrumentos de renta fija será:
σ xy = (0,10) × [(600 − 340) × (200 − 78)] + (0,50) × [(500 − 340) × (80 − 78)] +
(0, 20) × [(−450 − 340) × (−110 − 78)] =
$39.380
b) Calcular la correlación entre los instrumentos de renta fija y las acciones.

Para calcular la correlación se necesitan calcular las desviaciones estándar:
σ x= (0,30) × (600 − 340) 2 + (0,5) × (500 − 340) 2 + (0, 20) × (−450 − 340) 2= $ 397,37
σ= (0,30) × (200 − 78) 2 + (0,5) × (80 − 78) 2 + (0, 20) × ( −110 − 78)=
2
$ 107, 41
y
Por lo tanto la correlación será:

39.380
=ρ = 0,923
(397,37) × (107, 41)
22
C a pí t ulo
Funciones de distribución
de probabilidad discretas
1) Respecto a la distribución binomial: cuando se tiene una población pequeña y la mues-

tra se hace sin reemplazo, el supuesto que la probabilidad de suceso es la misma en cada
tentativa ¿es satisfecha? Explique.
No, ya que la probabilidad cambiará cada vez que se hace la selección entre los elemen-
tos que quedan en la muestra.
2) Se tiene una caja con 15 bolas, 8 son rojas y 7 son amarillas. Se seleccionan al azar 5
bolas, 1 a la vez, y se anota el color de la misma. Se supone que éxito es cuando la bola
extraída es de color amarillo. El experimento se realiza con reemplazo, es decir, que una
vez que se saca una bola y se anota su color, se le devuelve a la caja antes de realizar la
siguiente selección.
Nota: Se resuelven todos estos ejercicios usando el comando Excel DISTR.BINOM.
De acuerdo a los datos, la probabilidad de éxito (π) será igual a 7/15 = 0,4667. La hoja
Excel que acompaña a este ejercicio es capitulo3_ejercicio2_binomial.xls.
a) ¿Cuál es la probabilidad de sacar exactamente 3 bolas amarillas?
P(x = 3) = 0,0245
¿Cuál es la probabilidad de sacar no sacar ninguna bola amarilla?
b)
P(x = 0) = 0,0001
c) ¿Cuál es la probabilidad de sacar más de 2 bolas amarillas?
P(x > 2) = P(x = 3) + P(x = 4) + P(x = 5) = 0,0245 + 0,0643 + 0,1238 = 0,2126
23
d) ¿Cuál es la probabilidad de sacar al menos 3 bolas amarillas?

P(x < 3) = P(x = 0) + P(x = 1) + P(x = 2) = 0,0001 + 0,0011 + 0,0065 = 0,0076
Note que se pueden utilizar directamente las probabilidades acumuladas, en dicho
caso solo se toma el valor que corresponde a:
P(x < 3) = P(x ≤ 2) = 0,0076
Esto último es cierto debido a que la distribución de probabilidad binomial trata
con variables aleatorias discretas, por lo que el número que es menor a 3 es 2.
e) ¿Cuál es la probabilidad de sacar entre 2 y 5 bolas amarillas?
P(2 ≤ x ≤ 5) = P(x ≤ 5) - P(x < 2) = P(x ≤ 5) - P(x ≤ 1) = 0,2201 - 0,0011 = 0,2190
f) En promedio, ¿cuántas bolas amarillas se esperan sacar?
Usando la fórmula de la distribución binomial para obtener el promedio:
E(x) = n × π = 15 × (0,4667) = 7,00
g) ¿Cuál es la desviación estándar?
Usando la fórmula de la binomial para obtener la varianza:
var(x) = n × π × (1 - π) = 15 × (0,4667) × (1 - 0,4667) = 3,7333
Por lo tanto, la desviación estándar será igual a la parte positiva de la raíz cuadrada
de este número:
desv_std(x) = 1,9322
3) Si se utiliza Excel y con los datos de la pregunta 2, construya la tabla de probabilidades
de la distribución binomial. Incluya las probabilidades marginales y las probabilidades
acumuladas.
La hoja Excel que acompaña a este ejercicio es capitulo3_ejercicio2_binomial.xls.
24
capítulo 3 Funciones de distribución de probabilidad discretas
4) Por medio del uso de Excel, verifique que la distribución binomial es:1
a) Simétrica: si π = 0,5 o si el número de tentativas es bastante grande. Use π = 0,5 y
n = 10, y π = 0,4 y n = 100.
n=10 y π=0,5
0,3000
0,2500
0,2000
0,1500
0,1000
0,0500
0,0000
1 2 3 4 5 6 7 8 9 10 11
n=100 y π=0,4
0,0900
0,0800
0,0700
0,0600
0,0500
0,0400
0,0300
0,0200
0,0100
0,0000
1
3
5
7
9
11
13
15
17
19
23
25
29
31
35
37
41
43
47
49
51
53
55
57
59
61
63
65
67
69
71
73
75
77
79
81
83
85
87
89
91
93
97
99
21
27
33
39
45
95
101
1 Esto se presenta en la planilla Excel capitulo3_ejercicio2_binomial.xls, en las hojas llamadas a, b y c. Aquí solamente se han mostrado
los gráficos correspondientes.
25
3 0,2013 0,8791
4 0,0881 0,9672
5 0,0264 0,9936
6 0,0055 0,9991
7 0,0008 0,9999
8 0,0001 1,0000
b) Asimétrica positiva: si π <1,0000
9 0,0000 0,5 y el número de tentativas es pequeño. Use π = 0,2 y
10
n = 10. 0,0000 1,0000
n 10 n=10 y π=0,2
π 0,8
0,3500
x P(X = x)
0,3000
P(X ≤ x)
0 0,0000 0,0000
0,2500
1 0,0000 0,0000
2 0,2000
0,0001 0,0001
3 0,15000,0008 0,0009
4 0,10000,0055 0,0064
5 0,0500
0,0264 0,0328
6 0,0881 0,1209
0,0000
7 0,2013
1 2
0,3222
3 4 5 6 7 8 9 10 11
8 0,3020 0,6242
9 0,2684 0,8926
10 c)
0,1074 1,0000
Asimétrica negativa: si π > 0,5 y el número de tentativas es pequeño. Use π = 0,8 y
n = 10.
n=10 y π=0,8
0,3500
0,3000
0,2500
0,2000
0,1500
0,1000
0,0500
-
1 2 3 4 5 6 7 8 9 10 11
5) Se conoce que históricamente la probabilidad que un cliente compre un determinado

producto es igual al 40%. Si se observa a 20 clientes:
Para todas las siguientes preguntas se define x = número de clientes que compran un
producto determinado. La hoja Excel que acompaña a este ejercicio es capitulo3_ejerci-
cio5_binomial.xls.
26
¿Cuál es la probabilidad que exactamente 10 compren el producto?

a)
P(x = 10) = 0,1171
b) ¿Cuál es la probabilidad que al menos 5 clientes compren el producto?
P(x ≥ 5) = 1 - P(x < 5) = 1 - P(x ≤ 4) = 1 - 0,0350 = 0,9650
c) ¿Cuál es la probabilidad que no más de 7 clientes compren el producto?
P(x ≤ 7) = 0,4159
d) ¿Cuál es la probabilidad que compren el producto entre 5 y 8 clientes?
P(5 ≤ x ≤ 8) = P(x ≤ 8) - P(x < 5) = P(x ≤ 8) - P(x ≤ 4) = 0,5956 - 0,0510 = 0,5446
¿Cuál es la probabilidad que ningún cliente compre el producto?
e)
P(x = 10) = 0,0000
En promedio, ¿cuántos clientes comprarán el producto?
f)
E(x) = n × π = 20 × (0,4) = 8
g) ¿Cuál es la varianza?
var(x) = n × π × (1 - π) = 20 × (0,4) × (1 - 0,4) = 4,80
de este número:
6) Emplee Excel y tome los datos de la pregunta 5, construya la tabla de probabilidades de
la distribución binomial. Incluya las probabilidades marginales y las probabilidades
acumuladas.
La hoja Excel que acompaña a este ejercicio es capitulo3_ejercicio5_binomial.xls.
27
7) Se desea saber si las personas que trabajan en una determinada empresa pondrán sus
pensiones en una administradora privada de pensiones. Las únicas respuestas posibles
de los empleados son sí (éxito) o no (fracaso). Si el número de trabajadores de la em-
presa es de 50, de los cuales se seleccionan aleatoriamente y sin reemplazo a 20 emplea-
dos. Se supone que históricamente la probabilidad que una persona decida enrolarse es
igual al 20%.
a) ¿Se puede utilizar la distribución binomial para calcular las probabilidades? Analice
el supuesto del modelo binomial asociado con que la probabilidad de suceso en
cada tentativa debe ser el mismo. Asimismo utilice el criterio basado en el tamaño
de la muestra (en comparación de la población) que hace que el supuesto se asuma
como satisfecho.
No se puede utilizar la distribución binomial ya que el supuesto que las probabili-
dades de éxito se mantienen constantes no se cumple (la muestra es sin reemplazo y
el tamaño de la muestra es pequeño comparado con el de la población).
b) ¿Su respuesta cambiaría si el número de empleados de la empresa fuese 500?
La regla para poder asumir que las probabilidades de éxito se mantienen constantes
es n ≤ 0,05 N (el tamaño de la muestra es menor o igual al 5% del tamaño de la
población). Si N = 500 y n = 20, se puede observar que 20 ≤ 0,05 (500). Por lo
tanto, se podrá utilizar la distribución binomial.
c) Bajo el supuesto original (50 empleados que trabajan en la empresa), ¿cuál sería la
distribución adecuada a utilizar?
La distribución a usar sería la distribución hipergeométrica.
8) Responder las siguientes preguntas basadas en la pregunta 7. Considere que el número
de empleados de la empresa es igual a 500 (para que se pueda emplear la distribución
binomial). Se recuerda que de estos empleados, se toma una muestra (sin reemplazo) de
20, a los que se les pregunta si desean poner sus pensiones en una administradora pri-
vada de pensiones. Un éxito será obtener una respuesta afirmativa. Se sabe que históri-
camente la probabilidad que una persona decida enrolarse es igual al 20%.
Para todas las siguientes preguntas, se define x = número de empleados que pondrán
sus pensiones en una administradora privada de pensiones. La hoja Excel que acom-
paña a este ejercicio es capitulo3_ejercicio8_binomial.xls.
28
¿Cuál es la probabilidad que exactamente 5 pongan sus pensiones en la administra-

a)
dora privada de pensiones?
P(x = 5) = 0,1746
b) ¿Cuál es la probabilidad que al menos 3 empleados se enrolen en la administradora?
P(x ≥ 3) = 1 - P(x < 3) = 1 - P(x ≤ 2) = 1 - 0,2061 = 0,7939
c) ¿Cuál es la probabilidad que no más de 3 empleados se enrolen en la administra-
dora?
P(x ≤ 3) = 0,4114
d) ¿Cuál es la probabilidad que se enrolen entre 2 y 6 clientes?
P(2 ≤ x ≤ 6) = P(x ≤ 6) - P(x < 2) = P(x ≤ 6) - P(x ≤ 1) = 0,9133 - 0,0692 = 0,8441
¿Cuál es la probabilidad que ningún empleado se enrole en la administradora pri-
e)
vada de pensiones?
P(x = 0) = 0,0115
En promedio, ¿cuántos empleados se enrolarán en la administradora?
f)
E(x) = n × π = 20 × (0,2) = 4
var(x) = n × π × (1 - π) = 20 × (0,2) × (1 - 0,2) = 3,20
29
de este número:
9) ¿En qué casos se utiliza la distribución hipergeométrica?
Cuando los eventos no son estadísticamente independientes, por ejemplo, cuando el
muestreo es sin reemplazo, las probabilidades de suceso no son constantes, violando
una vez más uno de los supuestos de la función de probabilidades binomial.
En estos casos la distribución a usar debe ser la distribución hipergeométrica.
10) Se tiene una caja con 15 bolas, 8 son rojas y 7 son amarillas. Se seleccionan al azar 5
bolas, 1 a la vez, y se anota el color de la misma. Se supone que éxito es cuando la bola
extraída es de color amarillo. El experimento se realiza sin reemplazo, es decir, que una
vez que se saca una bola y se anota su color, no se le devuelve a la caja antes de realizar
la siguiente selección.
X = bola extraída es amarilla.
¿Cuál es la probabilidad de sacar exactamente 3 bolas amarillas?
a)
P(x = 3) = 0,3263
Para comprobar esta respuesta se emplea la fórmula para calcular las probabilidades
usando la distribución hipergeométrica.
 7!  8! 
7 15 − 7 (7 − 3)!× 3!  (8 − 2)!× 2! 
C ×C
P( x= 3)= 3
15
5−3
=   = 0,3263
C 5  15! 
 (15 − 5)!× 5! 
 
¿Cuál es la probabilidad de sacar ninguna bola amarilla?

b)
P(x = 0) = 0,0186
c) ¿Cuál es la probabilidad de sacar más de 2 bolas amarillas?
P(x > 2) = 1 - P(x ≤ 2) = 1 - 0,5734 = 0,4266
d) ¿Cuál es la probabilidad de sacar al menos 3 bolas amarillas?
P(x ≥ 3) = 1 - P(x < 3) = 1 - P(x ≤ 2) = 1 - 0,5734 = 0,4266
e) ¿Cuál es la probabilidad de sacar entre 2 y 5 bolas amarillas?
P(2 ≤ x ≤ 5) = P(x ≤ 5) - P(x < 2) = P(x ≤ 5) - P(x ≤ 1) = 1 - 0,1818 = 0,8182
f) En promedio, ¿cuántas bolas amarillas se esperan sacar?
n × k 5× 7
=µ E=
( x) = = 2,333
N 15
30
g) ¿Cuál es la desviación estándar?

La varianza está dada por:
 N −k   N −n  15 − 7   15 − 5 
σ 2 = n×k × ×
2    = (5) × (7) ×  ×
2    = 0,8889
 N   N −1   15   15 − 1 
Por lo tanto, el desvío estándar será igual a 0,9428.
11) Si
se emplea Excel y con los datos de la pregunta 10, construya la tabla de probabilida-
des de la distribución hipergeométrica. Incluya las probabilidades marginales y las pro-
babilidades acumuladas.
La hoja de Excel usada es capitulo3_ejercicio10_hipergeometrica.xls.
12) Resuelvala pregunta 7 con los datos originales, es decir, con el número de empleados
de la empresa igual a 50. Se recuerda que de estos empleados, se toma una muestra (sin
reemplazo) de 20, a los que se les pregunta si desean poner sus pensiones en una admi-
nistradora privada de pensiones. Un éxito será obtener una respuesta afirmativa. Se co-
noce que históricamente la probabilidad que una persona decida enrolarse es igual al
20%. (Se recomienda comparar estos resultados con los obtenidos en la pregunta 8.)
Para todas las siguientes preguntas se define x = número de empleados que pondrán sus
pensiones en una administradora privada de pensiones. En base a los datos del problema
se asumirá que k es el 20% del total de empleados de la empresa, es decir, k = 10. La hoja
Excel que acompaña a este ejercicio es capitulo3_ejercicio12_hipergeometrica.xls.
¿Cuál es la probabilidad que exactamente 5 pongan sus pensiones en la administra-
a)
dora privada de pensiones?
P(x = 5) = 0,2151
b) ¿Cuál es la probabilidad que al menos 3 empleados se enrolen en la administradora?
P(x ≥ 3) = 1 - P(x < 3) = 1 - P(x ≤ 2) = 1 - 0,1390 = 0,8610
c) ¿Cuál es la probabilidad que no más de 3 empleados se enrolen en la administra-
dora?
P(x ≤ 3) = 0,3650
31
d) ¿Cuál es la probabilidad que se enrolen entre 2 y 6 clientes?

P(2 ≤ x ≤ 6) = P(x ≤ 6) - P(x < 2) = P(x ≤ 6) - P(x ≤ 1) = 0,9635 - 0,0308 = 0,9327
¿Cuál es la probabilidad que ningún empleado se enrole en la administradora pri-
e)
vada de pensiones?
P(x = 0) = 0,0029
En promedio, ¿Cuántos empleados se enrolarán en la administradora?
f)
n × k 20 ×10
=µ E= ( x) = = 4
N 50
La varianza está dada por:
 N −k   N −n  50 − 10   50 − 20 
σ 2 = n×k × ×
2    = (20) × (10) ×  2 ×  = 1,9592
 N   N −1   50   50 − 1 
Por lo tanto, el desvío estándar será igual a 1,3997.
13) Alemplear Excel y tomando en cuenta la pregunta 12, construya la tabla de probabili-
dades de la distribución hipergeométrica. Incluya las probabilidades marginales y las
probabilidades acumuladas.
La hoja de Excel usada es capitulo3_ejercicio12_hipergeometrica.xls.
32
14) Sise observa el número de clientes que son atendidos cada hora por un determinado
cajero en una agencia bancaria. Las observaciones que corresponden a las 8 horas de
trabajo en un día en particular son: 5, 6, 10, 15, 13, 8, 5, 8.
Para las siguientes preguntas se asumirá que x es el número de clientes atendidos por
hora por el cajero. La hoja Excel que corresponde al siguiente ejercicio es capitulo3_
ejercicio14_Poisson.xls.
a) Calcular el promedio de clientes atendidos por hora (λ).
El promedio de las observaciones por hora de trabajo es igual a:
5 + 6 + 10 + 15 + 13 + 8 + 5 + 8 70
x
= = λ
= = 8, 75
8 8
¿Cuál es la probabilidad que el cajero no atienda a ningún cliente en una hora de
b)
trabajo?
P(x = 0) = 0,0002
¿Cuál es la probabilidad que el cajero atienda exactamente a 8 clientes en una hora
c)
de trabajo?
P(x = 8) = 0,1350
d) ¿Cuál es la probabilidad que el cajero atienda exactamente al menos a 7 clientes en
una hora de trabajo?
P(x ≥ 7) = 1 - P(x < 7) = 1 - P(x ≤ 6) = 1 - 0,2305 = 0,7695
e) ¿Cuál es la probabilidad que el cajero atienda a menos de 8 clientes en una hora de
trabajo?
P(x < 8) = P(x ≤ 7) = 0,3540
f) ¿Cuál es la probabilidad que el cajero atienda entre 6 y 10 clientes en una hora de
trabajo?
P(6 ≤ x ≤ 10) = P(x ≤ 10) - P(x < 6) = P(x ≤ 10) - P(x ≤ 5) = 0,7352 - 0,1317 = 0,6035
g)
de trabajo?
P(x = 12) = 0,0666
15) Repitala pregunta 14 pero esta vez utilice el promedio histórico de clientes atendidos
por hora, que es igual a 7.
Para las siguientes preguntas se toma en cuenta que x es el número de clientes atendidos
por hora por el cajero. La hoja Excel que corresponde al siguiente ejercicio es capitulo3_
ejercicio15_Poisson.xls.
33
¿Cuál es la probabilidad que el cajero no atienda a ningún cliente en una hora de

a)
trabajo?
P(x = 0) = 0,0009
b)
de trabajo?
P(x = 8) = 0,1304
c) ¿Cuál es la probabilidad que el cajero atienda exactamente al menos a 7 clientes en
una hora de trabajo?
P(x ≥ 7) = 1 - P(x < 7) = 1 - P(x ≤ 6) = 1 - 0,4497 = 0,5503
d) ¿Cuál es la probabilidad que el cajero atienda a menos de 8 clientes en una hora de
trabajo?
P(x < 8) = P(x ≤ 7) = 0,5987
e) ¿Cuál es la probabilidad que el cajero atienda entre 6 y 10 clientes en una hora de
trabajo?
P(6 ≤ x ≤ 10) = P(x ≤1 0) - P(x < 6) = P(x ≤ 10) - P(x ≤ 5) = 0,9015 - 0,3007 =
0,6008
f)
de trabajo?
P(x = 12) = 0,0263
34
g) ¿Se puede afirmar que el cajero de la pregunta 14 es más eficiente que la media de
cajeros del banco?
La media histórica es igual a 7. Si se toma la media muestral obtenida en la pre-
gunta anterior (8,75) como representativa de la productividad del cajero, la res-
puesta sería afirmativa.
16) Tome en cuenta los datos de la pregunta 14 y utilice Excel construya la tabla de proba-
bilidades de la distribución de Poisson. Calcule λ. Incluya las probabilidades margina-
les y las probabilidades acumuladas.
La hoja Excel de este ejercicio es capitulo3_ejercicio14_Poisson.xls.
35
17) Con los datos de la pregunta 15 y usando Excel, construya la tabla de probabilidades de
la distribución de Poisson. Incluya las probabilidades marginales y las probabilidades
acumuladas.
18) Seconoce que el promedio (λ) de pacientes por hora que llegan a la sala de emergencias
de un hospital es igual 3,6. Si se define a la variable aleatoria x como el número de pa-
cientes atendidos en la sala de emergencias por hora. Responder:
¿Cuál es la probabilidad que en una hora lleguen 7 pacientes?
a)
P(x = 7) = 0,0425
¿Cuál es la probabilidad que ningún paciente llegue en la siguiente hora?
b)
P(x = 0) = 0,0273
c) ¿Cuál es la probabilidad que lleguen entre 2 y 5 pacientes en una hora?
P(2 ≤ x ≤ 5) = P(x ≤ 5) - P(x < 2) = P(x ≤ 5) - P(x ≤ 1) = 0,8441 - 0,1257 = 0,7184
d) ¿Cuál es la probabilidad que al menos lleguen 3 pacientes en una hora?
P(x ≥ 3) = 1 - P(x < 3) = 1 - P(x ≤ 2) = 1 - 0,3027 = 0,6972
e) ¿Cuál es la probabilidad que a lo máximo lleguen 5 pacientes en una hora?
P(x ≤ 5) = 0,8441
36
19) Conlos datos de la pregunta 18 y empleando Excel, construya la tabla de probabilida-

des de la distribución de Poisson. Incluya las probabilidades marginales y las probabili-
dades acumuladas.
37
C a pí t ulo
Distribuciones de
probabilidad continuas
1) Independientemente de la función de distribución continua, ¿a qué es igual P(x = a),

donde a es una constante?
P(x = a) = 0
2) Se tiene un experimento en el que todos los eventos tienen la misma probabilidad de
ocurrencia en el intervalo a = 1, b = 6. En base a esto responder lo siguiente:
a) ¿Cuál es distribución adecuada para este caso?
Es la distribución de probabilidad uniforme.
Antes de proceder con el cálculo de las probabilidades se necesita calcular la altura
del rectángulo. Este estará dado por:
1 1
= = 0, 20
(b − a ) (6 − 1)
b) P(x ≤ 4):
P(x ≤ 4) = (4 - 1) × (0,2) = 0,6
Es 4 - 1 porque x ocurre en el intervalo [1,6] y la probabilidad en todo ese intervalo
tiene que ser 1.
c) P(1 ≤ x ≤ 4):
P(1 ≤ x ≤ 4) = (4 - 1) × (0,2) = 0,6
39
d) P(3 < x ≤ 6):

P(3 < x ≤ 6) = (6 - 3) × (0,2) = 0,6
e) P(x > 5):
P(x > 5) = 1 - P(x ≤ 5) = 1 - (5 - 1) × (0,2) = 0,2
P(x = 1):
f)
P(x = 1) = 0
g) ¿Cuál es la esperanza matemática de este experimento?
a + b 1+ 6
=µ E=
( x) = = 3,5
2 2
h) ¿Cuál es la varianza de este experimento?
(b − a ) 2 (6 − 1) 2
= σ2 = = 2, 0833
12 12
3) Se supone que el consumo de cierto producto se distribuye como una distribución uni-
forme con media 5 y varianza 3. Responda:
a) ¿Cuáles son los límites de la distribución?
a+b
µ = E ( x) = = 5 → a + b = 10
2
(b − a) 2
σ =
2
=3 → (b − a) 2 =36
12
Resolviendo el sistema se obtendrá:
a = 2 y b = 8
O bien,
a = 8 y b = 2
Como b representa el límite superior, se seleccionará con la primera opción (a = 2 y
b = 8).
del rectángulo. Este estará dado por:
1 1
= = 0,1667
(b − a ) (8 − 2)
b) P(x ≤ 3):
P(x ≤ 3) = (3 - 2) × (0,1667) = 0,1667
Es (3 – 2) porque x ocurre en el intervalo [2,8] y la probabilidad en todo ese inter-
valo tiene que ser 1.
40
capítulo 4 Distribuciones de probabilidad continuas
c) P(3 ≤ x ≤ 7):
P(3 ≤ x ≤ 7) = (7 - 3) × (0,1667) = 0,6668
d) P(2 < x ≤ 4):
P(2 < x ≤ 4) = (4 - 2) × (0,1667) = 0,3334
e) P(x > 6):
P(x > 6) = 1 - P(x ≤ 6) = 1 - (6 - 2) × (0,1667) = 1 - 0,6668 = 0,3332
f) P(x ≥ 3):
P(x ≥ 3) = 1 - P(x ≤ 3) = 1 - (3 - 2) × (0,1667) = 1 - 0,1667 = 0,8333
4) Se conoce que el promedio (λ) de pacientes por hora que llegan a la sala de emergencias
de un hospital es igual 3,6. Se define a la variable aleatoria x como el tiempo entre la
llegada de los pacientes. Responda:
En primer lugar se transforma el número de pacientes en pacientes por hora.
a) ¿Cuál es la probabilidad que un paciente llegue en los siguientes 10 minutos, dado
que acaba de llegar un paciente?
10 minutos = 0,1667 horas (10/60)
F ( x) = 1 − e −3,6 × (0,1667) =
P(tiempo de ocurrencia ≤ 0,1667 horas) = 0, 45
b) ¿Cuál es la probabilidad que ningún paciente llegue en la siguiente hora, dado que
acaba de llegar un paciente?
P( x ≥ 1)= e − λ ×=
k
e −3,6 × (1)= 0, 00
c) ¿Cuál es la probabilidad que algún paciente llegue entre los próximos 10 y 20 minu-
tos, dado que acaba de llegar un paciente?
P(0,1667 ≤ x ≤ 0,34)= P( x ≤ 0,3334) − P( x ≤ 0,1667)
P(0,1667 ≤ x ≤ 0,34) = (1 − e −3,6 × (0,3334) ) − (1 − e −3,6 × (0,1667) ) =0, 2476
d) ¿Cuál es el tiempo promedio esperado en el que arribará otro paciente?

1 1
µ= E ( x=
) = = 0, 2778
λ 3, 6
Es decir, que en promedio se espera que llegue un paciente cada 0,28 horas.
e) ¿Cuál es la varianza del tiempo esperado en el que arribará otro paciente?
1 1
σ=
2
= = 0, 0772
λ 2
3, 62
41
5) Mediante el uso de Excel construya la tabla de probabilidades marginales de la distri-

bución exponencial dada la información del ejemplo anterior.
La hoja Excel de este ejercicio se llama “capitulo4_ejercicio4_Exponencial.xls”.
6) El número de clientes promedio por hora que compran un determinado producto en

una tienda es igual a 35. Si se define a la variable aleatoria x como el tiempo entre la
llegada de los clientes. Responda:
En primer lugar, se transforma el número de clientes en clientes por hora.
a) ¿Cuál es la probabilidad que un cliente compre el producto en los siguientes 5 mi-
nutos, dado que un cliente acaba de comprar el producto?
1 − e −35 × (0,0833) =
P( x ≤ 0,0833 horas ) = 0,9458
b) ¿Cuál es la probabilidad que ningún cliente compre el producto en los siguientes 10

minutos, dado que un cliente acaba de comprar el producto? (10 minutos es 0,1667
horas, 10/60)
P( x ≥ 0,1667)= e −35 × (0,1667)= 0, 0029
c) ¿Cuál es la probabilidad que un cliente compre el producto entre los próximos 5 y

10 minutos, dado que un cliente acaba de comprar el producto?
P(0, 0833 ≤ x ≤ 0,1667)= P( x ≤ 0,1667) − P ( x ≤ 0, 0833)
P(0, 0833 ≤ x ≤ 0,1667) = (1 − e −35 × (0,1667) ) − (1 − e −35 × (0,0833) ) = 0, 0571
d) ¿Cuál es el tiempo promedio esperado en el que un cliente comprará el producto?

1 1
µ= E ( x=
) = = 0, 0286
λ 35
42
Es decir, que en promedio se espera que un cliente compre cada 0,0286 horas (o
sea, cada 1,71 minutos, ya que 0,0286 × 60 = 1,71).
e) ¿Cuál es la varianza del tiempo esperado de la distribución en este caso?
1 1
σ=
2
= = 0, 0008
λ2
352
7) Por medio de Excel construya la tabla de probabilidades marginales de la distribución
exponencial dada la información del ejemplo anterior.
La hoja Excel de este ejercicio se llama “capitulo4_ejercicio6_Exponencial.xls”.
43
8) Se tiene una variable aleatoria x ~ N(10,2), es decir, que la variable aleatoria x se distri-
buye como una normal con media 10 y desviación estándar 2. Utilice la regla empírica
para responder las siguientes preguntas:
Se recuerda la regla empírica mediante el siguiente gráfico:
0,50 0,50
-4 -3 -2 -1 0 1 2 3 4
68,3%
95,5%
99,7%
a) P(x ≥ 10):
 10 − 10 
P ( x ≥ 10 ) = P  z ≥  = P ( z ≥ 0) = 0,5
 2 
b) P(8 ≤ x ≤ 12):
 8 − 10 x − µ 12 − 10 
P (8 ≤ x ≤ 12) = P  ≤ ≤  = P (−1 ≤ z ≤ 1) = 0, 683
 2 σ 2 
c) P(4 ≤ x ≤ 14):
 4 − 10 x − µ 14 − 10 
P(4 ≤ x ≤ 14) = P  ≤ ≤  = P(−3 ≤ z ≤ 2)
 2 σ 2 
 0,955   0,997 
P(−3 ≤ z ≤ =
2) P( z ≤ 2) − P( z ≤ −=
3)  − 
 2   2 
P(−3 ≤ z =
≤ 2) 0, 4775 + 0, 4985
= 0,976
d) P(4 ≤ x ≤ 16):
 4 − 10 x − µ 16 − 10 
P (4 ≤ x ≤ 16) = P  ≤ ≤  = P (−3 ≤ z ≤ 3) = 0,997
 2 σ 2 
44
e) P(x ≤ 8):
8 − 10  0, 683
) P  z ≤
P ( x ≤ 8= = P ( z ≤ −1)
= 0,5 − = 0,1585
 2  2
f) P(x ≥ 6):
6 − 10  0,955
) P  z ≥
P ( x ≥ 6= = P ( z ≥ −2)
= 0,5 + = 0,9775
 2  2
9) Se tiene una variable aleatoria x ~ N(7;1,5). Responda las siguientes preguntas:

Los valores se han obtenido usando Excel (DISTR.NORM). Recuerde que Excel pre-
senta las probabilidades desde −∞ hasta el valor deseado. Para analizar esto observe la
Aplicación de Excel 2 del capítulo 4.
a) P(x ≥ 8):
 8−7 
P ( x ≥ 8 ) =P  z ≥ =P( z ≥ 0, 6667) =1 − 0, 747518 =0, 252482
 1,5 
b) P(5 ≤ x ≤ 6):
 5−7 x− µ 6−7 
P (5 ≤ x ≤ 6)= P  ≤ ≤ = P (−1,3333 ≤ z ≤ −0, 6667)
 1,5 σ 1,5 
P (−1,3333 ≤ z ≤ −0, 6667)

= P ( z ≤ −0, 6667) − P ( z ≤ −1,3333)
= 0, 252482 − 0, 091266
= 0,161216
c) P(7 ≤ x ≤ 9):
 7−7 x−µ 9−7 
P(7 ≤ x ≤ 9)= P  ≤ ≤ = P(0 ≤ z ≤ 1,3333)
 1,5 σ 1,5 
P(0 ≤ z ≤ 1,3333)= P( z ≤ 1,3333) − P ( z ≤ 0)= 0,908783 − 0,50= 0, 408783
d) P(6 ≤ x < 8):

 6−7 x− µ 8−7 
P(6 ≤ x ≤ 8) = P  ≤ ≤ = P (−0, 6667 ≤ z ≤ 0, 6667)
 1,5 σ 1,5 
P (−0, 6667 ≤ z ≤ 0, 6667)

= P( z ≤ 0, 6667) − P( z ≤ −0, 6667)
= 0, 747518 − 0, 252482
= 0, 495036
e) P(x < 7):

 7−7
P ( x<7 ) = P  z< = P ( z < 0) = 0,5
 1,5 
45
f) P(x ≥ 6):
 6−7
P ( x ≥ 6) = P  z ≥ = P( z ≥ −0, 6667) = 1 − P( z < −0, 6667) = 1 − 0, 252482 = 0, 747518
 1,5 
10) Seconoce que los salarios (expresados en miles de U.M.) de las personas que trabajan
en una determinada empresa transnacional siguen una distribución normal con media
50 y varianza 20. En base a esta información determinar lo siguiente:
a) P(x > 60):
 60 − 50 
P ( x>60 ) =
P  z> =P( z > 2, 2361) =
1 − P( z ≤ 2, 2361) =
1 − 0,987327 =
0, 012673
 20 
b) P(x > 100):

 100 − 50 
P ( x>100 ) =
P  z> P( z 11,18) =
 => 1 − P( z ≤ 11,18) =
1 −1 =
0, 00
 20 
c) P(45 ≤ x ≤ 75):
 45 − 50 x − µ 75 − 50 
P (45 ≤ x ≤ 75) = P  ≤ ≤  = P (−1,1180 ≤ z ≤ 5,5902)
 20 σ 20 
P(−1,12 ≤ z ≤ 3,35)
= P ( z ≤ 5,5902) − P ( z ≤ −1,1180)
= 1, 000000 − 0,131783
= 0,868217
d) P(x < 30):

 30 − 50 
P ( x<30
= ) P  z< =  P( z < −4, 4721)
= 0, 000004
 20 
11) Usela aproximación de la distribución binomial empleando la distribución normal. Se

conoce que históricamente la probabilidad que un cliente compre un determinado pro-
ducto es igual al 52%. Si se observan a 10 clientes:
a) ¿Se cumplen las condiciones para la aproximación?
Las condiciones son: n × π ≥ 5 y n × (1 - π) ≥ 5. Entonces como:
10 × (0,52) = 5,2 ≥ 5 y 10 × (1 - 0,52) = 4,8 < 5
Técnicamente no se puede utilizar la aproximación, pero a manera de demostrar el
uso de esta aproximación se continuará con la solución del ejercicio.
Para los siguientes ejercicios la media y la varianza serán las siguientes:
E(x) = n × π = 10 × (0,52) = 5,2
var(x) = n × π × (1 - π) = 10 × (0,52) × (1 - 0,52) = 2,496
Por lo tanto, la desviación estándar será:
std(x) = 1,58
46
b) ¿Cuál es la probabilidad que exactamente 5 compren el producto?

 4,5 − 5, 2 x − µ 5,5 − 5, 2 
P ( x = 5) = P (4,5 ≤ x ≤ 5,5) = P  ≤ ≤ = P (−0, 4430 ≤ z ≤ 0,1899)
 1,58 σ 1,58 
P(−0, 44 ≤ z ≤ 0,19)
= P ( z ≤ 0,1899) − P ( z ≤ −0, 4430)
= 0,575306 − 0,328883
= 0, 246423
c) ¿Cuál es la probabilidad que al menos 3 clientes compren el producto?

 x − µ 2,5 − 5, 2 
P( x ≥ =
3 ) P ( x ≥ 2,5
= ) P ≥ = P ( z ≥ −1, 7089)
 σ 1,58 
P ( z ≥ −1, 7089) = 1 − P ( z ≤ −1, 7089) = 1 − 0, 043735 = 0,956265
d) ¿Cuál es la probabilidad que no más de 6 clientes compren el producto?

 x − µ 6,5 − 5, 2 
P ( x ≤ 6 ) = P ( x ≤ 6,5 ) = P  ≤ = P ( z ≤ 0,8228)
 σ 1,58 
P ( z ≤ 0,8228) =
0, 794689
e) ¿Cuál es la probabilidad que compren el producto entre 3 y 7 clientes?

 2,5 − 5, 2 x − µ 7,5 − 5, 2 
P(3 ≤ x ≤ 7) = P(2,5 ≤ x ≤ 7,5) = P  ≤ ≤ = P(−1, 7089 ≤ z ≤ 1, 4557)
 1,58 σ 1,58 
P(−1, 71 ≤ z ≤ 1, 46) = P( z ≤ 1, 4557) − P ( z ≤ −1, 7089) = 0,927262 − 0, 043735 = 0,883527
f) ¿Cuál es la probabilidad que ningún cliente compre el producto?

 0 − 5, 2 x − µ 0,5 − 5, 2 
P( x= 0)= P(0 ≤ x ≤ 0,5)= P  ≤ ≤ = P(−3, 2911 ≤ z ≤ −2,9747)
 1,58 σ 1,58 
P(−3, 29 ≤ z ≤ −2,97)
= P ( z ≤ −2,9747) − P ( z ≤ −3, 2911)
= 0, 001466 − 0, 000499
= 0, 000967
Se advierte que en la aproximación se emplea 0 como punto de partida. Esto es

cierto porque no se puede tener −0,5 clientes.
12) Resuelva la pregunta anterior usando la probabilidad binomial.
a) ¿Es la aproximación presentada en la pregunta anterior adecuada?
De acuerdo a la parte a) de la pregunta anterior (donde se demostró que las condi-
ciones se cumplieron solo marginalmente), la aproximación será buena.
b) ¿Por qué cree que esta aproximación es adecuada?
10 × (0,52) = 5,2 ≥ 5 y 10 × (1 - 0,52) = 4,8 < 5
47
Como se observa la segunda condición es casi 5. Obviamente las aproximaciones

serán mejores cuanto mayor sea el número de observaciones (n) o cuando la proba-
bilidad tienda a 0,50. En este caso 0,52 es también bastante aproximada a 0,50, por
lo que las estimaciones deben de ser buenas.
c) ¿Cambiaría su respuesta si la probabilidad que el cliente compre el producto baje de
52% a 25%?
Se puede observar:
10 × (0,25) = 2,5 ≤ 5 y 10 × (1 - 0,25) = 7,5 ≥ 5
Nótese que en este caso el primer número está bastante lejos de 5, por lo que esta
aproximación no será buena.
d) ¿Cambiaría su respuesta si la probabilidad que el cliente compre el producto baje de
52% a 25%, pero que el número de clientes observados suba de 10 a 200?
De acuerdo a las condiciones planteadas:
200 × (0,25) = 40 ≥ 5 y 200 × (1 - 0,25) = 150 ≥ 5
La aproximación será buena, en este caso porque n aumentó.
13) Seadvierte que un 41% de empresas creadas permanecen en el mercado un año o más.
Si se define un suceso como el que una empresa permanezca por un año o más. Se
toma una muestra de 100 empresas creadas en los últimos 5 años. Utilizando la aproxi-
mación de la distribución binomial usando la normal, responda a las siguientes pregun-
tas:
a) Verifique que las condiciones de la aproximación son satisfechas.
100 × (0,41) = 41 ≥ 5 y 100 × (1 - 0,41) = 59 ≥ 5
Técnicamente se puede utilizar la aproximación.
Para los siguientes ejercicios la media y la varianza serán las siguientes:
E(x) = n × π = 100 × (0,41) = 41
var(x) = n × π × (1 - π) = 100 × (0,41) × (1 - 0,41) = 24,19
Por lo tanto, la desviación estándar será:
std(x) = 4,9183
b) ¿Cuál es la probabilidad que al menos 20 empresas hayan permanecido en el mer-
cado por un año o más?
 x − µ 19,5 − 41 
P ( x ≥ 20
= ) P ( x ≥ 19,5=) P  ≥ = P ( z ≥ −4,3714)
 σ 4,9183 
P ( z ≥ −4,3714) = 1 − P ( z ≤ −4,3714) = 1 − 0, 000006 = 0,999994
48
c) ¿Cuál es la probabilidad que un máximo de 30 empresas hayan permanecido en el

mercado por un año o más?
 x − µ 30,5 − 41 
P ( x ≤ 30
= ) P ( x ≤ 30,5=) P  ≤ = P( z ≤ −2,1349)
 σ 4,9183 
P( z ≤ −2,1349) =0, 016385
d) ¿Cuál es la probabilidad que entre 10 y 35 empresas hayan permanecido en el mer-

cado por un año o más?
 9,5 − 41 x − µ 35,5 − 41 
P (10 ≤ -x ≤ 35 ) = P ( 9,5 ≤ -x ≤ 35,5 ) = P  ≤ ≤ = P (−6, 4047 ≤ z ≤ −1,1118)
 4,9183 σ 4,9183 
P (−6, 4047 ≤ z ≤ −1,1118)

= P( z ≤ −1,1118) − P( z ≤ −6, 4047)
= 0,133112 − 0, 00000
= 0,133112
e) Conteste la pregunta a) usando la distribución binomial.

Se empleará Excel para obtener estos resultados.
P ( x ≥ 20 ) =
1 − P ( x < 20) =
1 − P( x ≤ 19) =
1 − 0, 000002 =
0,999998

f) Conteste la pregunta b) usando la distribución binomial.
P ( x ≤ 30 ) =
0, 015214

g) Conteste la pregunta c) usando la distribución binomial.
P (10 ≤ -x ≤ 35 ) = P( x ≤ 35) − P( x < 10) = P( x ≤ 35) − P( x ≤ 9)
P( x ≤ 35) − P( x=
≤ 9) 0,131334 − 0, 00000
= 0,131334
Como se puede observar en las preguntas e) - f), los valores obtenidos mediante la
distribución binomial son bastante cercanos a los obtenidos con la distribución nor-
mal.
14) Construya la tabla de probabilidades de la chi cuadrada con 3 grados de libertad. Cons-
truya la tabla desde cero hasta 20 con incrementos de 0,5. Conteste lo siguiente:
La hoja Excel se llama “capitulo4_ejercicio14_chi_cuadrada.xls”. Recuerde que Excel
presenta las probabilidades desde el número deseado hasta +∞. De acuerdo a esto
último se ajusta la forma en determinar las probabilidades. Se adjunta una parte de la
tabla a los efectos prácticos.
49
a) P(x > 1,5):

P(x > 1,5) = 0,91307
b) P(x ≤ 6):
P(x ≤ 6) = 1 - P(x > 6) = 1 - 0,306219 = 0,693781
c) P(0 < x ≤ 3):
P(0 < x ≤ 3) = P(x ≥ 0) - P(x > 3) = 1 - 0,699986 = 0,300014
d) P(12 ≤ x ≤ 15):
P(12 ≤ x ≤ 15) = P(x > 12) - P(x > 15) = 0,034788 - 0,010362 = 0,024426
15) Si
los retornos de una determinada acción se distribuyen como una distribución t Stu-
dent con 5 grados de libertad. Se toman aleatoriamente 50 observaciones y se define la
variable aleatoria x como los retornos de la acción, responda lo siguiente:
a) Construya la tabla de probabilidades de la t de Student con 5 grados de libertad.
Construya la tabla desde -3 hasta 3 en incrementos de 0,1.
La hoja Excel se llama “capitulo4_ejercicio15_t_student.xls”. Recuerde que Excel
presenta las probabilidades desde x hasta −∞, si el x es negativo, y desde x hasta +∞
si el x es positivo. De acuerdo a esto último se ajusta la forma de determinar las pro-
babilidades.
50
b) P(x > 0,1):

P(x > 0,1) = 0,46212
c) P(x ≤ 0):
P(x ≤ 0) = 0,5
d) P(-0,5 < x ≤ 1,0):
P(-0,5 < x ≤ 1,0) = [0,5 - P(x ≤ -0,5)] + [0,5 - P(x > 1,0)] = [0,5 - 0,31915)] +
[0,5 - 0,18161]
P(-0,5 < x ≤ 1,0) = 0,49924
e) P(1,0 ≤ x ≤ 2,5):
P(1,0 ≤ x ≤ 2,5) = P(x > 1,0) - P(x > 2,5) = 0,18161 - 0,02725 = 0,15436
16) Construya
la tabla de probabilidades de la F de Fisher con 5 y 10 grados de libertad en
el numerador y denominador, respectivamente. Construya la tabla desde cero hasta 5
en incrementos de 0,1. Conteste lo siguiente:
La hoja Excel se llama “capitulo4_ejercicio16_F.xls”. Recuerde que Excel presenta las
probabilidades desde 0 hasta +∞. De acuerdo a esto último se ajusta la forma de deter-
minar las probabilidades. Se adjunta una parte de la misma a los efectos prácticos.
51
a) P(x > 1):

P(x > 1) = 0,4651
b) P(x ≤ 2):
P(x ≤ 2) = 1 - P(x > 2) = 1 - 0,1642 = 0,8358
c) P(0,5 < x ≤ 2,2):
P(0,5 < x ≤ 2,2) = P(x ≥ 0,5) - P(x > 2,2) = 0,7700 - 0,1352 = 0,6348
d) P(3 ≤ x ≤ 4,5):
P(3 ≤ x ≤ 4,5) = P(x > 3) - P(x > 4,5) = 0,0656 - 0,0208 = 0,0448
17) Se entrevistó a 60 familias para determinar sus gastos en consumo mensuales. Se tiene
la siguiente tabla que muestra el rango de gastos de consumo mensual, el número de
familias en cada rango y el gasto promedio mensual por rango:
Tabla 1
Gasto promedio mensual

Rango (en U.M.) Número de familias
(en U.M.)
[500;1.000) 12 734
[1.000;1.500) 26 1.350
[1.500;2.000) 17 1.703
[2.000; +) 5 2.560
52
Responda las siguientes preguntas:

Asuma que x = gasto en consumo de una determinada familia
¿Cuál es la probabilidad de seleccionar aleatoriamente a una familia cuyo gasto en
a)
consumo está entre 500 y 1.000 U.M.?
P(x ∈ [500;1.000)) = 12/60 = 0,2000
Calcule las otras probabilidades de seleccionar aleatoriamente a una familia en un
b)
determinado rango de consumo.
P(x ∈ [1.000;1.500)) = 26/60 = 0,4334
P(x ∈ [1.500;2.000)) = 17/60 = 0,2833
P(x ∈ [2.000; +)) = 5/60 = 0,0833
¿Cuál es el gasto promedio mensual de toda la muestra?
c)
Promedio = 0,2 × 734 + 0,4334 × 1.350 + 0,2833 × 1.703 + 0,0833 × 2.560 =
1.427,60
¿Cuál es la varianza de la misma?
d)
Varianza = 0,2 × (734 - 1.427,60)2 + 0,43 × (1.350 - 1.427,60)2 + 0,28 × (1.703
- 1.427,60)2 + 0,08 × (2.560 - 1.427,60)2 = 227.131,03
La desviación estándar será = 476,58
18) ¿Si
una variable aleatoria se distribuye como una normal, las medias muestrales toma-
das de esta población se distribuirán como una normal, si y solo si el tamaño de la
muestra es mayor o igual que 30?
Esta es la regla empírica que asegura con cierta certeza que el teorema del límite central
se cumple. Sin embargo, si la población se distribuye como una normal, las medias
muestrales tomadas de esta población también se distribuirán como una normal sin
importar el tamaño de la muestra.
19) ¿Las
medias muestrales se distribuyen normalmente, sin importar la distribución de la
población de la que fueron tomadas? Comente.
Falso. Esto es cierto si y solo si en el caso en el que la población de donde se toman las
muestras se distribuye como una normal. En todos los otros casos se tiene que verificar
que el teorema del límite central se cumple, es decir, se tiene que verificar que el ta-
maño de la muestra sea de por lo menos 30.
20) Elteorema del límite central dice que si el tamaño de las muestras es grande (por lo
general ≥ 30), indiferentemente de la distribución poblacional de donde se sacaron las
muestras, la distribución muestral será una normal. Comente.
Correcto.
53
21) Sise tiene una población que se distribuye como una normal con media 20 y desvia-
ción estándar 3, de la cual se extrae una muestra de tamaño 10. Conteste las siguientes
preguntas:
En este caso, ¿cuál es la distribución de las medias muestrales?
a)
X~N(20,3)
Por lo tanto la muestra, independientemente del tamaño de la muestra, será tam-
bién normal.
b) ¿Cuál es la media y el error estándar de las medias muestrales?
media muestral= µ= 20
σ 3
=s = = 0,9487
n 10
c) P( x > 18) .
 
 x − µ 18 − 20 
P( x > 18)
= P > =  P( z > −2,1081)
 σ 0,9487 
 
 n 
P ( z > −2,1081) = 1 − P ( z ≤ −2,1081) = 1 − 0, 017511 = 0,982489
d) P( x ≤ 16) .
 16 − 20 
P( x ≤ 16)
= P z ≤ = P( z ≤ −4, 2163)
= 0, 000012
 0,9487 
e) P ( 21 ≤ x ≤ 23) .
 21 − 20 23 − 20 
P ( 21 ≤ x ≤ 23) = P  ≤z≤ = P(−1, 0541 ≤ z ≤ 3,1622)
 0,9487 0,9487 
P (−1, 0541 ≤ z ≤ 3,1622)

= P ( z ≤ 3,1622) − P ( z ≤ −1, 0541)
= 0,999217 − 0,145919
= 0,853298
22) Sise tiene una población que no se distribuye como una normal. La media del proceso
es 5 y la desviación estándar es 0,75. De esta población se saca una muestra de tamaño
10. Conteste las siguientes preguntas:
a) ¿Se puede afirmar que en este caso la distribución muestral será una normal?
No, porque la población no se distribuye como una normal.
b) ¿Su respuesta cambiaría si el tamaño de las muestras fuera 50?
Sí, porque en ese caso se puede afirmar que el teorema del límite central se cumple,
por lo que la muestra se distribuirá como una normal.
54
c) Si su respuesta en b) es afirmativa, ¿por qué sería este el caso?

Por la aplicación del teorema del límite central.
23) Continuando con la pregunta anterior y asumiendo que el tamaño de la muestra es 50,
responda las siguientes preguntas:
a) P ( x ≤ 4) :
 
 4−5 
P(x ≤ =
4) P  z ≤ =  P( z ≤ −9, 4251)
= 0, 00
0, 75
 
 50 
b) P ( x > 5.5 ) :
 5,5 − 5 
P ( x > 5,5 ) =
P z > =P( z > 4, 7125) =
1 − P( z ≤ 4, 7125) =
1 − 0,999999 =
0, 000001
 0,1061 
c) P (5 ≤ x ≤ 7) :
 5−5 7−5 
P ( 5 ≤ x ≤ 7 )= P  ≤z≤ = P (0 ≤ z ≤ 18,8501)= 0,50
 0,1061 0,1061 
d) P ( 4 ≤ x ≤ 6) :
 4−5 6−5 
P ( 4 ≤ x ≤ 6) = P  ≤z≤  = P(−9, 4251 ≤ z ≤ 9, 4251)
 0,1061 0,1061 
P(−9, 4251 ≤ z ≤ 9, 4251) = P( z ≤ 9, 4251) − P( z ≤ −9, 4251) = 1 − 0 = 1
24) Sise tiene un índice de sentimiento de los inversionistas, que señala lo que los inversio-
nistas creen que pasará con la economía el próximo año en términos de expectativas de
crecimiento o recesión. Se supone que 57% del total de inversionistas esperan que la
economía crezca el próximo año. Se toma aleatoriamente una muestra de 40 inversio-
nistas. Responda lo siguiente:
a) Verifique que las condiciones para la aproximación mediante la distribución normal
se cumplen.
Las condiciones son:
n × π ≥ 5 y n × π (1 - π) ≥ 5
Si se reemplaza por los valores dados en el ejercicio:
40 × 0,57 = 22,8 ≥ 5
40 × 0,57 × (1 - 0,57) = 9,804 ≥ 5
Por lo tanto, la condición se cumple y se puede afirmar que la proporción muestral
se distribuye como una normal.
55
Calcule la media y el error estándar.

b)
Media = π = 0,57
0,57(1 − 0,57)
= 0, 0783
40
c) P(p > 0,5):

 0,5 − 0,57 
P ( p > 0,5
= ) P z > = P( z > −0,8940)
 0, 0783 
P( z > −0,8940) = 1 − P( z ≤ −0,8940) = 1 − 0,185661 = 0,814339
d) P(p ≤ 0,6):
 0, 6 − 0,57 
P ( p ≤ 0, 6 ) = P  z ≤ = P ( z ≤ 0,3831) =0, 649177
 0, 0783 
e) P(0,3 ≤ p ≤ 0,7):
 0,3 − 0,57 0, 6 − 0,57 
P ( 0,3 ≤ p ≤ 0, 6 ) = P  ≤z≤ = P(−3, 4483 ≤ z ≤ 0,3831)
 0, 0783 0, 0783 
P(−3, 4483 ≤ z ≤ 0,3831)

= P( z ≤ 0,3831) − P( z ≤ −3, 4483)
= 0, 649177 − 0, 000282
= 0, 648895
56
C a pí t ulo
Estadística inferencial:
Intervalos de confianza
1) ¿Cuál es la diferencia entre un parámetro y un estadístico?

La diferencia es que el primero se refiere a la población y el segundo a la muestra.
2) ¿Un estadístico insesgado es aquel cuyo valor es igual al parámetro correspondiente?
Incorrecto. Un estadístico insesgado es aquel cuyo valor esperado es igual al paráme-
tro correspondiente.
3) ¿Por qué el denominador de la varianza muestral es n – 1?
Porque de esta manera el estadístico de la varianza poblacional será insesgado. Para una
demostración formal de esto se sugiere leer la sección 2 del capítulo 5.
4) ¿Puede un estimador ser no eficiente pero consistente?
Correcto.
5) ¿Por qué es muy riesgoso realizar inferencias basadas en una estimación puntual?
Debido a que se asume que el valor exacto del estadístico es igual al valor del paráme-
tro. Para una explicación detallada se sugiere leer la sección 3 del capítulo 5.
57
6) ¿Cuál sería el efecto en los límites de un intervalo de confianza, si el nivel deseado de

confianza es igual al 100%?
Los límites serian −∞ y +∞. Lógicamente este intervalo contendrá con certeza el pará-
metro, su uso práctico es nulo ya que no provee ninguna información sobre la cual se
puedan tomar decisiones.
7) Si el nivel de confianza deseado tiende a cero, ¿el intervalo de confianza tenderá a
100%?
En este caso el intervalo de confianza tenderá a la estimación puntual del parámetro.
8) Se supone que una población se distribuye como una normal. Se conoce por datos his-
tóricos que la desviación estándar poblacional (σ) es igual a 2. Se toma una muestra
aleatoria de 15 elementos de dicha población y se calcula su media muestral, que es
igual a 20. En base a estos datos estime el intervalo de confianza de la media poblacio-
nal dados los siguientes niveles de confianza:
Para el desarrollo de este ejercicio se utilizará el comando Excel DIST.NORM.INV.
a) Nivel de confianza del 90%:
 σ   2 
µ ∈ x ± z ×  → µ ∈  20 ± 1, 645 ×  → µ ∈ [19,1505; 20,8495]
 n  15 
b) Nivel de confianza del 95%:

 σ   2 
µ ∈ x ± z ×  → µ ∈  20 ± 1,96 ×  → µ ∈ [18,9879; 21, 0121]
 n  15 
c) Nivel de confianza del 99%:

 σ   2 
µ ∈ x ± z ×  → µ ∈  20 ± 2,56 ×  → µ ∈ [18, 6780; 21,3220]
 n  15 
9) Basados en las respuestas obtenidas en la pregunta anterior, comente: ¿Puede verificarse

que la amplitud de los intervalos de confianza se incrementa conforme se incrementan
los niveles de confianza deseados?
Sí, es correcto, se puede verificar.
10) Las ganancias/pérdidas mensuales de las empresas que componen un índice, se distri-
buyen como una normal. Se supone que la varianza poblacional (σ 2) es conocida e igual
a 245. Se toma una muestra aleatoria de 10 empresas componentes del índice. La media
muestral de las ganancias/pérdidas de estas 10 empresas es igual a 1.350. Basados en
esta información:
Note que la desviación estándar será igual a 15,6525 (245^0,5).
58
capítulo 5 Estadística inferencial: Intervalos de confianza
a) ¿Cuál es el estimador puntual de la media poblacional?

El estimador puntual es 1.350.
b) Construya el intervalo de confianza para la media poblacional. Asuma un nivel de
significancia igual al 5%.
 σ   15, 6525 
µ ∈ x ± z ×  → µ ∈ 1.350 ± 1,96 ×  → µ ∈ [1.340,30;1.359, 70]
 n  10 
c) Construya el intervalo de confianza para la media poblacional. Asuma un nivel de

 σ   15, 6525 
µ ∈ x ± z ×  → µ ∈ 1.350 ± 1, 645 ×  → µ ∈ [1.341,86;1.358,14]
 n  10 
11) Confeccione una hoja Excel que replique los resultados obtenidos en la pregunta ante-
rior.
La hoja de Excel con el desarrollo del ejercicio anterior se llama “capitulo5_
ejercicio10_Z.xlsx”.
59
12) ¿Es
cierto que conforme los grados de libertad de la distribución t de Student se incre-
mentan, la distribución tenderá hacia una distribución normal?
Correcto.
13) Trabaje con los datos de la pregunta 10. Suponga que no se conoce la varianza pobla-
cional. En este caso, lo que se hace es calcular la media y la varianza muestral. Los va-
lores estimados son 245 y 49 para la media y la varianza muestral, respectivamente.
Basados en esta información:
La solución de este ejercicio usando Excel se llama “capitulo5_ejercicio13_t.xlsx”
a) Construya el intervalo de confianza para la media poblacional. Asuma un nivel de
significancia igual al 5%:
 s   7 
µ ∈  x ± t(10−1) ×  → µ ∈  245 ± 2, 2622 ×  → µ ∈ [239,9925; 250, 0075]
 n  10 

significancia igual al 10%:
 s   7 
µ ∈  x ± t(10−1) ×  → µ ∈  245 ± 1,8331×  → µ ∈ [240,9422; 249, 0578]
 n  10 
60
14) ¿Enesta última pregunta, se puede verificar que la amplitud de los intervalos de con-
fianza se incrementa conforme se incrementan los niveles de confianza deseados?
Correcto. Se puede apreciar que la amplitud del primer intervalo (95%) es mayor que el
segundo (90%).
15) Sesabe que el número de horas semanales trabajadas por los empleados de una deter-
minada empresa siguen una distribución normal. Se tomó una muestra de 50 emplea-
dos y se obtuvo la media y la desviación estándar muestral, que son iguales a 45 y 2,7,
respectivamente. En base a esta información responda:
a) ¿Cuál es el estimador puntual de la media poblacional?
El estimador puntual es 45.
 s   2, 7 
µ ∈  x ± t(50−1) ×  → µ ∈  45 ± 2, 01×  → µ ∈ [44, 2327; 45, 7673]
 n  50 
c) Construya el intervalo de confianza para la media poblacional. Asuma un nivel de
 s   2, 7 
µ ∈  x ± t(50−1) ×  → µ ∈  45 ± 1, 68 ×  → µ ∈ [44,3598; 45, 6402]
 n  50 
16) Resuelva la pregunta 15 usando Excel.

Resuelto en “capitulo5_ejercicio15_t.xlsx”.
61
17) Dada las siguientes observaciones de una muestra proveniente de una población distri-
buida aproximadamente como una normal, construya el intervalo de confianza para la
media poblacional considerando un nivel de confianza del 99%: 22, 31, 28, 22, 29, 25,
30, 24, 26, 29.
Esta pregunta se encuentra resuelta en la hoja Excel “capitulo5_ejercicio17_t.xlsx”.
La media muestral es igual a 26,60 y la desviación estándar igual a 3,27. Por lo tanto, el
intervalo de confianza será:
 3, 27 
µ ∈  26, 60 ± 3, 2498 ×  → µ ∈ [ 23, 2366; 29,9634]
 10 
18) Para ver la dificultad de un examen para la certificación de analistas financieros, se

testeó el banco de preguntas con 50 estudiantes de doctorado en finanzas. Estos estu-
diantes requirieron en promedio 45 minutos para resolver el examen, con una desvia-
ción estándar de 3,5 minutos. Se supone que el tiempo de demora en resolver el examen
se distribuye como una normal. Construya el intervalo de confianza de 95% para la
media poblacional del tiempo que tardan los estudiantes de doctorado en resolver este
examen.
62
 3,5 
µ ∈  45 ± 2, 0096 ×  → µ ∈ [ 44, 0053; 45,9947 ]
 50 
19) ¿Cuálesson las condiciones para que la aproximación de la binomial mediante la distri-
bución normal sea adecuada?
La distribución binomial es adecuadamente aproximada usando la distribución normal
cuando la probabilidad de suceso (p) es cercana a 0,5 o cuando n es bastante grande. En
general, esta aproximación será buena si se cumple que (n × p ≥ 5) y [n × (1 – p) ≥ 5].
20) Sehizo una encuesta sobre la intención de voto hacia un determinado candidato. Las
posibles respuestas eran a favor y en contra. El tamaño de la muestra fue de 500 perso-
nas, de las cuales 342 dijeron que estaban a favor del candidato.
Primero, se tiene que verificar que las condiciones para usar la distribución normal para
aproximar la distribución binomial son satisfechas:
n × p ≥ 5 → (500) × (0,684) = 342 > 5
[n × (1- p) ≥ 5 → (500) × (1 - 0,684) = 158 > 5
Por lo tanto, se podrá resolver este ejercicio usando las técnicas presentadas en el capí-
tulo 5.
¿Cuál es el valor de la proporción muestral?
a)
p = 342/500 = 0,684
b) Construya el intervalo de confianza del 90% para la proporción poblacional (π)
definida como la proporción de los encuestados que votarían por el candidato.
La media de la distribución binomial está dada por:
p= E ( p )= p= 0, 684
El error estándar está dado por:
p × (1 − p ) 0, 684 × (1 − 0, 684)
=σp = = 0, 0208
n 500
Por lo tanto, el intervalo de confianza será:
 p × (1 − p ) 
π ∈p± z  → π ∈ [ 0, 684 ± 1, 645 × 0, 0208] → π ∈ [ 0, 6498;0, 7182]
 n 

c) Basado en el intervalo obtenido y si se sabe que el candidato requiere del 51% de los
votos para ser elegido, ¿se puede estar casi seguros que el candidato será elegido en
estas elecciones?
Sí, el 51% cae dentro del intervalo de confianza mostrado en la pregunta anterior.
63
21) Sequiere determinar la proporción de clientes que compran menos de 10 unidades de

un determinado producto en un mes. Se tiene una relación de clientes (identificados
por un código único) de la cual se toma una muestra de 100 clientes. En esta muestra
se determina que 35 personas compraron menos de 10 productos en un determinado
mes.
Se puede demostrar que las condiciones para la aproximación de la binomial usando la
normal se satisfacen.
¿Cuál es el valor de la proporción muestral?
a)
p = 35/100 = 0,35
definida como la proporción de los clientes que compraron menos de 10 unidades
del producto en un mes.
La media de la distribución binomial está dada por:
p= E ( p )= p= 0,35
El error estándar está dado por:
p × (1 − p ) 0,35 × (1 − 0,35)
=σp = = 0, 0477
n 100
Por lo tanto, el intervalo de confianza será:
 p × (1 − p ) 
π ∈p± z  → π ∈ [ 0,35 ± 1,96 × 0, 0477 ] → π ∈ [ 0, 2565;0, 4435]
 n 

22) Siga con la pregunta anterior, si la lista de clientes contiene una relación de 500 clien-
tes:
a) ¿Cómo afecta esto los cálculos de la estimación de los intervalos de confianza?
En este caso, se conoce N (el tamaño de la población). Por lo tanto, se debe verificar
si se tiene el problema de tamaño de población finita: n ≥ 0,05 × N; en este caso
efectivamente el tamaño de la muestra (100) es mayor que el 5% del tamaño de la
población (0,05 × 500 = 25). Se observa que se tiene el problema de tamaño de
población finita y se debe ajustar el error estándar.
definida como la proporción de los clientes que compraron menos de 10 unidades
del producto en un mes, ajustando la fórmula por tamaño poblacional pequeño.
 p × (1 − p ) N −n  500 − 100 
π ∈p ± z× ×  → π ∈ 0,35 ± 1,96 × 0, 0477 × 
 n N −1   500 − 1 
π ∈ [ 0,35 ± 1,96 × 0, 0477 × 0,8953] → π ∈ [ 0, 2663;0, 4337 ]

64
c) Compare estos resultados con lo obtenidos en la pregunta anterior.

En este último caso el intervalo de confianza es más pequeño, como consecuencia
del factor de ajuste del error estándar.
23) Un analista financiero desea determinar los ingresos promedio de ventas de las líneas
aéreas durante la temporada alta anterior y que operan en una determinada región. Se
conoce que la desviación estándar de todos los ingresos es σ = 300 U.M. El analista
desea que el margen de error sea como máximo de 50 U.M., es decir, que se desea que
la media poblacional como máximo esté a 50 U.M. de la media poblacional. Si el nivel
de confianza deseado es del 95%, ¿Cuál será el número de ingresos que necesitará reco-
lectar?
2 2
z2 ×σ 1,962 × 300
=n →
= n = 138,30 ≅ 139
e2 502
24) Si en la pregunta anterior se desea un error máximo de 25 U.M., ¿cuál es el efecto de
reducir el error máximo deseado? y ¿cuál será el número de ingresos que necesitará re-
colectar?
El efecto de reducir el error máximo deseado hará que el tamaño de la muestra reque-
rida se incremente.
2 2
z2 ×σ 1,962 × 300
=n →
= n = 553,19 ≅ 554
e2 252
25) Si en la pregunta 23 se sabe además que en la región operan 30 líneas aéreas, ¿cuál será
el número de ingresos por línea aérea que necesitará recolectar?
En este caso se tiene un tamaño de población finita, por lo que se debe ajustar la fór-
mula para considerar esto.
σ2 3002
=n = = 24, 65 ≅ 25
e2 σ 2 502 3002
+ +
z2 N 1,962 30
26) Utilice Excel para resolver la pregunta 23.

Desarrollado en hoja Excel “capitulo5_ejercicio23_tamano_muestra.xlsx”.
65
27) Se desea realizar una encuesta para determinar la factibilidad de poner una cafetería en
el campus de una determinada universidad. Si se determina que existe una proporción
significativa de estudiantes interesados se pondrá en marcha el proyecto. Se desea que
el error máximo de la proporción muestral sea de 0,03 y el nivel de confianza igual al
95%, ¿cuál será el número de estudiantes a entrevistar?
Como no se conoce un valor aproximado de p, se utilizará 0,5 como valor de p.
z 2 × p × (1 − p ) 1,962 × 0,5 × (1 − 0,5)
=n = = 1.067,11 ≅ 1.068
e2 0, 032
28) Prosigacon la pregunta 27. Si antes de la realización de la encuesta se hace una prueba
piloto y se determina que la muestra proporcional de este piloto es 0,6; dado un nivel
de confianza del 95%, ¿cuál será el número de estudiantes a entrevistar?
z 2 × p × (1 − p) 1,962 × 0, 6 × (1 − 0, 6)
=n = = 1.024, 43 ≅ 1.025
e2 0, 032
29) Continúe con la pregunta 27. Si el número total de estudiantes de la universidad es

igual a 1.000, ¿cuál será el número de estudiantes a entrevistar?
En este caso se debe ajustar la fórmula para considerar el tamaño de población finita.
0,5 × (1 − 0,5)
=n = 516, 23 ≅ 517
0, 032 0,5 × (1 − 0,5)
+
1,962 1.000
66
C a pí t ulo
Pruebas de hipótesis para la media
1) ¿Cuáles son las características que deben de satisfacer: la hipótesis nula y la alternativa?
Deben de ser mutuamente exclusivas y exhaustivas.
2) Se tienen las siguientes hipótesis, señale las que están correctamente estructuradas en
base a su respuesta de la pregunta anterior:
a) H0: µ = 20; H1: µ ≠ 20.
b) H0: µ < 20; H1: µ > 20.
c) H0: µ > 20; H1: µ ≤ 20.
d) H0: µ > 20; H1: µ ≤ 19.
e) H0: µ > 20; H1: µ ≥ 20.
Las respuestas correctas son: a) y c).
3) ¿Cuál es la regla de decisión basada en los valores críticos para una hipótesis no direc-
cional?
Rechazar la hipótesis nula si el valor del test estadístico cae a la derecha o izquierda de
los valores críticos.
4) ¿Qué es el p-valor y cuál es la regla para rechazar la hipótesis nula?
Si el p-valor es menor que la significancia estadística, rechazar la hipótesis nula.
67
5) ¿Es posible que la decisión usando el criterio del valor crítico sea diferente a la decisión
alcanzada con el p-valor?
No.
6) Un juez realiza sus decisiones pensando que es mejor dejar libre a una persona culpable
que enviar a la cárcel a una persona inocente. ¿Qué tipo de error estadístico (tipo I o
tipo II) es el que utiliza al momento de decidir? Suponga que la hipótesis nula es que la
persona es culpable.
El error tipo I: Probabilidad de rechazar la hipótesis nula cuando esta es correcta.
7) Se tiene una población que se distribuye como una normal con desviación estándar
poblacional (σ) igual a 3. Se toma una muestra de 15 elementos de esta población y se
calcula la media muestral, la cual es igual a 16. Siga los pasos señalados en el capítulo y
realice la siguiente prueba de hipótesis, asumiendo que el nivel de confianza es del
95%:
a) H0: µ = 17; H1: µ ≠ 17.
Paso 1: Determinar el valor de z:
En este caso se emplea Excel y se obtiene z = 1,96 y z = −1,96.
Se advierte que este valor es conocido como el valor crítico de la hipótesis.
Paso 2: Calcular es z-test:
16 − 17
z − test = −1, 29
=
3 15
Paso 3: Ubicar z-test y concluir:

Como el z-test está entre los valores críticos, no se rechaza la hipótesis nula.
b) Grafique y muestre claramente las zonas de rechazo de la hipótesis nula.
Rechazar No rechazar Rechazar
-1,29
-1.96 1.96
-4 -3 -2 -1 0 1 2 3 4
68
capítulo 6 Estadística inferencial: Pruebas de hipótesis para la media
c) En base al criterio del valor crítico, ¿cuál es su decisión respecto a la hipótesis nula?
Como el z-test está entre los valores críticos, no se rechaza la hipótesis nula.
d) En base al criterio del p-valor, ¿cuál es su decisión respecto a la hipótesis nula?
El p-valor (la probabilidad asociada al z-test) es igual a:
P-valor = 0,098525 × 2 = 0,197051
Por lo tanto, como este valor es mayor que 0,05 (el nivel de significancia), no se re-
chazará la hipótesis nula.
e) Construya el intervalo de confianza respectivo y utilícelo como criterio para decidir
si rechaza o no la hipótesis nula.
 3 
µ ∈ 16 ± 1,96 ×  → µ ∈ [14, 4818;17,5182]
 15 
Efectivamente 17 puede ser el valor de la media poblacional.

8) Los beneficios antes de impuestos (en miles de U.M.) de las empresas del sector minero
de un determinado país, se distribuyen como una normal con desviación estándar po-
blacional conocida e igual a 150. Se tomó una muestra de 25 Estados de Ganancias y
Pérdidas, de las que se extrajeron los beneficios antes de impuestos y se tomó el prome-
dio. Dicho promedio muestral es igual a 1.240. Suponiendo un nivel de confianza del
90%, realice la siguiente prueba de hipótesis:
a) H0: µ = 1.300; H1: µ ≠ 1.300.
En este caso se utiliza Excel y se obtiene z = 1,645 y z = −1,645.
Se advierte que este valor es conocido como el valor crítico de la hipótesis.
1.240 − 1.300
z − test = −2, 00
=
150 25

Como el z-test está a la izquierda del valores crítico z = −1,645, se rechaza la hipóte-
sis nula.
69
-1,645 1,645
-4 -3 -2 -1 0 1 2 3 4
Como el z-test está a la izquierda del valores crítico z = −1,645, se rechaza la hipóte-
sis nula.
Se calcula con Excel y se obtiene el siguiente valor crítico relacionado con el z-test:
P-valor = 0,02275 × 2 = 0,0455
Como el p-valor es menor que el nivel de significancia (0,10), se rechaza la hipótesis
nula. Recuerde que se multiplica por dos porque se está trabajando con una prueba
no direccional.
 150 
µ ∈ 1.240 ± 1, 645 ×  → µ ∈ [1.190, 65;1.289,35]
 25 
Como se puede apreciar 1.300 no se encuentra en este intervalo, por lo que se re-
chaza la hipótesis nula.
9) Basado en la pregunta 8, para un nivel de confianza del 95%, realice la siguiente prueba
de hipótesis:
a) H0: µ > 1.500; H1: µ ≤ 1.500.
Paso 1: Determinar el valor de z.
En este caso se emplea Excel y se obtiene z = −1,645. Recuerde que en este caso la
región de rechazo se encuentra a la izquierda, por lo que solo se considera el valor
crítico en esta cola.
70
Paso 2: Calcular es z-test.

1.240 − 1.500
z − test = −8, 6667
=
150 25
Paso 3: Ubicar z-test y concluir.

Como el z-test está a la izquierda del valor crítico z = −1,645, se rechaza la hipótesis
nula.
Rechazar No rechazar
-8,6667
-1.645
-4 -3 -2 -1 0 1 2 3 4
Como el z-test está a la izquierda del valor crítico z = −1,645, se rechaza la hipótesis
nula.
Al utilizar Excel se obtiene el siguiente valor crítico relacionado con el z-test:
P-valor = 0,0000
nula.
10) Con
los datos de la pregunta 8, para un nivel de confianza del 99%, realice la siguiente
prueba de hipótesis:
a) H0: µ < 1.100; H1: µ ≥ 1.100.
En este caso se usa Excel y se obtiene z = 2,326. Recuerde que en este caso la región
de rechazo se encuentra a la derecha, por lo que solo se considera el valor crítico en
esta cola.
71

1.240 − 1.100
z − test
= = 4, 6667
150 25

Como el z-test está a la derecha de valor crítico z = 2,326, se rechaza la hipótesis
nula.
No rechazar Rechazar
4,6667
2,326
-4 -3 -2 -1 0 1 2 3 4
Como el z-test está a la derecha de valor crítico z = 2,326, se rechaza la hipótesis
nula.
Al utilizar Excel se obtiene el siguiente valor crítico relacionado con el z-test:
P-valor = 0,9999
Como el p-valor es mayor que el nivel de significancia (0,01), se rechaza la hipótesis
nula.
11) Se tiene el registro de la velocidad de los vehículos que pasan por un determinado cruce
peatonal. Se supone que la máxima velocidad permitida es de 15km/hora. Se toma una
muestra de 100 vehículos y se calcula la media y la varianza muestral, que son iguales a
18 km/hora y 4 km/hora, respectivamente. Para un nivel de confianza del 95% realice
la siguiente prueba de hipótesis:
a) H0: µ = 15; H1: µ ≠ 15.
En primer lugar, advierta que la desviación estándar poblacional no es conocida.
Por lo tanto, se utilizará la prueba t.
72
Paso 1: Determinar el valor de t.

Con la ayuda de Excel, se obtienen los valores críticos de la prueba: t = 2,276 y
t = −2,276.
Paso 2: Calcular es t-test.
18 − 15
t − test
= = 15
2 100

Como el t-test está a la derecha de valor crítico z = 2,276, se rechaza la hipótesis
nula.
b) Grafique y marque claramente las zonas de rechazo de la hipótesis nula.
15
-2,276 2,276
-4 -3 -2 -1 0 1 2 3 4
Como el t-test está a la derecha de valor crítico t = 2,276, se rechaza la hipótesis
nula.
Cuando se utiliza Excel se obtiene el siguiente valor crítico relacionado con el t-test:
P-valor = 0,0000 × 2 = 0,0000
no direccional.
 2 
µ ∈ 18 ± 2,326 x  → µ ∈ [17,5348;18, 4652]
 100 
73
Como se puede apreciar 15 no se encuentra en este intervalo, por lo que se rechaza

la hipótesis nula.
f) Nótese que en este caso no se asume que esta población se distribuya como una
normal. ¿Es este supuesto necesario a la luz del teorema del límite central?
Este supuesto no es necesario a la luz del teorema del límite central ya que el nú-
mero de observaciones en la muestra es mayor que 30.
12) Conlos datos de la pregunta 11, para un nivel de confianza del 95%, realice la si-
guiente prueba de hipótesis:
a) H0: µ > 20; H1: µ ≤ 20:
En este caso se emplea Excel y se obtiene t = −1,9842. Recuerde que en este caso la
región de rechazo se encuentra a la izquierda, por lo que solo se considera el valor
Paso 2: Calcular es t-test:
18 − 20
t − test = −10
=
2 100

Como el t-test está a la izquierda del valor crítico t = −1,9842, se rechaza la hipóte-
sis nula.
-10
-1,9842
-4 -3 -2 -1 0 1 2 3 4
Como el t-test está a la izquierda del valor crítico t = −1,9842, se rechaza la hipóte-
sis nula.
74

Se emplea Excel y se obtiene el siguiente valor crítico relacionado con el t-test:
P-valor = 0, 0000
nula.
13) Sise tienen los datos de la pregunta 11, para un nivel de confianza del 99%, realice la
siguiente prueba de hipótesis:
a) H0: µ < 10; H1: µ ≥ 10:
En este caso se usa Excel y se calcula el valor t = 2,6264. Recuerde que en este caso
la región de rechazo se encuentra a la derecha, por lo que solo se considera el valor
Paso 2: Calcular es t-test.
18 − 10
t − test
= = 40
2 100

Como el t-test está a la derecha del valor crítico t = 2,6264, se rechaza la hipótesis
nula.
b) Grafique y señale claramente las zonas de rechazo de la hipótesis nula.
40
2,6264
-4 -3 -2 -1 0 1 2 3 4
Como el t-test está a la derecha del valor crítico t = 2,6264, se rechaza la hipótesis
nula.
75

Se usa Excel se obtiene el siguiente valor crítico relacionado con el t-test:
P-valor = 0, 0000
e) Como el p-valor es menor que el nivel de significancia (0,01), se rechaza la hipótesis
nula.
14) Si se cuenta con la información sobre los precios de tickets aéreos desde la ciudad A
hasta la ciudad B, ofrecida por todas las líneas aéreas que prestan servicio entre dichas
ciudades. Se supone que la población de precios se distribuye como una normal con
desviación estándar conocida e igual a 20 U.M. Se toma arbitrariamente una muestra
de 25 precios cuya media muestral es igual a 180 U.M. Si el nivel de confianza deseado
es del 99%, pruebe la siguiente hipótesis:
a) H0: µ = 160; H1: µ ≠ 160:
En este caso se usa Excel y se logra z = 2,326 y z = −2,326.
180 − 160
z −=
test = 5, 00
20 25

Como el z-test está a la derecha del valores crítico z = 2,326, se rechaza la hipótesis
nula.
b) Grafique y señale claramente las zonas de rechazo de la hipótesis nula.
-2,326 2,326
-4 -3 -2 -1 0 1 2 3 4
Como el z-test está a la derecha del valores crítico z = 2,326, se rechaza la hipótesis
nula.
76

Se utiliza Excel para obtener el siguiente valor crítico relacionado con el z-test:
P-valor = 0,0000 × 2 = 0,0000
bservaciones solucionario capítulo
no06
direccional.
ág. Renglón e) Construya el intervaloDetalle

de confianza respectivo y utilícelo como criterio para decidir
77 9 si rechaza o no la hipótesis nula.
 20 
En la fórmula:   180  2,326      170, 696;189,304
 25 
Cambiar el signo
Comox después
se puede de 2,326160
apreciar porno
x en SymbolMT,
se encuentra en como está allípor lo que se rechaza
este intervalo,
en la fórmula la
puesta.
hipótesis nula.
84 13 Donde dice: De nuevo, 0,70 (el valor de la hipótesis nula), cae
f) Nótese que en este caso se supuso que esta población se distribuía como una nor-
Poner: De nuevo 0,70 (el valor de la hipótesis nula) cae (sin las dos , )
mal. ¿Es este supuesto necesario a la luz del teorema del límite central?
Sí, porque el tamaño de la muestra es menor que 30. Por lo tanto si no se asume que
la población es normal, no se podría haber resuelto el problema con las técnicas
enseñadas en el capítulo 6.
15) Con base en la pregunta 14, para un nivel de confianza del 95%, realice la siguiente
a) H0: µ > 190; H1: µ ≤ 190:
En este caso se tiene una prueba de hipótesis direccional con el área de rechazo a la
izquierda. Se utiliza Excel y se calcula z = −1,645.
180 − 190
z − test = −2,50
=
20 25

Como el z-test está esta a la izquierda del valor crítico z = −1,645, se rechaza la hi-
pótesis nula.
77
b) Grafique e indique las zonas de rechazo de la hipótesis nula.
-2,50 -1,645
-4 -3 -2 -1 0 1 2 3 4
Como el z-test (−2,50) está a la izquierda del valor crítico z = −1,645, se rechaza la
hipótesis nula.
En base al criterio del p-valor, ¿cuál es su decisión respecto a la hipótesis nula?
d)
P-valor = 0,00621
Este valor es menor que el nivel de significancia estadístico (0,05), por lo que se re-
16) Basadoen la pregunta 14, para un nivel de confianza del 99%, efectúe la siguiente
a) H0: µ < 150; H1: µ ≥ 150.
derecha. Se emplea Excel y se obtiene z = 2,326.
180 − 150
z −=
test = 7,50
20 25

Como el z-test está a la derecha del valor crítico z = 2,326, se rechaza la hipótesis
nula.
78
b) Grafique e indique las zonas de rechazo de la hipótesis nula.
7,50
2,326
-4 -3 -2 -1 0 1 2 3 4
Como el z-test (7,50) está a la derecha del valor crítico z = 2,326, se rechaza la hipó-
tesis nula.
P-valor = 0,000
Este valor es menor que el nivel de significancia estadístico (0,01), por lo que se re-
17) Serealizó una serie de “focus groups” para determinar el nivel de aprobación del sabor
de un nuevo producto que se desea introducir al mercado. Las opciones presentadas
fueron: aprueba el sabor o no la aprueba. El número total de personas participantes en
los grupos de discusión fue de 170, de las cuales 103 aprobaron el sabor. Si se supone
que éxito es la aprobación del sabor y un nivel de significancia estadístico del 5%, res-
ponda las siguientes preguntas y realice la siguiente hipótesis:
a) ¿Cuál es el valor de la proporción muestral de los sucesos?
103
p
= = 0, 61
170
b) ¿Se puede emplear la aproximación de la binomial usando la normal? (compruebe la
condiciones necesarias para que esto sea cierto).
Las condiciones son: (n × p) ≥ 5 y [n × (1 − p)] ≥ 5.
Por lo tanto, como 170 × (0,61) = 103,7 ≥ 5 y 170 × (1 - 0,61) = 66,3 ≥ 5, las con-
diciones son satisfechas para usar la aproximación normal.
c) H0: π = 0,60; H1: π ≠ 0,60:
79
En este caso se tiene una prueba de hipótesis no direccional con áreas de rechazo a
ambos lados de la distribución. Se emplea Excel y se obtiene z = 1,96 y z = −1,96.
0, 61 − 0, 60 0, 01
z − test= = = 0, 27
0, 61× (1 − 0, 61) 0, 037
170

Como el z-test está entre los valores crítico z = 1,96 y z = −1,96, no se rechaza la
hipótesis nula.
d) Grafique y muestre las zonas de rechazo de la hipótesis nula.
-1,96 0,27 1,96

-4 -3 -2 -1 0 1 2 3 4
e) En base al criterio del valor crítico, ¿cuál es su decisión respecto a la hipótesis nula?
Como el z-test está entre los valores crítico z = 1,96 y z = -1,96, no se rechaza la hi-
pótesis nula.
f)
P-valor = 0,39358 × 2 = 0,78716
Este valor es mayor que el nivel de significancia estadístico (0,05), por lo que no se
rechaza la hipótesis nula.
g) Construya el intervalo de confianza respectivo y utilícelo como criterio para decidir
El valor de z para un nivel de confianza del 95% es igual a 1,96, por lo que el inter-
valo de confianza para la proporción poblacional será:
 0, 61× (1 − 0, 61) 
π ∈ 0, 61 ± 1,96  → π ∈ [ 0,5367;0, 6833]
 170 

80
De nuevo, el valor de la hipótesis nula 0,60, cae en este intervalo por lo que la hipó-
tesis nula no se puede rechazar.
18) Tomelos datos de la pregunta 17 y para un nivel de confianza del 95%, realice la si-
a) H0: π > 0,50; H1: π ≤ 0,50.
izquierda. Se utiliza Excel y se obtiene z = −1,645.
0, 61 − 0,50 0,11
z − test= = = 2,97
0, 61× (1 − 0, 61) 0, 037
170

Como el z-test está a la derecha del valor crítico z = −1,645, no se rechaza la hipóte-
sis nula.
b) Grafique y señale las zonas de rechazo de la hipótesis nula.
2,97
-1,645
-4 -3 -2 -1 0 1 2 3 4
sis nula.
d)
P-valor = 0,9985
81
19) Partade los datos de la pregunta 17, para un nivel de confianza del 99%, haga la si-
a) H0: π < 0,70; H1: π ≥ 0,70:
derecha. Se usa Excel y se obtiene z = 2,326.
0, 61 − 0, 70 −0, 09
z − test = = −2, 4064
=
0, 61× (1 − 0, 61) 0, 0374
170

Como el z-test está a la izquierda del valor crítico z = 2,326, no se rechaza la hipó-
tesis nula.
b) Represente gráficamente y muestre las zonas de rechazo de la hipótesis nula.
-2,4064 2,326
-4 -3 -2 -1 0 1 2 3 4
tesis nula.
d)
P-valor = 0,9925
82
20) En
los últimos 3 ciclos académicos, el 60% de estudiantes del doctorado en finanzas
aprobaron al primer intento el examen del curso de métodos cuantitativos. Si la pre-
sente clase tiene 35 estudiantes, con un nivel de confianza del 95%, responda las si-
guientes preguntas y realice la siguiente hipótesis:
a) ¿Se puede utilizar la aproximación de la binomial empleando la normal (compruebe
la condiciones necesarias para que esto sea cierto)?
Las condiciones son: (n × p) ≥ 5 y [n × (1 − p)] ≥ 5.
Por lo tanto, como 35 × (0,60) = 21 ≥ 5 y 35 × (1 - 0,60) = 14 ≥ 5, las condiciones
son satisfechas para usar la aproximación normal.
La proporción de estudiantes de la presente clase que aprobará el examen de méto-
b)
dos cuantitativos en el primer intento será igual al 70%.
H0: π = 0,70; H1: π ≠ 0,70.
En este caso se tiene una prueba de hipótesis no direccional con áreas de rechazo a
ambos lados de la distribución. Se emplea Excel y se obtiene z = 1,96 y z = −1,96.
0, 60 − 0, 70 −0,10
z − test = = −1, 2077
=
0, 60 × (1 − 0, 60) 0, 0828
35

hipótesis nula.
c) Interprete gráficamente y señale las zonas de rechazo de la hipótesis nula.
-1,2077
-1,96 1,96
-4 -3 -2 -1 0 1 2 3 4
83
d) En base al criterio del valor crítico, ¿cuál es su decisión respecto a la hipótesis nula?
hipótesis nula.
e)
P-valor = 0,1131 × 2 = 0,2263
f) Construya el intervalo de confianza respectivo y utilícelo como criterio para decidir
El valor de z para un nivel de confianza del 95% es igual a 1,96, por lo que el inter-
valo de confianza para la proporción poblacional será:
 0, 60 × (1 − 0, 60) 
π ∈ 0, 60 ± 1,96  → π ∈ [ 0, 4377;0, 7623]
 35 

De nuevo 0,70 (el valor de la hipótesis nula) cae en este intervalo por lo que la hipó-
tesis nula no se puede rechazar.
21) Partade los datos de la pregunta 20, para un nivel de confianza del 95%, realice la si-
a) La proporción de estudiantes de la presente clase que aprobará el examen de méto-
dos cuantitativos en el primer intento será mayor al 60%.
H0: π > 0,60; H1: π ≤ 0,60.
En este caso se tiene una prueba de hipótesis direccional con área de rechazo a la
izquierda. Se usa Excel y se obtiene z = −1,645.
0, 60 − 0, 60 0, 00
z − test
= = = 0, 00
0, 60 × (1 − 0, 60) 0, 0828
35

sis nula.
84
b) Realice el gráfico y muestre las zonas de rechazo de la hipótesis nula.
0,00
-1,645
-4 -3 -2 -1 0 1 2 3 4
sis nula.
d)
P-valor = 0,50
Como el p-valor es mayor que el nivel de significancia (0,05), no se rechaza la hipó-
tesis nula.
22) Basado
en la pregunta 20, para un nivel de confianza del 99%, efectúe la siguiente
La proporción de estudiantes de la presente clase que aprobará el examen de méto-
a)
dos cuantitativos en el primer intento será de no más del 50%.
H0: π ≤ 0,50; H1: π > 0,50.
En este caso se tiene una prueba de hipótesis direccional con área de rechazo a la
derecha. Se emplea Excel y se calcula z = 2,326.
0, 60 − 0,50 0,10
z − test
= = = 1, 2077
0, 60 × (1 − 0, 60) 0, 0828
35

tesis nula.
85
-1,2077 2,326
-4 -3 -2 -1 0 1 2 3 4
tesis nula.
d)
P-valor = 0,11
tesis nula.
86
C a pí t ulo
Aplicaciones de la chi cuadrada
1) Se tiene una población distribuida normalmente y de la cual se toma una muestra de

20 elementos. Se calcula la desviación estándar muestral, obteniéndose s = 3,5. Si se
supone un nivel de confianza del 95%, realice la siguiente prueba de hipótesis de la va-
rianza poblacional:
l documento de Excel que acompaña a este ejercicio se llama “ capitulo7_ejercicio1_
E
chi_valores_criticos.xlsx”.
a) H0: σ 2 = 11; H1: σ 2 ≠ 11:
Paso 1: Determinar el valor de chi cuadrada.
Se recuerda que Excel provee la probabilidad desde el valor deseado hasta +∞. Por
lo tanto, para hallar el χ inf se tendrá que usar CHIINV(0,025;19) y para determinar
2
χ sup
2
CHIINV(0,975;19), donde 19 corresponde a los grados de libertad de este
ejemplo (n - 1 = 20 - 1 = 19). Los valores críticos que se obtendrán con Excel son
8,9065 y 32,8523, para el valor inferior y superior, respectivamente. Estos valores se
encuentran en la hoja “chi_cuadrada_tabla de valores”.
Paso 2: Calcular el chi-test.
En este paso simplemente se reemplazan los valores en la ecuación (4) para obtener
el estadístico.
87
(n − 1) × s 2 (20 − 1) × 3,52
χ 2 −=
test = = 21,1591
σ 02 11
Paso 3: Ubicar el chi-test y concluir.

Se recuerda que se está trabajando con una prueba no direccional y que, por lo
tanto, se tendrán dos aéreas de rechazo. Como se puede observar el chi-test cae en
medio de ambos valores críticos, por lo que no se rechazará la hipótesis nula.
α /2 = 0,025 α /2 = 0,025
Como se puede observar el chi-test cae en medio de ambos valores críticos, por lo
que no se rechazará la hipótesis nula.
d)
P-valor = 0,6561
tesis nula.
e) Construya el intervalo de confianza para la varianza poblacional y utilícelo para
rechazar o no la hipótesis nula.
(20 − 1) × (3,52 ) (20 − 1) × (3,52 )
≤σ ≤
2
→ 7, 085 ≤ σ 2 ≤ 26,133
32,8523 8,9065
88
capítulo 7 Estadística inferencial: Aplicaciones de la chi cuadrada
Como se puede apreciar el valor de la hipótesis nula (11) cae dentro del intervalo de
confianza, por lo que no se rechaza la hipótesis nula.
de hipótesis:
a) H0: σ 2 > 14; H1: σ 2 ≤ 14:
Se recuerda que Excel provee la probabilidad desde el valor deseado hasta +∞. En
este caso se tiene una prueba direccional con el área de rechazo a la izquierda. Al
utilizar Excel se obtiene usando CHIINV(0,90;19). El valor crítico que se obtiene
es 11,6509.
el estadístico.
(n − 1) × s 2 (20 − 1) × 3,52
χ 2 −=
test = = 16, 625
σ 02 14

Como se puede observar el chi-test cae a la derecha del valor crítico, por lo que no
se rechazará la hipótesis nula.
b) Grafique y demuestre las zonas de rechazo de la hipótesis nula.
89
Como se puede observar el chi-test cae a la derecha del valor crítico, por lo que no
d)
P-valor = 0,3847
tesis nula.
3) En base a los datos de la pregunta 1, para un nivel de confianza del 99%, realice la si-
a) H0: σ 2 ≤ 10; H1: σ 2 > 10:
Se recuerda que Excel provee la probabilidad desde el valor deseado hasta +∞. En
este caso se tiene una prueba direccional con el área de rechazo a la derecha. Con la
utilización de Excel se obtiene usando CHIINV(0,01;19). El valor crítico que se
obtiene es 36,1909.
el estadístico.
(n − 1) × s 2 (20 − 1) × 3,52
χ 2 −=
test = = 23, 275
σ 02 10

Como se puede observar el chi-test cae a la izquierda del valor crítico, por lo que no
b) Grafique y muestre las zonas de rechazo de la hipótesis nula.
90
Como se puede observar el chi-test cae a la izquierda del valor crítico, por lo que no
d)
P-valor = 0,2254
tesis nula.
4) Se tienen los balances de todos los bancos que operan en un determinado país. Se ha
observado que el valor de los activos sigue una distribución normal. Se toma una mues-
tra de 30 bancos y se calcula la varianza de la muestra. Esta varianza muestral es igual
a 459. Con un nivel de confianza del 90% realice la siguiente prueba de hipótesis de la
varianza poblacional:
l documento de Excel que acompaña a este ejercicio se llama “ capitulo7_ejercicio4_
E
chi_valores_criticos.xlsx”.
a) H0: σ 2 = 500; H1: σ 2 ≠ 500:
lo tanto, para hallar el χ inf
2
se tendrá que usar CHIINV(0,05;29) y para determinar
χ sup
2
CHIINV(0,95;29), donde 29 corresponde a los grados de libertad de este ejem-
plo (n - 1 = 30 - 1 = 29). Los valores críticos que se obtendrán con Excel son
17,7084 y 42,5570, para el valor inferior y superior, respectivamente
el estadístico.
(n − 1) × s 2 (30 − 1) × 459
χ 2 −=
test = = 26, 622
σ 02 500

Se recuerda que se está trabajando con una prueba no direccional y que, por lo
tanto, se tendrán dos aéreas de rechazo. Como se puede observar el chi-test cae en
medio de ambos valores críticos, por lo que no se rechazará la hipótesis nula.
91
Como se puede observar el chi-test cae en medio de ambos valores críticos, por lo
que no se rechazará la hipótesis nula.
d)
P-valor = 0,8156
tesis nula.
e) Construya el intervalo de confianza para la varianza poblacional y utilícelo para
rechazar o no la hipótesis nula.
(30 − 1) × 459 (30 − 1) × 459
≤σ2 ≤ → 312, 7805 ≤ σ 2 ≤ 751, 6772
42,5570 17, 7084
Como se puede apreciar el valor de la hipótesis nula (500) cae dentro del intervalo
de confianza, por lo que no se rechaza la hipótesis nula.
5) Con los datos de la pregunta 4, para un nivel de confianza del 95%, realice la siguiente
a) H0: σ 2 > 500; H1: σ 2 ≤ 500:
En este caso se tiene una hipótesis direccional con el área de rechazo a la izquierda.
lo tanto, para hallar el χ se tendrá que usar CHIINV(0,95;29), donde 29 corres-
2
ponde a los grados de libertad de este ejemplo (n - 1 = 30 - 1 = 29). El valor crítico

que se obtiene con Excel es 17,7084.
92

el estadístico.
(n − 1) × s 2 (30 − 1) × 459
χ 2 −=
test = = 26, 62
σ 02 500

Se recuerda que se está trabajando con una prueba direccional con área de rechazo
a la izquierda. Como se puede observar el chi-test cae a la derecha del valor crítico
(en la zona de no rechazo), por lo que no se rechazará la hipótesis nula.
a la izquierda. Como se puede observar el chi-test cae a la derecha del valor crítico
d)
P-valor = 0,4078
tesis nula.
de hipótesis:
a) H0: σ 2 ≤ 400; H1: σ 2 > 400:
93

En este caso se tiene una hipótesis direccional con el área de rechazo a la derecha.
lo tanto, para hallar el χ se tendrá que usar CHIINV(0,01;29), donde 29 corres-
2
ponde a los grados de libertad de este ejemplo (n - 1 = 30 - 1 = 29). El valor crítico

que se obtiene con Excel es 49,5879.
el estadístico.
(n − 1) × s 2 (30 − 1) × 459
χ 2 −=
test = = 33, 2775
σ 02 400

a la derecha. Como se puede observar el chi-test cae a la izquierda del valor crítico
b) Grafique y demuestre las zonas de rechazo de la hipótesis nula.
a la derecha. Como se puede observar el chi-test cae a la izquierda del valor crítico
94

d)
P-valor = 0,2666
tesis nula.
7) Se tiene la siguiente tabla de contingencias que relaciona el género con el aprobar o des-
aprobar un curso de métodos cuantitativos en una determinada universidad:
Tabla 15
Aprobó
Totales
Sí No
Femenino 25 14 39
Masculino 14 9 23
Totales 39 23 62
Asuma un nivel de confianza deseado del 95% y realice lo siguiente:

a) Pruebe la siguiente hipótesis:
H0: El que un estudiante apruebe el curso es independiente de su género.
H1: El que un estudiante apruebe el curso NO es independiente de su género.
Se advierte que en esta tabla el número de filas f = 2 y el número de columnas c = 2.
Esta tabla presenta los valores observados (Oij ). Para calcular el estadístico presen-
tado en la ecuación (6) se tienen que calcular los valores esperados (Eij ). Para esto se
necesita calcular pj , lo cual se hace de la siguiente manera:
39
p1
= = 0, 6290
62
23
p=
2 = 0,3710
62
Si en realidad las notas obtenidas por género son independientes, 62,90% de alum-
nos deberían aprobar el examen independientemente de su género. Asimismo,
37,10% de alumnos deberían desaprobar el examen independientemente de su gé-
nero. Basados en esto, la tabla de valores esperados (usando la ecuación (7)) será:
95
Tabla 15, a)
Marca Totales
CC PP
Promoción 0,629 × 39 = 24,53 0,371 × 39 = 14,47 39
No promoción 0,629 × 23 = 14,47 0,371 × 23 = 8,53 23
Totales 39 23 62
Si se reemplazan estos valores en la Ecuación (6), se obtendrá:

(25 − 24,53) 2 (14 − 14, 47) 2 (14 − 14, 47) 2 (9 − 8,53) 2
χ 2 − test = + + + = 0, 0654
24,53 14, 47 14, 47 8,53
Para seguir el procedimiento de las pruebas de hipótesis, se necesita conocer el valor

crítico de la distribución chi cuadrada con (f - 1) × (c - 1) grados de libertad. En
este caso este número será (2 - 1) × (2 - 1) = 1. El nivel de confianza es igual a
0,95, por lo que α será igual a 0,05. Al utilizar Excel, este valor crítico será igual a
3,8415.
b) En base al criterio del valor crítico, ¿cuál es su decisión respecto a la hipótesis nula?
Por lo tanto, como el valor del chi-test (0,0654) es menor que el valor crítico, no se
rechazará la hipótesis nula de independencia. Lo que significa que, dada la infor-
mación disponible, el que un alumno apruebe o no el examen es independiente de
su género.
c)
P-valor = 0,7982
Por lo tanto, como el p-valor es mayor que el nivel de significancia estadístico
(0,05), no se rechaza la hipótesis nula.
8) Se tiene el volumen negociado, durante el último año, de dos acciones similares cotiza-
das en dos bolsas de valores. Los datos se muestran en la siguiente tabla (los valores es-
tán expresados en millones de acciones):
Tabla 16
Bolsa de Valores Totales

A B
Acción 1 4,1 2,7 6,8
Acción 2 5,2 3,9 9,1
Totales 9,3 6,6 15,9
96
Asuma un nivel de confianza deseado del 95% y resuelva:

H0: El volumen de negociación es independiente de la Bolsa de Valores donde
se negocia la acción.
H1: El volumen de negociación NO es independiente de la Bolsa de Valores
donde se negocia la acción.

9,3
p1
= = 0,5849

15,9
6, 6
p2
= = 0, 4151

15,9
Si en realidad los volúmenes negociados son independientes, 58,49% debería de ser
negociados en la Bolsa de Valores A y el 41,51% en la Bolsa de Valores B. Basados
en esto, la tabla de valores esperados (usando la ecuación (7)) será:
Tabla 16, a)
Bolsa de Valores
Totales
A B
Acción 1 0,5849 × 4,1 = 2,398 0,4151 × 2,7 = 1,121 6,8
Acción 2 0, 5849 × 5,2 = 3,041 0,4151 × 3,9 = 1,619 9,1
Totales 9,3 6,6 15,9
Si se reemplazan estos valores en la Ecuación (6), se obtendrá:

(4,1 − 2,398) 2 (2, 7 − 1,121) 2 (5, 2 − 3, 041) 2 (3,9 − 1, 619) 2
χ 2 − test
= + + + = 8,1786
2,398 1,121 3, 041 1, 619

crítico de la distribución chi cuadrada con (f - 1) × (c - 1) grados de libertad. En este
caso este número será (2 - 1) × (2 - 1) = 1. El nivel de confianza es igual a 0,95, por
lo que α será igual a 0,05. Si se utiliza Excel, este valor crítico será igual a 3,8415.
Como el valor del chi-test (8,1786) es mayor que el valor crítico, se rechazará la hi-
pótesis nula de independencia. Lo que significa que, dada la información disponi-
ble, el volumen negociado dependerá de la Bolsa de Valores donde se negocien las
acciones.
97

c)
P-valor = 0,0042
Por lo tanto, como el p-valor es menor que el nivel de significancia estadístico
(0,05), se rechaza la hipótesis nula.
9) En base a los valores presentados en la tabla 2 y asumiendo un nivel de significancia
estadística del 1%, realice lo siguiente:
H0: El volumen de negociación es independiente de la acción negociada.
H1: El volumen de negociación NO es independiente de la acción negociada.
9,3
p1
= = 0,5849
15,9
6, 6
p2
= = 0, 4151
15,9
Si en realidad los volúmenes negociados son independientes, 58,49% debería de ser

negociados en la Bolsa de Valores A y el 41,51% en la Bolsa de Valores B. Basados
en esto, la tabla de valores esperados (usando la ecuación (7)) será:
Tabla 16, b)
Bolsa de Valores
Totales
A B
Acción 1 0,5849 × 4,1 = 2,398 0,4151 × 2,7 = 1,121 6,8
Acción 2 0,5849 × 5,2 = 3,041 0,4151 × 3,9 = 1,619 9,1
Totales 9,3 6,6 15,9
Al reemplazar estos valores en la Ecuación (6), se obtendrá:

(4,1 − 2,398) 2 (2, 7 − 1,121) 2 (5, 2 − 3, 041) 2 (3,9 − 1, 619) 2
χ 2 − test
= + + + = 8,1786
2,398 1,121 3, 041 1, 619

crítico de la distribución chi cuadrada con (f - 1) × (c - 1) grados de libertad. En
este caso este número será (2 - 1) × (2 - 1) = 1. El nivel de confianza es igual a
0,99, por lo que α será igual a 0,01. Si se emplea Excel, este valor crítico será igual a
6,6349.
98
Al ser el valor del chi-test (8,1786) mayor que el valor crítico, se rechazará la hipóte-
sis nula de independencia. Lo que significa que, dada la información que se dis-
pone, el volumen negociado dependerá de la Bolsa de Valores donde se negocien las
acciones.
c)
P-valor = 0,0042
(0,01), se rechaza la hipótesis nula.
10) Setiene la siguiente tabla de frecuencias en la que se presentan las ventas de todas las
tiendas que son parte de una determinada cadena:
Tabla 17
Ventas
Número de tiendas
(En cientos de miles de U.M.)
<25 2
[25,35) 8
[35,45) 12
[45,55) 14
[55,65) 11
[65,75) 7
>75 1
Se supone que la media y la desviación estándar calculadas a partir de la muestra son

iguales a 52 y 10, respectivamente. Asuma que el nivel de confianza deseado es del
90%.
a) Se siguen los pasos descritos en el capítulo, probar la siguiente hipótesis:
H0: La muestra proviene de una distribución normal.
H1: La muestra NO proviene de una distribución normal.
Paso 1: Poner la información en una sola fila e identificar los límites de las clases.
De ser necesario juntar las clases con menos de 5 observaciones.
Tabla 17, a)
<25 [25,35) [35,45) [45,55) [55,65) [65,75) >75

2 8 12 14 11 7 1
99
Se puede observar que las clases de los extremos tienen valores menores a 5, por lo
que se deben juntar con las observaciones adyacentes a las mismas:
Tabla 17, b)
<35 [35,45) [45,55) [55,65) >65

8 + 2 = 10 12 14 11 7+1=8
Paso 2: Convertir los límites en términos de valores estandarizados (z).

En este ejemplo µ es 52 y 10. A continuación convertir los límites en términos de z:
35 45 55 65
| | | |
-1,70 -0,70 0,30 1,30
35 − 52 45 − 52 55 − 52 65 − 52
10 10 10 10
Paso 3: Calcular las probabilidades relacionadas a estos valores z.

Se emplea Excel para obtener las probabilidades con la función DISTR.NORM.
ESTAND y se tendrán:
P ( z < − 1, 70 ) =0, 0446
P ( −1, 70 ≤ z ≤ −=
0, 70 ) 0, 2420 − 0,=
0446 0,1974

P ( −0, 70 ≤ z ≤ 0,30
= ) 0, 6179 − 0, 2420
= 0,3759

P ( 0,30 ≤ z ≤ 1,30
= ) 0,9032 − 0, 6179
= 0, 2853

P ( z > 1,30 ) =
1 − 0,9032 =
0, 0968

Paso 4: Calcular los valores esperados (Ei ).

Los valores esperados (para cada clase) se calculan simplemente multiplicando la
probabilidad de cada clase por el número total de observaciones en la muestra.
Los valores esperados se muestran en la siguiente tabla:
Tabla 17, c)
<35 [35,45) [45,55) [55,65) >65

2,453 10,857 20,675 15,692 5,324
100
Como se puede observar en esta tabla existen valores menores que 5, por lo que se
debe ajustar las tablas 17, b) y 17, c) de la siguiente manera:
Tabla 17, d)
<45 [45,55) [55,65) >65

22 14 11 7+1=8
Tabla 17, e)
<45 [45,55) [55,65) >65

13,31 20,675 15,692 5,324
La tabla 17, d) corresponde a los valores observados y la tabla 17, e) a los valores es-
perados.
Paso 5: Proceder con la prueba de hipótesis.
Una vez que se tienen la tabla con los valores esperados, se procede a calcular el chi-
test de bondad de ajuste, presentado en la ecuación (8):
(22 − 13,31) 2 (14 − 20, 675) 2 (11 − 15, 692) 2 (8 − 5,324) 2
χ=
2
− test + + + = 10,577
13,31 20, 675 15, 692 5,324
Ahora, se procederá a encontrar el valor crítico basado en una chi cuadrada con
(c – m – 1) grados de libertad. En este caso, el número de parámetros de la distribu-
ción normal estimados a partir de la muestra es igual a 2 (m = 2). El número final
de columnas en la tabla es 4 (c = 4). Por lo tanto, los grados de libertad serán iguales
a 1 (4 - 2 - 1). Se usa Excel para obtener el valor crítico que será igual a 2,7055.
En este caso, el chi-test = 10,577 es mayor que 2,7055. Por lo que se rechaza H0, lo
que significa que la muestra no proviene de una distribución normal.
En este caso, el chi-test = 10,577 es mayor que 2,7055. Por lo tanto, se rechaza H0,
lo que significa que la muestra no proviene de una distribución normal.
c)
P-valor = 0,0012
Como el p-valor es menor que el nivel de significancia del 10%, se rechaza la hipó-
tesis nula.
11) Basadoen la pregunta 10, solo la desviación estándar ha sido calculada a partir de los
datos de la muestra y es igual a 10.
101
a) Se desea probar la siguiente hipótesis (con un nivel de confianza del 95%).

H0: La muestra proviene de una distribución normal con media 50.
H1: La muestra NO proviene de una distribución normal con media 50.
Tabla 17, f)
<25 [25,35) [35,45) [45,55) [55,65) [65,75) >75

2 8 12 14 11 7 1
que se debe juntar con las observaciones adyacentes a las mismas:
Tabla 17, g)
<35 [35,45) [45,55) [55,65) >65

8 + 2 = 10 12 14 11 7+1=8

En este ejemplo µ es 50 y la desviación estándar de 10. A continuación convertir los
límites en términos de z:
35 45 55 65
| | | |
-1,50 -0,50 0,50 1,50
35 − 50 45 − 50 55 − 50 65 − 50
10 10 10 10

Se emplea Excel para obtener las probabilidades, se tendrán:
P ( z < − 1,50 ) =0, 0668

P ( −1,50 ≤ z ≤ −0,50
= ) 0,3085 − 0,=
0668 0, 2417

P ( −0,50 ≤ z ≤ 0,50
= ) 0, 6915 − 0,3085
= 0,383

P ( 0,50 ≤ z ≤ 1,50
= ) 0,9332 − 0, 6915
= 0, 2417

P ( z > 1,50 ) =
1 − 0,9332 =
0, 0668

102

Tabla 17, h)
<35 [35,45) [45,55) [55,65) >65

3,674 13,294 21,065 13,294 3,674
debe ajustar las tablas 17, g) y 17, h) de la siguiente manera:
Tabla 17, i)
<45 [45,55) >55

22 14 19
Tabla 17, j)
[35,45) [45,55) [55,65)

16,968 21,065 16,968
La tabla 17, i) corresponde a los valores observados y la tabla 17, j) a los valores espe-
rados.
(22 − 16,968) 2 (14 − 21, 065) 2 (19 − 16,968) 2
χ − test
= 2
+ + = 4,105
16,968 21, 065 16,968
Ahora, se procederá a encontrar el valor crítico basados en una chi cuadrada con
ción normal estimados a partir de la muestra es igual a 1 (m = 1), recordar que solo
se ha estimado la desviación estándar. El número final de columnas en la tabla es 3
(c = 3). Por lo tanto los grados de libertad serán iguales a 1 (3 - 1 - 1). Al usar Excel
el valor crítico será igual a 3,8415.
En este caso chi-test = 4,105 es mayor que 3,8415. Por lo tanto, se rechaza H0, lo
que significa que la muestra no proviene de una distribución normal.
103
En este caso, el valor del chi-test = 4,105 es mayor que 3,8415. Por lo tanto, se re-
chaza H0, lo que significa que la muestra no proviene de una distribución normal.
c) En base al criterio del p-valor, ¿cuál es su decisión respecto a la hipótesis nula?
P-valor = 0,043
Como el p-valor es menor que el nivel de significancia del 5%, se rechaza la hipóte-
sis nula.
12) Con los datos de la pregunta 10, asuma que trabaja con un nivel de confianza del 95%:
a) Se desea probar la siguiente hipótesis:
H0: La muestra proviene de una distribución normal con media 50 y desviación
estándar de 4.
H1: La muestra NO proviene de una distribución normal con media 50 y
desviación estándar de 4.
Tabla 17, i)
<25 [25,35) [35,45) [45,55) [55,65) [65,75) >75

2 8 12 14 11 7 1
que se debe juntar con las observaciones adyacentes a las mismas:
Tabla 17, j)
<35 [35,45) [45,55) [55,65) >65

8 + 2 = 10 12 14 11 7+1=8

En este ejemplo, µ es 50 y la desviación estándar es 4. A continuación convertir los
límites en términos de z:
35 45 55 65
| | | |
-3,75 -1,25 1,25 3,75
35 − 50 45 − 50 55 − 50 65 − 50
4 4 4 4
104

Al utilizar Excel para obtener las probabilidades se tendrán:
P ( z < − 3, 75 ) =0, 0001
P ( −3, 75 ≤ z ≤ −1,
= 25 ) 0,1056 − 0,=
0001 0,1055

P ( −1, 25 ≤ z ≤ 1,=
25 ) 0,8944 − 0,1056
= 0, 7888

P (1, 25 ≤ z ≤ 3, 75=
) 1, 000 − 0,8944
= 0,1056

P ( z > 3, 75 ) =
1 − 0,9999 =
0, 0001

Tabla 17, k)
<35 [35,45) [45,55) [55,65) >65

0,00 5,80 43,38 5,80 0,00
debe ajustar las tablas 17, b) y 17, c) de la siguiente manera:
Tabla 17, l)
<45 [45,55) >55

22 14 19
Tabla 17, m)
<45 [45,55) >55

5,80 43,38 5,80
La tabla 17, l) corresponde a los valores observados y la tabla 17, m) a los valores es-
perados.
105

(22 − 5,80) 2 (14 − 43,38) 2 (19 − 5,80) 2
χ 2 − test = + + = 45, 2 + 19,9 + 30, 0 = 95,1
5,80 43,38 5,80
Ahora se procederá a encontrar el valor crítico basado en una chi cuadrada con
ción normal estimados a partir de la muestra es igual a 0 (m = 0). El número final
de columnas en la tabla es 3 (c = 3). Por lo tanto los grados de libertad serán iguales
a 2 (3 - 0 - 1). En base a esto el valor crítico será igual a 5,9915.
En este caso chi-test = 95,1 es mayor que 5,9915. Por lo tanto, se rechaza H0, lo que
significa que la muestra no proviene de una distribución normal con media 50 y
desviación estándar 4.
En este caso, se observa que el chi-test = 95,1 es mayor que 5,9915. Por lo tanto, se
rechaza H0, lo que significa que la muestra no proviene de una distribución normal
con media 50 y desviación estándar 4.
c)
P-valor = 0,00
(0,05), se rechazará la hipótesis nula.
13) Sise está interesado en saber si una variable sigue una distribución uniforme con pará-
metros a = 1, b = 6. Los valores observados se encuentran en la siguiente tabla:
Tabla 18
Intervalo Frecuencia
[1,2) 40
[2,3) 42
[3,4) 43
[4,5) 39
[5,6] 41
a) Basado en estos datos y asumiendo un nivel de confianza del 95%, ¿se podría afir-
mar que la variable aleatoria se distribuye como una distribución uniforme con pa-
rámetros a = 1, b = 6?
del rectángulo (ver el capitulo 4). Este estará dado por:
106
1 1
= = 0, 20
(b − a ) (6 − 1)
H0: La muestra proviene de una distribución uniforme con parámetros

a = 1, b = 6.
H1: La muestra NO proviene de una distribución uniforme con parámetros
a = 1, b = 6.
Por lo tanto, si los datos siguen una distribución uniforme, la probabilidad será la
misma independientemente del intervalo. Con esto en mente, la tabla de valores es-
perados será:
Tabla 18, a)
Intervalo [1,2) [2,3) [3,4) [4,5) [5,6]

Valor esperado 205 × 0,2 = 41 41 41 41 41
Una vez calculada la tabla con los valores esperados, se utiliza la ecuación (8) para
determinar el chi-test:
c
(Oi − Ei ) 2 (40 − 41) 2 (42 − 41) 2 (43 − 41) 2 (39 − 41) 2 (41 − 41) 2
χ 2 − test = ∑ = + + + +
i =1 Ei 41 41 41 41 41
χ 2 − test =
0, 2439
Ahora falta calcular el valor crítico de la distribución chi cuadrada con (k − m − 1)

grados de libertad. En este caso, no se ha calculado ningún parámetro a partir de la
muestra, por lo que m será igual a 0. Por lo tanto, se buscará el valor de una chi
cuadrada con 5 - 1 = 4 grados de libertad y un nivel de significancia de 0,05. Con
el uso de Excel el valor crítico de la prueba será igual a 9,4877.
Como se puede observar el chi-test cae en la zona de no rechazo, por lo que no se
puede rechazar la hipótesis nula y se podrá afirmar que efectivamente la muestra
puede provenir de una población que se distribuye uniformemente.
Como se puede observar, el chi-test cae en la zona de no rechazo, por lo que no se
puede rechazar la hipótesis nula y se podrá afirmar que efectivamente la muestra
puede provenir de una población que se distribuye uniformemente.
c)
P-valor = 0,8852
Como el p-valor es mayor que 0,05, no se rechaza la hipótesis nula.
107
14) Se tiene datos diarios sobre las personas que compran un determinado producto al visi-
tar una tienda de una cadena comercial. Los datos se presentan en la siguiente tabla:
Tabla 19
Cantidad comprada Promedio de compras diarias

0 24
1 58
2 44
3 31
4 18
5 6
6 1
a) Con estos datos y asumiendo un nivel de confianza del 95%, ¿se podría afirmar
que la variable aleatoria se distribuye como una Poisson?
Las hipótesis a testear serán:
H0: La muestra proviene de una distribución de Poisson.

H1: La muestra NO proviene de una distribución de Poisson.
Al igual que en los casos anteriores se determinan los valores esperados (Ei ). En este
caso, lo primero que se debe recordar es que para poder determinar una distribu-
ción de Poisson se necesita conocer λ, que es simplemente igual al valor esperado de
eventos en un determinado intervalo. En este caso se cuenta con una muestra, por
lo que se aproximará este parámetro con la media muestral.
0 × 24 + 1× 58 + ... + 6 ×1
λ= x= = 1,9066 ≅ 2
182
Dada esta información se procederá a emplear la tabla de la distribución de Poisson
presentada en el apéndice del libro. Se busca la columna que corresponda a λ = 2 y
se procede a calcular los valores esperados como se muestra en la Tabla
Tabla 19, a)
Cantidad Comprada Probabilidad Total de observaciones × Probabilidad (Ei )

0 0,13534 182 × 0,1353 = 24,632
1 0,27067 49,262
2 0,27067 49,262
3 0,18045 32,842
4 0,09022 16,420
5 0,03609 6,568
≥6 0,01203 3,014
108
Si se emplea la información de la tabla 19 (valores observados) y la tabla 19, a) (valo-

res esperados), se procede a calcular el chi-test:
(Oi − Ei ) 2 (24 − 24, 632) 2 (58 − 49, 262) 2
c
(1 − 3, 014) 2
χ − test ∑ =
= 2
+ + ... +
i =1 Ei 24, 632 49, 262 3, 014
χ 2 − test =
3, 778
Para hallar el valor crítico se necesitan los grados de libertad. En este caso será igual
a (c - m - 1) = (7 - 1 - 1) = 5. Así, m = 1, ya que se calcula la media de la distribu-
ción (λ) a partir de los datos de la muestra.
Con el uso de Excel se obtiene 11,0705.
Como se observa, el chi-test (3,778) está a la izquierda del valor crítico, por lo que
no se rechaza la hipótesis nula y se concluye que, dada la información disponible, la
muestra puede provenir de una distribución de Poisson.
c)
P-valor = 0,5818
Por lo tanto, no se rechaza la hipótesis nula.
15) Con los datos presentados en la tabla 14, responda:
a) Si asume un nivel de confianza del 99%, ¿se podría afirmar que la variable aleatoria
se distribuye como una Poisson con media λ = 2?
Las hipótesis a testear serán:
H0: La muestra proviene de una distribución de Poisson con media λ = 2.

H1: La muestra NO proviene de una distribución de Poisson con media λ = 2
Se busca la columna que corresponda a λ = 2 y se procede a calcular los valores es-

perados como se muestra en la Tabla.
109
Tabla 19, a)
Cantidad Comprada Probabilidad Total de observaciones × Probabilidad (Ei )

0 0,13534 182 × 0,1353 = 24,632
1 0,27067 49,262
2 0,27067 49,262
3 0,18045 32,842
4 0,09022 16,420
5 0,03609 6,568
≥6 0,01203 3,014
Si se emplea la información de la tabla 19 (valores observados) y la tabla 19, a) (valo-

res esperados), se procede a calcular el chi-test:
(Oi − Ei ) 2 (24 − 24, 632) 2 (58 − 49, 262) 2
c
(1 − 3, 014) 2
χ − test ∑ =
= 2
+ + ... +
i =1 Ei 24, 632 49, 262 3, 014
χ 2 − test =
3, 778
Para hallar el valor crítico se necesitan los grados de libertad. En este caso será igual
a (c - m - 1) = (7 - 0 - 1) = 6. En este caso m = 0 ya que NO se calcula la media
de la distribución (λ) a partir de los datos de la muestra.
Al emplear Excel se obtiene 12,5916.
c)
P-valor = 0,5818
Por lo tanto, no se rechaza la hipótesis nula.
110
C a pí t ulo
Fundamentos de álgebra lineal
Se tienen las siguientes matrices:

2 1 3 7 5 2 9 4
4 −1 1 9 3 0
A= C 8 −5 3 , D =
, B= 3 0 ,= , E= 9 0 8
2 3 5 6 4 2
1 5 2 0 7 4 8 7
1) Demuestre, usando las matrices presentadas anteriormente:

a) ( A + D ) ' =( A '+ D ')
4 −1 1 9 3 0 13 2 1
A+ D
= + =
2 3 5 6 4 2 8 7 7
13 8
( A + D) ' =2 7
1 7

Y,
4 2 9 6 13 8
A '+ D ' =−1 3 + 3 4 =2 7
1 5 0 2 1 7

111
b) ( A × B ) ' =( B '× A ')

2 1
4 −1 1 6 9
A× B
= 3 0
×=
2 3 5 18 27
1 5

6 18
( A × B) ' =
9 27
Y
4 2
2 3 1 6 18
(=
B '× A ') −1 3
×=
1 0 5 9 27
1 5
c) C × I = I × C = C , donde I es la matriz identidad de orden 3.
3 3 3
3 7 5 1 0 0 3 7 5
C × I 3 = 8 −5 3 × 0 1 0 = 8 −5 3 = C
2 0 7 0 0 1 2 0 7

1 0 0 3 7 5 3 7 5
I 3 × C =0 1 0 × 8 −5 3 =8 −5 3 =C
0 0 1 2 0 7 2 0 7

d) tr ( C ) = tr ( C ')
3 7 5
 
Tr (C ) = Tr  8 −5 3  = 3 − 5 + 7 = 5
2 0 7
 
Y
3 8 2
 
Tr (C ') = Tr  7 −5 0  = 3 − 5 + 7 = 5
5 3 7
 
112
capítulo 8 Fundamentos de álgebra lineal
e) tr ( C × E )= tr ( E × C )
3 7 5 2 9 4 89 67 103
C × E =8 −5 3 × 9 0 8 =−17 96 13
2 0 7 4 8 7 32 74 57

 89 67 103 
 
Tr (C × E ) = Tr  −17 96 13  = 89 + 96 + 57 = 242
 32 74 57 
 
Y
2 9 4 3 7 5 86 −31 65
E ExC
= × C 9 0 8 8 −=
5 3 43 63 101
4 8 7 2 0 7 90 −12 93

 86 −31 65 
 
Tr ( ExC
Tr(E × C )) = Tr  43 63 101  = 86 + 63 + 93 = 242
 90 −12 93 
 
f) tr ( C + E=
) tr ( C ) + tr ( E )
3 7 5 2 9 4 5 16 9
C + E = 8 −5 3 + 9 0 8 = 17 −5 11
2 0 7 4 8 7 6 8 14

 5 16 9 
 
Tr (C + E ) = Tr  17 −5 11  = 5 − 5 + 14 = 14
 6 8 14 
 
Y
3 7 5 2 9 4
   
Tr (C ) + Tr ( E ) = Tr  8 −5 3  + Tr  9 0 8  = (3 − 5 + 7) × (2 + 0 + 7) = 14
2 0 7 4 8 7
   
¿Es la matriz E una matriz simétrica?
g)
Sí.
113
2) Multiplique:
a) A× D '
9 6
4 −1 1 33 22
A=
×D' 3 4
×=
2 3 5 27 34
0 2

b) 3× C
3 7 5 9 21 15
3 × C =3 × 8 −5 3 = 24 −15 9
2 0 7 6 0 21

c) B×C
2 1 3 7 5
B×=
C 3 0 × 8 −5 3
1 5 2 0 7

Se puede apreciar que las matrices no son conformables, por lo que esta multiplica-
ción no se puede realizar.

a hoja Excel con estos cálculos es “capitulo8_ejercicio3_multip_matrices.xlsx”. El pri-
L
mer caso se encuentra en la hoja a) y el segundo en la b).
114
4) Calcule el determinante de C usando el método de Sarrus y usando Excel.

3 7 5
8 −5 3
det(C ) =2 0 7 =−105 + 0 + 42 − (−50 + 0 + 392) =−405
3 7 5
8 −5 3
El ejercicio usando Excel se llama “capitulo8_ejercicio4_determinante.xlsx”.
5) Basado en su respuesta a la pregunta 4, ¿es C una matriz singular?

No, porque el determinante de C es distinto de cero.
6) Determine la matriz inversa de E usando la fórmula presentada en el capítulo y usando
Excel.
Primero, se calcula la matriz de cofactores:
t
 −64 31 72  −64 31 72
 
cof ( E=
)  31 −2 −20 = 31 −2 −20
 72 −20 −81  72 −20 −81
 
Advierta que la matriz es simétrica por lo que su transpuesta será la misma.
S e calcula la matriz adjunta:
−64 −31 72
adj ( E ) =−31 −2 20
72 20 −81

115
Se calcula el det(E) por medio de Excel y da -119. Por lo tanto, la inversa de E será:
−64 −31 72
−31 −2 20
0,54 0, 26 0, 61
−1 72 20 −81
=(E) = 0, 26 0, 02 −0,17
−119
−0, 61 −0,17 0, 68
La hoja Excel que contiene la solución de este ejercicio se llama: “capitulo8_ejercicio6_

inversa.xlsx”.

7) Demuestre usando las matrices presentadas:

a) E −1 × E = E × E −1 = I n
0,54 0, 26 0, 61 2 9 4 1 0 0
−1
= ( E ) × E 0, 26 0, 02 −0,17=×9 0 8 0 1 0
−0, 61 −0,17 0, 68 4 8 7 0 0 1

Y
2 9 4 0,54 0, 26 0, 61 1 0 0
−1
E × ( E=
) 9 0 8 × 0, 26 0, 02 −0,17
= 0 1 0
4 8 7 −0, 61 −0,17 0, 68 0 0 1

(E )
−1
−1
b) =E
−1
 0,54 0, 26 0, 61  2 9 4
−1 −1  
( E ) =  0, 26 0, 02 −0,17  = 9 0 8 = E
 −0, 61 −0,17 0, 68  4 8 7
 
116
c) (C × E )
−1
(
= E −1 × C −1 )
3 7 5 2 9 4 89 67 103
C × E =8 −5 3 × 9 0 8 =−17 96 13
2 0 7 4 8 7 32 74 57

0, 094 0, 079 −0,187
−1
= (C × E ) 0, 029 0, 037 −0, 060
−0, 089 −0, 092 0, 201

Y
0,54 0, 26 0, 61 0, 086 0,121 −0,114
−1 −1
E × C ) 0, 26 0, 02 −0,17 × 0,124 −0, 027 −0, 077
(=
−0, 61 −0,17 0, 68 −0, 025 −0, 035 0,175

0, 094 0, 079 −0,187
−1 −1
( E × C ) =0, 029 0, 037 −0, 060 =(C × E ) −1
−0, 089 −0, 092 0, 201

d) ( E ') −1 = ( E −1 ) '
En este caso E es una matriz simétrica por lo que E’ = E y, por lo tanto, se cumple
la pregunta d).
8) Resuelva el siguiente sistema de ecuaciones:
 x1 − 2 x2 + 4 x3 =
20

2 x1 + x2 + 3 x3 =15
3 x − x + 6 x = 23
 1 2
3
1 −2 4 x1 20
2 1 3 × x2 =
15
3 −1 6 x3 23

−1
x1  1 −2 4  20
 
= x2  2 1 3  × 15
x  3 −1 6  23
3  
117
A l calcular la matriz inversa se obtienen los siguientes resultados:

x1 −1,8 −1, 6 2, 0 20 −14
= x2 0, 60 1, 20 −=
1, 0 × 15 7
x 1, 0 1, 0 −1, 0 23 12
3
La solución se ubica en “capitulo8_ejercicio9_sistema_ecuaciones.xlsx”.
10) Suponga que se tiene la siguiente matriz:

1 1 0
1 1 0
F=1 1 0
1 0 1
1 0 1
¿Es la matriz F no singular?

a)
No.
b) ¿Puede determinar las causas de la dependencia lineal?
Existe dependencia lineal entre las columnas de la matriz. En este caso la primera
columna de F es igual a la suma de las columnas 2 y 3.
11) Dado el siguiente sistema de ecuaciones en forma matricial:
y1 x1 2 9 4 x1
y2 =E × x2 =9 0 8 × x2
y3 x3 4 8 7 x3

Calcule ∂Y / ∂X .
Como se tiene Y= E × X
118
∂y1 ∂y1 ∂y1

∂x1 ∂x2 ∂x3
2 9 4
∂Y ∂y2 ∂y2 ∂y2
= = 9= 0 8 E
∂X ∂x1 ∂x2 ∂x3
4 8 7
∂y3 ∂y3 ∂y3
∂x1 ∂x2 ∂x3

12) Dado el siguiente sistema de ecuaciones en forma matricial:
3 7 5 x1
=Y x1 x2 x3 × 8 −5 3 × x2
2 0 7 x3
Calcule ∂Y / ∂X .
Como se tiene Y = X '× A × X
∂Y
La solución será igual a = 2× A× X
∂X
3 7 5 x1 6 14 10 x1
Y =×
2 8 −5 3 × x2 =16 −10 6 × x2
2 0 7 x3 4 0 14 x3
119
C a pí t ulo
El modelo de mínimos cuadrados

ordinarios (MCO) univariado
1) Describa los componentes de la ecuación de la recta (el intercepto y la pendiente).

yi = α + β × xi + ε i
En este caso α representa el intercepto y β la pendiente. El intercepto puede entenderse

como el valor que toma y en la ausencia de x. Un β positivo (negativo) indica que la re-
lación entre y y x es positiva (negativa), es decir, que si x se incrementa y, también, se
incrementará (disminuirá). El valor que tome β indicará la fuerza en la relación. Cuanto
mayor sea el valor de β en valor absoluto, mayor será la fuerza de la relación entre las
variables.
2) ¿Qué información se obtiene de la pendiente, en términos de su signo y magnitud?
Un β positivo (negativo) indica que la relación entre y y x es positiva (negativa), es decir,
que si x se incrementa y, también, se incrementará (disminuirá). El valor que tome β
indicará la fuerza en la relación. Cuanto mayor sea el valor de β en valor absoluto, ma-
yor será la fuerza de la relación entre las variables.
3) ¿Existe alguna relación entre la pendiente y el coeficiente de correlación?
Básicamente proporcionan la misma información. Se recuerda que el coeficiente de co-
rrelación mide la dependencia lineal entre dos variables. El rango de posibles valores va
entre −1 (perfecta correlación negativa) hasta 1 (perfecta correlación positiva). Cuando
el coeficiente de correlación entre dos variables es positivo (negativo) indica que la rela-
121
ción entre y y x es positiva (negativa), es2 decir, que si x se incrementa y también se incre-
mentará (disminuirá). Asimismo, cuando más cerca a 1 en valor absoluto, mayor será la
fuerza de la relación entre las variables. Como se puede observar, la información de β y
del coeficiente
Si beta es cero,de correlación
significa queesnola hay
misma.dependencia lineal.
4) Si β = 0, ¿se espera que el coeficiente de correlación sea igual a 0? Fundamente su res-
5) Si se tienen las siguientes dos ecuaciones:
puesta.
Si beta es cero, significa que no hay dependencia lineal.
y  1  1,5 x
5) Si se tienen las siguientes dos ecuaciones:
yy = 11 4,5 xx
+ 1,5
a) ¿En cuál de ellas la variable y = x1 +ejerce

4,5 x más influencia sobre la variable
dependiente y?
a) ¿En cuál de ellas la variable x ejerce más influencia sobre la variable dependiente y?
EnEn
el el
segundo
segundo caso,
caso, yayaque
queβ =β4,5
= 4,5
y esymayor
es mayor que 1,5.
que 1,5.
b) Grafique ambas ecuaciones para sustentar su respuesta en la parte a).
b) Grafique ambas ecuaciones para sustentar su respuesta en la parte a).
300
250
200
y 150
100
50
0
1 2 3 4 5 6 7
x
y=1+1,5 x y=1+4,5 x
6) ¿Por qué se introduce un término de error en la ecuación lineal?

6) ¿Por qué se introduce un término de error en la ecuación lineal?
Lo Lo
primero
primeroque
quesese tiene quetener
tiene que tener
en en cuenta
cuenta eslaque
es que línealarecta
línea
norecta no es la
es la descripción
descripción
perfecta deperfecta
los eventosdeobservados,
los eventos observados,
es decir, es decir, existirán errores.
existirán errores.
7) ¿Es posible utilizar el modelo de MCO en la siguiente ecuación?
7) ¿Es posible utilizar el modelo de MCO en la siguiente ecuación?
yi =α + β1 × x1,i + β 2 × x2,i + β 3 × x1,i × x2,i + ε i
yi   1  x1,i  2  x2,i  3  x1,i  x2,i   i
Sí, porque el modelo es lineal en los coeficientes.
Sí, porque el modelo es lineal en los coeficientes.
8)
122 ¿Cuál es el criterio del modelo de MCO para estimar los coeficientes de la
ecuación?
capítulo 9 El modelo de mínimos cuadrados ordinarios (MCO) univariado
8) ¿Cuál es el criterio del modelo de MCO para estimar los coeficientes de la ecuación?
El criterio que permitirá obtener una única línea recta será el minimizar la suma de
los errores al cuadrado.
9) De acuerdo al supuesto de la normalidad de los errores, los errores extremos son poco
probables. Comente.
La distribución normal decrece asintóticamente. Asimismo, se recuerda que la probabi-
lidad que existan observaciones a tres desviaciones estándar de la media es práctica-
mente cero. Por eso, cuando se asume normalidad, se está suponiendo que la
probabilidad de valores extremos es bastante pequeña.
10) Se cuenta con datos mensuales del Producto Bruto Interno (PBI) y Exportaciones (en
millones de US$) del Perú desde enero de 1994 a abril del 2010. Los datos son provistos
por el Instituto Nacional de Estadística e Informática del Perú. Se desea investigar la
relación que existe entre ambas variables. Se asume que la variable independiente son
las exportaciones y que la variable dependiente es el PBI. Los datos se encuentran en el
archivo pbi_exportaciones_peru.xlsx. En base a esto realizar lo siguiente:
La hoja Excel que acompaña a este ejercicio se llama: “capitulo9_pregunta10_pbi_ex-
portaciones_peru.xlsx”.
a) Determine la correlación entre ambas variables.
Según se ha determinado en la hoja de correlación del archivo citado, la correlación
entre las variables es de 0,9448.
correlación

b) Comente su resultado en base al signo y magnitud del coeficiente de correlación.
La relación lineal entre ambas variables es positiva y bastante fuerte (el valor es bas-
tante cercano a 1).
c) Emplee Excel, prepare el gráfico de dispersión e incluya la ecuación lineal. Asegú-
rese de incluir en el gráfico, la ecuación y el coeficiente de determinación (R 2 ).
En la hoja de “dispersión” del archivo citado se encuentra el siguiente gráfico obte-
nido en base a los datos.
123
4
PBI y Exportaciones y = 2,9759x + 8163,5

R² = 0,8926
20.000,00
18.000,00
16.000,00
14.000,00
12.000,00
10.000,00
8.000,00
6.000,00
0 500 1000 1500 2000 2500 3000 3500
PBI y Exportaciones Lineal (PBI y Exportaciones)
d) Utilice
d)
Utilice las ecuacionesdedelos
las ecuaciones loscoeficientes
coeficientes
deldel modelo,
modelo, desarrolladas
desarrolladas encapítulo,
en el el
capítulo, estime los coeficientes relacionados al intercepto y a la
estime los coeficientes relacionados al intercepto y a la pendiente. (Use las ecuacio-
pendiente. (Use las ecuaciones (35) y (50)).
nes (35) y (50)).
La
La repuesta
repuestase encuentra en la en
se encuentra hojala“algebra” del documento
hoja “algebra” Excel “capitulo9_pre-
del documento Excel
gunta10_pbi_exportaciones_peru.xlsx”.
“capitulo9_pregunta10_pbi_exportaciones_peru.xlsx”.
e) Aplique Excel, desarrolle el modelo de MCO univariados y presente la

e) Aplique
ventanaExcel,
de losdesarrolle el modelo de MCO univariados y presente la ventana de
resultados.
los resultados.
La
La repuesta se encuentra
repuesta en la en
se encuentra hojala“mco”
hoja del documento
“mco” Excel “capitulo9_pre-
del documento Excel
“capitulo9_pregunta10_pbi_exportaciones_peru.xlsx”.
124
f) Verifique que los valores obtenidos en la parte d son los mismos a los de la parte e.
Se verificó que efectivamente los resultados son los mismos.
¿Cuántos parámetros tiene este modelo (k) y con cuántas observaciones (n) se
g)
cuenta?
K = 2, n = 196
h) Emplee las ecuaciones (66) y (67) para calcular el coeficiente de determinación y el
coeficiente de determinación ajustado. ¿Los valores coinciden con los obtenidos por
Excel? Interprete el resultado obtenido.
La repuesta se encuentra en la hoja “R2” del documento Excel “capitulo9_pre-
Al usar la ecuación (66) y la información obtenida en la hoja "mco", se calcula el R^2
Al usar la ecuación (67) y la información obtenida en la hoja "mco", se calcula el R^2 ajustado
i) Use la ecuación (71), calcule el error estándar y compárelo con el obtenido usando
Excel.
La repuesta se encuentra en la hoja “error estándar” del documento Excel “capi-
tulo9_pregunta10_pbi_exportaciones_peru.xlsx”.
El resultado es exactamente el mismo, como se puede observar a continuación.
125
Error
Estándar
j) De acuerdo a la prueba F-test (análisis de varianza), con un nivel de confianza del

95%, ¿se puede afirmar que existe una relación lineal entre las exportaciones y el
PBI? (use el p-valor de la prueba).
El p-valor de la prueba es 0,00. Por lo tanto, como el p-valor es menor que el nivel
de significancia (0,05) se rechazará la hipótesis nula de no relación lineal. O sea,
que se puede afirmar que existe una relación lineal entre las exportaciones y el PBI.
Con base en las pruebas de hipótesis individuales y usando el t-test y el valor crítico,
k)
¿se puede afirmar que el coeficiente del intercepto es estadísticamente significativo?
T-test = 80,75, el valor crítico corresponde a una T con n – 2 grados de libertad
(194) y que es igual a 1,9723. Como el valor del t-test está en la zona de rechazo, se
puede afirmar que el coeficiente del intercepto es estadísticamente significativo.
Emplee el p-valor, ¿obtiene la misma conclusión respecto a la significancia del coefi-
l)
ciente del intercepto?
P-valor = 0,00
Por lo tanto, y como el p-valor es menor que 0,05, se rechaza la hipótesis nula de no
significancia estadística. Es decir, que el coeficiente del intercepto es estadística-
mente significativo.
m) Finalmente, mediante los intervalos de confianza, ¿confirma lo encontrado en los
puntos k y l?
El intervalo de confianza para el intercepto es [7.964,10; 8.362,87]. Como se puede
apreciar el valor cero no está en este intervalo por lo que se rechaza la hipótesis nula
de no significancia estadística del intercepto.
n) Basados en las pruebas de hipótesis individuales y usando el t-test y el valor crítico,
¿se puede afirmar que el coeficiente de la pendiente es estadísticamente significa-
tivo?
T-test = 40,15, el valor crítico corresponde a una T con n – 1 (195) grados de liber-
tad y que es igual a 1,9723. Por lo tanto, como el valor del t-test está en la zona de
rechazo, se puede afirmar que el coeficiente de la pendiente es estadísticamente
significativo.
Utilice el p-valor, ¿obtiene la misma conclusión respecto a la significancia del coefi-
o)
ciente de la pendiente?
P-valor = 0,00
126
Por lo tanto, al ser el p-valor menor que 0,05, se rechaza la hipótesis nula de no sig-
nificancia estadística. Es decir, que el coeficiente de la pendiente es estadísticamente
significativo.
p) Finalmente, con los intervalos de confianza, ¿confirma lo encontrado en los puntos
n y o?
El intervalo de confianza para el intercepto es [2,83; 3,12]. Como se puede apreciar
el valor cero no está en este intervalo por lo que se rechaza la hipótesis nula de no
significancia estadística de la pendiente.
11) Repita el ejercicio 10 usando EViews, realice y verifique lo siguiente:
El documento de EViews que acompaña a este ejercicio se llama: “capitulo9_pre-
gunta10_pbi_exportaciones_peru.wf1”.
a) Presente un análisis preliminar de los datos. Incluya el gráfico de series de tiempo
para cada variable, estadísticas descriptivas y el coeficiente de correlación.
Los resultados se encuentran en el documento de EViews bajo los nombres: “gra-
fico_export”, “grafico_pbi”, “estad_descrip” y “correlacion” y las pantallas se mues-
tran a continuación.
127
b) Presente el gráfico de dispersión.

El resultado se encuentran en el documento EViews bajo el nombre: “dispersión”.
c) Desarrolle el modelo de MCO que considere como variable endógena al PBI y va-
riable predeterminada a las exportaciones. ¿Son los coeficientes estimados los mis-
mos?
El resultado se encuentran en el documento EViews bajo el nombre: “mco” que se
reproduce a continuación:
128
Los resultados son los mismos.

¿Son los coeficientes de determinación y el coeficiente de determinación ajustado
d)
iguales a los obtenidos con Excel?
Sí.
e) Use el análisis de varianza, ¿llega a la misma conclusión?
Como se puede apreciar Prob(F-statistic) = 0. Por lo que se llega a la misma conclu-
sión que el caso anterior.
12) Secuenta con información respecto a la cartera administrada por las Administradoras
Privadas de Pensiones del Perú (fondo 2) y el encaje de la cartera correspondiente. Los
datos semanales fueron obtenidos del portal de internet de la Superintendencia de
Banca y Seguros del Perú (http://www.sbs.gob.pe/0/modulos/JER/JER_Interna.
aspx?ARE=0&PFL=0&JER=150) y corresponden al periodo que comienza el 02 de
Octubre del 2009 hasta el 23 de Abril del 2010. Se sabe que el encaje está directamente
relacionado con la cartera administrada, es decir, que el encaje será nuestra variable de-
pendiente y la cartera administrada nuestra variable independiente o explicativa. En
base a esto realizar lo siguiente:
La hoja Excel que acompaña a este ejercicio se llama: “capitulo9_pregunta12_encaje_
cartera_AFP.xlsx”.
a) Determine la correlación entre ambas variables.
En la hoja de “correlacion” del archivo mencionado se ha efectuado el cálculo co-
rrespondiente. Se obtuvo un valor de 0,9812.
129
10
b) Comente su resultado en base al signo y magnitud del coeficiente de

correlación.
b) La relación
Comente su lineal entreenambas
resultado base alvariables es positivadel
signo y magnitud y bastante fuerte
coeficiente (el
de correlación.
valor es bastante cercano a 1).
La relación lineal entre ambas variables es positiva y bastante fuerte (el valor es bas-
c) tante cercanoprepare
Use Excel, a 1). el gráfico de dispersión e incluya la ecuación lineal.
c) Use Excel, prepare
Asegúrese el gráfico
de incluir en eldegráfico,
dispersión e incluya la
la ecuación y ecuación lineal.de
el coeficiente Asegúrese de
incluir (R2). la ecuación y el coeficiente de determinación (R 2 ).
en el gráfico,
determinación
En la hoja de Excel denominada “dispersión” se encuentra el gráfico, que se mues-
En la hoja de Excel denominada “dispersión” se encuentra el gráfico,
tra.
que se muestra.
Encaje y Cartera Administrada y = 0,0103x - 33,173

R² = 0,9628
510
500
490
480
470
460
450
47500 48000 48500 49000 49500 50000 50500 51000 51500 52000 52500
Encaje y Cartera Administrada Lineal (Encaje y Cartera Administrada)
d) Utilice las ecuaciones de los coeficientes del modelo, desarrolladas en el

d) Utilice las estimar
capítulo, ecuaciones
los de los coeficientes
coeficientes del modelo,
relacionados desarrolladas
al intercepto y a enlael capítulo,
pendiente.
estimar Use las ecuaciones
los coeficientes (35) yal
relacionados (50).
intercepto y a la pendiente. Use las ecuacio-
nes (35) y (50).
La repuesta se encuentra en la hoja “algebra” del documento Excel
La repuesta se encuentra en la hoja “algebra” del documento Excel “capitulo9_pre-
“capitulo9_pregunta12_encaje_cartera_AFP.xlsx”
gunta12_encaje_cartera_AFP.xlsx”
130
e) Emplee Excel, desarrolle el modelo de MCO univariado y presente la ventana de los

resultados.
La repuesta se encuentra en la hoja “mco” del documento Excel “capitulo9_pre-
gunta12_encaje_cartera_AFP.xlsx”.
f) Verifique que los valores obtenidos en la parte d) son los mismos a los de la parte e).
Se verificó que efectivamente los resultados son los mismos.
¿Cuántos parámetros tiene este modelo (k) y con cuántas observaciones (n) se
g)
cuenta?
K = 2, n = 30.
h) Utilice las ecuaciones (66) y (67) para calcular el coeficiente de determinación y el
coeficiente de determinación ajustado. ¿Los valores coinciden con los obtenidos por
Excel? Interprete el resultado obtenido.
La repuesta se encuentra en la hoja “R2” del documento Excel “capitulo9_pre-
gunta12_encaje_cartera_AFP.xlsx”, que se expone a continuación.
Al emplear la ecuación (66) y la información obtenida en la hoja "mco", se calcula el R^2
Al emplear la ecuación (67) y la información obtenida en la hoja "mco", se calcula el R^2 ajustado
131
i) Emplee la ecuación (71), calcule el error estándar y compárelo con el obtenido

usando Excel.
La repuesta se encuentra en la hoja “error estándar” del documento Excel “capi-
tulo9_pregunta12_encaje_cartera_AFP.xlsx”.
Error Estándar
j) De acuerdo a la prueba F-test (análisis de varianza), con un nivel de confianza del

95%, ¿se puede decir que existe una relación lineal entre el encaje y la cartera admi-
nistrada? (use el p-valor de la prueba).
El p-valor de la prueba es 0,00. Por lo tanto, como el p-valor es menor que el nivel
de significancia (0,05) se rechazará la hipótesis nula de no relación lineal, es decir,
que se puede afirmar que existe una relación lineal entre el encaje y la cartera admi-
nistrada.
Basados en las pruebas de hipótesis individuales y usando el t-test y el valor crítico,
k)
¿se puede afirmar que el coeficiente del intercepto es estadísticamente significativo?
T-test = -1,74, el valor crítico corresponde a una T con n - 2 (28) grados de libertad
y que es igual a 2,0484. Por ello, el valor del t-test está en la zona de no rechazo, se
puede mencionar que el coeficiente del intercepto no es estadísticamente significa-
tivo.
l)
P-valor = 0,09
Como el p-valor es mayor que 0,05, no se rechaza la hipótesis nula de no significan-
cia estadística. Es decir, que el coeficiente del intercepto no es estadísticamente sig-
nificativo.
m) Finalmente, usando los intervalos de confianza, ¿confirma lo encontrado en los
puntos k y l?
El intervalo de confianza para el intercepto es [72,32; 5,98]. Como se puede apre-
ciar el valor cero está en este intervalo por lo que no se rechaza la hipótesis nula de
no significancia estadística del intercepto.
Basados en las pruebas de hipótesis individuales y usando el t-test y el valor crítico,
n)
¿se puede afirmar que el coeficiente de la pendiente es estadísticamente significa-
tivo?
T-test = 26,91, el valor crítico corresponde a una T con n - 2 (28) grados de liber-
tad y que es igual a 2,0484. Como el valor del t-test está en la zona de rechazo, se
puede afirmar que el coeficiente de la pendiente es estadísticamente significativo.
132

o)
ciente de la pendiente?
P-valor = 0,00.
Como el p-valor es menor que 0,05, se rechaza la hipótesis nula de no significancia
estadística. Es decir, que el coeficiente de la pendiente es estadísticamente significa-
tivo.
p) Finalmente, use los intervalos de confianza, ¿confirma lo encontrado en los puntos
n y o?
El intervalo de confianza para el intercepto es [0,010; 0,011]. Como se puede apre-
ciar el valor cero no está en este intervalo, por lo que se rechaza la hipótesis nula de
no significancia estadística de la pendiente.
13) Repita el ejercicio 12 usando EViews, realice y verifique lo siguiente:
El documento de EViews que acompaña a este ejercicio se llama: “capitulo9_pre-
gunta12_encaje_cartera_AFP.wf1”.
a) Presente un análisis preliminar de los datos. Incluya el gráfico de series de tiempo
para cada variable, estadísticas descriptivas y el coeficiente de correlación.
Los resultados se encuentran en el documento EViews bajo los nombres: “grafico_
encaje”, “grafico_cartera”, “estad_descrip” y “correlacion”. A continuación se mues-
tran los gráficos correspondientes.
133
b) Presente el gráfico de dispersión.

Los resultados se encuentran en el documento EViews bajo el nombre: “dispersión”.
c) Desarrolle el modelo de MCO que considere como variable endógena al encaje y

variable predeterminada a la cartera administrada ¿Son los coeficientes estimados
los mismos?
El resultado se encuentran en el documento EViews bajo el nombre: “mco” que se
reproduce a continuación:
134
Los resultados son los mismos.

¿Son los coeficientes de determinación y el coeficiente de determinación ajustado
d)
iguales a los obtenidos con Excel?
Sí.
e) Si utiliza el análisis de varianza, ¿llega a la misma conclusión?
Como se puede apreciar Prob(F-statistic) = 0. Por lo que se llega a la misma conclu-
sión que el caso anterior.
135
C a pí t ulo
10
El modelo de mínimos cuadrados

ordinarios (MCO) multivariado
1) De acuerdo al supuesto de no autocorrelación de los errores ¿Cómo es la matriz de va-

rianza-covarianza? y ¿cómo la representaría de manera matricial?
σ2 0 ... 0
0 σ2 ... 0
E (ε × ε ') = =
Σ
... ... ... ...
0 0 ... σ 2
2) Si se tiene la siguiente regresión:

yi =α + β1 × x1,i + β 2 × x2,i + ε i
a) Interprete los parámetros: el intercepto, β1 y β2:

Como siempre el intercepto es el valor que la variable y toma en el caso que las otras
variables sean cero. Cada uno de los coeficientes β representa la influencia lineal de
cada variable exógena hacia la variable endógena.
¿Cuál es el número de coeficientes de la regresión (k)?
b)
K = 3
3) Se ha estimado una regresión multivariada y se han obtenido los siguientes resultados:
yˆ = 0,1 + 1, 2 × x1 − 0,3 × x2
137
a) Explique el tipo de relación que existe entre la variable dependiente (y) y cada una
de las variables independientes.
Y depende positivamente de x1 y negativamente de x 2 . Asimismo, la influencia de
x1 es mayor que la influencia de x 2.
b) Si x1 = 100, ¿cuál es el valor estimado de y?
yˆ = 0,1 + 1, 2 ×100 = 120,1
c) Si x2 = 40, ¿cuál es el valor estimado de y?
yˆ =
0,1 − 0,3 × 40 =
−11,9
d) Si x1 = 70 y x2 = -10, ¿cuál es el valor estimado de y?
yˆ= 0,1 + 1, 2 × 70 − 0,3 × (−10)= 87,1
4) Se tienen los resultados de dos regresiones donde la variable endógena representa el nú-
mero de minutos hablados por teléfono en un determinado mes. Las variables exógenas
son el número de personas mayores de 12 años que viven en un determinado hogar (x1 )
y el nivel de ingresos familiares (x1 ). Cada regresión presenta datos de una ciudad dis-
tinta. Los resultados de las regresiones son los siguientes:
yˆ =
−21,517 + 11,996 × x1 + 0, 019 × x2 Para la ciudad 1
=yˆ 55,536 + 5, 644 × x1 + 0, 012 × x2 Para la ciudad 2
Los coeficientes de ambas variables exógenas son estadísticamente significativos al 5%.

En la primera ecuación, el coeficiente del intercepto no es significativo al mismo nivel
de significancia. En la segunda ecuación, el intercepto es altamente significativo.
a) ¿En cuál de las ciudades el número de miembros de una familia mayores de 12 años
ejerce una mayor influencia en los minutos hablados por teléfono?
En la ciudad 1.
b) De acuerdo a las estimaciones para la ciudad 2, ¿cuál será el número de minutos
hablados por teléfono estimados, si el ingreso familiar es igual a 5.000?
yˆ= 55,536 + 0, 012 × 5.000= 115,536
c) De acuerdo a las estimaciones para la ciudad 2, ¿cuál será el número de minutos

hablados por teléfono estimados si el ingreso familiar es igual a 3.500 y el número
de miembros de la familia (mayores de 12 años) es igual 3?
=

yˆ 55,536 + 5, 644 × 3 + 0, 012 × 3.500
= 114, 468
5) Si se continúa con el caso anterior. Como el coeficiente del intercepto no es estadística-
mente significativo en la regresión de la ciudad 1, se lo elimina y se obtiene lo siguiente:
yˆ 12, 601× x1 + 0, 014 × x2
=
138
capítulo 10 El modelo de mínimos cuadrados ordinarios (MCO) multivariado
a) De acuerdo a las estimaciones para la ciudad 1, ¿cuál será el número de minutos

hablados por teléfono estimados si el ingreso familiar es igual a 3.000?
yˆ = 0, 014 × 3.000 = 42
b) De acuerdo a las estimaciones para la ciudad 1, ¿cuál será el número de minutos
hablados por teléfono estimados si el ingreso familiar es igual a 2.500 y el número
de miembros de la familia (mayores de 12 años) es igual 2?
yˆ = 12, 601× 2 + 0, 014 × 2.500 = 60, 202
6) Los datos con los que se estimaron las regresiones presentadas en las preguntas 4) y 5)
se presentan a continuación:
Tabla 14
Ciudad 1 Ciudad 2
Número de Número de
Ingreso familiar Ingreso familiar
Minutos integrantes Minutos integrantes
(U.M.) (U.M.)
familia (>12 años) familia (>12 años)
150 6 5.500 90 2 2.000
64 2 3.700 108 3 2.900
126 4 5.750 122 4 4.000
141 5 5.750 94 2 2.500
89 2 4.000 99 3 2.300
89 3 4.500 106 3 3.000
110 4 4.000 133 5 4.500
166 5 6.000 143 6 5.000
95 2 5.000 104 2 3.000
110 2 5.500 154 6 5.000
Estos datos se encuentran en el archivo de Excel llamadas_telefonicas.xls.

La solución en Excel de este problema se encuentra en el archivo “capitulo10_pre-
gunta6_llamadas_telefonicas.xlsx”.
a) Para cada ciudad estime la regresión donde la variable endógena es el número de
minutos hablados por teléfono (y) y las variables exógenas son el número de perso-
nas mayores de 12 años que viven en un determinado hogar (x1 ) y el nivel de ingre-
sos familiares (x2 ). Utilice Excel y verifique que sus resultados coincidan con los
resultados presentados en la pregunta 4.
Los resultados se presentan en la hoja “algebra” del documento Excel “capitulo10_
pregunta6_llamadas_telefonicas.xlsx”.
139
b) Para cada ciudad, ¿la variabilidad de la variable endógena es adecuadamente expli-

cada por la variabilidad de las variables explicativas?
Sí. Los R 2 son bastante cercanos a la unidad.
c) Para cada ciudad, de acuerdo a la prueba F-test (análisis de varianza), con un nivel
de confianza del 95% y por medio del p-valor de la prueba, ¿puede afirmar que
existe una relación lineal entre la variable endógena y las variables exógenas?
Sí. El p-valor asociado a cada regresión es 0,00 (menor que 0,05). Por lo que existe
una relación lineal en ambas ciudades entre la variable endógena y las variables ex-
140
plicativas. Recuerde que la hipótesis nula de la prueba del ANOVA es que no existe
relación lineal entre las variables.
d) Para cada ciudad, basados en las pruebas de hipótesis individuales y empleando el
t-test y el valor crítico, ¿puede afirmar que el coeficiente del intercepto es estadísti-
camente significativo?
En el caso de la ciudad 1 el t-test del intercepto es igual a -1,05 y para el caso de la
ciudad 2 este es igual a 12,45. En este caso para ubicar el valor crítico se utilizan 7
grados de libertad (10 - 3). Recuerde que en este caso el número de coeficientes (k)
es igual a 3. Este valor crítico es igual a 2,3646. En el caso de la primera ciudad el
intercepto es no significativo y en el caso de la segunda ciudad este es altamente
significativo.
e) Si utiliza el p-valor, ¿obtiene la misma conclusión respecto a la significancia del
coeficiente del intercepto?
En el caso de la ciudad 1 el t-test del intercepto es igual a 0,33 y para el caso de la
ciudad 2 este es igual a 0,00. Por lo tanto, se llega a las mismas conclusiones.
f) Finalmente, usando los intervalos de confianza, ¿confirma lo encontrado en los
puntos d) y e)?
Ciudad 1: [-69,75; 26,72]
Ciudad 2: [44,99; 66,08]
Por lo tanto, se llega a las mismas conclusiones.
g) Para cada ciudad, basados en las pruebas de hipótesis individuales y usando el p-
valor, ¿puede afirmar que el coeficiente de x1 es estadísticamente significativo?
Ciudad 1: p-valor = 0,00 el coeficiente de x1 es significativo al 5%.
h) Si emplea los intervalos de confianza, ¿confirma lo encontrado en el punto g)?
Ciudad 1: [0,16; 11,13]
Ciudad 2: [5,51; 18,48]
Por lo tanto, se obtienen las mismas conclusiones.
i) Para cada ciudad, basados en las pruebas de hipótesis individuales y usando el p-
valor, ¿puede afirmar que el coeficiente de x2 es estadísticamente significativo?
j) Si usa los intervalos de confianza, ¿confirma lo encontrado en el punto i)?
Ciudad 1: [0,01; 0,03]
Ciudad 2: [0,00; 0,02]
Se llega a las mismas conclusiones.
141
7) De acuerdo a los resultados de la pregunta 6), en la regresión que corresponde a la pri-

mera ciudad, el coeficiente del intercepto no es significativo al 5%. Sin embargo, el in-
tercepto de la regresión que corresponde a la segunda ciudad es altamente significativo.
De acuerdo a esto, realice lo siguiente:
a) Para la primera ciudad corra la regresión sin incluir el intercepto.
Los resultados se presentan en la hoja “mco” del documento Excel “capitulo10_pre-
gunta6_llamadas_telefonicas.xlsx”.
Analice los resultados, ¿coinciden con la regresión estimada presentada en la pre-

b)
gunta 5)?
Sí.
c) ¿Qué pasa si hace lo mismo con la segunda regresión?, es decir, si conociendo que el
coeficiente del intercepto es estadísticamente significativo, ¿se fuerza el intercepto a
ser cero?
Al forzar el intercepto a ser cero cuando este es significativamente distinto de cero
genera que el coeficiente de x1 pase a ser no significativo y que ambos coeficientes
cambien radicalmente sus valores, como se puede observar en los siguientes resulta-
dos.
142
8) Realice la regresión con los datos de la tabla 1, esta vez utilizando EViews. Compare los
resultados con los obtenidos en la pregunta 6).
La hoja de EViews con esto resultados se llama “capitulo10_pregunta6_llamadas_tele-
fonicas_1.wf1” y “capitulo10_pregunta6_llamadas_telefonicas_2.wf1”
Los resultados son exactamente los mismos. Para la ciudad 1:
143
Y para la ciudad 2:
9) Responda la pregunta 7) utilizando EViews.

La hoja de EViews con esto resultados se llama “capitulo10_pregunta6_llamadas_tele-
fonicas_1.wf1” y “capitulo10_pregunta6_llamadas_telefonicas_2.wf1”. Las ecuaciones
modificadas se llaman “mco_modif”.
Para la ciudad 1:
144
Y para la ciudad 2:
10) Se cuenta con información financiera de 12 empresas de los Estados Unidos dedicadas
a la publicidad. Las 12 empresas son negociadas en la Bolsa de Valores de Nueva York
(New York Stock Exchange) o en NASDAQ. Se quiere determinar la influencia de la
deuda total (x1 ) y del total del capital invertido en las empresas (x2 ) en la capitalización
de mercado de las empresas (y). Los datos corresponden al año del 2006, están expresa-
dos en miles de US dólares y fueron obtenidos de Bloomberg. El archivo Excel que
contiene esta información es MarketCap_DeudaTotal_CapitalInvertido.xls.
Los resultados se presentan en el documento EViews “capitulo10_pregunta10_Mar-
ketCap_DeudaTotal_CapitalInvertido_sol.wf1”.
a) Usando EViews, estime la regresión donde la variable endógena es la capitalización
de mercado de las empresas (y) y las variables exógenas son la deuda total (x1 ) y el
total del capital invertido en las empresas (x2 ).
145
b) ¿Es la variabilidad de la variable endógena adecuadamente explicada por la variabi-

lidad de las variables explicativas?
El R 2 y el R 2 ajustado son bastante altos. Por lo tanto, la variable endógena es ade-
cuadamente explicada por la variabilidad de las variables explicativas.
c) De acuerdo a la prueba F-test (análisis de varianza), con un nivel de confianza del
95% y mediante el uso del p-valor de la prueba, ¿puede afirmar que existe una rela-
ción lineal entre la variable endógena y las variables exógenas?
De acuerdo a la Prob(F-statistic) que es igual a 0,00 se puede afirmar que existe una
relación lineal entre la variable endógena y las variables exógenas.
d) Basados en las pruebas de hipótesis individuales y usando el t-test y el valor crítico,
¿puede declarar que el coeficiente del intercepto es estadísticamente significativo?
El t-test es igual a 0,372657 y el valor crítico que corresponde a una t con 12-3 (9)
grados de libertad es igual a 2,2622. Por lo tanto no se rechaza la hipótesis nula de
no significancia estadística.
Si emplea el p-valor, ¿obtiene la misma conclusión respecto a la significancia del
e)
coeficiente del intercepto?
P-valor = 0,7180 que es mayor que 0,05. Se llega a la misma conclusión que la pre-
gunta anterior.
Basados en las pruebas de hipótesis individuales y usando el p-valor, ¿puede avalar
f)
que el coeficiente de x1 es estadísticamente significativo?
P-valor = 0,0098 que es menor que 0,05. Por lo tanto, x1 es estadísticamente signi-
ficativa.
146
Basados en las pruebas de hipótesis individuales y usando el p-valor, ¿puede afirmar

g)
P-valor = 0,0011 que es menor que 0,05. Por lo tanto, x2 es estadísticamente signifi-
cativa.
h) Interprete sus resultados de la ecuación estimada.
La capitalización de mercado de las empresas (y) depende negativamente de la
deuda total (x1 ) y positivamente del total del capital invertido en las empresas (x2 ).
El efecto del total del capital invertido en las empresas es mayor que el efecto de la
deuda total.
Para contestar las preguntas i) a k) se re-estima la ecuación sin considerar el inter-
cepto. El resultado se presenta a continuación:
Por lo tanto la ecuación sería igual a yi =

−4,962228 x1 + 5, 005425 x2
i) De acuerdo a la ecuación estimada, ¿cuál sería el nivel de capitalización bursátil si el
capital invertido es igual a US$ 10.000?
y=
i 5, 005425 ×10.000= 50.054, 25
j) De acuerdo a la ecuación estimada, ¿cuál sería el nivel de capitalización bursátil si el
total de deuda es de US$ 5.000?
yi =
−4,962228 × 5.000 =
−24.811,14
k) De acuerdo a la ecuación estimada, ¿cuál sería el nivel de capitalización bursátil si el
capital invertido es igual a US$ 10.000 y el total de deuda es igual a US$5.000?
yi =
−4,962228 × 5.000 + 5.005425 ×10.000 =
25.243,11
147
11) Se cuenta con datos anuales correspondientes al ingreso neto, ingreso financiero (por
intereses) y las provisiones por pérdidas, desde el año 1934 al año 2009, las mismas que
fueron obtenidas de la página de internet de la Federal Deposit Insurance Corporation
(FDIC) de los Estados Unidos (http://www2.fdic.gov/hsob/hsobRpt.asp). Los datos
presentan valores agregados de todos los bancos comerciales en ese país expresados en
miles de US dólares. El archivo Excel que contiene esta información es IngresoNeto_
IngresoInteres_Provisiones.xls.
Los resultados se presentan en el documento EViews “capitulo10_pregunta11_ Ingre-
soNeto_IngresoInteres_Provisiones.wf1”.
a) Por medio de EViews, estime la regresión donde la variable endógena es el ingreso
neto (y) y las variables exógenas son los ingresos financieros (x1 ) y las provisiones
por pérdidas (x2 ).
Por lo tanto, la ecuación sería igual a:

yi =−3.545.135 + 0, 473934 × x1 − 0, 746837 × x2

b) ¿Es la variabilidad de la variable endógena adecuadamente explicada por la variabi-
lidad de las variables explicativas?
El R 2 y el R 2 ajustado son bastante altos. De esta forma, la variable endógena es
adecuadamente explicada por la variabilidad de las variables explicativas.
148
c) De acuerdo a la prueba F-test (análisis de varianza), con un nivel de confianza del

95% y con el uso del p-valor de la prueba, ¿puede confirmar que existe una relación
lineal entre la variable endógena y las variables exógenas?
De acuerdo a la Prob(F-statistic) que es igual a 0,00 se puede afirmar que existe una
relación lineal entre la variable endógena y las variables exógenas.
d) Basados en las pruebas de hipótesis individuales y usando el t-test y el valor crítico,
¿puede asegurar que el coeficiente del intercepto es estadísticamente significativo?
El t-test es igual a −3,385518 y el valor crítico que corresponde a una t con 76−3
(73) grados de libertad es igual a −1,9930. Por lo tanto, se rechaza la hipótesis nula
de no significancia estadística. Es decir, que el coeficiente del intercepto es estadís-
ticamente significativo.
e) Si usa el p-valor, ¿obtiene la misma conclusión respecto a la significancia del coefi-
Sí, este es igual a 0,0011 que es menor que 0,05.
Basados en las pruebas de hipótesis individuales y usando el p-valor, ¿puede afirmar
f)
P-valor = 0,0000 que es menor que 0,05, por lo tanto x1 es estadísticamente signifi-
cativa.
Basados en las pruebas de hipótesis individuales y usando el p-valor, ¿puede asentir
g)
P-valor = 0,0000 que es menor que 0,05, por lo tanto x2 es estadísticamente signifi-
cativa.
h) Interprete sus resultados de la ecuación estimada.
El ingreso neto (y) depende positivamente de los ingresos financieros (x1) y negati-
vamente con respecto a las provisiones (x2). El efecto sobre el ingreso neto de las
provisiones es mayor que el del ingreso financiero.
i) De acuerdo a la ecuación estimada, ¿cuál sería el ingreso neto si el ingreso finan-
ciero es igual a US$ 10.000.000.000?
yi =
−3.545.135 + 0, 473934 ×10.000.000.000, 00 =
4.735.794.865
j) De acuerdo a la ecuación estimada, ¿cuál sería el ingreso neto si el ingreso finan-
ciero es igual a US$ 50.000.000?
yi =
−3.545.135 + 0, 473934 × 50.000.000 =
20.151.565
k) De acuerdo a la ecuación estimada, ¿cuál sería el ingreso neto si el ingreso finan-
ciero es igual a US$ 200.000.000 y las provisiones por pérdidas son iguales a US$
50.000.000?
yi =
−3.545.135 + 0, 473934 × 200.000.000 − 0, 746837 × 50.000.000 =
53.899.815
149
12) Se tienen los siguientes datos mensuales que corresponden a los ingresos en miles de US
dólares por concepto de cobro de peaje, de una empresa dedicada a la administración
de carreteras. Los datos corresponden a los años 2006 a 2008. Se está interesado en
generar una ecuación que represente la15tendencia de los ingresos. Se conoce que en di-
ciembre del 2006 el estado (dueño de las carreteras) redujo el número de puestos de
el cobro
valor de depeaje
1 endeel 122006
a 5. Laytabla
cerotiene las siguientes
después. columnas:
Los datos se fecha, ingresosen
encuentran en el
US
dólares, losExcel
documento meses “peaje.xls”.
expresados de manera numérica (números consecutivos desde 1 hasta
36) y la variable dummy (D) que toma el valor de 1 en el 2006 y cero después. Los da-
La tos
solución a este
se encuentran en elproblema
documentousando Excel se encuentra en el archivo
Excel “peaje.xls”.
"capitulo10_pregunta12_peaje_sol.xlsx", en la hoja "1 dummy".
La solución a este problema usando Excel se encuentra en el archivo “capitulo10_pre-
gunta12_peaje_sol.xlsx”, en la hoja “1 dummy”.
a) Emplee Excel y realice el gráfico de series de tiempo de los ingresos de
la empresa.
a) Emplee Excel y realice el gráfico de series de tiempo de los ingresos de la empresa.
US$
600.000
500.000
400.000
300.000
200.000
100.000
0
SET
SET
SET
MAY
MAY
MAY
ENE
MAR
NOV
ENE
MAR
NOV
ENE
MAR
NOV
JUL
JUL
JUL
b) ¿Qué observa en el gráfico?

b) ¿Qué observa en el gráfico?
SeSeobserva
observa que
que alrededor
alrededorde de
diciembre del primer
diciembre año (2006)
del primer algo pasó
año (2006) conpasó
algo los in-
gresos
con los (cayeron dramáticamente).
ingresos Esto se conoce comoEsto
(cayeron dramáticamente). quiebre
seestructural.
conoce como
quiebre
c) Incluyaestructural.
una línea detendencia. Incluya en el gráfico la ecuación de la regresión y el
coeficiente de determinación.
c) Incluya una línea de tendencia. Incluya en el gráfico la ecuación de la
regresión y el coeficiente de determinación.
US$ y = -1750,5x + 429980

R² = 0,0386
600.000
500.000
400.000
150
300.000
Se observa que alrededor de diciembre del primer año (2006) algo pasó
con los ingresos (cayeron dramáticamente). Esto se conoce como
quiebre estructural.
c) Incluya unacapítulo
línea de El modelo de
10 tendencia. mínimosen
Incluya cuadrados ordinarios
el gráfico (MCO) multivariado
la ecuación de la
regresión y el coeficiente de determinación.
US$ y = -1750,5x + 429980

R² = 0,0386
600.000
500.000
400.000
300.000
200.000
100.000
0
SET
SET
SET
MAY
MAY
MAY
ENE
MAR
ENE
NOV
ENE
NOV
MAR
MAR
NOV
JUL
JUL
JUL
d) ¿Se puede afirmar que la variabilidad de los ingresos es adecuadamente descrita por
la variabilidad del tiempo (R 2 )?
El R 2 es bastante bajo. Por lo tanto, de acuerdo a este estadístico, se puede concluir
que la variabilidad de los ingresos no es adecuadamente descrita por la variabilidad
del tiempo.
e) ¿Por qué cree que el R 2 es bastante bajo?
Por el problema observado en la parte b) de esta pregunta.
f) Corra la siguiente regresión:
yi =α + β1 × x1,i + β 2 × Di + ε i
Donde y corresponde a los ingresos mensuales, x1 a los meses expresados de manera

numérica y D la variable dummy.
La solución a este problema se encuentra en la hoja “1 dummy” del archivo “capi-
tulo10_pregunta12_peaje_sol.xlsx”.
151
g) Verifique el cambio en el valor del coeficiente de determinación, ¿a qué cree se debe

este cambio? 17
El R 2 ahora es igual a 89%. El cambio se debe al uso de la variable dummy que ha
permitido capturar el cambio estructural.
h) Grafique la línea estimada con la ecuación en el punto f). En este caso
h) ¿se tendrán
Grafique dosestimada
la línea líneas, una para
con la el 2006
ecuación y punto
en el otra para loseste
f). En siguientes
caso ¿se tendrán
años?
dos líneas, una para el 2006 y otra para los siguientes años?
Como se puede apreciar, se tienen dos líneas: una que corresponde al primer año
Como se puede apreciar, se tienen dos líneas: una que corresponde al
(2006) año
primer y la (2006
otra que
y lacorresponde a los dos siguientes
otra que corresponde años.
a los dos siguientes años.
600.000
500.000
400.000
300.000
200.000
100.000
0
0 5 10 15 20 25 30 35 40
Ventas en US$ MCO
13) Repita el ejercicio anterior usando EViews.

152
La solución a este problema usando EViews se encuentra en el archivo
"capitulo10_pregunta13_peaje_sol.wf1".
13) Repita el ejercicio anterior usando EViews.

La solución a este problema usando EViews se encuentra en el archivo “capitulo10_pre-
gunta13_peaje_sol.wf1”.
Como se puede apreciar, estos resultados son exactamente iguales a los obtenidos en la
pregunta 12.
14) Se
continúa con el ejercicio 12). Se conoce, además, que en el mes de octubre del 2008
(mes 34) el precio del peaje subió.
La solución a este problema usando Excel también se encuentra en el archivo “capi-
tulo10_pregunta12_peaje_sol.xlsx”, en la hoja “2 dummy”.
a) Corra la siguiente regresión:
yi =α + β1 × x1,i + β 2 × D1,i + β3 × D2,i + ε i
Donde y corresponde a los ingresos mensuales, x1 a los meses expresados de manera

numérica y D1 la variable dummy para el cambio en puestos de peaje que toma el
valor de 1 para el 2006 y cero después de eso y, D2 la variable dummy para capturar
el efecto del cambio de precios, que toma el valor de cero hasta septiembre del 2008
y 1 a partir de octubre del mismo año.
La solución a este problema usando Excel se encuentra en el archivo “capitulo10_
pregunta12_peaje_sol.xlsx”, en la hoja “2 dummy”. La ecuación obtenida es:
ventas
= i 150.199 + 7.800 × Tiempo + 287.556 × D1 + 86.967 × D2
153
b) Interprete sus resultados.

En este caso se puede observar que todas las variables son significativas al 5%. En
todos los casos el p-valor es igual a 0,00. En lo que respecta a los coeficientes de las
dummies, se muestra que estos son significativos y positivos.
c) Explique el cambio en R 2.
De nuevo, el R 2 mejora significativamente debido a que se está modelando de me-
jor manera los cambios estructurales presentes en los datos.
154
c) Explique el cambio en R2.
De nuevo, el R2 mejora significativamente debido a que se está

modelandocapítulo
de mejor El modelo
10 manera de mínimos
los cambios cuadrados ordinarios
estructurales presentes(MCO)
enmultivariado
los
datos.
d) Grafique la
d) Grafique la línea estimada
estimadaconconlalaecuación
ecuación enen
el punto c). c).
el punto (En(En
esteeste
casocaso
¿se tendrán
tres líneas,
¿se tendránuna para
tres el 2006,
líneas, unaotra
parapara
el el2006,
2007 otra
hastapara
septiembre
el 2007delhasta
2008 y otra
septiembre delrestantes
para los meses 2008 y otra para los meses restantes meses?)
meses?)
Como se puede observar en la siguiente figura, efectivamente se tendrán tres líneas
Como se puede observar en la siguiente figura, efectivamente se
dependiendo del periodo a considerar.
tendrán tres líneas dependiendo del periodo a considerar.
600.000
500.000
400.000
300.000
200.000
100.000
0
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35
Ventas en US$ MCO
155
C a pí t ulo
11
Prueba de los supuestos

del modelo de MCO
1) ¿Cuál es la consecuencia de tener errores heterocedásticos?

La presencia de heterocedasticidad no tiene ningún efecto en los coeficientes estima-
dos, los que continuarán siendo insesgados. Sin embargo, ya no serán eficientes, es de-
cir, que no tendrán la mínima varianza entre todos los estimadores insesgados.
2) ¿Cuáles son las causas que pueden causar autocorrelación en los errores?
Entre las causas más probables se pueden mencionar las siguientes:
• La existencia de un patrón estacional.
• El uso de una forma funcional incorrecta para modelar la relación entre la variable en-
dógena y las variables explicativas.
• Omisión de variables explicativas que, a su vez, están autocorrelacionadas.
3) ¿Qué mide el test de Durbin-Watson?, ¿se puede emplear este test para ver la autocova-
rianza de orden 3?
No. El test de Durbin-Watson solo se puede emplear para determinar la existencia de
autocovarianza de orden 1.
4) ¿Cuál es la consecuencia de tener errores autocorrelacionados?
Al igual que en el caso de heterocedasticidad, la presencia de autocorrelación no afecta
la propiedad de insesgamiento de los coeficientes. Sin embargo, ante la presencia de
157
autocorrelación los parámetros estimados no serán eficientes. Esto significa que las in-
ferencias serán incorrectas.
Existe un teorema bastant
2
límite central”.
5) ¿Cuál son las causas de no normalidad de los errores? y, ¿cuáles son las consecuencias de De acuerdo
no tener errores que se distribuyan normalmente? muestrales se distribuye n
Existe un teorema bastante importante conocido como el “teorema del suficientemente grande (po
Entre las posibles causas de no normalidad se pueden mencionar la presencia de esta-
límite central”. De acuerdo con este teorema, la distribución de las medias satisfecha si el número de o
cionalidad
muestrales en los datosnormalmente
se distribuye y la presencia desi valores extremos
el tamaño de la(outliers).
muestra es Por lo lo tanto, si se cuenta co
suficientemente grande (por lo general, se asume que esta condición
Existe un teorema bastante importante conocido como el “teorema delteorema es y se puede estar se
límite cen-
satisfecha
tral”.siDe
el acuerdo
número conde observaciones en la muestra
este teorema, la distribución es medias
de las mayor muestrales
que 30).
son secorrectos
distri- aun cuando e
Por lo buye
tanto,normalmente
si se cuentasicon una muestra
el tamaño grande,esselopuede
de la muestra invocar a grande
suficientemente este (por lo
teorema y se puede estar seguro que la distribución de los test estadísticos 6) En la siguiente tabla se pres
general, se asume que esta condición es satisfecha si el número de observaciones en la
son correctos aun cuando el supuesto de normalidad no es satisfecho. minutos hablados por telé
muestra es mayor que 30). Por lo tanto, si se cuenta con una muestra grande, se puede
invocar a este teorema y se puede personas mayores de 12 añ
6) En la siguiente tabla se presentan losestar seguro
datos que la distribución
correspondientes de los test
al número deestadísticos
sonhablados
correctos aun nivel de ingresos familiares (
minutos porcuando
teléfono el supuesto
en un de normalidad no
determinado es satisfecho.
mes, el número de
personas mayores de 12 años que viven en un determinado hogar (x1)de
6) En la siguiente tabla se presentan los datos correspondientes al número
y el
minutos ha-
nivel de ingresos familiares (x2).
blados por teléfono en un determinado mes, el número de personas mayores de 12 años
hogar2(x1 ) y el nivel de ingresos familiares (x2 ).
que viven en un determinadoTabla
Minutos in
Tabla 2
Número Ingreso
Minutos integrantes familia familiar 90
Minutos Número integrantes familia (> 12 años) Ingreso familiar (U.M.)
(> 12 años) (U.M.) 108
90 90 22 2.000 2.000 122
108 108 3 3 2.900 2.900 94
122 122 44 4.000 4.000 99
94 94 22 2.500 2.500 106
99 99 33 2.300 2.300 133
106 106 33 3.000 3.000 143
133 133 55 4.500 4.500 104
143
143 66 5.000 5.000 154
104 2 3.000
104 2 3.000
154 6 5.000
154 6 5.000 Estos datos se en
llamadas_telefonicas_19.xls
Estos datos se encuentran en el archivo de Excel
supone que el nivel de signi
llamadas_telefonicas_19.xlsx. Para todas las pruebas de hipótesis se Para to-
Estos datos se encuentran en el archivo de Excel llamadas_telefonicas_19.xlsx.
suponedas las el
que pruebas de significancia
nivel de hipótesis se supone que el nivel
estadístico de significancia
es igual al 5%. estadístico es igual al
5%. El documento de EViews
El documento de deEViews "capitulo11_pregunta6_llam
El documento EViewsque contieneesta
que contiene esta información
información se “capitulo11_pre-
se llama llama
"capitulo11_pregunta6_llamadas_telefonicas.wf1".
gunta6_llamadas_telefonicas.wf1”. a) Usando EViews, realice
a) Usando a) UsandoEViews, realice
EViews, la siguiente
realice regresión: 𝑦𝑦𝑖𝑖 = 𝛼𝛼 + 𝛽𝛽1 × 𝑥𝑥1,𝑖𝑖 + 𝛽𝛽2 × 𝑥𝑥2,𝑖𝑖 + 𝜀𝜀𝑖𝑖 .
la siguienteregresión:
𝑥𝑥2,𝑖𝑖 + 𝜀𝜀𝑖𝑖 .
158
capítulo 11 Prueba de los supuestos del modelo de MCO
b) Realice la prueba de Wald para probar si el coeficiente del intercepto es igual a 55.
Como se puede apreciar, no se puede rechazar la hipótesis nula que el coeficiente

del intercepto es igual a 55.
c) De acuerdo a la prueba F-test (análisis de varianza), ¿se puede afirmar que existe
una relación lineal entre la variable endógena y las variables exógenas? Utilice el p-
valor de la prueba.
El p-valor de la prueba es igual a 0,000001. Por lo tanto, se puede afirmar que
existe una relación lineal entre la variable endógena y las variables exógenas.
159
d) ¿Se puede estar seguro que E(ε) = 0?

Mientras el intercepto sea considerado, este supuesto siempre será satisfecho.
e) Presente el gráfico de los errores (residual plot). ¿Puede observar algún indicio de
heterocedasticidad?
Si se observa este gráfico parece no haber problemas de heterocedastidad.

f) Realice la prueba de heterocedastidad de White. Interprete sus resultados.
160
capítulo
5 11 Prueba de los supuestos del modelo de MCO
Prob
Se asume
F(5;4)que el nivel
= 0,2639 de significancia
> 0,05, deseado
en consecuencia, noes
sedel 5% y Hse0. utilizan los p-valores
rechaza
para decidir si se rechaza o no la hipótesis nula de homocedasticidad:
Prob Chi-square(5) = 0,2117 > 0,05, no se rechaza H0.
Prob F(5;4) = 0,2639 > 0,05, en consecuencia, no se rechaza H0.
En conclusión, basados en el test de White, se puede concluir que los
errores de la regresión cumplen el supuesto de homocedasticidad.
En conclusión, basados en el test de White, se puede concluir que los errores de la
g) En caso que la heterocedasticidad esté presente, corrija los errores
regresión cumplen el supuesto de homocedasticidad.
estándar usando el ajuste por heterocedasticidad de White.
g) En caso que la heterocedasticidad esté presente, corrija los errores estándar usando
Los errores son homocedásticos, por lo que no se necesitan corregir los
el ajuste por heterocedasticidad de White.
errores estándar.
Los errores son homocedásticos, por lo que no se necesitan corregir los errores es-
tándar. sus resultados con la regresión original. ¿Pasa algo con los
h) Compare
valores de los coeficientes estimados?
h) Compare sus resultados con la regresión original. ¿Pasa algo con los valores de los
coeficientes
No se realizaestimados?
ningún ajuste por heterocedasticidad.
No se realiza ningún ajuste por heterocedasticidad.
i) De acuerdo al test de Durbin-Watson, ¿existe autocorrelación de primer
De acuerdo
i) orden al test de
en los errores? Durbin-Watson, ¿existe autocorrelación de primer orden en
los errores?
DW = 1,032391
DW = 1,032391
En
En el
el problema
problema que se está
que se estáanalizando,
analizando,elelnúmero
númerode
deregresores
regresores
(sin(sin
incluir el inter-
incluir el intercepto) es 2 y el número de observaciones es igual a 10:
cepto) es 2 y el número de observaciones es igual a 10: DW es igual a 0,697 y
DW L es igual a 0,697 y DW S es igual a 1,641. Construyendo lasL zonas
DWS esseigual
críticas a 1,641. Construyendo las zonas críticas se tendrán:
tendrán:
0 0,697 1,641 2 2,359 3,303 4
En este caso el estadístico cae en la zona en la que el DW no pude

detectar
En este la
caso el estadístico
presencia cae en la zona
de autocorrelación de en la que
primer el DW no pude detectar la pre-
orden.
sencia de autocorrelación de primer orden.
j) Realice el test de Breusch-Godfrey de orden 5 (5 rezagos). Interprete
Realice
j) sus el test de
resultados. Breusch-Godfrey de orden 5 (5 rezagos). Interprete sus resultados.
161
De acuerdo a este test, no se puede rechazar la hipótesis nula de no autocorrelación

de orden 5.
k) Si los errores son autocorrelacionados, estime la matriz de varianza-covarianza que
es consistente con heterocedasticidad y autocorrelación (Newey-West). Compare
sus resultados con la regresión original.
No existe autocorrelación, por lo tanto, no se realiza ningún ajuste al modelo.
l) Verifique la normalidad de los errores usando el test de Jarque-Bera. Interprete sus
resultados.
162
Como se puede apreciar, no se puede rechazar la hipótesis nula de normalidad.

m) Construya la matriz de correlaciones entre todas las variables, ¿cree que existe la
posibilidad de tener problemas de multicolinealidad?
Dada la alta correlación entre las variables es posible tener problemas de multicoli-
nealidad. Una forma de analizar el impacto de esto es correr dos regresiones, una
solo con edad y otra con edad e ingresos, y ver si los coeficientes varían dramática-
mente. Si no lo hacen, el problema no sería serio. En la situación contraria, se reco-
mendaría solo usar una de las variables y buscar otras que puedan explicar a la
variable endógena.
n) Utilice el RESET, test propuesto por Ramsey, para verificar si la forma funcional
del modelo es la adecuada.
Como se puede apreciar, no se puede rechazar la hipótesis nula que la forma funcio-
nal lineal es la adecuada.
163
Como se puede apreciar, no s
Estadísticas y Econometría Financiera forma funcional lineal es la ade
Como se puede apreciar, no se puede rechazar la hipótesis nula que la
forma funcional lineal es la adecuada. 7) Se cuenta con información finan
7) Se cuenta con información financiera de 12 empresas de los Estados Unidos Unidosdedicadas
dedicadas a la publicidad.
7) Se cuenta con información financiera de 12 empresas de los Estados bolsa
a la publicidad.
Unidos dedicadas Las a la 12 empresasLas
publicidad. son12
negociadas
empresasenson la bolsa de valores
negociadas en la de Nuevavalores
de York de Nueva Yo
NASDAQ. Se quiere determinar la
(NewdeYork
bolsa Stockde
valores Exchange) o en NASDAQ.
Nueva York (New YorkSeStock
quiereExchange)
determinaroladel eninfluencia de la
capital invertido en las empresa
NASDAQ. Se quiere determinar la influencia de la deuda total (x )
deuda total (x1 ) y del total del capital invertido en las empresas (x2 ) enlas
1 y del total
la capitalización
empresas (y). Los datos c
del capital invertido en las empresas (x2) en la capitalización de mercado de
de mercado de las empresas (y). Los datos corresponden al año del 2006, están expresa-
expresadas en miles de US dólar
las empresas (y). Los datos corresponden al año del 2006, están
das en miles de US dólares y fueron obtenidas de
expresadas en miles de US dólares y fueron obtenidas de Bloomberg. ElBloomberg. El archivo
archivo Excel Excel
que que co
contiene esta
archivo Excel información
que es MarketCap_DeudaTotal_CapitalInvertido.xlsx.
contiene esta información MarketCap_DeudaTotal_CapitalInv
es Para to-
MarketCap_DeudaTotal_CapitalInvertido.xlsx.
das las pruebas de hipótesis se asume que el nivel Para detodas las pruebas
significancia hipótesis
de
estadístico se asume
es igual al que el nivel de
hipótesis
5%. se asume que el nivel de significancia estadístico es igual al 5%.El documento de EViews que
El Eldocumento
documentodede EViews EViews queque contiene
contieneesta
estainformación
información se llama
se llama "capitulo11_pregunta7_ MarketCap
“capitulo11_pre-
"capitulo11_pregunta7_ MarketCap_DeudaTotal_CapitalInvertido.wf1".
gunta7_ MarketCap_DeudaTotal_CapitalInvertido.wf1”.
a) Por medio de EViews, realice l
PorPor
a) a) medio
medio dede EViews,
EViews, realicelalasiguiente
realice siguienteregresión:
regresión: 𝑦𝑦𝑖𝑖 = 𝛼𝛼 + 𝛽𝛽1 × 𝑥𝑥1,𝑖𝑖 + 𝛽𝛽2 × 𝑥𝑥2,𝑖𝑖 + 𝜀𝜀𝑖𝑖 .
𝛽𝛽2 × 𝑥𝑥2,𝑖𝑖 + 𝜀𝜀𝑖𝑖
b) Realice la prueba de Wald para probar si el coeficiente relacionado con el total de

deuda es igual a -5.
164
De acuerdo a la prueba F o chi-cuadrada, no se rechaza la hipótesis nula que el

coeficiente relacionado con el total de deuda es igual a -5.
valor de la prueba.
heterocedasticidad?
165
De acuerdo a este gráfico se pueden observar indicios de heteroscedasticidad.

f) Realice la prueba de heterocedastidad de White. Interprete sus resultados.
Se asume que el nivel de significancia deseado es del 5% y se utilizan los p-valores

Prob F(5;4) = 0,0122 < 0,05, en consecuencia, se rechaza H0.
En este caso, en que existe una contradicción entre ambas pruebas, se preferirá el
F-test ya que toma en consideración el tamaño de la muestra. Es decir, que cuando
la muestra es pequeña se deberá de usar la prueba F. Por lo tanto, se tienen proble-
mas de heterocedasticidad.
166
h) Compare sus resultados con la regresión original, ¿pasa algo con los valores de los
coeficientes estimados?
Se puede observar que los coeficientes no cambian y que los que sí cambian son los
valores de los errores estándar, que decrecen.
i) De acuerdo al test de Durbin-Watson, ¿existe autocorrelación de primer orden en
los errores?
En este caso el DW es bastante cercano al valor de 2, por lo que se puede afirmar
que no existe autocorrelación de primer orden.
j) Realice el test de Breusch-Godfrey de orden 5 (5 rezagos). Interprete sus resultados.
167
De acuerdo a este test no se puede rechazar la hipótesis nula de no autocorrelación

de orden 5.
No existe autocorrelación, por lo tanto, no se realiza el ajuste de Newey-West al
modelo.
resultados.
168

Dada la alta correlación entre las variables es posible tener problemas de multicoli-
nealidad. Una forma de analizar el impacto de esto es correr dos regresiones, una
solo con deuda y otra con deuda e inversión, y ver si los coeficientes varían dramáti-
camente. Si no lo hacen, el problema no sería serio. En el caso contrario, se reco-
mendaría solo usar una de las variables y buscar otras que puedan explicar a la
variable endógena.
169
n) Utilice el RESET, test propuesto por Ramsey, para verificar si la forma funcional del
modelo es la adecuada.
Como se puede apreciar, no se puede rechazar la hipótesis nula que la forma funcio-
nal lineal es la adecuada.
8) Se cuenta con datos anuales correspondientes al ingreso neto, ingreso financiero (por
intereses) y las provisiones por pérdidas, desde el año 1934 al año 2009, las mismas que
fueron obtenidas de la página de internet de la Federal Deposit Insurance Corporation
(FDIC) de los Estados Unidos (http://www2.fdic.gov/hsob/hsobRpt.asp). Los datos
presentan valores agregados de todos los bancos comerciales en ese país expresados en
miles de US dólares. El archivo Excel que contiene esta información es IngresoNeto_
IngresoInteres_Provisiones.xlsx. Para todas las pruebas de hipótesis se asume que el ni-
vel de significancia estadístico es igual al 5%.
El documento de EViews que contiene esta información se llama “capitulo11_pre-
gunta8_ ingresoneto_ingresointeres_provisiones.wf1”.
170
miles de US dólares. El archivo Excel que contiene esta información hipótesis
es se asume que e
IngresoNeto_IngresoInteres_Provisiones.xlsx. Para todas las pruebas de
hipótesis se asume que el nivel de significancia estadístico es igual al 5% El documento de EVie
11 Prueba "capitulo11_pregunta8_ in
El documento de EViews que capítulo
contiene esta de los supuestos
información se delllama
modelo de MCO
"capitulo11_pregunta8_ ingresoneto_ingresointeres_provisiones.wf1".
a) Use EViews, realice la
a) UseEViews,
a) Use EViews,realice
realice lala siguiente regresión: 𝑦𝑦𝑖𝑖 = 𝛼𝛼 + 𝛽𝛽1 × 𝑥𝑥1,𝑖𝑖 + 𝛽𝛽2 × 𝑥𝑥2,𝑖𝑖 + 𝜀𝜀𝑖𝑖 .
siguiente regresión:
𝜀𝜀𝑖𝑖 .
b) Realice la prueba de Wald para probar si el coeficiente relacionado con las provisio-
nes es igual a -1.
De acuerdo a la prueba F o chi-cuadrada, se rechaza la hipótesis nula que el coefi-

ciente relacionado con provisiones es igual a -1.
171
valor de la prueba.
heterocedasticidad?
En este caso se presenta el gráfico de los errores, ya que la tabla es bastante grande.
Como se puede apreciar existe bastante evidencia de problemas de heterocedastici-
dad.
172
f) Realice la prueba de heterocedasticidad de White. Interprete sus resultados.
Se asume que el nivel de significancia deseado es del 5% y se utilizan los p-valores

Prob F(5;4) = 0,000 < 0,05, en consecuencia, se rechaza H0.
Prob Chi-square(5) = 0,000 < 0,05, se rechaza H0.
En este caso, es claro que se tienen problemas de heterocedasticidad.
173
h) Compare sus resultados con la regresión original, ¿pasa algo con los
valores de los coeficientes estimados?
h) Compare sus resultados con la regresión original, ¿pasa algo con los valores de los
coeficientes estimados?
Se puede observar que los coeficientes no cambian y que lo que si
cambia
Se puedeson los valores
observar quedeloslos errores estándar,
coeficientes los queydecrecen.
no cambian que lo que si cambia son los
valores de los errores estándar, los que decrecen.
i) De acuerdo al test de Durbin-Watson, ¿existe autocorrelación de primer
orden
i) De en los al
acuerdo errores?
test de Durbin-Watson, ¿existe autocorrelación de primer orden en
los errores?
El estadístico de DW = 0,593802
El estadístico de DW = 0,593802
En el problema que se está analizando, el número de regresores (sin
En el problema que se está analizando, el número de regresores (sin incluir el inter-
incluir el intercepto) es 2 y el número de observaciones es igual a 76. En
cepto)
la tablaes de
2 ylos
el número
valores de
de observaciones
esta prueba no es se
igual a 76.exactamente
tienen En la tabla de loslos valores de
esta prueba
valores que no se tienen exactamente
corresponden a 76. Sololossevalores
cuentaqueconcorresponden
valores quea 76. Solo se
corresponden
cuenta a 75.que
con valores Secorresponden
utilizará este a número, que será
75. Se utilizará esteuna buena que será una
número,
aproximación de los valores deseados. En este caso: DW L es igual a
buena
1,571 aproximación
y DW S es igual de los valoresConstruyendo
a 1,680. deseados. En lasestezonas
caso: DW L es se
críticas igual a 1,571 y
DW S es igual a 1,680. Construyendo las zonas críticas se tendrán:
tendrán:
0 1,571 1,680 2 2,320 2,429 4
En este
En estecaso
casoelelestadístico
estadísticocae
cae
en en la zona
la zona enque
en la la que el DW
el DW indica
indica la
la presencia de au-
presencia de autocorrelación positiva.
tocorrelación positiva.
j) j) Realice
Realice eleltest
testdedeBreusch-Godfrey
Breusch-Godfreyde
deorden
orden5 5(5(5rezagos).
rezagos). Interprete
Interprete sus
resultados.
sus resultados.
Como se puede observar a continuación, de acuerdo a este test se puede rechazar la
hipótesis
Como senula de no
puede autocorrelación
observar de orden
a continuación, de 5. Por lo atanto,
acuerdo este se tienen
test se claramente
puede rechazar la hipótesis nula de no autocorrelación
problemas de autocorrelación de los errores. de orden 5. Por
lo tanto, se tienen claramente problemas de autocorrelación de los
errores.
174

Se puede observar que los coeficientes no cambian y que los que sí cambian son los
valores de los errores estándar, que decrecen aún más.
resultados.
175

En este caso, la correlación entre las variables no es tan alta como en las preguntas
anteriores. Sin embargo es aún posible tener problemas de multicolinealidad.
n) Utilice el test RESET propuesto por Ramsey para verificar si la forma funcional del
modelo es la adecuada.
176
Como se puede apreciar, se rechaza la hipótesis nula que la forma funcional lineal
es la adecuada. Por lo tanto, se deben probar modelos adicionales. Una sugerencia
seria correr el modelo aumentando la regresión inicial con los regresores al cua-
drado. En la siguiente figura se presenta el caso en que se ha incluido el cuadrado
de los ingresos financieros.
177
o) Utilice el test de errores de predicción, verifique la estabilidad de los parámetros

estimados. El punto donde se iniciará el pronóstico será en el 2007.
Se recuerda que las hipótesis son:

H0 : Los errores de la predicción son ceros para todas las predicciones

 ( los parámetros estimados son estables )

 H1 : Los errores de la predicción no son ceros para todas las predicciones
 ( los parámetros estimados no son estables )

En base a los resultados del test se rechaza la hipótesis nula.

p) Verifique lo encontrado en la pregunta o), pero esta vez empleando el método de las
variables dummies.
Se crean las variables “dum1”, “dum2” y “dum3” que tendrán puros ceros hasta la
observación 74, 75 y 76, respectivamente. Y, en las mencionadas posiciones tendrán
el numero 1. Y se corre la regresión tal como se mostró en el capítulo 11. Los resul-
tados se presentan a continuación.
178

Como se puede apreciar los coeficientes asociados a las dummies son significativas,
lo que sustenta nuestra conclusión de la pregunta anterior. Para asegurarse de esto
se verá si todos los coeficientes relacionados con las variables dummies son cero.
Para eso se emplea el test de Wald. Los resultados de esta prueba son los siguientes:
Como se puede apreciar se rechaza la hipótesis nula de no significancia estadística

de los coeficientes de las dummies. Por lo que se estará seguro de afirmar que los
parámetros no son estables.
179
C a pí t ulo
12
Modelos de series
de tiempo
1) ¿Es una serie de tiempo un proceso estocástico?

Un proceso estocástico es una secuencia de números aleatorios. El proceso estocástico
se escribirá como {yi } para i = 1, 2,… Si este índice representa tiempo, el proceso esto-
cástico se llamará serie de tiempo.
2) ¿Por qué el tener una sola realización de algún proceso estocástico representa un pro-
blema para el cálculo de los parámetros poblacionales?
El principal problema en los modelos de series de tiempo es que en la realidad solo se
observa el proceso estocástico en una de sus varias posibles realizaciones. Por lo tanto,
solo se puede obtener un set de estadísticos (media, varianza, etc.) dadas las observacio-
nes disponibles. En teoría, si se pudieran observar todas las posibles realizaciones del
proceso estocástico, se podrían calcular los parámetros poblacionales (tal como la me-
dia poblacional) simplemente como el promedio de todas las realizaciones.
3) En palabras, ¿cómo define un proceso estacionario?
El concepto de estacionariedad en síntesis significa que todas las observaciones de las
series de tiempo provienen de la misma distribución de probabilidad y que, si a su vez el
proceso no es muy persistente, cada observación contendrá información valorable que
no está presente en ninguna de las otras observaciones, por lo que los estadísticos obte-
nidos de las observaciones serán consistentes con sus respectivos parámetros poblacio-
nales. Por ejemplo, la media de estas observaciones en el tiempo será consistente con la
media poblacional.
181
4) ¿Qué es una serie estacionaria con tendencia?

Es una serie no estacionaria simplemente porque tienen una tendencia determinística.
Es decir, que si se remueve la tendencia, la serie de tiempo se convertirá en una serie
estacionaria.
5) ¿Qué es una serie estacionaria en diferencias?
Una serie de tiempo que no es estacionaria pero que su diferencia sí lo es, se conoce
2
como serie estacionaria en diferencias.
El proceso de ruido blanco (W
6) ¿Es un proceso de ruido blanco un proceso estacionario débil?
El proceso de ruido blanco (White Noise Process) es un proceso débilmente estacionario con media
El proceso
débilmente de ruido
estacionario conblanco
media(White Noise
constante Process)
y no es un proceso débilmente estaciona-
autocorrelación.
rio con media constante y no autocorrelación. 7) ¿Cuál es la diferencia entre las p
7) ¿Cuál es la diferencia entre las pruebas de Box-Pierce and Ljung-Box? Y, ¿cuál es recomendable usar cuan
7) es
¿cuál ¿Cuál es la diferencia
recomendable usarentre
cuando las la
pruebas
muestra de es
Box-Pierce
pequeña? and Ljung-Box? Y, ¿cuál es reco-
mendable usar cuando la muestra es pequeña? Ambas pruebas se distribuyen com
Ambas pruebas se distribuyen como una chi cuadrada debido a que n  ˆ es asintóticamente independiente
Ambas pruebas
es asintóticamente se distribuyeny como
independiente una chi
distribuido cuadrada
como una normal a que nPor
debidoestándar. × ρˆloestanto,
asintóti-
la suma al cuadrado
camente
Por lo tanto, independiente
la suma al cuadradoy distribuido como unaesnormal
de estos números estándar. Por
asintóticamente cuadrada.
chi-lo Los grados de libertad
tanto, la suma
cuadrada. Los grados
al cuadrado de libertad
de estos números de esesta distribución son
asintóticamente iguales a m,
chi-cuadrada. que
Los representa
grados el número de rezagos d
de libertad
representa el número de rezagos deseados.
de esta distribución son iguales a m, que representa el número de rezagos deseados.
El método de Ljung-Box es prefe
El método de Ljung-Box es preferido cuando el tamaño de la muestra es pequeño.
El método de Ljung-Box es preferido cuando el tamaño de la muestra Como se puede observ
es pequeño.
pequeño. ComoComo se puede
se puede observar,
observar, la diferencia
la diferencia entre entre estos
estos dos dos métodos
métodos desaparece
desaparece conforme conforme
n n (número d
desaparece
(número conforme n (número de
de observaciones) observaciones) se incrementa.
se incrementa.
8) Se tienen las siguientes autoc
Se tienen
8) Se 8) tienen las siguientes
las siguientes autocorrelacionesestimadas:
autocorrelaciones estimadas: 𝜌𝜌1 = 0,89; 𝜌𝜌2 = 0,49; 𝜌𝜌3 = 0,07.. Determinar si esta
3 = 0,07. Determinar
0,49; 𝜌𝜌Determinar si de
si esta serie esta serie es
tiempo deestacionaria
tiempo es estacionaria de el
usando
usando el criterio los criterio de de
intervalos los intervalos de co
el criterio de los intervalos de confianza y las pruebas de Box-Pierce
confianza y las pruebas de Box-Pierce y Ljung-Box. Asuma que el nivel de confianza y Ljung-Box. Asuma que el nivel d
Ljung-Box. Asuma que el nivel de confianza estadístico deseado es del 95% y que el número de observac
estadístico deseado es del 95% y que el número de observaciones es 100.
95% y que el número de observaciones es 100.
De acuerdo al criterio de los intervalos de confianza se tendría (asumiendo De acuerdo
un nivelaldecriterio de los interv
De acuerdo al criterio
confianza del 5%): de los intervalos de confianza se tendría (asumiendo un nivel de confianza del 5%):
un nivel de confianza del 5%):
 1   1 
ρ ∈  ±1,96 × → ρ ∈ [−0,196;0,196]    1,96 
  
100 1  
100 
   1,96      [0,196;0,196] 
 100 
Por lo tanto, las dos primeras autocorrelaciones serían significativas, mientras que la
Por lo tanto, las dos primeras
Por loultima
tanto,nolaslo sería.
dos primeras autocorrelaciones serían significativas, mientras que la ultima no lo sería.
mientras
Se que la ultima
utiliza no lo
la prueba desería.
Box-Pierce:
m
Se utiliza la prueba de Box-Pierce
Se utiliza la prueba de Box-Pierce:
Box − Pierce(Q) = ∑ ( n × ρˆ j ) = ( 100 × 0,89) +( 100 × 0, 49) + ( 100 × 0, 07) 2
2 2 2
j =1 m
Box  Pierce
m
)  ((Q)n= ˆ j ) 71 ( 100  0,89) ( 100  0, 49)  ( 100  0, 07)
2 2 2 2
Box  Pierce(Q)  ( n  ˆ j )2  ( 10
Box(−QPierce 103, j 1
j 1
m
n+2 Box  Pier
Ljung − Box(Q) = ∑Box × ( n ρˆ )
n − j Pierce(Q) 
j =1
2
103,71
j
m
n2 Ljung  Box(Q)
Ljung  Box(Q)   n  j (
j 1
n ˆ j )2
182
 100  2  2 1
 100  2   100  2   100  2  Ljung  Box(Q
)    ( 100  0,89)  
Ljung  Box(Q
)  2
  ( 100  0,89)  
2
  ( 100  0, 49)     ( 100  0, 07)
2
 100  1  1
100  1 100  2 100  3
capítulo 12 Modelos de series de tiempo
 100 + 2  2  100 + 2  2  100 + 2  2

Ljung − Box(Q=
)   × ( 100 × 0,89) +   × ( 100 × 0, 49) +   × ( 100 × 0, 07)
 100 − 1   100 − 2   100 − 3 
Ljung − Box(Q) =
107,12
La hipótesis nula en este caso es:

H 0 : ρ=
1 ρ=
2 ρ=
3 0
Lo que se prueba es la no existencia de autocorrelación de hasta tercer orden. Se conoce

que ambas pruebas se distribuyen como una chi cuadrada con 3 grados de libertad
(m = 3). Si se desea un nivel de significancia del 5% (es una prueba no direccional, por
lo que cada cola será igual al 2,5%), el valor crítico superior de la chi cuadrada para es-
tos grados de libertad será igual a 9,3484. Por lo tanto, como los valores de las pruebas
son 103,71 y 107,12, para el Box-Pierce and Ljung-Box, respectivamente, se rechazará
la hipótesis nula. Lo que significa que existe autocorrelación significativa hasta el tercer
rezago.
9) ¿En los modelos de series de tiempo univariados, ¿se asume que los errores son ruidos
blancos?
Este supuesto es usual y es más débil que asumir que los errores son i.i.d. (independien-
tes e idénticamente distribuidos).
10) Escriba la ecuación de un modelo MA(4).
yt = µ + ut + θ1 × ut −1 + θ 2 × ut − 2 + θ3 × ut −3 + θ 4 × ut − 4
11) Escriba la ecuación de un modelo AR(3).

yt = µ + φ1 × yt −1 + φ2 × yt − 2 + φ3 × yt −3 + ut
12) ¿Por qué es importante la condición de invertibilidad del proceso MA(q)?

Porque con esta condición se asegura que el proceso MA es estacionario, es decir, que el
proceso tiende a volver a su media de largo plazo.
13) ¿Por qué es importante la condición de estacionariedad del proceso AR(p)?
Porque con esta condición se asegura que el proceso AR es estacionario, es decir, que el
proceso tiende a volver a su media de largo plazo.
14) ¿Si un proceso AR(p) es estacionario, podrá expresarse como un proceso MA(∞)?
Correcto. Esto se llama teorema de descomposición de Wold. Observe las ecuaciones
(76) a (82) del capítulo 12.
15) En un proceso MA(5), ¿cuántas autocorrelaciones distintas de cero se tendrán?
Se tendrán 5, después de eso las autocorrelaciones serán cero.
183
16) En un proceso AR(5), ¿cuántas autocorrelaciones distintas de cero se tendrán?

Infinitas. En un proceso AR las autocorrelaciones decaen asintóticamente.
17) ¿Es un proceso con raíz unitaria un proceso estacionario?
No. Un proceso con raíz unitaria en un proceso no estacionario.
18) Escriba la ecuación de un modelo ARMA(3,4).
yt = µ + φ1 × yt −1 + φ2 × yt − 2 + φ3 × yt −3 + ut + θ1 × ut −1 + θ 2 × ut − 2 + θ3 × ut −3 + θ 4 × ut − 4
19) Si tiene un proceso en el que las autocorrelaciones son iguales a cero después de 2 reza-
gos y donde las autocorrelaciones parciales decaen asintóticamente, ¿qué modelo univa-
riado de series de tiempo podría ser el adecuado?
El modelo más adecuado es MA(2).
20) Sitiene un proceso en el que las autocorrelaciones y las autocorrelaciones parciales de-
caen asintóticamente, ¿qué modelo univariado de series de tiempo podría ser el ade-
cuado?
ARMA(p,q), donde p y q se tienen que determinar usando algún criterio de informa-
ción.
21) ¿Qué se entiende por parsimonia?
En modelos de series de tiempo la idea de parsimonia se refiere a que siempre se prefe-
rirá un modelo con un menor número de rezagos si la influencia marginal de incluir
rezagos adicionales en el modelo es baja.
22) Si se tiene un pronóstico cuyo MAPE es menor que 1, ¿puede afirmar que estos pronós-
ticos son mejores que los pronósticos de un modelo de camino aleatorio?
Correcto.
23) En términos de la descomposición de los errores de predicción, ¿se desea que el compo-
nente de correlación sea el que es mayor?, ¿por qué?
Porque se desea que los pronósticos sean insesgados y eficientes. Por lo que se espera
que los componentes del insesgamiento y de la varianza sean bastante bajos.
24) Se tiene información presentada en la hoja de Excel peaje_2007_2008.xlsx. Este ar-
chivo contiene los ingresos mensuales en miles de US dólares por concepto de cobro de
peaje de una empresa dedicada a la administración de carreteras. Los datos correspon-
den a los años 2007 al 2008 (24 observaciones). Con base en estos datos y asumiendo
un nivel de significancia estadístico del 5%, responder usando EViews (sugerencia: di-
ferencie dos veces la serie para hacerla estacionaria y poder estimar el modelo).
El archivo de EViews que contiene la solución de este problema se llama: “capitulo12_
problema24_ peaje_2007_2008.wf1”
184
a) Grafique la serie:
b) Visualmente, ¿es la serie es estacionaria?

No es estacionaria.
c) Convierta la serie a retornos (para las siguientes preguntas trabaje con esta serie).
La serie se llama “drpeaje”. Se generó de la siguiente manera:
genr rpeaje=(peaje-peaje(-1))/peaje(-1)
Y para convertir esta serie que aún no es estacionaria se toma la diferencia de la
misma:
genr drpeaje=d(rpeaje)
Es con esta serie que se trabajará.
185
d) Determine el modelo de series de tiempo que mejor se ajuste a la serie de los retor-
nos. Use el método gráfico y los criterios de información.
Por el método gráfico parece que la serie es una serie de ruido blanco. Se utilizan
los criterios de información y el modelo que mejor se acomoda a los datos de acuerdo
al AIC es ARMA(5,1). La siguiente tabla presenta los resultados.
AR ↓ / MA → 1 2 3 4 5
1 AIC -2,399937 -2,144301 -3,036256 -3,097501 -2,262856
BIC -2,367553 -1,945345 -2,787560 -2,799066 -1,914681
2 AIC -2,351186 -2,286551 -2,105357 -1,838040 -2,730849
BIC -2,152040 -2,037618 -1,806637 -1,489534 -2,332556
3 AIC -2,238808 -2,739238 -2,713945 -2,643450 -2,662308
BIC -1,990272 -2,440994 -2,365994 -2,245792 -2,214942
4 AIC -2,444835 -2,696527 -2,035197 -3,002999 -2,874146
BIC -2,148045 -2,350271 -1,639476 -2,557813 -2,379495
5 AIC -3,382618 -3,165640 -1,831467 -2,977382 -1,335567
BIC -3,039530 -2,773540 -1,390355 -2,487256 -0,796429
Sin embargo, cuando se corre la regresión se puede apreciar que el proceso MA es

uno no invertible, por lo que el modelo final será un modelo AR(5).
Como se puede observar este modelo es estacionario.
186
e) Realice el pronóstico estático de los últimos tres meses (2008:10 al 2008:12).
f) Determine la calidad de los pronósticos con base en los criterios de evaluación pre-
sentados.
En lo que se refiere al MAPE, si este es menor que 1 (o 100%), significa que el mo-
delo que se está utilizando es mejor que el modelo de caminos aleatorios. En este
ejemplo, ese es el caso, el MAPE es igual al 40,44138%. Asimismo, el coeficiente
de desigualdad de Theil es significativamente menor que 1, lo que significa que el
modelo utilizado es mejor que el modelo de caminos aleatorios.
g) Grafique los datos pronosticados con los datos reales.
187
25) Se cuenta con datos anuales correspondientes al ingreso neto de los bancos de los Esta-
dos Unidos, desde el año 1980 al año 2009. Estos datos han sido obtenidos de la página
de internet de la Federal Deposit Insurance Corporation (FDIC) de los Estados Unidos
(http://www2.fdic.gov/hsob/hsobRpt.asp). Los datos presentan valores agregados de
todos los bancos comerciales en ese país expresados en miles de US dólares. El archivo
Excel que contiene esta información es Bancos_IngresoNeto_1980_2009.xlsx. Con
base en estos datos y asumiendo un nivel de significancia estadístico del 5%, responda
usando EViews:
El archivo de EViews que contiene la solución de este problema se llama: “capitulo12_
problema25_ Bancos_IngresoNeto_1980_2009.wf1”
a) Grafique la serie.
Visualmente, ¿es la serie es estacionaria?

b)
No.
La serie se llama “ring”. Se generó de la siguiente manera:
genr ring=(ingreso- ingreso (-1))/ ingreso (-1)
Por el método gráfico parece que la serie en una serie de ruido blanco. Al utilizar
los criterios de información, el modelo que mejor se acomoda a los datos de acuerdo
al AIC es ARMA(2,3). En este caso se emplean 4 rezagos asumiendo que la in-
fluencia máxima son 3 años. La siguiente tabla presenta los resultados.
188
AR ↓ / MA → 1 2 3
1 AIC 3,793366 3,746353 3,816016
BIC 3,888523 3,889089 4,006331
2 AIC 3,908946 3,668110 3,453164
BIC 4,052928 3,860085 3,693134
3 AIC 3,862707 3,784971 3,616057
BIC 4,056260 4,026912 3,906387
e) Realice el pronóstico estático de los últimos tres años (2007 al 2009).
f) Determine la calidad de los pronósticos con los criterios de evaluación presentados.

delo que se está utilizando es mejor que el modelo de camino aleatorio. En este
ejemplo, ese no es el caso, el MAPE es igual al 115,1498%. Sin embargo, el coefi-
ciente de desigualdad de Theil es significativamente menor que 1, lo que significa
que el modelo utilizado es mejor que el modelo de camino aleatorio. En este caso,
lo que puede haber pasado es que un solo error de pronóstico puede haber causado
que el MAPE sea mayor que 100%. Por esto se prefiere al coeficiente de desigual-
dad de Theil.
189
Donde “ringf” es el pronóstico de la serie.

26) Utilice internet busque los datos diarios que correspondan a los años 2009 y 2010 del
índice financiero de NASDAQ (sugerencia: buscar en Yahoo Finance). Con estos datos
y asumiendo un nivel de significancia estadístico del 5%, responda usando EViews.
La serie usada corresponde al 2 de enero del 2009 al 31 de diciembre del 2010. Los da-
tos y las respuestas a las preguntas se encuentran en el archivo de EViews “capitulo12_
problema26_nasdaq_2009_2010.wf1”.
a) Grafique la serie.
190
Visualmente, ¿es la serie estacionaria?

b)
No.
Se utiliza el comando EViews “dlog” para calcular los retornos en logaritmos de la
serie NASDAQ. La nueva serie se llama “ret” y cuyo gráfico se presenta a continua-
ción:
AR ↓ / MA → 1 2 3 4 5
1 AIC -5.520749 -5.527939 -5.524351 -5.521641 -5.519519
BIC -5.495538 -5.494325 -5.482333 -5.471220 -5.460694
2 AIC -5.526833 -5.522938 -5.531490 -5.531424 -5.585655
BIC -5.493168 -5.480856 -5.480992 -5.472509 -5.518324
3 AIC -5.522276 -5.542327 -5.599040 -5.574010 -5.592924
BIC -5.480130 -5.491752 -5.540036 -5.506576 -5.517061
4 AIC -5.531202 -5.541879 -5.594016 -5.589944 -5.615341
BIC -5.480549 -5.482785 -5.526480 -5.513965 -5.530920
5 AIC -5.524775 -5.520783 -5.590047 -5.586177 -5.615525
BIC -5.465589 -5.453143 -5.513952 -5.501627 -5.522520
De acuerdo al criterio de AIC el mejor modelo es al ARMA(4,5) y de acuerdo al

BIC es el ARMA(3,3). Por parsimonia, se escogerá el modelo seleccionado con el
BIC.
191
e) Realice el pronóstico estático de los últimos tres meses (2010:10 al 2010:12).

Primero, se estima el modelo cuyos resultados se presentan a continuación:
Se pronosticarán los retornos de los últimos dos meses del 2010 (desde la observa-
ción 455 a la observación 504). El resultado del pronóstico se muestra a continua-
ción:
192
f) Determine la calidad de los pronósticos en base a los criterios de evaluación presen-

tados.
delo que se está utilizando es mejor que el modelo de caminos aleatorios. En este
ejemplo, ese no es el caso, el MAPE es igual al 374,0100%. Sin embargo, el coefi-
ciente de desigualdad de Theil es significativamente menor que 1, lo que significa
que el modelo utilizado es mejor que el modelo de camino aleatorio. En este caso,
lo que puede haber pasado es que un solo error de pronóstico puede haber causado
que el MAPE sea mayor que 100%. Por esto se prefiere al coeficiente de desigual-
dad de Theil. Asimismo, se puede observar que el “bias proportion” es bastante
cercano a cero (lo que indica que los pronósticos son insesgados) y el “variance pro-
portion” es pequeño comparado con el “covariance proportion” (es algo deseado).
En base a esto se puede afirmar que los pronósticos creados con el modelo
ARMA(3,3) son mejores que los que se pudieran haber obtenido con el modelo de
camino aleatorio.
193
C a pí t ulo
13
Modelos para la
volatilidad condicional:
Los modelos de heteroscedasticidad
condicional autorregresiva
1) ¿Qué entiende por movimientos de agrupados de volatilidad (Volatility Clustering)?

Los movimientos de volatilidad agrupados se observan frecuentemente en las series de
los retornos de las acciones cotizadas en las bolsas de valores. Estos movimientos se de-
ben a que grandes cambios en los precios de las acciones tienden a ser seguidas de gran-
des cambios, de cualquier signo, y pequeños cambios son seguidos de pequeños
cambios. Este movimiento en los retornos, a su vez, genera similar comportamiento en
la volatilidad del instrumento financiero. Es decir que, grandes cambios de volatilidad
tienden a seguir grandes cambios mientras que pequeños cambios de volatilidad tien-
den a seguir pequeños cambios.
2) Explique cómo el modelo ARCH captura los movimientos agrupados de volatilidad.
El modelo ARCH es capaz de capturar este tipo de movimiento de la volatilidad. Para
observar esto se debe examinar la última parte de la Ecuación (9). En esta ecuación se
puede advertir que la volatilidad condicional es una función de los errores al cuadrado.
Por lo tanto, si ut-1 fue grande en términos absolutos, se espera que las siguientes va-
195
rianzas condicionales sean también grandes. Asimismo, si ut-1 fue pequeña, por el mo-
delo la varianza condicional, en el período t, t+1, etc., también será pequeña.
3) Explique la condición de estacionariedad del modelo ARCH.
La varianza incondicional del modelo ARCH está dada por:
ω
σ 2 E=
= ( µt2 ) q
(14)
1 − ∑α j
j =1
Se advierte que para asegurar la no negatividad de la varianza, se requiere que ω y αj ,

q
para j = 1, 2,…, q, sean no negativos y que ∑ α j sea menor que la unidad. A esta condi-
j =1
ción se le conoce como la condición de estacionariedad.
4) ¿Cuáles son los principales problemas del modelo ARCH?
El principal problema con el modelo ARCH es que muchas veces el número de rezagos
(q) requeridos es bastante grande. Esto presenta una serie de problemas generados por
la no parsimonia del modelo, entre los cuales el más grave es el que la condición de no
negatividad puede ser violada, lo que significa que se pueden obtener varianzas condi-
cionales negativas.
Otro problema del modelo ARCH es el hecho mismo de la determinación del número
óptimo de rezagos a utilizar (q). Hasta ahora no existe un método universalmente acep-
tado.
5) ¿Cuál es la intuición detrás del uso del modelo ARCH-M?
En finanzas existe una relación que es de bastante uso: la relación entre riesgo y renta-
bilidad. La idea básica es que a más riesgo se exigirá más rentabilidad, es decir, que el
riesgo tiene un precio que debe ser considerado. En términos de lo que se está anali-
zando, esto significa que la ecuación de la media condicional debe considerar el efecto
de la varianza condicional.
6) Exprese el modelo GARCH (1,1) en un modelo ARCH (∞).
ω ∞
σ t2
= + α ∑ β j −1ut2− j
(1 − β ) j =1
Para ver la forma en que se arriba a esta ecuación se recomienda ver las ecuaciones (94)
a (98) del capítulo 13.
7) ¿Puede el modelo GARCH modelar la asimetría de los movimientos de la volatilidad?
No, pero existen varias modificaciones del modelo GARCH que permiten capturar
esta asimetría: los modelos TARCH, EGARCH y el modelo de componentes ARCH,
son ejemplos de modelos que pueden capturar asimetrías.
196
capítulo 13 Modelos para la volatilidad condicional
8) Explique el concepto del efecto de apalancamiento y las posibles causas del mismo.
El efecto de apalancamiento se refiere al hecho que cuando el precio de las acciones cae,
el ratio de apalancamiento, definido como los pasivos divididos por el capital social de
la empresa, crece. Desde el punto de vista de los accionistas, este incremento implica
que los flujos de caja futuros son más inciertos, por lo que su reacción frente a caídas en
los precios de las acciones, movimientos adversos, será mucho más acentuada que en el
caso de observarse movimientos al alza de los precios.
9) Utilice internet y busque los datos diarios que correspondan a los años 2000 al 2010
del índice financiero de NASDAQ (sugerencia: buscar en Yahoo Finance). Con base en
estos datos y asumiendo un nivel de significancia estadístico del 5%, responda usando
EViews:
Los datos de este ejercicio se encuentran en “Nasdaq_2000_2010.xlsx” y la solución
del problema en “capitulo13_problema9_ Nasdaq_2000_2010.wf1”.
a) Grafique la serie de los retornos.
b) De acuerdo al gráfico de la pregunta anterior, se puede decir que existen movimien-

tos agrupados de volatilidad (Volatility Clustering), explique.
Como se puede observar, los retornos tienden a agruparse y ocurrir en grupos clara-
mente definidos por periodos de gran volatilidad y otros de baja volatilidad. Obsér-
vese, por ejemplo, el movimiento de los retornos durante las observaciones
2.200-2.500 que corresponden a los años 2008 y 2009 (gran volatilidad), en com-
paración con el correspondiente a los 2004-2006 (baja volatilidad).
197
c) Determine la existencia de efectos ARCH en esta serie de tiempo.

Al seguir el procedimiento señalado en el capítulo, se obtiene:
Como el p-valor (0,0000) es menor que el nivel de significancia estadístico (5%), se

rechaza la hipótesis nula, lo que quiere decir que la serie de retornos del índice de
NASDAQ presenta efectos ARCH, los cuales se necesitan modelar adecuadamente.
d) Modele la media condicional como un modelo AR(2) y la varianza condicional
como un modelo GARCH(1,1).
198
e) Analice los resultados obtenidos en el punto d): verifique la significancia estadística

de cada uno de los coeficientes del modelo. Realice el pronóstico de la volatilidad
condicional de los últimos 20 días de la muestra. Use el método dinámico.
Si se observan los resultados de la media condicional se puede advertir que el p-va-
lor de la media incondicional (c) es estadísticamente significativo (el p-valor es igual
a 0,000, que es menor que 0,05, por lo que se rechaza la hipótesis nula que el inter-
cepto es igual a cero). Asimismo, se puede apreciar que el coeficiente del AR(2) es
significativo, lo que puede sugerir que este modelo es adecuado para modelar la
media condicional del índice.
Ahora se pasan a analizar los resultados de la varianza condicional, la cual se ha
modelado como un modelo GARCH(1,1). Para seguir con la terminología del mo-
delo presentado en la Ecuación (19), el coeficiente “C” corresponde a ω,
“RESID(-1)^2” corresponde a α y “GARCH(-1)” a β.
Se procede a verificar si los supuestos del modelo se satisfacen: primero, todos los
coeficientes son positivos; segundo, la condición de estacionariedad (α + β < 1) es
satisfecha. Al tomar estos dos supuestos a la vez, se puede estar seguro que la va-
rianza incondicional, Ecuación (24), será positiva.
Finalmente todos los coeficientes de la parte GARCH son significativos.
El pronóstico de los últimos 20 días:
199
sentados en el capítulo 12.
La primera parte del gráfico presenta los pronósticos de la media condicional y la
segunda parte a la volatilidad condicional. En el caso de la varianza condicional se
puede advertir que esta estuvo debajo del promedio de la varianza incondicional,
por lo que se observa que en el tiempo estos pronósticos tienden a ese promedio de
largo plazo (de ahí la pendiente positiva de esa recta). Asimismo se puede apreciar
que el MAPE y el índice de Theil son menores que 100% y 1, respectivamente.
Esto significa que los pronósticos del modelo son mejores que los pronósticos del
modelo de camino aleatorio.
g) Realice el pronóstico de la volatilidad condicional de los últimos 20 días de la mues-
tra. Use el método estático.
10) Use los datos recolectados en la pregunta 9 y realice lo siguiente:

La solución del problema en “capitulo13_problema10_ Nasdaq_2000_2010.wf1”.
a) Utilice EViews, modele la media condicional como un modelo AR(1) y la varianza
condicional como un modelo TARCH con “threshold” igual a 1.
200
b) Analice los resultados obtenidos en el punto a): verifique la significancia estadística

de cada uno de los coeficientes del modelo. Recuerde que el nivel de significancia
deseado es igual al 5%.
En los resultados presentados en la pregunta a), el término γ × ut2−1 × dt −1 de la Ecua-
ción (27) corresponde a “RESID (-1)^2*(RESID (-1)<0)”. Por lo tanto, este término
representa el efecto de las malas noticias en la varianza condicional. Se puede obser-
var que este coeficiente es significativo e igual a 0,110607. Como es estadística-
mente significativo y mayor que 0, se puede afirmar que el efecto apalancamiento
está presente y que, además, como este coeficiente es distinto de cero, se puede for-
mular que la curva del impacto de las noticias es asimétrico.
c) En base a su respuesta de la pregunta b), ¿se puede afirmar que el efecto de apalan-
camiento está presente en la serie de tiempo?
Como el coeficiente de asimetría es estadísticamente significativo y mayor que 0, se
puede afirmar que el efecto apalancamiento está presente.
d) En base a su respuesta de la pregunta b), ¿se puede verificar la asimetría de la res-
puesta de la volatilidad?
Como este coeficiente es distinto de cero, se puede formular que la curva del im-
pacto de las noticias es asimétrica.
201
e) Realice el pronóstico de la volatilidad condicional de los últimos 20 días de la mues-

tra. Use el método dinámico.
segunda parte al de la volatilidad condicional. En el caso, de la varianza condicio-
nal, se puede advertir que esta estuvo debajo del promedio de la varianza incondi-
cional, por lo que se observa que en el tiempo estos pronósticos tienden a ese
promedio de largo plazo (de ahí la pendiente positiva de esa recta). Asimismo se
puede apreciar que el MAPE y el índice de Theil son menores que 100% y 1, res-
pectivamente. Esto significa que los pronósticos del modelo son mejores que los
pronósticos del modelo de camino aleatorio.
11) Utilice los datos recolectados en la pregunta 9 y realice lo siguiente:
a) Use EViews, modele la media condicional como un modelo AR(1) y la varianza
condicional como un modelo EGARCH(1,1).
202

En el gráfico de la pregunta a) se puede observar que el coeficiente γ es estadística-
mente significativo (p-valor = 0.000) y negativo (γ = −0,087477).1 Esto último im-
plica que el efecto de apalancamiento está presente y, finalmente, como γ es distinto
de cero, el impacto de las noticias (buenas o malas) en la varianza condicional es
asimétrico.
c) En base a su respuesta de la pregunta b), ¿se puede afirmar que el efecto de apalan-
Como el coeficiente γ es estadísticamente significativo y negativo. Esto último im-
plica que el efecto de apalancamiento está presente
En base a su respuesta de la pregunta b), ¿se puede verificar la asimetría de la res-
d)
Como γ es distinto de cero, el impacto de las noticias (buenas o malas) en la va-
rianza condicional es asimétrico.
1 Nótese, que este coeficiente corresponde a C(4), tal como se puede apreciar en la siguiente ecuación presentada en la misma ventana
de resultados de EViews: LOG(GARCH) = C(3) + C(4)*ABS(RESID(-1)/@SQRT(GARCH(-1))) + C(5)*RESID(-1)/@SQRT(GARCH(-1))
+ C(6)*LOG(GARCH(-1)).
203

segunda parte a la de la volatilidad condicional. En el caso de la varianza condicio-
nal, se puede advertir que esta estuvo debajo del promedio de la varianza incondi-
cional, por lo que se observa que en el tiempo estos pronósticos tienden a ese
promedio de largo plazo (de ahí la pendiente positiva de esa recta). Asimismo se
puede apreciar que el MAPE y el índice de Theil son menores que 100% y 1, res-
pectivamente. Esto significa que los pronósticos del modelo son mejores que los
pronósticos del modelo de camino aleatorio.
g) Grafique la curva de impacto de las noticias usando los resultados de este modelo.
204
12) Emplee los datos recolectados en la pregunta 9 y realice lo siguiente:

a) Use EViews, modele la media condicional como un modelo AR(1) y la varianza
condicional como un modelo de componentes ARCH(1,1) que además capture los
efectos de apalancamiento y asimetría en los movimientos de la volatilidad (utilice
threshold = 1).
205

En este caso, el coeficiente que muestra la convergencia de la volatilidad de largo
plazo (qt ) a ω está dado por C(4), que es igual a 0,994481. Como se mencionó an-
teriormente, esto significa que el componente de largo plazo converge lentamente al
nivel de equilibrio. La velocidad de convergencia de la parte transitoria está dada
por la suma de (α + β), que en este caso es igual a [C(6)+C(7)]. Esta suma es igual a
−0,159244 (= - 0,103038 - 0,056206).
En base a su respuesta de la pregunta b), ¿se puede afirmar que el efecto de apalan-
c)
Sí.
d) En base a su respuesta de la pregunta b), ¿se puede verificar la asimetría de la res-
Finalmente, se presenta el mismo modelo pero esta vez se introduce el factor de
asimetría tal como se muestra a continuación:
206
En este caso la variable de interés para analizar si existe el efecto de apalancamiento

es el coeficiente γ de la Ecuación (41) que en este caso se presenta como C(7).
Como se puede ver en el gráfico anterior, este coeficiente es estadísticamente signi-
ficativo, positivo e igual a 0,037565. Este resultado implica que efectivamente exis-
ten efectos transitorios de apalancamiento.
segunda parte de la volatilidad condicional. En el caso de la varianza condicional,
se puede advertir que esta estuvo debajo del promedio de la varianza incondicional,
por lo que se observa que en el tiempo estos pronósticos tienden a ese promedio de
largo plazo (de ahí la pendiente positiva de esa recta). Asimismo se puede apreciar
que el MAPE y el índice de Theil son menores que 100% y 1, respectivamente.
Esto significa que los pronósticos del modelo son mejores que los pronósticos del
modelo de camino aleatorio.
207
C a pí t ulo
14
Modelos de Series de Tiempo

Multivariados y el Concepto
de Cointegración
1. ¿Qué entiende por no estacionariedad?

El concepto de estacionariedad, en síntesis significa que todas las observaciones de la
serie de tiempo provienen de la misma distribución de probabilidad y que, si a su vez, el
proceso no es muy persistente, cada observación contendrá información valorable que
no está presente en ninguna de las otras observaciones, por lo que los estadísticos obte-
nidos de las observaciones serán consistentes con sus respectivos parámetros poblacio-
nales. Por ejemplo, la media de estas observaciones en el tiempo será consistente con la
media poblacional.
2. ¿Cuál es la diferencia entre no estacionariedad en tendencia y estocástica?
En una serie no estacionaria en tendencia, los momentos de su distribución de probabi-
lidad no serán constantes (condición para estacionariedad). Sin embargo, si se tiene esta
serie no estacionaria en tendencias y se desea convertirla en una estacionaria, lo que se
tendrá que hacer será simplemente correr la siguiente regresión:
yt = α + β × T + ut
Y luego se trabaja con los residuos estimados.
209
En el caso de una serie no estacionaria estocástica, la serie no presenta una tendencia

clara como en el caso anterior pero es aún no estacionaria.
Si uno tiene series no estacionarias estocásticas, el procedimiento para convertirlas en
series estacionarias será el diferenciarlas, es decir:
∆y = yt − yt −1
3. ¿Es correcto diferenciar una serie no estacionaria en tendencia para convertirla en esta-
cionaria? Justifique su respuesta.
No, porque al hacer esto se introducirá un proceso MA no invertible. Para observar
esto, en detalle, se recomienda examinar las ecuaciones (4) y (5) de este capítulo.
4. ¿Qué es una serie I(1)?
Una serie I(1) es una serie no estacionaria que para ser convertida en una serie estacio-
naria necesita ser diferenciada 1 vez.
5. ¿Cuál es la idea de la prueba aumentada de Dickey-Fuller?
La idea fundamental de la prueba aumentada de Dickey-Fuller es que para detectar la
presencia de raíces unitarias, la ecuación de las hipótesis debe considerar rezagos de la
variable endógena que permita que los errores sea no autocorrelacionados.
6. ¿Cuál es la diferencia entre la prueba de Dickey-Fuller y la prueba aumentada de
Dickey-Fuller?
El estadístico de DF presentado en la ecuación (6) o su equivalente en la ecuación (16)
asume que los errores son no autocorrelacionados. Sin embargo, en la práctica este su-
puesto puede no cumplirse. Es por esto que DF modificaron el test original de tal ma-
nera de hacer que los errores sean efectivamente no correlacionados. La idea es bastante
simple: para evitar que los errores sean autocorrelacionados se aumenta en la ecuación
(6) (o (16)) p-rezagos de la serie de la siguiente manera:
p
∆yt = λ × yt −1 + ∑ δ i × ∆yt −i + ut
i =1
7. Escriba cual sería la ecuación de un modelo VAR(2) tri-variado. ¿Cuál sería el número
de variables a estimar?
y1,t α1 β1,1 β1,2 β1,3 y1,t −1 γ 1,1 γ 1,2 γ 1,3 y1,t − 2 u1,t
y2,t =α 2 + β 2,1 β 2,2 β 2,3 × y2,t −1 + γ 2,1 γ 2,2 γ 2,3 × y2,t −2 + u2,t
y3,t α 3 β3,1 β3,2 β3,3 y3,t −1 γ 3,1 γ 3,2 γ 3,3 y3,t − 2 u3,t
El número de coeficientes a estimar en este modelo VAR(p) irrestricto es igual a

(r + p × r2). En nuestro caso r = 3 y p = 2, por lo tanto, se tendrán (3 + 2 × 32) = 21.
210
capítulo 14 Modelos de Series de Tiempo Multivariados y el Concepto de Cointegración
8. ¿Por qué un modelo que trabaja con series en diferencias solo puede capturar las relacio-
nes de corto plazo entre las variables?
Se escribe nuevamente la ecuación (49) del capítulo en la que cada variable ha sido di-
ferenciada:
∆yt= α + β1 × ∆yt −1 + β 2 × ∆yt − 2 + ... + β k × ∆yt − k + ut
Si existe una relación de largo plazo, también conocida como equilibrio o situación es-
tacionaria, todas las variables no variarán con el tiempo, es decir que:
y y=
= t yt −1
Por lo tanto, si se aplica esta condición de equilibrio en la ecuación (49) se observará

que todas las variables en diferencias desaparecerán, ya que estas variables se han calcu-
lado como yt - yt-1, por lo que es igual a cero. Por lo tanto, queda claro que cuando las
variables incluidas en el sistema están en diferencias solo se están modelando las rela-
ciones de corto plazo entre las variables.
9. Escriba el modelo de corrección de errores y explique cada uno de los coeficientes del
modelo.
Si las series son cointegradas se puede utilizar el modelo de corrección de errores, que
toma la siguiente forma:
∆yt= α + β1 × ∆X 1,t + β 2 × ∆X 2,t + β 3 ( yt −1 − γ − δ1 × X 1,t −1 − δ 2 × X 2,t −1 )
En este caso, sí existe un vector de cointegración ( 1, −γ , −δ1 , −δ 2 ) implicará que el tér-

mino entre paréntesis es estacionario y, por lo tanto, esta ecuación puede ser adecuada-
mente estimada y será posible realizar inferencia sobre los coeficientes estimados.
También nótese que ( δ1 , δ 2 ) representan las relaciones de largo plazo entre la variable y
y las variables X1 y X 2, respectivamente.
10. Escriba un modelo en corrección de errores donde se tienen las siguientes variables: y1,t ,
x1,t , x2,t y x3,t .
∆y1,t= α + β1∆X 1,t + β 2 × ∆X 2,t + β3 × ∆X 3,t + β 4 ( y1,t −1 − γ − δ1 × X 1,t −1 − δ 2 × X 2,t −1 − δ 3 × X 3,t −1 )
11. ¿Qué entiende por cointegración?

La idea fundamental de la cointegración es que existe una relación de largo plazo entre
las variables. Es decir, que existe alguna fuerza que hace que las variables tiendan a un
equilibrio o a un estado estacionario en el largo plazo.
12. ¿Qué es un vector de cointegración y por qué es importante para el uso de modelos de
corrección de errores?
Se asume que se tienen k, cada una de las cuales es I(1). Se afirma que existe una rela-
ción de largo plazo o una relación de cointegración, si existe una combinación lineal
211
que hace que estas sean integradas de orden cero (I(0)), es decir, que si existe un vector
de cointegración de tal manera que la serie resultante sea estacionaria o I(0). Matemáti-
camente,
k
∑δ × y
i
i i ∼ I (0)
13. Explique la lógica de la prueba de Johansen.

El test de Johansen se basa en la siguiente ecuación:
∆yt = Η1 × ∆yt −1 + Η 2 × ∆yt − 2 + ... + Η k −1 × ∆yt −( k −1) + Γ × yt − k + ut
El último término es el que captura la relación de largo plazo de las variables en caso
que se encuentre uno o más vectores de cointegración.
Es justamente en este último término en el que el test de Johansen se basa. La prueba
analiza los valores propios de la matriz Γ y su rango. Se conoce que el rango de una
matriz es igual al número de valores propios diferentes de cero.
En el caso de tener variables estacionarias se puede demostrar que la matriz Γ tendría
rango completo, es decir, que el número de valores propios diferentes de cero sería exac-
tamente igual al número de variables en el sistema, que en este caso se ha llamado “r”.
En el caso que se tenga variables I(1), el rango necesariamente será menor r, lo que a su
vez significa que el número de valores propios también será menor que r.
Se debe de recordar que a cada valor propio le corresponde un vector propio. En el caso
de la prueba de Johansen, estos vectores propios corresponden a los vectores de cointe-
gración que se están buscando. Como se mencionó anteriormente, el número máximo
de vectores de cointegración es igual a r – 1.
Existen dos test para detectar la presencia de vectores de cointegración: el test de la
traza y el test de la máxima verosimilitud. Para una detallada explicación de ambos se
recomienda leer la sección 4.2.2 de este capítulo.
14. Busque en Yahoo Finance tres series financieras. Busque datos diarios que correspon-
dan a los dos últimos años. Con base en estos datos, replicar paso por paso el ejemplo
presentado en la sección 5 de este capítulo. Esté seguro de hacer lo siguiente:
Los datos corresponden a tres índices bursátiles: SP500, BOVESPA (Brasil) y MER-
VAL (Argentina). Los datos se encuentran en “sp500_Ibovespa_MerVal_2009_2010.
xlsx”. La solución de este problema se encuentra en el archivo EViews “capitulo14_pro-
blema14_ sp500_Ibovespa_MerVal_2009_2010.wf1”.
212
a) Grafique las series en niveles y en logaritmos.

Las series en niveles:
Series en logaritmos (lsp, lmerv y lbvsp):
213
b) Mediante el uso de las funciones de autocorrelación ¿podría decir que las series son
no estacionarias?
No. Si se observan las funciones de autocorrelación se puede afirmar que las funcio-
nes no son estacionarias. Esto se puede apreciar al ver que las funciones de autocorre-
lación decrecen bastante lentamente, tal como se presenta en el siguiente gráfico que
corresponde al índice brasileño. Lo mimo se puede apreciar para los otros índices.
c) Utilice la prueba aumentada de Dickey-Fuller para probar que las series tienen raíz
unitaria.
test Bvsp Merv SP
ADF-test -2,428521 -0,725734 -1,287791
Valor crítico (5%) -2,867645 -2,867645 -2,867645
Conclusión Raíz unitaria Raíz unitaria Raíz unitaria
d) Verifique que las series son I(1), es decir, verifique si las series en diferencias son es-
tacionarias.
test Bvsp Merv SP
ADF-test -22,48426 -23,71090 -9,849522
Valor crítico (5%) -2,867645 -2,867645 -2,867645
Conclusión Estacionario Estacionario Estacionario
214
e) Trabaje con las series estacionarias, construya los modelos del tipo ARMA(p,q) que
mejor se ajusten a cada serie. Recuerde utilizar los criterios de información para de-
cidir el número óptimo de rezagos del modelo. Pronostique los últimos 5 días de las
series y compare sus resultados con los datos reales.
Para “dlsp”: De acuerdo al AIC ARMA(5,4) y de acuerdo al BIC ARAMA(4,4). Se
trabajará con el modelo más parsimonioso (ARMA(4,4)).
AR ↓ / MA → 1 2 3 4 5
1 AIC -5,640196 -5,636160 -5,641248 -5,649873 -5,655802
BIC -5,613074 -5,599997 -5,596045 -5,595630 -5,592518
2 AIC -5,635459 -5,686999 -5,690338 -5,684624 -5,677278
BIC -5,599236 -5,641721 -5,636005 -5,621235 -5,604833
3 AIC -5,651064 -5,689304 -5,692775 -5,681323 -5,690067
BIC -5,605710 -5,634880 -5,629280 -5,608757 -5,608431
4 AIC -5,662446 -5,703839 -5,699836 -5,747463 -5,748205
BIC -5,607931 -5,640239 -5,627149 -5,665691 -5,657346
5 AIC -5,661646 -5,694845 -5,696271 -5,696542 -5,692208
BIC -5,597939 -5,622037 -5,614361 -5,605531 -5,592096
Para “dlbvsp”: De acuerdo al AIC ARMA(5,4) y de acuerdo al BIC ARAMA(3,2).

Se trabajará con el modelo más parsimonioso (ARMA(3,2)).
AR ↓ / MA → 1 2 3 4 5
1 AIC -5,407608 -5,403325 -5,405012 -5,398710 -5,397972
BIC -5,380486 -5,367162 -5,359809 -5,344466 -5,334688
2 AIC -5,401775 -5,402939 -5,402178 -5,446759 -5,410423
BIC -5,365552 -5,357661 -5,347844 -5,383370 -5,337979
3 AIC -5,410465 -5,465383 -5,453382 -5,449086 -5,447370
BIC -5,365112 -5,410959 -5,389887 -5,376520 -5,365734
4 AIC -5,405294 -5,423263 -5,461819 -5,476032 -5,433330
BIC -5,350779 -5,359662 -5,389132 -5,394259 -5,342471
5 AIC -5,400365 -5,437204 -5,436806 -5,494032 -5,492650
BIC -5,336657 -5,364395 -5,354896 -5,403021 -5,392538
215
Para “dlmerv”: De acuerdo al AIC ARMA(5,4) y de acuerdo al BIC ARAMA(2,2).

Se trabajará con el modelo más parsimonioso (ARMA(2,2)).
AR ↓ / MA → 1 2 3 4 5
1 AIC -5,558336 -5,555816 -5,551614 -5,549396 -5,548579
BIC -5,531215 -5,519654 -5,506411 -5,495153 -5,485295
2 AIC -5,554846 -5,621943 -5,584130 -5,562258 -5,588822
BIC -5,518624 -5,576665 -5,529796 -5,498868 -5,516377
3 AIC -5,553002 -5,566523 -5,632194 -5,629649 -5,627098
BIC -5,507648 -5,512099 -5,568699 -5,557083 -5,545461
4 AIC -5,565073 -5,572615 -5,628868 -5,629399 -5,656460
BIC -5,510558 -5,509014 -5,556182 -5,547626 -5,565602
5 AIC -5,558015 -5,607993 -5,623276 -5,653828 -5,653644
BIC -5,494307 -5,535184 -5,541366 -5,562817 -5,553532
Pronóstico (método estático) para dlsp:
216
Pronóstico (método estático) para dlbvsp:
Pronóstico (método estático) para dlmerv:
217
f) Determine si existe Granger-causalidad entre las variables.
Como se puede ver DLBVSP y DLMERV no causan DLSP y no se causan entre

ellas. En el caso de DLSP esta causa DLBVSP (p-valor = 0,05189, muy cerca de
0,05).
g) Construya un modelo VAR(p) usando las series estacionarias. De nuevo seleccione
apropiadamente el número de rezagos del modelo. Pronostique los últimos 5 días
de las series y compare sus resultados con los datos reales.
De acuerdo al AIC el mejor modelo es un VAR(4) y de acuerdo al BIC es un
VAR(1). Por parsimonia se escogerá el modelo VAR(1).
VAR Valor
1 AIC -17,63280
BIC -17,52431
2 AIC -17,62639
BIC -17,43622
3 AIC -17,65014
BIC -17,37802
4 AIC -17,67019
BIC -17,31584
5 AIC -17,66640
BIC -17,22955
218
219
h) Verifique si existe alguna relación de cointegración entre las series mediante el uso
del test de Johansen.
Si se emplean 4 rezagos se obtiene lo siguiente:
220
Como se puede observar se tienen hasta 2 vectores de cointegración. Recuerde que

el máximo número de vectores de cointegración es igual al número de variables
menos 1. En nuestro caso 3 - 1 = 2.
i) De existir esta relación de largo plazo, estime el modelo VEC y pronostique los úl-
timos 5 días de las series y compare sus resultados con los datos reales.
De acuerdo al AIC el mejor modelo es un VEC(5) y de acuerdo al BIC es un
VEC(1). Por parsimonia se escogerá el modelo VEC(1).
VAR Valor
1 AIC -17,72995
BIC -17,56722
2 AIC -17,75290
BIC -17,50840
3 AIC -17,45913
BIC -17,43258
4 AIC -17,77279
BIC -17,36393
5 AIC -17,78386
BIC -17,29240
221
j) Concluya cual es el mejor modelo para los datos disponibles.

Para el caso de LBVSP el mejor modelo parece ser el VEC(1). Para los últimos días
del pronóstico de LMERV este modelo también es el mejor. Como era de esperar
no existe un modelo que pueda mejorar los pronósticos en el caso del LSP.
222

EstadÃ-sticas y EconometrÃ-A Financiera Solucionario Completo High

Enviado por

Dados do documento

Descrição original:

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

EstadÃ-sticas y EconometrÃ-A Financiera Solucionario Completo High

Enviado por

Direitos autorais:

Formatos disponíveis

Estadísticas y

1) ¿Cuál es la diferencia entre parámetro y un estadístico?

5) El muestreo aleatorio simple, el muestreo sistemático y el muestreo basado en el juicio

9) Basados en la pregunta 8, grafique el histograma, el polígono de frecuencias, y el grá-

10) Basados en la pregunta 8 responda las siguientes preguntas:

c. ¿Cuántos niños ven televisión entre 2 y 4 horas?

2do Cuartil, Q posición = 2 × ( N + 1) / 4 → 2 × (20 + 1) / 4 =

3er Cuartil, Q posición = 3 × ( N + 1) / 4 → 3 × (20 + 1) / 4 =15, 75

d. La desviación del cuartil

e. La desviación media absoluta

g. La desviación estándar muestral

La desviación estándar muestral es: Desvest ()  0,8610

Datos 𝑋𝑋𝑖𝑖 − 𝑚𝑚𝑒𝑒𝑑𝑑𝑖𝑖𝑎𝑎

15) Basados en los datos del ejercicio 8 calcule el coeficiente de variación.

Basados únicamente en la desviación estándar no se puede concluir qué variable es más

El problema de la media referido a los valores extremos, se pone de manifiesto cuando

Diagrama de series de tiempo del PBI y de los gastos en consumo personales.

Series de tiempo del PBI y Gastos en consumos

Producto bruto interno Gastos en consumo personales

Diagrama de dispersión entre PBI y Gastos en

PBI en Billones US$

Hacer el diagrama de dispersión entre el PBI y la inversión bruta en construcción resi-

La variable Y (gasto en consumo personales) es explicada por la variable X (PBI) en re-

Media Promedio() 12.270,25 8.569,46 569,32

21) ¿Qué información nos proporciona el coeficiente de correlación?

1. ¿Qué es una variable aleatoria?

b) Sin considerar el orden:

b) Sin considerar el orden:

Respuesta: La cantidad total es de 3! = 3 × 2 × 1 = 6

¿Cuál es la probabilidad que el producto en la presentación 2 sea vendida por las

P(C)=0,39 P( D | C )  0,36 P(C  D) 

¿Cuál es la probabilidad que el cliente seleccione la tienda 2?

¿Cuál es la probabilidad que el cliente compre el producto en la presentación 1 dado

Se demuestra que es igual que el valor obtenido usando la fórmula de la probabilidad

25. Se lanza un dado dos veces:

¿Cuál es la probabilidad que salga 4 dado que en el primer lanzamiento salió 1?

¿Cuál es la probabilidad que se saquen 3 bolas rojas?

¿Cuál es la probabilidad que se saquen 3 bolas rojas?

Consumo de agua en litros por semana P(x)

¿Cuál es la cantidad de litros de agua semanales de consumo promedio?

Escenario Probabilidad Acciones (X) Renta Fija (Y)

a) Calcular la covarianza entre los instrumentos de renta fija y las acciones.

b) Calcular la correlación entre los instrumentos de renta fija y las acciones.

Por lo tanto la correlación será:

1) Respecto a la distribución binomial: cuando se tiene una población pequeña y la mues-

d) ¿Cuál es la probabilidad de sacar al menos 3 bolas amarillas?

5) Se conoce que históricamente la probabilidad que un cliente compre un determinado

¿Cuál es la probabilidad que exactamente 10 compren el producto?

¿Cuál es la probabilidad que exactamente 5 pongan sus pensiones en la administra-

¿Cuál es la probabilidad de sacar ninguna bola amarilla?

g) ¿Cuál es la desviación estándar?

d) ¿Cuál es la probabilidad que se enrolen entre 2 y 6 clientes?

¿Cuál es la probabilidad que el cajero no atienda a ningún cliente en una hora de

19) Conlos datos de la pregunta 18 y empleando Excel, construya la tabla de probabilida-

1) Independientemente de la función de distribución continua, ¿a qué es igual P(x = a),

d) P(3 < x ≤ 6):

P(0,1667 ≤ x ≤ 0,34) = (1 − e −3,6 × (0,3334) ) − (1 − e −3,6 × (0,1667) ) =0, 2476

d) ¿Cuál es el tiempo promedio esperado en el que arribará otro paciente?

5) Mediante el uso de Excel construya la tabla de probabilidades marginales de la distri-

6) El número de clientes promedio por hora que compran un determinado producto en

b) ¿Cuál es la probabilidad que ningún cliente compre el producto en los siguientes 10

P( x ≥ 0,1667)= e −35 × (0,1667)= 0, 0029