Você está na página 1de 8

Curso: Análisis de Datos para la Gerencia

Profesor: Tomás Minauro La Torre


Preguntas de Repaso

Pregunta 1
Se realiza una encuesta entre los clientes de un restaurante de comida rápida para determinar su
preferencia por las hamburguesas o los sándwiches de pollo. De 200 encuestados seleccionados,
75 eran niños y 125 eran adultos. 120 preferían las hamburguesas y 80 los de pollo. 55 de los niños
prefiere hamburguesas. Calcular:
1. La probabilidad de que una persona seleccionada al azar es un adulto.
2. La probabilidad de que una persona seleccionada al azar es un adulto o un niño.
3. La probabilidad de que una persona seleccionada al azar es un niño y prefiere el pollo.
4. La probabilidad de que una persona seleccionada al azar es un adulto y prefiere el pollo.
5. La probabilidad de que una persona seleccionada al azar es un niño o prefiere
hamburguesa.
6. Si asumimos que sabemos que la persona es un niño. La probabilidad de que este
individuo prefiere hamburguesa.
7. Si asumimos que sabemos que una persona prefiere pollo. La probabilidad de que este
individuo es un adulto.
8. Si asumimos que sabemos que una persona prefiere hamburguesa. La probabilidad de
que este individuo es un niño.
9. Con todos los resultados anteriores, elabore un breve texto con una recomendación.

Pregunta 2
En una planta de envasado de carne, la máquina A procesa el 60% de la producción de la planta,
mientras que la máquina B, el 40% restante. Del total de la producción, el 4% de los paquetes están
sellados inadecuadamente. Además, el 5% de los paquetes que son de la máquina A, están sellados
inadecuadamente.
a) Si se selecciona un paquete al azar, ¿cuál es la probabilidad de que este adecuadamente
sellado?
b) Si seleccionamos al azar un paquete que NO está bien sellado, ¿cuál es la probabilidad
de que haya sido procesado en la máquina A?
c) Si seleccionamos al azar un paquete que fue procesado en la máquina A, ¿cuál es la
probabilidad de que NO esté bien sellado?
d) Si seleccionamos al azar un paquete que fue procesado en la máquina B, ¿cuál es la
probabilidad de que SI esté bien sellado?
e) Si seleccionamos al azar un paquete que fue procesado en la máquina B, ¿cuál es la
probabilidad de que no esté bien sellado?
f) Si seleccionamos al azar un paquete que SI está bien sellado, ¿cuál es la probabilidad de
que haya sido procesado en la máquina B?
g) Con todos los resultados anteriores, ¿qué se puede recomendar a los directivos de la
planta?
Curso: Análisis de Datos para la Gerencia Prof. Tomás Minauro La Torre
Preguntas de Repaso Pág. 2

Pregunta 3
La caja de ahorro municipal utiliza con frecuencia la investigación para medir qué tan conscientes
están los clientes de los productos, comprobar el nivel de satisfacción y las actitudes relacionadas
con los mismos.
A veces, resulta ventajoso ofrecer paquetes financieros especiales a grupos de clientes
determinados. En este caso, se diseñó un paquete financiero para clientes jubilados, de 55 años o
más de edad, que se ubicaran por arriba del promedio del mercado. Los estudios de mercado habían
dado un porcentaje de aceptación de 30%. Si se extrae una muestra de 200 clientes y se les
pregunta su intención de adquirir el producto:
a) ¿En qué proporción de las muestras se tendrá entre 25% y 35% de clientes que
manifiestan su intención de adquirir el producto?
b) ¿Dentro de qué límites simétricos del porcentaje de clientes que manifiestan su intención
de adquirir el producto caerá el 98.50% de los porcentajes de muestra?
c) ¿Cuál es la probabilidad de obtener un porcentaje de muestras de clientes que manifiestan
su intención de adquirir el producto que sea inferior a 23%?
d) ¿Cuál es la probabilidad de obtener un porcentaje de muestras de clientes que manifiestan
su intención de adquirir el producto que sea superior a 33%?
e) ¿Qué es más probable que ocurra:
i. más de 35% de clientes que manifiestan su intención de adquirir el producto con una
muestra de 200 o
ii. más de 33% en una muestra de 300? Explique.

Pregunta 4
Un productor de jugo de naranja compra todas las naranjas de los 150 agricultores que siembran
este cítrico en un valle cercano al norte de la ciudad de Lima. Se estima que la cantidad de jugo
extraída de cada una de estas naranjas, tiene una distribución aproximadamente normal con una
media de 5.80 onzas con una desviación estándar de 0.55 onzas.
a. ¿Cuál es la probabilidad de que una naranja seleccionada aleatoriamente contenga:
i. Entre 4.50 y 5.55 onzas.
ii. Entre 5.80 y 6.70 onzas.
b. ¿65% de las naranjas contendrán al menos cuántas onzas de jugo?
c. ¿Cuál es el valor de los cuartiles? Interprete sus resultados.
Suponga que selecciona una muestra de 50 naranjas.
d. ¿Cuál es la probabilidad de que la media de la muestra sea igual o menor que 5.85 onzas?
e. ¿Entre que valores, simétricamente distribuidos alrededor de la media caerán el 85% de
las medias maestrales?
f. ¿65% de las medias muestrales estarán por arriba de qué valor?
Suponga que selecciona otra muestra de 25 naranjas.
g. ¿Cuál es la probabilidad de que la media de la muestra sea igual o menor que 5.85 onzas?
h. ¿Entre que valores, simétricamente distribuidos alrededor de la media caerán el 85% de
las medias maestrales?
i. ¿65% de las medias muestrales estarán por arriba de qué valor?
Curso: Análisis de Datos para la Gerencia Prof. Tomás Minauro La Torre
Preguntas de Repaso Pág. 3

j. ¿Son diferentes los resultados de las preguntas b, f e i? ¿Son diferentes los resultados
de las preguntas d y g? ¿Son diferentes los resultados de las preguntas e y h? Explique
el por qué en cada caso.

Pregunta 5
El Director de un Colegio Secundario en un distrito tradicional de la ciudad, quiere asegurarse de
que no más del 5% de sus estudiantes faltan al colegio más de 10 días de clases en un año. Una
muestra aleatoria de 145 estudiantes de una población de 800 mostró que 12 estudiantes faltaron
más de 10 días de clases el año pasado. El director utilizará esta información para tomar decisiones.
1. ¿El parámetro de interés para el director es la proporción de estudiantes en la muestra
que reconocen haber faltado más de 10 días al año? Explique su respuesta.
2. ¿Cuál es el valor del parámetro poblacional de interés para el director?
3. ¿Puede concluir el director, con un nivel de confianza del 95% que no más del 5% de los
estudiantes del Colegio han faltado más de 10 días el año pasado?
4. Preocupado por los resultados toma otra muestra de 145 consumidores potenciales y se
obtiene nuevamente 12 que faltaron más de 10 días de clases el año pasado, ¿Cómo
modifica esto su inferencia?¿Disminuye el riesgo y/o aumenta su precisión?

Pregunta 6
El rector de una universidad afirmó que la promoción que entraba este año parecía ser más grande
que las que entraron en años anteriores, pero que su puntuación media del SAT es más bajo que
en años anteriores. Él tomó una muestra de 50 de los estudiantes que ingresan este año y descubrió
que su puntuación media SAT es 1501 con una desviación estándar de 83.80. Los registros de la
universidad indican que la puntuación media SAT de los estudiantes que ingresaron a la universidad
en años anteriores es 1.520. El Rector quiere saber si su inquietud tiene algún fundamento
a. ¿Cuál es el parámetro que le interesa obtener al rector?
b. ¿Cuál es la población que le interesa estudiar al rector?
c. ¿Cuáles son las hipótesis para este estudio?
d. ¿Cuál es la definición de error tipo I?
e. ¿Cuál es la definición de error tipo II?
f. ¿Cuál es el nivel de significación más adecuado para este estudio?
g. ¿Cuál sería el nivel más bajo de significación en el que la hipótesis nula todavía puede ser
rechazado?
h. Con estos resultados, ¿podemos decir que la evidencia demuestra más allá de toda duda
que la puntuación media SAT de la promoción entrante este año es menor que las de años
anteriores? Explique su respuesta.
i. Con estos resultados, ¿el rector puede concluir que la media sáb puntuación de la
promoción entrante de este año es menor que en años anteriores utilizando un nivel de
significación de 0.10? Explique su respuesta.
Con estos resultados, ¿el rector puede llegar a la conclusión de que existen pruebas
suficientes para demostrar que la puntuación media SAT de la promoción entrante este año
es menor que en años anteriores con no más de un 10% de probabilidad de rechazar por
error la hipótesis nula que es verdadera?
Curso: Análisis de Datos para la Gerencia Prof. Tomás Minauro La Torre
Preguntas de Repaso Pág. 4

Pregunta 7
Se trata de una cadena de supermercados que opera con más de 20 locales en diferentes distritos
de la ciudad. El gerente de operaciones decidió una venta de fin de estación, se trata de un bono
de descuento del 30% en una serie de productos que se utilizan para realizar una parrilla. El bono
permitía al portador comprar productos de una lista de auspiciadores con dicho descuento. Como
se trata de un descuento importante, se espera que las personas que hagan uso del bono, compren
también artículos adicionales, suficientes para compensar el descuento correspondiente.
Para medir el impacto del cupón, se han registrado todos los Cantidad
compradores que utilizaron el bono. Al final del período de promoción Media 299.50
se seleccionó una muestra de 75 de estos compradores. Lo más Mediana 286.71
importante es saber si la compra media total está por encima de un Moda 150.00
mínimo calculado para dicho fin. Se ha calculado que esta cifra debe Desviación estándar 49.67
ser de 285 soles, por lo menos, para que la promoción se pueda Mínimo 145.00
considerar un éxito.
Máximo 585.00
Los datos se procesaron y los resultados son los que aparecen en la
tabla.
¿Puede considerarse que ha sido un éxito la promoción?

Pregunta 8
Después de una extensa campaña de publicidad, el gerente de una empresa desea estimar la
proporción de clientes potenciales que reconocen un nuevo producto. Se toma una muestra de 120
consumidores potenciales y se encuentra que 54 reconocen este producto. El gerente utilizará esta
información para tomar decisiones.
a. ¿El parámetro de interés para el administrador es la proporción de clientes potenciales en
la muestra que reconoce el nuevo producto? Explique su respuesta.
b. ¿Cuál es el valor del parámetro poblacional de interés para el gerente?
c. ¿Cómo podemos disminuir el tamaño del error sin aumentar la muestra?
d. ¿Qué crees que opine la gerencia de tu sugerencia en (3)? ¿Crees que considere
satisfactorio el método propuesto?
e. Preocupado por sus resultados toma otra muestra de otros 120 consumidores potenciales
y se obtiene nuevamente 54 que reconocen el nuevo producto, ¿Cómo modifica esto su
inferencia? ¿Disminuye el riesgo y/o aumenta su precisión?

Pregunta 9
Una compañía farmacéutica está considerando la comercialización de un nuevo anestésico local. El
tiempo en el que hace efecto la anestesia que actualmente la compañía farmacéutica está
produciendo tiene una distribución normal con una media de 7.4 minutos con una desviación
estándar de 1.2 minutos. El componente activo del nuevo anestésico es tal que su tiempo en hacer
efecto debe ser también una distribución normal con la misma desviación estándar, pero el tiempo
medio puede ser inferior. Si es inferior, la compañía farmacéutica comercializará el nuevo
anestésico; de lo contrario, continuará produciendo el fármaco más antiguo. Una muestra de tamaño
36 se traduce en una media muestral de 7.1. Para ayudar a tomar la decisión se hará una prueba
de hipótesis.
a) ¿Cuál es el parámetro que le interesa obtener a la compañía?
b) ¿Cuáles son las hipótesis para este análisis?
c) ¿Cuál es la definición de error tipo I?
Curso: Análisis de Datos para la Gerencia Prof. Tomás Minauro La Torre
Preguntas de Repaso Pág. 5

d) ¿Cuál es la definición de error tipo II?


e) ¿Cuál es el nivel de significación más adecuado para este estudio?
f) ¿Cuál sería el nivel más bajo de significación en el que la hipótesis nula todavía puede ser
rechazado?
g) ¿Cuánto debe ser el valor de dicho promedio muestral para NO rechazar la hipótesis nula?
h) Con estos resultados, ¿podemos decir que la evidencia demuestra más allá de toda duda
que el tiempo en el que hace efecto el nuevo anestésico es menor que el que actualmente
comercializa la empresa? Explique su respuesta.
i) ¿Cuál es su conclusión con respecto al nuevo anestésico que se está considerando para
reemplazar al actual?

Pregunta 10
Un desarrollador de software desea utilizar el número de descargas (en miles) para la versión de
prueba de un nuevo shareware para predecir la cantidad de ingresos (en miles de dólares) que
puede hacer con la versión completa final. En la página siguiente, tenemos la salida de una regresión
lineal simple junto con los gráficos de residuales y de probabilidad normal obtenidos a partir de un
conjunto de datos de 30 diferentes sharewares que ha desarrollado:

a) ¿Cuál es una correcta interpretación del coeficiente de la pendiente?


b) ¿Cuál es una predicción de los ingresos cuando el número de descargas es de 30 miles?
c) ¿Cuál es una correcta interpretación del coeficiente de determinación?
d) ¿Cuál es el error típico de estimación?
e) ¿Cuál es la desviación estándar alrededor de la línea de regresión?
f) ¿Cuál de los supuestos parece haber sido violado?
g) ¿Cuál es la hipótesis nula para probar si existe una relación lineal entre los ingresos y el
número de descargas?
h) ¿Cuáles son los límites inferior y superior de la estimación del intervalo de confianza del
95% para la media del cambio en los ingresos como resultado de un aumento del 1 por
mil en el número de descargas?
Estadísticas de la regresión
Coeficiente de correlación múltiple 0.869141
Coeficiente de determinación R^2 0.755407
R^2 ajustado 0.746671
Error típico 44.476491
Observaciones 30

ANÁLISIS DE VARIANZA
Grados de Suma de Promedio de
F P Value
libertad cuadrados los cuadrados
Regresión 1 171062.919 171062.919 86.476 4.67E-10
Residuos 28 55388.4309 1978.158
Total 29 226451.35

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 99% Superior 99%
Intercepción -95.0614 26.9183 -3.531478585 0.001452415 -150.201038 -39.921762 -169.443728 -20.6790722
Descargas 3.7297 0.4011 9.298678634 4.67E-10 2.908084 4.551316 2.62135543 4.83804457
Curso: Análisis de Datos para la Gerencia Prof. Tomás Minauro La Torre
Preguntas de Repaso Pág. 6

Pregunta 11
Una clínica para bajar de peso quiere utilizar el análisis de regresión para construir un modelo para
la pérdida de peso de un cliente (medida en libras). Dos variables que se cree que afecta a la pérdida
de peso son tiempo en el programa y la hora de la sesión (mañana, tarde o noche). Estas variables
se describen a continuación:
Y = pérdida de peso (en libras)
X1 = Tiempo en el programa de pérdida de peso (en meses)
X2 = 1 si la sesión de la mañana, 0 si no
X3 = 1 si la sesión de la tarde, si no 0 (nivel de base = sesión de noche)
Se recogieron y se utilizan para ajustar el modelo datos para 12 clientes en un programa de pérdida
de peso en la clínica.
El modelo es: Y = β0 + β1X1 + β2X2 + β3X3 + ε
La salida de Microsoft ® Excel se encuentra en la siguiente página:
a. ¿Cuál es elemento de estudio para este análisis?
b. ¿Cuál es la hipótesis nula que se tiene que probar para determinar si la relación lineal
entre la pérdida de peso (Y) y el tiempo en el programa (X1) es significativa?
c. ¿Cuánto es el cambio medio en la pérdida de peso (Y) por cada aumento de un mes en el
tiempo en el programa de (X1) al asistir a la sesión en la tarde?
d. ¿Cuánto es el cambio medio en la pérdida de peso (Y) por cada aumento de un mes en el
tiempo en el programa de (X1) al asistir a la sesión en la mañana?
e. ¿Cuánto es el cambio medio en la pérdida de peso (Y) por cada aumento de un mes en el
tiempo en el programa de (X1) al asistir a la sesión en la noche?
f. ¿Cuál de las siguientes afirmaciones es compatible con el análisis de la muestra?
Justifique su respuesta.
A. Hay pruebas suficientes (en α = 0,05) para indicar que hay relación entre la pérdida de
peso (Y) y el mes en el programa de (X1).
B. Hay pruebas suficientes (en α = 0,05) para indicar que la relación entre la pérdida de
peso (Y) y el mes en el programa de (X1) depende de la hora de la sesión.
C. Hay pruebas suficientes (en α = 0,10) para indicar que la hora de la sesión afecta a la
pérdida de peso (Y).
Curso: Análisis de Datos para la Gerencia Prof. Tomás Minauro La Torre
Preguntas de Repaso Pág. 7

D. No hay pruebas suficientes (en α = 0,10) para indicar que la relación entre la pérdida
de peso (Y) y el mes en el programa de (X1) depende de la hora de la sesión.

Estadísticas de la regresión
Coeficiente de correlación múltiple 0.744891525
Coeficiente de determinación R^2 0.554863384
R^2 ajustado 0.44357923
Error típico 9.058829287
Observaciones 15

ANÁLISIS DE VARIANZA
Grados de Suma de Promedio de
F P Value
libertad cuadrados los cuadrados
Regresión 3 1227.4905 409.16350 4.9860053 0.0135071
Residuos 12 984.7487 82.06239
Total 15 2212.2392

Coeficientes Error típico Estadístico t P Value Inferior 95% Superior 95% Inferior 99% Superior 99%
Intercepción 0.08974 14.12712 0.00635261 0.9950358 -30.690595 0.103585 -43.062088 43.241576
X1 6.22538 2.43473 2.55690722 0.0251442 0.920558 11.796402 -1.211601 13.662361
X2 2.21727 18.14153 0.12222080 0.9047471 -37.309720 2.483568 -53.196740 57.631284
X3 11.82330 3.17778 3.72061109 0.0029236 4.899503 19.929815 2.116632 21.529968

Pregunta 12
Una empresa de construcción desea determinar si el tamaño de la casa (Tamaño) está relacionado
con el ingreso familiar (Ingreso), tamaño de la familia (Familia), y la educación del jefe de hogar
(Escuela). La superficie de la Propiedad se mide en cientos de pies cuadrados, el ingreso se mide
en miles de dólares, y la educación está en años de escolaridad. El constructor selecciona al azar
50 familias y corre la regresión múltiple con Excel. La salida obtenida se ofrece al final de la pregunta
a) ¿Qué fracción de la variabilidad en el tamaño de la casa, se explica por el ingreso, tamaño
de la familia y la educación?
b) ¿Algunas de las variables independientes en el modelo son significativas al nivel de 5%?
c) Cuando el constructor utilizó un modelo de regresión lineal simple con tamaño de la casa
como la variable dependiente y la educación como variable independiente, obtuvo un
valor de R2 de 23,0%. ¿Qué porcentaje adicional de la variación total en el tamaño de la
casa se ha explicado mediante la inclusión de tamaño de la familia y el ingreso en la
regresión múltiple?
d) ¿Cuál de los siguientes valores para el nivel de significación es la más pequeña para el
que cada variable explicativa sea estadísticamente significativo individualmente?
e) ¿Cuál de los siguientes valores para el nivel de significación es el más pequeño para el
que el modelo de regresión en su conjunto es significativo?
f) ¿Cuál es el tamaño de la casa predicho de una persona que tiene un ingreso anual de $
40,000, que tiene una familia de 4 miembros, y tiene un total de 13 años de escolaridad?
g) ¿Cuál sería la ganancia mínima anual que tendría que hacer una persona con una familia
de 4 miembros y 16 años de educación para predecir una casa de 10.000 pies cuadrados?
Curso: Análisis de Datos para la Gerencia Prof. Tomás Minauro La Torre
Preguntas de Repaso Pág. 8

h) Un individuo en la muestra tenía un ingreso anual de $ 100.000, una familia de 10


miembros, y una educación de 16 años. Este individuo era dueño de una casa con una
superficie de 7.000 metros cuadrados. ¿Cuál es el error de este miembro de la muestra?
i) A un nivel de significancia 0.01, ¿a qué conclusión debe llegar el constructor respecto a
la inclusión del ingreso en el modelo de regresión?
j) En el nivel de significancia de 0.01, ¿a qué conclusión debe llegar el constructor respecto
a la inclusión de la variable Escuela en el modelo de regresión?

Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple 0.864919539
Coeficiente de determinación R^2 0.748085809
R^2 ajustado 0.731656623
Error típico 5.13772577
Observaciones 50

ANÁLISIS DE VARIANZA
Grados de Suma de Promedio de
F P Value
libertad cuadrados los cuadrados
Regresión 3 3605.7736 1201.924533 45.533954 8.1115E-14
Residuos 46 1214.2264 26.396226
Total 49 4820.0000

Coeficientes Error típico Estadístico t P Value Inferior 95% Superior 95% Inferior 99% Superior 99%
Intercepción -1.6335 5.8078 -0.2812597 0.77977257 -13.323995 10.056995 -17.239137 13.972137
Ingresos 0.4485 0.1137 3.9445910 0.00027090 0.219634 0.677366 0.142987 0.754013
Familia 4.2615 0.8062 5.2859092 0.00000335 2.638704 5.884296 2.095230 6.427770
Escuela -0.6517 0.4319 -1.5089141 0.13815922 -1.521070 0.217670 -1.812221 0.508821

Você também pode gostar