Escolar Documentos
Profissional Documentos
Cultura Documentos
PROBABILIDAD Y ESTADÍSTICA
SEGUNDO EXAMEN FINAL
SOLUCIÓN b) La variancia está dada por:
Semestre: 2007-2
1.- Para la siguiente tabla de datos agrupados: sustituyendo la información de la tabla:
Fronteras Marca Frecuencia Frecuencia Frecuencia Frecuencia
de de Absoluta Acumulada Relativa Acumulada
clase clase Relativa
O bien:
Obtener:
a) La media.
b) La variancia y la desviación estándar.
c) El coeficiente de variación. sustituyendo los valores dados de la tabla:
d) La mediana.
15 Puntos
Resolución
a) La media se define como:
O bien, para:
Probabilidad y Estadística 2
S))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))
si , sustituyendo:
c) El coeficiente de variación está definido como:
despejando, se obtiene:
sustituyendo, se tiene:
2.- En cierta fábrica las máquinas A, B y C producen el mismo tipo de tornillo. El
porcentaje de tornillos defectuosos es: máquina A 2%, máquina B 3% y
entonces: máquina C 1%. La producción se distribuye de la siguiente manera: la máquina
A produce el triple que la B mientras que la máquina C produce sólo la tercera
En el otro caso, se tiene: parte de la máquina A. Si se toma un tornillo del almacén y resulta que es
defectuoso, ¿cuál es la probabilidad de que provenga de la máquina B?
15 Puntos
Resolución
sustituyendo los valores obtenidos: Sea el evento que representa a los tornillos producidos por la máquina .
Sea el evento que representa a los tornillos producidos por la máquina .
Sea el evento que representa a los tornillos producidos por la máquina .
por lo tanto: Sea el evento que representa a los tornillos defectuosos.
Del enunciado se tienen los datos:
d) La mediana es para el , el cual está en la
clase cuatro. Los datos a considerar son:
Frontera Frecuencia
superior acumulada
relativa
40 0.4179
Con respecto de se tiene:
0.5
50 0.5713
Realizando una interpolación con la información anterior:
se sabe que:
sustituyendo, se tiene:
sustituyendo:
entonces:
Probabilidad y Estadística 3
S))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))
representar que los atletas tomaron una vitamina y dos minerales y asignando
la misma probabilidad a cada evento del espacio muestral. Determinar:
sustituyendo, en cada caso: a) La distribución de probabilidad y la función de distribución
acumulativa para la variable aleatoria , que representa el número de
vitaminas y minerales que consume un atleta.
b) La media y la desviación estándar.
c) Las probabilidades , y .
15 Puntos
Resolución
La dieta requiere tres vitaminas y dos minerales, que se debe tomar cuando
Del Teorema de Probabilidad Total: mucho, se tiene que considerar el comportamiento del ejemplo dado en el
enunciado, esto es, que significa que un atleta toma una vitamina y dos
o bien: minerales.
Se define como la variable aleatoria que representa el número de vitaminas
sustituyendo los datos: y minerales que toma un atleta, el recorrido de la variable aleatoria, es:
entonces se tiene:
0 1 2 3 4 5
c2)
Para calcular la desviación estándar se tiene que determinar la c3) Por último, se quiere hallar:
variancia, la cual está definida por:
4.- Indicar el tipo de distribución que representa cada uno de los siguientes
sustituyendo: enunciados, justificar su respuesta.
a) Número de familias con ingresos mayores a $30000 de cuatro familias
seleccionadas al azar______________________________________
b) Analizar 125 muestras de agua antes de detectar la primera muestra
contaminada_____________________________________________
La variancia queda como: c) En una hora determinada llegan a una tienda en promedio ocho
personas_________________________________________________
d) La caída al azar de una bomba A sobre una carretera de 1000 [km] de
longitud_______________________________________________
entonces la desviación estándar en ambos casos es:
e) El número de tiros que deben realizar los jugadores de un equipo de
fútbol para anotar dos goles_________________________________
20 Puntos
Probabilidad y Estadística 5
S))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))
5.- Considerar la siguiente función de densidad conjunta: b) La región para calcular la probabilidad pedida es:
Obtener:
a)
b)
c) La covariancia.
20 Puntos
Resolución
La región donde la función es de densidad de probabilidad es:
porque se va a determinar:
6.- Los costos de afinación en un taller mecánico son de 300 pesos para un auto de sustituyendo valores:
cuatro cilindros, 360 para uno de seis y 420 para uno de ocho. De los registros
de ventas se sabe que el 50% de las afinaciones se hacen para autos de cuatro
cilindros, 40% para los de seis y 10% para los de ocho. Se seleccionan al azar
Pesos
dos autos para la afinación.
a) Calcular la distribución muestral para el promedio de los costos del Para la desviación estándar se requiere el segundo momento con
servicio. respecto del origen, por lo que:
b) Determinar la media, variancia y desviación estándar para la muestra.
c) ¿Cuál es la probabilidad de que al llevar un auto al servicio el costo de
este sea de 390 pesos? sustituyendo valores:
15 Puntos
Resolución
Sea la variable aleatoria que representa los costos de afinación para autos.
El recorrido de la variable aleatoria es , con función
de probabilidad dada por:
La variancia en términos de momentos con respecto al origen está
300 360 420 definida por:
El espacio muestral para el promedio de los costos del servicio de afinación, es:
Otra forma para calcular la variancia, es como segundo momento con
respecto de la media:
Grupo Frecuencia b )
La media que es el valor más representativo del número de puntos anotados por
0-3 27 lo equipos y juegos:
4 - 10 66
.
11 - 17 91
18 - 24 70
32 - 38 34
0-3 27 1.5
39 - 45 16
46 - 52 3
4 - 10 66 7
a) Trazar la gráfica de la distribución de frecuencia relativa.
b) Calcular la media y la moda.
11 - 17 91 14
c) Calcular la variancia y la desviación estándar.
20 Puntos
Resolución 18 - 24 70 21
a) La gráfica de la distribución de frecuencia relativa es:
25 - 31 57 28
Probabilidad y Estadística 2
S)))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))
La moda es la marca de clase del intervalo con mayor frecuencia: a) Se pide la probabilidad total para :
sustituyendo:
c) La variancia es:
número de tractores operando después de seis meses? Calcular la menos una llamada?
distribución de probabilidad. c) ¿Cuál es el número esperado de llamadas en las que las líneas estén
15 Puntos ocupadas?
Resolución 15 Puntos
Sea la variable aleatoria que representa el número de tractores que Resolución
permanecen trabajando después de seis meses. Sea la variable aleatoria que representa el número de líneas telefónicas que
no están ocupadas.
a) Se pide exactamente uno:
a) Se piden exactamente tres:
sustituyendo:
c) El número esperado de llamadas en las que las líneas estén ocupadas,
es el valor esperado para las líneas ocupadas:
a) La gráfica es: y
por lo que:
por lo tanto
Probabilidad y Estadística
Primer Examen Final
Resolución
Tipo A
Semestre: 2008-1
Duración máxima: 2.5 h
1. Considerar la siguiente muestra (la resistencia de 50 lotes de algodón, libras necesarias para
romper una madeja).
76 100 90 99 97 89 108 94 87 79
101 90 105 83 91 96 81 98 81 98
105 110 91 99 101 94 106 98 93 82
90 86 96 88 97 103 85 106 92 115
97 101 102 96 100 76 96 81 101 93
a) Completar la tabla de distribución de frecuencias siguiente:
F ro n tera s d e M arca de F r e c u e n c ia F r e c u e n c ia F r e c u e n c ia F r e c u e n c ia
c la s e c la s e a c u m u la d a r e la t iv a r e la t iv a
a c u m u la d a
in f su p x i f i F i f i* F i*
7 5 .5 8 1 .5
8 1 .5 8 7 .5
8 7 .5 9 3 .5
9 3 .5 9 9 .5
9 9 .5 1 0 5 .5
1 0 5 .5 1 1 1 .5
1 1 1 .5 1 1 7 .5
b) Dibujar el histograma.
c) Calcular la media, la moda, la mediana, la desviación estándar y el sesgo.
20 puntos
Resolución
a) La tabla de distribución de frecuencias está dada por:
Fronteras de clase Marca de clase Frecuencia Frecuencia Frecuencia Frecuencia
acumulada relativa relativa
acumulada
15
absoluta
10
5
0
78.5 84.5 90.5 96.5 102.5 108.5 114.5
Marcas de clase
c) La media de los datos agrupados está dada por:
1m m
⎡ ⎛6⎞ ⎛5⎞ ⎛ 10 ⎞ ⎛ 14 ⎞ ⎛ 10 ⎞ ⎛4⎞ ⎛ 1 ⎞⎤
x = ∑xi fi = ∑xi fi* = ⎢78.5⎜ ⎟ +84.5⎜ ⎟ + 90.5⎜ ⎟ + 96.5⎜ ⎟ +102.5⎜ ⎟ +108.5⎜ ⎟ +114.5⎜ ⎟⎥
n i=1 i=1 ⎣ ⎝ 50 ⎠ ⎝ 50 ⎠ ⎝ 50 ⎠ ⎝ 50 ⎠ ⎝ 50 ⎠ ⎝ 50 ⎠ ⎝ 50 ⎠⎦
x = 94.46
La mediana de los datos agrupados está en:
Fronteras de Frecuencia
clase relativa
acumulada
93.5 0.42
x 0.50
99.5 0.70
Realizando una interpolación, la ecuación de la recta dados dos puntos está definida por:
y1 − y0
y − y0 = ( x − x0 )
x1 − x0
la pendiente se obtiene de sustituir:
y −y 0.70 − 0.42 0.28 7
m= 1 0 = = = = 0.047
x1 − x0 99.5 − 93.5 6 150
sustituyendo los valores se tiene: y − 0.7 = 0.047( x − 99.5)
la recta en forma ordenada al origen es:
y = 0.047 x − 4.676 + 0.7 = 0.047 x − 3.976
sustituyendo el punto P ( x , 0.5 ) : 0.5 = 0.047 x − 3.976
despejando de la expresión anterior: x ≈ 95.234
La moda es la marca de clase con mayor frecuencia, entonces: xmo = 96.5
Para la variancia de los datos de la muestra, se sabe que:
1 m
sn2−1 = ∑ ( xi − x ) fi
2
n − 1 i =1
sustituyendo:
1
sn2−1 = ⎡( 78.5 − 94.46) 6 + (84.5 − 94.46)2 5 + (90.5 − 94.46)210 + (96.5 − 94.46)214 + (102.5 − 94.46)210 + (108.5 − 94.46)2 4 + (114.5 − 94.46)21⎤
2
⎣ 49 ⎦
1
sn2−1 = [ 4075.92] ≈ 83.18
49
La desviación estándar es la raíz cuadrada de la variancia, por lo que:
sn−1 = sn2−1 = 83.18 ≈ 9.12
Por la posición de las medidas de tendencia central se puede determinar de manera empírica el
sesgo de la muestra, esto es: x < x < xmo
por lo que: 94.46 < 95.23 < 96.5
por lo tanto, se puede concluir que la muestra tiene sesgo negativo.
De otra forma el coeficiente de sesgo se puede obtener como el tercer momento con respecto de
la media entre la desviación estándar al cubo, esto es:
1 m m
∑ ( i ) i ∑ ( xi − x ) fi*
−
3 3
x x f
m3 n
a3 = = i =1 = i =1
( sn −1 ) ( sn−1 ) ( sn−1 )
3 3 3
3. El PH con que se mide la acidez del agua, es importante en los estudios de lluvia ácida. Para
determinado lago en Veracruz, se llevan a cabo mediciones testigo de acidez para que se pueda
notar cualquier cambio originado por la lluvia ácida. El PH de las muestras del agua es una
variable aleatoria X , cuya función de densidad de probabilidad es:
⎧3
⎪ ( 7 - x)
2
; 5 < x <7
fX ( x) = ⎨8
⎪⎩ 0 ; en otro caso
a) Calcular la función de distribución acumulativa F X ( x ) .
b) Calcular la probabilidad de que el PH sea menor que seis en una muestra de agua de este
lago.
15 puntos
Resolución
Sea X la variable aleatoria que representa el PH en la muestra de agua de dicho lago.
a) La función de distribución que muestra el comportamiento acumulado está definida por:
∫
x
FX ( x) = f X (t )dt
−∞
sustituyendo para la función de densidad:
∫ ∫
x x
3
FX ( x) = f X (t )dt = (7 − t ) 2 dt
−∞ 5 8
por cambio de variable:
∫
x
3
FX ( x) = (7 − t ) 2 dt
8 5
u = 7−t
du = −dt
dt = − du
∫
x x x
3⎛1 ⎞
u 2 du = − ⎜ u 3 ⎟ = − ( u 3 )
3 1
FX ( x) = −
8 5 8⎝3 ⎠5 8 5
x
1 1
FX ( x) = − (7 − t )3 = − ⎡⎣ (7 − x)3 − (7 − 5)3 ⎤⎦
8 5 8
1 1
FX ( x) = − ⎡⎣(7 − x)3 − 8⎤⎦ = 1 − (7 − x)3 , 5 < x < 7
8 8
Por lo tanto la función de distribución acumulada es:
⎧ 0 ; x≤5
⎪ 1
⎪
FX ( x ) = ⎨1- (7 - x ) ; 5 < x < 7
3
⎪ 8
⎪⎩ 1 ; x ≥7
b) Se pide calcular P( X ≤ 6) , se sabe que:
1 1 7
P ( X ≤ 6) = FX ( X = 6) = 1 − (7 − 6)3 = 1 − =
8 8 8
4. Se ha observado que el tiempo necesario para que una persona se traslade de una ciudad a otra,
tiene una distribución normal con media de 15 horas y una variancia de dos horas. Calcular la
probabilidad de que el recorrido tarde:
a) Cuando mucho 16 horas.
b) Menos de 13.5 horas o más de 17 horas.
10 puntos
Resolución
Sea T la variable aleatoria que representa el tiempo de traslado de una ciudad a otra.
T ∼ Normal ( μ = 15, σ 2 = 2 )
a) Se pide la probabilidad de que cuando mucho el traslado tarde 16 horas, entonces:
⎛ T −μ ⎞ ⎛ 16 − 15 ⎞
P (T ≤ 16) = P (T < 16) ≈ P ⎜ Z ≤ ⎟ = P⎜Z ≤ ⎟
⎝ σ ⎠ ⎝ 2 ⎠
de tablas de la función de distribución acumulativa normal estándar:
⎛ 1 ⎞
P (T ≤ 16) = P ⎜ Z ≤ ⎟ = P( Z ≤ 0.71) = P( Z < 0.71) = FZ (0.71) = 0.7611
⎝ 2⎠
b) Se quiere calcular la probabilidad de que un viaje tarde cuando mucho 13.5 horas o al menos 17
horas, entonces:
P (T ≤ 13.5 ∪ T ≥ 17) = P (T < 13.5 ∪ T > 17) = P (T ≤ 13.5) + P (T ≥ 17) ≈
⎛ 13.5 − 15 ⎞ ⎛ 17 − 15 ⎞ ⎛ −1.5 ⎞ ⎛ 2 ⎞
≈ P⎜Z ≤
⎜ ⎟⎟ + P ⎜ Z ≥ ⎟ = P⎜Z ≤ ⎟ + P⎜ Z ≥ ⎟ = P ( Z ≤ −1.06 ) + P ( Z ≥ 1.41) =
⎝ 2 ⎠ ⎝ 2 ⎠ ⎝ 2 ⎠ ⎝ 2⎠
= FZ (−1.06) + (1 − FZ (1.41) )
usando la tabla de la función de distribución acumulativa normal estándar se tiene:
P (T ≤ 13.5) + P(T ≥ 17) = FZ (−1.06) + (1 − FZ (1.41)) = 0.1446 + 0.0793 = 0.2239
∫ ∫ ∫ ∫
0.3 0.3 R
− xy
P( X < 0.3 ∩ Y > 2) = 5 xe dydx = lim 5 xe− xy dydx =
R →∞
0.2 2 0.2 2
∫ ∫ ∫ ∫
0.3 0.3 0.3 0.3
R
= −5 lim e − xy ⎤ dx = −5 lim ⎡⎣e − xR
−e −2 x
⎤⎦ dx = −5 −e −2 x
dx = 5 e−2 x dx =
0.2
R →∞ ⎦2 0.2
R →∞
0.2 0.2
5 0.3 5 5
= − e−2 x ⎤⎦ = − ⎡⎣e−2(0.3) − e−2(0.2) ⎤⎦ = ⎡⎣e−2(0.2) − e−2(0.3) ⎤⎦ ≈ 0.3038
2 0.2 2 2
b) Para que las variables aleatorias conjuntas sean independientes, es suficiente que se cumpla:
f XY ( x, y ) = f X ( x) fY ( y )
sustituyendo las funciones marginales, se tiene:
⎛ 5 5 ⎞
5 x e − xy ≠ 5 ⎜ 2 e − 0.2 y (1 + 0.2 y ) − 2 e − 0.4 y (1 + 0.4 y ) ⎟
⎝y y ⎠
por lo tanto no son independientes; es decir, son variables aleatorias conjuntas dependientes.
7. Una compañía fabrica focos que tienen un periodo de vida distribuido aproximadamente
normal, con media igual a 800 horas y desviación estándar de 40 horas. Calcular la
probabilidad de que una muestra aleatoria de 16 focos tenga una vida promedio de menos de
775 horas.
15 puntos
Resolución
Sea X la variable aleatoria que representa el periodo de vida, en horas, de un foco.
X ∼ Normal ( μ = 800, σ 2 = (40) 2 )
con n = 16 , X i ∼ Normal ( μ = 800, σ 2 = (40) 2 ) , i = 1, 2, 3, ... , 16
se quiere calcular la probabilidad de que la vida promedio de los 16 focos, sea cuando mucho de 775
horas, entonces:
P ( X ≤ 775 ) = P ( X <775 )
como se conoce la variancia, se sabe que:
⎛ σ ⎞
X ∼ Normal ⎜ μ X = μ X , σ X = X ⎟
⎝ n⎠
sustituyendo:
⎛ 40 ⎞
X ∼ Normal ⎜ μ X = 800, σ X = ⎟
⎝ 16 ⎠
o bien:
X ∼ Normal ( μ X = 800, σ X = 10 )
la probabilidad pedida es:
⎛ ⎞
⎜ X −μ − ⎟ ⎛ −25 ⎞
P ( X ≤ 775 ) = P ( X <775 ) ≈ P ⎜
775 800
X
< ⎟ = P⎜Z < ⎟=
⎜ σX 40 ⎟ ⎝ 10 ⎠
⎜ 16 ⎟⎠
⎝ n
De tablas de la función de distribución acumulativa normal estándar:
= P ( Z < −2.50) = FZ (−2.50) = 0.0062
Facultad de Ingeniería
División de Ciencias Básicas
Coordinación de Ciencias Aplicadas
Departamento de Probabilidad y Estadística
Probabilidad y Estadística
Segundo Examen Final
SOLUCIÓN
Semestre: 2008-1
Duración máxima: 2.5 h
1. En la siguiente tabla se muestra la clasificación combinada del número de millas y el volumen del motor por parte
de la APA en 49 estados (todos menos California) para nueve automóviles subcompactos con transmisión
estándar, de cuatro cilindros y que utilizan gasolina. El tamaño del motor se da en pulgadas cúbicas totales de
cilindrada.
Automóvil Cilindrada (x) mpg (combinado) (y)
VW Rabbit 97 24
Datsun 210 85 29
Chevette 98 26
Dodge Omni 105 24
Mazda 626 120 24
Oldsmobile Starfire 151 22
Mercury Capri 140 23
Toyota Celica 134 23
Datsun 810 146 21
a) Representar los datos en un diagrama de dispersión.
b) Ajustar a los datos un modelo lineal de regresión, empleando el criterio de mínimos cuadrados.
c) Dibujar la gráfica de la recta de los mínimos cuadrados para ver qué tan bien se ajusta a los datos.
d) Utilizar la recta de los mínimos cuadrados para estimar el promedio de millas por galón para un automóvil
subcompacto que tiene un volumen del motor de 125 pulgadas cúbicas.
e) Calcular la covariancia, el coeficiente de correlación y de determinación. Interpretar los resultados de la
relación de las variables.
20 Puntos
Resolución
a) El diagrama de dispersión es:
Diagram a de dispersión
mpg (combinado) (y)
40
30
20
10
0
80 100 120 140
Cilindrada (x)
b) El ajuste de los datos a un modelo lineal de regresión por el criterio de mínimos cuadrados está dado por:
ŷ = βˆ0 + βˆ1 x
donde:
βˆ0 = y − βˆ1 x
y
SS xy
βˆ1 =
SS xx
realizando los productos y las sumas, se tiene:
x y x2 y2 xy
97 24 9409 576 2328
85 29 7225 841 2465
98 26 9604 676 2548
105 24 11025 576 2520
120 24 14400 576 2880
151 22 22801 484 3322
140 23 19600 529 3220
134 23 17956 529 3082
146 21 21316 441 3066
Sumas: 1076 216 133336 5228 25431
de donde:
2
⎛ ⎞
∑
n
⎜ xi ⎟
⎜ ⎟
∑ ⎠ = 133336 − (1076 ) = 4694.222
n 2
SS xx = x −⎝
2
i
i =1
n 9
i =1
∑ ∑
n n
x y
SS xy = xy −i = 25431 −
i
i =1 i =1
n 9
i =1
sustituyendo :
SS xy − 393
βˆ1 = = = − 0.084
SS xx 4694.222
para encontrar los promedios, se tiene:
∑
n
1 1
x= xi = (1076 ) =119.556
n 9
i =1
y
∑
n
1 1
y= yi = ( 216 ) = 24
n 9
i =1
sustituyendo:
βˆ0 = 24 − ( − 0.084 )(119.556 ) = 34.043
por lo tanto el modelo lineal de regresión es:
yˆ = 34.043 − 0.084 x
c) La gráfica es:
Diagrama de dispersión
y = -0.084x + 34.043
35
mpg (combinado) (y)
30
25
20
15
10
5
0
80 90 100 110 120 130 140 150
Cilindrada (x)
d) Un automóvil subcompacto que tiene un volumen del motor de 125 pulgadas cúbicas, sustituyendo en el modelo,
se tiene:
2
yˆ = 34.043 − 0.084 (125 ) = 23.543
e) La covariancia está dada por:
SS xy − 393
ˆ ( X ,Y ) =
Cov = = − 43.667
n 9
El coeficiente de correlación está definido por:
SS xy
r=
SS xx SS yy
calculando:
2
⎛ ⎞
∑
n
⎜ yi ⎟
⎜ ⎟
∑ ⎠ = 5228 − ( 216 ) = 44
n 2
SS yy = y2 − ⎝
i
i =1
n 9
i =1
por lo que el coeficiente de correlación es:
−393
r= = − 0.865
( 4694.222 )( 44 )
El coeficiente de determinación está definido por:
R 2 = ( r ) 2 = ( −0.865 ) 2 = 0.748
Se concluye que las variables tienen una buena relación lineal, puesto que: r = − 0.865
2. Una urna contiene 40 bolas blancas y 10 bolas negras. Si dos bolas se sacan aleatoriamente, determinar la
probabilidad de que las dos sean blancas si:
a) la primera bola es reemplazada antes de sacar la segunda.
b) la primera bola no es reemplazada antes de sacar la segunda.
10 Puntos
Resolución
a) Sea A el evento que representa que se selecciona aleatoriamente una bola blanca de la urna, con reemplazo, si
la primera bola que se selecciona es blanca.
2 2
⎛ 40 ⎞⎛ 40 ⎞ ⎛ 40 ⎞ ⎛ 4 ⎞ 16
P ( A A ) = ⎜ ⎟⎜ ⎟ = ⎜ ⎟ = ⎜ ⎟ = = 0.64
⎝ 50 ⎠⎝ 50 ⎠ ⎝ 50 ⎠ ⎝ 5 ⎠ 25
b) Sea B el evento que representa que se selecciona aleatoriamente una bola blanca de la urna, sin reemplazo, si la
primera bola que se selecciona es blanca.
⎛ 40 ⎞⎛ 39 ⎞ ⎛ 4 ⎞⎛ 39 ⎞ 156
P ( B B ) = ⎜ ⎟⎜ ⎟ = ⎜ ⎟⎜ ⎟ = ≈ 0.637
⎝ 50 ⎠⎝ 49 ⎠ ⎝ 5 ⎠⎝ 49 ⎠ 245
3. Se tiene la siguiente función de densidad:
⎧ 2e -2x ; x>0
f X (x)= ⎨
⎩0 ; en otro caso
a) Obtener el valor esperado de la función.
b) Calcular la variancia de la función.
10 Puntos
Resolución
Sea X una variable aleatoria con distribución exponencial con λ =2
a) El valor esperado es:
1 1
E(X )= = = 0.5
λ 2
o bien:
∞
∫ ∫
R
1
E(X )= 2 x e− 2 x dx = lim 2 x e − 2 x dx = = 0.5
R →∞ 2
0 0
b) La variancia es:
1 1 1
Var ( X ) = = = = 0.25
λ 2
22 4
3
o bien:
∞
∫ ∫
2 R 2
⎛ 1⎞ ⎛ 1⎞ 1
Var ( X ) = −2x
⎜ x − ⎟ 2 e dx = Rlim
−2x
⎜ x − ⎟ 2 e dx = = 0.25
0 ⎝ 2 ⎠ →∞
0 ⎝ 2 ⎠ 4
4. Los conductores que se fabrican para utilizarse en determinado sistema de cómputo, necesitan resistencias que
varíen entre 0.12 y 0.14 ohms. Las resistencias reales medidas de los conductores que produce la compañía A
tienen un distribución normal con promedio de 0.13 y desviación estándar de 0.005 ohm, respectivamente.
a) ¿Cuál es la probabilidad de que un conductor seleccionado al azar de la producción de la compañía A
cumpla con las especificaciones?
b) Si se usan cuatro de estos conductores en el sistema de la compañía A, ¿cuál es la probabilidad de que el
cuarto conductor sea el primero que cumple con las especificaciones?
c) Si se usan cuatro de estos conductores en el sistema de la compañía A, ¿cuál es la probabilidad de que el
cuarto componente sea el segundo componente que cumple con las especificaciones?
15 Puntos
Resolución
Sea Y la variable aleatoria que representa el valor de las resistencias que fabrica la compañía A .
Y ∼ Normal ( μY = 0.13, σ Y = 0.005 )
a) Se quiere calcular:
⎛ 0.12 − 0.13 0.14 − 0.13 ⎞
P ( 0.12 ≤ Y ≤ 0.14 ) = P ( 0.12 < Y < 0.14 ) ≈ P ⎜ <Z < ⎟ = P (− 2 < Z < 2 )
⎝ 0.005 0.005 ⎠
De la tabla de la distribución acumulativa normal estándar, se tiene:
FZ (2.00) − FZ (− 2.00) = 0.9772 − 0.0228 = 0.9544
b) Si se usan cuatro de estos conductores en el sistema de la compañía A , la probabilidad de que el cuarto sea el
primero que cumple con las especificaciones, es:
Q ∼ Geométrica ( p = 0.9544 )
Se quiere calcular:
P ( Q = 4 ) = q 3 p = (1 − 0.9544)3 ( 0.9544 ) = ( 0.0456 ) ( 0.9544 ) = 9.05 ×10− 5
3
⎝ ⎠
1 ⎝ ⎠
1
5. En un conmutador telefónico de una central, se reciben en promedio dos llamadas por minuto, suponiendo que las
llamadas siguen un proceso de Poisson, determinar la probabilidad de que:
a) no llegue ninguna llamada en un periodo de tres minutos.
b) lleguen menos de tres llamadas en un periodo de dos minutos.
15 Puntos
Resolución
Sea X la variable aleatoria que representa el número de llamadas que llegan al conmutador telefónico en un minuto.
X ∼ Poisson ( λ = 2 )
a) Se pide calcular la probabilidad de que no llegue ninguna llamada en un periodo de tres minutos, entonces:
X ∼ Poisson ( λt = 2(3) = 6 )
λ x e− λ 60 e − 6
P ( X =0) = = = e − 6 ≈ 0.002
x! 0!
b) Se quiere calcular la probabilidad de que lleguen menos de tres llamadas en un periodo de dos minutos,
entonces:
X ∼ Poisson ( λt = 2(2) = 4 )
∑
2
λ x e− λ
P ( X < 3) = P ( X = 0 ) + P ( X = 1) + P ( X = 2) =
x!
x =0
40 e − 4 4 e − 4 4 2 e − 4
P ( X < 3) = + + = e − 4 [1 + 4 + 8] ≈ 0.238
0! 1! 2!
4
6. Sean las distribuciones marginales de probabilidad de las variables aleatorias X eY :
X 1 2 Y 0 1 2 3
f X ( x) 0 .4 0 .6 fY ( y) 0 .2 0 .3 0 .4 0 .1
Si X y Y son estadísticamente independientes:
a) obtener la distribución de probabilidad conjunta.
b) demostrar que el coeficiente de correlación es cero.
15 Puntos
Resolución
Si las variables aleatorias conjuntas son independientes, entonces:
f XY ( x , y ) = f X ( x) fY ( y )
a) La distribución de probabilidad conjunta es:
f XY (x , y )
1
x
2
0 0.08 0.12
1 0.12 0.18
y
2 0.16 0.24
3 0.04 0.06
b) El coeficiente de correlación es cero, esto es, en particular:
Cov ( X , Y ) =E ( X Y ) − E ( X ) E (Y )
realizando los cálculos:
E( X Y ) =
∑ ∑ xy f
∀y ∀x
XY (x , y )
sustituyendo:
E ( X Y ) = (1)(1)(0.12) + (1)(2)(0.16) + (1)(3)(0.04) + (2)(1)(0.18) + (2)(2)(0.24) + (2)(3)(0.06)
E ( X Y ) = 2.24
Los promedios de las funciones marginales son:
E( X ) =
∑ ∀x
x f X ( x ) = (1)(0.4) + (2)(0.6) = 1.6
E (Y ) =
∑ ∀y
y fY ( y ) = (1)(0.3) + (2)(0.4) + (3)(0.1) = 1.4
sustituyendo en la covariancia:
Cov ( X , Y ) = 2.24 − (1.6) (1.4 ) = 0
se verifica que son variables aleatorias conjuntas independientes.
7. Se tomó una muestra aleatoria de 16 calificaciones de una población estudiantil de 100 estudiantes, en donde se
encontró una desviación estándar muestral de las calificaciones de cuatro puntos y media muestral de 20 puntos,
¿cuál es la probabilidad de seleccionar a un alumno que tenga más de 21.753 puntos como promedio?
15 Puntos
Resolución
Del enunciado se tiene:
n =16 S n2−1 = 42 x = 20
Se quiere determinar la probabilidad de que un alumno seleccionado al azar tenga al menos 21.753 puntos como
promedio muestral, no se conoce la variancia poblacional ni la media poblacional pero se sabe que es igual a la media
muestral, entonces:
⎛ ⎞
⎜ X − μ 21.753 − 20 ⎟ (21.753 − 20)(4)
P ( X > 21.753 ) = P ( X ≥ 21.753 ) ≈ P ⎜ > ⎟ = P ⎛⎜ T > ⎞
⎟ = P ( T > 1.753 ) =
⎜ S n −1 4 ⎟ ⎝ 4 ⎠
⎜ ⎟
⎝ n 16 ⎠
de la tabla de la distribución t de Student, con 15 grados de libertad y 1.753, se tiene:
P (T > 1.753 ) = 0.05
5
Distribución acumulativa normal estándar Distribución t de Student
z 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 α
0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359 ν 0.001 0.002 0.003 0.004
0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753 1 318.2888 159.1444 106.0963 79.5722
0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141 2 22.3285 15.7638 12.8517 11.1130
0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517 3 10.2143 8.0524 6.9944 6.3221
0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879 4 7.1729 5.9514 5.3213 4.9076
0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224 5 5.8935 5.0303 4.5703 4.2620
0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549 6 5.2075 4.5242 4.1517 3.8982
0.7 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852 7 4.7853 4.2071 3.8868 3.6666
0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133 8 4.5008 3.9909 3.7049 3.5067
0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389 9 4.2969 3.8345 3.5726 3.3899
1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621 10 4.1437 3.7163 3.4721 3.3010
1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830 11 4.0248 3.6238 3.3933 3.2311
1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015 12 3.9296 3.5495 3.3298 3.1747
1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177 13 3.8520 3.4887 3.2777 3.1282
1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319 14 3.7874 3.4379 3.2341 3.0893
1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441 15 3.7329 3.3948 3.1971 3.0563
1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545 16 3.6861 3.3579 3.1653 3.0279
1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633 17 3.6458 3.3259 3.1376 3.0032
1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706 18 3.6105 3.2979 3.1135 2.9815
1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767 19 3.5793 3.2732 3.0921 2.9624
2.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817 20 3.5518 3.2512 3.0731 2.9453
2.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857
2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890
2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916
2.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936
2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952
2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964
2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974
2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981
2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986
3.0 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990
3.1 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.9993
3.2 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.9995
3.3 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997
6
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO
FACULTAD DE INGENIERÍA
DIVISIÓN DE CIENCIAS BÁSICAS
COORDINACIÓN DE CIENCIAS APLICADAS
PROBABILIDAD Y ESTADÍSTICA
PRIMER EXAMEN FINAL
RESOLUCIÓN
NOMBRE______________________________________________________________________
1. Los alumnos de la carrera de ingeniería industrial de la Facultad de Ingeniería de la UNAM, realizaron
un estudio de las cotizaciones del trigo con el fin de emprender un negocio de distribución. Los datos
(en miles de pesos) de la muestra, se presentan en la tabla de distribución de frecuencias siguiente.
Clase Fronteras de Clase M arcas de Clase Frecuencia absoluta Frecuencia relat iva Frecuencia Acumulada Frecuencia Acumulada Relat iva
( xi − x )
* * 2
Li Ls xi fi fi Fi Fi xi fi fi
∑x f =∑x f
m m
1
a) La media de los datos está dada por: x =
*
i i i i
n
i =1 i =1
∑
8
1 1
sustituyendo: x = xi fi = [1963.8 + … + 275.0] = 150.97
60 60
i =1
La mediana es el valor de x que divide en dos partes a la muestra dada, entonces:
Ls Fi*
120.95 0.3
x 0.5
144.65 0.65
EF1 PyE_091 1
0.5 − 0.30 = 0.015 ( x − 120.95 )
0.2
x= + 120.95
0.015
x = 134.283
La moda es el valor de la marca de clase con mayor frecuencia:
xmo = 132.8
De otra forma, usando la fórmula para datos agrupados:
⎡ a ⎤
xmo = LMo inf + ⎢ cMo
⎣ a + b ⎥⎦
donde:
a = f Mo − f Mo −1 , b = f Mo − f Mo +1
f Mo : Es la frecuencia absoluta de la clase que contiene a la moda
cMo : Es la longitud de la clase que contiene a la moda
LMoinf : Es el límite inferior de la clase que contiene a la moda
sustituyendo:
⎡ 3 ⎤
xmo = 120.95 + ⎢ ( 23.7 )
⎣ 3 + 15 ⎥⎦
realizando las operaciones:
xmo = 124.90
1 m
sn2−1 = ∑ ( xi − x ) fi
2
b) La variancia muestral está definida por:
n − 1 i =1
sustituyendo la información dada:
1
sn2−1 = [31555.744 + … + 15383.441]
59
1
sn2−1 = [128477.226] = 2177.580
59
Sn −1
El coeficiente de variación se define por: C.V . =
x
2177.580 46.665
sustituyendo: C.V . = = = 0.309
150.970 150.970
c) El histograma es:
Histograma
0.400
0.350
Frecuencia Relativa
0.300
0.250
0.200
0.150
0.100
0.050
0.000
109.1 132.8 156.5 180.2 203.9 227.6 251.3 275.0
Marcas de Clase
EF1 PyE_091 2
El polígono de frecuencias es:
Polígono de Frecuencia
0.4
0.35
Frecuancia Relativa
0.3
0.25
0.2
0.15
0.1
0.05
0
85.4 109.1 132.8 156.5 180.2 203.9 227.6 251.3 275.0 298.7
Marcas de Clase
La ojiva es:
Ojiva
Frecuencia Acumulada
1.2
1
Relativa
0.8
0.6
0.4
0.2
0
97.25 120.95 144.65 168.35 192.05 215.75 239.45 263.15 286.85
Fronteras de Clase
2. Una prueba diagnóstica para el cáncer uterino tiene un coeficiente falso-positivo de 0.05 y falso-
negativo de 0.1. Una mujer con una probabilidad pre-prueba de padecer la enfermedad de 0.15 tiene
un resultado negativo con igual probabilidad. Calcular la probabilidad de que no esté enferma. El
coeficiente falso-positivo se refiere a: el resultado es positivo, dado que la mujer no tiene la
enfermedad y, el coeficiente falso-negativo se refiere a: el resultado es negativo, dado que la mujer
tiene la enfermedad.
15 Puntos
Resolución
Sea E el evento que representa que la mujer tenga la enfermedad.
Sea A el evento que representa el resultado de la prueba es positivo.
Del enunciado se tiene: P ( E ) = 0.15 , P ( E ) = 0.85 , P ( A E ) = 0.05 y
( )
P A E = 0.10
Se quiere calcular: P E A ( )
Por el Teorema de Bayes:
P(A∩ E) P(E) P A E ( )
(
P E A = ) =
P ( A) ( )
P(E) P A E + P(E) P A E ( )
sustituyendo:
( 0.85 )( 0.95)
(
P E A = ) =
0.8075
( 0.15 )( 0.10 ) + ( 0.85)( 0.95) 0.8225
= 0.9818
EF1 PyE_091 3
3. Por saturación de vuelos, algunas líneas aéreas venden más pasajes que los disponibles en un vuelo.
Una compañía ha vendido 205 boletos que corresponden a un avión con capacidad de 200 asientos.
Sea X la variable aleatoria que representa el número de pasajeros que tramita su pase de abordar
en el aeropuerto. La distribución de probabilidad está dada por
E(X ) =
∑ x f ( x)
∀x
X
sustituyendo:
E ( X ) = 198 ( 0.05 ) +199 ( 0.09 ) + 200 ( 0.15 ) + 201( 0.2 ) + 202 ( 0.23) + 203 ( 0.17 ) + 204 ( 0.09 ) + 205 ( 0.02 )
E ( X ) = 201.44
se espera que lleguen 202 personas. Entonces para calcular la cantidad esperada de dinero:
U =I −E
El modelo es:
U = 250 X − 1250 ( X − 200 )
Aplicando valor esperado a la utilidad:
E (U ) = E ( 250 X − 1250 ( X − 200 ) ) = 250 E ( X ) − 1250 E ( X − 200 )
se tiene:
E (U ) = 250 E ( X ) − 1250 ( E ( X ) − 200 ) = 250 ( 201.44 ) − 1250 ( 201.44 − 200 )
E (U ) = 50360 − 1800
E (U ) = 48560 Euros
4. La aceptación de un tubo capilar para un congelador se encuentra midiendo la presión que ejerce (en
libra por pulgada cuadrada, [psi]) en los extremos del mismo. Información obtenida anteriormente en
un proceso de manufactura de tubos capilares hace suponer que estas presiones están distribuidas
normalmente, con media de 130 [psi] y desviación estándar de cuatro [psi].
a) Si no se pueden aceptar presiones por debajo de 121.5 [psi], ¿cuál es el porcentaje de tubos
rechazados?
EF1 PyE_091 4
b) Si no se quiere rechazar más del 10% de los tubos con presiones bajas, cuál es la presión mínima
que debe tener cualquier tubo para ser aceptado?
15 Puntos
Resolución
a) Sea X la v.a. que representa la presión que ejerce un tubo capilar en los extremos.
X ∼ Normal ( μ X = 130 [ psi ] , σ X = 4 [ psi ])
Se pide calcular la probabilidad de que la presión P ( X < 121.5) que da la probabilidad de que
un tubo sea rechazado y usando tablas de la función de distribución acumulativa normal estándar:
⎛ 121.5 − 130 ⎞
P ( X < 121.5 ) ≈ P ⎜ Z < ⎟ = P ( Z < −2.13) = 0.0166
⎝ 4 ⎠
entonces el porcentaje de tubos que serán rechazados es: 1.67%
b) Se pide determinar P ( X < x) = 0.10 que representa que no se requiera rechazar más de 10%
de los tubos con presiones bajas, entonces:
⎛ x − 130 ⎞
P ( X < x ) ≈ P⎜Z < ⎟ = P ( Z < z0 ) = 0.10
⎝ 4 ⎠
usando tablas de la función de distribución acumulativa normal estándar, con 0.10 el más
próximo es:
x − 130
z0 =
4
por lo que:
x − 130
−1.28 =
4
despejando:
x = 124.88 [ psi]
que sería la presión mínima que debe tener un tubo para ser aceptado.
f X ( x) =
∫ -∞
sustituyendo se tiene:
f XY ( x, y ) dy y fY ( y ) =
∫ −∞
f XY ( x, y ) dx
∫
1
( 2 xy )
1
f X ( x) = 4 xy dy = 2
= 2x ; 0 ≤ x ≤ 1
0
0
por simetría:
fY ( y ) = 2 y ; 0 ≤ y ≤ 1
b) Para que las vv.aa. sean independientes, debe cumplir:
f XY ( x, y ) = f X ( x ) fY ( y )
sustituyendo:
EF1 PyE_091 5
4 xy = ( 2 x )( 2 y )
4 xy = 4xy
por lo tanto, sí son variables aleatorias conjuntas estadísticamente independientes.
c) El valor esperado de Z = X 2 + Y 2 está dado por:
E ( Z ) = E ( X 2 + Y 2 ) = E ( X 2 ) + E (Y 2 )
entonces:
∞
E(X 2
)=∫ x 2 f X ( x) dx
-∞
sustituyendo:
1
)=∫ ∫
1 1
2 ⎤
E(X
1
2
x (2 x) dx = 2
2
x dx = x 4 ⎥
3
=
0 0 4 ⎦ 0
2
Por simetría:
E (Y 2 ) =
1
2
E ( Z ) = E ( X 2 ) + E (Y 2 ) =
1 1
Por lo tanto el valor esperado es: + =1
2 2
6. Considérese una enlatadora que produce latas de ocho [onzas] de maíz procesado. Los ingenieros de
control de calidad han determinado que el proceso está funcionando correctamente cuando la
variación verdadera σ de la cantidad de llenado por lata es de menos de 0.0025. Se selecciona una
2
muestra aleatoria de 10 latas de la producción del día y se registra la cantidad de llenado (en onzas)
para cada una. Lo que interesa es la variancia de la muestra, S 2 . Si en verdad σ 2 = 0.001 , calcular
2
la probabilidad de que S será mayor que 0.0025. Supóngase que las cantidades de llenado tienen
una distribución normal.
15 Puntos
Resolución
Sea X la v.a. que representa la cantidad de maíz procesado que debe contener una lata de ocho
[onzas].
X ∼ Normal ( μ X , σ X2 = 0.001)
Sea X i una muestra aleatorias de 10 latas de la producción. i = 1, 2,...,10
X i ∼ Normal ( μ X , σ X2 = 0.001) ; i=1,2,...,10
se pide calcular:
P ( S2n −1 > 0.0025 )
entonces:
⎛ S2n −1 ( n − 1) ( 0.0025)( 9 ) ⎞ = P
P (S 2
n −1 > 0.0025 ) ≈ P⎜
⎝ σ2
>
0.001
⎟
⎠
( Χ( )
2
9 )
> 22.5 = 0.00742
21.666 0.01
22.5 y
23.589 0.005
EF1 PyE_091 6
y − 0.01 = −0.0026 ( x − 21.666 )
con x = 22.5
y = −0.0026 ( 22.5 − 21.666 ) + 0.01
y = 0.0078
donde se observa que es poco probable que se exceda la cantidad de llenado.
De otra forma de la tabla de la distribución Ji cuadrada, con nueve grados de libertad y x = 22.5 , es:
( )
0.005 < P Χ (29) > 22.5 < 0.01
EF1 PyE_091 7
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO
FACULTAD DE INGENIERÍA
DIVISIÓN DE CIENCIAS BÁSICAS
COORDINACIÓN DE CIENCIAS APLICADAS
PROBABILIDAD Y ESTADÍSTICA
SEGUNDO EXAMEN FINAL
RESOLUCIÓN
SEMESTRE 2009-1
DURACIÓN MÁXIMA 2.5 HORAS DICIEMBRE 10 DE 2008
NOMBRE______________________________________________________________________
1. Supóngase que un ingeniero toma una muestra aleatoria de 10 embarques recientemente enviados
por camión de una compañía y registra la distancia en kilómetros y el tiempo de entrega, al mediodía
más cercano, y a partir del momento en que el embarque estuvo listo para su transportación.
Distancia
( x ) , [Km] 825 215 1070 550 480 920 1350 325 670 1215
Tiempo de
entrega 3.5 1.0 4.0 2.0 1.0 3.0 4.5 1.5 3.0 5.0
( y ) , [días]
a) Construir la gráfica de dispersión.
b) Estimar la recta de regresión.
c) Calcular el coeficiente de determinación e interpretar el resultado.
20 Puntos
Resolución
a) El diagrama de dispersión es:
Diagrama de Dispersión
6
5 y = 0.0036x + 0.11
Tiempo (y)
4 R2 = 0.9005
3
2
1
0
0 215 430 645 860 1075 1290 1505
Distancia (x)
∑x ∑y
10 10
i i
∑x ∑y
10 10
∑x
10
1 1 n =1 n =1
x = i , y = i , SS xy = i yi −
n n =1 n n =1 n =1
n
EF2 PyE_091 1
2
⎛ 10 ⎞
⎜ ∑
xi ⎟
⎜ n =1 ⎟
∑
10
y SS xx = x i2 − ⎝ ⎠
n =1
n
SS xx = 7104300 − = 1297860
10
sustituyendo:
4653
β1 = = 0.0036
1297860
β0 = 2.85- ( 0.0036 ) ( 762 ) = 0.11
por lo tanto el ajuste a una recta está dado por:
y = 0.0036 x + 0.11
2
⎛ 10 ⎞
⎜ ∑y⎟
⎜ n =1 i ⎟
∑
10
c) Se requiere SS yy = yi2 − ⎝ ⎠
n =1 n
sustituyendo:
( 28.5)
2
SS yy = 99.75 − = 18.525
10
se sabe que:
SS xy 4653
r= = = 0.9489
SS xx SS yy (1297860 )(18.525)
entonces:
r 2 = ( 0.9489 ) = 0.9004
2
EF2 PyE_091 2
Ai : El circuito proviene del fabricante i ; i = 1, 2, 3.
D : El circuito está defectuoso.
a) Empleando el Teorema de Probabilidad Total:
( ) (
P ( D ) = P D ∩ A1 + P D ∩ A 2 + P D ∩ A 3 ) ( )
P ( D ) = P ( A1 ) P ( D | A 1 ) + P ( A 2 ) P ( D | A 2 ) + P ( A 3 ) P ( D | A 3 )
P ( D ) = ( 0.5 )( 0.05 ) + ( 0.25 )( 0.1) + ( 0.25 )( 0.12 )
P ( D ) = 0.08
Entonces la probabilidad de que no esté defectuoso es:
( )
P D = 1- P ( D ) = 1- 0.08 = 0.92
b) Del Teorema de Bayes y empleando el resultado del inciso anterior:
(
P A2 ∩ D )
(
P A2 | D = )
( ) P D
P( A ) P(D | A )
P ( A | D) =
2 2
P ( D)
2
( ) (
P A2 P 1 - P D | A2 ( ))
(
P A2 | D = ) 0.92
(0.25 )(1 - 0.1)
(
P A2 | D = ) 0.92
= 0.2446
3. El pH con el que se mide la acidez del agua, es importante en los estudios de lluvia ácida. Para
determinado lago de cierta región de México, se llevan a cabo mediciones testigo de acidez para que
se pueda notar cualquier cambio originado por la lluvia acida. El pH de las muestras de agua del lago
es una variable aleatoria X , cuya función de densidad de probabilidad es
⎧ 2x + 8
⎪ 90 ; 2< x≤5
⎪
⎪ 9− x
f X ( x) = ⎨ ; 5< x<9
⎪ 16
⎪ 0 ; en otro caso
⎪
⎩
∫
x
FX ( x ) = f X (t ) dt
-∞
para el intervalo 2 < x ≤ 5 :
EF2 PyE_091 3
∫
x
2t + 8
x
dt = ( t 2 + 8t )
1
FX ( x ) =
2 90 90 2
FX ( x ) = ( x 2 + 8 x ) - ( 4 + 16 ) = ⎡⎣ x 2 + x - 20⎤⎦
1 1 1
; 2< x≤5
90 90 90
para el intervalo 5 < x < 9 :
x
∫
1 1⎛ t2 ⎞ 1 1⎛ x2 ⎞ 1 ⎛
x
1 9−t 25 ⎞
FX ( x ) = + dt = + ⎜ 9t − ⎟ = + ⎜ 9 x − ⎟ − ⎜ 45 − ⎟
2 5 16 2 16 ⎝ 2⎠ 5
2 16 ⎝ 2 ⎠ 16 ⎝ 2 ⎠
1 9 1 45 25 1 9 49 1
FX ( x ) = + x − x2 − + = − x 2 + x − = ⎡⎣ − x 2 + 18 x − 49⎤⎦ ; 5<x <9
2 16 32 16 32 32 16 32 32
por lo tanto, la función de distribución está dada por:
⎧ 0 ; x≤2
⎪ 1
⎪ ⎡⎣ x 2 + x - 20 ⎤⎦ ; 2< x≤5
⎪ 90
FX ( x ) = ⎨
⎪ 1 ⎡ − x 2 + 18 x − 49 ⎤ ; 5<x <9
⎪ 32 ⎣ ⎦
⎪ x≥9
⎩ 1 ;
E(X ) =
sustituyendo:
∫ -∞
x f X ( x) dx
∫ ∫
5 9
⎛ 2x + 8 ⎞ ⎛9− x⎞
E(X ) = x⎜ ⎟ dx + x⎜ ⎟ dx
2 ⎝ 90 ⎠ 5 ⎝ 16 ⎠
∫ ∫
5 9
E(X ) =
1
90
( 2 x 2 + 8x ) dx + 1
16
( 9 x − x ) dx
2
2 5
integrando:
5 9
1 ⎛2 ⎞ 1 ⎛9 1 ⎞
E ( X ) = ⎜ x3 + 4 x 2 ⎟ + ⎜ x 2 − x3 ⎟
90 ⎝ 3 ⎠ 2 16 ⎝ 2 3 ⎠ 5
1 ⎛2 3 2 ⎞ 1 ⎛2 3 2 ⎞ 1 ⎛9 2 1 3 ⎞ 1 ⎛9 2 1 3 ⎞
E(X ) = ⎜ (5 ) + 4 (5 ) ⎟ − ⎜ ( 2 ) + 4 ( 2 ) ⎟ + ⎜ (9 ) − (9 ) ⎟ − ⎜ (5 ) − (5 ) ⎟
90 ⎝ 3 ⎠ 90 ⎝ 3 ⎠ 16 ⎝ 2 3 ⎠ 16 ⎝ 2 3 ⎠
9 19 149
E(X ) = + = ≈ 4.967
5 6 30
EF2 PyE_091 4
4. Investigaciones y análisis recientes se centran en el número de enfermedades relacionadas con el
organismo Escherichia Coli, que provoca la descomposición de los glóbulos rojos y hemorragias
intestinales en sus victimas. En cierta ciudad han ocurrido brotes esporádicos de E. Coli a una tasa de
2.5 por 100,000 durante un periodo de dos años. Supóngase que la tasa se conserva.
a) ¿Cuál es la probabilidad de que halla más de dos casos de E. Coli por 100,000 en dicha ciudad
en un determinado año?
b) ¿Alrededor de cuántos casos a lo sumo se relacionan con el 95% de los brotes de E. Coli?
15 Puntos
Resolución
Sea X la v.a. que representa el número de brotes de Escherichia Coli .
X ~ Binomial ( n , p )
sustituyendo:
⎛ 2.5 ⎞
X ~ Binomial ⎜ n = 100000 , p = ⎟
⎝ 100000 ⎠
o bien
X ~ Binomial ( n = 100000 , p = 0.000025 )
se sabe que, se puede hacer una aproximación por la distribución de Poisson, ya que, n es grande y
⎡ brotes ⎤
p es pequeña, entonces: λ = np = 2.5 ⎢ , en un año, se tiene:
⎣ 2 años ⎥⎦
⎡ brotes ⎤
λ = np = 1.25 ⎢
⎣ año ⎥⎦
por lo tanto:
⎛ ⎡ brotes ⎤ ⎞
λ ∼ Poisson ⎜1.25 ⎢ ⎟
⎝ ⎣ año ⎥⎦ ⎠
a) La probabilidad de que halla más de dos casos de Escherichia Coli , es:
P ( X > 2) = P ( X = 3) + P ( X = 4 ) + P ( X = 5 ) + … +
⎡ 97 ⎤
P ( X > 2) = 1 − P ( X ≤ 2 ) = 1 − e −1.25 ⎢ ⎥ ≈ 0.1315
⎣ 32 ⎦
b) Para determinar el valor de x , de tal forma que P ( X ≤ x) = 0.95 , se tiene:
⎛ ⎡ brotes ⎤ ⎞
X ∼ Poisson ⎜ λ = 1.25 ⎢ ⎟
⎝ ⎣ año ⎥⎦ ⎠
Utilizando el comportamiento acumulado:
x P ( X ≤ x)
(1.25)
0
P ( X = 0) = e −1.25 ≈ 0.2865
0 0!
(1.25) (1.25)
0 1
−1.25
P (X ≤ 1) = e + e−1.25 ≈ 0.6446
1 0! 1!
(1.25) (1.25) (1.25)
0 1 2
−1.25 −1.25
P (X ≤ 2) = e + e + e−1.25 ≈ 0.8685
2 0! 1! 2!
(1.25) 1.25 −1.25 (1.25 ) −1.25 (1.25 ) −1.25
0 2 3
−1.25
P (X ≤ 3) = e + e + e + e ≈ 0.9617
3 0! 1! 2! 3!
Por lo tanto serían a lo más tres casos para tener la probabilidad pedida.
EF2 PyE_091 5
5. Supóngase que Y1 , Y2 y Y3 son variables aleatorias con (μ 1 = 1, σ 12 = 2 ) , (μ 2 = 3, σ 22 = 1) ,
(μ 3 = 0, σ 32 = 4 ) , Cov (Y1 , Y2 ) = −1 , Cov (Y1 , Y3 ) = 2 y Cov (Y2 , Y3 ) = 1 . Calcular la media y la
variancia de T = 2Y1 + Y2 − 3Y3 .
15 Puntos
Resolución
Para obtener la media de la variable aleatoria T , se sabe que es un operador lineal, entonces:
E (T ) = E ( 2Y1 + Y2 − 3Y3 ) = 2 E (Y1 ) + E (Y2 ) − 3E (Y3 )
sustituyendo:
E (T ) = 2 (1) + 3 − 3 ( 0 ) = 5
La variancia de la variable aleatoria T está dada por:
(
Var (T ) = Var 2Y + Y − 3Y
1 2 3 )
( ) ( ) ( ) ( ) ( )( )
Var T = 4Var Y1 + Var Y2 + 9Var Y3 + 2 2 1 Cov Y1 , Y2 + 2 2 ( ) ( )( −3) Cov (Y1, Y3 ) + 2 (1)( −3) Cov (Y2 , Y3 )
Var (T ) = 4 ( 2 ) + 1 + 9 ( 4 ) + 2 ( 2 )(1)( −1) + 2 ( 2 )( −3)( 2 ) + 2 (1)( −3)(1)
Var (T ) = 11
6. El tiempo en el que un cajero de un banco con servicio en el automóvil atiende a un cliente, es una
variable aleatoria con distribución aproximadamente normal, con media 3.2 minutos y desviación
estándar 1.6 minutos. Si se observa una muestra aleatoria de 64 clientes, calcular la probabilidad de
que su tiempo medio en el cajero sea
a) más de 3.5 minutos; y
b) al menos 3.2 minutos pero menos de 3.4.
15 Puntos
Resolución
Sea Y la v.a. que representa el tiempo que tarda un cajero de un banco en brindar servicio en
automóvil a un cliente.
(
Y ∼ Normal μY = 3.2 [min] , σ Y2 = (1.6 ) [min]2
2
)
Sea Yi ; i = 1, 2, ... , 64 la muestra aleatoria tomada de una población normal, por el teorema del
límite central, se tiene:
(
Yi ∼ Normal μYi = 3.2 , σ Y2i = 1.6 2 ) ; i=1,2,...,64
la variable aleatoria para los 64 clientes de un banco en brindar servicio en automóvil:
∑Y
64
1 1
Y = (Y1 + Y2 + ... + Y64 ) = i
64 64
i =1
entonces:
⎛ σ Y2 (1.6 ) ⎞
2
Y ∼ Normal ⎜ μY = μY =3.2 , σ Y =
2
= ⎟
⎜ 64 64 ⎟
⎝ ⎠
a) Del enunciado se pide determinar P Y > 3.5 , entonces: ( )
⎛ ⎞
⎜ 3.5 − 3.2 ⎟
( )
P Y > 3.5 ≈ P ⎜ Z >
⎜ 1.6 ⎟
⎟ = P ( Z > 1.5 )
⎜ ⎟
⎝ 64 ⎠
usando tablas de la función de distribución acumulativa normal estándar:
P ( Z > 1.5 ) = 1 − FZ ( Z = 1.5) = 1 − 0.9332 = 0.0668
EF2 PyE_091 6
(
b) La probabilidad de que la media muestral esté en P 3.2 ≤ Y ≤ 3.4 = P 3.2 < Y < 3.4 , ) ( )
entonces:
⎛ ⎞
⎜ 3.2 − 3.2 3.4 − 3.2 ⎟
(
P 3.2 < Y < 3.4 ≈ P ⎜)
⎜ 1.6
<Z<
1.6 ⎟
⎟ = P ( 0 < Z < 1)
⎜ ⎟
⎝ 64 64 ⎠
usando tablas de la función de distribución acumulativa normal estándar:
P ( 0 < Z < 1) = FZ ( Z = 1) − FZ ( Z = 0 ) = 0.8413 − 0.5 = 0.3413
EF2 PyE_091 7
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO
FACULTAD DE INGENIERÍA
DIVISIÓN DE CIENCIAS BÁSICAS
COORDINACIÓN DE CIENCIAS APLICADAS
DEPARTAMENTO DE PROBABILIDAD Y ESTADÍSTICA
PRIMER EXAMEN FINAL
RESOLUCIÓN
NOMBRE______________________________________________________________________
1. "Scram" es el término que utilizan los ingenieros nucleares para describir un rápido cierre de emergencia
de un reactor nuclear. La industria nuclear ha hecho esfuerzos por reducir significativamente el número
de cierres no planeados. La tabla muestra el número de "Scrams" en cada uno de 56 reactores nucleares
en E.U.A.; 2004
a) Agrupar los datos en ocho intervalos, con un ancho de clase de dos y comenzando en la frontera
inferior -1.5
b) Calcular la media del número de “Scrams” para datos agrupados.
c) Obtener el segundo cuartil (la mediana) para datos agrupados.
Marcas de Frecuencia
clase absoluta
-0.5 6
1.5 13
3.5 18
5.5 6
7.5 8
9.5 3
11.5 1
13.5 1
15 Puntos
Resolución
a) La tabla de distribución de frecuencias es
Límites Fronteras
Marcas fi fi* Fi Fi *
de clase
-1 - 0 -1.5 - 0.5 -0.5 6 0.107 6 0.107
1-2 0.5 - 2.5 1.5 13 0.232 19 0.339
3-4 2.5 - 4.5 3.5 18 0.321 37 0.660
5-6 4.5 - 6.5 5.5 6 0.107 43 0.767
7-8 6.5 - 8.5 7.5 8 0.142 51 0.910
9 - 10 8.5 - 10.5 9.5 3 0.053 54 0.964
11 - 12 10.5 - 12.5 11.5 1 0.017 55 0.982
13 - 14 12.5 - 14.5 13.5 1 0.017 56 1.000
56
∑ ∑
m m
1
x= xi f i = xi fi *
n
i =1 i =1
sustituyendo
PyE_ EF1_TIPO1_2009-2 1
∑
8
1 1 226
x= xi fi = ⎡⎣( −0.5 )( 6 ) + … + (13.5 )(1) ⎤⎦ = = 4.036
56 56 56
i =1
c) El segundo cuartil es un valor que divide al conjunto de datos en dos subconjuntos de igual tamaño,
se obtiene mediante una interpolación lineal, entre las fronteras y la frecuencia acumulada, de tal
manera que se acumulen 28 datos, el valor de la frontera resultado de la interpolación, será el
segundo cuartil, mismo que coincide con la mediana.
Fronteras Fi
2.5 19
x 28
4.5 37
37 − 19 18
m= = =9
4.5 − 2.5 2
con la ecuación de una recta dado un punto y la pendiente, se tiene:
y − 19 = 9 ( x − 2.5 )
con ( x , 28 ) , sustituyendo:
28 − 19 = 9 ( x − 2.5 )
x = 1 + 2.5
x = 3.5
Se observa que en este caso, la mediana coincide con el punto medio de las fronteras de la clase en
cuestión.
2. En una planta de artículos electrónicos, se sabe por experiencia que la probabilidad de que un nuevo
trabajador que haya asistido al programa de capacitación conozca la cuota de producción es 0.86 y que
la probabilidad correspondiente es 0.35 para otro que no haya asistido. Si el 80 % de todos los
empleados de ingreso reciente asisten al programa, determinar la probabilidad de que un nuevo
empleado conozca la cuota de producción.
10 Puntos
Resolución
Sean los eventos
A : El trabajador asistió al programa de capacitación.
B : El trabajador conoce la cuota de producción.
Se pide calcular la probabilidad de que un nuevo empleado conozca la cuota de producción, P ( B ) .
( ) ( )
De los datos se tiene: P ( A ) = 0.8 , P A = 0.2 , P B A = 0.86 y P B A = 0.35 ( )
Del teorema de probabilidad total
P ( B) = P ( A ∩ B) + P ( A ∩ B)
P ( B ) = P ( A) P ( B A) + P ( A ) P ( B A )
sustituyendo
P ( B ) = 0.8 ( 0.86 ) + 0.2 ( 0.35 ) = 0.758
PyE_ EF1_TIPO1_2009-2 2
3. Una tienda de computadoras adquirió tres computadoras Dell a $4000.00 cada una. Las venderá a
$5500.00 cada una. El fabricante se comprometió a adquirir cualquier computadora que no se haya
vendido después de un periodo especificado a $2000.00 cada una. Sea X la variable aleatoria que
representa el número de computadoras vendidas y supóngase que P ( X = 0 ) = 0.1 , P ( X = 1) = 0.2 ,
P ( X = 2 ) = 0.3 y P ( X = 3) = 0.4 . Donde U ( X ) denota la utilidad asociada con la venta de X unidades,
la información dada implica que U ( X ) = Ingresos − Costos = 5500 X + 2000 ( 3 − X ) − 12000 = 3500 X − 6000 .
a) Calcular la utilidad esperada.
b) Determinar la desviación estándar de la utilidad.
15 Puntos
Resolución
La función de probabilidad de X se puede escribir, como
x 0 1 2 3
fX ( x) 0.1 0.2 0.3 0.4
sustituyendo
E ( X ) = ( 0 )( 0.1) + (1)( 0.2 ) + ( 2 )( 0.3) + ( 3)( 0.4 )
E(X ) = 2
sustituyendo en la utilidad esperada
E ⎡⎣U ( X ) ⎤⎦ = 3500 ( 2 ) − 6000 = 1000
b) La variancia de la utilidad esperada es el segundo momento con respecto de la media, o bien, el
segundo momento con respecto del origen menos el primero al cuadrado
Var ⎡⎣U ( X ) ⎤⎦ = Var ( 3500 X − 6000 ) = ( 3500 ) Var ( X )
2
sustituyendo
( )
E X 2 = ( 0 ) ( 0.1) + (1) ( 0.2 ) + ( 2 ) ( 0.3) + ( 3) ( 0.4 )
2 2 2 2
E(X ) = 5
2
La variancia es
Var ( X ) = 5 − [ 2] = 1
2
La variancia de la utilidad es
Var ⎡⎣U ( X ) ⎤⎦ = ( 3500 )
2
PyE_ EF1_TIPO1_2009-2 3
4. El chef de un restaurante de comida cantonesa prepara una ensalada que contiene, en promedio, cinco
vegetales. Obtener la probabilidad de que la ensalada contenga más de cinco vegetales:
a) en un día dado,
b) por primera vez en abril, el quinto día.
15 Puntos
Resolución
Sea X la variable aleatoria que representa el número de vegetales que contiene la ensalada.
⎛ vegetales ⎞
X ∼ Poisson ⎜ λ = 5
⎝ ensalada ⎟⎠
∑
5
5 x e −5
P ( X > 5) = 1 −
x!
x =0
desarrollando
⎡ 50 e −5 51 e −5 52 e −5 53 e −5 54 e −5 55 e −5 ⎤
P ( X > 5) = 1 − ⎢ + + + + + ⎥
⎣ 1 1 2 6 24 120 ⎦
⎡ 25 125 625 3125 ⎤
P ( X > 5 ) = 1 − e −5 ⎢1 + 5 + + + +
⎣ 2 6 24 120 ⎥⎦
1097 −5
P ( X > 5) = 1 − e ≈ 0.384
12
b) Sea Y la variable aleatoria que representa el quinto día de abril es el primer día que la ensalada
contiene más de cinco vegetales.
Y ∼ Geométrica ( p = 0.384 )
entonces
P(Y = 5) = (0.616) 4 (0.384) ≈ 0.055
f X ( x) =
∫ -∞
f XY ( x, y ) dy y fY ( y ) =
∫ −∞
f XY ( x, y ) dx
sustituyendo se tiene
∫
5 5
1 1 ⎛1 2⎞ 24 1
f X ( x) = xy dy = x ⎜ y ⎟ = x= x ; 0< x<4
1 96 96 ⎝ 2 ⎠ 1
192 8
por lo tanto
⎧1
⎪ x ; 0< x<4
f X ( x ) = ⎨8
⎪⎩ 0 ; en otro caso
PyE_ EF1_TIPO1_2009-2 4
para la función marginal de Y
∫
4 4
1 1 ⎛1 2⎞ 1 16
fY ( y ) = xy dx = y ⎜ x ⎟ = y (16 − 0 ) = y ; 1< y < 5
0 96 96 ⎝ 2 ⎠ 0
192 192
⎧1
⎪ y ; 1< y < 5
fY ( y ) = ⎨12
⎪⎩ 0 ; en otro caso
6. Un antropólogo quiere estimar la estatura promedio de los hombres de cierta raza. Si se supone que la
desviación estándar de la población es de 2.5 [cm] y se seleccionan al azar a 100 hombres. Calcular la
probabilidad de que la diferencia entre la media de la muestra y la media verdadera de la población no
exceda de 0.5 [cm]
15 Puntos
Resolución
Sea X la v.a. que representa la estatura de los hombres.
(
X ∼ Normal μ X , σ X2 = ( 2.5 )
2
)
Sea X i una muestra aleatoria de 100 hombres. i = 1, 2,...,100
(
X i ∼ Normal μ X , σ X2 = ( 2.5 )
2
) ; i = 1, 2,...,100
La muestra es grande y se conoce la variancia de la población, entonces por el Teorema del Límite
Central
⎛ σ2 ⎞
X ∼ Normal ⎜ μ X = μ X , σ X2 = X ⎟
⎝ n ⎠
sustituyendo
⎛ ( 2.5) ⎞⎟
2
X ∼ Normal ⎜ μ X = μ X , σ X2 =
⎜ 100 ⎟⎠
⎝
se pide calcular
⎛ ⎞
⎜ −0.5 X − μ ⎟
( )
P X − μ X < 0.5 = P ( −0.5 < X − μ X < 0.5 ) ≈ P ⎜
⎜ 2.5
<
σX
X
<
0.5
⎟ = P ( −2 < Z < 2 )
2.5 ⎟
⎜ 10 10 ⎟⎠
⎝ n
PyE_ EF1_TIPO1_2009-2 5
De tablas de la distribución acumulativa normal estándar:
P ( −2 < Z < 2 ) = FZ ( Z = 2 ) − FZ ( Z = −2 ) = 0.9772 − 0.0228 = 0.9544
x [mm] 6 9 11 22 26 28 33 35
⎡ kg ⎤
y ⎢
⎣ mm ⎥⎦
2 68 67 65 44 40 37 34 32
15 Puntos
Resolución
a) El ajuste de los datos a un modelo lineal de regresión por el criterio de mínimos cuadrados está dado
por
ŷ = βˆ0 + βˆ1 x
donde
βˆ0 = y − βˆ1 x
SS xy
βˆ1 =
SS xx
realizando los productos y las sumas, se tiene
x y x2 y2 xy
6 68 36 4624 408
9 67 81 4489 603
11 65 121 4225 715
22 44 484 1936 968
26 40 676 1600 1040
28 37 784 1369 1036
33 34 1089 1156 1122
35 32 1225 1024 1120
Suma: 170 387 4496 20423 7012
de donde
2
⎛ ⎞
∑
n
⎜ xi ⎟
⎜ ⎟
∑ ⎠ = 4496 − (170 ) = 883.5
n 2
SS xx = x2 − ⎝
i
i =1
n 8
i =1
PyE_ EF1_TIPO1_2009-2 6
∑∑
n n
xi yi
SS xy = xi yi − i =1 i =1
= 7012 −
n 8
i =1
sustituyendo
SS xy − 1211.75
βˆ1 = = = − 1.372
SS xx 883.5
para calcular los promedios, se tiene
∑
n
1 1
x= xi = (170 ) = 21.25
n 8
i =1
y
∑
n
1 1
y= yi = ( 387 ) = 48.375
n 8
i =1
sustituyendo
βˆ0 = 48.375 − ( −1.372 )( 21.25 ) = 77.53
por lo tanto el modelo lineal de regresión es
yˆ = 77.53 − 1.372 x
b) El coeficiente de correlación está definido por
SS xy
r=
SS xx SS yy
calculando
2
⎛ ⎞
∑
n
⎜ yi ⎟
⎜ ⎟
∑ ⎠ = 20423 − ( 387 ) = 1701.875
n 2
SS yy = y2 − ⎝
i
i =1
n 8
i =1
por lo que el coeficiente de correlación es
−1211.75
r= = − 0.988
(883.5)(1701.875)
El coeficiente de determinación está definido por
R 2 = ( r ) 2 = ( −0.988 ) 2 = 0.976
Se concluye que las variables tienen una buena relación lineal, puesto que: R 2 = 0.976
c) Si la deformación es de 25 [mm], entonces
yˆ = 77.53 − 1.372 ( 25 ) = 43.23
PyE_ EF1_TIPO1_2009-2 7
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO
FACULTAD DE INGENIERÍA
DIVISIÓN DE CIENCIAS BÁSICAS
COORDINACIÓN DE CIENCIAS APLICADAS
DEPARTAMENTO DE PROBABILIDAD Y ESTADÍSTICA
PRIMER EXAMEN FINAL
RESOLUCIÓN
NOMBRE______________________________________________________________________
1. "Scram" es el término que utilizan los ingenieros nucleares para describir un rápido cierre de emergencia
de un reactor nuclear. La industria nuclear ha hecho esfuerzos por reducir significativamente el número
de cierres no planeados. La tabla muestra el número de "Scrams" en cada uno de 56 reactores nucleares
en E.U.A.; 2004
a) Agrupar los datos en ocho intervalos, con un ancho de clase de dos y comenzando en la frontera
inferior -0.5
b) Calcular la media del número de “Scrams” para datos agrupados.
c) Obtener el segundo cuartil (la mediana) para datos agrupados.
Marcas de Frecuencia
clase absoluta
0.5 10
2.5 19
4.5 13
6.5 7
8.5 4
10.5 1
12.5 1
14.5 1
15 Puntos
Resolución
a) La tabla de distribución de frecuencias es
Límites Fronteras
Marcas fi fi* Fi Fi *
de clase
0–1 -0.5 – 1.5 0.5 10 0.178 10 0.178
2–3 1.5 – 3.5 2.5 19 0.339 29 0.518
4–5 3.5 – 5.5 4.5 13 0.232 42 0.750
6–7 5.5 – 7.5 6.5 7 0.125 49 0.875
8–9 7.5 – 9.5 8.5 4 0.071 53 0.946
10 – 11 9.5 – 11.5 10.5 1 0.018 54 0.964
12 – 13 11.5 – 13.5 12.5 1 0.018 55 0.982
14 – 15 13.5 – 15.5 14.5 1 0.018 56 1.000
56
∑ ∑
m m
1
x= xi f i = xi f i *
n
i =1 i =1
sustituyendo
∑
8
1 1 228
x= xi f i = ⎡⎣( 0.5 )(10 ) + … + (14.5 )(1) ⎤⎦ = = 4.071
56 56 56
i =1
PyE_ EF1_TIPO2_2009-2 1
c) El segundo cuartil es un valor que divide al conjunto de datos en dos subconjuntos de igual tamaño,
se obtiene mediante una interpolación lineal, entre las fronteras y la frecuencia acumulada, de tal
manera que se acumulen 28 datos, el valor de la frontera resultado de la interpolación, será el
segundo cuartil, mismo que coincide con la mediana.
Fronteras Fi
1.5 10
x 28
3.5 29
29 − 10 19
m= = = 9.5
3.5 − 1.5 2
con la ecuación de una recta dado un punto y la pendiente, se tiene
y − 10 = 9.5 ( x − 1.5 )
con ( x , 28 ) , sustituyendo
28 − 10 = 9.5 ( x − 1.5 )
18 129
x= + 1.5 =
9.5 38
x = 3.395
2. En una planta de artículos electrónicos, se sabe por experiencia que la probabilidad de que un nuevo
trabajador que haya asistido al programa de capacitación conozca la cuota de producción es 0.9 y que la
probabilidad correspondiente es 0.4 para otro que no haya asistido. Si el 75 % de todos los empleados de
ingreso reciente asisten al programa, determinar la probabilidad de que un nuevo empleado no conozca
la cuota de producción.
10 Puntos
Resolución
Sean los eventos
A : El trabajador asistió al programa de capacitación.
B : El trabajador conoce la cuota de producción.
( )
Se pide calcular la probabilidad de que un nuevo empleado no conozca la cuota de producción, P B .
( ) ( ) (
De los datos se tiene: P ( A ) = 0.75 , P A = 0.25 , P B A = 0.9 y P B A = 0.4)
Del teorema de probabilidad total
P ( B) = P ( A ∩ B) + P ( A ∩ B)
P ( B ) = P ( A) P ( B A) + P ( A ) P ( B A )
sustituyendo
P ( B ) = 0.75 ( 0.9 ) + 0.25 ( 0.4 ) = 0.775
entonces
P ( B ) = 1 − P ( B ) = 1 − 0.775 = 0.225
PyE_ EF1_TIPO2_2009-2 2
3. Una tienda de computadoras adquirió tres computadoras Acer a $3900.00 cada una. Las venderá a
$5750.00 cada una. El fabricante se comprometió a adquirir cualquier computadora que no se haya
vendido después de un periodo especificado a $2250.00 cada una. Sea X la variable aleatoria que
representa el número de computadoras vendidas y supóngase que P ( X = 0 ) = 0.1 , P ( X = 1) = 0.2 ,
P ( X = 2 ) = 0.3 y P ( X = 3) = 0.4 . Donde U ( X ) denota la utilidad asociada con la venta de X unidades,
la información dada implica que U ( X ) = Ingresos − Costos = 5750 X + 2250 ( 3 − X ) − 11700 = 3500 X − 4950 .
a) Calcular la utilidad esperada.
b) Determinar el coeficiente de variación de la utilidad.
15 Puntos
Resolución
La función de probabilidad de X se puede escribir, como
x 0 1 2 3
fX ( x) 0.1 0.2 0.3 0.4
sustituyendo
E ( X ) = ( 0 )( 0.1) + (1)( 0.2 ) + ( 2 )( 0.3) + ( 3)( 0.4 )
E(X ) = 2
sustituyendo en la utilidad esperada
E ⎡⎣U ( X ) ⎤⎦ = 3500 ( 2 ) − 4950 = 2050
b) La variancia de la utilidad esperada es el segundo momento con respecto de la media, o bien, el
segundo momento con respecto del origen menos el primero al cuadrado
Var ⎡⎣U ( X ) ⎤⎦ = Var ( 3500 X − 4950 ) = ( 3500 ) Var ( X )
2
calculando
( )
E X2 =
∑ ∀x
x2 f X ( x )
sustituyendo
( )
E X 2 = ( 0 ) ( 0.1) + (1) ( 0.2 ) + ( 2 ) ( 0.3) + ( 3) ( 0.4 )
2 2 2 2
E(X ) = 5
2
La variancia es
Var ( X ) = 5 − [ 2] = 1
2
La variancia de la utilidad es
Var ⎡⎣U ( X ) ⎤⎦ = ( 3500 )
2
PyE_ EF1_TIPO2_2009-2 3
El coeficiente de variación de la utilidad es
σ 3500
CVU = U = = 1.707
μU 2050
4. El chef de un restaurante de comida cantonesa prepara una ensalada que contiene, en promedio, cuatro
vegetales. Obtener la probabilidad de que la ensalada contenga más de cuatro vegetales:
a) en un día dado,
b) por cuarta vez en abril, el octavo día.
15 Puntos
Resolución
Sea X la variable aleatoria que representa el número de vegetales que contiene la ensalada.
⎛ vegetales ⎞
X ∼ Poisson ⎜ λ = 5
⎝ ensalada ⎟⎠
∑
4
4 x e −4
P ( X > 4) = 1 −
x!
x=0
desarrollando
⎡ 40 e −4 41 e−4 42 e −4 43 e−4 44 e −4 ⎤
P ( X > 4) = 1 − ⎢ + + + + ⎥
⎣ 1 1 2 6 24 ⎦
⎡ 16 64 256 ⎤
P ( X > 4 ) = 1 − e −4 ⎢1 + 4 + + +
⎣ 2 6 24 ⎥⎦
103 −4
P ( X > 4) = 1 − e ≈ 0.371
3
b) Sea Y la variable aleatoria que representa el octavo día de abril es el cuarto día que la ensalada del
chef contiene más de cuatro vegetales.
Y ∼ Pascal ( r = 4, p = 0.371)
entonces
⎛7⎞
P(Y = 8) = ⎜ ⎟ (0.371) 4 (0.629) 4 ≈ 0.104
⎝ 3⎠
f X ( x) =
∫ -∞
f XY ( x, y ) dy y fY ( y ) =
∫ −∞
f XY ( x, y ) dx
PyE_ EF1_TIPO2_2009-2 4
sustituyendo se tiene
∫
4 4
1 1 ⎛1 2⎞ 1 1
f X ( x) = xy dy = x ⎜ y ⎟ = x (16 − 0 ) = x ; 1 < x < 5
0 96 96 ⎝ 2 ⎠ 0
192 12
⎧1
⎪ x ; 1< x < 5
f X ( x ) = ⎨12
⎪⎩ 0 ; en otro caso
∫
5 5
1 1 ⎛1 2⎞ 1 1
fY ( y ) = xy dx = y ⎜ x ⎟ = y ( 25 − 1) = y ; 0 < y < 4
1 96 96 ⎝ 2 ⎠ 1
192 8
⎧1
⎪ y ; 0< y<4
fY ( y ) = ⎨ 8
⎪⎩ 0 ; en otro caso
6. Un antropólogo quiere estimar la estatura promedio de los hombres de cierta raza. Si se supone que la
desviación estándar de la población es de 2.5 [cm] y se seleccionan al azar a 100 hombres. Calcular la
probabilidad de que la diferencia entre la media de la muestra y la media verdadera de la población
exceda de 0.5 [cm]
15 Puntos
Resolución
Sea X la v.a. que representa la estatura de los hombres.
(
X ∼ Normal μ X , σ X2 = ( 2.5 )
2
)
Sea X i una muestra aleatoria de 100 hombres. i = 1, 2,...,100
(
X i ∼ Normal μ X , σ X2 = ( 2.5 )
2
) ; i = 1, 2,...,100
La muestra es grande y se conoce la variancia de la población, entonces por el Teorema del Límite
Central
⎛ σ2 ⎞
X ∼ Normal ⎜ μ X = μ X , σ X2 = X ⎟
⎝ n ⎠
PyE_ EF1_TIPO2_2009-2 5
sustituyendo
⎛ ( 2.5 ) ⎞
2
X ∼ Normal ⎜ μ X = μ X , σ X =
2
⎟
⎜ 100 ⎟⎠
⎝
se pide calcular
⎛ ⎞
⎜ −0.5 X − μ 0.5 ⎟
(
P X − μX )
> 0.5 = 1 − P ( −0.5 < X − μ X < 0.5 ) ≈ 1 − P ⎜
⎜ 2.5
<
σX
X
< ⎟ = 1 − P ( −2 < Z < 2 )
2.5 ⎟
⎜ 10 10 ⎟⎠
⎝ n
De tablas de la distribución acumulativa normal estándar:
1 − P ( −2 < Z < 2 ) = 1 − ( FZ ( Z = 2 ) − FZ ( Z = −2 ) ) = 1 − ( 0.9772 − 0.0228 ) = 1 − 0.9544 = 0.0456
x [mm] 6 9 11 22 26 28 33 35
⎡ kg ⎤
y ⎢
⎣ mm ⎥⎦
2 68 67 65 44 40 37 34 32
15 Puntos
Resolución
a) El ajuste de los datos a un modelo lineal de regresión por el criterio de mínimos cuadrados está dado
por
ŷ = βˆ0 + βˆ1 x
donde
βˆ0 = y − βˆ1 x
SS xy
βˆ1 =
SS xx
realizando los productos y las sumas, se tiene
x y x2 y2 xy
6 68 36 4624 408
9 67 81 4489 603
11 65 121 4225 715
22 44 484 1936 968
26 40 676 1600 1040
28 37 784 1369 1036
33 34 1089 1156 1122
35 32 1225 1024 1120
Suma: 170 387 4496 20423 7012
PyE_ EF1_TIPO2_2009-2 6
de donde
2
⎛ ⎞
∑
n
⎜ xi ⎟
⎜ ⎟
∑ ⎠ = 4496 − (170 ) = 883.5
n 2
SS xx = x2 − ⎝ i
i =1
n 8
i =1
∑∑
n n
xi yi
SS xy = xi yi − i =1 i =1
= 7012 −
n 8
i =1
sustituyendo
SS xy − 1211.75
βˆ1 = = = − 1.372
SS xx 883.5
para calcular los promedios, se sabe
∑
n
1 1
x= xi = (170 ) = 21.25
n 8
i =1
y
∑ y = 18 (387) = 48.375
n
1
y= i
n
i =1
sustituyendo
βˆ0 = 48.375 − ( −1.372 )( 21.25 ) = 77.53
por lo tanto el modelo lineal de regresión es
yˆ = 77.53 − 1.372 x
b) El coeficiente de correlación está definido por
SS xy
r=
SS xx SS yy
calculando
2
⎛ ⎞
∑
n
⎜ yi ⎟
⎜ ⎟
∑ ⎠ = 20423 − ( 387 ) = 1701.875
n 2
SS yy = y2 − ⎝
i
i =1
n 8
i =1
por lo que el coeficiente de correlación es
−1211.75
r= = − 0.988
(883.5)(1701.875)
c) Si la deformación es de 25 [mm], entonces
yˆ = 77.53 − 1.372 ( 25 ) = 43.23
PyE_ EF1_TIPO2_2009-2 7
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO
FACULTAD DE INGENIERÍA
DIVISIÓN DE CIENCIAS BÁSICAS
COORDINACIÓN DE CIENCIAS APLICADAS
DEPARTAMENTO DE PROBABILIDAD Y ESTADÍSTICA
SEGUNDO EXAMEN FINAL
RESOLUCIÓN
NOMBRE______________________________________________________________________
1. Una muestra aleatoria del porcentaje de algodón en una tela utilizada para elaborar camisetas está
representada en la tabla de distribución de frecuencias
Clase Linf Lsup Fri Frs xi fi fi* Fi Fi*
1 32.5 33.3 32.45 33.35 32.9 4 0.114 4 0.114
2 33.4 34.2 33.35 34.25 33.8 8 0.229 12 0.343
3 34.3 35.1 34.25 35.15 34.7 12 0.343 24 0.686
4 35.2 36.0 35.15 36.05 35.6 6 0.171 30 0.857
5 36.1 36.9 36.05 36.95 36.5 2 0.057 32 0.914
6 37.0 37.8 36.95 37.85 37.4 3 0.086 35 1.000
35
a) Trazar el histograma de frecuencias relativas.
b) Calcular las medidas de tendencia central y trazar el polígono de frecuencias con las medidas
obtenidas.
c) Trazar la ojiva de frecuencias acumuladas relativas.
15 Puntos
Resolución
a) El histograma es
0.400
0.300
0.200
0.100
0.000
32.9 33.8 34.7 35.6 36.5 37.4
Marcas de clase
∑ ∑
m m
1
x= xi f i = xi f i *
n
i =1 i =1
sustituyendo se tiene
∑
8
1 1 1217.2
x= xi fi = ⎡⎣( 32.9 )( 4 ) + … + ( 37.4 )( 3) ⎤⎦ = = 37.777
35 35 35
i =1
La mediana es el valor que divide a la muestra en dos partes iguales, entonces realizando una
interpolación
PyE_ EF2_TIPO1_2009-2 1
Fronteras Fi
34.25 12
x 17.5
35.15 24
24 − 12 12
m= = = 13.333
35.15 − 34.25 0.9
con la ecuación de una recta dado un punto y la pendiente, se tiene
y − 12 = 13.333 ( x − 34.25 )
con ( x , 17.5 ) , sustituyendo:
17.5 − 12 = 13.333 ( x − 34.25 )
5.5
x= + 34.25
13.333
x = 34.663
PyE_ EF2_TIPO1_2009-2 2
Como se observa en la gráfica.
Frecuencia relativa
0.4
0.3
0.2
0.1
0
34.61 < 34.663 < 37.777
32.0 32.9 33.8 34.7 35.6 36.5 37.4 38.3
Marcas de clase
c) La ojiva es
Ojiva
Frecuencia acumulada relativa
1
0.8
0.6
0.4
0.2
0
32.45 33.35 34.25 35.15 36.05 36.95 37.85
Frontera superior
2. Un minorista vende dos tipos de pantallas planas de LCD, la experiencia demuestra que tienen la misma
demanda. Cuatro clientes entran uno tras otro a la tienda y solicitan pantallas planas.
a) Describir el espacio muestral del experimento aleatorio.
b) Sea A el evento que representa, al menos dos clientes prefieren una pantalla plana del mismo tipo.
Sea B el evento que representa, exactamente dos clientes prefieren una pantalla plana del mismo
tipo.
(
Calcular P A B y P B A ) ( )
15 Puntos
Resolución
Sea 1 el evento que representa a las pantallas planas de LCD del tipo I.
Sea 2 el evento que representa a las pantallas planas de LCD del tipo II.
a) El espacio muestral del experimento aleatorio es
⎧1111, 1112, 1121, 1122 ⎫
⎪1211, 1212, 1221, 1222 ⎪⎪
⎪
S =⎨ ⎬
⎪2111, 2112, 2121, 2122 ⎪
⎪⎩2211, 2212, 2221, 2222 ⎪⎭
PyE_ EF2_TIPO1_2009-2 3
⎧1111, 1112, 1121, 1122 ⎫
⎪1211, 1212, 1221, 1222 ⎪⎪
⎪
A=⎨ ⎬=S
⎪2111, 2112, 2121, 2122 ⎪
⎪⎩2211, 2212, 2221, 2222 ⎪⎭
B = {1122, 1212, 1221, 2112, 2121, 2211}
6 3
Las probabilidades asociadas son: P ( A ) = P ( S ) = 1 , P ( B ) = =
16 8
P ( A ∩ B) P ( B)
P ( A B) = = =1
P ( B) P ( B)
P ( A ∩ B) P ( B)
P ( B A) =
3
= = P ( B) =
P ( A) 1 8
−∞
sustituyendo
x
1 2 1 ⎡1 ⎤ 1
FX ( x ) = ∫
x
t dt = ⎢ t 3 ⎥ = ⎡⎣ x3 + 1⎤⎦ ; −1 < x < 2
−1 3 3 ⎣ 3 ⎦ −1 9
entonces la función de distribución que muestra el comportamiento acumulado es
⎧ 0 ; x ≤ −1
⎪1
⎪
FX ( x ) = ⎨ ⎡⎣ x3 + 1⎤⎦ ; −1 < x < 2
⎪9
⎪⎩ 1 ; x≥2
b) Se pide calcular P ( X > 0 ) , entonces
FX ( x ) = P ( X < x ) = P ( X ≤ x )
sustituyendo
P ( X > 0 ) = 1 − FX ( x ) = 1 − P ( X ≤ x )
⎡1 ⎤ 1 8
P ( X > 0 ) = 1 − FX ( 0 ) = 1 − ⎢ ⎡⎣ 03 + 1⎤⎦ ⎥ = 1 − =
⎣9 ⎦ 9 9
PyE_ EF2_TIPO1_2009-2 4
4. Se sabe que el tiempo en minutos que una secretaria habla por teléfono, es una variable aleatoria con
función de densidad
⎧⎪ −
t
fT (t ) = ⎨ C e 40
; t >0
⎪⎩ 0 ; en otro caso
a) Calcular el valor de C para que la función sea de densidad.
b) Obtener la variancia del tiempo en minutos que la secretaria habla por teléfono.
c) Calcular la probabilidad de que una secretaria hable más de 10 minutos por teléfono.
15 Puntos
Resolución
Sea T la v.a. que representa el tiempo en minutos que una secretaria habla por teléfono.
Se tiene que T es una v.a. con distribución exponencial, esto es
⎛ 1 ⎞
T ∼ Exp ⎜ λ = C = ⎟
⎝ 40 ⎠
1
a) De lo anterior c =
40
por lo tanto, la función es
⎧ 1 − t
⎪ e 40
; t >0
fT (t ) = ⎨ 40
⎪
⎩ 0 ; en otro caso
λ 2
⎛ 1 ⎞
2
⎜ ⎟
⎝ 40 ⎠
c) Se pide calcular P (T > 10 ) , entonces se usan propiedades de la función exponencial
1 1
− (10 ) −
P (T > 10 ) = e − λt = e 40
=e 4
≈ 0.779
5. Dos líneas de producción manufacturan cierto tipo de artículos deportivos. Supóngase que la producción
(en cualquier día dado), es de la siguiente forma, sea X la variable aleatoria que representa el número
de artículos deportivos producidos en la línea I y, Y la variable aleatoria que representa el número de
artículos producidos en la línea II, la distribución de probabilidad conjunta es
f XY (x,y) y
0 1 2 3
0 0 0.04 0.12 0.09
x 1 0.02 0.14 0.21 0.14
2 0.07 0.06 0.06 0.05
a) Calcular la probabilidad de que en la línea I se produzcan más artículos deportivos que en la línea II.
Obtener la probabilidad de que se produzcan en total tres artículo deportivos.
b) Determinar la función marginal del número de artículos producidos en la línea I.
c) Cuál es la función de probabilidad condicional, dado que se producen dos artículos en la línea I.
PyE_ EF2_TIPO1_2009-2 5
d) En promedio cuántos artículos se espera sean producidos en la línea II, si se sabe que en la línea I se
producen dos.
20 Puntos
Resolución
a) Se pide calcular P ( X > Y ) , entonces
P ( X > Y ) = f XY (1, 0 ) + f XY ( 2, 0 ) + f XY ( 2,1) = 0.02 + 0.07 + 0.06 = 0.15
Se pide obtener P (T = 3 = X + Y ) , sustituyendo
P (T = 3 = X + Y ) = f XY ( 0,3) + f XY (1, 2 ) + f XY ( 2,1)
P (T = 3) = 0.09 + 0.21 + 0.06 = 0.36
b) La función marginal para el número de artículos producidos por la línea I, está definida por
f X ( x ) = ∑ f XY ( x, y )
∀y
sustituyendo
x 0 1 2
fX ( x) 0.25 0.51 0.24
c) La función condicional, dado que se producen dos artículos en la línea I, está dada por
⎧ f XY ( 2, y )
⎪ ; f X ( X = 2) > 0
fY X = 2 (Y X = 2) = ⎨ f X ( X = 2 )
⎪
⎩ 0 ; en otro caso
sustituyendo
Y 0 1 2 3
fY X = 2 (Y X = 2)
0.292 0.250 0.250 0.208
d) En promedio cuántos artículos se espera sean producidos en la línea II, si se sabe que en la línea
uno se producen dos. Por lo tanto se pide el valor esperado, del inciso anterior
E (Y X = 2 ) = ∑ y fY X = 2 (Y X = 2)
∀y
sustituyendo
E (Y X = 2 ) = (1)( 0.250 ) + ( 2 )( 0.250 ) + ( 3)( 0.208 ) = 1.374
Se espera una producción de dos artículos deportivos en la línea II, dado que en la línea uno se
producen dos.
6. Las calificaciones de un examen de colocación que se aplicó a estudiantes de primer año de una
universidad al sur del D.F., durante los últimos cinco años están distribuidas aproximadamente de forma
normal con una media de 74 y una variancia de ocho. ¿Considera que la variancia ocho es una valor
válido de la variancia si una muestra aleatoria de 20 estudiantes, quienes realizan tal examen de
colocación este año, obtienen un valor de la variancia de S n2−1 = 20 ?
15 Puntos
Resolución
Sea X la v.a. que representa la calificación de un examen de colocación.
X ∼ Normal ( μ X =74 , σ X2 = 8 )
PyE_ EF2_TIPO1_2009-2 6
Se pide calcular si es válida la variancia de la muestra, S n2−1 = 20 , entonces
(
P S n2−1 > 20 σ 2 = 8 )
transformando en distribución Ji cuadrada, con 19 grados de libertad, usando calculadora
⎛ ( n − 1) S n2−1 (19 )( 20 ) ⎞ ⎛ 2 (19 )( 20 ) ⎞ = P Χ 2 > 47.5 ≈ 0.000303
P ⎜⎜
⎝ σ 2
>
8
⎟⎟ = P ⎜ Χ (α ,19) >
⎠ ⎝ 8
⎟
⎠
(α ,19 ) ( )
Usando tabla de la distribución Ji cuadrada, con 19 grados de libertad y abscisa 47.5
( )
P Χ (2α ,19 ) > 47.5 < 0.001
Es muy poco probable que la variancia muestral sea de 20, entonces no es válido.
7. Se realizó un estudio para determinar los efectos de no dormir en la capacidad de las personas para
resolver problemas sencillos. La cantidad variaba de 8, 12, 16, 20 a 24 horas sin dormir. Cinco personas
participaron en el estudio. Se dio a cada persona, después de un periodo específico sin dormir, un
conjunto de problemas sencillos de sumar y se registro el número de errores. Se obtuvieron los siguientes
resultados
número de
errores, ( y )
8 10 14 12 16
número de horas
sin dormir , ( x )
8 12 16 20 24
x y x2 y2 xy
8 8 64 64 64
12 10 144 100 120
16 14 256 196 224
20 12 400 144 240
24 16 576 256 384
Suma: 80 60 1440 760 1032
de donde
2
⎛ n ⎞
⎜ ∑ xi ⎟ ( 80 )
2
⎝ ⎠
n
SS xx = ∑ xi −
2 i =1
=1440 − = 160
i =1 n 5
n n
n ∑x ∑ y i i
(80 )( 60 ) = 72
SS xy = ∑ xi yi − i =1 i =1
=1032 −
i =1 n 5
PyE_ EF2_TIPO1_2009-2 7
sustituyendo
SS xy 72
βˆ1 = = = 0.45
SS xx 160
para calcular los promedios, se tiene
1 n 1
x= ∑
n i =1
xi = ( 80 ) = 16
5
y
1 n 1
y= ∑
n i =1
yi = ( 60 ) = 12
5
sustituyendo
βˆ0 =12 − ( 0.45 )(16 ) = 4.8
por lo tanto el modelo lineal de regresión es
yˆ = 0.45 x + 4.8
Diagrama de dispersión
20
Núm. de errores
15
10 y = 0.45x + 4.8
5 2
R = 0.81
0
7 12 17 22
Núm. de horas sin dormir
PyE_ EF2_TIPO1_2009-2 8
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO
FACULTAD DE INGENIERÍA
DIVISIÓN DE CIENCIAS BÁSICAS
COORDINACIÓN DE CIENCIAS APLICADAS
DEPARTAMENTO DE PROBABILIDAD Y ESTADÍSTICA
PRIMER EXAMEN FINAL
RESOLUCIÓN
SEMESTRE 2010-1 TIPO 1
DURACIÓN MÁXIMA 2.5 HORAS DICIEMBRE 1 DE 2009
NOMBRE______________________________________________________________________
1. El índice de claridad se determinó en los cielos de Morelos, para cada uno de los 365 días de un año,
obteniéndose los siguientes datos.
Límites aparentes Frecuencia absoluta ( fi )
0.30-0.34 8
0.35-0.39 14
0.40-0.44 28
0.45-0.49 24
0.50-0.54 39
0.55-0.59 51
0.60-0.64 106
0.65-0.69 84
0.70-0.74 11
a) Determinar las frecuencias relativas y trazar el histograma correspondiente.
b) Los días despejados son aquellos para los que el índice de claridad es por lo menos 0.65. ¿Qué
porcentaje de días está despejado?
10 Puntos
Resolución
1
a) La frecuencia relativa y las marcas de clase, se definen como: fi * = f i y el punto medio de los
n
límites aparentes, respectivamente, sustituyendo se tiene:
PyE_ EF1_TIPO1_2010-1 1
Histograma de frecuencias relativas
Frecuencia relativa
0.4
0.3
0.2
0.1
0
0.32 0.37 0.42 0.47 0.52 0.57 0.62 0.67 0.72
Marcas de clase
b) Los días despejados son aquellos para los que el índice de claridad es por lo menos 0.65, entonces
de la tabla de distribución de frecuencias el porcentaje es: (0.2301+0.0301)*100=26.02%
2. Con base en varios estudios, una compañía ha clasificado de acuerdo con la posibilidad de encontrar
petróleo, las formaciones geológicas en tres tipos. La compañía pretende perforar un pozo en un
determinado sitio, al que se le asignan las probabilidades de 0.35, 0.4 y 0.25 para los tres tipos de
perforación respectivamente. De acuerdo con la experiencia, se sabe que el petróleo se encuentra en un
40% de formaciones de tipo I, en un 20% de formaciones de tipo II y en un 30% del tipo III.
a) Si la compañía descubre petróleo en ese sitio, determinar la probabilidad de que exista una
formación de tipo III.
b) Determinar la probabilidad de la existencia de una formación del tipo II, si la compañía no
encuentra petróleo en ese sitio.
15 Puntos
Resolución
Sean:
I el evento que representa una formación geológica del tipo I.
II el evento que representa una formación geológica del tipo II.
III el evento que representa una formación geológica del tipo III.
A el evento que representa encontrar petróleo.
P ( A ) = P ( I ) P ( A I ) + P ( II ) P ( A II ) + P ( III ) P ( A III )
PyE_ EF1_TIPO1_2010-1 2
Para determinar la probabilidad de que haya una formación geológica de tipo III, dado que la
compañía encuentra petróleo en ese sitio, se utiliza el Teorema de Bayes, entonces:
P ( A ∩ III )
P ( III A ) =
P ( A)
esto es:
P ( III ) P ( A III )
P ( III A ) =
P ( I ) P ( A I ) + P ( II ) P ( A II ) + P ( III ) P ( A III )
sustituyendo:
P ( III A ) =
( 0.25)( 0.3) = 0.2542
( 0.35)( 0.4 ) + ( 0.4 )( 0.2 ) + ( 0.25)( 0.3)
b) Se calcula la probabilidad de la existencia de una formación del tipo II, si se sabe que la compañía
no encuentra petróleo en ese sitio, del Teorema de Bayes, esto es:
P ( A ∩ II ) P ( A ∩ II )
P ( II A ) = =
P ( A) 1 − P ( A)
utilizando la regla de la multiplicación:
P ( II A ) =
P ( II ) P A II ( ) = ( 0.4 )( 0.8) = 0.4539
1 − 0.295 0.705
fX ( x)
3k
2k
k
X
O 1 2 3 4 5 6 7 8 9 10
1=
∫ -∞
f X ( x ) dx
PyE_ EF1_TIPO1_2010-1 3
1
k= ≈ 0.0833
12
Para determinar la forma analítica de la función de densidad, se utiliza la forma de la recta dados dos
puntos, la función constante y otra vez, la forma de la recta dados dos puntos, entonces:
⎧ 1 5
⎪− 24 x + 24 ; 1≤ x ≤ 3
⎪
⎪⎪ 1
; 3≤ x ≤8
fX ( x) = ⎨ 12
⎪ 1 7
⎪ x− ; 8 ≤ x ≤ 10
⎪ 12 12
⎪⎩ 0 ; en otro caso
La función de distribución que muestra el comportamiento acumulado, está definida por:
∫
x
FX ( x ) = P ( X ≤ x ) = P ( X < x ) = f X (t ) dt
-∞
sustituyendo por intervalos:
en 1 ≤ x ≤ 3
∫
x
⎛ 1 5 ⎞ 1 2 5 3
FX ( x ) = ⎜− t + ⎟ dt = − x + x−
1 ⎝ 24 24 ⎠ 48 24 16
en 3 ≤ x ≤ 8
∫
x
1 1 1
FX ( x ) = + dt = x
4 3 12 12
en 8 ≤ x ≤ 10
∫
x
2 ⎛1 7⎞ 1 2 7 8
FX ( x ) = + ⎜ t - ⎟ dt = x − x+
3 8 ⎝ 12 12 ⎠ 24 12 3
por lo tanto, la función acumulativa está dada por:
⎧ 0 ; x ≤1
⎪ 1
⎪− x 2 + 5 x − 3 ; 1≤ x ≤ 3
⎪ 48 24 16
⎪⎪ 1
FX ( x ) = ⎨ x ; 3≤ x ≤8
⎪ 12
⎪ 1 2 7 8
⎪ 24 x − 12 x + 3 ; 8 ≤ x ≤ 10
⎪
⎪⎩ 1 x ≥ 10
;
1
Para determinar la mediana, se sabe que P ( X ≤ x ) = P ( X < x ) = , sustituyendo e igualando en la
2
función de distribución, en el tercer intervalo:
1 1
= x
2 12
despejando:
12
x= =6
2
PyE_ EF1_TIPO1_2010-1 4
4. A un Centro de llamadas telefónicas de una empresa eléctrica, llegan en promedio tres llamadas por
minuto. Supóngase que dichas llamadas siguen un proceso de Poisson.
a) Calcular la probabilidad de recibir menos de tres llamadas en dos minutos.
b) Obtener la probabilidad de que el tiempo entre dos llamadas consecutivas sea mayor a dos
minutos.
c) Determinar el tiempo promedio entre llamadas y su desviación estándar.
P ( X < 3) = + +
0! 1! 2!
P ( X < 3) = e −6 + 6e −6 + 18e−6 = e −6 (1 + 6 + 18 ) = 25e −6 ≈ 0.0619
b) Sea Y la variable aleatoria que representa el tiempo entre dos llamadas consecutivas que llegan un
Centro de llamadas.
⎛ ⎡ llamadas ⎤ ⎞
Y ∼ Exponencial ⎜ λ = 3 ⎢⎣ minuto ⎥⎦ ⎟
⎝ ⎠
Se pide calcular la probabilidad de que el tiempo entre dos llamada consecutivas sea mayor de dos
minutos, P (Y > 2 ) , esto es:
P (Y > 2 ) = 1 − FY (Y = 2 ) = e −3(2) = e −6 ≈ 0.0025
c) El tiempo promedio entre dos llamadas es la media (valor esperado) de la variable aleatoria con
distribución exponencial, esto es:
1 1
E (Y ) = =
λ 3
La variancia de la variable aleatoria con distribución exponencial, es:
1 1 1
Var (Y ) = = =
λ 2
32 9
Entonces la desviación estándar, es:
1 1 1
σ X = Var (Y ) = = =
λ 2
32 3
d) En un minuto se tiene:
X ∼ Poisson ( λ = 3)
Se pide calcular la probabilidad de recibir al menos dos llamadas en un minutos , P ( X ≥ 2 ) , esto
es:
P ( X ≥ 2 ) = P ( X = 2 ) + P ( X = 3) + P ( X = 4 ) + … +
sustituyendo:
PyE_ EF1_TIPO1_2010-1 5
⎡ ( 3)0 e −3 ( 3)1 e−3 ⎤
P ( X ≥ 2 ) = 1 − P ( X ≤ 1) = 1 − ⎢ + ⎥
⎣⎢ 0! 1! ⎦⎥
P ( X ≥ 2 ) = 1 − ⎡⎣ e−3 + 3e −3 ⎤⎦ = 1 − e −3 [1 + 3] = 1 − 4e −3 ≈ 0.8009
y
f XY ( x, y ) -3 -1 1 3
1 1
x 1 0 4 4 0
1 1
9 4 0 0 4
a) Obtener E ( XY ) , E ( X ) y E (Y )
b) Calcular Cov ( X , Y )
c) ¿Son X y Y variables aleatorias independientes?
15 Puntos
Resolución
a) E ( XY ) =
∑∑ ∀y ∀x
xy f XY ( x, y )
sustituyendo:
⎛1⎞ ⎛1⎞ ⎛1⎞ ⎛1⎞
E ( XY ) = (1)( −1) ⎜ ⎟ + (1)(1) ⎜ ⎟ + ( 9 )( −3) ⎜ ⎟ + ( 9 )( 3) ⎜ ⎟ = 0
⎝4⎠ ⎝4⎠ ⎝4⎠ ⎝ 4⎠
El valor esperado de X , se define por:
E(X ) =
∑ ∀x
x fX ( x)
sustituyendo:
E ( X ) = (1)( 0.5 ) + ( 9 )( 0.5 ) = 5
El valor esperado de Y , se define de forma análoga:
E (Y ) =
∑ ∀y
y fY ( y )
sustituyendo:
E (Y ) = ( −3)( 0.25 ) + ( −1)( 0.25 ) + (1)( 0.25 ) + ( 3)( 0.25 ) = 0
PyE_ EF1_TIPO1_2010-1 6
Para ello, se calculan las funciones marginales, entonces:
fX ( x) =
∑∀y
f XY ( x, y ) y fY ( y ) =
∑
∀x
f XY ( x, y )
x 1 9
fX ( x) 0.5 0.5
y -3 -1 1 3
fY ( y ) 0.25 0.25 0.25 0.25
sustituyendo:
⎛ 1 ⎞⎛ 1⎞ 1
f XY ( X = 1, Y = −3) = 0 ≠ ⎜ f X ( X = 1) = ⎟ ⎜ fY (Y = −3) = ⎟ =
⎝ 2 ⎠⎝ 4⎠ 8
y observa que f XY ( x, y ) ≠ f X ( x ) fY ( y )
Por lo que se concluye que las variables aleatorias son dependientes.
6. Dados los siguientes números aleatorios con distribución uniforme entre 0 y 1, generar un número
aleatorio con distribución normal con parámetros μ X = 2 y σ X = 4
0.89 0.01 0.95 0.45 0.59 0.87
0.19 0.27 0.64 0.75 0.25 0.63
15 Puntos
Resolución
X = μX + σ X ⎜ Ri − 6 ⎟
⎜ ⎟
⎝ i =1 ⎠
sustituyendo:
∑
12
ri = 6.49
i =1
X = 2 + 4 ( 6.49 − 6 ) = 3.96
7. La siguiente tabla muestra datos sobre el desgaste de acero dulce y y la viscosidad del aceite x .
PyE_ EF1_TIPO1_2010-1 7
a) Trazar la gráfica de la dispersión de los datos. ¿Parece conveniente el uso de un modelo de
regresión lineal?
b) Ajustar un modelo de regresión lineal simple.
c) Determinar el valor que se espera del desgaste cuando la viscosidad es 30
d) ¿Puede considerarse válido el modelo? Justificar su respuesta.
15 Puntos
Resolución
a)
b) El modelo es:
ŷ = βˆ0 + βˆ1 x
9 9
9 ∑ xi ∑ yi ( 220.5)(1333)
∑x y − i i
i =1 i =1
9
26864.4 −
9
βˆ1 = i =1
= ≈ −3.5086
( 220.5 )
2 2
⎛ ⎞ 9
⎜ ∑ xi ⎟ 7053.67 −
xi2 − ⎝ i =1 ⎠
9
9
∑
i =1 9
y
βˆ0 = y − βˆ1 x
1333 ⎛ 220.5 ⎞
βˆ0 = − ( −3.5086 ) ⎜ ⎟ ≈ 234.0718
9 ⎝ 9 ⎠
El modelo queda:
yˆ = 234.0718 − 3.5086 x
c) Para el valor que se espera del desgaste cuando la viscosidad es 30, sustituyendo en el modelo:
yˆ (30) = 234.0718 − 3.5086(30) ≈ 128.8138
d) Para determinar si el modelo es válido debe obtenerse el coeficiente de determinación.
El coeficiente de correlación, está definido por:
SS xy
r=
SS xx SS yy
PyE_ EF1_TIPO1_2010-1 8
2
⎛ ⎞
∑
9
⎜ xi ⎟
⎜ ⎟
∑ ⎠ = 7053.67 − ( 220.5 ) = 1651.42
9 2
SS xx = x2 − ⎝
i
i =1
9 9
i =1
2
⎛ ⎞
∑
9
⎜ yi ⎟
⎜ ⎟
∑ ⎠ = 220549 − (1333) ≈ 23116.8889
9 2
SS yy = y2 − ⎝
i
i =1
9 9
i =1
∑∑
9 9
xi yi
∑ ( 220.5)(1333) = −5794.1
9
SS xy = xi yi − i =1 i =1
= 26864.4 −
9 9
i =1
sustituyendo:
SS xy −5794.1
r= = ≈ −0.9378
SS xx SS yy (1651.42 )( 23116.8889 )
Entonces el coeficiente de determinación será:
( −5794.1)
2
SS xy2
r =R =
2 2
= ≈ 0.8794
SS xx SS yy (1651.42 )( 23116.8889 )
El ajuste es regular y puede considerarse válido el modelo dependiendo del error que se esté
dispuesto a cometer.
PyE_ EF1_TIPO1_2010-1 9
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO
FACULTAD DE INGENIERÍA
DIVISIÓN DE CIENCIAS BÁSICAS
COORDINACIÓN DE CIENCIAS APLICADAS
DEPARTAMENTO DE PROBABILIDAD Y ESTADÍSTICA
SEGUNDO EXAMEN FINAL
RESOLUCIÓN
NOMBRE______________________________________________________________________
Clase Calificaciones en límites Calificaciones en intervalos Marcas de clase Frecuencia absoluta Frecuencia relativa Frecuencia acumulada absoluta Frecuencia acumulada relativa
xi fi fi* Fi Fi*
1 2 - 3 1.5 - 3.5 2.5 4 0.133 4 0.133
2 4 - 5 3.5 - 5.5 4.5 9 0.3 13 0.433
3 6 - 7 5.5 - 7.5 6.5 8 0.267 21 0.7
4 8 - 9 7.5 - 9.5 8.5 6 0.2 27 0.9
5 10 - 11 9.5 - 11.5 10.5 3 0.1 30 1
30
Con base en los datos de la tabla anterior contesta las siguientes preguntas:
b) ¿Cuál es el rango o recorrido de los datos agrupados? ¿Cuál es el ancho de los límites?
c) ¿Cuál es el promedio de calificaciones del grupo?
d) ¿Entre qué valores se encontrarán la mayoría de las calificaciones de este grupo (desviación
estándar)?
e) ¿Qué tipo de simetría tiene este modelo? ¿Qué tipo de curtosis tiene este modelo?
24 Puntos
Resolución
a) La Distribución de frecuencias queda como:
Clase Calificaciones en límites Calificaciones en intervalos Marcas de clase Frecuencia absoluta Frecuencia relativa Frecuencia acumulada absoluta Frecuencia acumulada relativa
xi fi fi* Fi Fi*
1 2 - 3 1.5 - 3.5 2.5 4 0.133 4 0.133
2 4 - 5 3.5 - 5.5 4.5 9 0.3 13 0.433
3 6 - 7 5.5 - 7.5 6.5 8 0.267 21 0.7
4 8 - 9 7.5 - 9.5 8.5 6 0.2 27 0.9
5 10 - 11 9.5 - 11.5 10.5 3 0.1 30 1
30
PyE_ EF2_TIPO1_2010-1 1
c=2
c) El promedio de las calificaciones, utilizando los datos agrupados, se define por:
∑ ∑
m m
1
x= xi f i = xi fi *
n
i =1 i =1
sustituyendo:
∑
5
1 1 185
x= xi f i = ⎡⎣( 2.5 )( 4 ) + ( 4.5 )( 9 ) + ( 6.5 )( 8 ) + ( 8.5 )( 6 ) + (10.5 )( 3) ⎤⎦ = = 6.2
30 30 30
i =1
d) La desviación estándar de las calificaciones para la muestra, está definida por la raíz de la
variancia, entonces:
1 m
sn2−1 = ∑ ( xi − x ) fi
2
n − 1 i =1
sustituyendo:
2
s n −1 =
1
⎡( 2.5 − 185 / 30 )2 ( 4 ) + ( 4.5 − 185 / 30 )2 ( 9 ) + ( 6.5 − 185 / 30 )2 ( 8) + ( 8.5 − 185 / 30 )2 ( 6 ) + (10.5 − 185 / 30 )2 ( 3)⎤
29 ⎣ ⎦
2
s n −1 ≈ 5.8
obteniendo la raíz:
1 m
sn −1 = ∑ ( xi − x ) fi
2
n − 1 i =1
sutituyendo:
sn −1 = 5.8
sn −1 = 2.4
e) La simetría se define como el tercer momento con respecto de la media entre la desviación
estándar al cubo, entonces:
1 m m
∑ ( xi − x ) fi ∑ ( xi − x ) fi*
3 3
n
a3 = i =1 = i =1
( n−1 ) ( Sn−1 )
3 3
S
sustituyendo:
1 ⎡
( 2.5 − 185 / 30 ) ( 4 ) + ( 4.5 − 185 / 30 ) ( 9 ) + ( 6.5 − 185 / 30 ) ( 8 ) + ( 8.5 − 185 / 30 ) ( 6 ) + (10.5 − 185 / 30 ) ( 3)⎤
3 3 3 3 3
⎣ ⎦
a3 = 30
( 2.4 )
3
realizando operaciones:
a3 ≈ 0.194
0 < 0.194
por lo tanto, es una muestra de calificaciones con ligero sesgo positivo.
La curtosis se define como el cuarto momento con respecto de la media entre la desviación
estándar elevado a la cuarta, entonces:
1 m m
∑ ( − ) ∑ ( xi − x ) fi*
4 4
xi x f i
n
a4 = i =1 = i =1
( Sn−1 ) ( Sn−1 )
4 4
sustituyendo:
PyE_ EF2_TIPO1_2010-1 2
1 ⎡
( 2.5 − 185 / 30 ) ( 4 ) + ( 4.5 − 185 / 30 ) ( 9 ) + ( 6.5 − 185 / 30 ) ( 8 ) + ( 8.5 − 185 / 30 ) ( 6 ) + (10.5 − 185 / 30 ) ( 3)⎤
4 4 4 4 4
⎣ ⎦
a4 = 30
( 2.4 )
4
realizando operaciones:
a4 ≈ 1.463
1.463 < 3
por lo tanto es una muestra con aplanamiento del tipo platicúrtica.
( )
P ( A ∩ B ) = P A ∪ B = 1− P ( A ∪ B) = 1−
11 9
=
20 20
= 0.45
3. Para construir tres subestaciones, una empresa eléctrica cuenta con dos compañías constructoras, la
probabilidad de que una de estas compañías realice la construcción de cualquiera de las tres
subestaciones es de 0.6. Si X es la variable aleatoria que representa el número de subestaciones que
puede construir una compañía:
a) Construir la función de probabilidad de la variable aleatoria X .
b) Calcular la probabilidad de que una compañía construya dos de las tres obras.
c) Obtener la desviación estándar de la variable aleatoria X .
18 Puntos
Resolución
a) Sea C el evento que representa la compañía construye una subestación.
P ( C ) = 0.6
Sea X la variable aleatoria que representa el número de subestaciones que puede construir la
compañía.
X ∼ Binomial ( n = 3, p = 0.6 )
por lo que la función de probabilidad en forma analítica, es:
⎧⎛ 3 ⎞
( 0.6 ) (1 − 0.6 )
3− x
x = 0,1, 2,3
x
⎪
f X ( x ) = ⎨⎜⎝ x ⎟⎠
;
⎪
⎩ 0 ; en otro caso
PyE_ EF2_TIPO1_2010-1 3
x 0 1 2 3
fX ( x) 0.064 0.288 0.432 0.216
⎣ ⎦
La media es E ( X ) = μ X = ∑ xf X ( x )
∀x
calculado:
E ( X ) = (1)( 0.288 ) + ( 2 )( 0.432 ) + ( 3)( 0.216 ) = 1.8
El segundo momento con respecto al origen está definido por:
E ( X 2 ) = ∑ x2 f X ( x )
∀x
calculando:
E ( X 2 ) = (12 ) ( 0.288 ) + ( 22 ) ( 0.432 ) + ( 32 ) ( 0.216 ) = 3.96
sustituyendo en la variancia y realizando operaciones:
Var ( X ) = E ( X 2 ) − ⎡⎣ E ( X ) ⎤⎦ = 3.96 − (1.8 ) = 0.72
2 2
4. La siguiente tabla muestra la relación que se presenta entre la pureza del oxígeno producido en un
proceso de destilación química, contra el porcentaje de hidrocarburos que están presentes en el
condensador principal de la unidad de destilación.
Nivel de hidrocarburos x (%) 0.99 1.02 1.05 1.29 1.46 1.36 0.87 1.23 1.55 1.4
Pureza y (%) 90.01 89.05 91.43 93.74 96.73 94.45 87.59 91.77 99.42 93.65
x (%) 1.19 1.15 0.98 1.01 1.11 1.2 1.26 1.32 1.43 0.95
y (%) 93.54 92.52 90.56 89.54 89.85 90.39 93.25 93.41 94.98 87.33
a) Ajustar un modelo de regresión lineal simple.
b) ¿Puede considerarse válido el modelo? Justificar su respuesta.
Se sabe que:
Sumas:
x y x2 y2 xy
23.82 1843.21 29.0692 170044.5321 2205.5136
10 Puntos
Resolución
a) El modelo es:
ŷ = βˆ0 + βˆ1 x
PyE_ EF2_TIPO1_2010-1 4
20 20
20 ∑ xi ∑ yi ( 23.82 )(1843.21)
∑x y − i i
i =1
20
i =1
2205.5136 −
20
βˆ1 = i =1
= ≈ 14.6523
( 23.82 )
2 2
⎛ ⎞ 20
⎜ ∑ xi ⎟ 29.0692 −
xi2 − ⎝ i =1 ⎠
20
20
∑
i =1 20
y
βˆ0 = y − βˆ1 x
1843.21 ⎛ 23.82 ⎞
βˆ0 = − (14.6523) ⎜ ⎟ ≈ 74.7096
20 ⎝ 20 ⎠
El modelo queda:
yˆ = 74.7096 + 14.6523x
b) Para determinar si el modelo es válido debe obtenerse el coeficiente de determinación.
El coeficiente de correlación, está definido por:
SS xy
r=
SS xx SS yy
2
⎛ ⎞
∑
20
⎜ xi ⎟
⎜ ⎟
∑ ⎠ = 29.0692 − ( 23.82 ) ≈ 0.6996
20 2
SS xx = x2 − ⎝
i
i =1
20 20
i =1
2
⎛ ⎞
∑
20
⎜ yi ⎟
⎜ ⎟
∑ ⎠ = 170044.5321 − (1843.21) ≈ 173.3769
20 2
SS yy = y2 − ⎝
i
i =1
20 20
i =1
∑∑
20 20
xi yi
SS xy = xi yi − i =1 i =1
= 2205.5136 −
20 20
i =1
sustituyendo:
SS xy 10.2505
r= = ≈ 0.9307
SS xx SS yy ( 0.6996 )(173.3769 )
Entonces el coeficiente de determinación será:
(10.2505)
2
SS xy2
r =R =
2 2
= ≈ 0.8663
SS xx SS yy ( 0.6996 )(173.3769 )
El ajuste es regular y puede considerarse válido el modelo dependiendo del error que se esté
dispuesto a cometer.
PyE_ EF2_TIPO1_2010-1 5
5. La presión de aire de un neumático seleccionado al azar, instalado en un automóvil nuevo, está
⎡ lb ⎤ ⎡ lb ⎤
distribuido normalmente con valor medio de 31 ⎢ 2⎥
y desviación estándar de 0.2 ⎢ 2⎥
.
⎣ pu lg ⎦ ⎣ pu lg ⎦
a) Calcular la probabilidad de que la presión de un neumático, seleccionado al azar, exceda de
⎡ lb ⎤
30.5 ⎢ 2⎥
.
⎣ pu lg ⎦
b) Determinar la probabilidad de que la presión de un neumático, seleccionado al azar, se encuentre
⎡ lb ⎤
entre 30.5 y 31.5 ⎢ 2⎥
.
⎣ pu lg ⎦
⎡ lb ⎤
c) Supóngase que un neumático se considera con presión baja si está debajo de 30.4 ⎢ 2⎥
, ¿cuál
⎣ pu lg ⎦
es la probabilidad de que al menos uno de los cuatro neumáticos de un automóvil se encuentre
bajo?
12 Puntos
Resolución
Sea X la variable aleatoria que representa la presión del aire de un neumático instalado en un
automóvil nuevo.
a) Del enunciado:
(
X ∼ N 31, ( 0.2 )
2
)
se pide calcular, P ( X > 30.5) :
estandarizando:
⎛ 30.5 − 31 ⎞
P ( X > 30.5) = P ⎜ Z > ⎟ = P ( Z > −2.5 )
⎝ 0.2 ⎠
Usando la tabla de la función de distribución acumulativa normal estándar:
P ( X > 30.5) = 1 − Fz ( −2.5 ) = 1 − 0.0062 = 0.9938
⎝0⎠
PyE_ EF2_TIPO1_2010-1 6
P (Y ≥ 1) = 1 − ( 0.9948 ) = 0.0052
4
6. Supóngase que en cierto tipo de lavadora, tanto el espesor como el diámetro de la cavidad son
diferentes en cada unidad. Sea X la variable aleatoria que representa el espesor, en milímetros, y Y la
variable aleatoria que representa el diámetro de la cavidad, en milímetros, de una lavadora
seleccionada al azar. Supóngase que la función de densidad conjunta de las variables aleatorias X y
Y está dada por:
⎧ 1≤ x ≤ 2
⎪k ( x + y ) ;
f XY ( x, y ) = ⎨ 4≤ y≤5
⎪ 0
⎩ ; en otro caso
a) Calcular el valor de k que hace una función de densidad.
b) Determinar la probabilidad de que una lavadora seleccionada aleatoriamente tenga un espesor
entre 1.0 y 1.5 [mm] y una cavidad con un diámetro entre 4.5 y 5 [mm].
c) Obtener la función de densidad si se sabe que el espesor es de 1.5 [mm].
d) Cuál es el diámetro esperado, si el espesor es de 1.5 [mm].
16 Puntos
Resolución
a) De las propiedades de una función de densidad, se tiene:
∞ ∞
∫ ∫
−∞ −∞
f XY ( x, y ) dxdy = 1
sustituyendo:
∫∫ ∫∫
5 2 5 2
k ( x + y ) dxdy = k ( x + y ) dxdy = 1
4 1 4 1
integrando con respecto de x:
2
⎛ x2 ⎞ ⎛4 ⎞ ⎛ 3⎞
∫ ∫ ∫
5 5 5
1
k ⎜ + xy ⎟ dy = k ⎜ + 2 y − − y ⎟ dy = k ⎜ y + ⎟ dy = 1
4 ⎝ 2 ⎠ 1
4 ⎝2 2 ⎠ 4 ⎝ 2⎠
integrando con respecto de y:
5
⎛ 3⎞ ⎛ y2 3 ⎞ ⎛ 25 15 16 12 ⎞ ⎛ 12 ⎞
∫
5
k ⎜ y + ⎟ dy = k ⎜ + y ⎟ = k ⎜ + − − ⎟ = k ⎜ ⎟ = 6k = 1
4 ⎝ 2⎠ ⎝ 2 2 ⎠ ⎝ 2 2 2 2⎠ ⎝ 2⎠
4
por lo tanto:
1
k=
6
sustituyendo:
⎧1 1≤ x ≤ 2
⎪ ( x + y) ;
f XY ( x, y ) = ⎨ 6 4≤ y≤5
⎪
⎩ 0 ; en otro caso
b) Se pide calcular P (1 ≤ X ≤ 1.5, 4.5 ≤ Y ≤ 5 ) , como la región de la función de densidad es
cuadrada, entonces:
∫ ∫ ∫ ∫
5 1.5 5 1.5
1 1 1
P (1 ≤ X ≤ 1.5, 4.5 ≤ Y ≤ 5 ) = ( x + y ) dxdy = ( x + y ) dxdy = = 0.25
4.5 1 6 6 4.5 1 4
PyE_ EF2_TIPO1_2010-1 7
5
⎛1 5⎞ 1 ⎛ y2 5 ⎞ 1 ⎛ 25 25 81 45 ⎞ 1 ⎛ 24 ⎞ 24 1
∫
5
1
⎜ y + ⎟ dy = ⎜ + y⎟ = ⎜ + − − ⎟= ⎜ ⎟= =
6 4.5 ⎝ 2 8⎠ 6⎝ 4 8 ⎠ 6 ⎝ 4 8 16 16 ⎠ 6 ⎝ 16 ⎠ 96 4
4.5
3
c) Se pide determinar la función de densidad, dado que el espesor es de , entonces:
2
⎧ ⎛3 ⎞
⎪ f XY ⎜ 2 , y ⎟
⎝ ⎠ ;
⎛ 3⎞ ⎪ 4≤ y≤5
f 3 ⎜Y X = ⎟ = ⎨ ⎛ 3⎞
Y X= ⎝ 2 ⎠ ⎪ fX ⎜ X = ⎟
2
⎝ 2⎠
⎪
⎩ 0 ; en otro caso
1⎡ 9⎤
fX ( x) = ⎢ x+ ⎥
6⎣ 2⎦
por lo tanto queda definida por:
⎧1 ⎛ 9⎞
⎪ ⎜x+ ⎟ ; 1≤ x ≤ 2
fX ( x) = ⎨6 ⎝ 2⎠
⎪
⎩ 0 ; en otro caso
Ahora, sustituyendo en la función de densidad condicional, se tiene:
⎧1⎛3 ⎞
⎪ 6⎜ 2 + y⎟
⎝ ⎠ ;
⎛ 3⎞ ⎪ 4≤ y≤5
fY X = x0 ⎜ Y X = ⎟ = ⎨ 1 ⎛ 3 9 ⎞
⎝ 2⎠ ⎪ ⎜ + ⎟
6⎝2 2⎠
⎪
⎩ 0 ; en otro caso
desarrollando y simplificando:
⎧3 + 2 y
⎛ 3⎞ ⎪ ; 4≤ y≤5
f 3 ⎜ Y X = ⎟ = ⎨ 12
Y X= ⎝ 2⎠ ⎪
⎩ 0
2 ; en otro caso
d) El diámetro esperado, si el espesor es de 1.5 [mm], es el valor esperado de la función de
densidad condicional, entonces:
∞
⎛ 3⎞ ⎛ 3⎞
E ⎜Y X = ⎟ =
⎝ 2⎠ ∫ −∞
yf
Y X=
3
2
⎜ Y X = ⎟ dy
⎝ 2⎠
sustituyendo:
5
⎛ 3⎞ ⎛ 3+ 2y ⎞ 1 ⎛3 2 ⎞
∫ ∫ (3 y + 2 y )
5 5
1
E ⎜Y X = ⎟ = y ⎜ ⎟ dy =
2
dy = ⎜ y 2 + y 3 ⎟ =
⎝ 2⎠ 4 ⎝ 12 ⎠ 12 4 12 ⎝ 2 3 ⎠ 4
PyE_ EF2_TIPO1_2010-1 8
7. Se extrae una muestra aleatoria de tamaño 10 de una distribución normal con media 4. La estadística t
X − μX x −4
de Student T = , donde t = es calculada. ¿Cuál es la probabilidad de que
S n −1 s
n 10
P (T > 1.833) ?
8 Puntos
Resolución
Esta estadística t tiene 10 -1 = 9 grados de libertad. De la tabla t de Student, P ( T > 1.833 ) = 0.05
PyE_ EF2_TIPO1_2010-1 9
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO
FACULTAD DE INGENIERÍA
DIVISIÓN DE CIENCIAS BÁSICAS
COORDINACIÓN DE CIENCIAS APLICADAS
DEPARTAMENTO DE PROBABILIDAD Y ESTADÍSTICA
PRIMER EXAMEN FINAL
RESOLUCIÓN
SEMESTRE 2010-2 TIPO 1
DURACIÓN MÁX. 2.5 HORAS MIÉRCOLES 2 DE JUNIO DE 2010
NOMBRE______________________________________________________________________________
∑
n
1
x= xi
n
i =1
para los nuevos datos, incrementando 5 unidades cada calificación
x1 + c, x2 + c,..., xn + c
sustituyendo
∑ ∑(
n n
1 1
x= ( x1 + c + x2 + c+, ..., + xn + c ) = xi + c )
n n
i =1 i =1
por propiedades
∑ ∑ ∑
n n n
1 1 nc
x= xi + c= xi + = x +c
n n n
i =1 i =1 i =1
entonces la media sumando 5 unidades a cada calificación es
x = 75 + 5 = 80
∑(
n
1
S = xi − x )
2 2
n
n
i =1
para los nuevos datos, incrementando 5 unidades a cada calificación
x1 + c, x2 + c,..., xn + c y con media x + c , sustituyendo
∑( ∑(
n n
1 1
S = xi + c − x − c ) = xi − x )
2 2 2
n
n n
i =1 i =1
2. Una oficina tiene cuatro secretarias que manejan respectivamente 20, 60, 15 y 5 % del archivo de
reportes. La probabilidad de que “archiven mal” tales reportes es 0.05, 0.10, 0.10 y 0.05,
respectivamente.
a) ¿Cuál es la probabilidad de tener un reporte mal archivado?
b) ¿Cuál es la probabilidad de que un reporte mal archivado haya sido causa de la secretaria uno?
15 Puntos
Resolución
PyE_ EF1_TIPO1_2010-2 1
Sean
I el evento que representa la secretaria uno maneja el archivo de reportes.
II el evento que representa la secretaria dos maneja el archivo de reportes.
III el evento que representa la secretaria tres maneja el archivo de reportes.
IV el evento que representa la secretaria cuatro maneja el archivo de reportes.
M el evento que representa archivan mal los reportes.
Del enunciado
P ( I ) = 0.2 P ( M I ) = 0.05
P ( II ) = 0.6 P ( M II ) = 0.10
P ( III ) = 0.15 P ( M III ) = 0.10
P ( IV ) = 0.05 P ( M IV ) = 0.05
P ( M ) = P ( I ) P ( M I ) + P ( II ) P ( M II ) + P ( III ) P ( M III ) + P ( IV ) P ( M IV )
sustituyendo
P(I M ) =
( 0.2 )( 0.05) = 0.01 ≈ 0.1143
( 0.0875) 0.0875
3. En los alrededores de CU, en los últimos años, las autoridades de la Delegación Coyoacán han
proporcionado licencias de uso de suelo a comerciantes, con el argumento de que el giro es alimentos.
Dadas las condiciones por la falta de supervisores en la zona de Coyoacán. La Delegación
recientemente tiene denuncias de los vecinos en donde manifiestan que los giros no son los de origen,
por ello piden a la Delegación una supervisión a dichos negocios. Los responsables se dieron a la tarea
de hacer un análisis y encontraron que los supervisores visitan al año los comercios, con la siguiente
función de probabilidad, siendo X la variable aleatoria que representa el número de visitas a los
establecimientos con el giro de alimentos.
x 0 1 2 3 4
fX ( x) 0.4 0.4 0.1 0.05 0.05
a) Obtener la probabilidad de que un negocio de ese giro y ubicado en esa zona, sea visitado por un
supervisor al menos dos veces en un año.
b) Con la función de probabilidad acumulada, obtener la probabilidad de que uno de estos
negocios, sea visitando entre dos y cinco veces, inclusive.
c) Obtener las medidas de tendencia central. Usted como estudiante de la FI y asesor de un
despacho de consultoría, ¿cuál sería su sugerencia al ser abordado por un posible inversionista en
este tipo de giros y bajo las condiciones iniciales establecida?
20 Puntos
PyE_ EF1_TIPO1_2010-2 2
Resolución
a) La probabilidad a calcular es
P ( X ≥ 2 ) = P ( X = 2 ) + P ( X = 3) + P ( X = 4 )
sustituyendo
P ( X ≥ 2 ) = 0.1 + 0.05 + 0.05 = 0.2
b) La función de distribución acumulativa está dada por
∑ f (i )
x
FX ( x ) = P ( X ≤ x ) = X
i =−∞
por lo que
x 0 1 2 3 4
FX ( x ) 0.4 0.8 0.9 0.95 1
E ( X ) = μ = μX =
∑
∀x
x fX ( x)
4. En un quiosco de periódicos se supone que las ventas diarias se distribuyen normalmente con media de
30 y variancia dos.
a) Determinar la probabilidad de que las ventas en un día sean entre 13 y 31
b) Calcular la máxima cantidad de ventas en un día para que sea del 90%
c) Supóngase que en una ciudad hay 10 quioscos independientes del mismo tipo y con las mismas
características. Determinar la probabilidad de que más de dos quioscos vendan en un día entre 13
y 31
20 Puntos
Resolución
Sea X la variable aleatoria que representa las ventas diarias de un quiosco de periódicos.
X ~ Normal ( μ = 30, σ 2 = 2 )
PyE_ EF1_TIPO1_2010-2 3
a) La probabilidad de que las ventas en un día sean entre 13 y 31, está dado por
⎛ 13 − 30 31 − 30 ⎞
P (13 ≤ X ≤ 31) ≈ P ⎜ ≤Z≤ ⎟ = P ( −12.02 ≤ Z ≤ 0.71) = Fz ( 0.71) − Fz ( −12.02 )
⎝ 2 2 ⎠
sustituyendo valores de la tabla de distribución acumulativa normal estándar
P (13 ≤ X ≤ 31) = Fz ( 0.71) − Fz ( −12.02 ) = 0.7611 − 0 ≈ 0.7611
b) La máxima cantidad de ventas en un día, para que sea de 90%, está dada por
P ( X ≤ x ) = 0.9
aproximando mediante la distribución normal estándar
⎛ X − μ x − 30 ⎞ ⎛ x − 30 ⎞
P⎜ ≤ ⎟ = P⎜Z ≤ ⎟ = 0.9
⎝ σ 2 ⎠ ⎝ 2 ⎠
sustituyendo los valores de la tabla de distribución acumulativa normal estándar, para el valor
correspondiente
x − 30
= 1.29
2
despejando la variable x
x = 1.29 2 + 30 = 31.824
los cuales son 32 ventas al día como máximo.
a) Sea Y la variable aleatoria que representa el número de quioscos que venden periódicos en la
ciudad con las características dadas
Y ~ Binomial ( n = 10, p = 0.7611)
la probabilidad a calcular es
∑ f ( y)
2
P (Y > 2 ) = 1 − ⎡⎣ P (Y = 0 ) + P (Y = 1) + P (Y = 2 ) ⎤⎦ = 1 − Y
y =0
sustituyendo en el modelo probabilístico
∑
2
⎛ 10 ⎞
P (Y > 2 ) = 1 − ⎜ ⎟ ( 0.7611) ( 0.2389 )
y 10 − y
y =0
⎝ y⎠
P (Y > 2 ) = 1 − 0.000296 ≈ 0.9997
a) La función de densidad conjunta para dos variables aleatorias, está dada definida por
f XY ( x, y ) = g X ( x ) hY ( y )
sustituyendo
PyE_ EF1_TIPO1_2010-2 4
⎧16 y
⎪ ; x>2 , 0 < y <1
f XY ( x, y ) = ⎨ x3
⎪ 0
⎩ ; en otro caso
b) El valor esperado, por independencia de variables aleatorias y propiedades es
E ( Z ) = E ( XY ) = E ( X ) E (Y )
Calculando los valores esperados con las funciones de densidad marginales
∞ ∞ R
∫ ∫ ∫
⎡ x −2+1 ⎤
R
8 1
E(X ) = ( x ) dx = 8 dx = 8 lim −2
x dx = 8 lim ⎢ ⎥
x3 x2 R →∞ R →∞ −2 + 1
2 2 2 ⎣ ⎦2
R
⎡1⎤ ⎡ 1 1⎤ ⎛ 1⎞
E ( X ) = − 8 lim ⎢ ⎥ = −8 lim ⎢ − ⎥ = −8 ⎜ − ⎟ = 4
⎣ ⎦2
R →∞ x
⎣
R →∞ R 2⎦ ⎝ 2⎠
El otro valor esperado es
∫ ∫
1 1
2 2 2
E (Y ) = 2 y ( y ) dy = 2 y 2 dy = ⎡⎣ y 3 ⎤⎦ = [1 − 0] =
1
0 0 3 0 3 3
por lo tanto
⎛2⎞ 8
E ( Z ) = E ( X ) E (Y ) = ( 4 ) ⎜ ⎟ = ≈ 2.6667
⎝3⎠ 3
6. El peso neto por lote en una marca de sopa tiene distribución normal con media de 565 [gr] y
desviación estándar de 15 [gr]. Si se eligen al azar nueve lotes y se anota el peso, ¿cuál es la
probabilidad de que la media muestral esté entre 555 y 575 [gr]?
15 Puntos
Resolución
Sea X i la variable aleatoria que representa el peso neto por lote. i = 1, 2,...,9
(
X i ~ Normal μ X i = 565, σ X2 i = (15 )
2
)
entonces
⎛ σ X2 (15 )2 ⎞
X ~ Normal ⎜ μ X = μ X i = 565, σ X2 = i = ⎟
⎜ n 9 ⎟
⎝ ⎠
La probabilidad de que la media muestral esté entre dos valores, si se conoce σ X2 i , por el Teorema del
Límite Central, es
⎛ ⎞
⎜ 555 − 565 X − μ − ⎟
P ( 555 ≤ X ≤ 575 ) = P ( 555 < X < 575 ) ≈ P ⎜
575 565
≤ X
≤ ⎟=
⎜ 15 σX 15 ⎟
⎜ ⎟
⎝ 9 n 9 ⎠
= P ( −2 ≤ Z ≤ 2 ) = FZ ( 2 ) − FZ ( −2 )
con valores de la tabla de distribución acumulativa normal estándar
P ( 555 ≤ X ≤ 575 ) = FZ ( 2 ) − FZ ( −2 ) = 0.9772 − 0.0228 ≈ 0.9544
Es muy probable que el peso medio de los lotes esté entre los valores de peso especificado.
PyE_ EF1_TIPO1_2010-2 5
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO
FACULTAD DE INGENIERÍA
DIVISIÓN DE CIENCIAS BÁSICAS
COORDINACIÓN DE CIENCIAS APLICADAS
DEPARTAMENTO DE PROBABILIDAD Y ESTADÍSTICA
SEGUNDO EXAMEN FINAL
RESOLUCIÓN
SEMESTRE 2010-2 TIPO 1
DURACIÓN MÁX. 2.5 HORAS MIÉRCOLES 9 DE JUNIO DE 2010
NOMBRE______________________________________________________________________________
1. De todas las fallas de un tipo especifico de unidad de disco duro de computadora, se determina que
20% de éstos tiene dañado sólo el sector que contiene la tabla de asignación de archivos, 70% sólo los
sectores no esenciales están dañados y 10% tanto el sector de asignación como uno o más sectores no
esenciales están dañados. Se selecciona aleatoriamente una unidad de disco dañada y se examina.
a) ¿Cuál es la probabilidad de que el sector de asignación esté dañado?
b) ¿Cuál es la probabilidad de que un sector no esencial esté dañado?
c) Si se encuentra que la unidad de disco tiene un sector de asignación dañado, ¿cuál es la
probabilidad de que algunos sectores no esenciales también estén dañados?
15 Puntos
Resolución
Sean los eventos
A el cual representa daño en el sector que contiene la tabla de asignación.
B el cual representa daño en los sectores no esenciales.
Del enunciado
P ( A ∩ B ) = 0.2 , P ( B ∩ A ) = 0.7 , P ( A ∩ B ) = 0.1
a) P ( A ) = P ( A ∩ B ) + P ( A ∩ B ) = 0.2 + 0.1 = 0.3
b) P ( B ) = P ( B ∩ A ) + P ( A ∩ B ) = 0.7 + 0.1 = 0.8
P ( A ∩ B)
P ( B A) =
0.1 1
c) = =
P ( A) 0.3 3
2. Sea X los gastos médicos totales (en miles de dólares) incurridos por un individuo particular durante
un año dado. Aunque X es una variable aleatoria discreta, supóngase que su distribución es bastante
bien aproximada por una distribución continua con función de densidad f X ( x ) = ke−2 x con x > 0
a) Determinar el valor de k que hace una función de densidad válida.
b) ¿Cuáles son el valor esperado y la desviación estándar de los gastos médicos totales?
c) Un individuo está cubierto por un plan de seguro que le impone una provisión deducible de $500
(así que los primeros $500 de gastos son pagados por el individuo). Luego el plan pagará 80% de
cualquier gasto adicional que exceda de $500 y el pago máximo por parte del individuo (incluida
la cantidad deducible) es de $2500. Sea Y la cantidad de gastos médicos de este individuo
pagados por la compañía de seguros. ¿Cuál es el valor esperado de Y ?
Nota: X = V + Y donde V es la variable aleatoria que representa la cantidad de gastos pagados
por el individuo.
20 Puntos
Resolución
+∞
a) De la propiedad
+∞
∫ −∞
f X ( x ) dx = 1 , se tiene
∫ 0
ke −2 x dx = 1
PyE_ EF2_TIPO1_2010-2 1
∫
R
k R k k
1 = k lim e −2 x dx = lim ⎡⎣ e−2 x ⎤⎦ = lim ⎡⎣e −2 R − e0 ⎤⎦ = ⇒ k=2
R →+∞
0 −2 R →+∞ 0 −2 R →+∞ 2
De otra forma, se observa que es una distribución exponencial, por lo tanto k = 2 con función
de densidad
⎧2e −2 x ; x>0
fX ( x) = ⎨
⎩ 0 ; en otro caso
b) El valor esperado y la desviación estándar de los gastos médicos totales, está dado por
+∞
E(X ) =
∫ −∞
x f X ( x ) dx
sustituyendo
+∞
∫ ∫
R R
⎛ 1 ⎞
E(X ) = x ( 2e ) dx = 2 lim −2 x
xe dx = 2 lim ⎜ − (1 + 2 x ) e −2 x ⎟
−2 x
0
R →+∞
0
R →+∞
⎝ 4 ⎠0
1 1 1
E ( X ) = − lim ⎡⎣(1 + 2 R ) e −2 R − 1⎤⎦ = − lim ⎡⎣(1 + 2 R ) e −2 R − 1⎤⎦ =
2 R →+∞ 2 R →+∞ 2
La variancia está definida por el segundo momento con respecto a la media, entonces
+∞
Var ( X ) =
∫ (x − μ) f X ( x ) dx
2
−∞
sustituyendo
+∞
∫ ∫
2 R 2 R
⎛ 1⎞ ⎛ 1 ⎞ −2 x ⎛ 1 −2 x ⎞
Var ( X ) = ⎜ − (1 + 4 x ) e ⎟
−2 x
⎜ x − ⎟ 2e dx = 2 Rlim ⎜ x − ⎟ e dx = 2 Rlim
2
0 ⎝ 2⎠ →+∞
0 ⎝ 2⎠ →+∞
⎝ 8 ⎠0
Var ( X ) = −
1
(
lim (1 + 4 x 2 ) e −2 x ) 1
lim ⎡⎣(1 + 4 R 2 ) e −2 R − e0 ⎤⎦ =
1
R
=−
4 →+∞
R 0 4 R →+∞ 4
E (Y ) =
∫ 0
y ( x ) f X ( x ) dx
PyE_ EF2_TIPO1_2010-2 2
+∞
∫ ∫
10.5
∫ ∫
10.5
E (Y ) = −0.8 ⎡⎣ xe −2 x ⎤⎦ − lim ⎡⎣( x − 2 ) e−2 x ⎤⎦ = −0.8 ⎡⎣(10.5 ) e −2(10.5) − ( 0.5 ) e −2( 0.5) ⎤⎦ −
10.5 R
E (Y ) = 0.14715
Por lo que la compañía aseguradora paga $147.15 dólares por asegurado.
b) La probabilidad de que la octava persona sea la tercera en obtener el permiso con a lo más 20 [h]
de práctica.
Sea U la variable aleatoria que representa la octava persona es la tercera en obtener el permiso
para conducir con máximo 20 [h] de practica.
U ∼ Pascal ( r = 3, p = 0.0918 )
⎛ U − 1 ⎞ 3 u −3 ⎛ 7 ⎞
P (U = 8 ) = ⎜ ⎟ p q = ⎜ ⎟ ( 0.0918 ) ( 0.9082 ) ≈ 0.0100
3 5
⎝ r −1 ⎠ ⎝ 2⎠
c) La probabilidad de que la quinta persona sea la primera en obtener el permiso con a lo más 20 [h]
de práctica.
Sea Y la variable aleatoria que representa la quinta persona sea la primera en obtener el permiso
para conducir con máximo 20 [h] de practica.
Y ∼ Geométrica ( p = 0.0918 )
P (Y = 5 ) = q 4 p = ( 0.9082 ) ( 0.0918 ) ≈ 0.0625
4
4. Una caja contiene cuatro baterías defectuosas, tres baterías en estado regular y dos baterías aceptables.
Se seleccionan dos baterías al azar.
a) Calcular la probabilidad de seleccionar una batería defectuosa y una aceptable.
PyE_ EF2_TIPO1_2010-2 3
b) Determinar la distribución marginal g X ( x ) , correspondiente al número de baterías defectuosas.
15 Puntos
Resolución
x 0 1 2
gX ( x) 10 20 6
36 36 36
5. Si la distribución del peso de los ingenieros que viajan del Distrito Federal a Chetumal, Quintana Roo,
tiene una media de 74 [kg] y una desviación estándar de 8.5 [kg]. ¿Cuál es la probabilidad de que el
peso total combinado de 36 de estos viajeros sea menor que 2722 [kg]?
PyE_ EF2_TIPO1_2010-2 4
15 Puntos
Resolución
Sea Y la variable aleatoria que representa el peso [en kg] de los ingenieros que viajan del D.F. a
Chetumal, Quintana Roo.
Por el Teorema del Límite Central si n = 36 , se conoce la media y desviación estándar, se puede
aproximar por
(
Y ∼ Normal μY = 74 [ kg ] , σ Y2 = ( 8.5 )
2
⎡⎣ kg 2 ⎤⎦ )
entonces los parámetros del peso total combinado de los 36 ingenieros
T ∼ Normal ( μT = nμY , σ T2 = nσ Y2 )
sustituyendo
T ∼ Normal ( μT = 2664, σ T2 = 2601)
se determinará
⎛ T − μT 2722 − 2664 ⎞ ⎛ 58 ⎞
P (T ≤ 2722 ) = P (T < 2722 ) ≈ P ⎜ < ⎟ = P ⎜ Z < ⎟ = P ( Z < 1.14 ) = FZ (1.14 )
⎝ σT 2601 ⎠ ⎝ 51 ⎠
de tablas de la distribución acumulada normal estándar
P (T ≤ 2722 ) = P (T < 2722 ) ≈ 0.8729
6. Una gráfica que aparece en el artículo “Thermal conductivity of polyethilenc: The effects of cristal
size, density and orientation on the thermal conductivity” sugiere que el valor esperado de
10 4
conductividad térmica y es una función lineal de donde x es el grosor laminar [en ångström].
x
x 240 410 460 490 520 590 745 830
y 12 14 14 15 15 15 16 18
a) Trazar el diagrama de dispersión.
b) Estimar los parámetros de la función de regresión y su función de regresión.
c) Pronosticar el valor de conductividad térmica cuando el grosor laminar es de 500 [Å ]
15 Puntos
Resolución
a) El diagrama de dispersión es
Diagram a de dispersión
y = 0.0089x + 10.101
Conductividad térmica
20
R2 = 0.931
15
10
0
0 100 200 300 400 500 600 700 800 900
Grosor lam inar
ŷ = βˆ0 + βˆ1 x
PyE_ EF2_TIPO1_2010-2 5
8 8
8 ∑ xi ∑ yi ( 4285)(119 )
∑x y − i i
i =1 i =1
8
65920 −
8
βˆ1 = i =1
= ≈ 0.0089
( 4285 )
2 2
⎛ ⎞ 8
⎜ ∑ xi ⎟ 2539825 −
x 2 − ⎝ i =1 ⎠
8
8
∑i =1
i 8
βˆ0 = y − βˆ1 x
119 ⎛ 4285 ⎞
βˆ0 = − ( 0.0089 ) ⎜ ⎟ ≈ 10.1079
8 ⎝ 8 ⎠
El modelo está dado por
yˆ = 10.1079 + 0.0089 x
c) Para obtener la estimación del valor de conductividad térmica cuando el grosor laminar es de
500 [Å], es
yˆ = 10.1079 + 0.0089 ( 500 ) ≈ 14.5579
PyE_ EF2_TIPO1_2010-2 6
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO
FACULTAD DE INGENIERÍA
DIVISIÓN DE CIENCIAS BÁSICAS
COORDINACIÓN DE CIENCIAS APLICADAS
DEPARTAMENTO DE PROBABILIDAD Y ESTADÍSTICA
PRIMER EXAMEN FINAL
RESOLUCIONES
SEMESTRE 2011-1 TIPO 1
DURACIÓN MÁX. 2.5 HORAS DICIEMBRE 7, 2010
NOMBRE______________________________________________________________________________
Apellido Paterno Apellido Materno Nombre(s)
1. En un centro de maquinaria hay cuatro máquinas automáticas que producen tornillos. Un análisis de
los registros de inspección anteriores produce los siguientes datos:
Las máquinas 2 y 4 son más nuevas y se les ha asignado más producción que a las máquinas 1 y 3.
Supóngase que la combinación de inventarios refleja los porcentajes de producción indicados.
a) Si se elige un tornillo al azar del inventario, ¿cuál es la probabilidad de que esté defectuoso?
b) Si se elige un tornillo y se encuentra que está defectuoso, ¿cuál es la probabilidad de que se haya
producido en la máquina 3?
15 Puntos
Resolución
Sean:
D el evento que representa a los tornillos que se producen defectuosos.
M i el evento que representa la producción de tornillos en la máquina i . i = 1, 2, 3, 4
Del enunciado
P ( M 1 ) = 0.15 P ( D M 1 ) = 0.04
P ( M 2 ) = 0.30 P ( D M 2 ) = 0.03
P ( M 3 ) = 0.20 P ( D M 3 ) = 0.05
P ( M 4 ) = 0.35 P ( D M 4 ) = 0.02
P ( D ) = P ( M1 ) P ( D M1 ) + P ( M 2 ) P ( D M 2 ) + P ( M 3 ) P ( D M 3 ) + P ( M 4 ) P ( D M 4 )
sustituyendo:
PyE_ EF1_TIPO1_2011-1 1
b) La probabilidad de que un tornillo sea producido por la máquina 3, dado que es defectuoso, por
el Teorema de Bayes se tiene:
P ( D ∩ M3 ) P (M3 ) P ( D M3 ) ( 0.20 )( 0.05) = 0.3125
P (M3 D) = = =
P ( D) P ( D) ( 0.032 )
2. La función de distribución acumulativa de una variable aleatoria X está definida por:
⎧ 0 ; x<0
⎪ 3
⎪x + x
2
FX ( x ) = ⎨ ; 0 ≤ x ≤1
⎪ 2
⎪⎩ 1 ; x >1
∫
+∞
E(X ) = x f X ( x ) dx
−∞
∫ ∫
1 1
1
⎛3 ⎞ ⎛3 3 2⎞ ⎛ 3 4 x3 ⎞ 3 1 17
E(X ) = x ⎜ x 2 + x ⎟ dx = ⎜ 2 x + x ⎟ dx = ⎜ 8 x + 3 ⎟ = 8 + 3 = 24 ≈ 0.7083
⎝2 ⎠ ⎝ ⎠ ⎝ ⎠0
0 0
∫
+∞
Var ( X ) = ( X − μX ) f X ( x ) dx
2
−∞
sustituyendo:
∫ ∫
1 1
2
⎛ 17 ⎞ ⎛ 3 2 ⎞ ⎛ 3 4 9 3 85 2 289 ⎞
Var ( X ) = ⎜ x − 24 ⎟ ⎜ 2 x + x ⎟ dx = ⎜ 2 x − 8 x − 128 x + 576 x ⎟ dx
⎝ ⎠ ⎝ ⎠ ⎝ ⎠
0 0
1
⎡3 9 85 3 289 2 ⎤ 3 9 85 289 139
Var ( X ) = ⎢ x5 − x 4 − x + x ⎥ = − − + = ≈ 0.0483
⎣ 10 32 384 1152 ⎦0 10 32 384 1152 2880
b) Para determinar la probabilidad pedida:
⎛1 ⎞ ⎛1 ⎞
P ⎜ ≤ X ≤ 1⎟ = P ⎜ < X < 1⎟
⎝ 2 ⎠ ⎝ 2 ⎠
de la función de distribución acumulativa, se tiene:
1 ⎡⎛ 1 ⎞ ⎛ 1 ⎞ ⎤ 13
3 2
⎛1 ⎞ ⎛1 ⎞ ⎛1⎞
P ⎜ ≤ X ≤ 1⎟ = P ⎜ < X < 1⎟ = FX (1) − FX ⎜ ⎟ = 1 − ⎢⎜ ⎟ + ⎜ ⎟ ⎥ = = 0.8125
⎝2 ⎠ ⎝2 ⎠ ⎝2⎠ 2 ⎣⎢⎝ 2 ⎠ ⎝ 2 ⎠ ⎦⎥ 16
PyE_ EF1_TIPO1_2011-1 2
3. Un explorador de petróleo perforará una serie de pozos en cierta área para encontrar un pozo
productivo. La probabilidad de que tenga éxito en una prueba es 0.2
a) ¿Cuál es la probabilidad de que el primer pozo productivo sea el tercer pozo perforado?
b) ¿Cuál es la probabilidad de que el explorador no vaya a encontrar un pozo productivo si
solamente puede perforar 10 pozos?
c) ¿Cuál es la probabilidad de que el tercer encuentro de petróleo ocurra en el quinto pozo que se
perfora?
15 Puntos
Resolución
a) Sea X la variable aleatoria que representa el número de pozos perforados para encontrar el
primero que sea productivo.
X ∼ Geométrica ( p = 0.2 )
P ( X = 3) = q 2 p = ( 0.8 ) ( 0.2 ) = 0.128
2
⎝ ⎠u ⎝ ⎠
10
c) Sea Y la variable aleatoria que representa el número de perforaciones realizadas para encontrar
el tercer pozo productivo.
Y ∼ Pascal ( r = 3, p = 0.2 )
⎛ Y − 1⎞ 3 2 ⎛ 5 − 1⎞
P (Y = 5 ) = ⎜ ⎟q p = ⎜ ⎟ ( 0.2 ) ( 0.8 ) ≈ 0.0307
3 2
⎝ r −1 ⎠ ⎝ 3 − 1⎠
4. Una fábrica de focos para equipos de refrigeración afirma que éstos tienen una vida útil de 60 meses
con una desviación estándar de 6 meses. El supervisor de una empresa que compra este tipo de focos
para los refrigeradores que ensambla, prueba una muestra de 64 focos. Considerando que los datos
proporcionados por la fábrica son confiables, ¿cuál es la probabilidad de encontrar una muestra con
una vida útil promedio menor a 58 meses?
15 Puntos
Resolución
Sea X i la variable aleatoria que representa la vida útil de los focos para equipos de refrigeración.
i = 1, 2,..., 64
(
X i ~ Normal μ X i = 60, σ X2 i = ( 6 )
2
)
la muestra es de tamaño 64, por el Teorema de Límite Central, entonces la media muestral tiene:
⎛ σ X2 ( 6 )2 ⎞
X ~ Normal ⎜ μ X = μ X i = 60 , σ X2 = i = ⎟
⎜ n 64 ⎟
⎝ ⎠
La probabilidad de que la media muestral sea menor que 58 meses, es:
⎛ ⎞
⎜ X −μ − ⎟ ⎛ 8⎞
P ( X ≤ 58 ) ≈ P ( X < 58 ) ≈ P ⎜
58 60
X
≤ ⎟ = P ⎜ Z ≤ − ⎟ = P ( Z ≤ −2.67 ) ≈ 0.0038
⎜ σX 6 ⎟ ⎝ 3⎠
⎜ ⎟
⎝ n 64 ⎠
Es muy poco probable que la vida útil de los 64 focos de una muestra sea menor que 58 meses.
PyE_ EF1_TIPO1_2011-1 3
5. Supóngase que el tiempo de mantenimiento semanal de una máquina depende de dos variables
aleatorias continuas (en horas), donde X es la variable aleatoria que representa la duración del
mantenimiento mecánico y, Y es la variable aleatoria que representa la duración de mantenimiento
eléctrico. Supóngase que la función de densidad de probabilidad conjunta es:
⎧ 2
⎪ ( x + 2 y) ; 0 ≤ x ≤ 1 , 0 ≤ y ≤ 1
f XY ( x, y ) = ⎨ 3
⎪
⎩ 0 ; en otro caso
a) Calcular la probabilidad que en alguna semana, el mantenimiento mecánico dure menos de 15
minutos y el mantenimiento eléctrico dure más de 30 minutos.
b) Determinar la función de densidad marginal g X ( x )
c) Obtener la función de densidad condicional fY X = x (Y X = x0 ) 0
∫ ∫
⎛ 1 1⎞ 2
P ( X < 15 ∩ Y > 30 ) = P ⎜ X < ∩ Y > ⎟ = ( x + 2 y ) dx dy =
4
⎝ 4 2⎠ y=
1
x =0 3
2
1 y =1
y =1 y =1
x=
⎛ 1 ⎛ 1 ⎞2 ⎛1⎞ ⎞
∫ ∫
2 ⎛1 2 ⎞ 4 2 2 ⎛ y y2 ⎞
= ⎜ x + 2 xy ⎟ dy = ⎜⎜ ⎜ ⎟ + 2 ⎜ ⎟ y ⎟⎟ dy = ⎜ + ⎟ =
3 y= ⎝ 2 ⎠ x=0 3 y= ⎝ 2 ⎝ 4 ⎠ ⎝4⎠ ⎠ 3 ⎝ 32 4 ⎠ y = 1
1 1
2 2 2
2⎛ 1 ⎛ 1 ⎞ ⎞ 2 ⎛ 1 ⎛ 1 ⎞ ⎛ 1 ⎞⎛ 1 ⎞ ⎞ 13
2
= ⎜ (1) + ⎜ ⎟ ⎟ − ⎜ ⎜ ⎟ + ⎜ ⎟⎜ ⎟ ⎟⎟ = ≈ 0.135
3 ⎝ 32 ⎝ 4 ⎠ ⎠ 3 ⎜⎝ 32 ⎝ 2 ⎠ ⎝ 4 ⎠⎝ 2 ⎠ ⎠ 96
b) La función marginal se define como:
∞
gX ( x) =
∫ -∞
f XY ( x, y ) dy
al sustituir:
∫
y=1
( x + 2 y ) dy = ( xy + y 2 ) y =0 = ( x + 1)
2 2 y =1 2
gX ( x) = ; 0 ≤ x ≤1
y=0 3 3 3
por lo tanto:
⎧2
⎪ ( x + 1) ; 0 ≤ x ≤1
gX ( x) = ⎨ 3
⎪⎩ 0 ; en otro caso
c) La función condicional se define por:
⎧ f XY ( x0 , y )
⎪ ; f X ( x0 ) > 0
fY X = x0 (Y X = x0 ) = ⎨ f X ( x0 )
⎪
⎩ 0 ; en otro caso
PyE_ EF1_TIPO1_2011-1 4
⎧2
⎪ 3 ( x0 + 2 y ) ⎧ x0 + 2 y
⎪ 0 ≤ y ≤1 ⎪ ; 0 ≤ y ≤1
fY X = x0 (Y X = x0 ) =
;
⎨ 2 ( x + 1) = ⎨ x0 + 1
⎪ 3 0 ⎪ 0
⎪ ⎩ ; en otro caso
⎩ 0 ; en otro caso
d) Se va a calcular:
⎛ 1⎞
P ⎜ Y < 15 X = ⎟
⎝ 2⎠
sustituyendo en la función de densidad condicional, se tiene:
⎧1 ⎧1+ 4 y
⎪ 2 + 2y ⎪ 2 ⎧1 + 4 y
⎛ 1⎞ ⎪ 1 ; 0 ≤ y ≤1 ⎪ 3 ; 0 ≤ y ≤1 ⎪ ; 0 ≤ y ≤1
f 1 ⎜Y X = ⎟ = ⎨ = ⎨ = ⎨ 3
+1
2 ⎝ 2⎠
Y X=
⎪ 2 ⎪ 2 ⎪ 0
⎪ 0 ⎪ 0 ⎩ ; en otro caso
⎩ ; en otro caso ⎩ ; en otro caso
entonces:
1
1⎛ 1 ⎛ 1⎞ ⎞ 1⎛ 1 2 ⎞
∫
⎛ 1⎞ 1 2
(1 + 4 y ) dy = ( y + 2 y ) 0 = ⎜⎜ + 2 ⎜ ⎟ ⎟⎟ = ⎜ + ⎟ =
1 1
4 1
P ⎜Y < X = ⎟ = 2 4
⎝ 4 2⎠ 0 3 3 3⎝ 4 ⎝ 4 ⎠ ⎠ 3 ⎝ 4 16 ⎠
1 ⎛ 4 2 ⎞ ⎛ 1 ⎞⎛ 6 ⎞ 1
= ⎜ + ⎟ = ⎜ ⎟⎜ ⎟ = = 0.125
3 ⎝ 16 16 ⎠ ⎝ 3 ⎠⎝ 16 ⎠ 8
6. La Procuraduría del Consumidor evalúa anualmente distintas marcas de cigarros de acuerdo con el
contenido de alquitrán, nicotina y monóxido de carbono (CO). La asociación de médicos considera
peligrosas cada una de estas sustancias en la salud del fumador. Estudios anteriores han demostrado
que un aumento en el contenido de alquitrán y nicotina de un cigarro está acompañado de un
incremento en el monóxido de carbono emitido en el humo del cigarro. La tabla siguiente muestra los
valores para seis marcas de cigarros.
Alquitrán CO
Marca [mg] [mg]
Benson&Hedges 16,0 16,6
Camel Lights 8,0 10,2
Marlboro 15,1 14,4
Raleigh 15,8 17,5
Montana 17,0 18,5
Viceroy Light 8,6 10,6
a) Elaborar un diagrama de dispersión entre el contenido de alquitrán (x), y CO (y)
b) Obtener la recta de regresión y trazarla en el diagrama de dispersión del inciso (a)
c) ¿Corroboran los resultados el hecho de que un aumento de alquitrán conlleva un aumento de
monóxido de carbono?
d) ¿Considera que el modelo proporcionado es bueno? ¿Qué porcentaje del monóxido de carbono
emitido en el humo del cigarro queda explicado por el modelo?
20 Puntos
Resolución
a) El diagrama de dispersión es:
PyE_ EF1_TIPO1_2011-1 5
Diagrama de dispersión
y = 0.8541x + 3.1736
20
R2 = 0.9328
Monóxido de carbono
15
10
0
8 10 12 14 16 18
Alquitrán
ŷ = βˆ0 + βˆ1 x
6 6
6 ∑ xi ∑ yi (80.50 )(87.80 )
∑x y − i i
i =1
6
i =1
1246.80 −
6 68.817
βˆ1 = i =1
= = ≈ 0.8541
( 80.50 )
2 2
⎛ ⎞ 6 80.568
⎜ ∑ xi ⎟ 1160.61 −
x 2 − ⎝ i =1 ⎠
6
6
∑i =1
i 6
βˆ0 = y − βˆ1 x
βˆ0 = y − βˆ1 x = 14.633 − ( 0.854 )(13.417 ) ≈ 3.1741
c) Sí es bueno el modelo que se obtuvo, ya que, el porcentaje del monóxido de carbono emitido en
el humo del cigarro queda explicado por el modelo de manera muy aceptable como se observa
en lo que sigue.
⎜ xi ⎟
⎜ ⎟
∑ ⎠ =1160.61 − ( 80.50 ) = 80.568
6 2
SS xx = x −⎝
2
i
i =1
6 6
i =1
PyE_ EF1_TIPO1_2011-1 6
2
⎛ ⎞
∑
6
⎜ yi ⎟
⎜ ⎟
∑ ⎠ = 1347.82 − ( 87.80 ) = 63.013
6 2
SS yy = y2 − ⎝
i
i =1
6 6
i =1
∑∑
6 6
xi yi
SS xy = xi yi − i =1 i =1
= 1246.80 −
6 6
i =1
sustituyendo:
SS xy 68.817
r= = ≈ 0.9658
SS xx SS yy (80.568)( 63.013)
Entonces el coeficiente de determinación es:
( 68.817 )
2
SS xy2
r =R =
2 2
= ≈ 0.9328
SS xx SS yy (80.568)( 63.013)
El ajuste es bueno puede considerarse válido el modelo, como se mencionó anteriormente.
PyE_ EF1_TIPO1_2011-1 7
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO
FACULTAD DE INGENIERÍA
DIVISIÓN DE CIENCIAS BÁSICAS
COORDINACIÓN DE CIENCIAS APLICADAS
DEPARTAMENTO DE PROBABILIDAD Y ESTADÍSTICA
SEGUNDO EXAMEN FINAL
RESOLUCIONES
SEMESTRE 2011-1 TIPO 1
DURACIÓN MAX. 2.5 HORAS 2010, DICIEMBRE 13
NOMBRE______________________________________________________________________________
Apellido Paterno Apellido Materno Nombre (s)
1. Considérese un sistema eléctrico integrado como se muestra en el diagrama, donde se indica las
probabilidades de que los componentes A 1 , A 2 , A 3 , A 4 y A 5 del sistema operen de modo correcto.
Los componentes del sistema funcionan de manera independiente. Para que funcione el sistema una
corriente eléctrica debe pasar del nodo X al nodo Y . Calcular:
a) la probabilidad de que el sistema eléctrico funcione.
b) la probabilidad de que el sistema eléctrico funcione con al menos cuatro componentes.
15 Puntos
Resolución
a) Sea F el evento que representa el sistema eléctrico funciona.
Sea A i el evento que representa el componente i funciona, i = 1, 2,3, 4,5 .
Por independencia de eventos:
⎣ ( ) ⎦ ⎣ ( ) ( ) ( )
P ( F ) = P ( A1 ) ⎡1 − P A2 ∩ A3 ∩ A4 ⎤ P ( A5 ) = P ( A1 ) ⎡1 − P A2 P A3 P A4 ⎤ P ( A5 ) =
⎦
= ( 0.8 ) ⎡⎣1 − ( 0.35 )( 0.4 )( 0.35 ) ⎤⎦ ( 0.9 ) ≈ 0.6847
b) Sea F ( 4 ó 5) el evento que representa el sistema eléctrico funciona con al menos cuatro
componentes. Por independencia de eventos:
( ) ( ) ( ) (
P F ( 4 ó 5) = P ( A1 ) P A2 ∩ A3 ∩ A4 P ( A5 ) + P ( A1 ) P A2 ∩ A3 ∩ A4 P ( A5 ) + P ( A1 ) P A2 ∩ A3 ∩ A4 P ( A5 ) + )
+ P ( A1 ) P ( A2 ∩ A3 ∩ A4 ) P ( A5 ) =
( ) ( )
F ( 4 ó 5) = P ( A1 ) P ( A2 ) P ( A3 ) P A4 P ( A5 ) + P ( A1 ) P ( A2 ) P A3 P ( A4 ) P ( A5 ) +
( )
+ P ( A1 ) P A2 P ( A3 ) P ( A4 ) P ( A5 ) + P ( A1 ) P ( A2 ) P ( A3 ) P ( A4 ) P ( A5 ) =
( ) ( ) ( )
= P ( A1 ) P ( A5 ) ⎡ P ( A2 ) P ( A3 ) P A4 + P ( A2 ) P A3 P ( A4 ) + P A2 P ( A3 ) P ( A4 ) + P ( A2 ) P ( A3 ) P ( A4 ) ⎤
⎣ ⎦
sustituyendo valores
F ( 4 ó 5) = ( 0.8 )( 0.9 ) ⎡⎣( 0.65 )( 0.6 )( 0.35 ) + ( 0.65 )( 0.4 )( 0.65 ) + ( 0.35 )( 0.6 )( 0.65 ) + ( 0.65 )( 0.6 )( 0.65 ) ⎤⎦ ≈ 0.5008
PyE_ EF2_TIPO1_2011-1 1
2. En la tienda UNAM se adquirieron tres computadoras de un tipo a $5000 cada una. Las venderá a
$10000 cada una. El fabricante se comprometió a readquirir cualquier computadora que no se haya
vendido después de un periodo especificado a $2000 cada una. Sea X el número de computadoras
vendidas y supóngase que P ( 0 ) = 0.1 , P (1) = 0.2 , P ( 2 ) = 0.3 y P ( 3) = 0.4 . Con U ( X ) denotando la
utilidad asociada con la venta de X unidades, la información dada implica que
U ( X ) = Ingreso – Costo = 10000 X + 2000 ( 3 - X ) – 15000 = 8000 X – 9000 . Calcular la utilidad
esperada y la variancia.
15 Puntos
Resolución
Dada la función de utilidad y la función de probabilidad de X
U ( X ) = 8000 X – 9000
x 0 1 2 3
fX ( x) 0.1 0.2 0.3 0.4
Var [ X ] = 5 − [ 2] = 1
2
La variancia de la utilidad es
Var ⎡⎣U ( X ) ⎤⎦ = ( 8000 ) = 64000000
2
En promedio la utilidad será de $7000 con desviación estándar $8000 por la venta de las
computadoras.
3. Considere que X y Y son variables aleatorias que se distribuyen conjuntamente, como lo indica la
función de probabilidad
x
f XY ( x, y ) 0 1 2
0 0.10 0.08 0.06
y
1 0.04 0.20 0.14
2 0.02 0.06 0.30
a) Calcular P ( X ≤ 1 , Y ≥ 1)
b) Determinar P ( X ≤ 1 Y ≥ 1)
c) Obtener la covariancia entre las variables aleatorias.
d) ¿Son variables aleatorias conjuntas estadísticamente independientes?
PyE_ EF2_TIPO1_2011-1 2
20 Puntos
Resolución
a) De la función de probabilidad, la que se pide es
P ( X ≤ 1 , Y ≥ 1) = f XY ( 0,1) + f XY ( 0, 2 ) + f XY (1,1) + f XY (1, 2 ) = 0.04 + 0.02 + 0.20 + 0.06 = 0.32
b) La probabilidad pedida es
P ( X ≤ 1 , Y ≥ 1) P ( X ≤ 1 ∩ Y ≥ 1)
P ( X ≤ 1 Y ≥ 1) = =
P (Y ≥ 1) P (Y ≥ 1)
La función marginal de probabilidad de Y a partir de la definición
fY [ y ] =
∑∀x
f XY ( x, y )
y 0 1 2
fY ( y ) 0.24 0.38 0.38
∑∑
E [ XY ] =
∀y ∀x
xy f XY ( x, y )
[ ]
E X =
∑ ∀x
x fX ( x)
[ ]
E Y =
∑ ∀y
y fY ( y )
[ ]
fX x =
∑ ∀y
f XY ( x, y )
x 0 1 2
fX ( x) 0.16 0.34 0.50
Los valores esperados son
E [ XY ] = (1)(1)( 0.2 ) + (1)( 2 )( 0.06 ) + ( 2 )(1)( 0.14 ) + ( 2 )( 2 )( 0.3) = 1.8
E [ X ] = (1)( 0.34 ) + ( 2 )( 0.50 ) = 1.34
E [Y ] = (1)( 0.38 ) + ( 2 )( 0.38 ) = 1.14
sustituyendo en la covariancia los promedios
Cov ( X , Y ) = 1.8 − (1.34 )(1.14 ) = 0.2724
Existe asociación lineal positiva.
d) Por independencia de variables aleatorias conjuntas, se sabe que
f XY ( x, y ) = f X ( x ) fY ( y )
sustituyendo valores tanto de la función conjunta como en las marginales, se tiene
f XY ( 0, 0 ) = f X ( 0 ) fY ( 0 )
PyE_ EF2_TIPO1_2011-1 3
0.10 ≠ ( 0.16 )( 0.24 ) = 0.0384
por lo tanto se concluye que no son independientes.
4. Estadísticas publicadas por una oficina de seguridad de la Dirección de Tránsito de una gran ciudad
muestra que, en promedio, en la noche de un fin de semana uno de cada diez conductores maneja en
estado de ebriedad. Si 400 conductores se inspeccionan al azar en una noche de sábado, ¿cuál es la
probabilidad de que el número de conductores ebrios sea:
a) menor que 32?
b) mayor que 49?
c) por lo menos 35 pero menor que 47?
20 Puntos
Resolución
Sea X la variable aleatoria que representa el número de conductores que manejan en estado de
ebriedad, en sábado por la noche.
⎛ 1⎞
X ∼ Binomial ⎜ n = 400 , p = ⎟
⎝ 10 ⎠
dado que n es grande y p es pequeña, se aproxima por distribución normal
Y ∼ Normal ( μ = np , σ 2 = npq )
sustituyendo
(
Y ∼ Normal μ = 40 , σ 2 = 36 )
a) Se va a calcular y con la tabla de la función de distribución acumulativa normal estándar
⎛ 1⎞
⎜ 32 − 40 + ⎟
P (Y ≤ 32 ) ≈ P ⎜ Z ≤ 2 = P ( Z ≤ −1.25 ) = 0.1056
⎟
⎜⎜ 6 ⎟⎟
⎝ ⎠
b) Se pide calcular y usando tablas
⎛ 1⎞
⎜ 49 − 40 − ⎟
P (Y ≥ 49 ) ≈ P ⎜ Z ≥ 2 = P ( Z ≥ 1.42 ) = 1 − F (1.42 ) = 1 − 0.9222 = 0.0778
⎟ Z
⎜⎜ 6 ⎟⎟
⎝ ⎠
c) A calcular
⎛ 1 1⎞
⎜ 35 − 40 − 2 47 − 40 + ⎟
P ( 35 ≤ Y ≤ 47 ) ≈ P ⎜ ≤Z≤ 2 = P ( −0.91 ≤ Z ≤ 1.25 ) = F (1.25 ) − F ( −0.91) =
⎟ Z Z
⎜⎜ ⎟⎟
6 6
⎝ ⎠
= 0.8944 − 0.1814 = 0.713
Otra posible solución sin emplear el factor de corrección por continuidad, o bien, directamente por
distribución binomial.
PyE_ EF2_TIPO1_2011-1 4
5. Dada la función de probabilidad de una población uniforme
⎧ 1
⎪ ; x = 0,1, 2,3
fX ( x) = ⎨ 4
⎪⎩ 0 ; en otro caso
Calcular la probabilidad de que una muestra aleatoria de tamaño 36, seleccionada con reemplazo, dé
un promedio muestral mayor que 1.45 pero menor de 1.75
15 Puntos
Resolución
Se tiene una función de probabilidad de una variable aleatoria uniforme discreta, se sabe que su media
está dada por
μX =
∑ ∀x
x fX ( x)
sustituyendo
1 6 3
μX = ( 0 + 1 + 2 + 3) = =
4 4 2
y su variancia está dada por
σ X2 =
∑ ∀x
( x − μX )
2
fX ( x)
sustituyendo
1 ⎡⎛ 3⎞ ⎤
2 2 2 2
3⎞ ⎛ 3⎞ ⎛ 3⎞ ⎛ 1 ⎡9 1 1 9⎤ 5
σ X2 = ⎢⎜ 0 − ⎟ + ⎜ 1 − ⎟ + ⎜ 2 − ⎟ + ⎜ 3 − ⎟ ⎥ = ⎢ + + + ⎥ =
4 ⎣⎢⎝ 2⎠ ⎝ 2⎠ ⎝ 2⎠ ⎝ 2 ⎠ ⎦⎥ 4 ⎣ 4 4 4 4 ⎦ 4
De acuerdo con la población dada se sabe que
X i ∼ Uniforme ( k = 4 )
Por el Teorema del Límite Central, para una muestra aleatoria grande, en este caso n = 36 , entonces
⎛ σ2 ⎞
X ∼ Normal ⎜ μ X = μ X , σ X2 = X ⎟
⎝ n ⎠
sustituyendo
⎛ 5 ⎞
⎜ 3 4 5 ⎟
X ∼ Normal ⎜ μ X = , σ X =
2
= ⎟
⎜⎜ 2 36 144 ⎟
⎟
⎝ ⎠
La probabilidad a calcular para la media de la muestra es
⎛ ⎞
⎜ 1.45 − 1.5 1.75 − 1.5 ⎟ ⎛ 12 (1.45 − 1.5 ) 12 (1.75 − 1.5 ) ⎞
P (1.45 ≤ X ≤ 1.75 ) ≈ P ⎜ ≤Z≤ ⎟ = P⎜ ≤Z≤ ⎟⎟ =
⎜ 5 ⎟ ⎜
5 ⎝ 5 5 ⎠
⎜ ⎟
⎝ 12 12 ⎠
= P ( −0.27 ≤ Z ≤ 1.34 )
por propiedades de la función de distribución acumulativa normal estándar
P (1.45 ≤ X ≤ 1.75 ) ≈ FZ (1.34 ) − FZ ( −0.27 ) = 0.9099 − 0.3936 = 0.5163
6. Se llevó a cabo una investigación para estudiar la relación entre la velocidad [en pies por segundo] y el
ritmo de zancadas [en número de pasos por segundo] de entre 11 corredores de maratón, se tienen los
siguientes datos:
∑ ∑
11 11
PyE_ EF2_TIPO1_2011-1 5
∑ ∑
11 11
∑
11
Obtener la ecuación de la recta de regresión que se utilizaría para pronosticar el ritmo de zancadas a
partir de la velocidad.
15 Puntos
Resolución
Del enunciado se tiene n = 11 y se sabe que la recta de regresión es
ŷ = βˆ0 + βˆ1 x
donde
11 11
11 ∑ xi ∑y i
( 205.4 )( 35.16 )
∑x y − i i
i =1
11
i =1
660.13 −
3.5969
βˆ1 = i =1
= 11 = ≈ 0.0805
( 205.4 )
2 2
⎛ ⎞ 11 44.7018
⎜ ∑ xi ⎟ 3880.08 −
x 2 − ⎝ i =1 ⎠
11
11
∑
i =1
i 11
βˆ0 = y − βˆ1 x
∑
11
(Velocidad )
205.4
x= n =1
= = 18.6727
n 11
y
∑
11
( Ritmo )
35.16
y= n =1
= = 3.1964
n 11
entonces
βˆ0 = 3.1964 − ( 0.0805 )(18.6727 ) ≈ 1.6932
PyE_ EF2_TIPO1_2011-1 6
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO
FACULTAD DE INGENIERÍA
DIVISIÓN DE CIENCIAS BÁSICAS
COORDINACIÓN DE CIENCIAS APLICADAS
DEPARTAMENTO DE PROBABILIDAD Y ESTADÍSTICA
SEGUNDO EXAMEN FINAL
RESOLUCIÓN
SEMESTRE 2011 - 2 TIPO 1
DURACIÓN MÁXIMA 2.5 HORAS JUNIO 8, 2011
NOMBRE___________________________________________________________________________
Apellido Paterno Apellido Materno Nombre(s)
1. En una clase hay 30 alumnos, de los cuales 20 estudian inglés, 12 estudian francés y seis
estudian los ambos idiomas. Se elige a un alumno al azar y se denotan:
Sea A el evento que representa el alumno elegido aleatoriamente estudia inglés
Sea B el evento que representa el alumno elegido aleatoriamente estudia francés
Determinar las probabilidades de:
a) P ( A ∪ B) , P( A∪ B) y P( A A∪ B)
b) Explicar a qué se refiere cada probabilidad del inciso a).
15 Puntos
Resolución
Se define:
Sea A el evento que representa el alumno elegido aleatoriamente estudia inglés
Sea B el evento que representa el alumno elegido aleatoriamente estudia francés
P( A A∪ B) =
(
P A∩( A∪ B) ) = P ( ( A ∩ A) ∪ ( A ∩ B ) ) = P ( A ∪ ( A − B ) ) = P ( A)
P( A∪ B) P( A∪ B) P( A∪ B) P( A∪ B)
PyE_ EF2_TIPO1_2011-2 1
20
P( A A∪ B) = 30 20 5
= = ≈ 0.833
24 24 6
30
Diagrama de Venn P ( A ∪ B )
Diagrama de Venn P ( A ∪ B )
P ( A A ∪ B ) Seleccionar a un alumno que estudie inglés, si se sabe que estudia inglés o que no estudia francés.
Diagrama de Venn P ( A A ∪ B )
PyE_ EF2_TIPO1_2011-2 2
15 Puntos
Resolución
La probabilidad de que el índice de octano esté entre 0.20 y 0.30, al utilizar la función
acumulativa, está dada por:
P ( 0.20 < X < 0.30 ) = P ( 0.20 ≤ X ≤ 0.30 ) = FX ( 0.30 ) − FX ( 0.20 )
P ( 0.20 < X < 0.30 ) = 6.25 ( 0.30 ) − 1.25 ( 0.30 ) + 0.0625 − ⎡ 6.25 ( 0.20 ) − 1.25 ( 0.20 ) + 0.0625⎤
2 2
⎣ ⎦
P ( 0.20 < X < 0.30 ) = 0.25 − 0.0625 = 0.188
a) Para calcular el promedio del índice de octano, primero se debe determinar la función de
densidad, se sabe que:
dFX ( x )
= fX ( x)
dx
para el caso, se tiene:
f X ( x ) = 12.5 x − 1.25
por lo tanto la función de densidad está dada por:
⎧12.5 x − 1.25 ; 0.1 ≤ x ≤ 0.5
fX ( x) = ⎨
⎩ 0 ; en otro caso
El valor esperado del índice de octano por litro, es:
∫
∞
E(X ) = x f X ( x ) dx
−∞
sustituyendo:
∫ ∫ ∫
0.5 0.5 0.5
3 0.1 2 0.1 3 ⎣ 2 ⎣
E ( X ) = 0.516 − 0.15 = 0.367
3. El número promedio de camiones tanque que llega diario a Salina Cruz, Oaxaca, es tres. Las
instalaciones en el puerto manejan a lo más cinco camiones tanque por día.
a) ¿Cuál es la probabilidad de que en un día cualquiera los camiones se tengan que regresar?
b) En los primeros ocho días de cualquier mes, ¿cuál es la probabilidad de que el octavo día del
mes, sea el cuarto día en que los camiones tanque se tengan que regresar?
15 Puntos
Resolución
a) Sea Y la variable aleatoria que representa el número de camiones tanque que llega en un
día a Salina Cruz, Oaxaca.
⎛ camiones ⎞
Y ~ Poisson ⎜ λ = 3
⎝ día ⎟⎠
La probabilidad de que en un día cualquiera, los camiones tanque se tengan que regresar,
es:
P (Y > 5 ) = P (Y = 6 ) + P (Y = 7 ) + P (Y = 8 ) + ...
P (Y > 5 ) = 1 − P (Y ≤ 5 ) = 1 − ⎡⎣ P (Y = 0 ) + P (Y = 1) + P (Y = 2 ) + P (Y = 3) + P (Y = 4 ) + P (Y = 5 ) ⎤⎦
sustituyendo los valores:
∑ ∑
5 5
3 y e −3 3y
P (Y > 5 ) = 1 − = 1 − e −3 = 1 − 0.916 ≈ 0.084
y! y!
y =0 y =0
b) Sea R la variable aleatoria que representa el octavo día del mes, para que el cuarto día en
que los camiones tanque se tengan que regresar, cuando llegan a Salina Cruz, Oax.
R ~ Pascal ( r = 4 , p = 0.084 )
PyE_ EF2_TIPO1_2011-2 3
con lo que se va a calcular:
⎛7⎞ ⎛7⎞
P ( R = 8 ) = ⎜ ⎟ ( 0.084 ) (1 − 0.084 ) = ⎜ ⎟ ( 0.084 ) ( 0.916 ) ≈ 0.001
4 4 4 4
⎝ ⎠
3 ⎝ ⎠
3
4. Supóngase que la función de densidad de probabilidad conjunta de un vector aleatorio (T , U ) es:
⎧⎪2e- ( 2 t+u) ; t > 0 , u > 0
fTU ( t , u) = ⎨
⎪⎩ 0 ; en otro caso
donde T es el tiempo de espera en cola, en minutos, de los clientes en la caja normal de un
pequeño supermercado y U es el tiempo de espera en cola, en minutos, de los clientes en la caja
rápida.
a) Determinar las funciones marginales de densidad de T y U
b) Calcular la probabilidad de que el tiempo de espera en cola en la caja rápida sea mayor que
el tiempo de espera en la caja normal.
c) Obtener la función de densidad condicional del tiempo de espera en cola de la caja normal,
dado que el tiempo de espera en la cola de la caja rápida es de un minuto.
d) Calcular el coeficiente de correlación e interpretar el resultado.
20 Puntos
Resolución
Sea T la variable aleatoria que representa el tiempo de espera en la cola de la caja normal.
Sea U la variable aleatoria que representa el tiempo de espera en la cola de la caja rápida.
∫
∞
fT ( t ) = fTU ( t , u ) du
−∞
∫
∞
fU ( u ) = fTU ( t , u ) dt
−∞
∫ ∫ ∫
+∞ R R
fT ( t ) =
−( 2t + u ) − ( 2t + u ) − ( 2t + u )
2e du = lim 2e du = 2 lim e du
R →+∞ R →+∞
0 0 0
∫ ∫ ∫
+∞ P P
fU ( u ) =
−( 2t + u ) − ( 2t + u ) − ( 2t + u )
2e dt = lim 2e dt = 2 lim e dt
P →+∞ P →+∞
0 0 0
( )
P
⎡ 1 − 2t + u ⎤
fU ( u ) = 2 lim ⎢ − e ( ) ⎥ = − lim ⎡ e ( ) ⎤ = − lim ⎡ e (
P
− 2 P +u )
− 2t + u
⎤ − ⎡e−(0 + u ) ⎤ = e−u ; u > 0
P →+∞
⎣ 2 ⎦0 P →+∞ ⎣ ⎦ 0 P →+∞ ⎣ ⎦ ⎣ ⎦
por tanto, las funciones marginales son:
⎪⎧2e ⎪⎧e
−2 t −u
; t >0 ; u>0
fT ( t ) = ⎨ fU ( u ) = ⎨
⎪⎩ 0 ; en otro caso ⎪⎩ 0 ; en otro caso
b) La probabilidad de que el tiempo de espera en cola en la caja rápida sea mayor que el
tiempo de espera en la caja normal, significa que:
P (U > T ) = P (U − T > 0 )
De las propiedades de la función de densidad conjunta, se sabe que:
∫∫
∞ ∞
P ( (T , U ) ∈ R ) = fTU ( t , u ) dt du
−∞ −∞
PyE_ EF2_TIPO1_2011-2 4
sustituyendo:
⎡ S ⎡ ⎤ ⎤
∫∫ ∫ ∫
∞ ∞ R
⎢ ⎥
P (U > T ) = lim ⎢ du ⎥ dt ⎥
−( 2t + u ) −( 2t + u )
2e du dt = 2 lim ⎢ e
S → +∞ R → +∞ ⎢ ⎥
0 t ⎢⎣ 0 ⎣⎢ t ⎥⎦ ⎥⎦
⎡ ⎤ ⎡ ⎤
∫ ∫
S S
∫ ∫
S S
P (U > T ) = −2 lim ⎢
S → +∞ ⎢ ⎣
R → +∞
(
lim ⎡⎢ e ( ) − e −3t
− 2t + R
) ( ) ⎤ dt ⎥ = −2 lim ⎢
⎦⎥ ⎥ S → +∞ ⎢ ⎣ ⎦ ⎥ ( )
⎡( 0 ) − e −3t ⎤ dt ⎥
⎢⎣ 0 ⎥⎦ ⎢⎣ 0 ⎥⎦
⎡ ⎤
∫
S
⎝ n⎠
i
sustituyendo:
PyE_ EF2_TIPO1_2011-2 5
⎛ 3 ⎞
Y ~ Normal ⎜ μY = 24 h , σ Y = h⎟
⎝ 10 ⎠
La probabilidad de que la muestra aleatoria de 100 pilas, tenga un promedio que se desvíe más de
30 minutos de su promedio, esto es:
( )⎛ 1⎞
2⎠
⎛
⎝
1⎞
P Y − μY > 30 = P ⎜ Y − μY > ⎟ = 1 − P ⎜ Y − μY < ⎟
⎝ 2⎠
entonces:
⎛ 1 1 ⎞
⎜− ⎟
⎛ 1⎞ ⎛ 1 1⎞ Y − μY ⎛ −10 10 ⎞
P ⎜ Y − μY < ⎟ = P ⎜ − < Y − μY < ⎟ ≈ P ⎜ 2 < < 2 ⎟ = P⎜ <Z< ⎟
⎝ 2 ⎠ ⎝ 2 2 ⎠ ⎜ 3 σ Yi 3 ⎟ ⎝ 6 6⎠
⎜ 10 10 ⎟
⎝ n ⎠
⎛ 1⎞
P ⎜ Y − μY < ⎟ = P ( −1.67 < Z < 1.67 ) = FZ (1.67 ) − FZ ( −1.67 ) ≈ 0.9525 − 0.0475 ≈ 0.905
⎝ 2⎠
⎛ 1⎞
P ⎜ Y − μY > ⎟ = 1 − 0.905 = 0.095
⎝ 2⎠
Al usar calculadora o excel:
⎛ 1⎞ ⎛ 1⎞
P ⎜ Y − μY > ⎟ = 1 − P ⎜ Y − μY < ⎟ = 1 − P ( −1.67 < Z < 1.67 ) = 1 − ⎣⎡ FZ (1.67 ) − FZ ( −1.67 ) ⎦⎤ ≈ 1 − [ 0.9525 − 0.0475] ≈ 0.095
⎝ 2⎠ ⎝ 2⎠
6. En la producción de herramientas de acero, se ha considerado ilustrar la relación entre la
deformación ( x ) y la dureza Brinell ( y )
x [mm] 6 9 11 22 26 28 33 35
⎡ kg ⎤
y ⎢
⎣ mm ⎥⎦
2 68 67 65 44 40 37 34 32
a) Elaborar el diagrama de dispersión.
b) Estimar la recta de regresión.
c) Interpretar el resultado del coeficiente de determinación.
20 Puntos
Resolución
a)
Diagrama de Dispersión
y = -1.3715x + 77.52
80 R2 = 0.9765
70
Dureza Brinell kg/mm2
60
50
40
30
20
10
0
0 10 20 30 40
Deformación mm
b) El ajuste de los datos a un modelo lineal de regresión por el criterio de mínimos cuadrados
está dado por:
ŷ = βˆ0 + βˆ1 x
PyE_ EF2_TIPO1_2011-2 6
donde
SS xy
βˆ0 = y − βˆ1 x βˆ1 =
SS xx
Al realizar los productos y las sumas, se tiene
x y x2 y2 xy
6 68 36 4624 408
9 67 81 4489 603
11 65 121 4225 715
22 44 484 1936 968
26 40 676 1600 1040
28 37 784 1369 1036
33 34 1089 1156 1122
35 32 1225 1024 1120
Suma: 170 387 4496 20423 7012
de donde:
2
⎛ ⎞
∑
n
⎜ xi ⎟
⎜ ⎟
∑ ⎠ = 4496 − (170 ) = 883.5
n 2
SS xx = x2 − ⎝
i
i =1
n 8
i =1
∑ ∑
n n
x y
SS xy = xy −i i = 7012 −
i =1 i =1
n 8
i =1
sustituyendo:
SS xy − 1211.75
βˆ1 = = = − 1.375
SS xx 883.5
para calcular los promedios:
∑
n
1 1
x= xi = (170 ) = 21.25
n 8
i =1
y
∑
n
1 1
y= yi = ( 387 ) = 48.375
n 8
i =1
sustituyendo:
βˆ0 = 48.375 − ( −1.372 )( 21.25 ) = 77.52
por lo tanto el modelo de regresión lineal es:
yˆ = − 1.3715 x + 77.52
c) El coeficiente de correlación está definido por
SS xy
r=
SS xx SS yy
Al realizar los cálculos necesarios:
PyE_ EF2_TIPO1_2011-2 7
2
⎛ ⎞
∑
n
⎜ yi ⎟
⎜ ⎟
∑ ⎠ = 20423 − ( 387 ) = 1701.875
n 2
SS yy = y2 − ⎝
i
i =1
n 8
i =1
por lo que el coeficiente de correlación es:
−1211.75
r= = − 0.988
(883.5)(1701.875)
El coeficiente de determinación está definido por:
R 2 = ( r ) 2 = ( −0.988 ) 2 = 0.9765
Se concluye que el modelo explica muy bien a la variable de entrada, ya que es muy
bueno el porcentaje de explicación: R 2 = 0.9765
PyE_ EF2_TIPO1_2011-2 8
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO
FACULTAD DE INGENIERÍA
DIVISIÓN DE CIENCIAS BÁSICAS
COORDINACIÓN DE CIENCIAS APLICADAS
DEPARTAMENTO DE PROBABILIDAD Y ESTADÍSTICA
PRIMER EXAMEN FINAL
RESOLUCIÓN
SEMESTRE 2011 - 2 TIPO 1
DURACIÓN MÁXIMA 2.5 HORAS JUNIO 1, 2011
NOMBRE_____________________________________________________________________________
Apellido Paterno Apellido Materno Nombre(s)
1. Los datos que se muestran en la tabla de frecuencias, obtenidos por la observación de una cámara
oculta, corresponden a las velocidades, para una muestra aleatoria de 37 coches que recorren el
circuito interior en CU, donde se permite circular hasta 40 kilómetros por hora.
1.00 - 50.00 0 3
0.135
10
0.541
50.00 - 30.0 10
a) Completar la tabla de frecuencias con los datos faltantes e identificar la amplitud (o longitud) de
clase y la unidad de precisión de los datos.
b) Calcular la media.
c) Determinar la desviación estándar.
d) Interpretar el coeficiente de variación.
20 Puntos
Resolución
a) La tabla de frecuencias completa es:
∑ ∑
6 6
1
x= xi fi = xi f i *
n
m =1 m =1
PyE_ EF1_TIPO1_2011-2 1
sustituyendo:
1 711
x= ⎡( 3)( 3) + ( 8 )( 2 ) + (13)( 5 ) + (18 )(10 ) + ( 23)( 7 ) + ( 28 )(10 ) ⎤⎦ = ≈ 19.216 km / h
37 ⎣ 37
∑
6
1
( xi − x )
2
s( n −1) = fi
n −1
m =1
sustituyendo se tiene:
s( n −1) =
1 ⎡( 3 − 19.216 )2 ( 3) + (8 − 19.216 )2 ( 2 ) + (13 − 19.216 )2 ( 5) + (18 − 19.216 )2 (10 ) + ( 23 − 19.216 )2 ( 7 ) + ( 28 − 19.216 )2 (10 )⎤
37 − 1 ⎣⎢ ⎦⎥
1
s( n −1) = ( 2120.270 ) ≈ 7.674 km / h
36
2. En una determinada gasolinería, el 25% de los clientes utilizan gasolina Premium para sus
vehículos, el 55% usan gasolina Magna, y el resto utilizan gasolina Alternativa (Etanol). De los
clientes que consumen gasolina Premium sólo el 30% de ellos llenan sus tanques, de los que usan
gasolina Magna el 60% llenan sus tanques, en tanto que los que prefieren gasolina Alternativa el
50% llenan los tanques de sus automóviles.
a) ¿Cuál es la probabilidad de que el siguiente cliente pida al servidor llenar su tanque?
b) Si el siguiente cliente llena su tanque, ¿qué probabilidad hay de que solicite al servidor gasolina
Magna?
c) Si el siguiente cliente no llena su tanque ¿qué probabilidad hay de que pida al servidor gasolina
Alternativa?
15 Puntos
Resolución
Sean los eventos que representan a:
A1 : Los clientes que utilizan gasolina Premium.
A2 : Los clientes que utilizan gasolina Magna.
A3 : Los clientes que utilizan gasolina Alternativa (Etanol).
B : Los clientes que llenan el tanque.
b) Si el siguiente cliente llena su tanque con gasolina, cuál es la probabilidad de que solicite
gasolina Magna, aplicando Teorema de Bayes, entonces:
PyE_ EF1_TIPO1_2011-2 2
P ( A2 ∩ B ) P ( A2 ) P ( B A2 ) ( 0.55)( 0.60 ) ≈
P ( A2 B ) = = = 0.653
P ( B) P ( B) 0.505
c) Determinar la probabilidad de que un cliente pida gasolina alternativa, dado que no llena su
tanque, entonces del Teorema de Bayes, del enunciado se sabe que:
(
P B A1 = 0.70 ) ( )
P B A2 = 0.40 ( )
P B A3 = 0.50
P ( A3 B ) =
P ( A3 ∩ B )
=
(
P ( A3 ) P B A3 ) = ( 0.20)( 0.50) = 0.1
≈ 0.202
P(B) 1− P ( B) 1 − 0.505 0.495
E ( C ) = E ( aX + b ) = aE ( X ) + b
sustituyendo:
7 = 6a + b
Aplicando propiedades de la variancia, se tiene:
Var ( C ) = V ar ( aX + b ) = a 2Var ( X )
sustituyendo:
1 = a 2 ( 0.8 )
2
1 1 5
a=± =± =±
( 0.8)
2
0.8 4
5
De lo que, sólo se trabaja la parte positiva, entonces: a =
4
Sustituyendo el valor calculado:
⎛5⎞
7 = 6⎜ ⎟ + b
⎝4⎠
PyE_ EF1_TIPO1_2011-2 3
Por lo tanto el ajuste a realizar por parte del profesor es:
5 1
C= X − = 1.25 x − 0.5
4 2
4. El 2% de los tornillos fabricados por una máquina presentan defectos. Si se tiene un lote de 2000
tornillos, ¿cuál es la probabilidad de que haya menos de 50 tornillos defectuosos?
15 Puntos
Resolución
Sea X la variable aleatoria que representa el número de tornillos defectuosos que se tienen
cuando se seleccionan para revisión.
X ~ Binomial ( n = 2000 , p = 0.02 )
Se pide determinar la probabilidad de que haya a lo más 50 tornillos defectuosos, esto es:
P ( X ≤ 50 ) = P ( X = 0 ) + P ( X = 1) + P ( X = 2 ) + ... + P ( X = 50 )
∑
50
⎛ 2000 ⎞
P ( X ≤ 50 ) = ⎟ ( 0.02 ) ( 0.98 )
x 2000 − x
⎜ ≈ 0.949
⎝ x ⎠
x =0
O bien, aproximando con distribución normal ya que μ = np = ( 2000 )( 0.02 ) = 40 ≥ 20 es una buena
aproximación, entonces:
Y ~ Normal ⎡⎣ μ = np = ( 2000 )( 0.02 ) = 40 , σ 2 = npq = ( 2000 )( 0.02 )( 0.98 ) = 39.2 ⎤⎦
(
Y ~ Normal μ = 40 , σ 2 = 39.2 )
por aproximación se tiene:
⎛ 1 1⎞
⎜ Y − μ + 2 50 − 40 + 2 ⎟ ⎛ 10.5 ⎞
P (Y ≤ 50 ) ≈ P ⎜ ≤ ⎟ = P⎜Z ≤ ⎟ = P ( Z ≤ 1.68 ) ≈ FZ (1.68 ) = 0.9535
⎜⎜ npq 39.2 ⎟⎟ ⎝ 39.2 ⎠
⎝ ⎠
De otra forma, al usar calculadora con distribución normal se tiene:
(
Y ~ Normal μ = 40 , σ 2 = 39.2 )
P (Y ≤ 50 ) ≈ 0.9535
También podría darse el caso, de no usar el factor por continuidad de un medio, entonces:
⎛ Y − μ 50 − 40 ⎞ ⎛ 10 ⎞
P (Y ≤ 50 ) ≈ P ⎜ ≤ ⎟ = P⎜ Z ≤ ⎟ = P ( Z ≤ 1.60 ) = FZ (1.60 ) = 0.9452
⎜ npq 39.2 ⎠⎟ ⎝ 39.2 ⎠
⎝
5. Supóngase que los tiempos requeridos por un cierto autobús para alcanzar uno de sus destinos a
una ciudad grande, tiene distribución normal con desviación estándar de un minuto. Si se elige al
azar una muestra aleatoria de 17 tiempos. Obtener la probabilidad de que la variancia muestral sea
mayor que dos e interpretar el resultado.
15 Puntos
Resolución
(
Se pide determinar la probabilidad de que la variancia de la muestra aleatoria S(2n −1) , sea mayor que )
(
2, esto es: P S(2n −1) > 2 )
PyE_ EF1_TIPO1_2011-2 4
Por lo tanto, transformando en Ji cuadrada, se tiene:
⎛ ( n − 1) S(2n −1) (16 ) 2 ⎞
( )
P S(2n −1) > 2 ≈ P ⎜
⎜ σ2
>
1 ⎟
2
(
⎟ = P Χ (16, )
α ) > 32 = α
⎝ ⎠
(
P Χ (16,
2
)
α ) > 32 = 0.01
6. Dos oftalmólogos se asociaron para poner una clínica en la que, por la subespecialidad, él puede
atender hasta cinco pacientes por día y ella puede atender hasta tres pacientes por día. Si ( X , Y ) es
un vector aleatorio, sea X la variable aleatoria que representa el número de pacientes atendidos por
el doctor y, sea Y la variable aleatoria que representa el número de pacientes atendidos por la
doctora, según la tabla que muestra la función masa de probabilidad conjunta.
f XY ( x , y ) x
0 1 2 3 4 5
0 0 0.01 0.03 0.05 0.07 0.09
y 1 0.01 0.02 0.04 0.05 0.06 0.08
2 0.01 0.03 0.05 0.05 0.05 0.06
3 0.01 0.02 0.04 0.06 0.06 0.05
y
fY ( y ) =
∑
∀RX
f XY ( x, y )
entonces:
x 0 1 2 3 4 5
PyE_ EF1_TIPO1_2011-2 5
y 0 1 2 3
∑
3
f X ( X ≤ 3) = f x ( x ) = f X ( X = 0 ) + f X ( X = 1) + f X ( X = 2 ) + f X ( X = 3) = 0.48
x =0
sustituyendo se tiene:
y 0 1 2 3
PyE_ EF1_TIPO1_2011-2 6
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO
FACULTAD DE INGENIERÍA
DIVISIÓN DE CIENCIAS BÁSICAS
COORDINACIÓN DE CIENCIAS APLICADAS
DEPARTAMENTO DE PROBABILIDAD Y ESTADÍSTICA
PRIMER EXAMEN FINAL
RESOLUCIONES
SEMESTRE 2012 - 2 TIPO 1
DURACIÓN MÁXIMA 2.5 HORAS 30 DE MAYO DE 2012
NOMBRE_______________________________________________________________________________
Apellido paterno Apellido materno Nombre (s) Firma
Problema 1
La siguiente tabla muestra la estimación de hundimientos de suelo en centímetros, de diez diferentes sitios del Distrito
Federal durante el último año.
Hundimiento (cm) [0,10) [10,20) [20,30) [30,40]
Frecuencia 3 2 1
Frecuencia 3 9
Acumulada
Frecuencia Relativa 0.30 0.20
Frecuencia Relativa 0.30 0.90
Acumulada
a) Completar los valores faltantes en la tabla.
b) Determinar el valor medio de los hundimientos registrados.
c) Calcular el valor del coeficiente de variación.
Puntos 15
Resolución
a) Como el total de observaciones es de 10, el dato faltante del renglón de la frecuencia debe ser 4 para tener el total de 10.
Luego se completa la tabla de frecuencias.
c) Se tiene que el coeficiente de variación está dado por: , por lo que falta calcular S, utilizando la fórmula
correspondiente a datos agrupados.
PyE_ EF1_TIPO1_2012-2 1
entonces
S=9.9442 y C.V.=62.15%
Problema 2
El sistema contiene siete componentes. Estos se conectan como se muestra en el diagrama. Si los siete componentes operan
de manera independiente y si la probabilidad de que cada uno de ellos A, B, C, D, E, F, o G, esté funcionando, es de 0.95,
determinar la probabilidad de que el sistema completo funcione.
Puntos 15
Resolución
La probabilidad de que el sistema completo funcione, equivale a todas las componentes funcionan, entonces
P(Funciona completamente)=(0.95)7
P(Funciona completamente)=0.6983
Problema 3
Supóngase que el error en la lectura del consumo de energía eléctrica en Kw/h, es una variable aleatoria que tiene por
función densidad
a) Calcular
b) Determinar de manera analítica y gráfica la función de distribución acumulada y utilizarla para verificar el resultado del
inciso a).
c) Obtener la variancia de
15 Puntos
Resolución
a) La probabilidad de que el error en la lectura de consumo sea entre cero y uno, es por propiedades se sabe
entonces
b) La función de distribución se define por la integral con límite superior variable, entonces
sustituyendo
por lo tanto
PyE_ EF1_TIPO1_2012-2 2
La gráfica de la función acumulativa es
c) Se pide calcular la variancia, segundo momento con respecto a la media, o bien, en términos de momentos con
respecto al origen, se sabe que es el segundo momento con respecto a origen menos el primer momento con
respecto al origen al cuadrado, es decir
Integrando para calcular los momentos con respecto al origen, de la definición de momentos con respecto al
origen, se sabe
sustituyendo
sustituyendo
al sustituir en la variancia de se tiene y se sabe que la variancia de una constante es igual a cero
PyE_ EF1_TIPO1_2012-2 3
Otra forma de calcular la variancia de , al aplicar variancia en la función de la variable aleatoria, se tiene
que obtener la media
=8
Problema 4
Un examen contiene 15 preguntas tipo falso-verdadero. El examen se aprueba si por lo menos se contestan correctamente
13 preguntas. Si un alumno contesta al azar el examen, ¿cuál es la probabilidad de que lo apruebe?
10 Puntos
Resolución
entonces
sustituyendo
Problema 5
Se hacen dos pruebas diferentes para un artículo deportivo. Las siguientes distribuciones marginales corresponden a cada
una de las pruebas. En donde X e Y son variables aleatorias que representan a cada una de las pruebas aplicadas a
los artículos deportivos.
0 1 2 0 1 2 3
0.2 0.3 0.5 0.3 0.2 0.1 0.4
Si se sabe que y son variables aleatorias conjuntas estadísticamente independientes.
a) Obtener la distribución de probabilidad conjunta.
b) Si se sabe que la prueba es exactamente dos, ¿cuál es la probabilidad de que la prueba sea menor a dos?
15 Puntos
Resolución
a) Si se sabe y son estadísticamente independientes entonces
0 1 2
0 0.06 0.09 0.15
1 0.04 0.06 0.1
2 0.02 0.03 0.05
3 0.08 0.12 0.2
PyE_ EF1_TIPO1_2012-2 4
b) Se pide obtener P(X < 2 | Y=2)
f XY X = 0, Y = 2 0.02
P X = 0 | Y = 2 = = = 0.2
f Y 2 0.1
f XY X = 1, Y = 2 0.03
P X = 1 | Y = 2 = = = 0.3
f Y 2 0.1
P X < 2 | Y = 2 = 0.2 + 0.3 = 0.5
Otra forma, como las variables aleatorias son estadísticamente independientes, entonces se sabe que
f X | Y=y (X | Y=2) =
x 0 1 2
fX (x) 0.2 0.3 0.5
entonces
P(X < 2 | Y=2)=
Problema 6
En una tienda venden tres marcas diferentes de yogurt en envases de 150 g. De todos los clientes que compran
un sólo envase, 50% compra el que contiene 160 calorías, 30% compra el de 200 calorías y el otro 20% compra
el de 250 calorías. Sean y el número de calorías de los envases comprados por dos clientes seleccionados
independientemente.
a) Calcular la media y la variancia de la población.
b) Determinar la distribución muestral de , calcular y comparar con .
c) Obtener la distribución muestral de , calcular y comparar con .
15 Puntos
Resolución
a) La función de probabilidad para un cliente que llega a la tienda a comprar yogurt, es
b) Para la distribución muestral de la media y variancia, si dos clientes entran de forma independiente a comprar a la tienda
un yogurt, entonces una forma para calcular es
PyE_ EF1_TIPO1_2012-2 5
160 160 (0.5)(0.5)=0.25 160
160 200 (0.5)(0.3)=0.15 180
160 250 (0.5)(0.2)=0.1 205
200 160 (0.3)(0.5)=0.15 180
200 200 (0.3)(0.3)=0.09 200
200 250 (0.3)(0.2)=0.06 225
250 160 (0.2)(0.5)=0.1 205
250 200 (0.2)(0.3)=0.06 225
250 250 (0.2)(0.2)=0.04 250
Por lo tanto
Por lo tanto
Problema 7
En la siguiente tabla se registraron los datos que se refieren al crecimiento de células de piel humana en un medio de
cultivo controlado, en una investigación dirigida a la restauración de piel en víctimas de quemaduras.
Días de cultivo 3 6 9 12 15 18
Número de células 115000 147000 189000 230600 257900 286400
PyE_ EF1_TIPO1_2012-2 6
a) Obtener el coeficiente de determinación para un modelo lineal, y a partir de este responder: ¿Es adecuado el modelo
usado? Argumentar su respuesta. Conclusión:
________________________________________________________________________________________
_______________________________________________________________________________________.
b) Con la ecuación de regresión lineal, estimar el número de células después de 17 días: __________________________.
Días de Número de
cultivo x células y x2 y2 xy
Sumas 63 1225900 819 2.72269E+11 14718900
15 Puntos
Resolución
Días de Número de
cultivo x células y
x2 y2 xy
3 115000 9 13225000000 345000
6 147000 36 21609000000 882000
9 189000 81 35721000000 1701000
12 230600 144 53176360000 2767200
15 257900 225 66512410000 3868500
18 286400 324 82024960000 5155200
63 1225900 819 2.72269E+11 14718900
a) Como el coeficiente de determinación se utiliza como medida de eficacia de la regresión, éste se calculará a partir
del cuadrado del coeficiente de correlación:
PyE_ EF1_TIPO1_2012-2 7
Las medias son
ŷ ˆ0 ˆ1 x
6 6
6 x y i i
631225900
x y i i
i 1
6
i 1
14718900
6 1846950
ˆ1 i 1
11726.667
63
2 2
6 157.5
xi 819
x 2 i 1
6
6
i 1
i 6
ˆ0 y ˆ1 x
ˆ0 y ˆ x 204316.66 11726.667 10.5 81186.656
1
xi
819 63 157.5
6 2
SS xx x
2
i
i 1
6 6
i 1
2
6
yi
2.72269 E 11 1225900 21796928333
6 2
SS yy y2
i
i 1
6 6
i 1
6 6
xi yi
631225900 1846950
6
SS xy xi yi i 1 i 1
14718900
6 6
i 1
PyE_ EF1_TIPO1_2012-2 8
sustituyendo
SS xy 1846950
r 0.9968
SS xx SS yy 157.5 21796928333
entonces el coeficiente de determinación es
1846950
2
SS xy2
r R
2 2
0.9936
SS xx SS yy 157.5 21796928333
Del resultado anterior, se puede observar y concluir, que el coeficiente de determinación es r 2 0.9936 , esto es,
99.36% y está cercano al 100%, por lo que se considera que el modelo lineal es adecuado para estos datos.
b) Se debe considerar los días de cultivo como variable x, y en número de células como y, entonces la ecuación de
regresión que se obtiene es
yˆ 11726.667 x 81186.656
PyE_ EF1_TIPO1_2012-2 9
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO
FACULTAD DE INGENIERÍA
DIVISIÓN DE CIENCIAS BÁSICAS
COORDINACIÓN DE CIENCIAS APLICADAS
DEPARTAMENTO DE PROBABILIDAD Y ESTADÍSTICA
SEGUNDO EXAMEN FINAL
RESOLUCIONES
NOMBRE_______________________________________________________________________________
Apellido paterno Apellido materno Nombre (s) Firma
Problema 1
De la ojiva mostrada a continuación, obtener su tabla de frecuencias, la media y varianza.
15 Puntos
Resolución
Tabla de frecuencias
Frecuencia
Frontera Frontera Marca de relativa Frecuencia Frecuencia Frecuencia
inferior superior clase acumulada relativa absoluta acumulada
5 10 7.5 0.16 0.16 0.16n 0.16n
10 15 12.5 0.28 0.12 0.12n 0.28n
15 20 17.5 0.56 0.28 0.28n 0.56n
20 25 22.5 0.80 0.24 0.24n 0.80n
25 30 27.5 0.90 0.10 0.10n 0.90n
30 35 32.5 0.94 0.04 0.04n 0.94n
35 40 37.5 0.98 0.04 0.04n 0.98n
40 45 42.5 1.00 0.02 0.02n 1.00n
Media
La media aritmética no se puede obtener porque no se dispone de la colección de datos, se estimará a través del concepto
de media ponderada:
m
x = ∑ t i f i* = t1 f1* + t 2 f 2* + L + t m f m*
i =1
En donde ti es la marca de clase del intervalo i, fi* es la frecuencia relativa del intervalo i y m es el número de intervalos o
clases en la tabla de frecuencias.
PyE_ EF2_TIPO1_2012-2 1
Marca de Frecuencia
clase relativa tifi*
7.5 0.16 1.2
12.5 0.12 1.5
17.5 0.28 4.9
22.5 0.24 5.4
27.5 0.10 2.75
32.5 0.04 1.3
37.5 0.04 1.5
42.5 0.02 0.85
Suma= 19.4
Marca de Frecuencia
tifi*
clase relativa ti2fi*
7.5 0.16 1.2 9
12.5 0.12 1.5 18.75
17.5 0.28 4.9 85.75
22.5 0.24 5.4 121.5
27.5 0.1 2.75 75.63
32.5 0.04 1.3 42.25
37.5 0.04 1.5 56.25
42.5 0.02 0.85 36.13
Suma= 19.4 445.25
entonces
(
s 2 = t i2 f i* − t i f i* )
2
= 445.25 − (19.4 ) = 68.89
2
s = s2 = 68.89 = 8.3
Problema 2
Se tienen tres urnas como se describe:
Urna I contiene cuatro bolas rojas y cinco bolas blancas.
Urna II contiene dos bolas rojas y una bola blanca.
Urna III contiene dos bolas rojas y tres bolas blancas.
Se selecciona una urna al azar y se saca una bola de la urna, dado que la bola es roja, ¿cuál es la probabilidad de que
proceda de la urna I?
15 Puntos
Resolución
Del enunciado se tiene
Sea el evento I que representa seleccionar la urna I.
PyE_ EF2_TIPO1_2012-2 2
Sea el evento II que representa seleccionar la urna II.
con probabilidades P(I) =1/3 , P(II)=1/3 y P(III)=1/3 porque es igualmente probable la selección de la urna.
4 2 2
P(R I ) = P (R II ) = P (R III ) =
9 3 5
La probabilidad condicional
de la multiplicación
del enunciado, se sabe que la pregunta corresponde a la aplicación del Teorema de Bayes, dado que se tenga una bola roja
que se haya seleccionado de la urna I, entonces
sustituyendo valores
Problema 3
Realidad
El duque de Toscana preguntó a Galileo por qué al tirar tres dados y realizar la suma era más fácil obtener un diez que un
nueve, Galileo respondió esta pregunta en su texto Sopra le scoperte dei dadi (Sobre los resultados de los dados).
Para Galileo fue evidente que por ejemplo para sumar tres, debía obtener uno en cada dado (1,1,1) y para sumar cuatro
debía obtener un dos y dos uno, que podían salir de tres formas distintas: (2,1,1), (1,2,1) ó (1,1,2) y así sucesivamente
cubrir todas las posibilidades. ¿Cuál es la probabilidad que encontró Galileo para la pregunta del duque de Toscana (sumar
10 ó 9)?
Ficción
El hijo del duque al sentirse celoso del estudioso, le pregunto cuál sería la probabilidad de sacar uno, dos o tres “6” en una
tirada, lo que Galileo mostró como (complete la tabla)
x 1 2 3
f(x) 75/216 15/216
PyE_ EF2_TIPO1_2012-2 3
Donde X representa los seis que salen en una tirada de los tres dados. Cuya suma no dio 100%. Explique por qué.
10 Puntos
Resolución
Para sumar 10 existen 27 formas, que se muestran como: (1−3−6), (1−4−5), (1−5−4), (1−6−3), (2−2−6), (2−3−5), (2−4−4),
(2−5−3), (2−6−2), (3−1−6), (3−2−5), (3−3−4), (3−4−3), (3−5−2), (3−6−1), (4−1−5), (4−2−4), (4−3−3), (4−4−2), (4−5−1),
(5−1−4), (5−2−3), (5−3−2), (5−4−1), (6−1−3), (6−2−2), (6−3−1).
Para sumar 9 necesita (3,3,3), (1,2,6), (1,3,5),(1,4,4),(2,2,5),(2,3,4)
De los cuales forman 1 (3,3,3), 6(1,2,6), 6(1,3,5), 3(1,4,4), 3(2,2,5), 6(2,3,4), dado que al haber dos tres iguales hay una
sola opción, al haber dos iguales hay 3 y al ser todos diferentes hay 6, cuya probabilidad es 25/216,
P(suma=9)=25/216 < P(suma=10)=27/216
La función de probabilidad correcta, la cual incluye que X puede tomar el valor de cero en su recorrido, ya que en el
propuesto se omitió, es
x 0 1 2 3
fX (x) 125/216 75/216 15/216 1/216
Esto es
P(Obtener cero seis en el lanzamiento de tres dados)= 125/216 Por ejemplo: (1,1,1), (1,2,3), (3,4,5),…
5X5X5=125 casos a favor todos sin seis
cinco y cinco y cinco formas para tener tres resultados sin seis.
P(Obtener un seis en el lanzamiento de tres dado)= 75/216 Por ejemplo: (1,1,6), (6,2,3), (4,6,5),…
3X5X5=75 casos a favor todos con un seis
tres formas para poner un seis en sus posiciones y cinco y cinco que no sean seis.
P(Obtener dos seis en el lanzamiento de tres dado)= 15/216 Por ejemplo: (1,6,6), (6,6,2), (3,6,6),…
3X5=15 casos a favor todos con dos seis
Tres formas para poner dos seis en tres posiciones y cinco para otro que no sea seis.
P(Obtener tres seis en el lanzamiento de tres dado)= 1/216 Por ejemplo: (6,6,6)
Un caso a favor todos seis
uno y uno y uno formas de tener seis y seis y seis.
La suma no da uno porque no se consideran los casos en que no sale ningún seis, esto es, que el número de seis sea cero en
los tres dados (x=0).
Problema 4
En la Cuenca Salina del Istmo, la probabilidad de que un pozo exploratorio resulte productor de aceite es de 0.15. Si en la
cuenca se perforan 100 pozos exploratorios.
a) Calcular la probabilidad de que haya más de 15 pozos productores.
b) Determinar el número esperado de pozos productores.
c) Obtener el coeficiente de variación asociado.
15 Puntos
Resolución
Se trata de una secuencia de Bernoulli en la que resulta muy conveniente hacer una aproximación a distribución
normal (modelo de Gauss), en vez de utilizar una distribución binomial.
PyE_ EF2_TIPO1_2012-2 4
Ahora se puede hacer la aproximación
b)
c)
Problema 5
La función de densidad conjunta de dos variables aleatorias X y Y está dada por:
⎧cxy ; 0 < x < 4 , 1 < y < 5
f XY ( x , y ) = ⎨
a) Determinar el valor de la constante ⎩ 0c que; hace válida
en otro
a lacaso
función.
b) Obtener la covariancia entre las variables aleatorias conjuntas.
15 Puntos
Resolución
a) Por las propiedades que debe cumplir una función de densidad, se sabe que
PyE_ EF2_TIPO1_2012-2 5
entonces sustituyendo en la función de densidad con respecto de la región de definición
∫ ∫
1
f X (x ) = (xy ) dy = 1 x ; 0≤x≤4 fY ( y ) =
1
(xy ) dx = 1 y ; 1≤ y ≤ 5
1 96 8 0 96 12
Al multiplicar la funciones marginales, por independencia de variables aleatorias conjuntas, se tiene
f XY (x , y ) = f X (x ) fY ( y )
sustituyendo
1 ⎛ 1 ⎞⎛ 1 ⎞ 1
xy = ⎜ x ⎟⎜ y⎟ = xy
96 ⎝ 8 ⎠⎝ 12 ⎠ 96
Por lo tanto son variables aleatorias conjuntas estadísticamente independientes, la covariancia es igual a cero.
Problema 6
En un espacio de la Facultad de Ingeniería se tienen 5000 varillas almacenadas, para la construcción del edificio X, con
media de 5.02 kilogramos y desviación estándar 0.3 kilogramos. Obtener las probabilidades de que una muestra aleatoria
de 100 varillas tenga un peso,
a) Entre 500 y 596 kilogramos.
b) Mayor de 510 kilogramos.
15 Puntos
Resolución
De los datos del enunciado
kilogramos
kilogramos
PyE_ EF2_TIPO1_2012-2 6
Sea la variable aleatoria que representa el peso de la varilla .
a)
puesto que se realiza muestreo aleatorio simple sin reemplazo
kilogramos
0.0008822
y del Teorema del Límite Central, se tiene que la aproximación por distribución normal, es
b)
Problema 7
Los datos de la tabla representan, de una muestra de seis estudiantes, las calificaciones del examen diagnóstico (x) que se
realiza previamente al ingreso de una Escuela de Ingeniería y las calificaciones respectivas en el curso de Matemáticas I
(y), que los mismos alumnos cursaron posteriormente durante el primer semestre, del troco común de las carreras
profesionales que esta Escuela imparte.
Estudiante 1 2 3 4 5 6
Calificaciones del curso de Matemáticas I 5.0 6.0 9.0 8.0 7.0 9.0
PyE_ EF2_TIPO1_2012-2 7
ŷ = βˆ0 + βˆ1 x
donde se sabe que los promedios están definidos por
1 6 1 6
x =
n
∑ xi y =
n
∑ yi
n =1 , n =1
32 . 4 44
x = = 5 .4 y = = 7 . 333
6 , 6
los estimadores se definen por
6 6
6 ∑ xi ∑ yi ( 32.4 )( 44 )
∑x y − i i
i =1
6
i =1
246.2 −
6 8.600
βˆ1 = i =1
= = ≈ 1.295
( 32.4 )
2 2
⎛ 6 ⎞ 6.640
6 ⎜ ∑ xi ⎟ 181.6 −
6
∑ x − ⎝ i =1 ⎠
2
i =1
i 6
βˆ0 = y − βˆ1 x
b) Como el coeficiente de determinación se utiliza como medida de eficacia de la regresión, éste se calculará a partir del
cuadrado del coeficiente de correlación.
SS xy
r=
SS xx SS yy
2
⎛ 6
⎞
6
⎜⎜ ∑ xi ⎟
⎟
⎠ = 181.6 − ( 32.4 ) = 6.640
2
SS xx = ∑i =1
x −⎝
i
2 i =1
6 6
2
⎛ 6
⎞
6
⎜⎜ ∑ yi ⎟
⎟
⎠ = 336 − ( 44 ) = 13.333
2
SS yy = ∑i =1
y −⎝
2
i
i =1
6 6
6 6
6 ∑ ∑y xi i
( 32.4 )( 44 )
SS xy = ∑x y −
i =1
i i
i =1
6
i =1
= 246.2 −
6
= 8.6
sustituyendo
PyE_ EF2_TIPO1_2012-2 8
SS xy 8.6
r= = ≈ 0.914
SS xx SS yy ( 6.640 )(13.333)
entonces el coeficiente de determinación es
( 8.6 )
2
SS xy2
r 2 = R2 = = ≈ 0.835
( ( 6.640 )(13.333) )
2
SS xx SS yy
Del resultado anterior, se puede observar y concluir, que el coeficiente de determinación es r 2 ≈ 0.835 , esto es,
83.5 % y no es tan cercano al 100%, por lo que se considera que el modelo lineal es suficiente para esta muestra de
exámenes.
c) Si x= 4.9 entonces
yˆ = 1.295 ( 4.9 ) + 0.339 = 6.685
Esto es, si un alumno obtiene una calificación de 4.9 en el examen diagnóstico se esperaría que su calificación en
Matemáticas I sea de 6.69
PyE_ EF2_TIPO1_2012-2 9
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO
FACULTAD DE INGENIERÍA
DIVISIÓN DE CIENCIAS BÁSICAS
COORDINACIÓN DE CIENCIAS APLICADAS
DEPARTAMENTO DE PROBABILIDAD Y ESTADÍSTICA
PRIMER EXAMEN FINAL
RESOLUCIÓN
SEMESTRE 2013 ‐ 1 TIPO 1
DURACIÓN MÁXIMA 2.0 HORAS 29 DE NOVIEMBRE DE 2012
NOMBRE__________________________________________________________________________________________
Apellido paterno Apellido materno Nombre (s) Firma
Problema 1
En la tabla siguiente se presentan los ingresos familiares en miles de pesos, en las áreas metropolitanas más grandes del
país.
Intervalo de clase Frecuencia
1‐4 14
5‐8 18
9‐12 12
13‐16 16
17‐20 20
a) Bosquejar la ojiva.
b) Obtener la media, la mediana y la moda.
c) A partir del resultado obtenido en el inciso b), determinar el tipo de sesgo de la distribución de los datos. Justificar su
respuesta.
d) Calcular el coeficiente de variación.
15 Puntos
Resolución
a) La tabla de distribución de frecuencias es
Clase Límites Fronteras Marcas de Frecuencia Frecuencia Frecuencia Frecuencia
Clase Absoluta Relativa Acumulada Acumulada
(xi) (fi) (f*i) (Fi) Relativa
(F*i)
1 1 ‐ 4 0.5 ‐ 4.5 2.5 14 0.175 14 0.175
2 5 ‐ 8 4.5 – 8.5 6.5 18 0.225 32 0.400
3 9 ‐ 12 8.5 – 12.5 10.5 12 0.150 44 0.550
4 13 ‐ 16 12.5 – 16.5 14.5 16 0.200 60 0.750
5 17 ‐ 20 16.5 – 20.5 18.5 20 0.250 80 1
PyE_ EF1_TIPO1_2013-1 1
b) La media se define por
∑ ∑x f
m m
1
X = xi f i = i i
*
n i =1 i =1
al sustituir, se tiene
1 880
x= ⎡( 2.5 )(14 ) + ... + (10.5 )(12 ) ⎤⎦ = = 11
80 ⎣ 80
La moda también puede aproximarse utilizando la marca de clase de intervalo con frecuencia máxima
Δ1
x mo = Frinf eriorclase mod al + c
Δ1 + Δ 2
4
con los valores respectivos x mo = 16.5 + ( 4 ) = 17.167
4 + 20
La mediana es el valor que divide en dos partes iguales a la muestra, entonces se realiza una interpolación lineal como
Fronteras Frecuencia Acumulada
Relativa (F*i)
8.5 32/80
x% 40/80
12.5 44/80
44 32
−
y1 − y 0 80 80 = 3 = 0.038
La pendiente dados dos puntos es m = =
x1 − x 0 12.5 − 8.5 80
y − y 0 = m ( x − x0 )
la ecuación de la recta es 44 3
y− = ( x − 12.5 )
80 80
entonces
40 44
− =
80 80 80
3
( x% − 12.5 )
4
se tiene la mediana x% = 12.5 − = 11.167
3
PyE_ EF1_TIPO1_2013-1 2
c) El sesgo se puede determinar en este caso de forma empírica, ya que,
x = 11 x% = 11.167 x mo = 17.167
S n −1
d) El coeficiente de variación está definido por C V =
X
para lo cual se requiere de la variancia de la muestra, entonces de la definición para datos agrupados, se tiene
∑ (X
5
1
)
2
S n2− 1 = −X fi
n −1
i
m =1
al sustituir en la variancia muestral, se tiene
1 ⎡ 2700
( 2.5 − 11 ) (14 ) + ... + (18.5 − 11) ( 20 ) ⎤⎦ =
2 2
s n2 −1 = = 34.177
79 ⎣ 79
34.177
por lo que el coeficiente de variación es cv = = 0.531
11
Problema 2
Un alumno contesta una pregunta que ofrece cuatro soluciones posibles en un examen de opción múltiple. Supóngase
que la probabilidad de que el alumno conozca la respuesta correcta es 0.8 y la probabilidad de que tenga que contestar al
azar es de 0.2. Si el alumno contesta correctamente la pregunta, ¿cuál es la probabilidad de que efectivamente conozca
la respuesta correcta?
15 Puntos
Resolución
Sean los eventos:
A el alumno contesta correctamente la pregunta.
B el alumno conoce la respuesta correcta.
Del enunciado
P ( B ) = 0.8
P ( B ) = 0.2
P (A B) = 1
P ( A B ) = 0.25
de acuerdo con los eventos, se pide calcular P ( B A ) , del Teorema de Bayes, se tiene
P(A∩ B) P (B ) P ( A B ) P (B ) P ( A B )
P (B A) = = =
P ( A) P ( A) P (B ) P ( A B ) + P (B ) P ( A B )
sustituyendo
( 0.8 )(1 )
P (B A) =
0.8
= ≈ 0.941
( 0.8 )(1) + ( 0.2 )( 0.25 ) 0.85
PyE_ EF1_TIPO1_2013-1 3
Problema 3
Si X denota el tiempo de digestión (medido en horas) de una comida. Entonces X es una variable aleatoria. Supóngase
que su función de densidad es
⎧⎪9 x e − 3 x ; x≥0
fX ( x) = ⎨
⎪⎩ 0 ; en otro caso
a) Determinar la función distribución acumulativa y usarla para determinar la probabilidad de que la comida sea
completamente digerida cuando mucho en dos horas.
b) ¿Cuál es la probabilidad de que el tiempo para digerir toda la comida tome más de tres horas?
c) ¿Cuál es el tiempo promedio de digestión de una comida?
15 Puntos
Resolución
a) La función de distribución acumulativa se define por
∫
x
FX ( x ) = f X ( t ) dt
−∞
al sustituir en la función de densidad e integrando por partes, se tiene
x
⎡ −t ⎤
∫ ∫
x x
1
FX ( x ) = 9t e − 3t dt = 9 t e− 3t dt = 9 ⎢ e −3t − e −3t ⎥ =
0 0 ⎣ 3 9 ⎦ 0
x
⎡ 1⎤
FX ( x ) = −3 e−3t ⎢t + ⎥ = 1 − 3xe −3 x − e −3 x
⎣ 3⎦ 0
por lo tanto la función está dada por
⎧ 0 ; x<0
FX ( x ) = ⎨ −3 x −3 x
⎩1 − 3 xe − e ; x≥0
La probabilidad de que la comida sea digerida en máximo dos horas, es
P ( X < 2 ) = FX ( 2 ) = 1 − 3 ( 2 ) e
−3(2 ) −3(2 )
−e = 1 − 6 e − 6 − e − 6 = 1 − 7 e − 6 ≈ 0.983
b) Se pide calcular la probabilidad de, usando la función acumulativa y sus propiedades
P ( X > 3 ) = 1 − P ( X ≤ 3 ) = 1 − F X ( 3 ) = 1 − ⎡1 − 3 ( 3 ) e ( ) − e ( ) ⎤ =
−3 3 −3 3
⎣ ⎦
−9 −9 −9
= 1 − 1 + 9 e + e = 10 e ≈ 0.0012
c) El tiempo promedio de digestión está dado por el valor esperado, que se define por
∞
E (X ) =
∫ −∞
x f X ( x ) dx si existe
al sustituir
∞ ∞
E (X ) =
∫ 0
(
x 9 xe − 3 x dx = 9 ) ∫ 0
x 2 e − 3 x dx
se tiene una integral impropia y se resuelve por partes, entonces
R R
⎡ x 2 −3 x 2 x −3 x 2 −3 x ⎤ ⎡ ⎛ 2 2 x 2 ⎞⎤
∫
R
E ( X ) = 9 lím x e2 −3 x
dx = 9 lím ⎢ − e − e − e ⎥ = − 3 lím ⎢ e − 3 x ⎜ x + 3 + 9 ⎟⎥
R→∞ 0 R→∞
⎣ 3 9 27 ⎦ R→∞
⎣ ⎝ ⎠⎦
0 0
PyE_ EF1_TIPO1_2013-1 4
R
⎡1 ⎤
⎣
R →∞ 9
( )
E ( X ) = −3 lím ⎢ e−3 x 9 x 2 + 6 x + 2 ⎥
⎦
1
( ) 1 2
= − lím ⎡e −3 R 9 R 2 + 6 R + 2 − 2 ⎤ = − ( 0 − 2 ) =
3 R →∞ ⎣ ⎦ 3 3
0
Problema 4
Se sabe que el 7% de los paquetes que se envían de una ciudad a un algún destinatario se pierden y nadie se hace
responsable. Una persona tiene dos libros que desea enviar cuyo costo es de $20.00 por cada uno. El costo del envío por
un paquete con los dos libros es de $5.20 pero si los envía por separado cada paquete tiene un costo de $3.30. El señor
desea minimizar el valor esperado de su desembolso que es el gasto del correo más la posible pérdida. ¿Qué es mejor,
enviar los libros en un solo paquete o separados?
15 Puntos
Resolución
Sea X la variable aleatoria el gasto de envío más la posible pérdida. La función de distribución de probabilidad para
enviar un solo paquete
X fX (x)
No se pierde 5.2 0.93
Se pierde 45.20 0.07
Para este caso el valor esperado es
La función de distribución de probabilidad para enviar dos paquetes es
Paquetes
X fX (x)
perdidos
0 6.6 0.8649
1 26.6 0.1302
2 46.6 0.0049
Para este caso el valor esperado es
Las probabilidades para este caso se obtuvieron aplicando una función de distribución binomial porque es independiente,
entonces
⎛n⎞
f ( x ) = ⎜ ⎟ p x q n− x
⎝ x⎠
⎛ 2⎞ 2− 0
f ( x ) = ⎜ ⎟ ( 0.07 ) ( 0.93) = (1)( 0.07 ) ( 0.93) = 0.8649
0 0 2
⎝0⎠
⎛ 2⎞ 2−1
f ( x ) = ⎜ ⎟ ( 0.07 ) ( 0.93) = ( 2 )( 0.07 )( 0.93) = 0.1302
1
⎝1⎠
⎛ 2⎞
f ( x ) = ⎜ ⎟ ( 0.07 ) ( 0.93) = (1)( 0.07 ) ( 0.93) = 0.0049
2 0 2 0
⎝ 2⎠
PyE_ EF1_TIPO1_2013-1 5
Problema 5
Sea X la temperatura ambiente (en °C) y Y el tiempo (en minutos), requeridos para que el motor diesel de una
camioneta esté listo para ponerla en movimiento. Supóngase que la densidad conjunta de X y Y está dada por
⎧ 1
⎪
f XY ( x, y ) = ⎨ 6640
( 4 x + 2 y + 1) ; 0 ≤ x ≤ 40 , 0 ≤ y ≤ 2
⎪
⎩ 0 ; en otro caso
a) Determinar la probabilidad de que en un día seleccionado aleatoriamente la temperatura ambiente sea mayor a 20°C
y se requiera por lo menos un minuto para poner en movimiento la camioneta.
b) ¿Son independientes X y Y ? Justifique la respuesta sobre bases matemáticas.
15 Puntos
Resolución
a) Del enunciado se pide calcular
40
∫ ∫ ∫ ( 2x )
2 40 2
1 1
P ( X > 20 , 1 ≤ Y ≤ 2 ) = ( 4 x + 2 y + 1) dxdy = 2
+ 2 xy + x dy =
1 20 6640 6640 1 20
6640 ∫
( 2 ( 40) ) ∫
2 2
1 1
+ 2 ( 40 ) y + 40 − 2 ( 20 ) − 2 ( 20 ) y − 20 dy = ( 2420 + 40 y ) dy =
2 2
=
1 6640 1
1
( ) 1
( ( 2420 )( 2 ) + ( 20 )( 4 ) − 2420 − 20 ) =
2480
2
= 2420 y + 20 y 2 = ≈ 0.3735
6640 1 6640 6640
b) Las variables aleatorias conjuntas son independientes, si cumple con
f XY ( x, y ) = f X ( x ) fY ( y )
o bien,
fX Y ( X Y ) = fX ( x)
o bien
fY X ( Y X ) = f Y ( y )
Entonces al calcular las funciones marginales, de la definición
∞
fX ( x) =
∫ −∞
f XY ( x, y ) dy
∞
fY ( y) = ∫ f XY ( x, y ) dx
−∞
sustituyendo
∫
2
1 1 1
fX ( x) = ( 4 x + 2 y + 1) dy = [8 x + 6 ]
2
⎡⎣ 4 xy + y 2 + y ⎤⎦ =
0 6640 6640 0 6640
⎧ 1
⎪
f X ( x ) = ⎨ 6640
[8 x + 6] ; 0 ≤ x ≤ 40
⎪
⎩ 0 ; en otro caso
∫
40
1 1 1
fY ( y ) = ( 4 x + 2 y + 1) dx = [80 y + 3240]
40
⎡ 2 x 2 + 2 xy + x ⎤⎦ =
0 6640 6640 ⎣ 0 6640
⎧ 1
⎪
fY ( y ) = ⎨ 6640
[80 y + 3240] ; 0 ≤ x ≤ 2
⎪
⎩ 0 ; en otro caso
sustituyendo en la condición
PyE_ EF1_TIPO1_2013-1 6
( 4 x + 2 y + 1) ≠ ⎛⎜ [8 x + 6] ⎞⎟ ⎛⎜ 6640 [80 y + 3240] ⎞⎟
1 1 1
6640 ⎝ 6640 ⎠⎝ ⎠
Por lo tanto, las variables aleatorias conjuntas no son independientes.
Problema 6
Se debe colocar un cordón de soldadura a 40 piezas. Basado en su experiencia, un soldador sabe que el tiempo promedio
requerido para colocar el cordón de soldadura en una de las piezas es de 5 minutos y su desviación estándar es de 3
minutos. El soldador comienza a aplicar los cordones a las 6:00 p.m. y sabe que el valor medio de aplicación de los 40
cordones debe ser de máximo 4.5 minutos, si desea colocar todos los cordones de soldadura antes de las 9:00 p.m. (hora
de término de su turno de trabajo). ¿Cuál es la probabilidad de que el soldador termine de colocar los 40 cordones antes
de que termine su turno de trabajo?
15 Puntos
Resolución
Sea X la variable aleatoria que representa el tiempo para colocar el cordón de soldadura a una pieza, entonces X tiene
un promedio de 5 minutos y desviación estándar de 3 minutos, no se especifica qué distribución tiene, pero es una
muestra grande.
Se pide calcular para que en promedio las 40 piezas, cada una tarde a lo más 4.5 minutos, con X 1 , X 2 , X 3 , ..., X 40 por lo
que, se pide calcular P ( X < 4.5)
Por el Teorema del Límite Central
⎛ σ 2 32 ⎞
X ~ Normal ⎜ μ X = μ X = 5 min , σ X2 = X = ⎟
⎝ n 40 ⎠
al realizar cálculos y haciendo la estandarización y al usar la tabla de la distribución acumulativa normal
estándar, se tiene
⎛ ⎞
⎜ X −μ − ⎟ ⎛ ( −0.5) ⎞
P ( X < 4.5 ) ≈ P ⎜
4.5 5
X
< ⎟ = P ⎜ Z < 40
⎜ ⎟ = P ( Z < −1.05 ) = FZ ( −1.05 ) = 0.1469
⎜ σ X
3 ⎟ ⎝ 3 ⎟⎠
⎜ 40 ⎟⎠
⎝ n
Problema 7
El departamento de publicidad de una compañía que fabrica detergentes para trastos desea saber qué tan fuerte es la
relación y el porcentaje de explicación entre las ventas y el número de comerciales televisivos transmitidos por día para
una muestra aleatoria de siete ciudades. Ventas (en cientos de unidades por mes, y); Comerciales (número transmitido
por día x). Se sabe que r 2 = 0.736 , interpretar el resultado.
10 Puntos
Resolución
La relación lineal es relativamente fuerte, según el decisor, r = 0.736 ≈ 0.858 ya que no es tan cercana a uno.
La relación es muy ligera ya que por cada comercial transmitido, y (las ventas) se incrementan ligeramente, además, el
modelo explica el 73.6% de la variabilidad de las ventas, y.
PyE_ EF1_TIPO1_2013-1 7
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO
FACULTAD DE INGENIERÍA
DIVISIÓN DE CIENCIAS BÁSICAS
COORDINACIÓN DE CIENCIAS APLICADAS
DEPARTAMENTO DE PROBABILIDAD Y ESTADÍSTICA
SEGUNDO EXAMEN FINAL
RESOLUCIÓN
NOMBRE_______________________________________________________________________________
Apellido paterno Apellido materno Nombre (s) Firma
Problema 1
La siguiente distribución representan los montos por concepto de carga, adeudados a una compañía americana de 35
facturas.
Intervalos de Clase fi
0.00 ― 0.99 3
1.00 ― 1.99 12
2.00 ― 2.99 12
3.00 ― 3.99 5
4.00 ― 4.99 2
5.00 ― 5.99 1
Calcular el coeficiente de variación y coeficiente de simetría. Interpretar los resultados.
15 Puntos
Resolución
Clase Intervalos Fronteras Marcas Frecuencia
de de de Absoluta
Clase Clase Clase
xi fi xi f i f i (x − x )2 f i (x − x )3
1 0.00‐0.99 ‐0.005‐0.995 0.495 3 1.485 10.031 ‐18.342
2 1.00‐1.99 0.995‐1.995 1.495 12 17.94 8.238 ‐6.826
3 2.00‐2.99 1.995‐2.995 2.495 12 29.94 0.353 0.060
4 3.00‐3.99 2.995‐3.995 3.495 5 17.475 6.861 8.037
5 4.00‐4.99 3.995‐4.995 4.495 2 8.99 9.430 20.477
6 5.00‐5.99 4.995‐5.995 5.495 1 5.495 10.058 31.898
Sumas: 35 81.325 44.971 35.304
S n −1
El coeficiente de variación se define como, siendo adimensional, de forma CV =
X
sustituyendo, la media y la desviación estándar que se definen como
m m
X =
1
n ∑
i =1
f i xi y S n2−1 =
1
n −1 ∑ f (x − x )
i =1
i
2
entonces
6 6
x= 1
35 ∑
i =1
f i xi =
1
35
(81.325 ) = 2.324 y s n2−1 =
1
34 ∑ f (x − x )
i =1
i
2
=
1
34
(44.971) = 1.323
PyE_ EF2_TIPO1_2013-1 1
1.323
cv = = 0.495 entonces 49.5%
2.324
El coeficiente de simetría (o asimetría) es
m
1
n ∑ f (x − x)
i =1
i i
3
a3 =
3
⎛ S2 ⎞
⎜ n −1 ⎟
⎝ ⎠
sustituyendo, se tiene que
1
(35.304 ) 1.009
a3 = 35 = ≈ 0.663
(
1.323
3
)
1.522
El coeficiente de sesgo es positivo, la muestra tiene sesgo a la derecha.
Problema 2
Una empresa comercializadora de artículos electrónicos está considerando comercializar un nuevo modelo de pantalla
LCD. En el pasado, el 40% de los equipos de pantallas que la empresa lanzó al mercado tuvieron éxito y el 60% no fueron
exitosos. Antes de lanzar al mercado el equipo de pantallas LCD, el departamento de investigación de mercados realiza
un extenso estudio y entrega un reporte, ya sea favorable o desfavorable. En el pasado, el 80% de los equipos de
pantalla LCD exitosas habían recibido un reporte de investigación favorable y el 30% de los equipos de pantalla LCD no
exitosos habían recibido un reporte de investigación favorable. Para los nuevos modelos de pantallas LCD bajo
consideración, el departamento de investigación de mercado ha entregado un reporte favorable, ¿cuál es la probabilidad
de que el equipo de pantalla LCD tenga éxito en el mercado?
15 Puntos
Resolución
Sean los eventos
A representa un equipo de pantalla exitoso en el mercado.
B representa el reporte del Departamento de Mercadotecnia es favorable.
Del enunciado
P ( A ) = 0.4
( )
P A = 0.6
P ( B A ) = 0.8
P ( B A ) = 0.3
de acuerdo con los eventos, se pide calcular P ( A B ) , del Teorema de Bayes, se tiene
P(A∩ B) P ( A) P (B A) P ( A) P (B A)
P (A B) = = =
P (B ) P (B ) ( ) (
P ( A) P (B A) + P A P B A )
sustituyendo
( 0.4 )( 0.8 )
P (A B) =
0.32
= = 0.64
( 0.4 )( 0.8 ) + ( 0.6 )( 0.3 ) 0.5
Es decir, la probabilidad de que el equipo de pantalla LCD tenga éxito en el mercado, dado que se recibió un reporte
favorable es de 0.64
PyE_ EF2_TIPO1_2013-1 2
Problema 3
Sea una variable aleatoria discreta con función de probabilidad dada en forma tabular por
X 0 1 2 3 4
fX ( x) 0.10 0.20 0.30 0.25 0.15
a) Obtener una tabla de distribución de probabilidad de la siguiente variable aleatoria Y = X 3 − 4 X 2 + 10
b) Obtener la media y la variancia de la variable Y
15 Puntos
Resolución
a) Al sustituir los valores de X en la función Y , se obtienen los correspondientes valores como
Y ( 0 ) = X 3 - 4 X 2 + 10 ⇒ Y ( 0 ) = 10
Y (1) = X 3 - 4 X 2 + 10 ⇒ Y (1) = 13 - 4 (1) + 10 = 7
2
Y ( 2 ) = X 3 - 4 X 2 + 10 ⇒ Y ( 2 ) = 23 - 4 ( 2 ) + 10 = 2
2
Y ( 3 ) = X 3 - 4 X 2 + 10 ⇒ Y ( 3 ) = 33 - 4 ( 3 ) + 10 = 1
2
Y ( 4 ) = X 3 - 4 X 2 + 10 ⇒ Y ( 4 ) = 43 - 4 ( 4 ) + 10 = 10
2
La función de probabilidad en forma tabular está dada por
Y 1 2 7 10
fY ( y ) 0.25 0.30 0.20 0.25
b) El promedio se define como E (Y ) = ∑ y f ( y)
∀y
Y
al sustituir se tiene
E (Y ) = 1( 0.25 ) + 2 ( 0.30 ) + 7 ( 0.20 ) + 10 ( 0.25 )
E (Y ) = 0.25 + 0.6 + 1.4 + 2.5
E (Y ) = 4.75
La variancia se define por
Var (Y ) = ∑ (Y − μ ) fY ( y ) = E (Y 2 ) − ⎡⎣ E (Y ) ⎤⎦
2 2
∀y
al sustituir se tiene
Var (Y ) = (1 − 4.75 ) ( 0.25 ) + ( 2 − 4.75 ) ( 0.30 ) + ( 7 − 4.75 ) ( 0.20 ) + (10 − 4.75) ( 0.25 ) = 13.687
2 2 2 2
Problema 4
Una muestra aleatoria de 10 observaciones se toma de una población normal con variancia σ 2 = 42.5 Calcular la
probabilidad aproximada de obtener una desviación estándar muestral entre 3.14 y 8.94
10 Puntos
Resolución
Sea pide calcular P ( 3.14 < S < 8.94 ) entonces con n=10 observaciones
⎛ 9 ( 3.14 )2 ( n − 1) S 2 9 ( 8.94 )2 ⎞ ⎛ ( n − 1) S 2 ⎞
(
P ( 3.14 ) < S < ( 8.94 )
2 2 2
) ≈ P⎜
⎜ 42.5
<
σ2
<
42.5
⎟ = P ⎜ 2.088 <
⎟ ⎜
⎝ σ 2 ( )
< 16.925 ⎟ = P 2.088 < Χ 2 < 16.925
⎟
⎠
⎝ ⎠
de tablas de la distribución Ji‐cuadrada con nueve grados de libertad, entonces
PyE_ EF2_TIPO1_2013-1 3
(
P ( 3.14 ) < S 2 < ( 8.94 )
2 2
) = P ( 2.088 < Χ 2
)
< 16.925 = 0.99 − 0.05 ≈ 0.94
Problema 5
Si se ajusta correctamente la sensibilidad de un reflector activado por movimiento, el número promedio de veces por
semana que lo activan ardillas y otros pequeños animales es de 0.5
a) ¿Cuál es el número promedio de veces que esperaría su activación por dichos animales en dos semanas?
b) Si ocurriera la activación por estos animales al menos cinco veces en dos semanas, ¿supondría que es necesario
ajustar la sensibilidad del reflector? Justifique su respuesta con base a la probabilidad.
15 Puntos
Resolución
a) Sea X la variable aleatoria que representa el número de activaciones en una semana.
⎛ 1 número de activaciones ⎞
X ~ Poisson ⎜ λ = ⎟
⎝ 2 una semana ⎠
Se sabe que la media y la variancia de la variable aleatoria con distribución de Poisson es igual con el parámetro
lambda, entonces para dos semanas y debido al proceso de Poisson:
Sea Y la variable aleatoria que representa el número de activaciones en dos semanas, es
⎛ ⎛1⎞ número de activaciones ⎞
Y ~ Poisson ⎜ λ = 2 ⎜ ⎟ =1 ⎟
⎝ ⎝2⎠ dos semanas ⎠
El promedio de activaciones para dos semanas es el valor esperado, entonces
E (Y ) = λ = 1
Lo que significa que se espera una activación en dos semanas, en promedio.
b)
La activación por estos animales al menos cinco veces en dos semanas, la probabilidad a calcular es
P (Y ≥ 5 ) = P (Y = 5 ) + P (Y = 6 ) + ... +
P (Y ≥ 5 ) = 1 − P (Y < 5 ) = 1 − ⎡⎣ P (Y = 0 ) + P (Y = 1) + P (Y = 2 ) + P (Y = 3) + P (Y = 4 ) ⎤⎦
4 −1 y 4
e 1 1
P (Y ≥ 5 ) = 1 − P (Y < 5 ) = 1 − ∑ = 1 − e −1 ∑
y =0 y! y =0 y !
⎡1 1 1 1 1 ⎤ ⎡ 65 ⎤
P (Y ≥ 5 ) = 1 − e −1 ⎢ + + + + ⎥ = 1 − e −1 ⎢ ⎥ ≈ 0.0036
⎣1 1 2 6 24 ⎦ ⎣ 24 ⎦
La probabilidad de que se active el reflector al menos cinco veces es poco probable, tiene mayor probabilidad que se
active a lo más en cuatro veces, por lo cual se requiere un ajuste.
Problema 6
Dos directivos acordaron encontrarse en un restaurante entre las 2:00 y 3:00 p.m. para comer y firmar el acuerdo de su
alianza estratégica. Considérese que X es la hora de llegada del directivo A y Y es la hora de llegada del directivo B.
Además, supóngase que X y Y son independientes y cada una está distribuida uniformemente en el intervalo [2,3].
a) Obtener la función de densidad de probabilidad conjunta de X y Y
b) ¿Cuál es la probabilidad de que ambos directivos lleguen entre las 2:00 y las 2:30 p.m.?
c) Si a las 2:00 p.m., el primer directivo en llegar es B y esperará en el restaurante 15 minutos antes de irse, ¿cuál es la
probabilidad de que ambos directivos coman juntos?
15 Puntos
Resolución
a) Del enunciado X y Y se distribuyen uniformemente en [2,3], por lo tanto sus funciones de densidad están dadas
por
PyE_ EF2_TIPO1_2013-1 4
⎧1 ; 2≤ x≤3
fX ( x) = ⎨
⎩0 ; en otro caso
y
⎧1 ; 2≤ y≤3
fY ( y ) = ⎨
⎩0 ; en otro caso
se sabe que son independientes, entonces debe cumplir con alguna de las condiciones siguientes
f XY ( x, y ) = f X ( x ) fY ( y )
o bien,
fX Y ( X Y ) = fX ( x)
o bien
fY X ( Y X ) = f Y ( y )
al usar las funciones marginales, se tiene
f XY ( x, y ) = (1)(1) = 1
⎧ 1 ; 2≤ x≤3 , 2≤ y≤3
f XY ( x, y ) = ⎨
⎩ 0 ; en otro caso
b) Se pide calcular la probabilidad de que lleguen entre las 2:00 y las 2:30, esto es P ( X < 2.5 , Y < 2.5 )
por lo tanto
P ( X < 2.5 , Y < 2.5 ) = ∫ [ x] 2 [ 2.5 − 2] dy = 0.5∫2
2.5 2.5 2.5 2.5 2.5
∫ dxdy = ∫ dy = ∫
2.5
dy =
2 2 2 2
=0.5 [ y ] = 0.5 ( 2.5 − 2 ) = 0.5 ( 0.5 ) = 0.25
2.5
2
c) La probabilidad de que ambos directivos coman juntos, dado que B llegó a las 2:00 p.m. y solo esperará 15 minutos,
esto es P ( X ≤ 2.5 Y = 2 ) , entonces primero hay que determinar la función condicional dado un valor
⎧ f XY ( x, 2 )
⎪ ; fY ( y ) > 0
fX Y ( X Y ) = ⎨ fY ( 2 )
⎪
⎩ 0 ; en otro caso
sustituyendo
⎧ 1
⎪ 2< x<3
f X Y =2 ( X Y = 2) = ⎨ 1
;
⎪⎩ 0 ; en otro caso
por lo que la probabilidad es
P ( X ≤ 2.5 Y = 2 ) = ∫
2.25
dx = ( x )
2.25
= 2.25 − 2 = 0.25
2 2
por independencia, se sabe que
fX Y ( X Y ) = fX ( x)
entonces al calcular la función marginal de f X ( x ) , se tiene
P ( X ≤ 2.5 Y = 2 ) = ∫
2.25
dx = ( x )
2.25
= 2.25 − 2 = 0.25
2 2
PyE_ EF2_TIPO1_2013-1 5
Problema 7
Las estaturas (en centímetros) y pesos (en kilogramos), de 10 jugadores de baloncesto de un equipo, algunos se
muestran en la tabla.
Estatura (x) 186 189 190 192 193 193 198 201 203 205
Pesos (y) 85 85 86 90 87 91 93 103 100 101
se sabe que
xi yi xi2 yi2 xi yi
Sumas: 1950 921 380618 85255 179971
a) Estimar la recta de regresión por el método de mínimos cuadrados de los pesos en función de la estatura.
b) Calcular el coeficiente de determinación e interpretar el resultado.
c) Obtener el peso estimado de un jugador que mide 208 cm.
15 Puntos
Resolución
a) Como el coeficiente de determinación se utiliza como medida de eficacia de la regresión, éste se calculará a partir del
cuadrado del coeficiente de correlación.
Las medias son
∑
10
∑Y
10
1 1
X = Xi y Y = i
n i =1
n i =1
sustituyendo
1 1
x= (1950 ) = 195 y y= ( 921) = 92.1
10 10
Los parámetros y el modelo, son
ŷ = βˆ1 x + βˆ0
10 10
10 ∑x ∑y i i
(1950 )( 921)
∑x y − i i
i =1
10
i =1
179971 −
10 376
βˆ1 = i =1
= = ≈ 1.022
(1950 )
2 2
⎛ ⎞ 10 368
⎜ ∑ xi ⎟ 380618 −
x 2 − ⎝ i =1 ⎠
10
10
∑i =1
i 10
βˆ0 = y − βˆ1 x
⎛ 376 ⎞
βˆ0 = y − βˆ1 x = 92.1 − ⎜ ⎟ (195 ) ≈ −107.139
⎝ 368 ⎠
por lo tanto el modelo está dado por yˆ = 1.022 x − 107.139
b) Para determinar si el modelo es válido debe obtenerse el coeficiente de determinación.
El coeficiente de correlación, está definido por
SS xy
r=
SS xx SS yy
PyE_ EF2_TIPO1_2013-1 6
2
⎛ ⎞
∑
10
⎜ xi ⎟
⎜ ⎟
∑ ⎠ = 380618 − (1950 ) = 368
10 2
SS xx = x2 − ⎝
i
i =1
10 10
i =1
2
⎛ ⎞
∑
10
⎜ yi ⎟
⎜ ⎟
∑ ⎠ = 85255 − ( 921) = 430.9
10 2
SS yy = y2 − ⎝
i
i =1
10 10
i =1
∑∑
10 10
xi yi
SS xy = xi yi − i =1 i =1
= 179971 −
10 10
i =1
sustituyendo
SS xy 376
r= = ≈ 0.944
SS xx SS yy ( 368)( 430.9 )
entonces el coeficiente de determinación es
( 376 )
2
SS xy2
r =R =
2 2
= ≈ 0.892
SS xx SS yy ( 368)( 430.9 )
Del resultado anterior, se puede observar y concluir, que el coeficiente de determinación es r 2 ≈ 0.892 , esto es, 89.2
% y está poco cercano al 100%, por lo que se considera que el modelo lineal es adecuado para estos datos.
c) Se debe considerar la estatura del jugador como variable x , y el peso como y , entonces la ecuación de regresión que
se calculó es
yˆ = 1.022 x − 107.139
pero la estimación es para un valor fuera del intervalo, por lo que, es incorrecto hacer la estimación de un jugador que
mide 208 cm.
PyE_ EF2_TIPO1_2013-1 7
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO
FACULTAD DE INGENIERÍA
DIVISIÓN DE CIENCIAS BÁSICAS
COORDINACIÓN DE CIENCIAS APLICADAS
DEPARTAMENTO DE PROBABILIDAD Y ESTADÍSTICA
PRIMER EXAMEN FINAL
RESOLUCIÓN
SEMESTRE 2013 ‐ 2 TIPO 1
DURACIÓN MÁXIMA 2.0 HORAS 31 DE MAYO DE 2013
NOMBRE__________________________________________________________________________________________
Apellido paterno Apellido materno Nombre (s) Firma
1. Los datos que se muestran a continuación, representan el costo de energía eléctrica en kW/h durante el mes de
abril del 2013, para una muestra aleatoria de 50 departamentos con dos recámaras en el Distrito Federal.
a) Con los datos agrupados de la muestra, calcular: media, moda, mediana y desviación estándar.
b) Construir el polígono de frecuencias relativas, ubicar en la gráfica las medidas de tendencia central, ¿es posible
determinar la simetría de manera empírica?
20 Puntos
Resolución
a) Para las medidas de tendencia central se sabe que,
∑ ∑
m m
1
La media se define por X = X i fi = X i fi*
n
i =1 i =1
sustituyendo
1 7498
x= ⎡92 ( 4 ) + K + 218 (1) ⎤⎦ = = 149.96
50 ⎣ 50
La moda es la marca de clase con mayor frecuencia absoluta, esto es debido a que es bimodal
134 + 155 289
xmo = 134 , 155 o bien xmo = = = 144.5 o bien
2 2
⎡ a ⎤
xmo = Lx +⎢ ⎥ cxmo
mo _inf ⎣a + b⎦
a = f xmo − f x
mo−1
PYE_ EF1_2013-2 1
b = f xmo − f x
mo+1
f xmo : frecuencia absoluta de la clase que contiene a la mod a.
cmo : Longitud de la clase que contiene a la mod a.
LMo _ inf : Límite inf erior de la clase que contiene a la mod a.
sustituyendo
⎡ 11 − 7 ⎤
xmo = 123.5 + ⎢ ⎥ ( 20 ) = 143.5
⎢⎣ (11 − 7 ) + (11 − 11) ⎥⎦
La mediana es la medida de tendencia central que divide en dos partes iguales a la muestra, entonces
Fri ‐ Frs Fr.Ac.Rel.
144.5 0.44
x% 0.5
165.5 0.66
al hacer la interpolación lineal
y2 − y1 0.66 − 0.44
m= = ≈ 0.0105
x2 − x1 165.5 − 144.5
sustituyendo en la ecuación de una recta dados dos puntos, se tiene
y2 − y1 = m ( x2 − x1 ) con y = 0.5 , x% = mediana
0.5 − 0.44 = 0.0105 ( x% − 144.5 )
por lo que x% = 150.227
La desviación estándar de la muestra, se define como la raíz de la variancia, entonces
∑(
m
Xi − X ) fi
1 2
S 2
n −1 =
n −1
i =1
1 ⎡ 1
( 92 − 149.96 ) ( 4 ) + K + ( 218 − 149.96 ) (1)⎤⎦ = ( 50767.92 ) ≈ 1036.8
2 2
sustituyendo sn2−1 =
49 ⎣ 49
La raíz cuadrada de la variancia muestral está dada por
∑
m
1
( Xi − X )
2
S n −1 = fi S n −1 = 10.36.08 ≈ 32.188
n −1
i =1
que es la desviación estándar muestral, hay mucha variabilidad de la muestra.
b)
PYE_ EF1_2013-2 2
por la posición de las medidas no es posible determinar el sesgo de la muestra de forma empírica, sin embargo,
se puede observar de la gráfica que tiene ligero sesgo negativo.
2. Un alumno contesta una pregunta que ofrece cuatro posibles respuestas en un examen de opción múltiple,
Supóngase que la probabilidad de que el alumno conozca la respuesta correcta es de 0.8 y la probabilidad de que
tenga que contestar al azar es de 0.2. Si el alumno contesta correctamente la pregunta, cuál es la probabilidad de
que conteste aleatoriamente.
15 Puntos
Resolución
Sean los eventos:
A que representa el alumno contesta correctamente.
B que representa el alumno contesta de forma aleatoria.
Del enunciado se pide determinar: P ( B A )
y se tiene que P ( B ) = 0.8 P ( B ) = 0.2 P( A B) = 1 P ( A B ) = 0.25
por el Teorema de Bayes
P ( A ∩ B) P ( B) P ( A B)
P ( B A) = =
P ( A ∩ B) + P ( A ∩ B) P ( B) P ( A B) + P ( B ) P ( A B )
sustituyendo valores
( 0.2 )( 0.25)
P ( B A) =
0.05
= ≈ 0.059
( 0.2 )( 0.25) + ( 0.8)(1) 0.85
3. En un conmutador telefónico de una empresa comercial, el promedio de llamadas que se reciben en horas hábiles
es seis por hora. Determinar la probabilidad de recibir en media hora, entre una y tres llamadas.
15 Puntos
Resolución
Sea X la variable aleatoria que representa el número de llamada que se reciben en una hora en el conmutador.
⎛ llamadas ⎞
X ~ Poisson ⎜ λ = 6
⎝ hora ⎟⎠
para media hora del proceso de Poisson
⎛ llamadas ⎞
X ~ Poisson ⎜ λ = 3
⎝ media hora ⎟⎠
se pide calcular P (1 ≤ X ≤ 3) para lo cual el modelo es
⎧ 3x e −3
⎪ ; x = 0,1, 2,3,...
f X ( x ) = ⎨ x!
⎪ 0
⎩ ; en otro caso
sustituyendo
P (1 ≤ X ≤ 3) = P ( X = 1) + P ( X = 2 ) + P ( X = 3)
∑ ∑
x =3 x =3
3x e −3 −3 3x
P (1 ≤ X ≤ 3) = =e = 12e−3 ≈ 0.597
x! x!
x =1 x =1
PYE_ EF1_2013-2 3
4. Considere la función de densidad conjunta
⎧16 y
⎪ ; x > 2 , 0 < y <1
f XY ( x, y ) = ⎨ x3
⎪ 0
⎩ ; en otro caso
a) Calcular la covarianza. ¿Es determinante el resultado de la covarianza para saber la independencia de las
variables?
b) Determinar si las variables son estadísticamente independientes.
20 Puntos
Resolución
La región de definición es
a) La covariancia se define por
Cov ( X , Y ) = E ([ X − μ X ][Y − μY ]) = E ( XY ) − E ( X ) E (Y )
que es una medida de asociación lineal. Se deben calcular los valores esperados que se requieren, entonces
E ( g ( X ,Y )) =
∫∫ RXY
g ( x, y ) f XY ( x, y ) dR
sustituyendo en cada caso, se tiene
∞ ∞
∫∫ ∫∫ ∫
1 1 1
⎛ 16 y ⎞ ⎛ y2 ⎞ ∞
E ( XY ) = xy ⎜ 3 ⎟dxdy = 16 ⎜ 2 ⎟dxdy = 16 y 2 ⎣⎡ − x −1 ⎦⎤ dy =
0 2
⎝ x ⎠ 0 2 ⎝x ⎠ 0
2
∫ ∫
1 1
⎡ 1⎤ 8 8
( )
1
E XY = −16 y 2 ⎢ 0 − ⎥ dy = 8 y 2 dy = ⎡⎣ y 3 ⎤⎦ =
0
⎣ 2⎦ 0
3 0 3
∞ ∞
∫∫ ∫∫ ∫
1 1 1
⎛ 16 y ⎞ ⎛ y ⎞ ∞
( )
E X = x ⎜ 3 ⎟dxdy = 16 ⎜ x2 ⎟dxdy = 16 y ⎡⎣ − x −1 ⎤⎦ dy =
0 2
⎝ x ⎠ 0 2
⎝ ⎠ 0
2
∫ ∫
1 1
⎡ 1⎤
( )
1
E X = −16 y ⎢ 0 − ⎥ dy = 8 y dy = 4 ⎡⎣ y ⎤⎦ = 4 2
0
⎣ 2⎦ 0
0
∞ ∞
∫∫ ∫∫ ∫
1 1 1 ∞
⎛ 16 y ⎞ ⎛ y2 ⎞ ⎡ x −2 ⎤
( )
E Y = y ⎜ 3 ⎟ dxdy = 16 ⎜ 3 ⎟ dxdy = 16 y ⎢ 2
⎥ dy =
0 2
⎝ x ⎠ 0 2 ⎝x ⎠ 0 ⎣ −2 ⎦ 2
∫ ∫
1 1 1
⎡ 1⎤ ⎡ y3 ⎤ 2
( )
E Y = −8 y 2 ⎢ 0 − ⎥ dy = 2 y 2 dy = 2 ⎢ ⎥ =
0
⎣ 4⎦ 0 ⎣ ⎦0 3
3
sustituyendo en la covariancia se tiene
8 ⎛2⎞
Cov ( X , Y ) = − ( 4) ⎜ ⎟ = 0
3 ⎝3⎠
La covariancia vale cero, pero el resultado No es determinante para concluir si son variables aleatorias
conjuntas independientes.
PYE_ EF1_2013-2 4
b) Para que las variables aleatorias sean conjuntas independiente debe cumplir la condición
f XY ( x, y ) = f X ( x ) fY ( y )
de la condición las funciones marginales, se tiene
∞ ∞
fX ( x) =
∫ −∞
f XY ( x, y ) dy y fY ( y ) =
∫ −∞
f XY ( x, y ) dx
al sustituir
∫
1 1
16 y 16 ⎛ y 2 ⎞ 8
fX ( x) = dy = ⎜ ⎟ = ; x > 2
x3 x3 ⎝ 2 ⎠ 0
x3
0
por lo que
⎧8
⎪ ; x>2
f X ( x ) = ⎨ x3
⎪0
⎩ ; en otro caso
∞ ∞
∫
∞
16 y ⎛ x -2 ⎞ ⎛ 1 ⎞ ⎛ 1⎞
fY ( y ) = dx = 16 y ⎜ ⎟ = -8 y ⎜ 2 ⎟ = -8 y ⎜ 0 - ⎟ = 2 y ; 0 < y < 1
2
x3 ⎝ -2 ⎠ 2
⎝x ⎠ 2 ⎝ 4⎠
⎧2 y ; 0 < y <1
fY ( y ) = ⎨
⎩ 0 ; en otro caso
entonces
f XY ( x, y ) = f X ( x ) fY ( y )
16 y ⎛ 8 ⎞ 16 y
= ⎜ 3 ⎟(2 y) = 3
⎝x ⎠
3
x x
El producto de funciones marginales es igual a la función conjunta, por lo tanto se concluye que son variables
aleatorias conjuntas independientes, la covariancia es igual a cero, no hay asociación lineal, además, el
coeficiente de correlación también es igual a cero.
5. Si la vida media de operación de una pila de linterna es de 24 horas y está distribuida normalmente con una
desviación estándar de tres horas. ¿Cuál es la probabilidad de que una muestra aleatoria de 100 pilas, difiera de la
verdadera media más de 30 minutos?
15 Puntos
Sea X la variable aleatoria que representa la vida media de operación de una pila de linterna.
(
X i ~ Normal μ = 24h , σ X2 = 9h 2
Xi i )
por el teorema del límite central, ya que, es una muestra aleatoria grande 100 pilas, cada una idénticamente
distribuida, se tiene
⎛ σ X2 9h 2 ⎞
X i ~ Normal ⎜ μ = μ = 24h , σ X = 2
= ⎟ i
⎜ X Xi
n 100 ⎟⎠
⎝
se pide calcular
⎛ 1⎞ ⎛ 1⎞ ⎛ 1⎞ ⎛ 1 1⎞
P ⎜ X − μX > ⎟ = P ⎜ X − μX < − ⎟ + P ⎜ X − μX > ⎟ = 1− P ⎜ − < X − μX < ⎟
⎝ 2 ⎠ ⎝ 2 ⎠ ⎝ 2 ⎠ ⎝ 2 2⎠
normalizando y al utilizar tablas de la distribución acumulativa, se tiene
⎛ 1 1 ⎞ ⎛ 1 1 ⎞
⎛ 1⎞ ⎜− X − μ ⎟ ⎜ − ⎟ ⎛ 10 10 ⎞
P ⎜ X − μX > ⎟ ≈ 1− P ⎜ 2 < X
< 2 ⎟ = 1− P ⎜ 2 < Z < 2 ⎟ = 1− P ⎜ − < Z < ⎟
⎝ 2⎠ σ
⎜ X σ X σ X ⎟ ⎜ 3 3 ⎟ ⎝ 6 6⎠
⎜ n ⎟ ⎜ 100 ⎟
⎝ n n ⎠ ⎝ 100 ⎠
⎛ 1⎞
P ⎜ X − μ X > ⎟ = 1 − P ( −1.67 < Z < 1.67 ) = 1 − ⎡⎣ FZ (1.67 ) − FZ ( −1.67 ) ⎤⎦ = 1 − ( 0.9525 − 0.0475 ) = 0.095
⎝ 2⎠
PYE_ EF1_2013-2 5
6. Los siguientes datos (x, y) representan el precio por litro de leche y la venta semanal de leche en miles de litros,
respectivamente, con una muestra de diez observaciones, se obtuvieron los siguientes datos:
(13, 10), (20, 6), (17, 5), (15, 12), (16, 10), (12, 15), (16, 5), (14, 12), (10, 17) y (11, 20)
a) Interpretar el coeficiente de determinación.
b) Estimar la venta semanal en miles de litros de leche para un precio de $18
15 Puntos
Resolución
a) El precio de venta por cada litro de leche, explica muy ligeramente las ventas semanales de leche y el modelo,
ya que es el 74.56% que es bajo.
b) El precio es $18 por litro de leche, sí está en el intervalo por lo cual se puede usar la recta para estimar las
ventas semanales de dicho producto, por lo que
)
y = −1.454 x + 32.136
sustituyendo
)
y = −1.454 (18 ) + 32.136 = 5.964
PYE_ EF1_2013-2 6
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO
FACULTAD DE INGENIERÍA
DIVISIÓN DE CIENCIAS BÁSICAS
COORDINACIÓN DE CIENCIAS APLICADAS
DEPARTAMENTO DE PROBABILIDAD Y ESTADÍSTICA
SEGUNDO EXAMEN FINAL
RESOLUCIONES
SEMESTRE 2013 ‐ 2 TIPO 1
DURACIÓN MÁXIMA 2.0 HORAS 7 DE JUNIO DE 2013
NOMBRE__________________________________________________________________________________________
Apellido paterno Apellido materno Nombre (s) Firma
1. Las gráficas muestran el tiempo de respuesta en segundos por cliente que tienen 40 servidores de la marca IBT.
a) Obtener media y variancia de la muestra.
b) Calcular de manera aproximada: la moda, la mediana y el sesgo.
c) Si el tiempo promedio de respuesta para 40 servidores de la marca DELLA fue de 403 y con una desviación
estándar de 119 segundos, ¿cuál de las dos marcas de servidores presenta mayor variabilidad de los datos?
Justificar su respuesta.
20 Puntos
Resolución
a) Para la media, de la gráfica se observa que
∑ ∑
m m
1
La media se define por X = X i fi = X i fi*
n
i =1 i =1
sustituyendo
x = ⎡⎣726.5 ( 0.1) + K + 746.5 ( 0.1) ⎤⎦ = 736.6
La variancia muestral, es el segundo momento con respecto de su media
∑
m
1
( Xi − X )
2
S 2
n −1 = fi
n −1
i =1
PyE_ EF2_TIPO1_2013-2 1
sustituyendo
1 ⎡ 1
( 726.5 − 736.6 ) ( 4 ) + K + ( 746.5 − 736.6 ) ( 4 )⎤⎦ = (1279.6 ) ≈ 32.81
2 2
sn2−1 =
39 ⎣ 39
b) La moda es la marca de clase con mayor frecuencia relativa
xmo = 734.5
otra forma de calcular la moda es
⎡ a ⎤
xmo = Lx +⎢ ⎥ cxmo
mo _inf
⎣a + b⎦
a = f xmo − f x
mo−1
b = fx
mo−inf
∑( ∑(
m m
Xi − X ) f i Xi − X ) fi *
1 3 3
n
a3 = i =1
= i =1
( Sn −1 ) ( Sn −1 )
3 3
sustituyendo
1 ⎡
( 726.5 − 736.6 ) ( 4 ) + K + ( 746.5 − 736.6 ) ( 4 )⎦⎤ − 4.398
3 3
⎣
a3 = 40 = ≈ − 0.023 < 0
( ) ( 5.728)
3 3
32.81
c) Para hacer la comparación y tomar una decisión, al utilizar el coeficiente de variación
Sn −1
CV =
X
119
para DELLA el coeficiente de variación es cvDELLA = ≈ 0.295
403
5.728
para IBT el coeficiente de variación es cvIBT = ≈ 0.008
736.6
La marca DELLA tiene menor promedio y mayor variabilidad. La marca IBT mayor promedio y menor
variabilidad, es mejor la marca IBT, tiene menor variabilidad.
PyE_ EF2_TIPO1_2013-2 2
2. En la siguiente figura se presenta la función de densidad de la variable aleatoria continua. Calcular la media y la
variancia.
15 Puntos
Resolución
La media es igual a cero la abscisa del centroide, matemáticamente se tiene
∞
E(X ) =
∫ −∞
x f X ( x ) dx
0 2
−0.25 3
∫ ∫
0 2
0.25 3
E(X ) = x ( −0.25 x ) dx + x ( 0.25 x ) dx = ⎡x ⎤ + ⎡x ⎤ =0
−2 0 3 ⎣ ⎦ −2 3 ⎣ ⎦ 0
La variancia es el segundo momento con respecto de la media, entonces
∞
Var ( X ) = E ⎡( X − μ ) ⎤ =
∫ ( X − μ ) f ( x ) dx
2 2
⎣ ⎦ −∞
X
⎦ ∫ ( ∫ ( x ) ( −0.25x ) dx + ∫
0 2
Var ( X ) = E ⎡( X − 0 ) ⎤ = x − 0 ) f ( x ) dx = ( x ) ( 0.25 x ) dx
2 2 2 2
⎣ −∞
X
−2 0
−0.25
∫ x dx + 0.25∫ x dx = 4 ⎡⎣ x ⎤⎦ + 4 ⎡⎣ x ⎤⎦
0 2
0.25
Var ( X ) = −0.25
0 2
3 3 4 4
−2 0 −2 0
1 ⎡ 1 16 16
Var ( X ) = − − ( −2 ) ⎤ + ⎡ ( 2 ) ⎤ = + = 2
4 4
16 ⎣ ⎦ 16 ⎣ ⎦ 16 16
3. Una moneda corriente se lanza 14 veces. Determinar la probabilidad de que:
a) el número de caras que salga esté entre cinco y ocho, inclusive;
b) la primera cruz aparezca en el quinto lanzamiento; y
c) la tercera cara aparezca en el octavo lanzamiento.
15 Puntos
Resolución
a) Sea X la variable aleatoria que representa el número de caras que se pueden tener en el lanzamiento de la
moneda legal.
⎛ 1⎞
X ~ Binomial ⎜ n = 14 , p = ⎟
⎝ 2⎠
⎧⎛ 14 ⎞ ⎛ 1 ⎞ x ⎛ 1 ⎞14 − x
⎪ ; x = 0,1, 2,...,14
f X ( x ) = ⎨⎜⎝ x ⎟⎠ ⎜⎝ 2 ⎟⎠ ⎜⎝ 2 ⎟⎠
⎪
⎩ 0 ; en otro caso
14 − x
⎛ 14 ⎞ ⎛ 1 ⎞ ⎛ 1 ⎞
x
∑
8
P ( 5 ≤ X ≤ 8) = P ( X = 5) + P ( X = 6 ) + P ( X = 7 ) + P ( X = 8) = ⎜ ⎟⎜ ⎟ ⎜ ⎟ ≈ 0.6982
x =5 ⎝ x ⎠⎝ 2 ⎠ ⎝ 2 ⎠
PyE_ EF2_TIPO1_2013-2 3
También se puede resolver aproximando de normal a binomial, entonces
⎛ 1⎞
X ~ Binomial ⎜ n = 14 , p = ⎟
⎝ 2⎠
como np = 7 > 5 es aceptable la aproximación, entonces
⎛ 14 ⎞
Y ~ Normal ⎜ μY = np = 7 , σ Y2 =npq = = 3.5 ⎟
⎝ 4 ⎠
⎛ 5 − np − 0.5 Y − μY 8 − np + 0.5 ⎞ ⎛ 5 − 7 − 0.5 Y − μY 8 − 7 + 0.5 ⎞
P ( 5 ≤ Y ≤ 8) ≈ P ⎜ ≤ ≤ ⎟ = P⎜ ≤ ≤ ⎟
⎜ npq σY npq ⎟⎠ ⎝ 3.5 σY 3.5 ⎠
⎝
P ( 5 ≤ X ≤ 8 ) ≈ P ( −1.34 ≤ Z ≤ 0.80 ) = FZ ( 0.80 ) − FZ ( −1.34 ) = 0.7881 − 0.0901 = 0.6980
que es muy buena aproximación.
b) Sea U la variable aleatoria que representa la primera águila se pueda obtener en el quinto lanzamiento.
⎛ 1⎞
U ~ Geométrica ⎜ p = ⎟
⎝ 2⎠
⎧⎛ 1 ⎞⎛ 1 ⎞u −1
⎪ ; u = 1, 2,...,14
fU ( u ) = ⎨⎜⎝ 2 ⎟⎜ ⎟
⎠⎝ 2 ⎠
⎪
⎩ 0 ; en otro caso
4
1⎛1⎞ 1
P (U = 5 ) = ⎜ ⎟ = ≈ 0.0312
2⎝ 2⎠ 32
c) Sea T la variable aleatoria que representa la tercera cara pueda aparecer en el octavo lanzamiento.
⎛ 1⎞
T ~ Pascal ⎜ r=3 , p = ⎟
⎝ 2⎠
⎧⎛ 7 ⎞ ⎛ 1 ⎞3 ⎛ 1 ⎞t −3
⎪ t = 3, 4,...,8
fT ( t ) = ⎨⎜⎝ 2 ⎟⎠ ⎜⎝ 2 ⎟⎠ ⎜⎝ 2 ⎟⎠
;
⎪
⎩ 0 ; en otro caso
⎛7⎞⎛ 1 ⎞ ⎛ 1 ⎞ ⎛7⎞⎛ 1 ⎞ ⎛ 1 ⎞
3 5 3 5
21
P (T = 8 ) = ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ = ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ = ≈ 0.0820
⎝ ⎠⎝ ⎠ ⎝ ⎠ ⎝ ⎠⎝ ⎠ ⎝ ⎠
2 2 2 2 2 2 256
PyE_ EF2_TIPO1_2013-2 4
b) Se pide determinar
P ( X = 4, Y ≥ 1) = f XY ( 4,1) + f XY ( 4,3) = 0.15 + 0.11 = 0.26
c) Se pide determinar
P ( X + Y ≥ 3) = f XY ( 2,1) + f XY ( 2,3) + f XY ( 4,1) + f XY ( 4,3) = 0.14 + 0.20 + 0.15 + 0.11 = 0.60
5. En la UNAM, la media de edad de los estudiantes es de 22.3 años y la desviación estándar de cuatro años, se toma
una muestra aleatoria de 64 estudiantes, ¿cuál es la probabilidad que la edad promedio de estos estudiantes sea a
lo más de 22 años? ¿cuál es la probabilidad de que la edad promedio de estos estudiantes sea mayor de 23 años?
15 Puntos
Resolución
Sea X la variable aleatoria que representa la edad de los estudiantes de la UNAM.
(
X i ~ Normal μ X = 22.3 , σ X2 i = 16
i
) ; i = 1, 2,3,..., 64
por el teorema del límite central, ya que, es una muestra aleatoria grande 64 estudiantes, cada uno idénticamente
distribuido, se tiene
⎛ σ X2 16 ⎞
X ~ Normal ⎜ μ = μ X = 22.3 , σ X2 = i = ⎟
⎜ X i n 64 ⎟⎠
⎝
se pide calcular y al normalizar, se tiene
⎛ ⎞
⎜ ⎟
− μ 22 − 22.3 ⎟ ⎛ 8 ( −0.3) ⎞ ⎛ −2.40 ⎞
P ( X < 22 ) ≈ P ⎜
X
X
< = P⎜ Z < ⎟⎟ = P ⎜ Z < = P ( Z < −0.60 )
⎜ σX 4 ⎟ ⎜
⎝ 4 ⎠ ⎝ 4 ⎟⎠
⎜⎜ i
⎟
⎝ n 64 ⎟⎠
al utilizar tablas de la distribución acumulativa, se tiene
P ( Z < −0.60 ) = FZ ( −0.60 ) = 0.2743
También se pide calcular
⎛ ⎞
⎜ ⎟
X − μ X 23 − 22.3 ⎟ ⎛ 8 ( 0.7 ) ⎞ ⎛ 5.60 ⎞
P ( X > 23) ≈ P ⎜ > = P⎜ Z > ⎟⎟ = P ⎜ Z > = P ( Z > 1.40 )
⎜ σX 4 ⎟ ⎜
⎝ 4 ⎠ ⎝ 4 ⎟⎠
⎜⎜ i
⎟
⎝ n 64 ⎟⎠
al utilizar tablas de la distribución acumulativa, se tiene
P ( Z > 1.40 ) = P ( Z < −1.40 ) = 0.0808
Por la simetría de la distribución normal estándar con respecto de su media que es cero.
6. En un centro de cómputo se ha observado que el crecimiento de la información almacenada en los últimos seis
meses ha ido aumentando su tamaño de acuerdo a la siguiente secuencia por mes: 50GB, 100GB, 110GB, 125GB,
170GB y 180GB.
a) Hacer la gráfica de dispersión.
b) Obtener la recta de regresión por el método de mínimos cuadrados.
c) ¿Se podría afirmar que el ritmo de crecimiento de la información lleva una tendencia lineal? Justificar su
respuesta.
20 Puntos
PyE_ EF2_TIPO1_2013-2 5
Resolución
a)
b)
Crecimiento
de la
Meses Información
x y xy x2 y2
1 50 50 1 2500
2 100 200 4 10000
3 110 330 9 12100
4 125 500 16 15625
5 170 850 25 28900
6 180 1080 36 32400
21 735 3010 91 101525
Las medias son
1 6 1 6
X= ∑ xi
n i =1
sustituyendo x= ∑ 21 = 3.5
6 i =1
6 6
∑ yi ∑ 735 = 122.5
1 1
Y= sustituyendo y=
n i =1 6 i =1
Los parámetros y el modelo, son
ŷ = βˆ0 + βˆ1 x
PyE_ EF2_TIPO1_2013-2 6
6 6
6 ∑ xi ∑ yi ( 21)( 735)
∑x y − i i
i =1
6
i =1
3010 −
6 437.5
βˆ1 = i =1
= = ≈ 25
( 21)
2 2
⎛ 6 ⎞ 17.5
⎜ ∑ xi ⎟ 91 −
x − ⎝ i =1 ⎠
6
6
∑
i =1
2
i 6
βˆ0 = y − β1 x
ˆ
βˆ0 = y − βˆ x = 122.5 − 25 ( 3.5 ) = 35
1
por lo tanto el modelo está dado por
yˆ = 35 + 25 x
c) Para determinar si el modelo es válido debe obtenerse el coeficiente de determinación.
El coeficiente de correlación, está definido por
SS xy
R=
SS xx SS yy
2
⎛ ⎞
∑
6
⎜ xi ⎟
⎜ ⎟
∑ ⎠ = 91 − ( 21) = 17.5
6 2
SS xx = x2 − ⎝
i
i =1
6 6
i =1
2
⎛ ⎞
∑
6
⎜ yi ⎟
⎜ ⎟
∑ ⎠ = 101525 − ( 735 ) = 11487.5
6 2
SS yy = y −⎝
2
i
i =1
6 6
i =1
∑∑
6 6
xi yi
SS xy = xi yi − i =1 i =1
= 3010 −
6 6
i =1
sustituyendo
437.5
r= ≈ 0.9758
(17.5)(11487.5 )
que es el coeficiente de correlación, es fuerte la asociación lineal de las variables. Hay una tendencia lineal
fuerte.
Entonces el coeficiente de determinación es, elevando al cuadrado el coeficiente de correlación
SS xy2
R2 =
SS xx SS yy
PyE_ EF2_TIPO1_2013-2 7
sustituyendo
( 437.5 )
2
r 2
= ≈ 0.9522
(17.5)(11487.5)
El modelo explica bien a la variable dependiente que es 95.22% se puede considerar válido el modelo.
Del coeficiente de determinación 0.9522 se puede decir que hay una buena explicación del crecimiento de la
información conforme pasan los meses. Es buena la eficiencia del modelo lineal.
PyE_ EF2_TIPO1_2013-2 8
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO
FACULTAD DE INGENIERÍA
DIVISIÓN DE CIENCIAS BÁSICAS
COORDINACIÓN DE CIENCIAS APLICADAS
DEPARTAMENTO DE PROBABILIDAD Y ESTADÍSTICA
PRIMER EXAMEN FINAL
RESOLUCIÓN
NOMBRE__________________________________________________________________________________________
Apellido paterno Apellido materno Nombre (s) Firma
Instrucciones: Leer detenidamente los siete enunciados y resolver seis de los siete problemas
propuestos.
1. Una empresa de elementos prefabricados de madera procedió a clasificar los excedentes de una muestra
aleatoria de bastidores de una pulgada de espesor, por su longitud en centímetros. Los resultados se
muestran en la siguiente tabla de distribución de frecuencias:
Frontera Frontera
Frecuencia
inferior superior
absoluta (fi)
(LRi) (LRs)
a) Calcular la media, la mediana y la
24.5 32.5 2 moda.
32.5 40.5 4
40.5 48.5 8 b) Determinar el sesgo de la
48.5 56.5 10 distribución de los datos.
56.5 64.5 9
64.5 72.5 6
72.5 80.5 1
Resolución
a)
La tabla de distribución de frecuencias queda dada como:
Frontera Inferior Frontera Superior Marcas de Clase Frecuencia Absoluta Frecuencia Relativa Frecuencia Acumulada Absoluta Frecuencia Acumulada Relativa
2 3
LRi LRs xi fi fi* Fi Fi* xifi* (xi-media) fi (xi-media) fi*
24.5 32.5 28.5 2 0.05 2 0.05 1.425 1190.720 -726.339
32.5 40.5 36.5 4 0.1 6 0.15 3.650 1075.840 -441.094
40.5 48.5 44.5 8 0.2 14 0.35 8.900 564.480 -118.541
Clase mediana 48.5 56.5 52.5 10 0.25 24 0.6 13.125 1.600 -0.016
y clase modal 56.5 64.5 60.5 9 0.225 33 0.825 13.613 519.840 98.770
64.5 72.5 68.5 6 0.15 39 0.975 10.275 1460.160 569.462
72.5 80.5 76.5 1 0.025 40 1 1.913 556.960 328.606
Sumas 40 52.900 5369.600 -289.152
Media 11.734 -0.179
D.Est.Muestral Sesgo <0
La media, está definida por:
1 m m
X X i f i X i f i *
n i 1 i 1
PYE_ EF1_2014-1 1
1 7 7
x
n i 1
x f
i i
i 1
xi fi * 52.9
b f xmo f x
mo1
f xmo : frecuencia absoluta de la clase que contiene a la mod a.
cmo : Longitud de la clase que contiene a la mod a.
LMo _ inf : Límite inf erior de la clase que contiene a la mod a.
10 8
xmo 48.5 8 53.833
10 8 10 9
c) El sesgo de la muestra aleatoria está dado por:
1 m m
X i X fi X i X fi*
2 2
n
a3 i 1 i 1
3 3
Sn21 Sn21
sustituyendo para calcular la variancia muestral, se tiene:
1 m
X i X fi
2
Sn21
n 1 i 1
1
sn21 5369.6
40 1
La raíz es la desviación estándar:
1
sn1 sn21 5369.6 11.734
39
sustituyendo en el sesgo:
289.152
a3 0.179 tiene ligero sesgo negativo
11.734
3
2. Un centro de cómputo tiene tres impresoras A, B, C, que imprimen a distinta velocidad. Las
probabilidades de que una persona envíe el trabajo a las impresoras A, B y C son 0.6, 0.3 y 0.1,
respectivamente. En ocasiones los impresos se atoran en la impresora y se destruyen. Las probabilidades
de que se atore el papel en las impresoras A, B y C son 0.015, 0.05 y 0.04, en ese orden. Un estudiante de
ingeniería utiliza este sistema para imprimir un trabajo urgente de investigación, calcular:
PYE_ EF1_2014-1 2
a) Si el trabajo se atoró, ¿qué probabilidad hay de que el estudiante haya enviado el documento a la
impresora B?
b) ¿Qué probabilidad hay de que el trabajo haya sido enviado por el estudiante a la impresora A o a la
impresora C?, si se imprimió correctamente.
Resolución
Sean los eventos que representan:
A el trabajo se envía a la impresora A
B el trabajo se envía a la impresora B
C el trabajo se envía a la impresora C
D el trabajo se atora y se destruye
Datos:
P A 0.6 P B 0.3 P C 0.1
P D A 0.015 P D B 0.05 P D C 0.04
a) Dado que el trabajo se atoró, cuál es la probabilidad de que el estudiante haya enviado el
documento a la impresora B , se pide P B D que es Teorema de Bayes, entonces:
P B D P B P D B
P B D
P D P A P D A P B P D B P C P D C
sustituyendo:
0.3 0.05
P B D
0.015
0.535
0.6 0.015 0.3 0.05 0.1 0.04 0.028
b) Se sabe que el trabajo se imprimió correctamente, cuál es la probabilidad de que el estudiante haya
enviado a la impresora A ó C , con el Teorema de Bayes se tiene:
P A C D
P A C D
P A P D A P C P D C
P D 1 P A P D A P B P D B P C P D C
sustituyendo:
0.6 0.985 0.1 0.96
P A C D
0.687
0.0707
1 0.028 0.972
x a b 0
1 1 1
p x
3 3 3
8
Determinar los valores a y b de la variable aleatoria X , si se sabe que E X 0 y Var X
3
PYE_ EF1_2014-1 3
Resolución
Se sabe que E X
x
x fX x
sustituyendo:
1 1 1
EX 0 a b 0
3 3 3
Var X
8
3
x
X 2 f X x E X 2 E X
2
sustituyendo:
8 2 1 2 1 2 1
Var X a 0 b 0 0 0
3 3 3 3
a2 4 a 2
entonces:
a 2 y b 2
x 2 0 2
1 1 1
p x
3 3 3
4. Un call center tiene un servicio de consulta por teléfono para la solución de los problemas de sus
usuarios. El servicio está disponible de 9:00 a 17:00 horas en días laborables. La experiencia muestra que
la variable aleatoria X , el número de llamadas recibidas por día, tiene una distribución de Poisson con
50 llamadas al día, calcular la probabilidad de que en un día dado, la primera llamada del día se reciba:
a) Antes de las 9:15 horas.
b) Después de las 10:00 horas, dado que no se recibió llamada antes de las 9:30 horas.
Resolución
a) Sea X ⍙ Número de llamadas recibidas por día
X Poisson 50 llamadas por día
T Exponencial 50 tiempo entre llamadas
Observando que el día laborable es de 8 horas, entonces:
PYE_ EF1_2014-1 4
1
P T 1 e 32 0.7903
1 50
32
1 1 1 1
P T T P T 50
1 1
1 8 50 50
T
16
1 8 8 e 50 50
b) P T e 8 16
e 16 8
0.0439
8 16 1 1 1
50
P T P T e 16
16 16
5. Un consultorio médico cuenta con dos líneas telefónicas. En un día seleccionado al azar, sea X la
variable aleatoria que representa la proporción del tiempo que se utiliza la línea telefónica 1 y sea Y la
variable aleatoria que representa la proporción del tiempo que se utiliza la línea telefónica 2. Si la función
de densidad conjunta de estas variables aleatorias es:
2
x 2y ; 0 x 1 , 0 y 1
f XY x, y 3
0 ; en otro caso
¿Cuál es la probabilidad de que la línea telefónica 2 se encuentre libre durante el 80% del día?
Resolución
Se pide calcular P La línea 2 está desocupada el 80% del día P Y 0.2
entonces:
y 0.2 1
2 0.2 2
1 0.2 1 1
6. Considérese el experimento del lanzamiento de un dado. Sea X la variable aleatoria que representa el
número que queda hacia arriba.
a) ¿Qué distribución tiene X ?
b) ¿Cuál es la media y la variancia de X ?
c) Si el experimento se modifica y ahora se lanza 30 veces el dado y se promedian los resultados, ¿cuál
es la media y la variancia teórica de la media muestral?
d) Al lanzar 30 veces el dado, ¿cuál es la probabilidad aproximada de que la media muestral sea mayor
o igual que cuatro?
Resolución
a) El comportamiento aleatorio tiene distribución Uniforme discreta
x 1 2 3 4 5 6
1 1 1 1 1 1
fX x
6 6 6 6 6 6
PYE_ EF1_2014-1 5
O bien,
1
; x 1, 2,3, 4,5, 6
fX x 6
0 ; en otro caso
E X 3.5
E X2
x
X 2 fX x
E X 2
91
6
Var X E X 2 E X
2
2
91 7 35
Var X 2.916
6 2 12
c) X es la media muestral, entonces del teorema del límite central porque n 30 , se sabe:
X2
X Normal X X , X2
n
sustituyendo:
35
35
X Normal X 3.5, X 12
2
0.0972
30 360
d)
Se pide P X 4 , utilizando el TLC, puesto que n=30
P X 4 P Z
4 3.5
0.0972
P Z 1.60 1 FZ 1.60 1 0.9452 0.0548
7. Un médico especialista director del área de cirugía tiene datos estadísticos históricos del número de
pacientes programados y operados, estos datos corresponden a los meses de marzo, abril, mayo, junio y
julio del año corriente y desea tener un pronóstico con regresión lineal de mínimos cuadrados para saber
cuánto necesitará de suministros para el área de quirófanos en los meses de agosto, septiembre y
octubre, de este mismo año.
a) Trazar el diagrama de dispersión.
b) Calcular el coeficiente de correlación lineal.
c) Obtener la recta de regresión lineal. Trazar la recta de regresión lineal junto con el diagrama de
dispersión.
d) Calcular el coeficiente de determinación e interpretar el resultado.
PYE_ EF1_2014-1 6
Los datos son los siguientes:
Mes Consecutivo Mes Número de pacientes programados para cirugía
x y
Marzo 1 3 100
Abril 2 4 150
Mayo 3 5 200
Junio 4 6 210
Julio 5 7 220
Resolución
Del enunciado se tiene:
Número de pacientes
Mes
Mes Consecutivo programados para cirugía
x y xy x2 y2
Marzo 1 3 100 300 9 10000
Abril 2 4 150 600 16 22500
Mayo 3 5 200 1000 25 40000
Junio 4 6 210 1260 36 44100
Julio 5 7 220 1540 49 48400
Sumas 25 880 4700 135 165000
SS xy
R
SS xx SS yy
PYE_ EF1_2014-1 7
2
5
xi
5
SS xx x
2
i
i 1
i 1
5
25
2
ssxx 135 10
5
2
5
yi
5
SS yy y2
i
i 1
i 1
5
880
2
ss yy 165000 10120
5
y
5 5
xi i
5
SS xy xi yi i 1 i 1
i 1
5
25880
ssxy 4700 300
5
sustituyendo
300
r 0.943
10 10120
c) La recta de regresión es:
ŷ ˆ0 ˆ1 x
donde se sabe que los promedios están definidos por:
1 5
x xi
1 5
y y
n n 1 , n n1 i
25 880
x 5 y 176
5 , 5
los estimadores se definen por:
5 5
5 xi yi
x y i i
i 1 i 1
5
ˆ1 i 1
2
5
xi
x 2 i 1
5
i 1
i 5
4700
25880
300
ˆ1 5 30
2
25 10
135
5
PYE_ EF1_2014-1 8
ˆ0 y ˆ1 x
ˆ0 176 30 5 26
yˆ 26 30 x
SS xy2
R2
SS xx SS yy
300 0.8893
2
r2
10 10120
Del resultado anterior, se puede observar y concluir, que el coeficiente de determinación, 88.93 %
y no es tan cercano al 100%, por lo que se considera que el modelo lineal es suficiente para el
número de pacientes programados para cirugía.
PYE_ EF1_2014-1 9
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO
FACULTAD DE INGENIERÍA
DIVISIÓN DE CIENCIAS BÁSICAS
COORDINACIÓN DE CIENCIAS APLICADAS
DEPARTAMENTO DE PROBABILIDAD Y ESTADÍSTICA
SEGUNDO EXAMEN FINAL
Resolución
SEMESTRE 2014 - 1 TIPO 1
DURACIÓN MÁXIMA 2.0 HORAS 2 DE DICIEMBRE DE 2013
NOMBRE__________________________________________________________________________________________
Apellido paterno Apellido materno Nombre (s) Firma
Instrucciones: Leer detenidamente los siete enunciados y resolver seis de los siete problemas
propuestos.
1. Un médico quiere hacer un estudio estadístico de una muestra semanal de mediciones de las
presiones arteriales sistólicas de 90 pacientes diferentes, el médico ordenó y agrupó estos datos
mediante una tabla dinámica en una hoja de cálculo electrónica y es la siguiente:
Límite inferior real Límite superior real Frecuencia
76.5 86.5 1
86.5 96.5 8
96.5 106.5 12
106.5 116.5 19
116.5 126.5 13
126.5 136.5 18
136.5 146.5 12
146.5 156.5 7
Él desea calcular con datos agrupados:
a) El coeficiente de variación e interpretar el resultado.
b) La mediana.
Resolución
La tabla de distribución de frecuencias está dada por:
Frontera Inferior Frontera Superior Frecuencia Absoluta Marcas de Clase Frecuencia Relativa Frecuencia Acumulada Absoluta Frecuencia Acumulada Relativa
2
LRi LRs fi xi fi* Fi Fi* xifi* (xi-media) fi
76.5 86.5 1 81.5 0.0111 1 0.0111 0.9056 1529.6790
86.5 96.5 8 91.5 0.0889 9 0.1000 8.1333 6779.6543
96.5 106.5 12 101.5 0.1333 21 0.2333 13.5333 4382.8148
106.5 116.5 19 111.5 0.2111 40 0.4444 23.5389 1577.2346
Clase Mediana
116.5 126.5 13 121.5 0.1444 53 0.5889 17.5500 10.2716
126.5 136.5 18 131.5 0.2000 71 0.7889 26.3000 2134.2222
136.5 146.5 12 141.5 0.1333 83 0.9222 18.8667 5236.1481
146.5 156.5 7 151.5 0.0778 90 1.0000 11.7833 6678.8642
90 120.6111 28328.8889
318.3021
La media= 120.6111
La variancia muestral= 318.3021
Coeficiente de
Variación= 0.1479 La muestra aleatoria no es buena.
PYE_ EF2_2014-1 1
se requiere la media y la desviación estándar, realizando las estimaciones para los
datos agrupados, se tiene:
1 m m
X X i f i X i f i *
n i 1 i 1
8 8
1
x xi fi xi fi * 120.6111
90 i 1 i 1
la variancia mustral:
1 m
X i X fi
2
Sn21
n 1 i 1
1
sn21 28328.8889 318.3021
90 1
La raíz de la variancia es la desviación estándar, entonces:
sn1 sn21 318.3021 17.8410
sustituyendo
17.8410
cv 0.1479
120.6111
Este indicador para la muestra dice que hay variabilidad en los datos, según el
resultado 14.79 % es buena la muestra.
b) La mediana es el valor que divide en dos partes iguales la distribución de frecuencias,
con los datos agrupados, entonces se realiza una interpolación:
m= 0.0144
y2-y1=m(x2-x1)
0.5-0.4444=0.0144(xmediana-116.5) 120.3462
2. Una revista publica tres columnas tituladas “Arte” ( A ), ”Libros” ( B ) y “Cinema”( C ). Los hábitos
de lectura de las amas de casa son probables de acuerdo a como se muestra en la tabla
siguiente:
A B C A B AC B C A B C
0.5 0.3 0.5 0.15 0.25 0.1 0.05
Calcular:
a) P A B
b) P( A B C )
c) P( A B C)
Resolución
a) Se pide la probabilidad de que una ama de casa lea de arte dado que lee libros, entonces:
PYE_ EF2_2014-1 2
P A B 0.15 1
P A B 0.5
P B 0.3 2
b) Se pide la probabilidad de que una ama de casa lea de arte dado que lee libros o cinema,
entonces:
P A B C P AB AC P AB P AC P ABC
P A B C
PB C P B P C P BC P B P C P BC
0.15 0.25 0.05 0.35 1
P A B C 0.5
0.3 0.5 0.1 0.7 2
c) Se quiere calcular la probabilidad de que una ama de casa lea de arte o libros dado que lee
sobre cinema, entonces:
P A B C P AC BC P AC P BC P ABC
P A B C
P C P C P C
0.25 0.1 0.05 0.3 3
P A B C 0.6
0.5 0.5 5
3. Se sabe que el tiempo semanal, en minutos, que un estudiante llega tarde a clase de Inferencia
Estadística es una variable aleatoria X con función de densidad:
3
f X x 500000
2500 x2 ; 50 x 50
0 ; en otro caso
a) Determinar el tiempo promedio semanal de retardo del estudiante.
b) Calcular la probabilidad de que el tiempo de retardo del estudiante exceda su tiempo
promedio de retardo semanal.
Resolución
La gráfica de la función de densidad es:
x 2500 x 2 dx 0
3
EX
50
50 500000
PYE_ EF2_2014-1 3
P X P X 0
3
2500 x 2 dx 0.5
50
0 500000
4. Se estima que el tiempo transcurrido hasta la falla de una pantalla plana LCD, se distribuye
exponencialmente con media igual a tres años. Una compañía ofrece hacer válida la garantía en
la tienda por el primer año de uso, ¿qué porcentaje de pantallas hará uso efectivo de la garantía?
Resolución
La distribución exponencial tiene media:
1
EX
entonces:
1 1
EX
1
3
T es la variable aleatoria que representa el tiempo de falla de una pantalla plana LCD.
T Exponencial
1
3
FT T t P T t 1 e t
1
1
1
FT T 1 P T 1 1 e 1 e 3 0.2835
3
significa que el 28.35% de pantallas planas LCD presentará una falla en el primer año, los
usuarios y hará válida la garantía en la tienda.
5. Un consultorio médico cuenta con dos líneas telefónicas. En un día seleccionado al azar, sea X
la variable aleatoria que representa la proporción del tiempo que se utiliza la línea telefónica 1 y
sea Y la variable aleatoria que representa la proporción del tiempo que se utiliza la línea
telefónica 2. Si la función de densidad conjunta de estas variables aleatorias es:
2
x 2y ; 0 x 1 , 0 y 1
f XY x, y 3
0 ; en otro caso
¿Cuál es la probabilidad de que la línea telefónica 2 se encuentre libre durante el 80% del día?
Resolución
Se pide calcular P La línea 2 está desocupada el 80% del día P Y 0.2
entonces:
y 0.2 1
2 0.2 2
1 0.2 1 1
6. Las estaturas de 1000 estudiantes están distribuidas aproximadamente en forma normal con una
media de 174.5 centímetros y una desviación estándar de 6.9 centímetros. Si se extraen 200
muestras aleatorias de tamaño 25 de esta población, determinar:
a) El número de muestras cuyo promedio cae entre 172.5 y 175.8 centímetros, con reemplazo.
PYE_ EF2_2014-1 4
b) El número de muestras que su promedio cae abajo 172.5 centímetros, sin reemplazo.
Resolución
X i Normal 174.5 , 6.9 , i 1, 2, 3,..., 1000
a) Por el teorema del límite central se conoce la variancia, con reemplazo, se tiene:
6.9
X Normal X 174.5 , X X
n 25
172.5 174.5 X
P 172.5 X 175.8 P
175.8 174.5 5
2 X 5
1.3
X
P X
6.9 X 6.9 6.9 X 6.9
25 n 25 n
10 6.5 10 6.5
P 172.5 X 175.8 P Z P Z P 1.45 Z 0.94
6.9 6.9 6.9 6.9
P 172.5 X 175.8 FZ 0.94 FZ 1.45 0.8264 0.0735 0.7529
entonces 200(0.7529)=150.58 serían 151 muestras de las doscientas.
b) Por el teorema del límite central conocida la variancia, sin reemplazo, se tiene:
N n 6.9 1000 25
X Normal X 174.5 , X X
n N 1 25 1000 1
X Normal X 174.5 , X 1.3633
X
172.5 174.5
P X 172.5 P X
P Z 1.47
X N n 6.9 1000 25
n N 1 25 1000 1
P X 172.5 P Z 1.47 FZ 1.47 0.0708
por lo tanto 200(0.0708)=14.16 serían 15 muestras de las doscientas.
7. Para confirmar si están relacionados el tránsito vehicular (automóviles por hora), y el contenido de
ozono (porcentaje de partículas por millar) en la vegetación que crece a la orilla de las carreteras,
se realizó un estudio en siete regiones de la República Mexicana, y se obtuvieron los datos
siguientes:
PYE_ EF2_2014-1 5
Cantidad de autómoviles x Cantidad de ozono y xy xx yy
294 26.1 7673.4 86436 681.21
402 37.2 14954.4 161604 1383.84
103 4.6 473.8 10609 21.16
416 24.8 10316.8 173056 615.04
573 38.7 22175.1 328329 1497.69
216 74.4 16070.4 46656 5535.36
334 34.3 11456.2 111556 1176.49
Sumas: 2338 240.1 83120.1 918246 10910.79
2338 240.1
x 334 y 34.3
7 , 7
los estimadores se definen por:
7 7
7 x y i i
xi yi i 1
7
i 1
ˆ1 i 1
2
7
xi
x 2 i 1
7
i 1
i 7
83120.1
2338 240.1
2926.7
ˆ1 7 0.0213
2338
2
137354
918246
7
ˆ0 y ˆ1 x
ˆ0 34.3 0.0213 334 27.1858
yˆ 0.0213 x 27.1858
PYE_ EF2_2014-1 6
SS xy
R
SS xx SS yy
2
7
xi
7
SS xx x
2
i
i 1
i 1
7
2338
2
yi
7
SS yy y2
i
i 1
i 1
7
240.1
2
ss yy 10910.79 2675.36
7
y
7 7
xi i
7
SS xy xi yi i 1 i 1
i 1
7
2338 240.1
ssxy 83120.1 2926.7
7
sustituyendo
2926.7
r 0.1527
137354 2675.36
Del resultado anterior: es muy baja la asociación lineal, prácticamente es ligera asociación
lineal.
SS xy2
R 2
SS xx SS yy
2926.7
2
r 2
0.0233
137354 2675.36
se puede concluir que, el coeficiente de determinación 2.331 % es muy alejado al 100%,
por lo que se considera que el modelo lineal no explica la cantidad de ozono emitida por los
vehículos. El modelo es deficiente hay que usar otro modelo.
PYE_ EF2_2014-1 7
PYE_ EF2_2014-1 8
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO
FACULTAD DE INGENIERÍA
DIVISIÓN DE CIENCIAS BÁSICAS
COORDINACIÓN DE CIENCIAS APLICADAS
DEPARTAMENTO DE PROBABILIDAD Y ESTADÍSTICA
SEGUNDO EXAMEN FINAL
NOMBRE__________________________________________________________________________________________
Apellido paterno Apellido materno Nombre (s) Firma
Instrucciones: Resolver seis de los siete problemas, lee detenidamente los siete enunciados, este examen es
la demostración de tu aprendizaje a lo largo del semestre, trata de entender y resolver primero los que
tienes seguridad en tu conocimiento.
1. En el experimento aleatorio de lanzar una moneda al aire hasta que la cara superior sea sol, se obtuvieron los
siguientes datos para la variable aleatoria X que representa el número de tiros necesarios hasta que la cara superior
sea sol
1 2 4 3 1
3 5 1 1 2
4 1 2 7 3
1 6 3 2 1
2 5 1 4 8
Con los datos presentados, obtener la tabla de frecuencias relativas (fr), la tabla de frecuencias relativas acumuladas y su
valor esperado
Resolución
La tabla de frecuencias queda de la siguiente manera
x f fr F Fr x*fr
1 8 0.32 8 0.32 0.32
2 5 0.2 13 0.52 0.4
3 4 0.16 17 0.68 0.48
4 3 0.12 20 0.8 0.48
5 2 0.08 22 0.88 0.4
6 1 0.04 23 0.92 0.24
7 1 0.04 24 0.96 0.28
8 1 0.04 25 1 0.32
Con la información de la tabla el valor esperado es
x x
1
X i fi i fri 2.92
n i 1 i 1
2. En un experimento para estudiar la relación de la hipertensión arterial y los hábitos de fumar, se reúnen los
siguientes datos para 180 individuos.
PYE_ EF2_2014-2 1
NF=NO FUMADORES FM=FUMADORES MODERADOS FE=FUMADORES EMPEDERNIDOS TOTAL
H=HIPERTENSO 21 36 30 87
NH=NO HIPERTENSO 48 26 19 93
TOTAL 69 62 49 180
Resolución
1 2
P 85.5 X 87.5 dx 0.66666
88 85 3
85.5
4. Una planta fabrica concretos con resistencias que se distribuyen casi normalmente, con media de 240 𝑘𝑔/𝑐𝑚2 y
desviación estándar de 24 𝑘𝑔/𝑐𝑚2 . Calcule la probabilidad de que:
a) Una muestra aleatoria de 16 cilindros indique una resistencia promedio de menos de 200 𝑘𝑔/𝑐𝑚2 .
b) Una muestra aleatoria de 4 cilindros indique una resistencia promedio de menos de 200 𝑘𝑔/𝑐𝑚2 .
Resolución
a) Para calcular la probabilidad de que una muestra aleatoria de 16 cilindros indique una resistencia promedio de menos
de 230 kg/cm2.
X = Resistencia del concreto que se fabrica. X~𝑁(μ, σ2 ) ~N(240,576)
PYE_ EF2_2014-2 2
n = Tamaño de muestra = 16
̅~N (240, 576), X
̅ = Resistencia media del concreto en una muestra. X
X ̅~N(240,36)
16
σ 24
σX̅ = Error estándar = = =6
√n 4
230 240
P X 230 P Z
6
P Z 1.67 0.0478
b) Una muestra aleatoria de 4 cilindros indique una resistencia promedio de menos de 230 kg/cm2 .
X = Resistencia del concreto que se fabrica. X~N(240,576)
n = Tamaño de muestra = 4
576
X = Resistencia media del concreto en una muestra. ̅
̅ X~N (240, ), ̅ X~N(240,144)
4
σ 24
σX̅ = Error estándar = = = 12
√n 2
230 240
P X 230 P Z
12
P Z 0.833 0.2024
5. Un matrimonio de odontólogos atiende diariamente un cierto número de pacientes. Sea 𝑋 la variable aleatoria que
representa el número de pacientes en endodoncia, atendidos por el doctor, en un día cualquiera y sea 𝑌 la variable
aleatoria que representa el número de pacientes en ortodoncia, atendidos por la doctora, en un día cualquiera.
Considere que la función de masa de probabilidad conjunta del vector (𝑋, 𝑌) está expresada por la siguiente tabla de
doble entrada.
Y
𝑝𝑋𝑌 (𝑥, 𝑦)
0 1 2 3 4
0 0.08 0.07 0.06 0.01 0.01
1 0.06 0.10 0.12 0.05 0.02
X
2 0.05 0.06 0.09 0.04 0.03
3 0.02 0.03 0.03 0.03 0.04
PYE_ EF2_2014-2 3
Determine:
a) La densidad de probabilidad marginal de la variable aleatoria 𝑋
b) La densidad condicional de 𝑋, para 𝑌 < 2
c) La probabilidad de que, en un día cualquiera, el número de pacientes atendidos por el doctor, sea mayor que el
número de pacientes atendidos por la doctora.
f XY x , y y
0 1 2 3 4
f X x
0 0.08 0.07 0.06 0.01 0.01 0.23
x 1 0.06 0.1 0.12 0.05 0.02 0.35
2 0.05 0.06 0.09 0.04 0.03 0.27
3 0.02 0.03 0.03 0.03 0.04 0.15
f XY x , y y
0 1 2 3 4
0 0.08 0.07 0.06 0.01 0.01
x 1 0.06 0.1 0.12 0.05 0.02
2 0.05 0.06 0.09 0.04 0.03
3 0.02 0.03 0.03 0.03 0.04
La región sombreada presenta la probabilidad solicitada, de donde al sumar las probabilidades se obtiene.
f XY x y 0.06 0.05 0.06 0.02 0.03 0.03 0.25
6. Se asume que X se puede aproximar mediante una variable aleatoria continua cuya distribución de probabilidad
acumulada es:
0 𝑠𝑖 𝑥<0
𝐹(𝑥) = { −
𝑥
1−𝑒 10 𝑠𝑖 𝑥≥0
PYE_ EF2_2014-2 4
Calcule la probabilidad de que en un día cualquiera, el número de abortos sea de:
a) Calcular la mediana.
b) Obtener la función de densidad de probabilidad de X.
Resolución
a) Calcular la mediana.
x x x
x 10 ln 2
1
0.5 1 e 10
0.5 e 10
1 e 10
x 6.9315
0.5
c) Obtener la función de densidad de probabilidad de X
d
x x
1 10
f x 1 e
10
e
d x 10
7. Se registró la medición de la presión sanguínea y la edad de 10 personas. Los datos obtenidos fueron los siguientes:
Presión
sanguínea 147 125 160 118 149 128 150 145 115 140
(mm Hg)
Edad
56 42 72 36 63 47 55 49 38 42
(años)
Si la relación que existe entre la presión sanguínea y la edad de una persona es aproximadamente lineal; con base en los
resultado obtenidos, estime el valor de la presión sanguínea de una persona de 40 años de edad.
Resolución:
Debido a que la relación que existe entre la edad de una persona y su presión sanguínea es cuasi-lineal, para estimar el
valor de la presión sanguínea de una persona de 40 años de edad, se debe obtener el modelo de regresión lineal de y
(presión sanguínea) en función de x (edad de la persona). Para ello se emplea el método de mínimos cuadrados, en
dónde la ecuación de la recta estimada es: yˆ ˆ 0 ˆ1 x
Dónde:
𝑛 𝑛
(∑𝑖=1 𝑥𝑖 )(∑𝑖=1 𝑦𝑖 )
∑𝑛
𝑖=1 𝑥𝑖 𝑦𝑖 −
𝛽̂1 = (∑
𝑛
𝑛 𝑥 )2 y 𝛽̂0 = 𝑦̅ − 𝛽̂1 𝑥̅
∑𝑛 2 𝑖=1 𝑖
𝑖=1 𝑥𝑖 − 𝑛
Definiendo a la variable X, como la edad de la persona y a Y como la medida de presión sanguínea de la persona; con los
datos registrados se obtiene:
∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖 = 70258
∑𝑛𝑖=1 𝑥𝑖 = 500, 𝑥̅ =50, ∑𝑛𝑖=1 𝑥𝑖 2 = 26192
Empleando este modelo se estima que para una persona de 40 años de edad la medición de su presión arterial será de :
NOMBRE__________________________________________________________________________________________
Apellido paterno Apellido materno Nombre (s) Firma
Instrucciones: Resolver seis de los siete problemas, lee detenidamente los siete enunciados, este examen es
la demostración de tu aprendizaje a lo largo del semestre, trata de entender y resolver primero los que
tienes seguridad en tu conocimiento.
Intervalos de clase
[calificaciones]
Clase Frontera inferior Frontera superior Frecuencia absoluta
1 0.5 17.5 4
2 17.5 34.5 6
3 34.5 51.5 16
4 51.5 68.5 12
5 68.5 85.5 f
6 85.5 102.5 4
Determinar la frecuencia para el quinto intervalo de clase, si la media es igual a 51.84. Además, obtener la mediana
y la moda.
Resolución
Para obtener la frecuencia absoluta o relativa, si se conoce la media:
1 m m
=X
=
∑= X f
i i
n i 1 =i 1
∑
= X i fi * 51.84
entonces para las marcas de clase que es el promedio de cada clase, se tiene:
Frontera Marca de
Frontera superior Frecuencia Absoluta Frecuencia Relativa Frecuencia Acumulada Absoluta Frecuencia Acumulada Relativa x ifi*
inferior Clase
1 0.5 17.5 4 9 0.0800 4 0.0800 0.7200
2 17.5 34.5 6 26 0.1200 10 0.2000 3.1200
3 34.5 51.5 16 43 0.3200 26 0.5200 13.7600
4 51.5 68.5 12 60 0.2400 38 0.7600 14.4000
5 68.5 85.5 8 77 0.1600 46 0.9200 12.3200
6 85.5 102.5 4 94 0.0800 50 1 7.5200
50 1 0.84 51.8400
38.1173
1 1
51.84 = ( 4 )( 9 ) + ( 6 )( 26 ) + (16 )( 43) + (12 )( 60 ) + f ( 77 ) + ( 4 )( 94 ) = [1976 + 77 f ]
n n
también se sabe que la suma de la frecuencia relativa debe ser igual a uno, entonces:
PYE_ EF1_2014-2 1
m
1 m
∑
=i 1 =
∑ fi = 1
fi * = 1=
ni1
1 1
1= [ 4 + 6 + 16 + 12 + f + 4]= [ 42 + f ]
n n
=
por lo tanto f 8= n 50
La mediana, es el valor que divide a la distribución en dos partes iguales, entonces:
Frecuencia
Acumulada
Fronteras Relativa
34.5 0.20
Mediana 0.50
51.5 0.52
y2 − y1
=
interpolando en la clase mediana: x + x1
y2 − y1
x2 − x1
0.5 − 0.2
sustituyendo:=
x + 34.5 ≈ 50.44
0.0188
La moda es la abscisa con mayor frecuencia absoluta o relativa, entonces:
a
xmo = 43 o bien =xmo Lx + cxmo =a f xmo − f x
mo _inf a + b mo−1
=b f xmo − f x
mo+1
f xmo : frecuencia absoluta de la clase que contiene a la mod a.
cmo : Longitud de la clase que contiene a la mod a.
LMo _ inf : Límite inf erior de la clase que contiene a la mod a.
16 − 6
xmo =
34.5 + (17 ) =
46.6429
(16 − 6 ) + (16 − 12 )
2. Según una revista internacional, con base en sus estadísticas, de cada 100 niños que nacen 30 tienen aptitudes
para el atletismo y de cada 50 niñas 20 la tienen. Si en un determinado país, donde la población está compuesta
por el 46% de hombres y el resto de mujeres.
Se elige una persona al azar, calcular la probabilidad de que:
a) Sea apta para el atletismo.
b) Sea mujer, apta para el atletismo.
c) Sea hombre dado que no es apto para el atletismo.
Resolución
Sean los eventos que representan:
A = { persona apta para el atletismo}
M = {Una mujer de ese país}
Datos:
P ( M ) = 0.46 P( A M ) = P( A M ) =
2 3
P ( M ) = 0.54
5 10
PYE_ EF1_2014-2 2
a) La probabilidad de que se seleccione a una persona apta para el atletismo, entonces
=P ( A) P ( M ) P ( A M ) + P ( M ) P ( A M )
3 2
P ( A ) = 0.46 + 0.54 = 0.354
10 5
b) Se sabe que es una persona apta para el atletismo, la probabilidad de que sea mujer, entonces por el Teorema
de Bayes se tiene:
P(M ) P( A M )
P ( M A) =
P(M ) P( A M ) + P(M ) P( A M )
( 0.54 )
2
=P ( M A)
5
≈ 0.6102
3 2
0.46 + 0.54
10 5
c) Sea hombre dado que no es apto para el atletismo, entonces por el Teorema de Bayes se tiene:
( 0.46 )
7
P(M ) P A M ( ) 10 0.322
(
=
P M A ) =
1 − P ( A)
=
1 − 0.354 0.646
≈ 0.4985
3. Se sabe que X es la variable aleatoria que representa al número de personas que entran diariamente en un
almacén, se distribuye de manera aproximadamente normal. También se conoce que la probabilidad de 0.58 es
que entren menos de 75 clientes y la probabilidad de 0.38 que entren entre 75 y 80 clientes, determinar la media y
la varianza de la población.
Resolución
Sea X la variable aleatoria que representa al número de personas que entran diariamente en un almacén, se
distribuye de manera aproximadamente normal.
X ~ Normal ( m X , σ X2 )
Del enunciado, se tiene:
P ( 75 < X < 80 ) = 0.38
también
P ( X < 75) = 0.58
entonces
75 − µµµµµ
X − X 80 − X 80 − X 75 − X
P ( 75 < X < 80 ) = P X
< < = Fz − Fz = 0.96 − 0.58 = 0.38
σX σX σX σX σX
de tablas de la distribución acumulativa normal estándar con 0.58 y 0.96
75 − µµ 80 − X
=Z0 = X
0.21= y Z1 = 1.76
σX σX
se tiene un sistema de dos ecuaciones con dos incógnitas, resolviendo dicho sistema:
µ X= 74.3226 y σ X= 3.2258 σ X2= ( 3.2258)
2
⇒
PYE_ EF1_2014-2 3
1
4. La recta de regresión lineal dada por y=2+ x y con SS xx = 4 y SS yy = 9 , calcular el valor del coeficiente
4
de determinación, concluir sobre el valor obtenido.
Resolución
Como el coeficiente de determinación se utiliza como medida de eficacia de la regresión se define por:
SS xy2
R =
2
SS xx SS yy
del enunciado, se sabe que
1 1
y=2+ x y con SS xx = 4 y =
SS yy = 9 , además, βˆ0 2=
, βˆ1 , SS xy = 1
4 4
por lo que
SS xy2 1
r=
2
= ≈ 0.0278
SS xx SS yy 36
2.78%
del resultado anterior, se puede observar y concluir, que el coeficiente de determinación es muy bajo, por lo que
se considera que el modelo lineal no es nada bueno para estimar a y en términos de x.
5. Supóngase que una tienda de abarrotes compra cinco envases de leche descremada al precio de mayoreo de
$12.00 por envase y la vende a $16.50 por envase. Después de la fecha de caducidad, la leche que no se vende se
retira de los anaqueles y el tendero recibe un crédito del distribuidor igual a tres cuartos del precio de mayoreo. Si
la distribución de probabilidad de la variable aleatoria X , el número de envases que se venden de este lote es:
x 0 1 2 3 4 5
1 2 2 3 4 3
fX ( x)
15 15 15 15 15 15
Determinar la utilidad esperada.
Resolución
Sea X la v.a. que representa en número de envases de leche que se venden.
El valor esperado de venta es:
E(X ) =
∑ ∀x
x fX ( x)
1 3 46
E ( X ) = 1 + ... + 5 = ≈ 3.0667
15 15 15
La utilidad se plantea como:
3
U = 16.5 X − 5 (12 ) + ( 5 − X )(12 )
4
= 16.5 X − 60 + 9(5 − X )
U
= 16.5 X − 60 + 45 − 9 X
U
=
U 7.5 X − 15
Aplicando valor esperado, se tiene:
E (=
U ) E ( 7.5 X − 15
= ) 7.5E ( X ) − 15
(U ) 7.5 =
46
E= − 15 8 pesos
15
PYE_ EF1_2014-2 4
6. El tiempo total, en horas, que un estudiante de ingeniería permanece en un salón de clase está definido por la
variable aleatoria X , además, sea Y la variable aleatoria que representa el tiempo que el estudiante espera en el
salón para que llegue su profesora y sea Z la variable aleatoria que representa el tiempo de exposición de la clase
de Estadística ( X= Y + Z ) , la función de densidad conjunta está dada por:
− x
9
k e 2
; 0< y< x<
f XY ( x, y ) = 4
0
; en otro caso
a) Obtener el valor de k que hace válida la función de densidad conjunta.
b) Calcular las funciones marginales de densidad.
c) ¿Son variables aleatorias conjuntas estadísticamente independientes? justificar su respuesta.
Resolución
Sea X la v.a. que representa el tiempo total desde que el alumno llega al salón.
Sea Y la v.a. que representa el tiempo que el alumno espera a que llegue la maestra para exponer.
Sea Z la v.a. que representa el tiempo de exposición de la maestra.
− x
9
k e 2
; 0< y< x<
f XY ( x, y ) = 4
0
; en otro caso
∫∫ f XY ( x, y ) dydx = 1
−∞ −∞
9
4 x x
−
∫∫
0 0
k e 2
dydx = 1
9
x
4
− 2x
k ∫
0
ye dx = 1
0
9 9
− 2x
4
−
x
−
x 4
k ∫ xe dx =− k 2 xe − 4e
2 2
=
1
0 0
9 − 9
−
9
k −2 e 8 − 4e 8 − ( −4 ) =1
4
9 − 98 −
9
k − e − 4e 8 + 4 =
1
2
17 − 9
k 4 − e 8 = 1
2
k [1.2405] = 1
1
=k ≈ 0.8061
1.2405
Por lo tanto la función está dada por:
PYE_ EF1_2014-2 5
−
x
9
0.8061 e 2
; 0< y< x<
f XY ( x, y ) = 4
0 ; en otro caso
b) Las funciones de densidad marginal, se definen como:
∞ ∞
fX ( x) = ∫ f XY ( x, y ) dy fY ( y ) = ∫ f XY ( x, y ) dx
−∞ −∞
sustituyendo:
x
x
−−
xx
−
x
=f X ( x ) ∫= =
0.8061 e dy 0.8061 ye 2 2
0.8061 xe 2
0 0
−
x
9
0.8061 xe 2
; 0< x<
fX ( x) = 4
0 ; en otro caso
9 9 9
4
−
x
− 4
x
− 4
x
−
9
− y
1
fY ( y ) =
∫ 0.8061 e 2
0.8061( 2 ) e =
dx =− 2
−1.6122 e =
2
−1.6122 e + 1.6122e
8 2
y y y
− 12 y − 98
=fY ( y ) 1.6124 e −e
− 12 y − 98 9
1.6122 e −e ; 0< y<
fY ( y ) = 4
0 ; en otro caso
7. Se sabe que los sueldos semanales de los trabajadores de una empresa están distribuidos normalmente con una
media de $800.00. Se toma una muestra aleatoria de 25 trabajadores y se encuentra que hay una probabilidad de
0.05 de que la media muestral exceda los $866.00
a) Calcular la desviación estándar de los sueldos semanales.
b) Determinar la probabilidad de que un sueldo semanal elegido al azar exceda los $770.00
Resolución
a) Sea X la variable aleatoria que representa los sueldos semanales de los trabajadores.
X ~ Normal ( m X = 800 , σ 2 )
se tiene n=25 por el teorema del límite central, se tiene:
σ X2 σ X2
X Normal m=
X
m=
X 800, σ=
2
X
=
n 25
PYE_ EF1_2014-2 6
X −µ 866 − 800
(
P X > 866 ) ≈ P
σX
X
>
σX
=
PZ >
66
σX
=
0.05
25
n 5
entonces:
(
P X > 866 = )
1 − P X < 866 = (
1 − 0.95 =
0.05 )
de tablas de la distribución acumulativa normal estándar, se tiene:
5 ( 66 )
= =
Z 0 1.65
σX
5 ( 66 )
⇒ σX = = 200
1.65
b) Se pide calcular la probabilidad de que un sueldo semanal, elegido aleatoriamente sea mayor, por lo que:
=
X ~ Normal ( m X 800
= , σ X 200 )
X − µX 770 − 800
P ( X > 770 ) ≈ P > =P ( Z > −0.15) =
1 − P ( Z < −0.15) =
σX 200
1 − FZ ( −0.15 ) =
= 1 − 0.4404 =
0.5596
PYE_ EF1_2014-2 7
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO
FACULTAD DE INGENIERÍA
DIVISIÓN DE CIENCIAS BÁSICAS
COORDINACIÓN DE CIENCIAS APLICADAS
DEPARTAMENTO DE PROBABILIDAD Y ESTADÍSTICA
PRIMER EXAMEN FINAL
NOMBRE__________________________________________________________________________________________
Apellido paterno Apellido materno Nombre (s) Firma
1. Un hospital elaboró el siguiente histograma de frecuencias tomando como base una muestra aleatoria de
los pesos (en kg.) de los bebés recién nacidos en ese hospital.
2. Con base en varios estudios geológicos una compañía ha clasificado, de acuerdo a la posibilidad de
descubrir petróleo, las formaciones geológicas en tres tipos. La compañía pretende perforar un pozo en un
determinado sitio al que se le asignan las probabilidades de 0.35, 0.40 y 0.25 para los tres tipos de
formaciones respectivamente. De acuerdo con la experiencia, se sabe que el petróleo se encuentra en un
40% de formaciones del tipo I, en un 20% de formaciones del tipo II y en un 30% de formaciones del tipo
III.
Resolución.
a) Sean los eventos:
A={x|x es una formación del tipo 1} Los datos son: P(A)=0.35 P(D|A)=0.4
B={x|x es una formación del tipo 2} P(B)=0.40 P(D|B)=0.2
C={x|x es una formación del tipo 3} P(C)=0.25 P(D|C)=0.3
D={x|x es un sitio con petróleo}
PYE_ EF1_2015-1 1
La probabilidad de encontrar petróleo, considerando los tres tipos de formaciones geológicas es:
P(D)=P(A)P(D|A)+P(B)P(D|B)+P(C)P(D|C)=0.35(0.4)+0.4(0.2)+0.25(0.3)=0.295
0 𝑥 < −2
0.4 −2 ≤ 𝑥 < 0.5
𝐹 (𝑥) = {
0.8 0.5 ≤ 𝑥 < 3
1 𝑥 ≥3
Resolución.
F(x) p (−2) = P (x = −2) = F (−2) − F (−2− ) = 0.4 − 0 = 0.4
p (0.5) = P (x = 0.5) = F (0.5) − F (0.5− ) = 0.8 − 0.4 = 0.4
a) 1.0
p (3) = P (x = 3) = F (3) − F (3− ) = 1 − 0.8 = 0.2
0.8
0.6
0.4 En forma tabular:
0.2 x -2 0.5 3
P(X) 0.4 0.4 0.2
-2 -1 0 1 2 3 4 x
c) P(-2X0.5)=0.4+0.4=0.8
4. Un ingeniero viaja diariamente desde su domicilio en Cd. Satélite, hasta su oficina en el centro de la Cd.
de México. En promedio el viaje en un sentido le lleva 24 minutos, con una desviación estándar de 3.8
minutos. Suponga que la distribución de los tiempos de viaje es normal.
a) Si sale de su domicilio a las 8:35 y se sirve café en la oficina de 8:50 a 9:00 ¿Cuál es la probabilidad
de que se pierda el café?
b) Determine la probabilidad de que 2 de los 3 viajes siguientes tome por lo menos ½ hora.
(15 Puntos)
Resolución.
a) Para que se pierda el café, debe llegar a su oficina de las 9.00 hrs. En adelante, por lo tanto de su domicilio a su trabajo
tendrá que hacer más de 25 min.
PYE_ EF1_2015-1 2
25−24
Z= 3.8
= 0.263 P(X≥25)= P(Z ≥ 0.263) = 1 − 0.6026 = 0.3974
Si A es el evento un viaje toma por lo menos ½ hora, entonces la probabilidad los eventos que cumplen con lo que se
solicita es:
P(A∩ Ac ∩A U A∩A∩ Ac U Ac ∩A∩A) = 3P(A∩ Ac ∩A) = 3P(A)P(Ac)P(A)
Considerando la probabilidad de que tome más de media hora, P(A)=0.0571, por lo tanto
P(Ac)=1- P(A) = 1- 0.0571=0.9429
3P(A)P(Ac)P(A)=3(0.0571)(0.9429)(0.0571)=0.0092
5. Suponga que el porcentaje X de alumnos y Y de alumnas que han concluido un examen de probabilidad y
estadística se puede describir mediante la función densidad de probabilidad conjunta:
1 1 4 1 4 1 8
E(XY) = ∫0 ∫y xy 8xydxdy = E(X) = ∫0 x4x 3 dx = E(Y) = ∫0 y[4y(1 − y 2 )]dy =
9 5 15
4 4 8 4
Por lo tanto: COV(XY)= 9 − 5 (15) = 225
1
2 (4y(1 2
8 2 11
Var(Y) = ∫ y − y ))dy − ( ) =
0 15 225
Cov(XY)
ρXY = = 0.4923
√Var(X)Var(Y)
PYE_ EF1_2015-1 3
6. El promedio de las personas que ingresan a una librería y compran, es del el 25%. El comportamiento de
las compras obedece a una distribución binomial. Si en un día entraron 80 clientes, calcule la
probabilidad de que se hagan al menos 28 compras.
(15 Puntos)
Resolución.
Si se tiene que las compras se distribuyen de manera binomial, se tiene:
p=éxito=el cliente compra=0.25; q=fracaso=el cliente no compra=0.75, entonces la media y desviación estándar
serán:
𝜇 = 𝑛𝑝 = 80(0.25) = 20 y 𝜎 = √𝑛𝑝𝑞 = √80(0.25)(0.75) = 3.87
28 − 20
Entonces la probabilidad pedida es 𝑃(𝑥 ≥ 28). 𝑍= = 2.07
3.87
Utilizando tablas de la distribución normal estándar se determina la probabilidad.
𝑃(𝑥 ≥ 28) = 𝑃(𝑍 ≥ 2.07) = 1 − 0.9808 = 0.0192
7. Los resultados de las estaturas (en centímetros) y pesos (en kilogramos), de 10 jugadores de baloncesto
de un equipo, van de 186 a 205 cm y de 85 a 103 kg respectivamente.
Los resultados de las sumas de los datos obtenidos, se muestran a continuación:
A partir de los datos anteriores se estimó la siguiente recta de regresión lineal la cual relaciona el peso de
un jugador en función de su estatura:
yˆ 107.14 1.022 x
Se desea saber si realmente la relación que existe entre el peso y la estatura de los jugadores es
aproximadamente lineal. Con base en la información proporcionada, diga si existe o no relación lineal
entre el peso y la estatura de un jugador y justifique su respuesta.
(15 Puntos)
Resolución:
La relación que existe entre el peso de una persona y su estatura se considera lineal, si el coeficiente de correlación del
modelo de regresión lineal obtenido, es cercano igual a uno, por lo tanto, se debe calcular este coeficiente y observar su
valor para saber si el peso y la estatura de un jugador se relacionan de forma lineal.
El coeficiente de correlación, está definido por:
SS xy
r
donde: SS xx SS yy
SS xy ∑n
i=1 xi ∑n
i=1 xi (1950)(921)
= ∑ni=1 xi yi − = 179971 − = 376
10 10
SS xx = ∑n x 2 − (∑n
i=1 xi )
2 (1950)2
i=1 i 10
= 380618 − 10
= 368
SS yy (∑n
i=1 yi )
2 (921)2
= ∑ni=1 yi 2 − 10
= 85255 − 10
= 430.9
SS xy 376
Sustituyendo en r, se tiene: r 0.944
SS xx SS yy (368)(430.9)
Como el valor de r es cercano a 1, entonces se puede decir que si existe relación lineal positiva entre el peso de los
jugadores y su estatura, es decir, a mayor estatura, el valor del peso del jugador, será también mayor.
PYE_ EF1_2015-1 4
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO
FACULTAD DE INGENIERÍA
DIVISIÓN DE CIENCIAS BÁSICAS
COORDINACIÓN DE CIENCIAS APLICADAS
DEPARTAMENTO DE PROBABILIDAD Y ESTADÍSTICA
SEGUNDO EXAMEN FINAL
NOMBRE__________________________________________________________________________________________
Apellido paterno Apellido materno Nombre (s) Firma
1. La tabla registra las estaturas en pulgadas de una muestra de 140 alumnos de nuevo ingreso, de género
masculino, en una universidad del centro del país.
Intervalo de Clase Frecuencia a) Determine la estatura media y la estatura mediana de los estudiantes.
Estatura(pulgadas) (f)
59.5-62.4 3 b) Grafique la ojiva de frecuencia relativa acumulada.
62.5-65.4 12
65.5-68.4 24 c) Calcule la desviación estándar.
68.5-71.4 46
71.5-74.4 55 (15 Puntos)
Resolución.
Ajustando los intervalos de la tabla de frecuencias se tiene:
Frecuencia
Intervalo de Clase Frecuencia Marca de Frecuencia relativa
Estatura(pulgadas) Intervalo Ajustado (f) clase (m) relativa acumulada
59.5-62.4 59.45-62.45 3 60.95 0.0214 0.0214
62.5-65.4 62.45-65.45 12 63.95 0.0857 0.1071
65.5-68.4 65.45-68.45 24 66.95 0.1714 0.2786
68.5-71.4 68.45-71.45 46 69.95 0.3286 0.6071
71.5-74.4 71.45-74.45 55 72.95 0.3929 1
Total 140
a) La media para datos agrupados es:
k
1 1
̄x = ∑ f k mk = [3(60.95)+12(63.95)+24(66.95)+46 (69.95)+55(72.95)]=69.91 pulgadas
n k =1 140
La mediana:
( ) ( )
n 140
−T −39
2 2
x̃ = Lm+ Δ=68.45+ (3)=70.47 pulgadas
fm 46
b) Ojiva de frecuencia relativa acumulada:
1
15
0.9
0.8
0.7
10
0.6 Columna 1
0.5
0.4 Columna 2
0.3 5
0.2 Columna 3
0.1
0
0
62.45
Fila 1 Fila 2
65.45
Fila68.45
3 Fila 4 71.45 74.45
PYE_ EF2_2015-1 1
2
( )
k k
1
2
∑ f j m − ∑ f j mj
j
n j =1
2 j=1
c) S =
n−1
2 2 2 2 2 1 2
[3(60.95) +12(63.95) +24(66.95) + 46(69.95) +55( 72.95) ]− [3(60.95)+12(63.95)+24 (66.95)+46( 69.95)+55( 72.95)]
140
S 2=
139
S 2=9.9696 S= √ 9.9693=3.1574
2. En una tienda especializada en partes de robots, se ha observado que en el 7% de los sensores de luz salen
defectuosos. Si un profesor de robótica entra a la tienda para comprar tres de estos sensores para sus alumnos.
a) Calcule la probabilidad de que uno de los sensores elegidos sea defectuoso.
b) ¿Cuál es la probabilidad de que a lo más dos sensores sean defectuosos?
(10 Puntos)
Resolución.
Sean los eventos: A={x|x es un sensor defectuoso} y B={x|x es un sensor no defectuoso}
{
0.2 −1≤ y≤0
3. Sea Y una variable aleatoria con función de densidad dada por: f Y ( y)= 0.2+ky 0< y≤1
0 en otro caso
a) Determinar el valor de k.
b) Calcular P (Y > 0.5|Y > 0.1)
(15 Puntos)
Resolución.
0 1 1
∫ 0.2 dy+∫( 0.2+ky) dy =1 ∫ (0.2+1.2y)dy
−1 0 P (Y >0.5) 0.5 0.55
a) k b) P (Y >0.5∣Y >0.1)= = = =0.71
0.2+0.2+ =1 P (Y >0.1) 1 0.774
2 ∫ (0.2+1.2y)dy
k =1.2 0.1
4. Se ha comprobado que el tiempo de vida de cierto tipo de marcapasos sigue una distribución exponencial con
media de 16 años.
a) ¿Cuál es la probabilidad de que a una persona a la que se le ha implantado este marcapasos se le deba
reimplantar otro antes de 20 años?
b) Si el marcapasos lleva funcionando correctamente 5 años en un paciente, ¿cuál es la probabilidad de que
haya que cambiarlo antes de 25 años?
PYE_ EF2_2015-1 2
(15 Puntos)
Resolución.
Sea T la variable aleatoria que mide la duración del marcapasos en una persona.
T → Exp λ=( 20
1
16 )
⇔ f (t)=λ e−λ t
20 1
∀t≥0
1 − t
a) P (T <20)=∫ f (t) dt=∫ e 16 dt=0.7135
0 0 16
25 25 1
1 − t
b) P (5<T <25)=∫ f (t)dt=∫ e 16 dt=0.522
5 5 16
5, Sea el precio que el transportista inicial paga por un barril de petróleo crudo, y , el que paga la refinería que
compra ese petróleo. La densidad conjunta de está dada por:
1
f X ,Y ( x , y)= 20<x< y <40
200
Resolución.
a)
40
1 1
f x ( x)=∫ dy= ( 40− x)
200 200
Las funciones marginales para X y para Y son: x
y
1 1
f y ( y)=∫ dx = ( y−20)
20 200 200
40
1 80
E ( X )= ∫
200 20
x (40− x) dx= =26.6667
3
40
Los valores esperados son: 1 100
E (Y )= ∫
200 20
y ( y−20)dy=
3
=33.3334
40 40
xy
E ( XY )=∫∫ dy dx=900
20 x 200
80 100
b) Cov( X ,Y )= E (XY )−E ( X ) E(Y )=900−( )( )=11.1111
3 3
6. El tiempo que tarda un solicitante seleccionado al azar, en llenar cierta forma para una hipoteca, tiene una
distribución normal con valor promedio de 10 minutos y desviación estándar de dos minutos. Si en un día
determinado cinco individuos llenan una forma, y al siguiente día son seis los que llenan la forma, ¿cuál es la
probabilidad de que la cantidad de tiempo promedio de la muestra de cada día sea a los sumo 11 minutos?
(15 Puntos)
Resolución.
Sea X el tiempo que tarda una persona en llenar una solicitud.
X ∼N (μ X =10 , σ 2X =22 )
Para el día 1, n=5
PYE_ EF2_2015-1 3
( )
11−10
P(X
̄ ≤11)= P Z ≤ =P (Z ≤1.12)=0.8686
2
√5
̄
X
2
√6 )
≤11)=(0.8686)(0.8888)=0.7720
7. El presidente de una agencia de autos supone que el tiempo que un vendedor pasa con un cliente (minutos)
debe tener una relación positiva con el monto de lo que éste último compra. Para corroborar si esta relación
existe, reunieron los datos de nueve vendedores, y las sumas de estos datos son:
Minutos Montos (Minutos)2 (Montos)2 (Minutos)(Montos)
874 3565 91330 2147175 358852
a) A partir de los datos anteriores, estime la recta de regresión que permite estimar el monto de las compras en
función de los minutos invertidos por el vendedor.
b)¿Existe una relación lineal entre el monto de compras y el tiempo invertido por el vendedor? Justifique su
respuesta.
(15 Puntos)
Resolución.
a) En función de la pregunta se determina que el tiempo invertido por el vendedor es “x” y el monto de compras
es “y”.
Utilizando las siguientes expresiones y sustituyendo se tiene:
( ∑ y)(∑ x 2 )−(∑ x )(∑ xy ) (3565)(91330)−(874)(358852)
a= 2
= =205.78
n ∑ x 2−( ∑ x ) 9(91330)−(874) 2
n ∑ xy −( ∑ x)( ∑ y ) 9(358852)−(874)(3565)
b= 2
= =1.96
n ∑ x 2−( ∑ x) 9(91330)−(874)2
n ∑ xi ∑ yi (874)(3565)
S xy=∑ x i y i− i=1 i=1
=358852− =12650.889
i=1 n 9
S xy 12650.889
Entonces: r= = =0.1836
√ S xx S yy √(6454.889)(735038.889)
PYE_ EF2_2015-1 4
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO
FACULTAD DE INGENIERÍA
DIVISIÓN DE CIENCIAS BÁSICAS
COORDINACIÓN DE CIENCIAS APLICADAS
DEPARTAMENTO DE PROBABILIDAD Y ESTADÍSTICA
SOLUCIÓN PRIMER EXAMEN FINAL
NOMBRE______________________________________________________________________________________
Apellido paterno Apellido materno Nombre (s) Firma
1. Una muestra del tiempo en minutos que les tomó a 50 autos en recorrer desde Ecatepec hasta el Zócalo de la Ciudad de México
en un día sábado por la tarde fue agrupada en la siguiente tabla de distribución de frecuencias:
a) Complete la tabla.
s = √𝑠 2
1 1
𝑥̅ = � 𝑥𝑖 𝑓𝑖 = [75(1) + 80(2) + 85(6) + 90(7) + 95(7) + 100(14) + 105(8) + 110(4) + 115(1)]
𝑛 50
4835
= = 96.7
50
1
𝑠2 = ∑𝑚 2
𝑖=1(𝑥𝑖 − 𝑥̅ ) 𝑓𝑖
𝑛−1
1
= [(75 − 96.7)2 (1) + (80 − 96.7)2 (2) + (85 − 96.7)2 (6) + (90 − 96.7)2 (7) + (95 − 96.7)2 (7) + (100 − 96.7)2 (14) +
49
(105 − 96.7)2 (8) + (110 − 96.7)2 (4) + (115 − 96.7)2 (1)]
1 1123
= (3930.5) = = 𝟖𝟖. 𝟐𝟐𝟐
49 14
𝒔 = √𝑠 2 = √80.214 = 𝟖. 𝟗𝟗𝟗
𝑠 8.956
∴ 𝑐𝑐𝑋 = = ≈ 𝟎. 𝟎𝟎𝟎𝟎
𝑥̅ 96.7
PYE_SOL_1EFA_2015-2 1
2. La PROFECO realizó un estudio sobre la duración de diversas marcas de tabletas electrónicas. Dicho estudio se centró en aquellas
tabletas que tuvieron una duración menor a un año. Suponga que los resultados obtenidos fueron los que a continuación se
mencionan: -el 60% de las tabletas estudiadas fueron de la marca “Pad@”.
- el 50% de las tabletas estudiadas duraron menos de cuatro meses
- el 30% de las tabletas estudiadas presentaron ambas características siguientes: duraron más de cuatro meses y no
fueron de la marca “Pad@”.
Diga cuál es la probabilidad de que:
𝑃(𝐵∩𝐴)
Piden calcular 𝑃( 𝐵|𝐴) =
𝑃(𝐴)
, 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∪ 𝐵)
𝑃(𝐴 ∪ 𝐵) = 1 − 𝑃(𝐴̅ ∩ 𝐵� ) = 1 − 0.3 = 0.7
∴ 𝑃(𝐴 ∩ 𝐵) = 0.6 +0.5 – 0.7 = 0.4
𝑃(𝐵∩𝐴) 0.4 2
Finalmente: 𝑃( 𝐵|𝐴) = = = ≈ 𝟎. 𝟔𝟔
𝑃(𝐴) 0.6 3
b) una tableta dure cuando mucho cuatro meses ó sea de la marca “Pad@”.
Piden: P(BUA)= P(B)+P(A)- P(B∩A) = 0.5+0.6 - 0.4 = 0.7
3. Sea X el número de caras que pueden obtenerse cuando se lanza una moneda 4 veces. Si su media es 2 y su distribución de
probabilidad es la siguiente:
x 0 1 2 3 4
f(x) 1/16 4/16 K 4/16 1/16
4. En el módulo de atención a clientes de cierto banco llegan en promedio 10 clientes por hora, si el horario de servicio es de 9:00 a
15:00 hrs:
a) ¿Cuál es la probabilidad de que en la última hora de servicio de un día cualquiera se reciban menos de tres clientes en el
módulo?
Sea X: el número de clientes que llegan al módulo en una hora.
Tipo de variable aleatoria: DISCRETA
Tipo de distribución: POISSON , parámetros λ=10,
𝜆𝑥 𝑒 −𝜆
Se pide 𝑃(𝑋 < 3) = 𝑃(𝑋 ≤ 2) = ∑2𝑋=0 𝑥!
= 𝟎. 𝟎𝟎𝟎𝟎
b) ¿Cuántos clientes se espera que lleguen a dicho módulo durante un día cualquiera?
Sea X: el número de clientes que llegan al módulo en un día.
Tipo de variable aleatoria: DISCRETA
Tipo de distribución: POISSON , parámetros λ=60,
El número de clientes que se espera que lleguen a dicho módulo durante un día cualquiera es E(X)= λ = 60
5. Sea la función de probabilidad conjunta:
PYE_SOL_1EFA_2015-2 2
𝑥(1 + 3𝑦 2 ) 0<𝑥<2 , 0<𝑦<1
𝑓(𝑥, 𝑦) = � ;
4
0 ; 𝑂𝑂𝑂𝑂𝑂 𝑐𝑐𝑐𝑐𝑐
Se sabe empíricamente que las variables aleatorias 𝑋 y 𝑌 son estadísticamente independientes. Diga si esta afirmación es cierta y
justifique su respuesta.
Las v.a. son estadísticamente independientes si: 𝑓(𝑥) ∙ 𝑓(𝑦) = 𝑓(𝑥, 𝑦) , en este caso se tiene:
1 𝑥(1+3𝑦 2 ) 𝒙
𝑓(𝑥) = ∫0 𝑑𝑑 =
4 𝟐
2 𝑥(1+3𝑦 2 ) 𝟏 𝟑𝒚𝟐
𝑓(𝑦) = ∫0 𝑑𝑑 = +
4 𝟐 𝟐
𝑥 1 3𝑦 2 𝑥�1+3𝑦 2 �
𝑓(𝑥). 𝑓(𝑦) = � � � + �= = 𝑓(𝑥, 𝑦) , e.q.d. que X y Y son estadísticamente independientes.
2 2 2 4
6. Se supone que la estatura de los chicos de 18 años de cierta población sigue una distribución normal con media 162 cm y
desviación estándar de 12 cm. Se toma una muestra al azar de 100 de estos chicos encuestados y se calcula el valor de su estatura
media, ¿Cuál es la probabilidad de que dicho valor esté entre 159 y 165 cm?
La probabilidad de que la estatura media de los 100 chicos esté entre 159 y 165 cm es: 𝑃 (159 ≤ 𝑋� ≤ 165)
159 − 162 165 − 162
𝑃 (159 ≤ 𝑋� ≤ 165) = 𝑃 � ≤𝑍≤ � = 𝑃 (−2.5 ≤ 𝑍 ≤ 2.5) = 𝟎. 𝟗𝟗𝟗𝟗
12 12
10 10
a) Determine el modelo de regresión lineal que permita estimar la nota de un alumno en Química a partir de la nota
que obtenga en Matemáticas.
𝑆𝑆𝑆𝑆 8.9
�𝟏 =
∴ 𝜷 = = 𝟎. 𝟔𝟔𝟔𝟔
𝑆𝑆𝑆𝑆 12.8
� 𝟎 = 𝑦� − 𝛽̂1 𝑥̅ = 5.4 − (0.6953)(5.3) = 𝟏. 𝟕𝟕𝟕
𝜷
b) Indique la nota esperada en Química para un alumno que obtenga 7.5 en Matemáticas.
La nota esperada en Química es: 1.714 + 0.695(𝟕. 𝟓) ≈ 𝟔. 𝟗𝟗𝟗
PYE_SOL_1EFA_2015-2 3
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO
FACULTAD DE INGENIERÍA
DIVISIÓN DE CIENCIAS BÁSICAS
COORDINACIÓN DE CIENCIAS APLICADAS
DEPARTAMENTO DE PROBABILIDAD Y ESTADÍSTICA
SOLUCIÓN SEGUNDO EXAMEN FINAL
TIPO A
SEMESTRE 2015 -2
DURACIÓN MÁXIMA 2.0 HORAS 4 DE JUNIO DE 2015
1. Una ginecóloga está haciendo un estudio de las semanas de gestación de un feto hasta su nacimiento, para ello toma
en cierta semana una muestra de 70 datos del hospital en donde trabaja. La información obtenida se agrupó en la
siguiente tabla:
Fronteras 34.9 - 35.9 35.9 - 36.9 36.9 -37.9 37.9 -38.9 38.9-39.9 39.9-40.9 40.9-41.9 41.9-42.9 42.9-43.9
Marca de
35.4 36.4 37.4 38.4 39.4 40.4 41.4 42.4 43.4
clase
Frecuencia 4 6 9 12 13 10 8 5 3
4
Al realizar la interpolación se obtiene: 𝑥� = + 38.9 = 39.2
13
1
= [35.4(4) + 36.4(6) + 37.4(9) + 38.4(12) + 39.4(13) + 40.4(10) + 41.4(8) + 42.4(5) + 43.4(3)]
70
2747
= = 𝟑𝟑. 𝟐𝟐
70
2. Una empresa de manufactura emplea tres planos analíticos para el diseño y desarrollo de un producto específico. Por
razones de costo, los tres se emplean en momentos diferentes. De hecho, los planos 1, 2, y 3 se utilizan para 30%, 20% y
50% de los productos, respectivamente. La tasa de defectos difiere en los tres procedimientos de la siguiente manera:
𝑃(𝐷/𝑃1 ) = 0.01 ; 𝑃(𝐷/𝑃2 ) = 0.03 ; 𝑃(𝐷/𝑃3 ) = 0.02
En donde 𝑃�𝐷/𝑃𝑗 � es la probabilidad de que un producto esté defectuoso, dado el plano j.
Si se toma un producto al azar y dicho producto está defectuoso, ¿cuál de los 3 planos tiene más probabilidades de
haberse utilizado?
Por lo tanto:
𝑃(𝑃1 ∩𝐷) 0.003 3
𝑃(𝑃1 /𝐷) = = = ≈ 0.157
𝑃(𝐷) 0.019 19
3. Usando datos de PROFECO, un grupo de estudiantes de la FI encontró qué el modelo que describe el tiempo de vida
(en años) de las tabletas “Pad@” tiene la siguiente función de densidad de probabilidad.
3𝑒 −3𝑥 , 𝑥>0
𝑓(𝑥) = �
0 , 𝑒𝑒 𝑜𝑜𝑜𝑜 𝑐𝑐𝑐𝑐
𝑥�
En este caso: 𝑃(𝑋 ≤ 𝑥�) = ∫0 (3𝑒 −3𝑥 ) 𝑑𝑑 = (−𝑒 −3𝑥 )|0𝑥� = �−𝑒 −3𝑥� � + 𝑒 0 = �−𝑒 −3𝑥� � + 1
Probabilidad de que cualquiera de estas tabletas dure menos de tres meses = 𝑃(𝑋 ≤ 0.25)
0.25
𝑃(𝑋 ≤ 0.25) = ∫0 (3𝑒 −3𝑥 ) 𝑑𝑑 = (−𝑒 −3𝑥 )|0.250 = �−𝑒 −3(0.25) � + 𝑒 0 = (−0.472) + 1 = 𝟎. 𝟓𝟓𝟓
PYE_SOL_2EFA_2015-2 2
4 En una fábrica se produjeron 2000 refrigeradores, se sabe que el 5% de ellos tienen pequeños defectos en el compresor. Si
se hace una entrega de 10 refrigeradores, ¿cuál es la probabilidad de que solo 3 de ellos tengan pequeños defectos en el
compresor?
Como N=2000 es grande respecto a la muestra n=10, es posible aproximar la probabilidad deseada usando la
distribución binomial. Se tiene:
X = número de refrigeradores con pequeños defectos en el compresor
X~ BINOMIAL (n=10, p=0.05)
Por lo tanto, la probabilidad de que solo 3 de los refrigeradores entregados tengan pequeños defectos en el
compresor es: 𝑃(𝑋 = 3) = �𝑛𝑥�𝑝 𝑥 𝑞 𝑛−𝑥 = �10 3
�(0.05)3 (0.95)7 ≈ 𝟎. 𝟎𝟎𝟎𝟎
�𝑥𝑟��𝑁−𝑟
𝑛−𝑥�
�100 1900
3 �� 7 �
Y la probabilidad solicitada es: 𝑃(𝑋 = 3) = = ≈ 0.0102
�𝑁
𝑛� �2000
10 �
5. Dentro de un edificio gubernamental se encuentran ubicadas dos oficinas (A y B). En cada una de ellas puede haber
hasta 2 licenciados encargados de realizar el trámite solicitado por el ciudadano que acude a dicha oficina. Sea X el
número de licenciados disponibles en la oficina A y sea Y el número de licenciados disponibles en la oficina B en un
momento dado.
La función de probabilidad conjunta de X y Y es la siguiente:
f(x,y) y
0 1 2
0 0.10 0.04 0.02
x 1 0.08 0.20 0.06
2 0.06 0.14 0.30
a) Obtenga la probabilidad de que en ambas oficinas no haya solo un licenciado disponible, (ni en A, ni en B debe haber
solo 1 licenciado disponible).
Probabilidad de que no haya: solo un licenciado disponible en la oficina A, ni en la oficina B = 𝑃 (𝑋 ≠ 1, 𝑌 ≠ 1)
𝑃 (𝑋 ≠ 1, 𝑌 ≠ 1) = 𝑓(0,0) + 𝑓(0,2) + 𝑓(2,0) + f (2,2)
= 0.10 +0.02 + 0.06 + 0.30
∴ 𝑃 (𝑋 ≠ 1, 𝑌 ≠ 1) = 𝟎. 𝟒𝟒
b) Obtenga la probabilidad de que en ambas oficinas haya por lo menos un licenciado disponible.
Probabilidad de que en ambas oficinas haya por lo menos un licenciado disponible= 𝑃 (𝑋 ≥ 1, 𝑌 ≥ 1)
𝑃 (𝑋 ≥ 1, 𝑌 ≥ 1) = 𝑓(1,1) + 𝑓(1,2) + 𝑓(2,1) + f (2,2)
= 0.20 + 0.06 +0.14 + 0.3
∴ 𝑃 (𝑋 ≥ 1, 𝑌 ≥ 1) = 𝟎. 𝟕𝟕
c) Si se sabe que en la oficina B no hay licenciados disponibles, ¿cuál es la probabilidad de que en la oficina A haya dos
licenciados disponibles?
𝑓(2,0) 0.06
Se pide obtener : 𝑃 (𝑋 = 2 | 𝑌 = 0) = = = 0.25
𝑓𝑦 (0) 0.24
6. Sea la población formada por los elementos {5,7,8,10}. Para dicha población, obtenga la distribución muestral de la
media de las muestras de tamaño 2, sin reemplazo e ignorando el orden de los elementos.
Sea la variable aleatoria 𝑋� = valor promedio de las muestras de tamaño 2, sin reemplazo e ignorando el orden de los
elementos.
El número de distintas muestras que pueden obtenerse de la población dada es: 4C2 = 6
Los elementos que conforman cada una de las distintas muestras, así como el valor promedio de cada una de ellas se
muestran a continuación:
PYE_SOL_2EFA_2015-2 3
N°de muestra Muestra 1 Muestra 2 Muestra 3 Muestra 4 Muestra 5 Muestra 6
Elementos de la muestra (5,7) (5,8) (5,10) (7,8) (7,10) (8,10)
Valor promedio de la muestra 6 6.5 7.5 7.5 8.5 9
Al obtener la probabilidad de que 𝑋� tome cada uno de los valores anteriores, se obtiene la distribución muestral de la
media de las muestras, la cual es la siguiente:
∑ 𝑥𝑖 ∑ 𝑦𝑖 (26.5)(27)
𝑺𝑺𝑺𝑺 = ∑ 𝑥𝑖 𝑦𝑖 − = 152 − = 8.9
𝑛 5
(∑ 𝑥𝑖 )2 (26.5)2
𝑺𝑺𝑺𝑺 = ∑(𝑥𝑖 2 ) − = 148.75 − = 8.3
𝑛 5
𝑆𝑆𝑆𝑆 8.9
�𝟏 =
∴ 𝜷 = = 𝟏. 𝟎𝟎𝟎
𝑆𝑆𝑆𝑆 8.3
b) Indique la nota esperada en Matemáticas para un alumno que obtuvo 5.5 en Química.
Por lo tanto, la nota que se espera que el alumno obtenga en Matemáticas es 5.6
PYE_SOL_2EFA_2015-2 4