Escolar Documentos
Profissional Documentos
Cultura Documentos
RESUELTOS
ESTADSTICA
INFORMTICA
SISTEMAS
DELEGACIN DE ALUMNOS
CENTRO ASOCIADO DE BALEARES
COLECCIN DE EXAMENES DE ESTADSTICA
CENTRO DE ASOCIADO DE BALEARES
ESTADISTICA I (SISTEMAS)
Primera semana. 96/97
1. El tiempo que dura un proceso de validacin de datos es una variable aleatoria con funcin
de densidad:
x2/9 0<=x<=a
f(x)=
0 resto
a) Calcular a.
b) Calcular el tiempo esperado del proceso de validacin
c) Calcular la mediana de la distribucin.
2. Un jugador tiene en su bolsillo dos dados de tipo A, tres de tipo B y cuatro de tipo C. Los
dados de tipo A tienen 3 caras con el nmero 3 y otras tres con el 6. Los de tipo B tienen
dos caras de cada uno de los nmeros 2, 4 y 6. Los del tipo C tienen una cara con cada
uno de los nmeros del 1 al 6. Si el jugador elige al azar un dato y lo lanza, se pide:
a) Calcular la probabilidad de que salga un 6.
b) Suponiendo que haya salido un 3, calcular la probabilidad de que el dado elegido haya sido
del tipo A
3. En una muestra aleatoria de 400 individuos se encontraron 12 cumpliendo una condicin
determinada. Hay una evidencia suficiente para concluir que la proporcin de individuos
de esta clase es superior al 2%? (Utilice =0.05)
4. Un sistema contiene 3 componentes conectados en serie que funcionan
independientemente. Suponiendo que el tiempo de vida de estos componentes (medido en
horas) sigue una distribucin exponencial de media 1000, 3000 y 6000 horas,
respectivamente, calcular la probabilidad de que el sistema no falle antes de 100 horas.
Datos auxiliares:
a) La densidad exponencial es de la forma
1/ exp (-x/) x>0
f(x)=
0 en otro caso
b) La conexin en serie implica que el sistema falla cuando lo hace alguno de sus
componentes.
ESTADSTICA I*
(Informtica de Sistemas)
Primera Prueba Presencial. Primera Semana.
Curso 1998-99.
1. Se sabe que la cuarta parte de los habitantes de una gran ciudad tiene menos de 50
aos y que la probabilidad de que un habitante muera de cncer es 0.1 en el caso
de que tenga menos de 50 aos, y 0.2 en otro caso.
(a) Determinar la probabilidad de que un habitante, elegido al azar, no muera de
cncer.
(b) Si una persona muri de cncer, cul es la probabilidad de que tuviera menos de
50 aos?
2. Una compaa area afirma que la duracin de sus vuelos entre las ciudades A y
B se distribuye segn una ley Normal de media no superior a 1.2 horas. Sin
embargo, la competencia afirma que sto no es cierto ya que, despus de tomar 9
vuelos al azar, observ una duracin media de 1.78 horas y una cuasivarianza de
0.36. Avalan estos datos la afirmacin de la competencia? (Utilice =0.05)
Datos auxiliares: t8,0.05 =1.86 ; z0.05 =1.645 ; z0.025 =1.96
3. Una empresa compra grandes cantidades de una clase de dispositivos
electrnicos. La decisin para aceptar o rechazar un lote de dichos elementos se
toma en base a una muestra aleatoria de 100 unidades. Si el lote se rechaza
cuando se encuentran 3 ms unidades defectuosas, cul es la probabilidad de
rechazar un lote con un 1% de dispositivos defectuosos?
4. Con el fin de describir el comportamiento de una variable cuantitativa X bajo
unas condiciones determinadas, se procedi a su observacin. Los datos
registrados se resumen en la siguiente tabla de frecuencias:
__________________________________________
| X | 0 1 2 3 4 |
| Frec. abs. acumulada | 2 3 7 8 10 |
(a) Calcule la media de esta distribucin.
(b) Obtenga una medida de la dispersin.
_______________________________________
*NO se permite el uso de CALCULADORA.
Estadstica I - Sistemas
Primera Prueba Presencial. Segunda Semana. Curso 1998-99.
Examen realizado el 9 de febrero de 1999.
1. Una fbrica tiene tres plantas; el 20% de sus mquinas se montan en la primera planta, el 30% en la
segunda y el 50% restante en la tercera. Se sabe adems que la cadena de montaje falla, dando lugar a
una mquina defectuosa, con probabilidades 0.1, 0.2 y 0.15 en cada una de las tres plantas.
a) Determinar la probabilidad de que una mquina cualquiera montada en esa fbrica sea defectuosa.
b) Cul es la probabilidad de que una mquina no defectuosa se haya montado en la primera planta?
2. La tabla siguiente resume los datos obtenidos en la observacin de una variable cuantitativa X.
X 1 2 3 4 5
f 0.1 0.2 0.4 0.1 0.2
a) Calcular el coeficiente de variacin.
b) Obtener los percentiles correspondientes al 25% y al 75%
3. Un vendedor afirma que el tiempo medio de vida de las bombillas que oferta a sus clientes no es
inferior a 10 meses. Extrada una muestra aleatoria de 64 bombillas, se obtuvo un tiempo de vida
medio de 9.8 meses y una cuasivarianza muestral de 1. Avala la muestra, al nivel de significacin
alfa=0.025, la afirmacin hecha por el vendedor?
Datos auxiliares: Si F es la funcin de distribucin de la N(0,1),
F(1.96) =0.975 y F(1.645) =0.95.
4. Se supone que el voltaje medido en cierto circuito elctrico tiene una distribucin Normal con
media 120 y desviacin tpica 2. Calcule la probabilidad de que una medicin proporcione un voltaje:
a) superior a 118,
b) entre 116 y 118.
Datos auxiliares: F(1) =0.8413 y F(2) =0.9773, siendo F la funcin de distribucin de la N(0,1).
NOTA: NO se permite el uso de calculadora.
ESTADSTICA I
(Informtica de Sistemas)
Primera Prueba Presencial. Primera Semana.
Curso 2001-2002.
1. El siguiente diagrama de tallos y hojas propor-
ciona una descripcin de la naturaleza de una
coleccin de datos relativos a un aspecto cuanti-
tativo X de inters con valores en el intervalo
[0, 100].
4 2
5 5
6 9 3 8 5
7 2 9 2 1
8 4 4 8
9 2 1
Se pide:
(a) Calcular la media y la mediana de X.
(b) Obtener la desviacin tpica de X, par-
tiendo de
P
i
x
2
i
= 82169.
2. Un programa se ejecuta desde uno cualquiera
de dos perifricos: P
1
y P
2
, de acuerdo con el
siguiente protocolo: si P
1
est operativo el pro-
grama se ejecuta desde P
1
; si no lo est se reali-
za un segundo intento desde el segundo perif-
rico; si ste est operativo el programa se eje-
cuta desde P
2
, en caso contrario el programa se
queda sin ejecutar. Cada perifrico est opera-
tivo o no con independencia del estado del otro
y las probabilidades de estar operativo son: 0.8
para P
1
y 0.7 para P
2
.
(a) Determnese la probabilidad de que el pro-
grama no se ejecute.
(b) Si el programa se ha ejecutado, cul es la
probabilidad de que lo haya hecho desde el
segundo perifrico?
1 +
(x0 x)
2
vx
,
t
3;0.01
= 4.5407, t
3;0.005
= 5.8409, t
5;0.01
=
3.3649.
4. Dos algoritmos A y B permiten simular cierto
proceso. En 10 simulaciones, realizadas con
cada uno de ellos, se obtuvieron los siguientes
tiempos de ejecucin por cada simulacin
Tiempo de ejecuci on (en segundos)
A 7 10 8 9 6.5 8 7 7.5 9 8
B 7 7 6 5.5 7 8 6.5 7 7 9
Proporcionan los datos la evidencia suciente,
al nivel de signicacin = 0.05, para concluir
que hay diferencias entre los tiempos medios de
ejecucin de ambos algoritmos? Supngase nor-
malidad e igualdad de varianzas en los tiempos
de ejecucin.
Datos auxiliares: t
20;0.05
= 1.725 , t
18;0.05
=
1.734 , t
18;0.025
= 2.101 , z
0.05
= 1.645 , z
0.025
=
1.96
1
ESTADSTICA I
(Informtica de Sistemas)
Primera Prueba Presencial. Segunda Semana.
Curso 2001-2002.
1. Con el n de seleccionar el sistema ms rpido
de almacenamiento y recuperacin de datos
para un determinado tipo de procesos, se rea-
liz un experimento consistente en hacer 4 prue-
bas con cada uno de los tres sistemas conside-
rados: CD, Disco y Cinta. Los tiempos en
minutos requeridos en cada ocasin se ree-
jan en la siguiente tabla
CD Disco Cinta
8.7 7.0 7.2
9.3 6.4 9.1
7.9 9.8 7.5
8.0 8.2 7.7
Suma 33.9 31.4 31.5
Media 8.475 7.850 7.875
Varianza 0.429 2.250 0.709
Utilizando un nivel de signicacin = 0.01,
contraste la hiptesis de igualdad de los tiempos
medios.
Datos auxiliares: La variabilidad total es
11.167. F
2;11;0.01
= 7. 2057, F
2;9;0.01
= 8. 0215,
F
3;9;0.01
= 6. 9919
2. Un programa se puede ejecutar en uno
cualquiera de dos perifricos A y B, de acuerdo
con el siguiente protocolo: en un primer intento
se elige uno de los dos perifricos al azar; si est
operativo, el programa se ejecuta desde l; si no
lo est, se intenta ejecutar el programa desde el
otro perifrico; si ste no est operativo el pro-
grama se queda sin ejecutar. Cada perifrico
est operativo o no con independencia del es-
tado del otro. Las probabilidades de estar ope-
rativo son: 0.9 para A y 0.6 para B.
(a) Determnese la probabilidad de que el pro-
grama no se ejecute.
(b) Si el programa se ha ejecutado, cul es
la probabilidad de que haya sido en el se-
gundo intento?
(402014)
(Informtica de Sistemas)
Curso 2002-2003.
Primera Prueba Presencial (Primera Semana)
1. Extraemos tres dgitos al azar entre el 0 y el 9
para formar una clave. Se pide:
(a) Calcular la probabilidad de que la clave
tenga al menos dos cifras iguales.
(b) Calcular la probabilidad de que, si la clave
obtenida es un nmero par, no sea superior
a 100.
2. La lectura registrada por cierto aparato de me-
dida es una variable aleatoria X con distribu-
cin normal. En una muestra de doce lecturas,
tomadas al azar, se han observado los siguientes
valores de la variable X :
10, 15, 11, 12, 8, 13, 16, 5, 14, 5, 6, 5
(a) Dar una estimacin puntual de la media de
X. Justifquese la eleccin del estimador
que se utiliza.
(b) Obtener un intervalo de conanza, al 95%,
para la media de X.
Datos auxiliares: t
12;0.025
= 2.179 ,
t
11;0.05
= 1.796 , z
0.025
= 1.96 , t
11;0.025
=
2.201, z
0.05
= 1.645
2
4;0.05
= 9.488 ;
2
5;0.05
= 11.07
1
ESTADSTICA I
(402014)
(Informtica de Sistemas)
Curso 2002-2003.
Primera Prueba Presencial (Segunda Semana)
1. Para estudiar la posible relacin entre dos varia-
bles, X e Y , se registraron los valores de dichas
variables en una muestra aleatoria formada por
20 individuos. De la informacin recogida se
obtuvieron los siguientes datos estadsticos:
1
20
P
x
i
= 53.69
1
20
P
y
i
= 58.81
1
20
P
x
2
i
= 2948.82
1
20
P
y
2
i
= 3505.15
1
20
P
x
i
y
i
= 3197.39
Suponiendo un modelo de regresin lineal, se
puede concluir, con un nivel de signicacin
= 0.05, que la pendiente de la recta de Y
sobre X es positiva?
Datos auxiliares: t
18;0.05
= 1.734 , t
20;0.025
=
2.086 ; la estimacin insesgada de la varianza
2
vale 31.36 ; cuando
1
= 0,
1
S
R
q
1
nv
x
t
n2
.
2. La distribucin del error de medida de cierto
aparato es una variable aleatoria con distribu-
cin normal de media y varianza desconocidas.
En 10 mediciones, tomadas al azar, se obser-
varon los siguientes errores (expresados en la
unidad de medida correspondiente):
8, 10, 11, 10, 12, 10, 9, 8, 13, 9
(a) Obtener un intervalo de conanza, al 90%,
para el error de medida medio.
(b) Si la varianza del error de medida es
2
=
2.5 , obtener un nuevo intervalo, con el
mismo nivel de conanza, para la media
del error de medida. Comprelo con el
obtenido en el apartado anterior.
Datos auxiliares: z
0.1
= 1.28 , t
10;0.05
=
1.812 , z
0.05
= 1.645 , t
9;0.05
= 1.833 , t
9;0.1
=
1.383 , t
10;0.1
= 1.372
ISTICA I (SISTEMAS)
Profesores: Hilario Navarro. Jorge Martn
DEPARTAMENTO DE ESTAD
ISTICA,
INVESTIGACI
ON OPERATIVA Y C
ALCULO
NUM
ERICO
Soluciones a los problemas del examen.
Primera prueba presencial. Curso 2002-2003
Soluciones a los problemas del examen. 1
a
P. Presencial 1
Problema 1. Primera semana. Extraemos tres dgitos al azar entre el 0
y el 9 para formar una clave. Se pide:
(a) Calcular la probabilidad de que la clave tenga al menos dos cifras iguales.
(b) Calcular la probabilidad de que, si la clave obtenida es un n umero par, no
sea superior a 100.
Soluci on
(a) Se pueden formar un total de 10
3
claves con los dgitos del 0 al 9.
Denotaremos por A el suceso
A = la clave tiene al menos dos cifras iguales
Vamos a calcular la probabilidad del complementario
A
c
= todas las cifras que forman la clave son distintas
Hay 10 9 8 claves favorables al suceso A
c
; ya que la cifra de las centenas
puede ser uno cualquiera de los diez dgitos, la de las decenas uno de los
nueve restantes y la de las unidades uno cualquiera de los ocho que no
ocuparon el lugar de las centenas y decenas.
10 9 8
La probabilidad del complementario es P(A
c
) =
10 9 8
10
3
; de donde se
sigue la probabilidad pedida:
P(A) = 1 P(A
c
) = 1
10 9 8
10
3
= 1
18
25
=
7
25
.
(b) Vamos a resolver el problema utilizando dos metodos.
Metodo 1. El enunciado nos informa sobre el resultado del experimento: la
clave obtenida es un n umero par. Con esta informaci on la incertidumbre
se modica; de entrada excluiramos todas las claves impares. Por tanto,
el espacio muestral cambia y queda restringido al conjunto de todas las
claves pares entre la 0 0 0 y la 9 9 9 ; un total de 500, es decir
= {Conjunto de claves pares entre la 0 0 0 y la 9 9 9 }
2 Estadstica I (Sistemas). UNED. Curso 2002-2003
De todas ellas hay un total de 51 que no superan a 100; todos los pa-
res comprendidos entre el 0 cuya clave es 0 0 0 y el 100 con clave
1 0 0 . Consecuentemente, la probabilidad pedida ser a 51/500.
Metodo 2. Se considera el espacio muestral inicial que est a formado por el
conjunto de todas las claves comprendidas entre el 0 y el 999:
= {Conjunto de claves entre la 0 0 0 y la 9 9 9 }
A continuaci on, se consideran los sucesos
A = la clave obtenida no supera a 100
B = la clave obtenida es un n umero par
Nos est an pidiendo calcular la probabilidad condicionada
P(A|B) =
P(A B)
P(B)
.
Del conjunto de todas las claves, un total de 1000, hay 51 que son pares
menores o iguales que 100; con lo cual se tiene que P(A B) =
51
1000
.
Por otro lado, hay un total de 500 claves que son pares; luego se obten-
dr a que P(B) =
500
1000
.
Por tanto, la probabilidad pedida es
P(A|B) =
51/1000
500/1000
=
51
500
.
n
i=1
X
i
n
.
Se propone este estimador porque es insesgado para el par ametro media de
la variable poblacional X que se desea estimar. Con la muestra obtenida,
la estimaci on resulta:
x =
10 + 15 + 11 + 12 + 8 + 13 + 16 + 5 + 14 + 5 + 6 + 5
12
= 10
(b) Puesto que la variable aleatoria poblacional es normal de varianza desco-
nocida, la cantidad pivotal que utilizamos para construir el intervalo de
conanza pedido es la basada en la distribuci on t de Student, que elimina
el efecto de la varianza poblacional:
U =
X
S/
n
t
n1
donde
es la media de la variable X.
X
S/
12
2.201) = P(2.201
S
12
X 2.201
S
12
),
despejando en la desigualdad anterior la media , se obtiene que
_
X 2.201
S
12
,
X + 2.201
S
12
_
es un intervalo aleatorio que cubre a con probabilidad 0.95.
Una vez que se ha extrado la muestra, el intervalo anterior deja de ser
aleatorio, ya que los estimadores se sustituyen por sus valores en la mues-
tra. Para la muestra extrada el intervalo de conanza que resulta es
_
10 2.201
4.1
12
, 10 + 2.201
4.1
12
_
.
x
i
= 517
y
i
= 346
1
14
x
2
i
= 2792.5
1
14
y
2
i
= 1246.7
1
14
x
i
y
i
= 1844.6
Se pide:
(a) Calcular la pendiente de la recta de regresi on de Y sobre X.
(b) Obtener una medida del ajuste de dicha recta a la nube de puntos.
Datos auxiliares: Coeciente de correlaci on r = 0.98
Soluci on
(a) La pendiente de la recta de regresi on de Y sobre X viene dada por el
cociente
cov
x,y
v
x
=
1
n
n
i=1
x
i
y
i
x y
1
n
n
i=1
x
2
i
x
2
o, alternativamente,
cov
x,y
v
x
= r
_
v
y
v
x
Soluciones a los problemas del examen. 1
a
P. Presencial 5
Sustituyendo en la primera expresi on queda
1844.6
_
517
14
_ _
346
14
_
2792.5
_
517
14
_
2
(b) La varianza residual se dene como el error cuadr atico medio cometido
con la recta de regresi on de Y sobre X. Entonces, su valor nos dar a una
medida del ajuste de dicha recta a la nube de puntos. Con los datos del
enunciado obtenemos
v
y
=
1
n
n
i=1
y
2
i
y
2
= 1246.7
_
346
14
_
2
= 635.9
y
V arianza residual = 635.9
_
1 0.98
2
_
= 25.18
Sin embargo, si queremos una medida del error con mayor capacidad de
interpretaci on, deberemos calcular el valor relativo dado por el cociente
V arianza residual
v
y
= 1 r
2
o, equivalentemente, tomar el coeciente r
2
como una medida del grado
de ajuste: un valor pr oximo a 1 reejar a un buen ajuste y un valor cer-
cano al 0 indicar a la cualidad contraria. En denitiva, podramos calcular
directamente
r
2
= 0.96
concluyendo que, en este caso, el ajuste es bastante bueno.
2
=
5
i=1
(O
i
e
i
)
2
e
i
. Los resultados se muestran en la siguiente tabla
Clases O
i
e
i
(O
i
e
i
)
2 (O
i
e
i
)
2
e
i
5
i=1
(O
i
e
i
)
2
e
i
Menores que 0.22 6 8 4 4/8 1.25
0.22 0.51 8 8 0 0
0.51 0.92 10 8 4 4/8
0.92 1.61 7 8 1 1/8
Mayores que 1.61 9 8 1 1/8
El procedimiento que vamos a aplicar consiste en rechazar la hip otesis de interes
para el nivel de signicaci on si se satisface la desigualdad
5
i=1
(O
i
e
i
)
2
e
i
>
2
51;
En nuestro caso, el estadstico proporciona el valor 1.25 y, seg un los datos auxi-
liares,
2
4;0.05
= 9.488. Como consecuencia, no hay suciente evidencia al nivel
de signicaci on 0.05 contra la hip otesis de que el tiempo de respuesta sigue
una distribuci on exponencial con par ametro = 1 seg.
x
i
= 53.69
1
20
y
i
= 58.81
1
20
x
2
i
= 2948.82
1
20
y
2
i
= 3505.15
1
20
x
i
y
i
= 3197.39
Suponiendo un modelo de regresi on lineal, se puede concluir, con un nivel
de signicaci on = 0.05, que la pendiente de la recta de Y sobre X es positiva?
Datos auxiliares: t
18;0.05
= 1.734 , t
20;0.025
= 2.086 ; la estimaci on inses-
gada de la varianza
2
vale 31.36 ; cuando
1
= 0,
1
S
R
_
1
nv
x
t
n2
.
Soluciones a los problemas del examen. 1
a
P. Presencial 7
Soluci on
La pregunta alude al contraste
H
0
:
1
0 , H
1
:
1
> 0
Entonces, al nivel = 0.05, rechazaremos la hip otesis nula concluyendo que
1
es positiva cuando
1
S
R
_
1
20v
x
> t
18;0.05
Con los datos de este ejercicio resulta:
1
=
cov
x,y
v
x
=
3197.3953.6958.81
2948.8253.69
2
= 0.60
S
R
=
31.36 = 5.6
_
1
20(2948.8253.69
2
)
= 0.03
y, como consecuencia,
1
S
R
_
1
nv
x
=
0.6
5.6 0.03
= 3.57
Dado que t
18;0.05
= 1.734, los datos nos permiten concluir que la pendiente
1
es positiva.
n
t
n1
siendo
8 Estadstica I (Sistemas). UNED. Curso 2002-2003
la media del error de medida.
X la media muestral.
S
2
la cuasivarianza muestral.
n el tama no muestral.
En este caso, para la muestra extrada de tama no n = 10, se tiene que
x =
8 + 10 + 11 + 10 + 12 + 10 + 9 + 8 + 13 + 9
10
= 10
S
2
=
1
n 1
n
i=1
(x
i
x)
2
=
(8 10)
2
+ (10 10)
2
+ + (9 10)
2
9
= 2.67
Emplearemos el mismo procedimiento que en el problema 2 de la primera
semana. Ahora el tama no muestral es 10 y la cantidad pivotal U tiene
distribuci on t con 9 grados de libertad. Puesto que la probabilidad de que
U este comprendida entre los valores t
9;0.05
= 1.833 y t
9;0.05
= 1.833,
obtenidos de las tablas de la t
9
, es 0.90 area sombreada de la gura 2
se obtendr a que
0.90 = P(1.833
X
S/
10
1.833) = P(1.833
S
10
X 1.833
S
10
).
Despejando en la desigualdad anterior , resulta que
_
X 1.833
S
10
,
X + 1.833
S
10
_
es un intervalo aleatorio que cubre a con probabilidad 0.90.
1.833 1.833
Figura 2: Funci on de densidad de una t
9
Para la muestra obtenida, el intervalo con nivel de conanza del 90 % ser a
_
10 1.833
2.67
10
, 10 + 1.833
2.67
10
_
.
Soluciones a los problemas del examen. 1
a
P. Presencial 9
(b) Puesto que ahora la varianza de la poblaci on es
2
= 2.5 conocida, no
recurrimos, como hacamos en el apartado anterior, a la distribuci on t,
que elimina el efecto de la varianza. Utilizaremos la cantidad pivotal con
distribuci on normal dada por
V =
X
/
n
N(0, 1)
donde
es la media del error de medida.
2
es la varianza de la poblaci on. En este caso
2
= 2.5
n es el tama no muestral.
Al igual que en el apartado anterior, encontramos el intervalo que contiene
a V con una probabilidad de 0.90. La distribuci on N(0, 1), que rige su
comportamiento aleatorio, nos abre el camino. La probabilidad de que
V , o equivalentemente, una N(0, 1), este comprendida entre los valores
z
0.05
= 1.645 y z
0.05
= 1.645, obtenidos de las tablas de la normal, es
0.90 ( area sombreada de la gura 3).
1.645 1.645
Figura 3: Funci on de densidad de una N(0, 1)
Por tanto, se tendr a que
0.90 = P(1.645
2.5/
10
1.645) = P(1.645
2.5
10
X 1.645
2.5
10
)
Despejando en la desigualdad, resulta el siguiente intervalo de extremos
aleatorios que cubre al error medio de medida con probabilidad 0.90
_
X 1.645
2.5
10
,
X + 1.645
2.5
10
_
Reemplazado el valor de la media muestral que resulta de la muestra
extrada, obtendremos el siguiente intervalo con nivel de conanza del
90 %:
10 Estadstica I (Sistemas). UNED. Curso 2002-2003
_
10 1.645
2.5
10
, 10 + 1.645
2.5
10
_
.
Puesto que para la muestra extrada S
2
2
, las longitudes de ambos
intervalos est an caracterizadas por los cuantiles t
9;0.05
y z
0.05
de las dis-
tribuciones t y normal; el primero es mayor que el segundo ya que la
distribuci on t tiene colas m as pesadas que la normal. Esto explica que el
intervalo de conanza basado en la t tenga mayor longitud que el basado
en la normal.
k=1
kP(X = k) =
1
n
n
k=1
k.
Calcular este sumatorio es un ejercicio sencillo si se tiene en cuenta que la
suma de cada dos terminos del sumatorio que equidistan de los sumandos
extremos es igual a la suma de estos:
1 2 3 n 2 n 1 n
n n 1 n 2 3 2 1
n + 1 n + 1 n + 1 n + 1 n + 1 n + 1
De lo anterior se sigue que 2
n
k=1
k = n(n + 1), es decir,
E{X} =
1
n
n
k=1
k =
n + 1
2
.
Cuando n = 1000, el n umero medio de intentos es 1001/2.
El razonamiento recurrente nos proporciona de nuevo un procedimiento
de c alculo de la media que evita cuentas engorrosas como las anteriores.
Denotamos por
n
el n umero medio de intentos en una lista con n registros.
Si el registro buscado est a en la primera posici on de la la, lo cual ocurre
con probabilidad 1/n, se realiza un intento y se acaba la b usqueda. En
cambio, si no est a, lo cual ocurre con probabilidad
(n 1)
n
, contamos un
intento y comenzaremos a buscar en una lista con n 1 registros; con lo
que, en este caso, el n umero medio de intentos ser a 1 +
n1
.
Soluciones a los problemas del examen. 1
a
P. Presencial 13
De este razonamiento resulta la siguiente ecuaci on recurrente:
n
=
1
n
+
n 1
n
(1 +
n1
) (2)
con la condici on inicial
1
= 1 (en una lista con un solo registro se localiza
el buscado en un intento).
Poniendo Q
n
= n
n
, la ecuaci on recurrente 2 se transforma en
Q
n
= Q
n1
+n con Q
1
=
1
= 1 (3)
Es posible que no sepas resolver esta ecuaci on en diferencias. Realmente
no lo necesitas, ya que el enunciado tan s olo te pide que encuentres
1000
=
Q
1000
1000
. Seguro que s sabes programar un bucle que realice el c alculo. Las
siguientes cinco lneas de c odigo te resultar an familiares.
Q=1
for n = 2 to 1000
Q=Q+n
next n
Q/1000
Para los acionados a resolver problemas, vamos a solucionar 3.
Ensayamos para Q
n
una soluci on de la forma: Q
n
= a+bn+cn
2
. Partiendo
de la condici on inicial, basta aplicar la recurrencia dos veces para obtener
Q
1
= 1 Q
2
= 3 Q
3
= 6
Sustituyendo los valores n = 1, n = 2 y n = 3 en la soluci on general, se
llega al siguiente sistema de ecuaciones.
a +b +c = 1
a + 2b + 4c = 3
a + 3b + 9c = 6
La soluci on del sistema es a = 0, b = 1/2, c = 1/2; con lo que
n
=
Q
n
n
=
1
n
_
n
2
+
n
2
2
_
=
n + 1
2
i
(x
i
x)
2
Soluciones a los problemas del examen. 1
a
P. Presencial 15
o, equivalentemente,
v
x
=
1
n
i
x
2
i
x
2
=
1
26
_
325
2
+ 325
2
+ 334
2
+... + 424
2
_
370.7
2
ESTADSTICA I
(402014)
(Informtica de Sistemas)
Curso 2002-2003.
Septiembre (Original)
1. Se est realizando un estudio sobre los fallos
de un dispositivo electrnico. Este elemento se
puede montar en dos posiciones diferentes y hay
cuatro tipos de fallos posibles. Un muestreo
aleatorio proporciona la siguiente distribucin
de frecuencias:
Tipo de fallo
Posicin de Montaje A B C D
1 14 18 8 20
2 6 12 12 10
Concluira que el tipo de fallo es independiente
de la posicin de montaje?
Datos auxiliares:
t
3;0.025
= 3.182 ,
8;0.05
= 15.507 ,
3;0.05
= 7.815, z
0.05
= 1.645
2. Cierto aparato registra el nivel de saturacin
de la red elctrica en una comarca. El error
relativo porcentual de la medida dada por el
aparato es una variable aleatoria continua X
con funcin de distribucin
F(x) =
0 si x < 0
1 (1 x)
3
si 0 x 1
1 si x > 1
Determinar:
(a) La funcin de densidad de la variable X.
(b) La probabilidad de que una medida regis-
trada por el aparato tenga un error entre
el 0.1% y el 0.2%.
(c) El error relativo medio.
ISTICA I (SISTEMAS)
Profesores: Hilario Navarro. Jorge Martn
DEPARTAMENTO DE ESTAD
ISTICA,
INVESTIGACI
ON OPERATIVA Y C
ALCULO
NUM
ERICO
Soluciones a los problemas del examen.
Convocatoria de septiembre. Curso 2002-2003
Soluciones a los problemas del examen. Convocatoria de septiembre 1
Problema 1. Se est a realizando un estudio sobre los fallos de un dispositivo
electr onico. Este elemento se puede montar en dos posiciones diferentes y hay
cuatro tipos de fallos posibles. Un muestreo aleatorio proporciona la siguiente
distribuci on de frecuencias:
Tipo de fallo
Posici on de Montaje A B C D
1 14 18 8 20
2 6 12 12 10
Concluira que el tipo de fallo es independiente de la posici on de montaje?
Datos auxiliares:
t
3;0.025
= 3.182,
8;0.05
= 15.507,
3;0.05
= 7.815, z
0.05
= 1.645
Soluci on
Rechazaremos la hip otesis nula (Posici on de Montaje independiente del Tipo
de Fallo), con un nivel de sgnicaci on , si
4
j=1
2
i=1
(o
ij
e
ij
)
2
e
ij
>
2
(21)(41);
El enunciado nos proporciona la frecuencia observada (o
ij
); multiplicando las
correspondientes frecuencias marginales y dividiendo por el tama no de la mues-
tra obtenemos la frecuencia esperada bajo la hip otesis nula (e
ij
):
Tipo de fallo
Posici on de Montaje A B C D
1 12 18 12 18 60
2 8 12 8 12 40
20 30 20 30 100
Con estos datos podemos realizar la operaci on (o e)
2
/e para cada celda de la
tabla, resultando:
Tipo de fallo
Posici on de Montaje A B C D
1 4/12 0 16/12 4/18
2 4/8 0 16/8 4/12
Entonces,
4
j=1
2
i=1
(o
ij
e
ij
)
2
e
ij
=
4 + 16 + 4
12
+
16 + 4
8
+
4
18
=
144 + 180 + 16
72
=
340
72
4.7
2 Estadstica I (Sistemas). UNED. Curso 2002-2003
Como 4.7 <
2
3;0.05
= 7.815, concluimos que, con un nivel de signicaci on =
0.05, la condici on de independencia es aceptable.
_
0 si x < 0
1 (1 x)
3
si 0 x 1
1 si x > 1
Determinar:
(a) La funci on de densidad de la variable X.
(b) La probabilidad de que una medida registrada por el aparato tenga un
error entre el 0.1 % y el 0.2 %.
(c) El error relativo medio.
Soluci on
(a) La representaci on gr aca de la funci on de distribuci on F(x) es la que
aparece en la gura 1.
0 1 2 1 2
1
Figura 1: Funci on de distribuci on de la variable aleatoria X
Puesto que la variable X es continua, la funci on de densidad se obtiene
derivando la de distribuci on. Dicha funci on viene dada por
f(x) = F
(x) =
_
_
0 si x < 0
3(1 x)
2
si 0 x 1
0 si x > 1
Su representaci on gr aca es la que aparece en la gura 2.
Soluciones a los problemas del examen. Convocatoria de septiembre 3
0 1 2 1 2
1
2
Figura 2: Funci on de densidad de la variable aleatoria X
(b) El error de medida est a entre el 0.1 % y el 0.2 % cuando 0.1 X 0.2.
Por tanto, la probabilidad pedida ser a
P(0.1 X 0.2) =
_
0.2
0.1
f(x) dx = 3
_
0.2
0.1
(1 x)
2
dx = 0.217.
Esta probabilidad es el area sombreada de la gura 3.
0 1 2 1 2
1
2
Figura 3: P(0.1 X 0.2)
Un modo alternativo de llegar al mismo resultado es haciendo uso de la
funci on de distribuci on dada en el enunciado del problema.
P(0.1 X 0.2) =
_
0.2
0.1
f(x) dx =
_
0.2
f(x) dx
_
0.1
f(x) dx
= F(0.2) F(0.1) = 1 (1 0.2)
3
(1 (1 0.1)
3
) = 0.217.
(c) Finalmente, en este apartado nos est an pidiendo la media de la variable
aleatoria X que mide el error, la cual viene dada por
E{X} =
_
xf(x) dx = 3
_
1
0
x(1x)
2
dx = 3
_
x
2
2
2x
3
3
+
x
4
4
__
1
0
=
1
4
X
0
S/
n
t
n1
,
donde
0
: la media poblacional bajo H
0
. En este caso
0
= 18.
n
> t
n1;
_
,
siendo el nivel de signicaci on y t
n1;
el cuantil 1 de una distribuci on
t con n 1 grados de libertad, es decir, el valor de la distribuci on que verica
que P(t
n1
t
n1;
) = 1 .
En este caso, para un tama no muestral n = 25 y un nivel de signicaci on
= 0.01, la regi on crtica zona sombreada de la gura 4 viene dada por
R =
_
X 18
S/5
> t
24;0.01
= 2.192
_
.
Para la muestra extrada se obtendr a que
X 18
S/5
=
18.5 18
1/5
= 2.5 R,
lo cual conduce a rechazar la hip otesis nula de que la cantidad media de cereal
cosechada por m
2
es de 18 Kg.
Soluciones a los problemas del examen. Convocatoria de septiembre 5
2.192
Figura 4: Funci on de densidad de una t
24
ESTADSTICA I
(402014)
(Informtica de Sistemas)
Curso 2002-2003.
Septiembre (Reserva)
1. Se pretende describir el comportamiento de dos
variables cuantitativas, X e Y, en una poblacin
determinada. Tras un estudio estadstico, se
realiza un informe en el que aparecen los si-
guientes datos:
La recta de regresin de Y sobre X es:
Y = 0.24X + 1.80
Coeciente de correlacin lineal : 0.21
Varianza de Y : 120.5
Varianza residual ( Y sobre X): 10.25
Detecte y comente los errores que contiene este
informe.
2. La variable aleatoria X, que mide en das
el tiempo de funcionamiento de determinados
equipos, hasta que comienzan a presentar fallos,
tiene la siguiente funcin de densidad:
f(x) =
0 si x 0,
1
1000
e
x/1000
si x > 0 .
Determinar:
(a) La probabilidad de que uno de estos
equipos dure al menos 100 das.
(b) La probabilidad de que un equipo que no
ha fallado en 100 das, comience a hacerlo
antes de 500.
(c) Si un sistema est formado por tres de es-
tos equipos conectados en serie, cul es
la probabilidad de que el sistema funcione
correctamente durante al menos 300 das?
Supngase que cada equipo funciona con
independencia de los otros.
ISTICA (SISTEMAS)
Profesores: Hilario Navarro. Jorge Martn
DEPARTAMENTO DE ESTAD
ISTICA,
INVESTIGACI
ON OPERATIVA Y C
ALCULO
NUM
ERICO
Soluciones a los problemas de examen.
Primera prueba presencial. Curso 2003-2004
Soluciones a los problemas del examen. 1
a
P. Presencial 1
Problema 1. Primera semana. Partiendo de 10 observaciones del par
(X, Y ), y con el n de estudiar la asociaci on entre dichas variables, se calcularon
la recta de regresi on de Y sobre X y el coeciente de correlaci on muestral,
resultando:
Y = 25.5 + 3.6X ; r = 0.90,
respectivamente. Tambien se sabe que la varianza de X es 16. Se pide:
(a) Calcular la varianza de la variable Y .
(b) Cu anto vale la covarianza entre ambas variables?
Soluci on
(a) La pendiente (pend) de la recta de regresi on de Y sobre X se relaciona con
la varianza de Y a traves de la siguiente igualdad
pend =
cov
x,y
v
x
= r
_
v
y
v
x
Con los datos del enunciado resulta
v
y
=
_
pend
r
_
2
v
x
=
_
3.6
0.9
_
2
16 = 256
(b) Para el c alculo de la covarianza se puede utilizar
cov
x,y
= r
v
x
v
y
o bien,
cov
x,y
= pend v
x
De cualquier modo, se obtiene que
cov
x,y
= 57.6
2
=
10
i=1
(O
i
e
i
)
2
e
i
y comparar con el dato que nos proporciona la distribuci on
2
9
(9 grados de
libertad) para el nivel de signicaci on seleccionado.
Respecto al c alculo del estadstico, el enunciado nos proporciona la frecuen-
cia observada (O
i
) en una muestra aleatoria de tama no 200, mientras que la
frecuencia esperada (e
i
) bajo la hip otesis de que los 10 dgitos fuesen igualmen-
te probables es, en cada caso, 20. Entonces,
(O
i
e
i
)
2
: 100, 0, 1, 1, 1, 25, 1, 4, 25, 36
y
10
i=1
(O
i
e
i
)
2
e
i
=
194
20
= 9.7
Entre los datos auxiliares encontramos
2
9;0.05
= 16.92; entonces, dado que
9.7 < 16.92
las desviaciones observadas no son signicativas, al nivel = 0.05, y por tanto,
aceptamos la hip otesis de que en la poblaci on los 10 dgitos son equiprobables.
i=1
X
i
es un estimador insesgado
de la media poblacional , ya que E{
X} =
1
n
n
i=1
E{X
i
} = .
Para la muestra extrada la estimaci on viene dada por
Soluciones a los problemas del examen. 1
a
P. Presencial 5
x =
1 + 2 + 5 + 1 + 3 + 7 + 4 + 2 + 3 + 2
10
= 3.
(b) La muestra obtenida ha proporcionado un valor para la media muestral de
x = 3. Se trata de comprobar si ese valor proporciona evidencia estadstica
en favor de la hip otesis de que la media poblacional es = 3.5 o por el
contrario apoya la alternativa de que es inferior.
El problema se plantea en terminos de un contraste de hip otesis en el que
H
0
: = 3.5 H
1
: < 3.5.
Dado que la variable aleatoria poblacional sigue una distribuci on normal
de media y varianza desconocidas, el contraste se lleva a cabo utilizando
la cantidad pivotal
X
0
S/
n
t
n1
,
donde
0
: la media poblacional bajo H
0
. En este caso
0
= 3.5.
X: media muestral.
S
2
: cuasivarianza muestral.
n: tama no muestral.
La regi on crtica del test conjunto de todas las muestras para las que se
rechaza H
0
viene dada por
R =
_
(X
1
, X
2
, . . . , X
n
) :
X
0
S/
n
< c
_
donde el punto crtico c se determina con la condici on del nivel de signi-
caci on, la cual viene dada por:
P
H
0
((X
1
, X
2
, . . . , X
n
) R) = P
_
X
0
S/
n
< c
_
= P(t
n1
< c) = 0.01.
En este caso, para un tama no muestral de n = 10, el punto crtico vale
c = 2.821, ya que para una distribuci on t con 9 grados de libertad se
tiene que P(t
9
< 2.821) = 0.01 (vease la gura 1, en la que el area de
la regi on sombreada coincide con el nivel de signicaci on = 0.01). Por
tanto, la regi on crtica R est a denida por R =
_
X
0
S/
n
< 2.821
_
.
6 Estadstica (Sistemas). UNED. Curso 2003-2004
2.821
0.01
Figura 1: Punto crtico para una t
9
( = 0.01)
Para la muestra extrada, se sabe que x = 3 y que
S
2
=
1
n 1
n
i=1
(X
i
X)
2
=
(1 3)
2
+ (2 3)
2
+ + (2 3)
2
9
=
32
9
,
de donde se sigue que
X
0
S/
n
=
3 3.5
_
32/90
= 1.5
_
10
32
/ R.
Consecuentemente, la muestra extrada no proporciona evidencia estadsti-
ca como para rechazar H
0
y mantendremos la armaci on de que la media
de la poblaci on es 3.5.
i=1
P(A
c
|X = i)P(X = i) =
1
6
6
i=1
_
1
2
_
i
=
1
6
(1/2)
6
(1/2) (1/2)
(1/2) 1
=
1
6
_
2
6
1
2
6
_
=
21
128
,
de donde se obtendr a que P(A) = 1 P(A
c
) = 1
21
128
=
107
128
.
(b) La informaci on dada sobre el resultado del experimento aleatorio: se ha
obtenido alguna cara modica las probabilidades a priori de las distintas
puntuaciones del dado. Nos est an pidiendo recalcular la probabilidad de
que X = 1, conocida dicha informaci on, es decir, hallar la probabilidad a
posteriori P(X = 1|A).
Este es un ejemplo tpico de aplicaci on de la regla de Bayes para el que
P(X = 1|A) =
P({X = 1} A)
P(A)
=
P(A|X = 1)P(X = 1)
P(A)
=
[1 P(A
c
|X = 1)]P(X = 1)
P(A)
=
_
1
1
2
_
1
6
107
128
=
32
321
.
i=1
(X
i
X)
2
=
n
n 1
v
2
x
,
donde v
2
x
es la varianza muestral cuyo valor es proporcionado por el
enunciado.
Por tanto, la estimaci on insesgada vendr a dada por S
2
=
11
10
5 = 5.5.
10 Estadstica (Sistemas). UNED. Curso 2003-2004
(b) El enunciado pide realizar un contraste de hip otesis para la varianza de
la poblaci on
2
, con una hip otesis nula que postula que la varianza es 4.5
frente una alternativa que arma que es mayor:
H
0
:
2
= 4.5 H
1
:
2
> 4.5.
El objetivo es comprobar si la evidencia proporcionada por la muestra,
descrita en terminos de la cuasivarianza muestral, corrobora la hip otesis
nula o, por el contrario, la desacredita. Para ello, utilizaremos la cantidad
pivotal que corresponde a la situaci on planteada.
Dado que la distribuci on poblacional es normal, llevaremos a cabo el con-
traste empleando el estadstico:
(n 1)S
2
2
0
2
n1
,
donde
2
0
: varianza poblacional bajo H
0
. En este caso
2
0
= 4.5.
S
2
: cuasivarianza muestral. Para la muestra extrada se obtuvo en el
apartado anterior que S
2
= 5.5.
n: tama no muestral. En este caso n = 11.
La regi on crtica del contraste conjunto de muestras para las que se
rechaza H
0
viene dada por
R =
_
(X
1
, X
2
, . . . , X
n
) :
(n 1)S
2
2
0
> c
_
,
donde el punto crtico c se determina con la condici on del nivel:
P
H
0
((X
1
, X
2
, . . . , X
n
) R) = P
_
(n 1)S
2
2
0
> c
_
= P(
2
n1
> c) = 0.05.
18.307
0.05
Figura 2: Punto crtico para una
2
10
( = 0.05)
Soluciones a los problemas del examen. 1
a
P. Presencial 11
En este caso, para un tama no muestral de n = 11, el punto crtico vale
c = 18.307, ya que para una distribuci on
2
con 10 grados de libertad se
cumple que P(
2
10
> 18.307) = 0.05 vease la regi on sombreada en la
gura 2.
Para la muestra extrada, el valor de la cuasivarianza se sabe que es S
2
=
5.5; con lo cual
(n 1)S
2
2
0
=
10 5.5
4.5
< 18.307, es decir, la muestra
no pertenece a la regi on crtica. Por tanto, la decisi on que adoptaremos
ser a aceptar, con un nivel de signicaci on de = 0.05, la hip otesis nula
de que el valor de la varianza poblacional es 4.5.