Você está na página 1de 5

Examen Final

Estadstica II
18 de Enero de 2010

Contesta a los siguientes ejercicios en las hojas de examen de la Universidad.


No olvides poner tu nombre y tu grupo reducido en todas las hojas.
Emplea hojas distintas para los diferentes ejercicios.

1. El tiempo que tardan las cajeras de un supermercado en cobrar a los clientes sigue una
distribuci
on normal. Para una muestra aleatoria de 15 clientes se obtuvieron los siguientes
tiempos (en minutos):
5 6,2 4,8 5,2 5,2 6,4 4,9 5,3 4,2 5 5,9 5,1 6 4,9 5
a) (0,5 puntos) Calcula estimaciones insesgadas para la media y varianza.
b) (1 punto) Halla un intervalo de confianza al 95 % para el tiempo medio que se tarda
en cobrar a los clientes.
c) (1 punto) Podramos rechazar la hipotesis de que el tiempo medio que se tarda en
cobrar a los clientes es de 5,4 minutos, a un nivel de significacion del 5 %? Razona tu
respuesta.
d ) (0,5 puntos) Cu
al sera la respuesta a la pregunta del apartado anterior si cambiamos
el nivel de significaci
on del 5 % al 1 %?
Soluci
on.
a) Las estimaciones son
x
=
s2x =

79,1
= 5,2733
15
4,9693
= 0,35495
14

b) El intervalo de confianza es


sx
x
t/2,n1
n

0,59578
5,2733 2,145
15


(4,9434; 5,6033)

c) No podramos rechazar H0 : = 5,4, porque 5,4 esta contenido en el intervalo anterior, a un nivel de confianza del 95 %.
d ) Al aumentar el nivel de confianza, si mantenemos todo lo demas igual, aumenta la
amplitud del intervalo, luego si 5,4 esta contenido en el intervalo a un 95 %, tambien
lo estar
a a un 99 %. Por tanto no podemos rechazar H0 : = 5,4 a un nivel de
significaci
on de 1 %.
2. Un anuncio televisivo de una compa
na de seguros fue emitido en dos versiones: una de
duracion normal (30 segundos) y otra de duracion reducida (24 segundos). En una muestra
aleatoria simple de 60 personas que vieron la version normal, 15 de ellas recordaban la
marca de la compa
na aseguradora 2 das despues. En otra muestra aleatoria simple de 75
personas que vieron la versi
on reducida, independiente de la anterior, 30 de ellas recordaban
la marca 2 das despues.
Para un nivel de significaci
on del 5 %, contrasta la hipotesis de que la proporcion verdadera de recuerdo entre espectadores de la version normal, pn , es menor que la proporci
on
verdadera de recuerdo entre los espectadores de la version reducida, pc .
En tu respuesta debes incluir:

a) (0,5 puntos) La especificaci


on de las hipotesis nula y alternativa para este contraste.
b) (1 punto) La expresi
on de la region crtica o del p-valor en funcion del estadstico del
contraste.
c) (1 punto) Los c
alculos necesarios para evaluar si los datos pertenecen a la regi
on
crtica, o para obtener el p-valor.
d ) (0,5 puntos) Tu conclusi
on sobre el contraste.
Soluci
on.
a) H0 : pn pc pn pc 0

vs.

H1 : pn < pc pn pc < 0

b) Estadstico del contraste (aproximado):


Pn Pc (pn pc )
q

P0 (1 P0 )

1
n1

N (0, 1)

1
n2

La regi
on crtica corresponde a:
R = {z : z < z } = {z : z < 1,645}
El p-valor se obtiene del valor del estadstico para los valores muestrales, bajo la
hip
otesis nula,
pn pc
q
z=p
p0 (1 p0 ) n11 + n12
calculando para Z N (0, 1),
p-valor = P(Z z)
c) Valor del estadstico:
pn = 15/60 = 0,25
pc = 30/75 = 0,4
p0 = (15 + 30)/(60 + 75) = 45/135 = 0,33
pn pc
p
z = p
p0 (1 p0 ) 1/n1 + 1/n2
0,25 0,4
p
= p
= 1,8371
0,33(0,67) 1/60 + 1/75
Para la regi
on crtica
R = {z : z < 1,645},
el valor z = 1,84 pertenece a R, y por tanto rechazamos la hipotesis nula al 5 % de
significaci
on.
Equivalentemente,
p-valor = P(Z 1,84) = P(Z > 1,84) = 0,0331
Como el p-valor es menor que = 0,05, rechazamos la hipotesis nula a este nivel.
d ) Conclusi
on: Para el nivel de significacion indicado, disponemos de evidencia suficiente
para concluir que la tasa de recuerdo de la marca es mayor entre los espectadores de
la versi
on reducida.

3. Una empresa de comida r


apida esta interesada en conocer la relacion existente entre el
n
umero de folletos publicitarios repartidos semanalmente (x) y el beneficio en euros por
las ventas a domicilio (y). Los resultados de ajustar un modelo de regresion lineal entre
ambas variables observadas durante 20 semanas se muestran a continuacion:
Regression Analysis - Linear model: Y = a + b*X
----------------------------------------------------------------------------Dependent variable: Ventas
Independent variable: No. folletos
----------------------------------------------------------------------------Standard
T
Parameter
Estimate
Error
Statistic
P-Value
----------------------------------------------------------------------------Intercept
1083,83
42,0395
25,7812
0,0000
Slope
1,0584
0,0644815
16,414
0,0000
----------------------------------------------------------------------------Analysis of Variance
----------------------------------------------------------------------------Source
Sum of Squares
Df Mean Square
F-Ratio
P-Value
----------------------------------------------------------------------------Model
446354,0
1
446354,0
269,42
0,0000
Residual
29821,0
18
1656,72
----------------------------------------------------------------------------Total (Corr.)
476175,0
19

Para los datos observados se tiene la informacion siguiente:


x
= 636,5,

y = 1757,502,

s2X = 20971,3,

cov(x, y) = 22196,02

Adem
as, si yi = 0 + 1 xi y ei = yi yi , se tiene que
20
X
i=1

(
yi y)2 = 446354,

20
X

e2i = 29821

i=1

a) (0,5 puntos) Determinar la recta de regresion de las ventas sobre el n


umero de folletos.
b) (1 punto) Calcular un intervalo de confianza al 95 % para la pendiente de la recta de
regresi
on.
c) (1 punto) Contrastar la hipotesis de que la pendiente de dicha recta es distinta de
cero con un nivel de significacion del 5 %. Podra afirmarse que la venta del producto
depende linealmente del n
umero de folletos publicitarios repartidos?
d ) (1 punto) Estimar el valor del beneficio promedio en euros para aquellas semanas en
las que se repartan 550 folletos publicitarios. Calcular un intervalo de confianza al
95 % para dicha estimaci
on.
e) (0,5 puntos) Calcular e interpretar el valor del coeficiente de determinacion R2 .
Soluci
on.

a) Consideramos las variables


X =

N
umero de folletos repartidos semanalmente

Ventas semanales en euros

Estimamos un modelo de regresion simple:


yi = 0 + 1 xi + ui ,
donde yi son las ventas de la semana i-esima y xi representa el n
umero de folletos
repartidos esa semana. En la tabla de resultados podemos observar que la estimaci
on
del intercepto (intercept) es 0 = 1083,83 y la estimacion de la pendiente (slope) es
1 = 1,0584. Luego la recta de regresion es:
yi = 1083,83 + 1,0584xi
b) El intervalo de confianza para 1 tiene la forma,
s

1 tn2,/2

s2R
(n 1)s2X

Si observamos la tabla de resultados obtenemos la estimacion de la pendiente y su


error est
andar:
1 = 1,0584
s

s2R
(n 1)s2X

= 0,06448

Como tn2,/2 = t18,0,025 = 2,101, el intervalo de confianza para 1 al 95 % es:


s

1 tn1,/2

s2R
= 1,0584 2,101 0,06448 = [0,9229; 1,1939]
(n 1)s2X

c) Por el apartado anterior, sabemos que al no contener al cero el intervalo de confianza


al 95 % para la pendiente, 1 , podemos rechazar la hipotesis nula del contraste:
H0 : 1 = 0
H1 : 1 6= 0
con un nivel de significaci
on del 5 %. Alternativamente, podramos haber observado el
p-valor de dicho contraste, basado en el estadstico t, que seg
un la tabla de resultados
es pr
acticamente cero y por tanto, rechazamos la hipotesis nula ya que = 0,05 es
mayor que el p-valor. Por u
ltimo, otra alternativa habra sido observar el p-valor de
dicho contraste en la tabla ANOVA, basado en el estadstico F, que al ser un contraste
equivalente da lugar al mismo p-valor, que es practicamente cero. En cualquier caso,
concluimos que la venta del producto depende linealmente del n
umero de folletos
publicitarios repartido.
d ) Seg
un la ecuaci
on de la recta de regresion obtenida en el apartado a), el valor del
beneficio medio en euros para aquellas semanas en las que se repartan 550 folletos
publicitarios ser
a:
y0 = 1083,83 + 1,0584 550 = 1665,95 mil euros

El intervalo de nivel para dicha recaudacion promedio viene dado por:


y0 tn2,/2

v
u
u
ts2

1
(x0 x
)2
+
n (n 1)s2X

La varianza residual, s2R , la obtenemos de la tabla ANOVA:


s2R =

SCR
29821
=
= 1656,72
n2
18

Como tn2,/2 = t18,0,025 = 2,101, el intervalo de confianza al 95 % para el beneficio


medio es:
y0 tn2,/2

v
u
u
ts2

1
(x0 x
)2
+
n (n 1)s2X
s

1
(550 636,5)2
= 1665,95 2,101 1656,72
+
20
19 20971,3


= [1643,5; 1688,4]

e) A partir de la tabla ANOVA obtenemos que:


SCM
446354
=
= 0,93737
SCT
476175
Luego, el coeficiente de determinacion es R2 = 93,737 %, lo cual significa que el
modelo de regresi
on explica el 93,737 % de la variacion de las ventas.

Você também pode gostar