Você está na página 1de 46

Analisis de la Varianza

1. En una fabrica de autom oviles se utiliza una misma planta para el ensamblaje de tres modelos
distintos (A, B y C). Para determinar si los modelos reciben el mismo tratamiento, se ha
realizado un control de calidad a una muestra tomada para cada modelo. El n umero de
defectos encontrados para cinco vehculos del modelo A son 5, 4, 6, 6 y 7; para seis vehculos
del modelo B son 7, 8, 6, 7, 6 y 5; y para ocho vehculos del modelo C: 9, 7, 8, 9, 10, 11, 10 y
10. Contrastar si existen diferencias en el tratamiento que se da a los distintos modelos.
2. Una empresa debe elegir entre cinco procedimientos para fabricar un cierto producto qumico.
Se sospecha que existen diferencias entre ellos aunque peque nas. Para detectar estas diferen-
cias se pretende realizar un experimento a gran escala con el mismo n umero de observaciones
en cada grupo. Para determinar este tama no muestral se ha realizado un experimento piloto
con 6 observaciones de cada metodo y los resultados (medias de cada grupo) han sido los
siguientes:
METODO 1 2 3 4 5
Media 425.6 423.2 418.8 430.2 422.2
y la varianza residual s
2
R
= 198.5.
(a) C ual debe ser el tama no muestral del experimento a gran escala para que el contraste
de analisis de la varianza sea signicativo con = 0.01 si el coeciente de determinaci on
es igual al del experimento piloto?.
(b) Dar un intervalo de conanza ( = 0.05) para la prevision del rendimiento realizado
mediante el metodo D (Nota: Se pide un intervalo para una observacion, no para la
media.).
(c) El metodo A es el procedimiento habitual y el metodo D es el que se sospecha propor-
ciona mejor rendimiento. Una hipotesis que se pretende contrastar es H
0
:
D
=
A
,
frente a la hipotesis alternativa H
1
:
D
>
A
. Que condici on debe cumplir la difer-
encia entre las medias muestrales de los dos metodos para rechazar H
0
con = 0.01?
3. Se ha realizado un experimento para estudiar el efecto de un unico factor con I niveles
en la variable respuesta y con un n umero diferente de observaciones en cada tratamiento:
n
1
, n
2
, ..., n
I
siendo el total n = n
1
+ n
2
+ + n
I
. Llamando y
ij
a la observacion j del
tratamiento i, i = 1, ..., I, j = 1, 2, ..., n
i
e y
i
la media del tratamiento i. Se desea estimar
la media general cual de los dos estimadores siguientes
y

=
I

i=1
n
i

j=1
y
ij
n
, y

=
I

i=1
y
i
I
tiene mnima varianza? Realiza la comprobaci on para el caso I = 5, con n
i
= 3, 2, 3, 5, 6 el
n umero de observaciones en cada tratamiento. Asumir que las observaciones son independi-
entes y que se cumple la hipotesis de homocedasticidad.
1
4. Considere la comparacion de dos tratamientos en poblaciones normales. Demuestre que el
contraste t para comparar dos medias es analogo al contraste de la F en An alisis de la
Varianza (suponga n
1
= n
2
).
5. Cinco tipos (A, B, C, D y E) de material sintetico se han sometido a un ensayo de desgaste.
Para cada tipo de material la prueba se repitio 6 veces. El desgaste medio y la desviaci on
tpica corregida en cada caso es la siguiente:
A B C D E
media x
i
14.1 16.3 13.5 14.8 15.3
d. tpica s
i
1.3 1.2 1.4 1.2 1.5
(a) Contrastar ( = 0.05) la hipotesis
H
0
:
A
=
B
=
C
=
D
=
E
frente a la hipotesis alternativa,
H
1
: Alguna media es distinta a las demas.
(b) Indicar con nivel de conanza 0.95 el material con desgaste menor y que materiales
tienen desgaste medio, distinto.
(c) Obtener un intervalo de conanza con = 0.01 para la varianza del error experimental.
6. Se desea comprobar el efecto de un tratamiento termico sobre la resistencia de un nuevo
material. Se han tomado 15 probetas y se han asignado al azar a los tres tratamientos T
1
,
T
2
y T
3
obteniendo como medida de resistencia supercial los valores siguientes:
T
1
T
2
T
3
2.65 4.31 4.81
2.67 3.96 5.32
2.46 4.64 4.93
1.90 4.74 5.49
2.62 4.00 4.45
(a) Contrastar mediante el test de analisis de la varianza si existen diferencias signicativas
entre los tratamientos termicos ( = 0.01).
(b) La temperatura del tratamiento 2 es la media de las temperaturas de los otros dos
tratamientos. Si la relaci on entre la resistencia y la temperatura es lineal, es de esperar
que la media del tratamiento 2 verique : H
0
:
2
=
1
2
(
1
+
3
). Hacer el contraste
bilateral de esta hipotesis con = 0.05. (Nota.- Usar la distribuci on de y
2
(y
1
+y
3
)/2,
donde y
i
es la media de los datos correspondientes al tratamiento T
i
).
7. En el modelo de analisis de la varianza para contrastar la igualdad de medias de I grupos,
con n
1
, n
2
, ..., n
I
observaciones en cada grupo; indicar, justicando la respuesta, si y

, y
i
y
e
ij
son independientes. Calcular los coecientes de correlaci on.
2
8. Explicar detalladamente la descomposicion de la variabilidad en el modelo basico de analisis
de la varianza para comparar I tratamientos. Obtener el estadstico F de contraste, indi-
cando en cada paso las hipotesis utilizadas.
9. Demostrar que en el modelo para la comparacion de las medias de K tratamientos con el
mismo n umero de observaciones, la varianza residual estimada ( s
2
R
) es igual a la media de
las varianzas muestrales corregidas de cada tratamiento. Utilizando esta relaci on, demostrar
que el estimador s
2
R
es insesgado y obtener su distribucion de probabilidad. Suponer que
se cumplen las hipotesis de normalidad, independencia y homocedasticidad, y dar por de-
mostrado que la varianza muestral corregida s
2
, en una muestra aleatoria simple de tama no
n de una distribucion normal, es un estimador centrado de la varianza de la distribuci on
2
,
y que (n 1) s
2
/
2
se distribuye como una
2
con n 1 grados de libertad).
10. Explicar la descomposicion de la variabilidad en el modelo basico de comparacion de K
tratamientos (modelo con un factor ). Demostrar que si todos los tratamientos tienen la
misma media
V E

2

2
K1
.
Indicar en cada paso las hipotesis requeridas. Nota.- Tener en cuenta que si X
1
, X
2
, ..., X
n
son variables aleatorias independientes con distribucion normal de media y varianza
2
, y
X =

X
i
/n,
n

i=1

X
i
X

2
n1
.
11. Un fabricante sospecha que los lotes de materia prima recibidos de un proveedor dieren
signicativamente de su contenido en calcio. Elige al azar 5 lotes diferentes y un qumico
hace cinco determinaciones del contenido en calcio de cada lote. Los resultados obtenidos
han sido
Lote 1 Lote 2 Lote 3 Lote 4 Lote 5
23.46 23.59 23.51 23.28 23.29
23.48 23.46 23.64 23.40 23.46
23.56 23.42 23.46 23.37 23.37
23.39 23.49 23.52 23.46 23.32
23.40 23.50 23.49 23.29 23.38
La tabla de analisis de la varianza se proporciona a continuacion. Comparar mediante el
metodo de Bonferroni las medias de los cinco tratamientos con nivel de signicaci on total

T
= 0.10.
An alisis de la varianza
Fuente Variabilidad g.l. Var. Media F Nivel crtico
Lote 0.096976 4 0.024244 5.54 0.0036
Residuos 0.08760 20 0.00438
Total 0.184576 24
3
4
Dise no de experimentos
1. En una planta piloto se obtiene un nuevo producto mediante un proceso qumico. Con el
n de mejorar el rendimiento se emplean dos catalizadores distintos y se trabaja con tres
temperaturas diferentes. Los resultados del experimento son
Temperatura
Catalizador 20
0
30
0
40
0
A 115 125 130 140 110 120
B 115 105 135 145 100 110
(a) Contrastar si los factores Temperatura y Catalizador tienen efectos signicativos. ( =
0.05)
(b) Que tratamiento se debe utilizar para obtener el mayor rendimiento, si se desea garan-
tizar una probabilidad de error tipo I total,
T
= 0.03?
2. Se pretende estudiar el efecto que produce los factores (1) Porcentaje de algodon (10%, 20%
y 30%) (2) Tipo de confeccion (A y B) en la resistencia al desgaste de ciertos tejidos de bra
sintetica. Se ha realizado el siguiente dise no con tres replicaciones
10% 20% 30%
115 120 126
A 112 135 118
133 139 142
107 110 132
B 114 102 114
108 117 125
(a) Construir la tabla de An alisis de la Varianza y contrastar la inuencia de los dos factores
y la presencia de la interacci on.
(b) Hacer un contraste de diferencia de medias y decidir el tratamiento m as adecuado para
conseguir la mayor resistencia al desgaste.
3. Cierto Organismo P ublico (O.P.) encargado de certicar la composicion de aleaciones de
metales preciosos, debe seleccionar entre dos Laboratorios al mas capacitado para la realiza-
ci on de futuros analisis de gran precision. Para tomar la decisi on les somete a la siguiente
prueba: Prepara tres aleaciones A, B y C que contienen proporciones distintas de oro.
De cada una de ellas enva cuatro muestras a cada uno de los dos laboratorios. As pues,
cada laboratorio recibe un lote de 12 muestras (codicadas) ordenadas aleatoriamente sin
conocer como han sido obtenidas. Los resultados recibidos por el O.P. son (entre parentesis
las medias de las casillas):
1
Aleac. A Aleac. B Aleac. C
10.96 11.03 10.95 11.00 11.07 11.01
Lab. I 11.08 11.01 11.04 10.97 10.97 11.03
(11.02) (10.99) (11.02)
10.97 10.96 10.97 10.96 11.02 11.00
Lab. II 10.94 10.95 10.97 10.98 11.01 11.01
(10.955) (10.97) (11.01)
(a) Determinar si existen diferencias entre los resultados de los laboratorios y si estos han
encontrado diferencias entre las aleaciones.
(b) Aceptando que los datos cumplen la hipotesis de normalidad, indicar si podemos aceptar
que verican el resto de las hipotesis del modelo y en caso negativo que medidas se deben
adoptar para analizar los datos.
(c) Realizar un test de razon de varianzas para contrastar que las varianzas de los dos
laboratorios son iguales, sabiendo que las tres aleaciones tienen composicion distinta.
Interpretar el resultado.
(d) El O.P. conoce exactamente el porcentaje en oro de la aleaci on A (11 %), de la B
(11.02 %) y de la C (11.04 %). Con esta informacion comparar los resultados de los
laboratorios.
4. Complete la tabla ADEVA siguiente y diga de que dise no se trata.
Suma de Cuad. G.L. Varianzas
Factor 1 20 2
Factor 2 5 1.25
Factor 3 10
Int. Segundo orden
Int. Tercer orden 0.25
TOTAL 44 29
5. Se ha realizado un dise no factorial sin replicaci on con tres factores A, B, C con 5, 5 y 4
niveles respectivamente. Si la interacci on de tercer orden es nula, obtener la descomposicion
de la variabilidad e indicar los grados de libertad de cada termino.
6. Para estudiar el efecto de tres factores (A,B,C) en el tiempo de fraguado del hormigon se ha
realizado un experimento factorial completo a dos niveles con tres replicaciones (24 datos en
total). Los resultados de la estimaci on han sido:
Media A B AB C AC BC ABC
92.5 2.4 3.3 8.5 15.0 -1.4 2.65 0.72
Teniendo en cuenta que la varianza residual obtenida es s
2
R
= 18.8, indicar que efectos son
signicativos para un nivel de signicaci on = 0.05.
2
7. Una caracterstica de la calidad de la gasolina es su ndice de octanos. Una renera de
petroleo tiene cinco formulas que pueden emplearse para la obtencion de gasolina con plomo
o sin plomo.
(a) Para determinar que formula proporciona mayor ndice de octanos, con cada una de
ellas se ha repetido 10 veces en el laboratorio el proceso de fabricaci on de gasolina con
plomo. Si el coeciente de determinaci on del analisis de la varianza de los resultados
es igual a 0.20, contrastar con = 0.05 si existen diferencias entre las cinco f ormulas
para este tipo de gasolina.
(b) Los valores medios ( y
i
) para cada formula son:
Formula 1 2 3 4 5
Media 89.2 90.1 90.7 90.5 89.5
Contrastar con = 0.05 que formulas proporcionan ndices de octanos signicativa-
mente distintos y cuales no.
(c) Debido a los problemas medio-ambientales gran parte de la producci on futura debe
estar libre de plomo. Para determinar que formula de las anteriores produce mejores
resultados en cuanto al ndice de octanos , se realizo un dise no experimental similar
al anterior (cinco formulas, 10 observaciones en cada formula) para la obtencion de
gasolina sin plomo. El coeciente de determinaci on en este caso es igual a 0.25 y el
ndice medio para cada formula es,
Formula 1 2 3 4 5
Media 88.0 89.5 88.5 90.2 89.8
Contrastar ( = 0.05) si existe interacci on entre los factores tipo de gasolina (con y sin
plomo) y formula.
8. Para estudiar la inuencia de la temperatura y la presion sobre el rendimiento de un proceso
qumico se ha realizado un experimento con 5 valores de presion y 4 valores de temperatura.
Los resultados se muestran en la tabla siguiente.
Temperatura
10 20 30 40 Medias
1 65,58 96,71 124,20 156,63 110,71
2 66,32 101,5 130,37 161,38 114,89
Presi on 3 74,42 99,81 134,63 160,59 117,36
4 80,24 104,11 138,42 166,96 122,43
5 79,61 112,14 143,58 170,68 126,50
Medias 73,24 102,85 134,24 163,19 118,38
(a) Considere solamente el efecto de la presion y estudie si es signicativo ( = 0, 05),
sabiendo que las varianzas muestrales corregidas para los datos correspondientes a cada
presion son s
2
1
= 149, 85; s
2
2
= 164, 62; s
2
3
= 143, 95; s
2
4
= 145, 11; s
2
5
= 154, 94.
3
(b) Incorpore el efecto de la temperatura en un modelo adecuado para los datos. Interprete
el resultado.
(c) Calcule un intervalo de conanza al 95% para la varianza del error experimental de los
modelos de los dos apartados anteriores. Interprete las diferencias.
9. Se desea estudiar la fuerza de percusion de una perforadora en funcion de la VELOCIDAD
de giro (baja y alta) y de un coeciente mec anico que denominaremos RATIO (0.15, 0.30,
0.45 y 0.60). Se ha experimentado en las ocho posibles combinaciones de ambos factores,
replicando cada experimento dos veces. Los resultados se muestran en la tabla siguiente
0.15 0.30 0.45 0.60 Media
Vel. Baja
270
278
245
249
260
272
275
286
266.875
Vel. Alta
283
286
285
280
286
287
294
288
286.125
Media 279.25 264.75 276.25 285.75 276.5
Las variabilidades explicadas por el RATIO, la VELOCIDAD y la interacci on RAT x VEL
son respectivamente 925, 1482.25 y 418,75 y la Variabilidad Total es 3034.
(a) Completa la tabla de analisis de la varianza e indica que efectos son signicativos para
= 0.05.
(b) Interpreta el resultado, indicando como inuye el RATIO y la VELOCIDAD en la fuerza
de la perforadora. Dibuja el gr aco que permite interpretar la interacci on. Proporciona
el intervalo de conanza para la media de la combinacion RATIO 0.30, y VELOCIDAD
baja.
(c) Cada tratamiento tiene dos observaciones, llamando D
ij
= |Y
ij1
Y
ij2
| , al valor abso-
luto de la diferencia de estas observaciones, demuestra que
D
2
ij
2
2

2
1
y que S
2
D
=

2
i=1

4
j=1
D
2
ij
16
es un estimador centrado de la varianza del modelo factorial.
(d) Sup on que la varianza de las observaciones a velocidad baja es
2
1
y de las observaciones
a velocidad alta es
2
2
. Utilizando el resultado del apartado 3, realiza el siguiente
contraste con nivel de signicaci on 0.05,
H
0
:
2
1
=
2
2
H
1
:
2
1
=
2
2
4
10. Cuando un lenguaje de alto nivel es compilado, el tiempo de ejecucion depende del compi-
lador. Un ingeniero de software desea comparar tres compiladores (A, B y C), para ello ha
seleccionado 5 programas muy distintos, cada uno de los cuales ha sido compilado por los
tres compiladores. Los tiempos de CPU se proporcionan a continuacion:
1 2 3 4 5 Medias
A 122.9 147.4 189.6 200.9 307.3 193.6
B 113.8 135.1 173.8 199.3 296.6 183.7
C 131.2 152.8 192.7 219.8 318.9 203.1
Medias 122.7 145.1 185.3 206.7 307.6
La variabilidad total es 62899.2, y las variabilidades explicadas por el tipo de compilador y
tipo de programa son 937.2 y 61868.9, respectivamente. Da un intervalo de conanza (95%)
para la diferencia de las medias entre los dos compiladores m as rapidos.
11. Se ha realizado el analisis de la varianza de un dise no con un unico factor a 10 niveles con 6
observaciones para cada nivel. El nivel crtico que muestra la tabla ADEVA es p = 0.5832.
Los niveles crticos de los contrastes individuales de igualdad de medias son mayores de 0.05
para todas las parejas excepto para la comparacion entre los niveles 3 y 7 que ha sido igual a
0.0405. Es posible este resultado? Que se puede concluir del analisis? Que procedimiento
sugiere para realizar los contrastes individuales?
12. Se ha realizado un dise no factorial sin replicaci on con tres factores A, B, C con 5, 5 y 4
niveles respectivamente. Si la interacci on de tercer orden es nula, obtener la descomposicion
de la variabilidad e indicar los grados de libertad de cada termino.
13. Sea un dise no factorial con 4 factores a 3, 4, 2 y 5 niveles. Calcular el n umero de par ametros
totales correspondientes a efectos principales e interacciones de orden 2, 3 y 4.
14. Un ingeniero ha estudiado el efecto que tienen 5 niveles de iluminacion en una operaci on
de ensamblado. El departamento en el que se ha experimentado tiene cuatro estaciones de
trabajo, que representan una fuente potencial de variabilidad. Para cada estacion de trabajo
y nivel de iluminacion se ejecut o la operacion de ensamblado, midiendo la holgura en micras.
Los resultados fueron:
ESTAC. ILUMINACION
1 2 3 4 5 y
i
1 131 116 88 75 104 102.8
2 92 96 97 70 75 86.0
3 128 129 99 94 105 111.0
4 121 107 84 89 86 97.4
y
j
118 112 92 82 92.5 y

= 99.3
(a) Contrastar ( = 0.05) si la iluminacion o la estacion de trabajo inuye en los resultados
del ensamblado.
5
(b) Comparar los niveles de iluminacion y los niveles de las estaciones de trabajo. Indicar
en cada caso cuales se pueden considerar distintos y cuales no.
(c) Calcular la varianza te orica del valor medio previsto para cada observacion.
(d) Explicar por que no se debe contrastar la hipotesis
H
0
:
1
=
2
= ... =
m
del modelo basico de analisis de la varianza (un factor), mediante contrastes de la t de
Student a cada uno de los

m
2

pares de muestras.
15. Se realiza un experimento para estudiar la inuencia de 2 factores en el rendimiento de un
proceso, donde el factor que se encuentra a 3 niveles (Alto, medio y bajo) es la temperatura,
el otro factor, catalizador, tiene dos niveles: catalizador I y II. Los datos del experimento
se muestran en la siguiente tabla:
Alto Medio Bajo
CI 279 172 176 174 277 130 397 348 434
(215.6) (193.6) (393)
CII 253 238 387 252 367 323 417 427 423
(292.6) (314) (422.3)
(Nota: Los n umeros entre parentesis son las medias de las casillas)
(a) Contrastar con = 0.05 que efectos son signicativos. Interprete el resultado.
(b) Determinar el intervalo con el 99% de conanza para la varianza del error experimental.
(c) Dar un intervalo para una observacion realizada en condiciones optimas. Si se realizan
10 experimentos en estas condiciones, determinar el intervalo que con probabilidad
igual al 95% contiene a todas ellas. Utilice la aproximacion
t

g
= z

(1
z

+ 1
4g
)
1
donde g son los grados de libertad de la t y z

el valor de la normal estandar, tal que


P(Z z

) =
16. Un laboratorio de An alisis Clnicos ha adquirido un nuevo equipo (B) para medir el coles-
terol en la sangre de los enfermos. Para evaluar si el nuevo equipo esta ajustado se decide
analizar muestras de 5 enfermos que previamente han sido analizadas con otro equipo (A),
dando como resultado
Enfermo 1 2 3 4 5 Media
Equipo A 215 305 247 221 286 254.8
Equipo B 224 312 251 232 295 262.8
6
Contrastar con = 0.05 existen diferencias entre los dos equipos.
17. Para estudiar el consumo de aceite de un motor se prueban 4 motores distintos con 3 tipos
de aceites obteniendo 12 medidas de consumo. Se ha obtenido:
Variabilidad explicada por aceite = 100
Variabilidad explicada por motor = 80
Variabilidad Total = 220
Se pide escribir la tabla ADEVA correspondiente, y obtener conclusiones.
18. Para determinar el consumo de energa electrica para usos domesticos se ha medido el con-
sumo medio por persona en las distintas estaciones del a no en siete comunidades aut onomas
para 1989, habiendose obtenido los siguientes resultados:
COMUNIDAD INVIERNO PRIMAVERA VERANO OTO

NO MEDIAS
1 13.1 11.4 10.6 11.5 11.65
2 13.4 12.1 11.1 12.0 12.15
3 13.8 12.1 11.4 12.9 12.55
4 14.0 12.8 11.7 12.6 12.77
5 14.4 12.6 12.5 13.4 13.22
6 14.8 13.4 13.0 14.0 13.80
7 15.6 14.2 14.1 14.4 14.57
MEDIAS 14.16 12.66 12.06 12.97 12.96
(a) Analizar si el factor estacion del a no es inuyente, sabiendo que s
2
y
= 1.53.(No consid-
erar el factor Comunidad).
(b) Razonar estadsticamente cu al es la estacion de mayor consumo y la de menor, uti-
lizando el analisis anterior. Calcular los intervalos de conanza para el consumo medio
de cada estacion del a no.
(c) Sabiendo que la variabilidad explicada por el factor comunidad es 23.62, construir una
nueva tabla de la varianza, con dos factores, y decidir que factor es signicativo.
(d) Utilizar los resultados del apartado anterior para realizar un contraste de igualdad de
medias del efecto estacion y comparar los resultados con los del apartado 2, justicando
las diferencias encontradas.
( NOTA: Utilizar = 0.05 en todos los contrastes )
19. Se realiza un experimento para estudiar si la presencia de uorita reduce el coste de fabri-
caci on de clinker de cemento en tres tipos diferentes de mezcla. Los resultados del mismo
(en miles de pesetas por Tm) se muestran en la siguiente tabla:
7
FLUORITA MI MII MIII y
i
0% 15.4 10.6 17.8 14.6
1% 10.3 5.5 10.9 8.9
2% 7.4 1.2 8.1 5.5
3% 10.7 6.5 9.6 8.9
4% 13.5 11.6 15.5 13.5
y 11.4 7.1 12.4
5

i=1
3

j=1
e
2
ij
= 10.2 y

= 10.3
(a) Determinar si el tipo de mezcla y el nivel de uorita a nadido inuyen signicativamente
en el coste de fabricacion. Se supone que no existe interacci on entre los dos factores.
(b) Contrastar que porcentaje de uorita produce el menor coste del clinker.
20. El analisis de la varianza de un dise no en bloques aleatorizados proporciona los siguientes
resultados: V T = 232, V E(factor) = 156, V E(bloque) = 15 y V NE = 61. El n umero de
niveles del factor es 5 y el n umero de bloques 8. Construir la tabla ADEVA. Cual sera
el resultado del analisis si no se tiene en cuenta el efecto de los bloques ? Indicar en que
circunstancias es preferible cada uno de los modelos.
21. Se ha realizado un experimento con tres factores, (A, B y C), con 4, 3, y 5 niveles, sin
replicaciones. El modelo propuesto no incluye las interacciones de orden 3, por lo que la
variabilidad explicada por estas interacciones se pretende utilizar para estimar la varianza
residual. Los resultados proporcionan para la variabilidad explicada por las interacciones de
orden 3 un valor igual a 234.5; que es muy superior a lo esperado. Debido a esto se repiti o
por completo el experimento, obteniendose para este segundo experimento un valor de 158.7
(para la variabilidad explicada por la interacciones de orden 3). Proponer un procedimiento
para contrastar si se ha producido un cambio signicativo en esta variabilidad de uno a otro
experimento, indicando las hipotesis en las que se basa el contraste. (Dejar el resultado del
contraste indicado en funcion de los valores crticos de la tabla correspondiente.)
22. En un modelo de analisis de la varianza se ha observado que la desviaci on tpica ( s
i
) y la
media (y
i
) de las observaciones de cada tratamiento estan relacionadas linealmente, s
i
= ky
i
,
donde k es una constante. Cual de las siguientes transformaciones es la m as adecuada para
corregir la heterocedasticidad ? z = log y, z = y
2
o z = ky
23. La oxidaci on es una etapa de la fabricacion de chips y consiste en a nadir una capa de
oxido sobre la placa silicio (oblea). Se esta experimentando con 6 tratamientos (T
i
) para
seleccionar el que proporciona un mayor espesor de oxido en un mismo tiempo de proceso.
Una caracterstica que inuye en el espesor es el acabado supercial de la oblea, por lo que
se tomaron 5 tipos distintos de acabado (O
j
). De cada tipo (O
j
) se tomaron 6 obleas y se
asignaron aleatoriamente a los tratamientos. En la tabla se proporciona el espesor obtenido
en cada oblea y las medias por las y columnas.
8
T
1
T
2
T
3
T
4
T
5
T
6
O
1
85.60 90.90 93.00 80.50 85.20 88.90 87.35
O
2
89.30 91.50 93.60 83.20 87.80 91.00 89.40
O
3
84.70 87.50 90.90 81.00 83.20 86.30 85.60
O
4
87.60 90.50 95.60 84.60 87.60 91.10 89.50
O
5
87.30 93.10 94.90 82.70 86.70 88.70 88.90
86.90 90.70 93.60 82.40 86.10 89.20 88.15
VT = 465.1
(a) Contrastar si el tipo de oblea y el tratamiento inuyen en el espesor del oxido. Elegir el
tipo de oblea y tratamiento m as adecuado, indicando si son signicativamente distintos
del resto.
(b) Para jar los seis tratamientos, se seleccionaron dos temperaturas (t
1
, t
2
) y tres presiones
(p
1
, p
2
, p
3
) y se combinaron de forma que T
1
= (t
1
, p
1
), T
2
= (t
1
, p
2
), T
3
= (t
1
, p
3
)
T
4
= (t
2
, p
1
), T
5
= (t
2
, p
2
) y T
6
= (t
2
, p
3
). Calcular las variabilidades explicadas por la
temperatura, la presion y su interacci on (t p).
(c) Indicar si sus efectos son signicativos, suponiendo nulas las interacciones de los factores
O t, O p y O t p.
24. Demostrar que en un modelo de bloques aleatorizados, ,
i
y

j
son independientes.
25. Un centro ha realizado un experimento para mejorar la resistencia a la tensi on de ciertos
muelles de acero. En una etapa del proceso el muelle caliente se sumerge en aceite templado.
Se han estudiado tres factores, A (temperatura del acero antes de la inmersion, con tres
niveles), B (temperatura del ba no de aceite, dos niveles) y C (concentraci on de carbono en
el acero, dos niveles). El experimento se ha replicado tres veces. En la tabla se muestra la
media y la varianza (corregida) para los tres datos de cada tratamiento.
A B C y
i
s
2
i
1 1 1 40.2 0.25
1 1 2 61.1 2.68
1 2 1 35.9 2.43
1 2 2 57.1 4.44
2 1 1 49.0 3.49
2 1 2 70.3 7.77
2 2 1 46.7 5.08
2 2 2 67.6 1.03
3 1 1 41.9 4.27
3 1 2 62.7 11.41
3 2 1 37.1 1.33
3 2 2 60.3 6.13
(a) Dar un intervalo del 95 % de conanza para la varianza del error experimental,
2
.
(b) Indicar si los efectos principales de A, B y C son signicativamente distintos de cero.
9
(c) Dado
2
, construir un intervalo que cumpla que la probabilidad de que s
2
i
(la varianza
muestral corregida de un tratamiento) este contenido en el sea igual a 0.95. Sustituir
2
por su estimador y con ayuda de este intervalo, discutir si se puede rechazar la hip otesis
de homocedasticidad de las observaciones.
26. Estimar por m axima verosimilitud los par ametros ,
i
y
j
del modelo de bloques aleator-
izados. Obtener la distribucion de estos estimadores, indicando su media y varianza.
27. Explicar por que en un modelo de dos factores con interacci on es necesario poner las condi-
ciones
I

i=1

i
= 0,
J

j=1

j
= 0,
I

i=1
()
ij
= 0 para todo j, y
J

j=1
()
ij
= 0 para todo i.
Se podran haber puesto otras condiciones distintas a las anteriores? Justicar la respuesta.
28. La calidad de un producto qumico despues de un largo periodo de almacenamiento depende
del conservante empleado y de las caractersticas de almacenamiento. Se ha estudiado el
efecto de cuatro conservantes distintos (columnas) y cinco almacenamientos (las) sobre la
degradaci on del producto:
1 2 3 4 Medias
1 15.1 11.0 18.8 10.3 13.8
2 8.1 4.3 11.8 3.8 7.0
3 15.3 11.5 15.6 9.2 12.9
4 8.0 4.4 11.0 5.8 7.3
5 13.5 9.3 15.8 18.2 14.2
Medias 12.0 8.1 14.6 9.46 11.04
La tabla de analisis de la varianza para los datos anteriores es:
Suma de
Cuadrados
Grados de
Libertad
S. Cuadrados
Medios
F
Nivel
Crtico
Almacen. 205.488 4 51.372 10.03 0.0008
Conserv. 123.676 3 41.225 8.05 0.0033
Residuos 61.484 12 5.123
Total 390.648 19
(a) Elegir con = 0.05 el conservante y el almacenamiento que producen menor degradaci on.
(b) El analisis de los residuos muestra como atpica la observacion y
54
= 18.2. Un examen
qumico conrma el resultado anomalo por lo que se recomienda eliminar la observacion.
Seg un el modelo de dos factores sin interacci on, la prediccion de la observacion y
IJ
(eliminada) es:
y
IJ
=
S
I
(J 1)
+
S
J
(I 1)

S

(I 1)(J 1)
10
donde I = 5, J = 4, S
I
es la suma de las observaciones de la la I (sin incluir la elimi-
nada), S
J
es la suma de las observaciones de la columna J (sin incluir la eliminada), y
S

es la suma de las observaciones restantes no incluidas en la la I ni en la columna


J. Obtener la distribucion (media y varianza) del error de prediccion e
IJ
= y
IJ
y
IJ
.
(c) Cuando, como en el caso anterior, falta una observacion se recomienda el siguiente pro-
cedimiento: sustituir la observacion faltante por su prediccion y aplicar los contrastes
habituales teniendo en cuenta que los residuos tienen un grado de libertad menos. La
nueva descomposicion de la variabilidad es: VT=339.63, VE(Conservantes)=166.02,
VE(Almacenamiento)=164.02 y VNE=9.59. Contestar al apartado 1 con esta modi-
caci on e interpretar las diferencias.
29. Una instalaci on tpica de almacenamiento de combustible en una Estaci on de Servicio (gaso-
linera) esta formada por un tanque enterrado de gran capacidad, al que se encuentran
conectados distintos surtidores. La cantidad total de gasolina suministrada en un da se
puede determinar midiendo directamente la variacion que se ha producido en el tanque de
almacenamiento (Y
1j
) o por la suma de los suministros de los distintos surtidores (Y
2j
). La
comparacion de ambas medidas permite determinar perdidas en la instalaci on enterrada y
otras anomalas. En el proceso de comparacion es necesario tener en cuenta que las medidas
estan afectadas por errores aleatorios. Durante 20 das se han tomado los valores anteriores
en un gasolinera:
Da 1 2 3 4 5 6 7 8 9 10
Y
1j
4116,2 5627,0 2820,4 2521,8 2973,5 2834,9 2335,7 2590,8 2182,7 2621,4
Y
2j
4143,6 5632,0 2868,1 2477,7 2955,4 2851,9 2312,7 2630,6 2208,9 2635,9
Da 11 12 13 14 15 16 17 18 19 20
Y
1j
4323,6 1880,7 2131,4 3349,6 2545,0 2247,3 1817,5 1461,3 1646,5 1955,4
Y
2j
4305,4 1877,9 2159,2 3366,7 2566,1 2281,4 1854,6 1461,5 1607,3 1956,4
(a) Llamando D
j
= Y
1j
Y
2j
a la diferencia en las medidas de un mismo da, contrastar
con = 0.05
H
0
:
D
= 0
H
1
:
D
= 0
donde D
j
tiene distribucion N(
D
,
D
). Calcular el nivel crtico del contraste aproxi-
mando la distribucion t de Student por la normal.
(b) Los datos anteriores pueden ser analizados mediante un modelo de bloques aleatorizados
tomando el tipo de medida (tanque, surtidores) como un factor y los das como bloques.
Demostrar con caracter general que en el modelo de bloques aleatorizados si el factor
tiene dos niveles la varianza residual cumple:
s
2
R
=
1
2
s
2
D
donde s
2
D
es la estimaci on de
2
D
del apartado 1.
(c) Teniendo en cuenta lo anterior, demostrar que el contraste correspondiente al factor en
el modelo de bloques aleatorizados es equivalente al contraste del apartado 1.
11
30. Una forma alternativa de la ecuacion del modelo para comparar I tratamientos es
y
ij
= +
i
+u
ij
, i = 1, 2, ..., I; j = 1, 2, ..., m
donde
es la media global

1
,
2
, ...,
I
son los par ametros que determinan los efectos de cada tratamiento, cumplen
que

I
i=1

i
= 0
u
ij
son variables aleatorias independientes con identica distribuci on normal de media cero y
varianza
2
.
(a) Obtener el estimador m aximo verosmil de
i
, indicar su distribuci on de probabilidad,
media y varianza.
(b) Calcular la esperanza de la variabilidad explicada (V E = m

I
i=1

2
i
) cuando los
par ametros
i
no son todos nulos.
(c) Calcular la correlaci on entre
i
y un residuo e
ij
cualquiera (del mismo o diferente
tratamiento). Que implicacion tiene este resultado en el contraste de analisis de la
varianza.
31. Un ingeniero esta estudiando metodos para mejorar ciertas propiedades mec anicas de una
aleacion met alica. Los dos factores que considera m as importantes son la cantidad de Man-
ganeso y la temperatura de templado. Se dise na un experimento empleando tres niveles
para el factor manganeso y dos para la temperatura, en total 32 = 6 tratamientos. Se
dispone de 6 hornos diferentes para realizar la fundicion. Cada horno requiere un operador
y se disponen de seis operadores cada uno de los cuales es capaz de manejar los seis hornos.
Dise nar un experimento que con 36 observaciones permita estudiar las diferencias entre los
seis tratamientos y que tenga en cuenta el tipo de horno y el operador como variables blo-
ques. Construir la tabla de analisis de la varianza, indicando los grados de libertadad de
cada variabilidad, separando en ella el factor manganeso, el factor temperatura y su inter-
acci on. (Los bloques y los factores no interaccionan). (Nota: no es necesario indicar en la
tabla como se obtienen las distintas variabilidades).
32. Una asociacion de consumidores para comprobar la utilidad de ciertos compuestos que seg un
sus fabricantes reducen el consumo de gasolina de los autom oviles realiz o el siguiente exper-
imento: eligio al azar 9 vehculos nuevos de distintas marcas con cilindrada similar y con
cada uno de ellos recorri o tres veces un mismo trayecto con conductores distintos. Adem as
en cada uno de estos tres trayectos empleo un tratamiento diferente para la gasolina:
Tratamiento

A : Gasolina con Cyber-Gas


B : Gasolina con Consumin
C : Gasolina sin aditivo
En la tabla siguiente se muestra el consumo en litros de gasolina en cada uno de los recorridos
y el tipo de tratamiento (letra latina).
12
N umero Conductores Media
Vehculo 1 2 3 la
1 15,5 (A) 15,6 (B) 16,6 (C) 15,90
2 13,0 (B) 13,3 (A) 13,0 (C) 13,10
3 11,8 (B) 13,1 (C) 12,5 (A) 12,47
4 14,4 (A) 14,8 (C) 15,0 (B) 14,73
5 12,4 (B) 14,3 (A) 14,1 (C) 13,60
6 15,6 (C) 15,3 (A) 14,7 (B) 15,20
7 12,7 (C) 12,0 (B) 12,0 (A) 12,23
8 14,2 (C) 14,0 (B) 15,1 (A) 14,43
9 12,6 (A) 13,5 (C) 12,3 (B) 12,80
Media Media Total
Columna 13,58 13,99 13,92 13,83
Media de
Tratam.

A:13,89
B:13,42
C:14,18
El analisis de los datos se realiza con el siguiente modelo
y
ijk
= +
i
+
j
+
k
+u
ijk
donde y
ijk
representa el consumo en litros, la media global;
i
, i = 1, 2, ..., 9 y
j
, j =
1, 2, 3 los efectos correspondientes a los vehculos (las) y los conductores (columnas). La
estimaci on e interpretaci on de estos par ametros es similar al modelo de bloques aleatorizados.
Adem as se incluye los par ametros
k
, k = 1, 2, 3 que miden el efecto de los tratamientos (tipo
de aditivo) y cumplen

3
k=1

k
= 0. Por ultimo, u
ijk
la componente aleatoria son variables
aleatorias independientes con distribucion normal de media cero y varianza
2
para todas
las observaciones.
(a) Obtener razonadamente los estimadores m aximo verosmiles de
k
.
(b) La tabla del analisis de la varianza del modelo anterior es
Suma de Grados de
Cuadrados Libertad Varianza F p-Valor
Tratamiento 2,67 2 1,31 6,7 0,0091
Vehculo 40,2 8 5,02 25,7 0,0000
Conductor 0,876 2 0,438 2,2 0,1428
Residual 2,73 14 0,195
Total 46,4 26
Reducen los aditivos el consumo de gasolina? Existen diferencias signicativas entre
Cyber-gas (A) y Consumin (B)? (Realizar los contrastes con nivel de signicaci on 0.05).
(c) Demostrar que el dise no anterior, independientemente de los valores numericos (y
ijk
)
obtenidos, es un dise no ortogonal, es decir que cumple:
VT = VE(Vehculos) + VE(Conductores) + VE(Tratamientos) + VNE
(Nota.- Es suciente con demostrar la ortogonalidad del vector correspondiente a los
tratamientos con respecto a los otros tres).
13
33. Un informatico quiere comparar los tiempos de ejecucion de tres programas realizados en
lenguajes diferentes que realizan el mismo proceso. Para hacer la comparacion utilizan 4
ordenadores con microprocesadores distintos. Los tiempos requeridos por cada programa en
cada ordenador han sido:
ORDENADOR PROGRAMA
A B C y
i
1 1,36 2,23 1,54 1,71
2 0,97 0,70 0,76 0,81
3 1,79 1,74 1,84 1,79
4 0,64 0,69 0,74 0,69
y
j
1,19 1,34 1,22 1,25
Existen diferencias signicativas en los tiempos requeridos por los 3 programas?
34. Se ha realizado un experimento con dos factores cada uno de ellos con 3 niveles. El 20%
de la variabilidad total esta explicada por la interacci on de los dos factores y el 40% de
la variabilidad total es debida a la variabilidad residual. Determinar el n umero de replica-
ciones necesarias en cada tratamiento para que la interacci on sea signicativa con = 0.01.
(Explicar el procedimiento de calculo, dejando el resultado indicado en funcion de las tablas).
35. Un investigador quiere estudiar el efecto de sexo (hombre, mujer) y tipo de formaci on (cien-
cias, letras) en el dominio del ingles escrito en profesores universitarios. Para ello analiza el
n umero de incorrecciones gramaticales en artculos cientcos enviados a publicacion. Para
cada combinacion de niveles de los factores se han elegido al azar tres profesores. En la tabla
se proporciona el n umero de fallos detectados en artculos de 15 paginas
Letras Ciencias
Hombre 8, 6, 13 22, 28, 33
Mujer 5, 10, 6 12, 14, 9
Contrastar con nivel de signicaci on 0.05 si los efectos principales y la interacci on son sig-
nicativos. Tener en cuenta que P(F
1,8
5.32) = 0.95, siendo F
1,8
la distribuci on F con
grados de libertad 1 y 8. Interpretar los resultados.
36. Un alumno, como trabajo de la asignatura de estadstica, ha comparado tres marcas distintas
(A,B,C) de palomitas de maz precocinadas. Cada marca puede prepararse friendolas en
una sarten (metodo 1) o en el horno microondas (metodo 2). El alumno ha realizado un
dise no factorial completo 32 con cinco replicaciones en cada uno de los seis tratamientos.
La variable respuesta medida es el porcentaje de granos de maz que no se han inado
adecuadamente. Los resultados del experimento se muestran en la tabla, en cada tratamiento
14
se proporciona la media y entre parentesis la desviaci on tpica corregida para las cinco
replicaciones. Contrastar si la interacci on entre los dos factores es signicativa.
A B C
Sarten
5.5
(1,4)
3.6
(1,8)
7.5
(2,5)
Horno
3.8
(1,3)
3.4
(0,9)
4.3
(1,3)
37. Se ha realizado un experimento con dos factores, A (temperatura con tres niveles), B (con-
centraci on con cuatro niveles). El experimento se ha replicado 5 veces. En la tabla se
muestra la media y la varianza (corregida) para los 5 datos de cada tratamiento.
A B y
i
s
2
i
1 1 240 1.2
1 2 261 1.6
1 3 235 1.4
1 4 257 2.4
2 1 249 1.4
2 2 270 5.7
2 3 246 5.8
2 4 267 1.7
3 1 241 4.2
3 2 262 9.4
3 3 237 1.3
3 4 260 6.1
Escribir la tabla de analisis de la varianza.
38. Se desea estudiar la inuencia de 2 factores en el error de medida de un equipo de vision
articial. Un factor F es la distancia focal, para el que se han jado 4 niveles y el otro factor
L es el nivel de iluminacion con 2 niveles. Adem as se dispone de 2 equipos diferentes para
realizar las medidas. Se ha tomado un patron y se ha medido en las combinaciones indicadas
en la tabla, donde y
ijk
es el error obtenido al situar la distancia focal i, con iluminacion j y
el equipo k.
F 1 2 3 4 1 2 3 4
L 1 1 1 1 2 2 2 2
Equipo 1 y
111
y
211
y
311
y
411
y
121
y
221
y
321
y
421
Equipo 2 y
112
y
212
y
312
y
412
y
122
y
222
y
322
y
422
Construir la tabla de analisis de la varianza, que incluya los efectos principales debidos a la
distancia focal (F), la iluminacion (L) y el equipo, y adem as la interacci on F L, suponiendo
que son nulas el resto de interacciones.
39. Cierta industria de lentes para gafas desea comparar dos tipos de recubrimiento antireec-
tante A, B. Los dos tipos tienen identico aspecto y prestaciones, pero antes de decidirse por
15
uno u otro desean comprobar si el tipo de recubrimiento inuye en el desgaste que sufre la
lente. Para ello construyen gafas con una lente de cada tipo que distribuyen entre 10 per-
sonas seleccionadas al azar que habitualmente utilizan gafas. Al cabo de seis meses miden
el desgaste y se obtienen los valores que se indican en la tabla.
Persona Lente A Lente B
1 6.7 6.9
2 5.0 5.8
3 3.6 4.1
4 6.2 7.0
5 5.9 7.0
6 4.0 4.6
7 5.2 5.5
8 4.5 5.0
9 4.4 4.3
10 4.1 4.8
Que tipo de recubrimiento recomendara a los fabricantes con el criterio de mnimo des-
gaste?.
40. Demuestre que en un modelo en bloques aleatorizados, con I niveles para el factor y J niveles
para el bloque, con modelo
y
ij
= +
i+

j
+u
ij
,el valor esperado de la variabilidad explicada por el factor es: E[V E()] =
(I 1)
2
+J

J
i=1

2
i
,siendo
2
la varianza del error experimental.
41. Se desea comprobar si el orden en el que aparecen las preguntas de un examen test inuye
en resultado obtenido por el alumno. Se han preparado dos examenes, el Test A tiene
las preguntas en orden de dicultad creciente y el Test B a la inversa. Se ha elegido una
muestra aleatoria de 20 alumnos y se han emparejado seg un su habilidad, de forma que los
dos alumnos de cada pareja han demostrado durante el curso una habilidad similar. De
cada pareja, un alumno se ha asignado aleatoriamente al Test A y el otro al Test B. Los
resultados nales del ejercicio han sido (cada pareja es una columna)
Test A: 83 82 95 92 91 60 89 69 70 72
Test B: 76 62 70 74 52 63 48 80 76 74
Es evidente que las puntuaciones del Test B son mas bajas que las del Test A?
42. El analisis de la varianza de un dise no en bloques aleatorizados proporciona los si-guientes
resultados: V T = 129, V E(factor) = 38, 5 y V E(bloque) = 82, 5. El n umero de niveles del
factor es 4 y el n umero de bloques 4. Construir la tabla de analisis de la varianza y hacer
los contrastes correspondientes con nivel de signicaci on 0,05.
16
43. Se ha estudiado la inuencia de la cantidad de cierto aditivo en la opacidad de un material
pl astico que se puede fabricar por tres metodos de extrusion. El objetivo es conseguir el
tratamiento con opacidad mnima. Cada tratamiento se ha replicado 5 veces, los valores
medios y las desviaciones tpicas corregidas para cada caso se proporcionan en la tabla 1.
La tabla 2 corresponde al analisis de la varianza. Se ha comprobado que se verican las
condiciones de normalidad y homocedasticidad.
Metodo Aditivo Medias Desv. Tp.
1 1 9.5 0.83
1 2 9.3 0.67
2 1 10.0 1.53
2 2 8.1 0.77
3 1 11.5 0.78
3 2 6.0 1.23
(TABLA 1)
Suma de
cuadrad. g.l. Var. F p-valor
Extrus. 2.210 2 1.105 1.072 0.358
Aditivo 47.636 1 47.636 46.2 0.000
Interac. 37.572 2 18.786 18.2 0.000
Residual 24.728 24 1.030
Total 112.146 29
(TABLA 2)
(a) A la vista de los resultados de las dos tablas indica que metodo de extrusion es acon-
sejable para conseguir la opacidad mnima.
(b) Da un intervalo del 95% de conanza para la opacidad media en las condiciones optimas.
(c) Sea
d
i
= y
i1
y
i2
la diferencia entre las medias observadas en los dos niveles del factor aditivos para el
metodo de extrusion i. Calcula el valor esperado y la varianza de d
i
en terminos de los
par ametros del modelo factorial.
(d) Si E(di) = 0 para los tres metodos, obten la distribucion de probabilidad de
5
2

d
2
1
+d
2
2
+d
2
3

2
.
44. Se ha estudiado el efecto de tres hornos diferentes y dos temperaturas (290
o
C y 320
o
C)
en la duracion de cierto componente. Para cada combinacion de horno y temperatura se
ha replicado el experimento 3 veces. En la tabla siguiente se proporcionan las medias y
desviaciones tpicas de los datos de cada tratamiento.
17
Temperatura
o
C
290
o
C 320
o
C
Media Desv. T. Media Desv. T.
Horno 1 245.6 8.50 180.0 2.65
Horno 2 191.0 15.39 144.0 2.65
Horno 3 187.0 4.58 134.3 8.62
Suma Grados
Fuente Cuadrado Libertad Varianza F p-valor
Horno 9646.3 2 4823.2 69.1 0.000
Temp. 13667.6 1 13667.6 195.9 0.000
H x T 274.8 2 137.4 1.97 0.182
Residual 837.3 12 69.8
Total 24426 17
Seleccionar el horno y la temperatura que proporcionan m axima duraci on, haciendo los con-
trastes de igualdad de medias con nivel de signicaci on 0.01.
18
Modelos de regresion lineal
1. La tabla muestra los mejores tiempos mundiales en Juegos Olmpicos hasta 1976 en carrera
masculina para distintas distancias.
y: tiempo (sg) 9.9 19.8 44.26 103.5 214.9 806.4 1658.4 7795
x: distancia (m) 100 200 400 800 1500 5000 10000 42196
(a) Estimar la regresi on lineal de y sobre x y calcular la varianza residual y el coeciente
de correlaci on.
(b) Obtener intervalos de conanza para la pendiente y varianza residual ( = 0.01).
(c) Analizar si la relaci on lineal es adecuada, transformando las variables si es necesario.
(d) Sup ongase que en aquellas Olimpiadas hubiera existido una carrera de 500 metros.
Estimar el tiempo previsto para el record olmpico en dicha carrera, dando un intervalo
de conanza con = 0.05.
2. Estimar por mnimos cuadrados los par ametros a y b de la ecuacion y = a + bx
2
con la
muestra de tres puntos siguientes (y, x) : (3, -1); (4, 0); (6,1).
3. Dada la recta de regresi on y = 3 + 5(x 2) con r = 0.8, s
R
= 1, construir un intervalo de
conanza del 95% para la pendiente si n = 100.
4. Dado el modelo estimado con n = 25 datos, y = 2 + 3(x 4), s
R
= 5, con desviaci on tpica
del coeciente de regresi on S(

1
) = 0.5, calcular la desviaci on tpica de la prediccion del
valor medio de y cuando x = 20.
5. Sir Francis Galton (1877) estudio la relaci on entre la estatura de una persona (y) y la estatura
de sus padres (x) obteniendo las siguientes conclusiones:
(a) Exista una correlaci on positiva entre las dos variables.
(b) Las estaturas de los hijos cuyos padres medan m as que la media era, en promedio,
inferior a la de sus progenitores, mientras que los padres con estatura inferior a la
media en promedio tenan hijos m as altos que ellos, calicando este hecho como de
regresion a la media.
Contrastar ( = 0.05) estas dos conclusiones con la ecuacion y = 17.8 + 0.91x resultante de
estimar un modelo de regresi on lineal entre las variables (en cm.) descritas anteriormente
para una muestra de tama no 100 si la desviaci on tpica (estimada) de

1
es 0.04.
6. La ley de Hubble sobre la expansi on del universo establece que dadas dos galaxias la ve-
locidad de desplazamiento de una respecto a la otra es v = Hd, siendo d su distancia y H
la constante de Hubble. La tabla proporciona la velocidad y la distancia de varias galaxias
respecto a la Via L actea. Se pide:
1
Galaxia Distancia Velocidad
(millones a nos luz) (10
3
Km/s)
Virgo 22 1.21
Pegaso 68 3.86
Perseo 108 5.15
Coma Berenices 137 7.56
Osa Mayor 1 255 14.96
Leo 315 19.31
Corona Boreal 390 21.56
Geminis 405 23.17
Osa Mayor 2 700 41.83
Hidra 1100 61.14
Tabla: Distancia y velocidad de desplazamiento de las distintas galaxias a la Via Lactea.
Nota: Observese que seg un el modelo de Hubble la regresi on debe pasar por el origen.
T omese 1 a no luz = 300 000 Km/seg x 31 536 000 seg = 9.46 10
12
Km.
(a) Estimar por regresi on la constante de Hubble.
(b) Como T = d/v = d/Hd = 1/H, la inversa de la constante de Hubble representa la
edad estimada del Universo. Construir un intervalo de conanza del 95% para dicha
edad .
7. Para establecer la relaci on entre el alargamiento en mm (Y ) producido en un cierto material
pl astico sometido a traccion y la fuerza aplicada en toneladas por cm
2
(X) se realizaron 10
experimentos cuyos resultados se muestran en la tabla
x
i
0.20 0.50 0.60 0.70 0.90 1.00 1.20 1.50 1.60 1.70
y
i
23 20 33 45 67 52 86 74 98 102
Tabla: Alargamiento y
i
(mm) producidos por la fuerza x
i
(Tm/cm
2
).
(a) Ajustar el modelo de regresi on lineal E(Y |x) =
0
+
1
x y contrastar ( = 0.01) la
hip otesis de que, en promedio, por cada Tm/cm
2
de fuerza aplicada es de esperar un
alargamiento de 50 milmetros, sabiendo que la desviaci on tpica residual vale 10.55.
(b) Si el lmite de elasticidad se alcanza cuando x = 2.2 Tm/cm
2
, construir un intervalo
de conanza al 95% para el alargamiento medio esperado en ese punto.
(c) Teniendo en cuenta que el alargamiento esperado cuando la fuerza aplicada es nula
debe ser nulo tambien, estimar el nuevo modelo E [Y |x] = x con los datos anteriores
Cu al es el sesgo del estimador del par ametro de la pendiente si se estima seg un el
modelo del apartado 1?
2
8. La ecuacion de regresi on entre las ventas de un producto y y su precio x es y = 320 1.2x,
s
R
= 2 y s
y
= 4. Si el n umero de datos ha sido n = 50, contrastar H
0
:
1
= 1 frente a la
alternativa H
1
:
1
< 1.
9. Se estudia la relaci on entre el tiempo de reparaci on (minutos) de ordenadores personales y
el n umero de unidades reparadas en ese tiempo por un equipo de mantenimiento con los
resultados mostrados en la siguiente tabla
unidades reparadas 1 3 4 6 7 9 10
tiempo de reparacion 23 49 74 96 109 149 154
Se pide:
(a) Construir la recta de regresi on para prever el tiempo de reparaci on y utilizarla para
construir un intervalo de conanza ( = 0.01) para el tiempo medio de reparaci on de
8 unidades.
(b) Construir un intervalo de conanza ( = 0.01) del tiempo de reparaci on para un lote
de 14 unidades.
(c) Si los tiempos de reparaci on fuesen medias de 10 datos. Cual sera la recta de regresi on?
10. Se realiza una regresi on m ultiple con tres regresores y se encuentra un coeciente de cor-
relaci on de 0.5 entre los residuos de la regresi on y uno de los regresores. Interpretar este
resultado.
11. La matriz de varianzas de tres variables estandarizadas es la siguiente
_
_
1 0.8 0.6
0.8 1 0.2
0.6 0.2 1
_
_
Calcular la ecuacion de regresi on de la primera variable respecto a las otras dos.
12. Dos variables x
1
y x
2
tienen la siguiente matriz de varianzas
_
1 0.5
0.5 1
_
y las regresiones simples con y son y = 0.75x
1
; y = 0.6x
2
. Calcular la regresi on m ultiple
entre y y las dos variables x
1
, x
2
sabiendo que la variable y tiene media cero y varianza
unidad.
13. Se realiza la regresi on entre la variable dependiente y y tres regresores x
1
, x
2
y x
3
. Posterior-
mente se decide realizar la regresi on entre la variable y y los tres regresores estandarizados.
Explicar cu ales son las diferencias entre los resultados de una regresi on y otra en cuanto a
los coecientes estimados

i
, los residuos y el coeciente de determinaci on, justicando la
respuesta.
3
14. La matriz de varianzas de las variables X
1
, X
2
e Y es
_
_
25 27 14
27 36 19.2
14 19.2 16
_
_
Siendo X
1
= 30, X
2
= 40, Y = 100 y el n umero de datos n = 10.
Se pide:
(a) Realizar la regresi on simple entre Y (variable dependiente) y X
1
, dando el intervalo de
conanza para la pendiente de la recta con = 0.05. Hacer lo mismo con Y y X
2
.
(b) Realizar la regresi on m ultiple entre Y (variable dependiente) y X
1
, X
2
, en desviaciones
a la media.
(c) Indicar si los coecientes de la regresi on anterior son signicativos.
(d) Calcular R
2
para los tres modelos, comentar los resultados obtenidos e indicar que
modelo eligira y por que.
15. Para establecer la relaci on entre el voltaje de unas bateras y la temperatura de fun-
cionamiento se han hecho unos experimentos cuyos resultados se muestran en la siguiente
tabla
Batera 1 2 3 4 5 6 7 8
Temperatura 10 10 20 20 30 30 40 40
Voltaje 7.2 7.7 7.3 7.4 7.7 9.4 9.3 10.8
Se pide:
(a) Contrastar la hipotesis ( = 0.05) de que no existe relaci on lineal entre el voltaje y la
temperatura.
(b) Las lecturas 1,3,5 y 7 fueron realizadas con unas bateras de Cadmio y las 2,4, 6 y 8 con
bateras de Zinc. Introducir en el analisis anterior una variable cualitativa que tenga
en cuenta los dos tipos de bateras y contrastar si es signicativa al 95%.
(c) Dar un intervalo de conanza para el voltaje de una batera de Cadmio que va a trabajar
a 35

centgrados. (Utilizar el modelo estimado en el apartado 2).


(d) Comprobar que se cumplen las hipotesis del modelo construido en los apartados ante-
riores.
16. C omo disminuira la varianza te orica de los estimadores

en el modelo de regresi on lineal
al replicar las observaciones? (Por replicar se entiende el obtener un nuevo vector Y de la
variable respuesta manteniendo las X jas).
4
17. Se ha estimado un modelo de regresi on para la estatura (y) de un grupo de adultos y sus
estaturas a los 7 (x
1
) y 14 (x
2
) a nos. La desviaci on tpica residual obtenida es 5 cm y la
desviaci on tpica del coeciente de x
1
(estatura a los 7 a nos) resulta 2.4, siendo este efecto
no signicativo al 95%. Sin embargo, un segundo modelo de regresi on que incluya solo a
esta variable (x
1
) conduce a una desviaci on tpica residual de 7 cm y a un coeciente de
regresi on de 2 con desviaci on tpica de 1. Que podemos concluir con estos resultados de la
correlaci on entre x
1
y x
2
?
18. Se dispone de una muestra de 100 autom oviles con informacion respecto a su consumo
(litros/100 km), peso (kg), potencia (CV), tipo de motor (I=inyecci on, NI=no inyecci on) y
nacionalidad (1=USA, 2=Alemania, 3=Japon, 4=Francia). Escribir la ecuacion del modelo
de regresi on lineal del consumo respecto al resto de las variables e interpretar el signicado
de cada uno de los par ametros del modelo.
19. Teniendo en cuenta que mediante variables cualitativas cualquier modelo de dise no experi-
mental puede escribirse como un modelo de regresi on, determinar la matriz V = X(X
T
X)
1
X
T
de proyecci on y la varianza de un residuo e
ij
para el modelo basico de analisis de la varianza
y
ij
=
i
+u
ij
, i = 1, ..., I ; j = 1, ..., n
i
Aplicarlo al caso de 3 grupos (I = 3), con 5 observaciones en el primer grupo, 4 en el segundo
y 3 en el tercero.
20. La variable y se relaciona con las variables x
1
y x
2
seg un el modelo E(y) =
0
+
1
x
1
+
2
x
2
;
no obstante se estima el siguiente modelo de regresi on que no incluye la variable x
2
y
i
=

0
+

1
x
1i
.
Justicar en que condiciones el estimador

1
es centrado.
21. Se efect ua una regresi on con dos variables explicativas E[y] =
0
+
1
x
1
+
2
x
2
. La matriz
de varianzas de x
1
y x
2
es
_
2 1
1 3
_
Cu al de los dos estimadores

1
y

2
tendr a menor varianza?
22. Se estudia la relaci on entre los costes de fabricacion totales en miles de pesetas (Y ), de 25
libros tecnicos, la tirada en miles de ejemplares producidos (T) y el n umero de paginas del
libro (N), encontrandose la relaci on
Y = 1400 + 900T + 4N
(a) Sabiendo que las desviaciones tpicas (sin corregir por grados de libertad) de T y N
son 1.5 miles de ejemplares y 200 paginas respectivamente, y s
R
= 600, calcular un
intervalo de conanza del 90% para los efectos de T y N suponiendo que las variables
estan incorreladas. Interpretar el resultado.
5
(b) Si el coeciente de correlaci on entre las variables T y N es 0.5, Puede admitirse la
hip otesis de que el coste asociado a la tirada es de 1.100.000 ptas. cada mil unidades?
( = 0.05).
(c) Sabiendo que la desviaci on tpica (sin corregir por grados de libertad) de los costes de
fabricacion es 2200 miles de pesetas, calcular el coeciente de correlaci on m ultiple y el
estadstico F para contrastar que ambas variables no inuyen. Interpretar el resultado.
(d) Para estudiar cu anto encarecen los gr acos el precio se introduce en el modelo una
variable cticia Z que toma el valor 1 en libros con gr acos y 0 en el resto, obteniendose
el nuevo modelo estimado siguiente (desviaciones tpicas entre parentesis)
Y = 1080 + 520Z + 840T + 3.8N
(100) (16) (0.97)
Interpretar el resultado.
23. Demostrar que el coeciente de correlaci on m ultiple en el modelo general de regresi on es
igual al coeciente de correlaci on lineal entre la variable observada y y la prevista y.
24. Para 11 provincias espa nolas se conocen los siguientes datos:
Y = n umero de mujeres conductoras dividido por el n umero de hombres conductores.
X
1
= porcentaje de mujeres que trabajan sobre el total de trabajadores de la provincia.
X
2
= porcentaje de poblacion que trabaja en el sector agrcola.
Si se denomina X = (1 X
1
X
2
) a la matriz de regresores (1 es un vector de unos) se sabe que
(X
T
X)
1
=
_
_
5.1 0.12 0.05
0.12 30.8 0.08
0.05 0.08 0.001
_
_
(X
T
Y ) =
_
_
0.06
0.05
9.45
_
_
s
R
= 0.03;
n

i=1
(y
i
y)
2
= 0.0645
Se pide:
(a) Estimar el modelo de regresi on y realizar los contrastes individuales ( = 0.05). Inter-
pretar la regresi on.
(b) Calcular el coeciente de determinaci on R
2
y realizar el contraste de que las dos vari-
ables no inuyen mediante el test F ( = 0.05).
(c) Se introducen dos nuevas variables en la regresi on: X
3
que representa el porcentaje
de poblacion que trabaja en los servicios, y X
4
el porcentaje de poblacion que trabaja
en otras actividades distintas de agricultura y servicios. Explicar razonadamente como
sera la regresi on al introducir estas dos nuevas variables y los efectos de cada una de
ellas.
6
25. Con los datos de la tabla, se pide:
x -2 -2 -1 -1 0 0 1 1 2 2 3 3
y 1.1 1.3 2.0 2.1 2.7 2.8 3.4 3.6 4.0 3.9 3.8 3.6
(a) Estimar un modelo de regresi on simple con y como variable dependiente y x como
regresor. Indicar si el modelo es apropiado, justicando la respuesta.
(b) Estimar el modelo
y
i
=
0
+
1
x
i
+
2
x
2
i
+u
i
y realizar el contraste H
0
:
2
= 0.
(c) El resultado de la estimaci on del modelo que incluye el termino x
3
es,
y
i
= 2.81 + 0.80x
i
- 0.06x
2
i
- 0.035x
3
i
(0.05) (0.048) (0.019) (0.010)
con s
R
= 0.113 (entre parentesis las desviaciones tpicas de los estimadores). Realizar
el contraste general de regresi on con = 0.01. Seleccionar entre los tres el modelo m as
adecuado, justicando la respuesta.
26. En un modelo de regresi on simple se ha obtenido un coeciente de correlaci on igual a 0.8.
Si el n umero de observaciones es n = 150, y = 22 y la variabilidad total es 320. Construir
un intervalo de conanza al 95% para el valor medio de la variable dependiente (y) cuando
x (regresor) es igual a x. (Aproximar la distribucion t de Student correspondiente por una
distribuci on normal, si Z N(0, 1), P(Z 1.96) = 0.975).
27. En una planta piloto se obtiene un nuevo producto mediante un proceso qumico. Con el
n de mejorar el rendimiento se emplean dos catalizadores distintos y se trabaja con tres
temperaturas diferentes. Los resultados del experimento son
Temperatura
Catalizador 20
0
30
0
40
0
A 115 125 130 140 110 120
B 115 105 135 145 100 110
(a) Contrastar si los factores Temperatura y Catalizador tienen efectos signicativos. ( =
0.05)
(b) Que tratamiento se debe utilizar para obtener el mayor rendimiento, si se desea garan-
tizar una probabilidad de error tipo I total,
T
= 0.03?
(c) Estimar y contrastar el modelo de regresi on simple entre el rendimiento y la tempera-
tura. Que conclusiones obtiene? Proponga un modelo de regresion que subsane las
deciencias encontradas.
7
28. El modelo de regresion m ultiple se puede escribir en notacion matricial
Y = X +U
donde U es el vector de variables aleatorias que cumple las hipotesis de normalidad, inde-
pendencia y homocedasticidad. Deducir razonadamente la distribuci on, media y matriz de
varianzas del vector de residuos e = Y X

.
29. La empresa de bebidas gaseosas CIBELES quiere determinar la inuencia sobre la presi on
interna (y
i
) en los botes de refresco de dos variables continuas (x
1
, x
2
) y del tipo de bebida
(NARANJA=1, LIMON=2 y COLA=3). Para distintos valores de x
1
y x
2
y 20 botes de
cada sabor, ha medido la presion interna. El tipo de bebida se representa por las variables z
1
,
z
2
y z
3
que identican el sabor NARANJA, LIMON y COLA, respectivamente. El modelo
estimado de regresi on de y con respecto a x
1
, x
2
, z
2
y z
3
es:
y = 19.4 + 77.2x
1
50.8x
2
+ 2.95z
2
+ 5.52z
3
; s
R
= 4.32
donde
(X
T
X)
1
=
_

_
0.1772 0.6909 0.5043 0.0605 0.0896
0.6909 5.8085 0.2541 0.1478 0.2444
0.5043 0.2541 5.0070 0.0680 0.1216
0.0605 0.1478 0.0680 0.1049 0.0546
0.0896 0.2444 0.1216 0.0546 0.1127
_

_
(a) Realizar los contrastes individuales con = 0.01, indicando las variables que inuyen
signicativamente en la presion. Interpretar el resultado explicando el signicado de
cada par ametro.
(b) Si se realiza una regresi on entre la presion interna (y
i
) y las dos variables continuas x
1
y x
2
se obtiene el siguiente modelo de regresi on
y = 23.86 + 65.1x
1
56.3x
2
; s
R
= 4.78.
Contrastar ( = 0.01) conjuntamente que el tipo de bebida no inuye. (H
0
:
2
=
3
=
0 frente a H
1
:
2
o
3
es distinto de cero).
(c) Existe diferencia signicativa en las presiones internas de los botes de LIMON y
COLA? ( = 0.01)
30. Estimar por m axima verosimilitud los par ametros
1
y
2
del modelo
y
i
=
1
x
1i
+
2
x
2
2i
+u
i
; u
i
N(0, ).
En que condiciones los estimadores obtenidos por m axima verosimilitud son iguales que los
obtenidos por mnimos cuadrados?
31. Obtener la relaci on entre el coeciente de determinaci on R
2
y el coeciente de determinaci on
corregido R
2
. Que ventajas presenta el segundo frente al primero ?
8
32. Con el n de reducir el tiempo de secado se han realizado 20 ensayos con cementos de
distintas caractersticas. El ajuste por mnimos cuadrados de la ecuacion de regresi on entre
el tiempo de secado y una de las variables x
1
es
y = 17.1 + 2.9x
1
, s
R
= 12.8, R
2
= 0.37
(a) Obtener el intervalo de conanza al 95% para el par ametro de la pendiente de la recta
e indicar si su efecto es signicativo.
(b) Incluir en el modelo de regresi on otra variable independiente x
2
, sabiendo que su var-
ianza muestral es s
2
2
= 9.2, la covarianza entre las dos variables independientes es
s
12
= 3.35 y la covarianza entre el tiempo de secado y la nueva variable s
2y
= 9.55.
Realizar los contrastes individuales para los par ametros de x
1
y x
2
.
(c) Un estudio te orico del problema indica que el efecto de las dos variables es igual y que
por tanto, la ecuacion de regresi on debera ser
y =

b
0
+

b
1
(x
1
+x
2
).
Con la informacion de los apartados anteriores, obtener

b
1
y contrastar si la pendiente
de la recta es signicativamente distinta de cero.
33. En el analisis de regresi on simple entre dos variables, se considera como importante desde
el punto de vista pr actico, una correlaci on entre las dos variables igual o superior a r = 0.1.
Determinar el n umero mnimo de observaciones con las que se debe estimar el modelo de
regresi on para que una correlaci on igual a 0.1, implique que el regresor tiene un efecto
signicativo sobre la variable dependiente. (Aproximar la distribuci on t de Student corre-
spondiente por una distribucion normal, si Z N(0, 1), P(Z 1.96) = 0.975).
34. Interpretar geometricamente el problema de estimaci on por mnimos cuadrados en regresi on
m ultiple. Demostrar que los residuos del modelo se obtienen mediante la expresion e =
PY , donde Y es el vector correspondiente a la variable dependiente y P es una matriz de
dimension n n. Determinar P en terminos de la matriz X de los regresores. A partir de
la expresion anterior, obtener la distribucion de probabilidad de los residuos, la media y la
matriz de varianzas.
35. Una de las etapas de fabricacion de circuitos impresos requiere perforar las placas y recubrir
los oricios con una l amina de cobre mediante electr olisis. Una caracterstica esencial del
proceso es el grosor de la capa de cobre. Se han realizado 12 experimentos para evaluar
el efecto de 7 variables, X
1
: Concentracion de Cobre, X
2
: Concentraci on de Cloruro, X
3
:
Concentracion de

Acido, X
4
: Temperatura, X
5
: Intensidad, X
6
: Posicion y X
7
: Supercie
de la placa. Cada variable se ha estudiado a dos niveles. Las condiciones experimentales y
los resultados de cada experimento se muestran en la tabla.
9
X
1
X
2
X
3
X
4
X
5
X
6
X
7
Y
1 1 -1 1 1 1 -1 2.13
1 -1 1 1 1 -1 -1 2.15
-1 1 1 1 -1 -1 -1 1.67
1 1 1 -1 -1 -1 1 1.53
1 1 -1 -1 -1 1 -1 1.49
1 -1 -1 -1 1 -1 1 1.78
-1 -1 -1 1 -1 1 1 1.80
-1 -1 1 -1 1 1 -1 1.93
-1 1 -1 1 1 -1 1 2.19
1 -1 1 1 -1 1 1 1.61
-1 1 1 -1 1 1 1 1.70
-1 -1 -1 -1 -1 -1 -1 1.43
Responder a las siguientes preguntas aplicando el modelo de regresi on m ultiple, teniendo en
cuenta que X
T
X = 12I
8
, donde I
8
es la matriz identidad de 8 8.
(a) Estimar el modelo de regresi on m ultiple
y
i
=
0
+
1
x
1i
+
2
x
2i
+
3
x
3i
+
4
x
4i
+
5
x
5i
+
6
x
6i
+
7
x
7i
+u
i
.
Obtener la descomposicion de la variabilidad del modelo y realizar el contraste
H
0
:
1
=
2
=
3
=
4
=
5
=
6
=
7
= 0
frente a la hipotesis alternativa H
1
: alg un
j
es distinto de cero.
(NOTA.: X
T
Y = (21.41, 0.03, 0.01, 0.23, 1.69, 2.35, 0.09, 0.19)
T
)
(b) Realizar cada uno de los contrastes individuales e indicar que variables tienen efecto
signicativo.
(c) Eliminar del modelo del apartado 1 todas las variables no signicativas. Estimar el
modelo y contrastar sus coecientes. Interpretar los resultados del experimento.
36. Una medida crtica de calidad en la fundicion de llantas de aluminio por inyecci on es la
porosidad. Se ha realizado un dise no experimental para analizar la porosidad (Y ) en funcion
de la temperatura (T) del aluminio lquido y de la presion (P) con que este se inyecta al
molde. Se han realizado n=16 experimentos y el modelo obtenido ha sido
y = 2.84 + 0.59 T - 0.031 P
(.048) (.048) (.048)
+ 0.26 T
2
+ 0.30 P
2
- 0.22 TP
(.048) (.048) (.068)
Entre parentesis se proporciona la desviaci on tpica estimada para cada uno de las estima-
ciones de los par ametros del modelo. Adem as s
R
= 0.137 y R
2
= 0.9267. Las condiciones
experimentales se eligieron de forma que los cinco regresores utilizados en el modelo estan
incorrelados.
10
(a) Realizar el contraste F general de regresi on y los contrastes individuales de todos los
coecientes del modelo, indicando cu al es signicativamente distinto de cero.
(b) Demostrar que si los regresores estan incorrelados, al eliminar alguno del modelo,
las estimaciones de los restantes no varan. Adem as, si se elimina el regresor j, con
par ametro estimado

j
, la variabilidad no explicada del nuevo modelo V NE
1
es igual
a V NE
0
+ ns
2
j

2
j
, donde V NE
0
es la variabilidad no explicada del modelo con todos
los regresores. Obtener s
R
y R
2
para el modelo que unicamente incluye los par ametros
signicativos.
(c) Determinar en que condiciones de presion y temperatura la porosidad es mnima seg un
el modelo anterior y dar un intervalo para prediccion de la porosidad media en estas
condiciones. (Si t es la temperatura medida en grados centgrados (
0
C) y p la presi on
en kg/cm
2
,
T = (t 650)/10 y P = (p 975)/25. En estas unidades se cumple que

n
i=1
T
i
= 0,

n
i=1
P
i
= 0,

n
i=1
T
2
i
= 8,

n
i=1
P
2
i
= 8,

n
i=1
T
i
P
i
= 0)
37. Demostrar que cuando todos los regresores estan incorrelados, el coeciente de determinaci on
de un modelo de regresi on m ultiple cumple R
2
=

k
j=1
r
2
j
, donde k es el n umero de regresores
y r
j
el coeciente de correlaci on entre el regresor j y la variable dependiente.
38. Explicar el concepto de multicolinealidad en regresi on m ultiple, como se identica y cu ales
son sus efectos sobre (a) los estimadores

i
, (b) los residuos y (c) las predicciones.
39. Demostrar que en un modelo de regresi on simple y y el estimador de la pendiente

1
son
independientes. Utilizar esta propiedad para calcular la varianza de

0
= y

1
x.
40. La masa M de un cristal de hielo depositado en una camara a temperatura (-5
o
C) y humedad
relativa constante crece seg un la ecuacion M = T

, donde T es el tiempo y y son


par ametros desconocidos. La relaci on anterior se linealiza con la transformacion logartmica,
estim andose el siguiente modelo
log M = log + log T +u
donde el termino a nadido u son los errores experimentales, que se consideran aleatorios e
independientes con distribucion normal, N(0,
2
). Diez cristales del mismo tama no y forma se
introdujeron en una camara, extrayendose secuencialmente seg un unos tiempos previamente
establecidos. Para determinar la inuencia del tipo de camara, se repiti o exactamente el
experimento en una segunda camara. Los valores de s
R
para la camara 1 y 2 son 0.64 y
0.50, respectivamente. Los modelos estimados para cada camara, X
T
X y (X
T
X)
1
son:
log M
1
= 7.30 + 2.40 log T
log M
2
= 5.74 + 2.03 log T
X
T
X =
_
10.00 46.66
46.66 218.9
_
(X
T
X)
1
=
_
18.27 3.89
3.89 0.835
_
11
(a) Contrastar con nivel de signicaci on 0.05 si los dos modelos tienen la misma pendiente.
Lo mismo para la ordenada en el origen. (NOTA.- Aceptar que la varianza de los
dos modelos es la misma y estimarla como el promedio de las dos varianzas residuales
calculadas.)
(b) Un modelo de regresi on m ultiple Y = X + U, se replica, es decir se obtienen dos
vectores de variables respuesta Y
1
, Y
2
, para los mismo regresores (matriz X). Demostrar
que si

1
y

2
son los resultados de la estimaci on de utilizando por separado la variable
Y
1
e Y
2
; entonces el estimador de con todos los datos es (

1
+

2
)/2.
(c) Estimar un unico modelo con los datos de las dos camaras. Sabiendo que Y
T
Y = 306.8,
donde Y = log M, dar un intervalo de conanza al 99% para los dos par ametros.
41. El molibdeno se a nade a los aceros para evitar su oxidaci on, pero en instalaciones nucleares
presenta el inconveniente de ser el causante de gran parte de los productos radioactivos. Se
ha realizado un experimento para determinar el grado de oxidaci on del acero en funcion del
porcentaje de molibdeno. Adem as se ha tenido en cuenta el efecto del tipo de refrigerante
utilizado (R
1
, R
2
). Los resultados se muestran en la tabla.
Molibdeno (%)
Refrig. 0.5% 1% 1.5% 2% Medias
R
1
26.2 23.4 20.3 23.3 23.3
R
2
34.8 31.7 29.4 26.9 30.7
R
1
33.2 31.3 28.6 29.3 30.6
R
2
43.0 40.0 31.7 33.3 37.0
Media 34.3 31.6 27.5 28.2 30.4
(a) Escribir un modelo de regresi on que incluya el porcentaje de molibdeno y el tipo de re-
frigerante como regresores; estimar el modelo e indicar que par ametros son signicativos
( = 0.05)).
(b) Los experimentos relativos a las dos primeras las se realizaron en un tipo de instalaci on
y los correspondientes a las dos ultimas en otra distinta. Escribir un nuevo modelo que
incluya este aspecto. Comprobar que este nuevo regresor esta incorrelado con los dos
anteriores. Estimar el nuevo modelo.
(c) Demostrar que en un modelo con los regresores incorrelados, la eliminacion de uno
de ellos no inuye en el valor de los estimadores

i
, (i = 0) restantes. Inuye en
la varianza residual y en los contrastes ? Explicar este efecto en funcion de que el
par ametro del regresor eliminado sea o no nulo.
42. Demostrar que en un modelo de regresi on m ultiple estimado por m axima verosimilitud, los
residuos cumplen
n

j=1
e
j
x
ij
= 0,
donde [x
i1,
x
i2,
..., x
in,
] es cualquier regresor del modelo. Obtener la distribuci on conjunta
del vector de residuos. Si
2
es la varianza te orica de la componente aleatoria del modelo,
indicar en que circuntancias la varianza de un residuo es mayor que
2
.
12
43. Se dispone de una muestra de 86 vehculos, de los cuales 31 son japoneses (J), 41 norteame-
ricanos (N) y 14 europeos (E). La media y desviaci on tpica del consumo de gasolina (en litros
cada 100 Km) para los coches japoneses es y
J
= 9.1781, s
J
= 1.42, para los norteamericanos
y
N
= 9.7274, s
N
= 1.25 y para los europeos y
E
= 10.64, s
E
= 1.36.
(a) Suponiendo que los vehculos escogidos son muestras aleatorias independientes y que
pueden aplicarse las hipotesis de normalidad y homocedasticidad, contrastar la hip otesis
de que el lugar de fabricacion no inuye en el consumo de combustible. Existe alg un
grupo con un consumo signicativamente menor que los otros dos?
(b) Los coches tienen caractersticas muy diferentes (peso, potencia,...) que deben ser
tenidas en cuenta para hacer la comparacion anterior. Con esa nalidad, se ha ajustado
el siguiente modelo de regresi on:
y = 3.305 + 0.843 Pot + 3.829 Peso + 0.440 Z
J
+ 1.127 Z
E
s
2
R
= 0.506, R
2
= 75.7%
donde (X
T
X)
1
es:
_
_
_
_
_
_
4.791e 1 5.054e 2 3.794e 1 9.157e 2 4.682e 2
5.054e 2 1.595e 1 1.931e 1 3.443e 3 1.262e 2
3.794e 1 1.931e 1 4.646e 1 5.210e 2 2.865e 2
9.157e 2 3.443e 3 5.210e 2 6.667e 2 2.744e 2
4.682e 2 1.262e 2 2.865e 2 2.744e 2 9.759e 2
_
_
_
_
_
_
donde la variable dependiente es el consumo, Pot (potencia) esta expresada en unidades
de 100 Cv, el Peso en Toneladas, Z
J
toma el valor 1 si el coche es japones y cero en
los demas, y Z
E
toma el valor 1 para los coches europeos y cero en los demas. Realizar
el contraste general de regresi on para el modelo anterior e interpretar los coecientes
estimados.
(c) Con el modelo de regresi on anterior realizar los tres contrastes siguientes:
(c.1) No existe diferencia en el consumo de los coches japoneses y europeos.
(c.2) No existe diferencia en el consumo de los coches japoneses y norteamericanos.
(c.3) No existe diferencia en el consumo de los coches europeos y norteamericanos.
Comparar los resultados con los obtenidos en el apartado 1, explicar a que se deben las
diferencias y justicar cu al es el modelo m as adecuado para hacer las comparaciones.
44. El modelo de regresi on m ultiple con n observaciones y k + 1 variables independientes (in-
cluyendo la constante
0
) se puede escribir en notacion matricial como
Y = X +U,
donde U es el vector de variables aleatorias que cumple las hipotesis de normalidad, inde-
pendencia y homocedasticidad y la matriz de los regresores X es de dimension n (k + 1).
Demostrar que si se transforma linealmente la matriz X, esto es, W = XA, donde A es
cualquier matriz cuadrada de dimension (k + 1) (k + 1) y rango m aximo, entonces la
regresi on de Y con la nueva W proporciona las mismas predicciones y los mismos residuos.
Justicar geometricamente este resultado.
13
45. La resistencia a la traccion (y) de una aleacion met alica en funcion de la temperatura de
templado (x) se ha ajustado con una ecuacion de regresi on para 30 observaciones resultando:
y = 276.1 + 1.9x, s
R
= 15.7, R
2
= 0.43
Se puede concluir con una conanza del 95% que la temperatura de templado tiene efecto
signicativo en la resistencia a la traccion.
46. En Cosby Creek, una ciudad al sur de las monta nas Apalaches, se ha hecho un estudio para
determinar como el pH y otras medidas de acidicaci on del agua se ven afectadas durante
las tormentas. En concreto se han obtenido 17 datos durante cada una de las tres tormentas
monitorizadas para un total de 19 variables, aunque en este analisis se analizar an solo 2, el
pH y el denominado Weak Acidity (WA). Se ha estimado el modelo de regresi on m ultiple
del valor pH con respecto a la variable WA y para cada una de las tres tormentas. Las
tormentas se representan con las variables cticias z
1
, z
2
y z
3
que identican respectivamente
la tormenta 1, 2 y 3. El modelo estimado de regresi on de y con respecto a WA, z
1
, z
2
y z
3
es:

pH = 5.77 0, 00008WA
(0,000727)
+0, 998z
1
(0,4664)
+1, 65z
2
(0,4701)
0, 005z
1
WA
(0,0014)
0, 008z
2
WA
(0,0016)
, R
2
= 0, 866
Entre parentesis las deviaciones tpicas estimadas de los estimadores de los par ametros cor-
respondientes.
(a) Realice el contraste general de regresi on y los contrastes individuales con = 0, 05
indicando las variables que inuyen signicativamente en el pH. Interprete el signicado
de cada par ametro.
(b) Proporcione sendos intervalos de conanza al 95% para los par ametros de las interac-
ciones z
1
WA y z
2
WA. Que conclusiones pueden extraerse? Se puede simplicar el
modelo?
47. Dos becarios del Departamento de Ciencias Sociales estan interesados en el estudio de la
Tasa de Mortalidad Infantil (TMI). Para ello, han recogido en 107 pases dicha magnitud
as como la alfabetizacion (A), el PIB y la poblacion (Pob) en cada uno de ellos.
Las medias y desviaciones tpicas corregidas de estas 4 variables son:
TMI A PIB Pob
Media 42.67 78.34 5831.4 48501
DT corregida 38.3 22.88 6537.24 147.991
(a) Si el coeciente de correlaci on entre TMI y A vale -0.9005 estime el modelo de regresi on
simple en el que TMI es la variable respuesta y A la variable explicativa y contraste si
la pendiente estimada es signicativa.
(b) Los becarios han estimado un modelo de regresi on m ultiple en que la variable depen-
diente es TMI y las variables independientes son A, PIB y Pob. Observando que la
diagnosis del modelo es inadecuada. Estime el modelo de regresi on m ultiple entre TMI
(variable dependiente) y los regresores A, log(PIB) y log(Pob). Para ello se proporciona:
14
(

X)
1
= 10
3
_
_
0.0259 0.0499 0.0001
0.0499 0.3186 0.0007
0.0001 0.0007 0.0004
_
_
(

Y ) = 10
4
_
_
8.3651
1.7007
5.1293
_
_
siendo

X la matriz de estos 3 ultimos regresores en desviaciones a la media e

Y el vector
respuesta en desviaciones a la media. Son signicativos los coecientes estimados?
c. Para el modelo del apartado anterior realice el contraste general de regresi on. En-
cuentra contradicciones entre el resultado de los contrastes individuales del apartado 2
y el del apartado 3? Justique la respuesta.
d. Los pases objeto del estudio se pueden clasicar en desarrollados y no desarrollados.
Para ello se introduce la variable cualitativa Z que toma valor 0 si el pas es desarrollado
y 1 si no lo es. El modelo resultante se presenta a continuacion:
TMI = 138.2 1.1A9.6 log(PIB) + 3.3Z con s
2
R
= 196.3
Todos los coecientes estimados resultan signicativos. Interprete dichos coecientes y elija
de manera razonada el mejor modelo de entre los propuestos en el segundo y cuarto apartados
NOTA: Utilice = 0.05 para todos los contrastes que sean necesarios.
48. Se ha realizado la regresi on entre la anchura y la longitud del pie en centmetros con datos
de chicos y chicas de cuarto curso de la ense nanza secundaria. En la tabla se proporciona el
resultado de la regresi on. En el modelo se ha incluido una variable cualitativa que toma el
valor 1 si la observacion corresponde a una chica y 0 si es a un chico. Interpreta el resultado
del analisis.
Multiple Regression Analysis
-----------------------------------------------------------------------------
Dependent variable: Anch
-----------------------------------------------------------------------------
Standard T
Parameter Estimate Error Statistic P-Value
-----------------------------------------------------------------------------
CONSTANT 4,29977 1,12692 3,81551 0,0005
Long 0,21311 0,048554 4,38913 0,0001
Chica -0,272394 0,127844 -2,13067 0,0402
-----------------------------------------------------------------------------
Analysis of Variance
15
-----------------------------------------------------------------------------
Source Sum of Squares Df Mean Square F-Ratio P-Value
-----------------------------------------------------------------------------
Model 4,60164 2 2,30082 16,41 0,0000
Residual 4,90599 35 0,140171
-----------------------------------------------------------------------------
Total (Corr.) 9,50763 37
R-squared = 48,3994 percent
49. Seg un la ecuacion de los gases ideales, la presion ejercida por un gas a volumen y temperatura
constante es proporcional a la masa. Se puede utilizar el siguiente procedimiento para estimar
el peso molecular de un gas. Se almacena el gas en un recipiente de volumen constante, y se va
soltando poco a poco gas, variando la presion, pero manteniendo la temperatura constante.
En la tabla adjunta se proporcionan mediciones de la presion (con respecto a la atmosferica)
y de la masa del gas para el argon.
Presi on (psi) Masa (g)
52 1, 028
49 0, 956
44 0, 88
39 0, 793
34 0, 725
29 0, 645
25 0, 593
21 0, 526
19 0, 5
19 0, 442
11 0, 373
0 0, 21
(a) Para estimar el peso molecular del argon a partir de los datos, se propone el siguiente
modelo de regresi on
P
i
= m
i
+u
i
, con u
i
N(0,
2
).
Obtener el estimador de m axima verosimilitud del par ametro
(b) Realizar el contraste H
0
: = 50 frente a H
1
: = 50 con nivel de signicaci on 0.05.
(c) Para el modelo del apartado 1, obtener un intervalo de prediccion para la presi on cuando
la masa es igual a 1 gramo.
(d) Se considera tambien el modelo alternativo
P
i
=
0
+
1
m
i
+u
i
con u
i
N(0,
2
).
16
Obtener la varianza del estimador de E[P
h
|m
h
], es decir del valor medio de la presi on P
h
para una masa dada m
h
con ambos modelos. Si el modelo verdadero fuese el del primer
apartado, que efecto tendra sobre la prediccion adoptar el modelo alternativo?
50. Se ha estimado un modelo de regresi on con dos variables independientes y 150 observaciones
obteniendose la siguiente ecuacion:
y
i
= 1.17 + 0.025 log x
1
+ 0.59 log x
2
, s
2
R
= 2.48
La matriz de varianzas estimada de

b = [

1
,

2
]
T
para el modelo propuesto es
_

X
T

X
_
1
s
2
R
=
_
.253 .201
.201 .288
_
.
realiza el contraste general de regresi on con = 0.05:
H
0
:
1
=
2
= 0
H
1
: alg un
i
es distinto de cero
51. En el modelo de regresi on
y
i
=
0
+
1
X
1i
+
2
X
2i
+u
i
con las hipotesis habituales, explicar como se contrasta
H
0
:
1
=
2
H
1
:
1
=
2
52. Demostrar que en el modelo de regresi on m ultiple con k regresores y constante, el estadstico
que contrasta H
0
:
0
=
1
=
2
= =
k
= 0 frente a H
1
: alg un
i
= 0, si H
0
es cierta
es:
F =
Y
T
V Y
Y
T
(I V )Y
n k 1
k + 1
F
k+1,nk1
donde V = X(X
T
X)
1
X
T
e I es la matriz identidad de dimension n n.
53. En la tabla siguiente se muestra el resultado de un experimento para relacionar el calor
generado en el proceso de endurecimiento del 13 muestras de cemento en funcion de su
composicion. Los regresores X
i
corresponden al porcentaje de 4 componentes de la mezcla.
17
Fila Regresores Calor Modelo II
X
1
X
2
X
3
X
4
Y Residuo v
ii
1 7 26 6 60 78.5 -1.574 0.25
2 1 29 15 52 74.3 1.049 0.26
3 11 56 8 20 104.3 -1.515 0.12
4 11 31 8 47 87.6 -1.658 0.24
5 7 52 6 33 95.9 -1.393 0.08
6 11 55 9 22 109.2 4.048 0.11
7 3 71 17 6 102.7 -1.302 0.36
8 1 31 22 44 72.5 -2.075 0.24
9 2 54 18 22 93.1 1.825 0.18
10 21 47 4 26 115.9 1.362 0.55
11 1 40 23 34 83.8 3.264 0.18
12 11 66 9 12 113.3 0.863 0.20
13 10 68 8 12 109.4 -2.893 0.21
Modelo I Modelo II
Desv. Tp.
Par ametros Estimacion Estimadas t
Constante 62.4 70.1 0.89
X
1
1.55 0.74 2.08
X
2
0.51 0.72 0.70
X
3
0.10 0.75 0.13
X
4
-0.14 0.71 -0.20
Desv. Tp.
Par ametros Estimacion Estimadas t
Constante 52.6 2.28 23.0
X
1
1.46 0.12 12.1
X
2
0.66 0.045 14.4
Analisis de la Varianza
Varia- Grados
Fuentes bilidad Lib. Var. F
Explic. 2667.9 4 667.0 111.5
Residual 47.8 8 5.98
Total 2715.7 12
Analisis de la Varianza
Varia- Grados
Fuentes bilidad Lib. Var. F
Explic. 2657.8 2 1328.9 229.5
Residual 57.9 10 5.8
Total 2715.7 12
En las tablas se proporcionan dos modelos de regresi on lineal, con las estimaciones de los
par ametros, las desviaciones tpicas estimadas de estos y los estadsticos t de los contrastes
individuales. Debajo se incluyen las tablas de analisis de la varianza de cada modelo.
(a) Realizar los contrastes H
0
:
i
= 0 frente H
1
:
i
= 0 para los distintos par ametros en
los dos modelos. Realizar el contraste conjunto H
0
:
3
=
4
= 0 frente H
1
: alguno de
los dos es = 0. Se puede concluir con estos datos que X
4
no inuye signicativamente
en el calor Y ?
(b) Estimar el modelo de regresi on simple del calor Y y la variable explicativa X
4
Inuye
signicativamente X
4
en el calor Y ? Analizar este resultado e interpretarlo teniendo
en cuenta el resultado del apartado anterior.
(c) En la tabla superior se muestran los residuos del modelo II y los elementos de la
diagonal de la matriz V = X(X
T
X)
1
X
T
. Indicar los residuos con mayor y menor
varianza, justicando la respuesta. Si se vuelve a repetir los experimentos en estas dos
18
condiciones, dar un intervalo para la prediccion de los nuevos valores de la variable
dependiente (usar = 0.05).
54. En un estudio de regresi on simple con 35 observaciones ha resultado el siguiente modelo
y = 0.12 + 7.6 log(x), s
R
= 1.2, R
2
= 0.37
Obtener el intervalo de conanza al 95% para el par ametro de la pendiente e indicar si su
efecto es signicativo.(El percentil 0.975 de la distribucion t de Student con 33 grados de
libertad es 2.03)
55. Los datos siguientes corresponden a la perdida (P) por abrasion en gr/h y su medida de
dureza (D) en grados Shore para 15 gomas de caucho de alta resistencia a la tensi on (A) y
otras 15 gomas de caucho con resistencia a la tension baja (B):
A D 75 55 61 66 71 71 81 86
A D 53 60 64 68 79 81 56
A P 128 206 175 154 136 112 55 45
A P 221 166 164 113 82 32 228
B D 45 68 83 88 59 71 80 82
B D 89 51 59 65 74 81 86
B P 372 196 97 64 249 219 186 155
B P 114 341 340 283 267 215 148
Escribir el modelo estadstico, indicar los par ametros y explicar el procedimiento de esti-
maci on para estudiar con estos datos simultaneamente el efecto de la dureza y de la resisten-
cia a la tension (alta o baja) en las perdidas por abrasion. Indicar como contrastar con el
modelo propuesto que las gomas de caucho con baja resistencia a la traccion tienen por
termino medio mayor perdida que las gomas con resistencia a la traccion baja. (Nota.- No
se pide ning un calculo numerico, los datos se presentan para ilustrar y describir el problema
de forma precisa).
56. Sea x
1
la altura del tronco de un arbol y x
2
el di ametro del mismo en su parte inferior. El
volumen y del tronco de arbol puede ser calculado aproximadamente con el modelo
y
i
= x
1i
x
2
2i
+u
i
,
seg un el cual, el volumen del tronco es proporcional al volumen de un cono con las medidas
x
1i
, x
2i
, siendo el par ametro (desconocido) de proporcionalidad, m as una componente
de error aleatorio u
i
. La tabla siguiente contiene los datos (en metros y metros c ubicos)
correspondientes a una muestra aleatoria de 15 troncos de una variedad de pino.
19
Obs. x
1i
x
2i
x
1i
x
2
2i
y
i
Obs. x
1i
x
2i
x
1i
x
2
2i
y
i
1 10,1 0,117 0,14 0,062 9 19,8 0,297 1,75 0,821
2 11,3 0,13 0,19 0,085 10 26,8 0,328 2,90 1,280
3 20,4 0,142 0,41 0,204 11 21 0,351 2,60 1,034
4 14,9 0,193 0,56 0,227 12 27,4 0,376 3,90 1,679
5 23,8 0,218 1,13 0,47 13 29 0,389 4,40 2,073
6 19,5 0,236 1,09 0,484 14 27,4 0,427 5,00 2,022
7 21,6 0,257 1,43 0,623 15 31,7 0,594 11,2 4,630
8 22,9 0,269 1,66 0,722
(a) Estimar por m axima verosimilitud suponiendo que las variables u
i
tienen distribuci on
normal de media cero, con la misma varianza e independientes.
(b) Un tronco tiene una altura de 20 metros y un diametro de 0.25 metros, dar un intervalo
de prediccion de su volumen (95% de conanza). La varianza residual del modelo es
0,0058.
(c) En el analisis de los residuos se observa que la varianza de los errores crece con el
volumen del tronco. Para obtener homocedasticidad se propone el siguiente modelo
transformado utilizando logaritmos neperianos,
log y
i
=
0
+
1
log x
1i
+
2
log x
2i
+u
i
El resultado de la estimaci on es:
Par ametro Estimacion

0
-1,45

1
1,14

2
1,86
y

M

=
_
_
0, 1250 0, 0212 0, 0317
0, 0212 0, 0082 0, 0051
0, 0317 0, 0051 0, 0042
_
_
siendo

M

= s
2
R
(X
T
X)
1
(X es la matriz de los regresores transformados seg un el
modelo) La transformacion logartmica del modelo inicial (x
1i
x
2
2i
) implicara que
1
=
1 y
2
= 2. Contrastar (nivel de signicaci on 0.05) si estos dos valores son aceptables.
(d) Con este modelo, dar un intervalo de prediccion (95% de conanza) para el volumen
del tronco del apartado 2 si la varianza residual es 0,0031.
57. La cantidad m axima y
i
de cierto compuesto disuelta en un litro de agua a temperatura x
i
sigue el modelo de regresi on simple,
y
i
=
0
+
1
x
i
+u
i
,
donde u
i
cumple las hipotesis de normalidad, homocedasticidad (Var(u
i
) =
2
) e indepen-
dencia. Una muestra de n disoluciones diferentes han proporcionado los valores (y
i
, x
i
).
Adem as se han medido las cantidades disueltas y

1
, y

2
, ..., y

m
en otra muestra de m disolu-
ciones que se encontraban a la misma temperatura x
0
. El valor x
0
es desconocido. Estimar
por m axima verosimilitud los par ametros
0
,
1
,
2
y x
0
utilizando las n +m observaciones.
20
58. Explicar en que consiste el problema de la multicolinealidad en el modelo de regresi on: como
se detecta, como se puede corregir y cu ales son sus efectos.
59. Ciertas propiedades del acero se mejoran sumergiendolo a alta temperatura (T
0
= 1525
o
F) en un ba no templado de aceite (t
0
= 95
o
F). Para determinar la inuencia de las
temperaturas del acero y del ba no de aceite en las propiedades nales del material se han
elegido tres valores de la temperatura del acero y tres del ba no de aceite,
Temperatura acero (T)
_
_
_
1450
o
F
1525
o
F
1600
o
F
Temperatura aceite (t)
_
_
_
70
o
F
95
o
F
120
o
F
y se han realizado los siguientes experimentos:
x
1i
0 0 0 0 -1 1 -1 1 0 0 -1 1
x
2i
0 0 0 0 -1 -1 1 1 -1 1 0 0
y
i
49.2 49.4 47.0 49.5 28.2 88.6 54.9 31.3 59.2 43.6 41.9 58.0
donde se ha utilizado la siguiente transformacion (para simplicar calculos)
x
1i
=
T
i
1525
75
y x
2i
=
t
i
95
25
.
Estimar el modelo de regresi on
y
i
=
0
+
1
x
1i
+
2
x
2i
+
3
x
1i
x
2i
+u
i
e indicar que par ametros son signicativos para nivel de signicaci on 0.05, teniendo en
cuenta que la desviaci on tpica residual es s
R
= 9.6. Estimar y contrastar el modelo anterior
empleando las variables originales T
i
y t
i
.
60. Se ha ajustado un modelo de regresi on para estudiar el efecto de la velocidad de corte (x
1
)
y el caudal de refrigerante (x
2
) en la duracion (y) de una herramienta de corte. Las tres
variables se han transformado mediante el logaritmo neperiano y el modelo estimado ha sido:
log y = 18, 30 5, 050 log x
1
3, 750 log x
2
(1,65) (0,19) (0,34)
(entre parentesis se proporcionan las desviaciones tpicas estimadas de los coecientes estima-
dos del modelo). El n umero de observaciones es 32 y la desviaci on tpica residual s
R
= 0, 24.
Obtener los intervalos de conanza (99%) para los tres par ametros de la ecuacion de re-
gresion. El coeciente de determinaci on es R
2
= 0, 96, realizar el contraste conjunto de los
par ametros correspondientes a las dos variables explicativas.
61. Se ha ajustado el siguiente modelo de regresi on m ultiple con una muestra de 86 vehculos, de
los cuales 31 son japoneses , 41 norteamericanos y 14 europeos, donde la variable dependiente
es el consumo, y los regresores: Pot (potencia) esta expresada en unidades de 100 Cv, el
21
Peso en Toneladas, Z
J
toma el valor 1 si el coche es japones y cero en los demas, y Z
E
toma
el valor 1 para los coches europeos y cero en los demas.
y = 3.305 + 0.843 Pot + 3.829 Peso + 0.440 Z
J
+ 1.127 Z
E
s
2
R
= 0.506, R
2
= 75.7%
(X
T
X)
1
=
_
_
_
_
_
_
4.791e 1 5.054e 2 3.794e 1 9.157e 2 4.682e 2
5.054e 2 1.595e 1 1.931e 1 3.443e 3 1.262e 2
3.794e 1 1.931e 1 4.646e 1 5.210e 2 2.865e 2
9.157e 2 3.443e 3 5.210e 2 6.667e 2 2.744e 2
4.682e 2 1.262e 2 2.865e 2 2.744e 2 9.759e 2
_
_
_
_
_
_
Dar el intervalo de conanza para el consumo previsto de un coche norteamericano con una
potencia de 120 Cv y 1600 Kg de peso.
62. El modelo de regresi on m ultiple que relaciona el calor generado en el proceso de endurec-
imiento (variable dependiente) de 13 muestras de cemento en funci on de su composicion
x
1
, x
2
, x
3
y x
4
, es
y
i
= 62.4 + 1.55 x
1i
+ 0.51 x
2i
+ 0.10 x
3i
0.14 x
4i
(70.1) (0.74) (0.72) (0.75) (0.71)
(entre parentesis la desviaci on tpica estimada de las estimaciones de los par ametros). Abajo
se proporciona el coeciente de determinaci on R
2
de los 15 modelos de regresi on diferentes
que se obtienen seg un los regresores elegidos.
R
2
Variables en el Modelo
53.3948 x
1
66.6268 x
2
28.5873 x
3
67.4542 x
4
97.8678 x
1
, x
2
54.8167 x
1
, x
3
97.2471 x
1
, x
4
84.7025 x
2
, x
3
68.0060 x
2
, x
4
93.5290 x
3
, x
4
98.2285 x
1
, x
2
, x
3
98.2335 x
1
, x
2
, x
4
98.1281 x
1
, x
3
, x
4
97.2820 x
2
, x
3
, x
4
98.2376 x
1
, x
2
, x
3
, x
4
Que variables inuyen signicativamente en el calor generado? Justicar la respuesta. Que
modelo seleccionaras para predecir el calor generado?
63. Se desea estudiar la relaci on entre el sueldo de 100 personas, en funcion del n umero de
a nos que llevan trabajando y el sector al que pertenecen, pudiendose dividir el sector en
22
S=servicios, I=industria, A=agricultura. Escribir el modelo de regresi on entre el sueldo
(variable respuesta) y el resto de las variables. Se estima este modelo de regresi on obteniendo
una varianza residual s
2
R
= 0.25. Con el objetivo de contrastar si el sector inuye en el sueldo
se estima otro modelo de regresi on que no contiene ninguna variable de sector, para este
modelo se obtiene una varianza residual s

2
R
= 0.4. Contrastar si el sector inuye en el sueldo
que perciben los empleados ( = 0.05).
64. En un modelo de regresi on m ultiple Y = X+U se realiza la transformacion de los regresores
Z = XA, donde X es la matriz de los regresores, y A una matriz cuadrada de rango m aximo.
Calcular la estimaci on de los coecientes del nuevo modelo Y = Z
N
+U en funcion de los
antiguos.
65. Se ha estimado el siguiente modelo de regresi on entre la variable y y los regresores x
1
, x
2
y
x
3
,
y = 61.1 + 46.1 log x
1
+ 83.1 log x
2
+ 27.9 log x
3
, s
R
= 5.49
Teniendo en cuenta que el n umero de observaciones es n = 60 y que
(X
T
X)
1
=
_
_
_
_
0.1939 0.0892 0.0887 0.1534
0.0892 0.1924 0.0125 0.0010
0.0887 0.0125 0.2093 0.0066
0.1534 0.0010 0.0066 0.2613
_
_
_
_
Dar un intervalo de conanza para los 4 par ametros de la ecuacion de regresi on y para la
varianza del modelo ( = 0.05).
66. Se ha estimado un modelo de regresi on m ultiple para explicar el consumo de combustible
de autom oviles en funcion del peso, la potencia y el lugar de fabricaci on. La muestra es de
86 vehculos, de los cuales 31 son japoneses (J), 41 norteamericanos (N) y 14 europeos (E).
y = 3.305 + 0.843 Pot + 3.829 Peso + 0.440 Z
J
+ 1.127 Z
E
, s
2
R
= 0.506, R
2
= 75.7%
(X
T
X)
1
=
_
_
_
_
_
_
4.791e 1 5.054e 2 3.794e 1 9.157e 2 4.682e 2
5.054e 2 1.595e 1 1.931e 1 3.443e 3 1.262e 2
3.794e 1 1.931e 1 4.646e 1 5.210e 2 2.865e 2
9.157e 2 3.443e 3 5.210e 2 6.667e 2 2.744e 2
4.682e 2 1.262e 2 2.865e 2 2.744e 2 9.759e 2
_
_
_
_
_
_
La variable dependiente, el consumo, esta medida en litros cada 100 km, Pot es la potencia
y esta expresada en unidades de 100 Cv, el Peso en Toneladas, Z
J
toma el valor 1 si el coche
es japones y cero en los demas, y Z
E
toma el valor 1 para los coches europeos y cero en
los demas. Realizar el contraste general de regresi on y los contrastes individuales para el
modelo anterior. Interpretar el resultado.
67. En una muestra de 31 arboles se ha medido la altura (x
1i
), el di ametro del arbol a un metro
de altura sobre el suelo (x
2i
) y el volumen de madera del tronco (y
i
) y se ha estimado el
siguiente modelo de regresi on
log(y
i
) =
0
+
1
log(x
1i
) +
2
log(x
2i
) +u
i
.
Los resultados se muestran en las tablas siguientes:
23
Analisis de regresion m ultiple
Variable dependiente: Log(Volumen)
Regresor Estimacion Desviacion tpica Estadstico t Nivel crtico
Ordenada en el origen -6,63162 0,79979 -8,2917 0,0
Log(Altura) 1,11712 0,20444 -5,4644 0,0
Log(Diametro) 1,98265 0,07501 26,4316 0,0
Analisis de la varianza
Fuente Suma de cuadrados G. de L. Varianzas Cociente F Nivel crtico
Modelo 8,12323 2 4,06161 613,19 0,0
Residual 0,18546 28 0,00662
Total 8,30869 30
Aproximando el volumen del arbol por el de un tronco conico, el volumen debe ser propor-
cional a kx
1i
x
2
2i
y tomando logaritmos
log(k) + log(x
1i
) + 2 log(x
2i
).
Realizar los siguientes contrastes de hipotesis con nivel de signicaci on 0,05:
_
H
0
:
1
= 1
H
1
:
1
= 1
_
H

0
:
2
= 2
H

1
:
2
= 2
.
68. En la tabla siguiente se presenta la estimaci on de la regresi on entre el resultado en la prueba
del salto de longitud de 34 atletas y los tiempos de estos mismos atletas en las pruebas de
100 metros lisos, 110 metros valla, 400 metros y 1500 metros.
Coecientes

i
Desv. T. t p-valor
Constante 17.9 2.12 8.45 0.000
X
1
(100 m) -.462 .266 -1.73 0.093
X
2
(110 m) -.181 .124 -1.45 0.155
X
3
(400 m) -3.39E-02 .070 -.485 0.631
X
4
(1500 m) -4.47E-03 .004 -1.03 0.312
La variabilidad total de los datos es 4.613, la variabilidad explicada 2.199 y la variabilidad
residual 2.413. Realizar el contraste general de regresi on, e interpretar el resultado del
contraste y los contrastes individuales de la tabla.
24

Você também pode gostar