Escolar Documentos
Profissional Documentos
Cultura Documentos
MARCOS
FACULTAD DE INGENIERA INDUSTRIAL
ESTADSTICA INDUSTRIAL
EJERCICIOS DE LABORATORIO
NUMERO DE GRUPO: 5
INTEGRANTES:
CONTENIDO
PRUEBA DE HIPTESIS......................................................................................................................... 2
MARCO TERICO:............................................................................................................................ 2
PRUEBA Z DE HIPTESIS PARA UNA MUESTRA, CON DOS COLAS ....................... 3
Prueba Z de hiptesis para una muestra, con una cola .................................................................. 9
PRUEBA DE HIPTESIS: PROPORCIONES....................................................................... 12
MARCO TERICO ....................................................................................................................... 12
PRUEBA DE Z PARA COMPRAR LAS MEDIAS DE DOS MUESTRAS INDEPENDIENTES. ............... 13
COMPARACIN DE DOS PROPORCIONES MUESTRALES ........................................................... 13
PROBLEMAS UTILIZANDO LA DISTRIBUCIN T DE UNA SOLA MUESTRA ..................................... 16
PROBLEMAS UTILIZANDO LA DISTRIBUCIN T DE UNA SOLA MUESTRA CON 2 COLAS ............... 18
PROBLEMAS UTILIZANDO LA DISTRIBUCIN T DE MUESTRAS PAREADAS ................................... 23
ANOVA............................................................................................................................................... 32
ANALISIS DE VARIANZA EN DOS DIRECCIONES (ANOVA II) ............................................................... 36
REGRESIN LINEAL ............................................................................................................................ 39
Regresin mltiple ............................................................................................................................ 50
PROBLEMAS UTILIZANDO LA DISTRIBUCIN JI CUADRADO PARA TABLAS DE CONTINGENCIA ....... 63
PROBLEMAS UTILIZANDO METODOS NO PARAMETRICOS ............................................................... 70
PRUEBA DEL SIGNO ....................................................................................................................... 70
PRUEBA DE MANN-WHITNEY-WILCOXON .................................................................................... 78
PRUEBA DE KRUSKAL-WALLIS ....................................................................................................... 83
PRUEBA DE HIPTESIS
MARCO TERICO:
Las pruebas de hiptesis son un procedimiento estadstico que usa datos mustrales para
determinar si una afirmacin acerca del valor de un parmetro poblacional debe o no
rechazarse. Como hiptesis se tienen dos afirmaciones opuestas acerca de un parmetro
poblacional. A una de las afirmaciones se le llama hiptesis nula (H0) y a la otra, hiptesis
alternativa (Ha).
Nivel de significancia
PROBLEMA 1
Un fabricante de tinas calientes anuncia que con su equipo de calefaccin se puede
alcanzar una temperatura de 100 F en 15 minutos en forma aproximada. Se selecciona
una muestra aleatoria de 42 tinas y se determina el tiempo necesario para alcanzar una
temperatura de 100 F con cada tina. El tiempo promedio y la desviacin estndar muestral
son de 16.5 y 2.2 min, respectivamente. Siembran estos datos alguna duda sobre la
afirmacin de la compaa? Utilice un nivel de significancia de 5%.
Probabilidad y estadstica para ingeniera y ciencia- Devore Jay L. pag 344-prob.81
SOLUCIN
Prueba de hiptesis bilateral
H0: 15 (El tiempo en el que su equipo de calefaccin alcanza los 100F no es 15)
H1: =15 (El tiempo en el que su equipo de calefaccin alcanza los 100F es 15)
0.475 = 1.96
: { < 1.96 ^ z > 1.96}
Mtodo p
Dado
= 4.419
< 0.5 0.49998
< 0.00002
: >
Entonces SE RECHAZA H0
.
. .
. .
: {15.334; 16.865}
Entonces SE RECHAZA H0
En minitab se obtuvo
Z de una muestra
Prueba de = 15 vs. 15
La desviacin estndar supuesta = 2.2
Error
estndar
de la
N Media media IC de 95% Z P
42 16.500 0.339 (15.835; 17.165) 4.42 0.000
PROBLEMA 2
Las sociedades de valores de Wall Street pagaron en 2005 gratificaciones de fin de
ao de $ 125500 por empleado. Suponga que se desea tomar una muestra de los
empleados de la empresa de valores Jones &Ryan para ver si la media de la
gratificacin de fin de ao es diferente de la media de 125500 reportada para la
poblacin.
a) Establezca la hiptesis nula y alternativa que se usaran para probar si las
gratificaciones de fin de ao de Jones & Ryan difieren de la media
poblacional.
b) Suponga que una muestra de 40 empleados de Jones & Ryan exhibi una
media muestral de las gratificaciones de $118000. Suponga que a desviacin
estndar poblacional es = $30000 y calcule el valor p.
c) Con = 0.05 como nivel de significancia Cul es su conclusin?
SOLUCIN
a)
0 = 125000
1 125000
b)
= 40
= 118000
= 30000
118000 1255000
= = 1.58
30000
40
Minitab
One-Sample Z
Los valores obtenidos con el Minitab son los mismos que los obtenidos
manualmente.
EJERCICIO 3
Un auditor toma una muestra de 36 cuentas de la empresa "Amauta S.A" y calcula
la media muestral que es igual a $240.00. Adems se sabe que la desviacin
estndar de los montos de las cuentas por cobrar es $43.
Su objetivo es probar la suposicin de que el valor medio de todas las cuentas por
cobrar en la empresa sea $260.00. Considere un nivel de significancia de 0.05.
SOLUCIN:
1. Plantear la hiptesis Nula y la hiptesis alternativa
Ho: = 260
Ha: 260
= 0.05
3. Identificar el estadstico de prueba
Z (n > 30)
Desarrollo Manual:
n = 36
= 240
X
= 43
X 240 260
Z= = = 2.79
43
n 36
Z = 2.79
Uso de minitab:
Zk RC => Rechazo Ho y acepto Ha
Z de una muestra
Error
estndar
de la
N Media media IC de 95% Z P
Facultad de Ingeniera Industrial
36 240,00 7,17 (225,95; 254,05) -2,79 0,005 Pgina 7
EJERCICIOS DE LABORATORIO
Interpretacin:
Se concluye que, al nivel de confianza de 95%, el valor medio de todas las cuentas
de la empresa "Amauta S.A" no son iguales a $260.
EJERCICIO 4
En western University, la media histrica en las puntuaciones de los solicitantes de
una beca es 900. La desviacin estndar poblacional histrica que se considera
conocida es = 180. Cada ao, el decano asistente utiliza una muestra de las
solicitudes para determinar si la puntuacin media ha cambiado entre los solicitantes
de becas.
a) Establezca las hiptesis
b) Cul es el valor de p si en una muestra de 200 estudiantes la media muestral
es = 935?
c) Manejando = 0.05 como nivel de significancia a qu conclusin llega?
SOLUCIN
a)
0 = 900
1 900
b)
= 200
= 935
= 180
935 900
= = 2.75
180
200
Minitab
One-Sample Z
Los valores obtenidos con el Minitab son los mismos que los obtenidos
manualmente.
El U.S. Departament of Labor informo que los ingresos promedio para los
trabajadores estadounidenses de la produccin en 2001 era $14.32 por hora. En
una muestra de 75 trabajadores tomada en 2003, la media muestral fue $14.68 por
hora. Si la desviacin estndar poblacional es = $1.45 . Se puede concluir que
ha habido un aumento en la media de las ganancias por hora? Use = 0.05.
SOLUCIN
0 14.32
1 > 14.32
= 75
= 14.68
= 1.45
14.68 14.32
= = 2.15
1.45
75
Para Z = 2.15 le corresponde un valor de p de 0.016. Con un valor de significancia
0.05 se tiene que el valor de p hallado es menor que el nivel de significancia por lo
tanto la 0 se rechaza.
Minitab
One-Sample Z
95% Lower
N Mean SE Mean Bound Z P
75 14.680 0.167 14.405 2.15 0.016
Los valores obtenidos con el Minitab son los mismos que los obtenidos
manualmente.
EJERCICIO 6
El comit de seleccin de nuevos ingresos a una universidad revisa todos los
resultados obtenidos de los concursantes y concluye que de los concursantes y
concluye que de los preseleccionados para ingresar, solo el 60% respondi
satisfactoriamente a la entrevista prevista para la seleccin por lo que son
susceptibles para el ingreso. La direccin revisa una muestra de 150
preseleccionados segn los resultados obtenidos por el comit y estima que la
proporcin correcta posible de seleccin es de 50% con un 5% de probabilidad de
error (nivel de significacin).
SOLUCIN:
1. Plantear la hiptesis nula y alternativa
Ho: = 0.60
Ha: 0.60
2. Determinar el nivel de significancia
= 0.05
4. Grfica de distribucin:
0.5 0.6
= = 0.04 = 2.5
150
Uso de minitab:
Interpretacin:
En una muestra de 150 alumnos se sabe que la media de ingreso es diferente de 0.6
MARCO TERICO
p
=
= La proporcin muestral
Donde
= (1 )/
(X1 X2) (1 2)
=
2 2
1 + 2
1 2
EJERCICIO 1
La familia Prado posee grandes viedos. Al principio de la estacin hay que protegerlos
contra varios insectos y enfermedades, mediante la aplicacin de insecticidas. Hay dos
nuevos insecticidas, A y B. Para probar su eficiencia, se rociaron tres hileras largas de vias
con el insecticida A y otras tres con insecticida B. Cuando las uvas maduraron se tomaron
400 plantas tratadas con el insecticida A y 400 tratadas con el insecticida B, para verificar
si tenan alguna infeccin. Los resultados fueron:
Tamao Vias
Insecticida
muestral afectadas
A 400 24
B 400 40
Al nivel de significancia 0.05. Puede concluirse que hay diferencia entre las proporciones
de vias afectadas usando el insecticida A, y usando el insecticida B?
SOLUCIN:
Ho: PA = PB
Ha: PA PB
= 0.05
3. Identificar el estadstico
Z (n 30)
4. Regla de decisin:
ZK
Insecticida Insecticida
A B
= nB = 400
= X B = 40
24 40
= = = 0.06 = = = 0.1
400 400
+ 24 + 40
= = = 0.08
+ 400 + 400
0.06 0.1
= = = 2.085
1 1
(1 ) ( + ) 0.08(1 0.08) ( 1 + 1 )
400 400
Hallamos el valor de P:
P<
0.037 < 0.05
Rechazo Ho y acepto la Ha
Usando Minitab:
Interpretacin:
Se puede concluir que la proporcin de vias infectadas de la familia Prado a las cuales
se le roci el insecticida A es diferente a la proporcin de vias infectadas rociadas con el
insecticida B.
Solucin
0: 87
1 : < 87
= 0.05
= 8 1 = 7
=8
= 83
= 4.34
83 87
= = 2.61
4.34
8
Para = 0.05 se debe tener un valor de t que sea menor a -1.895 para rechazar
Ho, el valor hallado es de -2.61 por lo tanto la hiptesis nula se rechaza.
Minitab
One-Sample T: millas
Test of mu = 87 vs < 87
95% Upper
Variable N Mean StDev SE Mean Bound T P
millas 8 83.00 4.34 1.54 85.91 -2.61 0.018
Los valores obtenidos con el Minitab son los mismos que los obtenidos
manualmente y el valor de p reafirma nuestra conclusin.
1 : > 0.09
= 0.01
= 8 1 = 7
=8
= 0.09487
= 0.00467
0.09487 0.09
= = 2.95
0.00467
8
Para = 0.01 se debe tener un valor de t que sea mayor a 2.998 para rechazar Ho,
el valor hallado es de 2.95 por lo tanto la hiptesis nula no se rechaza.
Minitab
One-Sample T: Tasa de Interes
99% Lower
Variable N Mean StDev SE Mean Bound T P
Tasa de Interes 8 0.09487 0.00467 0.00165 0.08992 2.95 0.011
Los valores obtenidos con el Minitab son los mismos que los obtenidos
manualmente y el valor de p reafirma nuestra conclusin.
EJERCICIO 1
Unprofesor de matemtica imparte el curso en dos institutos distintas Ay B
Tamao de la
Instituto Promedio Desviacin estndar
muestra
A 16.3 0.9 20
B 18.2 1.2 10
SOLUCIN:
Ho: 1 2
Ha: 1 > 2
= 0.01
Manualmente
Datos: n1 = 20 n2 = 10
1 = 16.3
X 2 = 18.2
X
s1 = 0.9 s2 = 1.2
2
(1 1)1 2 + (2 1)2 2 (20 1)0.92 + (10 1)1.22
= =
1 + 2 2 20 + 10 2
2
= 1.0125
1 2 16.3 18.2
= = = 4.8754
2 1 1 1 1
( + ) 1.0125 ( + )
1 2 20 10
= 4.8754
=>
Valor de P:
Usando Minitab
Error
estndar
de la
Muestra N Media Desv.Est. media
1 20 16,300 0,900 0,20
2 10 18,20 1,20 0,38
Interpretacin:
Se concluye que, al nivel de confianza de 99%, que la calificacin promedio del instituto
A es mayor a la calificacin promedio del instituto B.
EJERCICIO 2
Un estudiante universitario (de Estados Unidos) toma en promedio 27 galones de
caf por ao, o 2.25 galones por mes. En una muestra de 12 estudiantes de una
determinada universidad se encontraron las siguientes cantidades de consumo de
caf por mes
1.75 1.96 1.57 1.82 1.85 1.82 2.43 2.65 2.60 2.24 1.69 2.66
En el nivel de significancia 0.05 hay una diferencia significativa entre el consumo
promedio general y el consumo promedio de los estudiantes de esta universidad?
Solucin
0: = 2.25
1 : 2.25
= 0.05
= 12 1 = 11
= 12
= 2.087
= 0.405
2.087 2.25
= = 1.39419
0.405
12
Para = 0.05 se debe tener un valor de t que este entre -2.201 y +2.201 para no
rechazar Ho, el valor hallado es de -1.3941 por lo tanto la hiptesis nula no se
rechaza.
Minitab
Los valores obtenidos con el Minitab son los mismos que los obtenidos
manualmente y el valor de p reafirma nuestra conclusin.
11 8 = 3
7 8 = -1
96=3
12 7 = 5
13 10 = 3
15 15 = 0
15 14 = 1
b. Calculamos d.
3 + 1 + 3 + 5 + 3 + 0 + 1
= =2
7
c. La desviacion estandar:
d. Estimacion:
1 = 11.71 2 = 9.71
Estimacion = 2
e. 0 : 1 2 = 0
1 : 1 2 0
= 0.05
0.056 = 2.447
20
= = = 2.54
2.082
7
Justificacin y decisin:
Como 2.54 es mayor que 2.477, entra en la zona de rechazo.
Por lo tanto se rechaza la Hipotesis Nula (0 )
EN MINITAB:
IC y Prueba T pareada: 1, 2
T pareada para 1 - 2
Error
estndar
de la
N Media Desv.Est. media
1 7 11.71 2.98 1.13
2 7 9.71 3.50 1.32
Diferencia 7 2.000 2.082 0.787
Los valores obtenidos con el Minitab son los mismos que los obtenidos
manualmente y el valor de p reafirma nuestra conclusin.
PROBLEMA
Se hizo un estudio para definirse si los ejercicios aerbicos reducen el ritmo
cardiaco de una persona durante el descanso, y al examinar a diez voluntarios antes
y despus de seguir un programa de ese tipo durante seis meses. Sus pulsaciones,
en latidos por minuto, dieron los siguientes resultados:
Use = 0.05 para calcular si los ejercicios aerbicos reducen el ritmo cardiaco
durante el reposo.
Calcule el valor de P.
SOLUCION
0 : = 0
1 : > 0
= 0.05
0.059 = 1.833
Regla de la decisin:
Si <= 1.833 No se rechaza 0
Si > 1.833 se rechaza 0
Se proceder a calcular las diferencias de cada par:
3.6 0
= = = 7.20
1.58
10
Justificacin y decisin:
- Como 7.20 es mayor que 1.833, se RECHAZA 0 , y se concluye con un nivel
de significancia de 0.05 que los datos indican que los ejercicios aerbicos
disminuyen significativamente el ritmo cardiaco durante el reposo.
Con el valor de P:
Para calcular el valor de P se busca el 7.20 en el rengln de 9 grados de libertad en
la tabla t, y se observa que el valor mayor que aparece en dicha tabla es 4.781 al
cual le corresponde un rea a la derecha de 0.0005, entonces se puede concluir
que el valor de P es prcticamente cero.
EN MINITAB:
IC y Prueba T pareada: Antes, Despues
Error
estndar
de la
N Media Desv.Est. media
Antes 10 71.40 5.64 1.78
Despues 10 67.80 5.79 1.83
Diferencia 10 3.600 1.578 0.499
3.- Las personas que viajan por avin, suelen elegir de qu aeropuerto salir con
base en el costo del vuelo. Para determinar de qu aeropuerto es ms costoso salir,
si de Dayton, Ohio; o de Louisville, Kentucky, se recolectan datos (en dlares) de
una muestra de vuelos a ocho ciudades partiendo de estos dos aeropuertos (The
Cincinnati Enquirer, 19 de febrero de 2006). Un investigador sostiene que es mucho
ms costoso partir de Dayton, que de Louisville. Use los datos muestrales para ver
si favorecen tal afirmacin. Como nivel de significancia use =0.05.
SOLUCION:
0 : = 0
1 : < 0
= 0.05
0.057 = 1.895
Regla de la decisin:
Si > 1.895 No se rechaza 0
Si <= 1.895 se rechaza 0
Se procedera a calcular las diferencias de cada par:
177, 201, -186, 131, -22, -212, 5, -14 ; del cual la media es igual a 10, y
= 155.1
10 0
= = = 0.18
155.1
8
Justificacin y decisin:
- Como 0.18 es menor que 1.895, se RECHAZA 0 , y se concluye con un nivel
de significancia de 0.05 que los datos indican en Dayotn son mas caros que
los de Louisville.
Minitab
IC y Prueba T pareada: Louisville, Dayton
Error
estndar
de la
N Media Desv.Est. media
Louisville 8 261.3 82.6 29.2
Dayton 8 318.0 93.7 33.1
Diferencia 8 -56.8 121.5 43.0
Panorama de distribucin f
Anlisis de varianza
2_ direcciones
1_ direcciones
PROBLEMA
En la empresa gloria la produccin se tiene una lnea de produccin de latas en el
cual tiene respectivas maquinas.
La lnea de produccin consta de 2 partes de produccin de tapas de las latas y
produccin de enrolado de cilindro con medidas que no varen mucho
Los cuales tienen que cumplir con varianzas de rendimientos iguales con el objetivo
para que no tengan la necesidad de encontrase una tapa chica con un cilindro
grande, o un cilindro chico con una tapa grande si logramos tener una varianzas
iguales podemos obtener mejor ensamblaje y se tendra que manejar las medias de
los dos para as estar seguros de un mejor ensamblaje.
Con un nivel de significancia es 0.1
Recopilando datos tenemos las medidas las muestras:
TAPAS CILINDRO
2 2
S1 = 0.41 S2 =0.13
n =22 n = 16
Solucin
1. Las hiptesis de prueba son las siguientes:
H 0 : 12 22
H 1 : 12 22
s12 0.41
F 2 3.15
s 2 0.13
4. Regla de Decisin
Comparacin del Valor crtico y la Razn de Varianzas
F (0.05) < F
2.32 < 3.15
MINITAB
Mtodo
Estadsticas
IC para IC para
Distribucin relacin de relacin de
De los datos Desv.Est. Varianza
Normal (1.149, 3.027) (1.319, 9.161)
Pruebas
Estadstica
Mtodo GL1 GL2 de prueba Valor P
Prueba F (normal) 21 15 3.62 0.014
ANOVA
Pregunta 1
1. La siguiente informacin es muestral. Pruebe la hiptesis de que las medias
de tratamiento son iguales. Utilice el nivel de significancia 0.05.
El valor calculado para F es 5.12, que es mayor que el valor crtico 3.89, por tanto
se rechaza la hiptesis nula. Se concluye que las medias poblacionales no son
iguales. Los tratamientos promedio no son iguales en los tres grupos de evaluacin.
Por ahora slo se puede concluir que hay una diferencia entre las medias de
tratamiento.
EJERCICIO
Una compaa de desarrollos inmobiliarios considera la inversin en un centro
comercial en las afueras de Atlanta, Georgia. Se evalan tres terrenos. El ingreso
de los pobladores de la zona aledaa al centro comercial es de especial importancia.
Se selecciona una muestra aleatoria de cuatro familias que viven cerca de cada
terreno. A continuacin se presentan los resultados muestrales. Al nivel de
significancia de 0.05, puede concluir la compaa que hay diferencia en los
ingresos promedio? Utilice el procedimiento usual de cinco pasos para prueba de
hiptesis.
El valor calculado para F es 14.18, que es mayor que el valor crtico 4.26, por tanto
se rechaza la hiptesis nula. Se concluye que las medias poblacionales no son
iguales. Los ingresos promedio no son iguales en los tres grupos de evaluacin. Por
ahora slo se puede concluir que hay una diferencia entre las medias de
tratamiento.
Solucin:
Se seguir el procedimiento usual de cinco pasos para la prueba de hiptesis.
Paso 1: Plantear la hiptesis nula y la hiptesis alternativa
Los dos conjuntos de hiptesis son:
1.
0 : 1 = 2 = 3
1 :
2.
0 : 1 = 2 = 3
1 :
Paso 2: Establecer nivel de significancia. = 0.05
Paso 3: Determinar el estadstico de prueba. Estamos ante un ANOVA de dos
direcciones.
( )2
= 2
83.742
= 331.8218 = 72.1037
27
2 2
= ( )
27.892 27.142 28.712 83.742
= + + = 0.1370
9 9 9 27
2 2
= ( )
3.212 3.452 5.772 6.632 6.82 12.512 15.052 13.482
= + + + + + + +
3 3 3 3 3 3 3 3
2 2
16.84 83.74
+ = 71.6136
3 27
=
= 72.1037 0.1370 71.6136 = 0.3531
= /( 1)
0.1370
= = 0.0685
2
= /( 1)
71.6136
= = 8.9517
8
= /( 1)( 1)
0.3531
= = 0.0221
16
0.0685
= = = 3.0995
0.0221
No se rechaza la hiptesis nula de medias de tratamiento ya que del F hallado
en menor que 3.63. Se concluye que los precios no difieren en todas las tiendas
8.9517
= = = 405,0543
0.0221
Se rechaza la hiptesis nula de medias de bloques ya que el F hallado es mayor
que 2.59. Se concluye que hay diferencia entre los artculos observados.
REGRESIN LINEAL
1.- Un ciudadano est estudiando compaas que se harn pblicas por primera
vez. Tiene inters particular en la relacin entre le importe de una oferta y el precio
por accin. Una muestra de 15 empresas que recientemente se hicieron pblicas
presento la siguiente informacin.
Compaa Tamao(millones de Precio por accin, Y
dlares), X
1 9.0 10.8
2 94.4 11.3
3 27.3 11.2
4 179.2 11.1
5 71.9 11.1
6 97.9 11.2
7 93.5 11.0
8 70.0 10.7
9 160.7 11.3
10 96.5 10.6
11 83.0 10.5
12 23.5 10.3
13 58.7 10.7
14 93.8 11.0
15 34.4 10.8
Solucin:
a) Construir el diagrama de dispersin.
b) Calcular b0 y b1.
( ) ( )( ) 15(13114,64) (1193,8)(163,6)
1 = = = 0.00302
( 2 ) ( )2 15(126252,04) (1193,8)2
0 = 1 = 10.906 0.00302 79.5867 = 10.665 = 10.7
c) Interpretar b0 y b1
El valor de b1= 0.00302 significa que para cada tamao de oferta se puede
esperar aumentar 0.00302 el precio por accin. Es decir que por cada 10
ofertas aumentara 0.0302 el precio por accin.
El valor de b0= 10.7 es el punto donde la ecuacin cruza al eje y. si no hay
oferta, es decir si x=0, el precio por accin ser de 10.7. Pero x=0 est fuera
del intervalo de valores incluidos en la muestra.
Para 100:
= 10.7 + 0.00302 = 10.7 + 0.00302*100=11,002
( )2
. =
2
1.04
. = = 0.28
15 2
f) Calcular el coeficiente de estimacin 2 e interprete.
Compaa Tamao Precio Y Desviaci Desviaci
Y- )^2
(Y-
(millones por Calculado n (Y-Y) n (Y-Y)^2
de accin
dlares), ,Y
X
1 9.0 10.8 10.72718 0.07282 0.00530275 -0.10666667 0.01137778
( )2 ( )2 1.31 1.04
2 = = = 0.2061
( ) 2 1.31
( )2 0.30
2 = = = = 0.229
( )2 1.31
En minitab debido a los decimales calculados tenemos 21.7% lo que nos indica que
el 21.7% del precio por accin est determinado por su relacin lineal con X (tamao
de la oferta).
ANLISIS DE VARIANZA
Grados de Suma de Promedio de los Valor crtico
libertad cuadrados cuadrados F de F
Regresin 1 6786.04809 6786.04809 3.6073227 0.07994066
Residuos 13 24455.4292 1881.18687
Total 14 31241.4773
6786.04809
2 = = = 0.2172
31241.4773
= 2 = 0.217 = 0.466
La pendiente de la ecuacin de regresin es positiva esta entre -1 y +1.
= = 43.37
2
43.37 43.37
1= = = 0.245
( )2 31241,4773
1 /2 1 = 0.00302 1.9 0.245
(-0.46248, 0.46852)
Para y
10.7 73.19 0.004
(10.4111, 10.9823)
i) Cree un intervalo de prediccin.
= 0.009
Analysis of Variance
Source DF SS MS F P
Regression 1 0.28440 0.28440 3.61 0.080
Residual Error 13 1.02493 0.07884
Total 14 1.30933
PROBLEMA
Se quiere estudiar la relacin entre la pureza del oxgeno (Y) producido en un proceso
qumico de destilacin y el nivel de hidrocarburos(X) presentes en el condensador
principal de la unidad de destilacin
0,99 90,01
1,02 89,05
1,15 91,43
1,29 93,74
1,46 96,73
1,36 94,45
0,87 87,59
1,23 91,77
1,55 99,42
1,4 93,65
1,19 93,54
1,15 92,52
0,98 90,56
1,01 89,54
1,11 89,85
1,2 90,39
1,26 93,25
1,32 93,41
1,43 94,98
0,95 87,33
Solucin:
a)
X Y X2 Y2 XY
0.99 90.01 0.9801 8101.8001 89.11
1.02 89.05 1.0404 7929.9025 90.83
1.15 91.43 1.3225 8359.4449 105.14
1.29 93.74 1.6641 8787.1876 120.92
1.46 96.73 2.1316 9356.6929 141.23
1.36 94.45 1.8496 8920.8025 128.45
0.87 87.59 0.7569 7672.0081 76.20
1.23 91.77 1.5129 8421.7329 112.88
1.55 99.42 2.4025 9884.3364 154.10
1.4 9365 1.96 8770.3225 131.11
1.19 93.54 1.4161 8749.7316 111.31
1.15 92.52 1.3225 8559.9504 106.40
0.98 90.56 0.9604 8201.1136 88.75
1.01 89.54 1.0201 8017.4116 90.44
1.11 89.85 1.2321 8073.0225 99.73
1.2 90.39 1.44 8170.3521 108.47
1.26 93.25 1.5876 8695.5625 117.50
1.32 93.41 1.7424 8725.4281 123.30
1.43 94.98 2.0449 9021.2004 135.82
0.95 87.33 0.9025 7626.5289 82.96
23.92 1843.21 29.2892 170044.5321 2214.6566
20(2214.6566) (23.92)(1843.21)
= =
( ) 20(29.2892) 23.922
b = 14.947
1843.21 14.947(23.92)
= =
20
a = 74.283
( )2 1843.212
= 2 = 170044.5321 = 173.377
20
( )2 1843.212
= + = 74.283(1843.21) + 14.947(2214.6566) +
20
= 152.13
= +
= 21.247
Ho: 1 = 0
Ha: 1 0
FV GL SC CM F
Regresion 1 152.13 152.13 128.92
Error 18 21.247 1.18
Total 19
FK = 128.92
Fk RC Rechazo HO y Acepto la Ha
Interpretacin:
El coeficiente de regresin es diferente de 0, por lo tanto la ecuacin no es una
constante. Por cada unidad en el nivel de hidrocarburo que se incrementa, la pureza
b)delComo vamos
oxgeno a hacer
aumenta un anlisis residual, veremos que observacin de las 20 que
en 14.97.
tenemos, debemos eliminar ya que hace que nuestro estudio y desarrollo del modelo salga
errneo.
1) Matriz Sombrero:
1 ( )2
= [ + ]
2 ( )2
= 1
REGRESIN MLTIPLE
1.- En los datos siguientes se presenta peso en vaco, caballos de fuerza y velocidad
en 1/4 de milla de 10 automviles deportivos y GT. Supngase que se tiene tambin
el precio de cada uno de estos automviles. Todo el conjunto de datos es el
siguiente:
Analysis of Variance
Source DF SS MS F P
Regression 3 915.90 305.30 45.76 0.000
Residual Error 12 80.05 6.67
Total 15 995.95
Source DF Seq SS
Precio (miles de $) 1 406.39
Peso en vaco (lb) 1 242.90
Caballos de fuerza (lb) 1 266.61
Unusual Observations
Velocidad
Precio en de
(miles milla
Obs de $) (mph) Fit SE Fit Residual St Resid
11 47518 99.000 103.216 1.523 -4.216 -2.02R
1 = Precio (miles de $)
Tabla ANOVA
Fuente Gl SS MS F
Regresin 3 915.8989 305.2996 45.7632
Error 16-(3+1)=12 80.0555 6.6713
Total 15 995.9544
2
915.8989
.123 = = = 0.9196
995.9544
Este coeficiente de determinacin mltiple, calculado como 0.9196, puede
interpretarse diciendo que, de la muestra, 91.96% de la variacin en la velocidad
para de milla puede ser explicada por la variacin en el peso , por la variacin del
precio y por la variacin en los caballo de fuerza.
c) Coeficiente r2 ajustado:
1 161
2 = 1 (1 2 ) = 1 (1 0.9196) =0.8995
(+1) 16(3+1)
d) Matriz de correlacin:
Precio Peso en Caballos de Velocidad en de
(miles de $) vaco (lb) fuerza (lb) milla (mph)
Precio (miles de $) 1
0.10444597
Peso en vaco (lb) 1 1
Caballos de fuerza 0.48161151
(lb) 5 0.665777 1
Velocidad en de 0.63878048 0.5578625
milla (mph) 1 58 0.934326319 1
La ultima grfica de residuos sirve para examinar el patrn de residuos para los
valores predichos de Y. Si los residuos estandarizados parecen variar para
diferentes niveles del valor predicho de Y, esto nos proporciona evidencia de un
posible efecto curvilneo en al menos una variable explicativa y/o de la necesidad
de transformar la variable dependiente. La primera, segunda y tercera grficas
de residuos implican a las variables explicativas. La aparicin de patrones en la
grfica de los residuos estandarizados contra una variable explicativa puede ser
una indicacin de la existencia de un efecto curvilneo y, por consiguiente, nos
llevara a la posible transformacin de dicha variable independiente. En estas
figuras podemos observar que parece haber un patrn muy pequeo o no
haberlo en la relacin entre los residuos estandarizados y cualquiera de los
valores predichos de Y, X1, X2 o X3. As pues, podemos llegar a la conclusin de
que el modelo de regresin lineal mltiple es apropiado para predecir velocidad
para de milla.
f) Prueba de la Importancia de la Relacin entre la Variable Dependiente y las
Variables Explicativas
H 0 : 1 2 3 0 (No existe relacin lineal entre la variable
dependiente y las variables explicativas).
H1 : Al menos una j 0 (Al menos un coeficiente de regresin no es igual
a cero)
Esta hiptesis nula puede probarse utilizando una prueba F.
305.2996
= = = 45.7632
6.6713
Si se elige un nivel de significacin de 0.05, determinamos que el valor crtico
en la distribucin F (con 3 y 12 grados de libertad) es 3.49. Puesto que F = 45.7632
> FU(2,12)= 3.49, podemos rechazar H0 y llegar a la conclusin de que al menos una
de las variables explicativas (precio, peso, caballos de fuerza) est relacionada con
la velocidad para de milla.
80.0555
.123 = = = 2.5829
( + 1) 16 (3 + 1)
F crtico: 2.179
Tenemos que 2.4206> 2.179 por lo tanto no se rechaza Ho. Y llegamos a la
conclusin de que existe una relacin significativa entre la variable X1 (precio) y la
velocidad, tomando en cuenta las otras variables.
b1 t12 S b1
0.000104 (2.179)(0.00004315)
0.000104 0.000009402
0.000094598 1 0.0001134
PROBLEMA
a) Diagramas de dispersin
0,9
0,8
Margen de beneficios
0,7
0,6
0,5
0,4
0,3
6000 6500 7000 7500 8000 8500 9000 9500
Numero de oficinas
Analysis of Variance
Source DF SS MS F P
Regression 2 0,34213 0,17107 35,81 0,000
Residual Error 22 0,10508 0,00478
Total 24 0,44722
Source DF Seq SS
Ingreso por dolar 1 0,21475
Numero de oficinas 1 0,12738
Y con respecto a al valor de los errores estandarizados se puede concluir que los
errores son mnimos, es decir es un buen ajuste.
( )2 0.419181924
.12 = = = 0.1380352267
( + 1) 25 (2 + 1)
0.34213
2 = = = 0.765
0.44722
g) Calcular el coeficiente determinacin mltiple
= 2 = 0.765 = 0.87464
Nos da como intervalo de confianza (0.9633, 1.6108), por ello De los datos arrojados
por el programa podemos concluir que mi margen de beneficios oscila entre 0.9633
y 1.6108. Como intervalo de prediccin tenemos (0.930,1.6411).
Solucin:
2
( )2
= [ ]
Con (r-1)*(c-1) grados de libertad
Usando:
( )2
2 = [ ]
2 71 47 43 42 203
82.03 41.43 38.53 41.01
1.483 0.749 0.519 0.024
2.- PROBLEMA
Se realiz una encuesta por parte de una sucursal, situada en Canad, de una
cadena de que opera a nivel nacional oficinas de corretaje inmobiliario, con el
propsito de conseguir un perfil de las casas de una sola familia en algunas
comunidades vecinas. Se desea saber si existe una alguna relacin entre el estilo
arquitectnico y la localizacin geogrfica. Utilizando los archivos de un Censo
canadiense, se selecciona una muestra de 233 casas de una sola familia y se
obtiene un registro de una direccin para cada combinacin de estilo arquitectnico
y localizacin geogrfica. La tabla de contingencia de 5x3 se presenta a
continuacin:
SOLUCIN
= 0.05
2 (0.05,8) = 15.507.
( ) ( ) /
31 30.8 +0.2 0.04 0.00013
14 25 -11 121 4.84
52 41.2 +10.8 116.64 2.8311
2 4.8 -2.8 7.84 1.6333
1 3.9 -2.9 8.41 2.1564
12 6.4 +5.6 31.36 4.9
6 7.3 -1.3 1.69 2.3151
8 5.9 +2.1 4.41 0.7475
9 9.8 -0.8 0.64 0.0653
16 19.1 -3.1 9.61 0.5031
20 15.5 +4.5 20.25 1.3065
24 25.5 -1.5 2.25 0.0882
19 12.1 +6.9 47.61 3.9347
17 9.8 +7.2 51.84 5.2898
2 16.1 -14.1 198.81 12.3484
-- -- -- -- 40.975
PROBLEMA
Solucin:
1) H0 : p = 0.5 (no hay cambio en la capacidad como resultado de la capacitacin)
Ha: p > 0.5 (se increment la capacidad como resultado de la capacitacin)
2) = 0.1
3) prueba binomial
Interpretacin:
Se increment la capacidad como resultado de la capacitacin.
PROBLEMAS
mentales, Cornwall & Hudson, desea vender solo una marca de reproductor de
discos compactos de alta calidad. La lista de equipos reproductores de CDs se ha
reducido a dos marcas: Sony y Pioneer. Para ayudar en la toma de decisin, se
reuni a un grupo de 16 expertos en audio. Se hizo la reproduccin de un pasaje
musical usando componentes Sony (marcados A). Despus se reprodujo el mismo
pasaje utilizando componentes Pioneer (marcados B). Un signo + en la tabla
siguiente indica la preferencia de una persona por los componentes Sony, y un signo
- seala predileccin por Pioneer, y un 0 significa que no hay preferencia.
Experto
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
+ - + - + + - 0 - + - + + - + -
Realice una prueba de hiptesis al nivel de significancia 0.10 para determinar si hay
diferencia en la preferencia entre las dos marcas.
Solucin:
0 : = 0.50
1 : 0.50
Si no se puede rechazar Ho no tendremos pruebas que indiquen que hay
preferencia hacia una marca. Sin embargo, si se puede rechazar Ho, podremos
concluir que las preferencias de los expertos en audio son distintas hacia las dos
marcas. En este caso, la marca que seleccione la mayor cantidad de expertos en
audio ser la ms preferida.
Experto Probabilidad
0 0.000031
1 0.000458
2 0.003204
3 0.013885
4 0.041656
5 0.091644
6 0.152740
7 0.196381
8 0.196381
9 0.152740
10 0.091644
11 0.041656
12 0.013885
13 0.003204
14 0.000458
15 0.000031
= 0.10, tendramos una regin de rechazo cuya rea aproximada fuera 0.05 en
cada extremo de la distribucin. Si iniciamos en el extremo inferior de la distribucin,
vemos que la probabilidad de obtener cero, uno, dos o tres signos positivos es
0.000031 + 0.000458 + 0.003204 + 0.013885 = 0.017578, que es menor que 0.05.
En consecuencia, adoptaremos la siguiente regla de rechazo:
Rechazar H0 si el nmero de signos positivos es menor que 4 o mayor que 11.
Event = 1
PROBLEMA
Solucin:
1. Planteamos la hiptesis nula y la hiptesis alternativa
= 0.05
3. Identificar el estadstico de prueba
4. Regla de decisin
5.
ZK
6. Calculamos el estadstico
(+1)(2+1)
=
= 0 = 6
Retornar
Ejecutivo Gas C Gas AC Diferencia V.A Rango
Signo
Pastrana 25 28 -3 3 4.5 -4.5
Roman 33 31 2 2 2.5 2.5
Prado 31 35 -4 4 6 -6
Vargas 45 44 1 1 1 1
Caldern 42 47 -5 5 7.5 -7.5
Valdivia 38 40 -2 2 2.5 -2.5
Morn 29 29 0 0 - -
Olrtiga 42 37 5 5 7.5 7.5
Rojas 41 44 -3 3 4.5 -4.5
Quiroga 30 44 -14 14 9 -9
T = -23
n(n+1)(2n+1) 9(10)(19)
t = = = 16.88
6 6
T t 23 0
Z= = = 1.36
t 16.88
Zk = -1.36
ZK RA Acepto HO y rechazo la Ha
Interpretacin:
No existe diferencia en el nmero de millas recorridas por galn entre la gasolina comn
y la gasolina de alto octanaje, por lo tanto, se obtiene el mismo rendimiento con ambas
clases de gasolina.
EJERCICIO 2
Como parte de una investigacin de mercado que tena por objeto evaluar la
efectividad de una campaa de publicidad, se seleccionaron 10 ciudades para una
prueba de mercado. Las ventas en dlares en cada una de estas ciudades, en la
semana anterior a la campaa, se registraron. Despus, se realiz la campaa
durante dos semanas y se registraron las ventas que hubo en la primera semana,
inmediatamente despus de la campaa.
Solucin:
De hecho, tenemos dos poblaciones de ventas, una asociada con cada mtodo. Se
probarn los siguientes supuestos:
H0: las poblaciones son idnticas
H0: las poblaciones no son idnticas
Si no se puede rechazar H0, no tendremos evidencia para concluir que las ventas
difieren cuando se aplica la campaa o cuando no. Sin embargo, si se puede
rechazar H0, llegamos a la conclusin de que las poblaciones difieren en sus ventas.
T T 32 0
z 1.63
T 19.62
Facultad de Ingeniera Industrial Pgina 77
EJERCICIOS DE LABORATORIO
PRUEBA DE MANN-WHITNEY-WILCOXON
PROBLEMA 1
Solucin:
1. H0: las distribuciones de frecuencias de pulso de los grupos A y B son iguales
2. =0.05
3. M.W.W
4. Grafica
5. Calculamos el estadstico:
A B
140 11 130 5
135 7 166 19
150 16 128 3.5
140 11 126 2
144 13.5 140 11
154 17 136 8.5
160 18 132 6
144 13.5 128 3.5
136 8.5 124 1
148 15 Suma 59.5
suma 130.5
= 1(1 + 2 + 1)
Tl=76
Tu<130.5 y Tu>59.5 Tu Ra
Usando Minitab:
Interpretacin:
Aceptamos la hiptesis nula y rechazamos la hiptesis alternativa.
Entonces aceptamos que distribuciones de frecuencias de pulso de los grupos A y B no
son iguales, despus de haber realizado 10 minutos de ejercicios aerbicos.
PROBLEMA 2
Solucin:
T T 116 120
z 0.25
T 16.12
Con un nivel de significancia igual a 0.05, sabemos que para rechazar H0, z debe
ser menor que -1.96 o mayor que +1.96. Con z = -0.25, y el valor p 2(0.5000
0.0987) = 0.8026 mayor que = 0.05, no rechazamos H0.
Por consiguiente, concluimos que las dos poblaciones de ventas de microondas
son idnticas.
Minitab
N Median
Dallas 10 437.50
San Antonio 13 435.00
Con el Minitab podemos concluir de que la prueba tiene un p de 0.8282 mayo que
el nivel de significancia por lo tanto no se rechaza la hipotesis nula, las dos
poblaciones son idnticas.
PRUEBA DE KRUSKAL-WALLIS
EJERCICIO
Solucin:
1. Planteamos la hiptesis nula y la hiptesis alternativa
= 0.01
3. Identificar el estadstico de prueba
, 2
HK
n = 22
Hk = 13.635
HK RC Rechazo HO y acepto la Ha
Usando Minitab
Interpretacin:
No todos los ndices de movimientos de las cuentas personales de cheques de los
cuatro bancos filiales son iguales, hay diferencias.
EJERCICIO
Se ha registrado el tamao de los centros acogidos tres programas de experimentacin en
funcin al nmero de aulas, si el nmero de aulas de cada uno de estos centros es el que se
muestra a continuacin, se puede afirmar que el tamao no marca diferencias entre los
centros implicados en los tres programas?
SOLUCIN:
4) Grfico
20 19 16 21 24 22 28 23 15 18 26
A A A A B B B C C C C
5 4 2 6 9 7 11 8 1 3 10
Usando Minitab:
Interpretacin:
Esto quiere decir que no existen diferencias significativas entre dichos grupos.
EJERCICIO
Un alumno vive en una casa con sistema elctrico solar. A la misma hora de cada
da, rene lecturas de voltaje con un medidor conectado al sistema y los resultados
se listan en la tabla. Utilice un nivel de significancia de 0.05 y pruebe la aseveracin
de que las lecturas de voltaje tienen la misma mediana para los tres diferentes tipos
de da. Podramos esperar que un sistema solar proporcione ms energa elctrica
en das soleados que en das nublados o lluviosos. Podemos concluir que los das
soleados dan como resultado mayores cantidades de energa elctrica?
Solucin:
H0: Las lecturas de voltaje tienen la misma mediana para los tres diferentes tipos
de da.
H1: Las lecturas de voltaje no tienen la misma mediana para los tres diferentes tipos
de da.
El estadstico W se calcula:
12 k
Ri2 12 (92) 2 (58) 2 (21) 2
W 3( n 1) 3(18 1) 14.75
nT (nT 1) i 1 ni
T
18(19) 6 6 6
Minitab
H = 14.75 DF = 2 P = 0.001
H = 14.84 DF = 2 P = 0.001 (adjusted for ties)
Con el valor de p =0.001 menor que el nivel de significancia 0.05 podemos concluir
que existe evidencia suficiente para justificar el rechazo de la aseveracin de que
las medianas de las lecturas de voltaje son iguales en los tres tipos de das
diferentes.