Você está na página 1de 89

UNIVERSIDAD NACIONAL MAYOR DE SAN

MARCOS
FACULTAD DE INGENIERA INDUSTRIAL

ESTADSTICA INDUSTRIAL

EJERCICIOS DE LABORATORIO

PROFESOR: ING. Vctor Prez

NUMERO DE GRUPO: 5

INTEGRANTES:

Agero Pea, Yordy

Espinoza Molina, Eoclides

Gutirrez Huachaca, Yomark

Mallma Cuba, Katherine 14170126

Lima, Febrero de 2017


EJERCICIOS DE LABORATORIO

CONTENIDO
PRUEBA DE HIPTESIS......................................................................................................................... 2
MARCO TERICO:............................................................................................................................ 2
PRUEBA Z DE HIPTESIS PARA UNA MUESTRA, CON DOS COLAS ....................... 3
Prueba Z de hiptesis para una muestra, con una cola .................................................................. 9
PRUEBA DE HIPTESIS: PROPORCIONES....................................................................... 12
MARCO TERICO ....................................................................................................................... 12
PRUEBA DE Z PARA COMPRAR LAS MEDIAS DE DOS MUESTRAS INDEPENDIENTES. ............... 13
COMPARACIN DE DOS PROPORCIONES MUESTRALES ........................................................... 13
PROBLEMAS UTILIZANDO LA DISTRIBUCIN T DE UNA SOLA MUESTRA ..................................... 16
PROBLEMAS UTILIZANDO LA DISTRIBUCIN T DE UNA SOLA MUESTRA CON 2 COLAS ............... 18
PROBLEMAS UTILIZANDO LA DISTRIBUCIN T DE MUESTRAS PAREADAS ................................... 23
ANOVA............................................................................................................................................... 32
ANALISIS DE VARIANZA EN DOS DIRECCIONES (ANOVA II) ............................................................... 36
REGRESIN LINEAL ............................................................................................................................ 39
Regresin mltiple ............................................................................................................................ 50
PROBLEMAS UTILIZANDO LA DISTRIBUCIN JI CUADRADO PARA TABLAS DE CONTINGENCIA ....... 63
PROBLEMAS UTILIZANDO METODOS NO PARAMETRICOS ............................................................... 70
PRUEBA DEL SIGNO ....................................................................................................................... 70
PRUEBA DE MANN-WHITNEY-WILCOXON .................................................................................... 78
PRUEBA DE KRUSKAL-WALLIS ....................................................................................................... 83

Facultad de Ingeniera Industrial Pgina 1


EJERCICIOS DE LABORATORIO

PRUEBA DE HIPTESIS
MARCO TERICO:

Las pruebas de hiptesis son un procedimiento estadstico que usa datos mustrales para
determinar si una afirmacin acerca del valor de un parmetro poblacional debe o no
rechazarse. Como hiptesis se tienen dos afirmaciones opuestas acerca de un parmetro
poblacional. A una de las afirmaciones se le llama hiptesis nula (H0) y a la otra, hiptesis
alternativa (Ha).

Prueba direccional y no direccional

Una declaracin o afirmacin direccional sostiene que un parmetro poblacional es mayor


que (>), al menos (), no mayor que () o menor que (<) alguna cantidad. Por ejemplo, el
proveedor de Jackson afirma que no ms de 20 % de las latas de remolacha estn
abolladas.

Una declaracin o afirmacin no direccional sostiene que un parmetro es igual a alguna


cantidad.

Error en las pruebas de hiptesis


7
Las hiptesis nula y alternativa son afirmaciones opuestas acerca de la poblacin. Una de
las dos, ya sea la hiptesis nula o la alternativa es verdadera, pero no ambas. Lo ideal es
que la prueba de hiptesis lleve a la aceptacin de H0 cuando H0 sea verdadera y al rechazo
de H0 cuando Ha sea verdadera.

Nivel de significancia

El nivel de significancia es la probabilidad de cometer un error tipo I cuando la hiptesis


nula es verdadera como igualdad.

Prueba de hiptesis: Procedimientos bsicos

1. Formular las hiptesis nula y alternativa


2. Seleccionar el nivel de significancia.
3. Seleccionar el estadstico de prueba y calcular su valor.

Facultad de Ingeniera Industrial Pgina 2


EJERCICIOS DE LABORATORIO

4. Identificar los valores crticos para el estadstico de prueba y establecer la regla


de decisin.
5. Comparar los valores calculados y crticos y llegar a una conclusin acerca de
la hiptesis nula.
6. Tomar la decisin de negocios correspondiente.

PRUEBA Z DE HIPTESIS PARA UNA MUESTRA, CON DOS COLAS

PROBLEMA 1
Un fabricante de tinas calientes anuncia que con su equipo de calefaccin se puede
alcanzar una temperatura de 100 F en 15 minutos en forma aproximada. Se selecciona
una muestra aleatoria de 42 tinas y se determina el tiempo necesario para alcanzar una
temperatura de 100 F con cada tina. El tiempo promedio y la desviacin estndar muestral
son de 16.5 y 2.2 min, respectivamente. Siembran estos datos alguna duda sobre la
afirmacin de la compaa? Utilice un nivel de significancia de 5%.
Probabilidad y estadstica para ingeniera y ciencia- Devore Jay L. pag 344-prob.81
SOLUCIN
Prueba de hiptesis bilateral
H0: 15 (El tiempo en el que su equipo de calefaccin alcanza los 100F no es 15)
H1: =15 (El tiempo en el que su equipo de calefaccin alcanza los 100F es 15)

n=42 tinas (tamao de la muestra)


=16.5
S = 2.2
Debido a que n>30 (muestra grande) se usar la prueba Z
Mtodo clsico
Clculo del z estadstico:
16.5 15
=
2.2/42
= 4.419
Clculo del z crtico

Facultad de Ingeniera Industrial Pgina 3


EJERCICIOS DE LABORATORIO

0.475 = 1.96
: { < 1.96 ^ z > 1.96}

4.419 Regio Rechazo Entonces SE RECHAZA H0

Mtodo p

Dado
= 4.419
< 0.5 0.49998
< 0.00002
: >
Entonces SE RECHAZA H0

Mtodo intervalo de confianza


.
. .

.
. .

. .

: {15.334; 16.865}
Entonces SE RECHAZA H0

En minitab se obtuvo

Z de una muestra

Facultad de Ingeniera Industrial Pgina 4


EJERCICIOS DE LABORATORIO

Prueba de = 15 vs. 15
La desviacin estndar supuesta = 2.2

Error
estndar
de la
N Media media IC de 95% Z P
42 16.500 0.339 (15.835; 17.165) 4.42 0.000

A un nivel de significancia de 5% no existe duda sobre lo afirmado por la compaa por lo


que la media del tiempo en el que su equipo de calefaccin alcanza los 100F es 15.

PROBLEMA 2
Las sociedades de valores de Wall Street pagaron en 2005 gratificaciones de fin de
ao de $ 125500 por empleado. Suponga que se desea tomar una muestra de los
empleados de la empresa de valores Jones &Ryan para ver si la media de la
gratificacin de fin de ao es diferente de la media de 125500 reportada para la
poblacin.
a) Establezca la hiptesis nula y alternativa que se usaran para probar si las
gratificaciones de fin de ao de Jones & Ryan difieren de la media
poblacional.
b) Suponga que una muestra de 40 empleados de Jones & Ryan exhibi una
media muestral de las gratificaciones de $118000. Suponga que a desviacin
estndar poblacional es = $30000 y calcule el valor p.
c) Con = 0.05 como nivel de significancia Cul es su conclusin?
SOLUCIN
a)
0 = 125000
1 125000
b)
= 40
= 118000
= 30000
118000 1255000
= = 1.58
30000
40

Facultad de Ingeniera Industrial Pgina 5


EJERCICIOS DE LABORATORIO

Para Z =1.58 le corresponde un valor de p de 0.4429 pero como buscamos el valor


mayo de 1.58 se resta 0.5 0.4429=0.0571 este valor se le multiplica por dos ya
que es una prueba de dos colas por lo tanto p seria:
= 0.571 2 = 0.114
c) Con un valor de significancia 0.05 se tiene que el valor de p hallado es mayor
que el nivel de significancia por lo tanto la 0 no se rechaza.

Minitab
One-Sample Z

Test of mu = 125500 vs not = 125500


The assumed standard deviation = 30000

N Mean SE Mean 95% CI Z P


40 118000 4743 (108703, 127297) -1.58 0.114

Los valores obtenidos con el Minitab son los mismos que los obtenidos
manualmente.

EJERCICIO 3
Un auditor toma una muestra de 36 cuentas de la empresa "Amauta S.A" y calcula
la media muestral que es igual a $240.00. Adems se sabe que la desviacin
estndar de los montos de las cuentas por cobrar es $43.
Su objetivo es probar la suposicin de que el valor medio de todas las cuentas por
cobrar en la empresa sea $260.00. Considere un nivel de significancia de 0.05.

SOLUCIN:
1. Plantear la hiptesis Nula y la hiptesis alternativa

Ho: = 260
Ha: 260

2. Determinar el nivel de significancia

Facultad de Ingeniera Industrial Pgina 6


EJERCICIOS DE LABORATORIO

= 0.05
3. Identificar el estadstico de prueba
Z (n > 30)

4. Formular una regla de decisin

5. Calcular el estadstico de prueba

Desarrollo Manual:
n = 36
= 240
X
= 43
X 240 260
Z= = = 2.79
43
n 36

Z = 2.79
Uso de minitab:
Zk RC => Rechazo Ho y acepto Ha
Z de una muestra

Prueba de mu = 260 vs. no = 260


La desviacin estndar supuesta = 43

Error
estndar
de la
N Media media IC de 95% Z P
Facultad de Ingeniera Industrial
36 240,00 7,17 (225,95; 254,05) -2,79 0,005 Pgina 7
EJERCICIOS DE LABORATORIO

Interpretacin:
Se concluye que, al nivel de confianza de 95%, el valor medio de todas las cuentas
de la empresa "Amauta S.A" no son iguales a $260.

EJERCICIO 4
En western University, la media histrica en las puntuaciones de los solicitantes de
una beca es 900. La desviacin estndar poblacional histrica que se considera
conocida es = 180. Cada ao, el decano asistente utiliza una muestra de las
solicitudes para determinar si la puntuacin media ha cambiado entre los solicitantes
de becas.
a) Establezca las hiptesis
b) Cul es el valor de p si en una muestra de 200 estudiantes la media muestral
es = 935?
c) Manejando = 0.05 como nivel de significancia a qu conclusin llega?
SOLUCIN
a)
0 = 900
1 900
b)
= 200
= 935
= 180
935 900
= = 2.75
180
200

Facultad de Ingeniera Industrial Pgina 8


EJERCICIOS DE LABORATORIO

Para Z =2.75 le corresponde un valor de p de 0.4970 pero como buscamos el valor


mayor de 2.57 se resta 0.5 0.4970=0.003 este valor se le multiplica por dos ya que
es una prueba de dos colas por lo tanto p seria:
= 0.003 2 = 0.006
c) Con un valor de significancia 0.05 se tiene que el valor de p hallado es menor
que el nivel de significancia por lo tanto la 0 se rechaza.

Minitab

One-Sample Z

Test of mu = 900 vs not = 900


The assumed standard deviation = 180

N Mean SE Mean 95% CI Z P


200 935.0 12.7 (910.1, 959.9) 2.75 0.006

Los valores obtenidos con el Minitab son los mismos que los obtenidos
manualmente.

Prueba Z de hiptesis para una muestra, con una cola


EJERCICIO 5

El U.S. Departament of Labor informo que los ingresos promedio para los
trabajadores estadounidenses de la produccin en 2001 era $14.32 por hora. En
una muestra de 75 trabajadores tomada en 2003, la media muestral fue $14.68 por
hora. Si la desviacin estndar poblacional es = $1.45 . Se puede concluir que
ha habido un aumento en la media de las ganancias por hora? Use = 0.05.
SOLUCIN

0 14.32
1 > 14.32

= 75
= 14.68
= 1.45

Facultad de Ingeniera Industrial Pgina 9


EJERCICIOS DE LABORATORIO

14.68 14.32
= = 2.15
1.45
75
Para Z = 2.15 le corresponde un valor de p de 0.016. Con un valor de significancia
0.05 se tiene que el valor de p hallado es menor que el nivel de significancia por lo
tanto la 0 se rechaza.

Minitab
One-Sample Z

Test of mu = 14.32 vs > 14.32


The assumed standard deviation = 1.45

95% Lower
N Mean SE Mean Bound Z P
75 14.680 0.167 14.405 2.15 0.016

Los valores obtenidos con el Minitab son los mismos que los obtenidos
manualmente.
EJERCICIO 6
El comit de seleccin de nuevos ingresos a una universidad revisa todos los
resultados obtenidos de los concursantes y concluye que de los concursantes y
concluye que de los preseleccionados para ingresar, solo el 60% respondi
satisfactoriamente a la entrevista prevista para la seleccin por lo que son
susceptibles para el ingreso. La direccin revisa una muestra de 150
preseleccionados segn los resultados obtenidos por el comit y estima que la
proporcin correcta posible de seleccin es de 50% con un 5% de probabilidad de
error (nivel de significacin).

SOLUCIN:
1. Plantear la hiptesis nula y alternativa

Ho: = 0.60
Ha: 0.60
2. Determinar el nivel de significancia

= 0.05

3. Identificar el estadstico de prueba: z

Facultad de Ingeniera Industrial Pgina 10


EJERCICIOS DE LABORATORIO

4. Grfica de distribucin:

5. Calculamos el estadstico de prueba:


0.4
= (0.6 ) = 0.04
150

0.5 0.6
= = 0.04 = 2.5
150

Entonces vemos que Zk Rc: rechazamos Ho y aceptamos Ha

Uso de minitab:

Interpretacin:
En una muestra de 150 alumnos se sabe que la media de ingreso es diferente de 0.6

Facultad de Ingeniera Industrial Pgina 11


EJERCICIOS DE LABORATORIO

PRUEBA DE HIPTESIS: PROPORCIONES

MARCO TERICO

Prueba para la proporcin

En ocasiones, necesitamos comparar la proporcin de una muestra , con un valor


supuesto en una hiptesis para la proporcin de la poblacin, p . Por ejemplo, cada una de
las siguientes situaciones puede someterse a las tcnicas de esta seccin:
Una destacada candidata para el concejo municipal declara que 65% de los
electores de la ciudad pretende votar por ella en la eleccin venidera. En un
muestreo independiente, solo 40% de 120 electores dice que votar por la
candidata.
Un propietario de un taller de reparacin de automviles afirma que no ms de 5%
de sus clientes est satisfecho con su trabajo. Sin embargo, una encuesta de 150
clientes revela que 20% no est satisfecho con el trabajo realizado.

La distribucin tericamente correcta para abordar las proporciones es la distribucin


binomial. Sin embargo, la distribucin normal es una buena aproximacin cuando np > 5 y
n(1-p) >5.
Cuanto ms grande es el tamao de la muestra, mejor se torna esta aproximacin y para
la mayora de las situaciones prcticas se satisface esta condicin. Cuando se usa la
distribucin normal para pruebas de hiptesis acerca de la proporcin muestral, el
estadstico de la prueba es el siguiente:

p
=

= La proporcin muestral

p= La proporcin poblacional de la hiptesis.

Donde

= (1 )/

Facultad de Ingeniera Industrial Pgina 12


EJERCICIOS DE LABORATORIO

PRUEBA DE Z PARA COMPRAR LAS MEDIAS DE DOS MUESTRAS INDEPENDIENTES.

La prueba de z para comparar las medias de dos muestras independientes. La prueba z se


presenta aqu como una alternativa de la prueba t con varianzas desiguales cuando n1 y n2
son 30. Adems de no requerir suposiciones respecto a la forma de las distribuciones
poblacionales, ofrece la ventaja de una simplicidad ligeramente mayor y evita la complicada
frmula de correccin de los df utilizada en la prueba t con varianzas desiguales; por lo
tanto, puede ser til para quienes no disponen de una computadora y un software para
estadstica. Esta prueba ha sido popular durante muchos aos como mtodo para comparar
las medias de dos muestras grandes, independientes, cuando se desconocen, y de dos
muestras independientes de cualquier tamao cuando se conocen y las dos poblaciones
tienen una distribucin normal. Igual que la prueba t con varianzas desiguales, la prueba z
no supo en que son iguales las desviaciones estndar poblacionales, y se utilizan S1 y S2
para estimar las respectivas desviaciones estndar poblacionales 1 y 2.

(X1 X2) (1 2)
=
2 2
1 + 2
1 2

COMPARACIN DE DOS PROPORCIONES MUESTRALES

Las siguientes son algunas situaciones posibles:

1. Comparar el porcentaje de piezas defectuosas entre embarques de dos


proveedores diferentes.
2. Determinar si la proporcin de pacientes con dolor de cabeza que sienten
alivio con un nuevo medicamento es significativamente mayor que quienes
emplean aspirina.
3. Comparar el porcentaje de alumnos de ltimo ao de enseanza media
enrolados en el servicio militar que vieron la versin A de una pelcula sobre el
reclutamiento comparado con quienes vieron la versin B.

Facultad de Ingeniera Industrial Pgina 13


EJERCICIOS DE LABORATORIO

EJERCICIO 1
La familia Prado posee grandes viedos. Al principio de la estacin hay que protegerlos
contra varios insectos y enfermedades, mediante la aplicacin de insecticidas. Hay dos
nuevos insecticidas, A y B. Para probar su eficiencia, se rociaron tres hileras largas de vias
con el insecticida A y otras tres con insecticida B. Cuando las uvas maduraron se tomaron
400 plantas tratadas con el insecticida A y 400 tratadas con el insecticida B, para verificar
si tenan alguna infeccin. Los resultados fueron:

Tamao Vias
Insecticida
muestral afectadas
A 400 24

B 400 40

Al nivel de significancia 0.05. Puede concluirse que hay diferencia entre las proporciones
de vias afectadas usando el insecticida A, y usando el insecticida B?

SOLUCIN:

1. Plantear la hiptesis nula y la hiptesis alternativa

Ho: PA = PB
Ha: PA PB

2. Determinar el nivel de significancia

= 0.05
3. Identificar el estadstico
Z (n 30)

4. Regla de decisin:

ZK

Facultad de Ingeniera Industrial Pgina 14


EJERCICIOS DE LABORATORIO

5. Tomamos una decisin:

De los datos del problema:

Insecticida Insecticida
A B
= nB = 400
= X B = 40

24 40
= = = 0.06 = = = 0.1
400 400

+ 24 + 40
= = = 0.08
+ 400 + 400

0.06 0.1
= = = 2.085
1 1
(1 ) ( + ) 0.08(1 0.08) ( 1 + 1 )
400 400

Entonces ZK = -2.085 ZK RC Rechazo HO y acepto la Ha

Hallamos el valor de P:

P<
0.037 < 0.05
Rechazo Ho y acepto la Ha

Facultad de Ingeniera Industrial Pgina 15


EJERCICIOS DE LABORATORIO

0.5 0.4815 = 0.0185


Entonces: P = 2(0.0185) = 0.037

Usando Minitab:

Interpretacin:
Se puede concluir que la proporcin de vias infectadas de la familia Prado a las cuales
se le roci el insecticida A es diferente a la proporcin de vias infectadas rociadas con el
insecticida B.

PROBLEMAS UTILIZANDO LA DISTRIBUCIN T DE UNA SOLA MUESTRA

Problemas utilizando la distribucin t de una sola muestra con cola izquierda


1.- El fabricante de las motocicletas Ososki asegura que estas dan un rendimiento
promedio de 87 millas por galn de gasolina. En una muestra de ocho motocicletas
los rendimientos fueron:
88 82 81 87 80 78 79 89
En el nivel de significancia 0.05, el rendimiento es inferior a 87 millas por galn?

Facultad de Ingeniera Industrial Pgina 16


EJERCICIOS DE LABORATORIO

Solucin
0: 87
1 : < 87
= 0.05
= 8 1 = 7
=8
= 83
= 4.34
83 87
= = 2.61
4.34
8
Para = 0.05 se debe tener un valor de t que sea menor a -1.895 para rechazar
Ho, el valor hallado es de -2.61 por lo tanto la hiptesis nula se rechaza.

Minitab
One-Sample T: millas

Test of mu = 87 vs < 87

95% Upper
Variable N Mean StDev SE Mean Bound T P
millas 8 83.00 4.34 1.54 85.91 -2.61 0.018

Los valores obtenidos con el Minitab son los mismos que los obtenidos
manualmente y el valor de p reafirma nuestra conclusin.

Problemas utilizando la distribucin t de una sola muestra con cola derecha


2.- Un artculo reciente en Wall Street Journal indica que la tasa principal de inters
en los grandes bancos, actualmente, excede 9%. En una muestra de ocho bancos
pequeos de una determinada regin se encontraron las siguientes tasas de inters:
10.1 9.3 9.2 10.2 9.3 9.6 9.4 8.8
En el nivel de significancia 0.01, se puede concluir que en los bancos pequeos la
tasa de inters es superior a 9%?.
Solucin
0: 0.09

Facultad de Ingeniera Industrial Pgina 17


EJERCICIOS DE LABORATORIO

1 : > 0.09
= 0.01
= 8 1 = 7
=8
= 0.09487
= 0.00467
0.09487 0.09
= = 2.95
0.00467
8
Para = 0.01 se debe tener un valor de t que sea mayor a 2.998 para rechazar Ho,
el valor hallado es de 2.95 por lo tanto la hiptesis nula no se rechaza.

Minitab
One-Sample T: Tasa de Interes

Test of mu = 0.09 vs > 0.09

99% Lower
Variable N Mean StDev SE Mean Bound T P
Tasa de Interes 8 0.09487 0.00467 0.00165 0.08992 2.95 0.011

Los valores obtenidos con el Minitab son los mismos que los obtenidos
manualmente y el valor de p reafirma nuestra conclusin.

PROBLEMAS UTILIZANDO LA DISTRIBUCIN T DE UNA SOLA MUESTRA CON 2


COLAS

Facultad de Ingeniera Industrial Pgina 18


EJERCICIOS DE LABORATORIO

EJERCICIO 1
Unprofesor de matemtica imparte el curso en dos institutos distintas Ay B
Tamao de la
Instituto Promedio Desviacin estndar
muestra
A 16.3 0.9 20
B 18.2 1.2 10

A un nivel de significancia de 0.01. Es razonable concluir que la calificacin


promedio obtenida por el Instituto A es menor que el obtenido en el instituto B?

SOLUCIN:

1. Plantear la hiptesis Nula y la hiptesis alternativa

Ho: 1 2
Ha: 1 > 2

2. Determinar el nivel de significancia

= 0.01

3. Identificar el estadstico de prueba

t de Student (n < 30)


4. Formular una regla de decisin

Facultad de Ingeniera Industrial Pgina 19


EJERCICIOS DE LABORATORIO

5. Calcular el estadstico de prueba

Manualmente

Datos: n1 = 20 n2 = 10
1 = 16.3
X 2 = 18.2
X
s1 = 0.9 s2 = 1.2

2
(1 1)1 2 + (2 1)2 2 (20 1)0.92 + (10 1)1.22
= =
1 + 2 2 20 + 10 2
2
= 1.0125
1 2 16.3 18.2
= = = 4.8754
2 1 1 1 1
( + ) 1.0125 ( + )
1 2 20 10
= 4.8754
=>
Valor de P:

( = 1) > ( = 0.01) =>

Usando Minitab

Facultad de Ingeniera Industrial Pgina 20


EJERCICIOS DE LABORATORIO

Prueba T de dos muestras e IC

Error
estndar
de la
Muestra N Media Desv.Est. media
1 20 16,300 0,900 0,20
2 10 18,20 1,20 0,38

Diferencia = mu (1) - mu (2)


Estimado de la diferencia: -1,900
Lmite inferior 95% de la diferencia: -2,657
Prueba T de diferencia = 0 (vs. >): Valor T = -4,42 Valor P = 1,000 GL = 14

Interpretacin:
Se concluye que, al nivel de confianza de 99%, que la calificacin promedio del instituto
A es mayor a la calificacin promedio del instituto B.

Facultad de Ingeniera Industrial Pgina 21


EJERCICIOS DE LABORATORIO

EJERCICIO 2
Un estudiante universitario (de Estados Unidos) toma en promedio 27 galones de
caf por ao, o 2.25 galones por mes. En una muestra de 12 estudiantes de una
determinada universidad se encontraron las siguientes cantidades de consumo de
caf por mes
1.75 1.96 1.57 1.82 1.85 1.82 2.43 2.65 2.60 2.24 1.69 2.66
En el nivel de significancia 0.05 hay una diferencia significativa entre el consumo
promedio general y el consumo promedio de los estudiantes de esta universidad?
Solucin
0: = 2.25
1 : 2.25
= 0.05
= 12 1 = 11
= 12
= 2.087
= 0.405
2.087 2.25
= = 1.39419
0.405
12
Para = 0.05 se debe tener un valor de t que este entre -2.201 y +2.201 para no
rechazar Ho, el valor hallado es de -1.3941 por lo tanto la hiptesis nula no se
rechaza.

Minitab

One-Sample T: Cafe por mes

Test of mu = 2.25 vs not = 2.25

Variable N Mean StDev SE Mean 95% CI T P


Cafe por mes 12 2.087 0.405 0.117 (1.829, 2.344) -1.40 0.190

Los valores obtenidos con el Minitab son los mismos que los obtenidos
manualmente y el valor de p reafirma nuestra conclusin.

Facultad de Ingeniera Industrial Pgina 22


EJERCICIOS DE LABORATORIO

PROBLEMAS UTILIZANDO LA DISTRIBUCIN T DE MUESTRAS PAREADAS


CON DATOS DADOS:
1.- Los datos siguientes provienen de muestras pareadas tomadas de dos
poblaciones.

a. Estime la diferencia en cada elemento.


b. Calcule .
c. Calcule la desviacin estndar .
d. D la estimacin puntual de la diferencia entre las dos medias poblacionales.
e. D un intervalo de 95% de confianza para estimar la diferencia entre las dos
medias poblacionales.
SOLUCION
a. Hallamos la diferencia

11 8 = 3
7 8 = -1
96=3
12 7 = 5
13 10 = 3
15 15 = 0
15 14 = 1

b. Calculamos d.

3 + 1 + 3 + 5 + 3 + 0 + 1
= =2
7

c. La desviacion estandar:

Facultad de Ingeniera Industrial Pgina 23


EJERCICIOS DE LABORATORIO

(3 2)2 + (1 2)2 + (3 2)2 + (5 2)2 + (3 2)2 + (0 2)2 + (1 2)2


=
71
= 2.082

d. Estimacion:

1 = 11.71 2 = 9.71
Estimacion = 2

e. 0 : 1 2 = 0
1 : 1 2 0
= 0.05
0.056 = 2.447

20
= = = 2.54

2.082
7
Justificacin y decisin:
Como 2.54 es mayor que 2.477, entra en la zona de rechazo.
Por lo tanto se rechaza la Hipotesis Nula (0 )
EN MINITAB:
IC y Prueba T pareada: 1, 2

T pareada para 1 - 2

Error
estndar
de la
N Media Desv.Est. media
1 7 11.71 2.98 1.13
2 7 9.71 3.50 1.32
Diferencia 7 2.000 2.082 0.787

IC de 95% para la diferencia media:: (0.075, 3.925)


Prueba t de diferencia media = 0 (vs. no = 0): Valor T = 2.54 Valor P = 0.044

Los valores obtenidos con el Minitab son los mismos que los obtenidos
manualmente y el valor de p reafirma nuestra conclusin.

Facultad de Ingeniera Industrial Pgina 24


EJERCICIOS DE LABORATORIO

PROBLEMA
Se hizo un estudio para definirse si los ejercicios aerbicos reducen el ritmo
cardiaco de una persona durante el descanso, y al examinar a diez voluntarios antes
y despus de seguir un programa de ese tipo durante seis meses. Sus pulsaciones,
en latidos por minuto, dieron los siguientes resultados:

Use = 0.05 para calcular si los ejercicios aerbicos reducen el ritmo cardiaco
durante el reposo.
Calcule el valor de P.
SOLUCION
0 : = 0
1 : > 0
= 0.05
0.059 = 1.833
Regla de la decisin:
Si <= 1.833 No se rechaza 0
Si > 1.833 se rechaza 0
Se proceder a calcular las diferencias de cada par:

Al calcular la media de las diferencias nos da 3.6 con una = 1.58

Facultad de Ingeniera Industrial Pgina 25


EJERCICIOS DE LABORATORIO

3.6 0
= = = 7.20

1.58
10
Justificacin y decisin:
- Como 7.20 es mayor que 1.833, se RECHAZA 0 , y se concluye con un nivel
de significancia de 0.05 que los datos indican que los ejercicios aerbicos
disminuyen significativamente el ritmo cardiaco durante el reposo.
Con el valor de P:
Para calcular el valor de P se busca el 7.20 en el rengln de 9 grados de libertad en
la tabla t, y se observa que el valor mayor que aparece en dicha tabla es 4.781 al
cual le corresponde un rea a la derecha de 0.0005, entonces se puede concluir
que el valor de P es prcticamente cero.
EN MINITAB:
IC y Prueba T pareada: Antes, Despues

T pareada para Antes - Despues

Error
estndar
de la
N Media Desv.Est. media
Antes 10 71.40 5.64 1.78
Despues 10 67.80 5.79 1.83
Diferencia 10 3.600 1.578 0.499

Lmite inferior 95% para la diferencia media: 2.685


Prueba t de diferencia media = 0 (vs. > 0): Valor T = 7.22 Valor P = 0.000

3.- Las personas que viajan por avin, suelen elegir de qu aeropuerto salir con
base en el costo del vuelo. Para determinar de qu aeropuerto es ms costoso salir,
si de Dayton, Ohio; o de Louisville, Kentucky, se recolectan datos (en dlares) de
una muestra de vuelos a ocho ciudades partiendo de estos dos aeropuertos (The
Cincinnati Enquirer, 19 de febrero de 2006). Un investigador sostiene que es mucho

Facultad de Ingeniera Industrial Pgina 26


EJERCICIOS DE LABORATORIO

ms costoso partir de Dayton, que de Louisville. Use los datos muestrales para ver
si favorecen tal afirmacin. Como nivel de significancia use =0.05.

SOLUCION:
0 : = 0
1 : < 0
= 0.05
0.057 = 1.895
Regla de la decisin:
Si > 1.895 No se rechaza 0
Si <= 1.895 se rechaza 0
Se procedera a calcular las diferencias de cada par:
177, 201, -186, 131, -22, -212, 5, -14 ; del cual la media es igual a 10, y
= 155.1
10 0
= = = 0.18

155.1
8
Justificacin y decisin:
- Como 0.18 es menor que 1.895, se RECHAZA 0 , y se concluye con un nivel
de significancia de 0.05 que los datos indican en Dayotn son mas caros que
los de Louisville.

Minitab
IC y Prueba T pareada: Louisville, Dayton

T pareada para Louisville - Dayton

Error
estndar
de la
N Media Desv.Est. media
Louisville 8 261.3 82.6 29.2
Dayton 8 318.0 93.7 33.1
Diferencia 8 -56.8 121.5 43.0

Lmite inferior 95% para la diferencia media: -138.2


Prueba t de diferencia media = 0 (vs. > 0): Valor T = 0.18 Valor P = 0.886

Facultad de Ingeniera Industrial Pgina 27


EJERCICIOS DE LABORATORIO

Panorama de distribucin f

Anlisis de varianza
2_ direcciones

1_ direcciones

Facultad de Ingeniera Industrial Pgina 28


EJERCICIOS DE LABORATORIO

PROBLEMA
En la empresa gloria la produccin se tiene una lnea de produccin de latas en el
cual tiene respectivas maquinas.
La lnea de produccin consta de 2 partes de produccin de tapas de las latas y
produccin de enrolado de cilindro con medidas que no varen mucho
Los cuales tienen que cumplir con varianzas de rendimientos iguales con el objetivo
para que no tengan la necesidad de encontrase una tapa chica con un cilindro
grande, o un cilindro chico con una tapa grande si logramos tener una varianzas
iguales podemos obtener mejor ensamblaje y se tendra que manejar las medias de
los dos para as estar seguros de un mejor ensamblaje.
Con un nivel de significancia es 0.1
Recopilando datos tenemos las medidas las muestras:

Latas compuesta de (TAPAS_CILINDRO)

TAPAS CILINDRO

2 2
S1 = 0.41 S2 =0.13

n =22 n = 16

Solucin
1. Las hiptesis de prueba son las siguientes:

H 0 : 12 22
H 1 : 12 22

Si se puede rechazar H 0 , es adecuada la conclusin para un mejor


ensamblaje. En tal caso, el objetivo es tener igual varianza

2. Hallando valor critico

Facultad de Ingeniera Industrial Pgina 29


EJERCICIOS DE LABORATORIO

- Hallando nivel de significancia de 2 colas


o =0.1
o F (/2) = F (0.05)
- HALLANDO LOS GRADOS DE SIGNIFICANCIA
Grados de libertad del numerador = 22-1 = 21
Grados de libertad del denominador = 16-1 = 15
- VALOR GRITICO
-
F (/2) = F (0.05) = 2.32

3. Hallando la Razn de Varianzas

s12 0.41
F 2 3.15
s 2 0.13

4. Regla de Decisin
Comparacin del Valor crtico y la Razn de Varianzas

F (0.05) < F
2.32 < 3.15

Conclusin la hiptesis nula se rechaza hallando que las varianzas


diferentes. En conclusin esto afecta a la produciran de latas de la empresa
leche gloria Teniendo que hacer algo para disminuir este problema, sera
conveniente que haga un muestreo ms genera con ms datos y con ms
amplitud para verificar esta conclusin y ver cul es el origen de esta
diferencia de variacin para poder solucionarla

Facultad de Ingeniera Industrial Pgina 30


EJERCICIOS DE LABORATORIO

MINITAB

Bienvenido a Minitab, presione F1 para obtener ayuda.

Prueba e IC para dos varianzas

* NOTA * Las grficas que no sean grficas de intervalos no se pueden


crear con
Datos resumidos.

Mtodo

Hiptesis nula Sigma (1) / Sigma (2) = 1


Hiptesis alterna Sigma (1) / Sigma (2) not = 1
Nivel de significancia Alfa = 0.05

Estadsticas

Muestra N Desv.Est. Varianza


1 22 0.686 0.470
2 16 0.361 0.130

Relacin de deviaciones estndar = 1.901


Relacin de varianzas = 3.615

Intervalos de confianza de 95%

IC para IC para
Distribucin relacin de relacin de
De los datos Desv.Est. Varianza
Normal (1.149, 3.027) (1.319, 9.161)

Pruebas

Estadstica
Mtodo GL1 GL2 de prueba Valor P
Prueba F (normal) 21 15 3.62 0.014

Facultad de Ingeniera Industrial Pgina 31


EJERCICIOS DE LABORATORIO

ANOVA

Pregunta 1
1. La siguiente informacin es muestral. Pruebe la hiptesis de que las medias
de tratamiento son iguales. Utilice el nivel de significancia 0.05.

Tratamiento 1 Tratamiento 2 Tratamiento 3


9 13 10
7 20 9
11 14 15
9 13 14
12 15
10

a) Establezca las hiptesis nula y alternativa.


b) Cul es la regla de decisin?
c) Calcule SST, SSE y SS total.
d) Elabore una tabla ANOVA.
e) Exprese su decisin acerca de la hiptesis nula.
Se seguir el procedimiento usual de cinco pasos para la prueba de hiptesis.
Paso 1: Plantear la hiptesis nula y la hiptesis alternativa
0 : 1 = 2 = 3
1 : .
Paso2: Establecer nivel de significancia.
= 0.05
Paso 3: Determinar el estadstico de prueba. Estamos ante una distribucin F,
ANOVA.
Paso 4: Establecer la regla de decisin.
Grados de libertad para el numerador = k 1 = 3 1 = 2
Grados de libertad para el numerador = n - k = 15 3 = 12
Intersectando en la tabla, encontramos el valor de 3.89. As que la regla de decisin
es rechazar la 0 si el valor calculado para F es mayor que 3.89.
Paso 5: Seleccionar muestra, realizar los clculos y tomar una decisin.

Facultad de Ingeniera Industrial Pgina 32


EJERCICIOS DE LABORATORIO

Tratamient Tratamient Tratamiento Total


o1 o2 3
2 2 2
9 81 13 169 10 100
7 49 20 400 9 81
11 121 14 196 15 225
9 81 13 169 14 196
12 144 15 225
10 100
58 60 63 181
6 4 5 15
2 576 934 827 2337

Las entradas para la tabla ANOVA se calculan como sigue.


( )2 1812
SS total = 2 = 2337 = .
15

2 ( )2 582 602 632 1812


SST = ( ) = + + = .
6 4 5 15

SSE = SS total SST = 152.933 70.4 = 82.533


Al insertar estos valores en una tabla ANOVA y calcular el valor de F se tiene:
Tabla ANOVA
Fuente de Suma de Grados de Cuadrado F
variacin cuadrados libertad medio
Tratamientos SST = 70.4 k-1 = 3-1=2 SST/(k- MST/MSE=5.12
Error SSE = 82.533 n-k=15- 1)=35.2
Total SStotal = 3=12 SSE/(n-
152.933 n-1=14 k)=6.878

El valor calculado para F es 5.12, que es mayor que el valor crtico 3.89, por tanto
se rechaza la hiptesis nula. Se concluye que las medias poblacionales no son
iguales. Los tratamientos promedio no son iguales en los tres grupos de evaluacin.
Por ahora slo se puede concluir que hay una diferencia entre las medias de
tratamiento.

Facultad de Ingeniera Industrial Pgina 33


EJERCICIOS DE LABORATORIO

EJERCICIO
Una compaa de desarrollos inmobiliarios considera la inversin en un centro
comercial en las afueras de Atlanta, Georgia. Se evalan tres terrenos. El ingreso
de los pobladores de la zona aledaa al centro comercial es de especial importancia.
Se selecciona una muestra aleatoria de cuatro familias que viven cerca de cada
terreno. A continuacin se presentan los resultados muestrales. Al nivel de
significancia de 0.05, puede concluir la compaa que hay diferencia en los
ingresos promedio? Utilice el procedimiento usual de cinco pasos para prueba de
hiptesis.

Southwyck Parque Franklin Old Orchard


(miles US$) (miles US$) (miles US$)
64 74 75
68 71 80
70 69 76
60 70 78

Se seguira el procedimiento usual de cinco pasos para la prueba de hiptesis.


Paso 1: Plantear la hiptesis nula y la hiptesis alternativa
0 : 1 = 2 = 3
1 : .
Paso 2:
Establecer nivel de significancia.
= 0.05
Paso 3: Determinar el estadstico de prueba. Estamos ante una distribucion F,
ANOVA.
Paso 4: Establecer la regla de decisin.
Grados de libertad para el numerador = k 1 = 3 1 = 2
Grados de libertad para el numerador = n - k = 12 3 = 9
Intersectando en la tabla, encontramos el valor de 4.26. As que la regla de decisin
es rechazar la 0 si el valor calculado para F es mayor que 4.26.
Paso 5: Seleccionar muestra, realizar los clculos y tomar una decisin.

Facultad de Ingeniera Industrial Pgina 34


EJERCICIOS DE LABORATORIO

Southwyck Parque Old Total


(miles US$) Franklin Orchard
(miles US$) (miles US$)
2 2 2
64 4096 74 5476 75 5625
68 4624 71 5041 80 6400
70 4900 69 4761 76 5776
60 3600 70 4900 78 6084

262 284 309 855


4 4 4 12
2 1722 2017 2388 61283
0 8 5

Las entradas para la tabla ANOVA se calculan como sigue.


( )2 8552
SS total = 2 = 61283 = .
12

2 ( )2 2622 2842 3092 8552


SST = ( ) = + + = .
4 4 4 12

SSE = SS total SST = 364.25 276.5 = 87.75


Al insertar estos valores en una tabla ANOVA y calcular el valor de F se tiene:
Tabla ANOVA
Fuente de Suma de Grados de Cuadrado F
variacin cuadrados libertad medio
Tratamientos SST = 276.5 k-1 = 3-1=2 SST/(k- MST/MSE=14.18
Error SSE = 87.75 n-k=12-3=9 1)=138.25
Total SStotal = n-1=12- SSE/(n-
364.25 1=11 k)=9.75

El valor calculado para F es 14.18, que es mayor que el valor crtico 4.26, por tanto
se rechaza la hiptesis nula. Se concluye que las medias poblacionales no son
iguales. Los ingresos promedio no son iguales en los tres grupos de evaluacin. Por
ahora slo se puede concluir que hay una diferencia entre las medias de
tratamiento.

Facultad de Ingeniera Industrial Pgina 35


EJERCICIOS DE LABORATORIO

ANALISIS DE VARIANZA EN DOS DIRECCIONES (ANOVA II)


1. Cada una de las tres cadenas de supermercados en la regin de Denver
indica que ofrece los precios ms bajos. Como parte de un estudio de
investigacin sobre publicidad de supermercados, el diario Denver Daily
News realiz un estudio. Primero selecciono una muestra aleatoria de nueve
artculos comestibles. Despus se revis el precio de cada uno de estos
productos en cada una de las tres cadenas, el mismo da. Al nivel de
significancia 0.05, hay alguna diferencia en los precios medios de los
supermercados y de los artculos?
Articulo Super$ Ralphs Lowblaws
1 $ 1.12 $ 1.02 $ 1.07
2 1.14 1.10 1.21
3 1.72 1.97 2.08
4 2.22 2.09 2.32
5 2.40 2.10 2.30
6 4.04 4.32 4.15
7 5.05 4.95 5.05
8 4.68 4.13 4.67
9 5.52 5.46 5.86

Solucin:
Se seguir el procedimiento usual de cinco pasos para la prueba de hiptesis.
Paso 1: Plantear la hiptesis nula y la hiptesis alternativa
Los dos conjuntos de hiptesis son:
1.
0 : 1 = 2 = 3
1 :

2.
0 : 1 = 2 = 3
1 :
Paso 2: Establecer nivel de significancia. = 0.05
Paso 3: Determinar el estadstico de prueba. Estamos ante un ANOVA de dos
direcciones.

Facultad de Ingeniera Industrial Pgina 36


EJERCICIOS DE LABORATORIO

Paso 4: Establecer la regla de decisin.


a) Primero se probara la hiptesis relativa a las medidas de tratamiento:
Grados de libertad para el numerador = k 1 = 3 1 = 2
Grados de libertad para el numerador = (b-1)*(k-1) = (3-1)*(9-1)= 16
Intersectando en la tabla, encontramos el valor de 3.63. As que la regla de decisin
es rechazar la 0 si el valor calculado para F es mayor que 3.63 (Fcrit>3.63).
b) Luego se realizar la prueba de hiptesis a las medidas de bloques:
Grados de libertad para el numerador = b 1 = 9 1 = 8
Grados de libertad para el numerador = (b-1)*(k-1) = (3-1)*(9-1)= 16
Intersectando en la tabla, encontramos el valor de 2.59. As que la regla de decisin
es rechazar la 0 si el valor calculado para F es mayor que 2.59 (Fcrit>2.59).
Paso 5: Seleccionar muestra, realizar los clculos y tomar una decisin.
Articulo Super$ Ralphs Lowblaws
2 2
X X X 2 Suma
reglones
Bt
1 $ 1.12 1.2544 $ 1.02 1.0404 $ 1.07 1.1449 3.21
2 1.14 1.2996 1.10 1.21 1.21 1.4641 3.45
3 1.72 2.9584 1.97 3.8809 2.08 4.3264 5.77
4 2.22 4.9284 2.09 4.3681 2.32 5.3824 6.63
5 2.40 5.76 2.10 4.41 2.30 5.29 6.8
6 4.04 16.3216 4.32 18.6624 4.15 17.2225 12.51
7 5.05 25.5025 4.95 24.5025 5.05 25.5025 15.05
8 4.68 21.9024 4.13 17.0569 4.67 21.8089 13.48
9 5.52 30.4704 5.46 29.8116 5.86 34.3396 16.84
Total 27.89 27.14 28.71 83.74
columna
Suma de 110.3977 104.9428 116.4813 331.8218
cuadrados

( )2
= 2

83.742
= 331.8218 = 72.1037
27

Facultad de Ingeniera Industrial Pgina 37


EJERCICIOS DE LABORATORIO

2 2
= ( )

27.892 27.142 28.712 83.742
= + + = 0.1370
9 9 9 27

2 2
= ( )

3.212 3.452 5.772 6.632 6.82 12.512 15.052 13.482
= + + + + + + +
3 3 3 3 3 3 3 3
2 2
16.84 83.74
+ = 71.6136
3 27

=
= 72.1037 0.1370 71.6136 = 0.3531

= /( 1)
0.1370
= = 0.0685
2

= /( 1)
71.6136
= = 8.9517
8

= /( 1)( 1)
0.3531
= = 0.0221
16

Fuente de Suma de Grados de Cuadrado medio


variacin Cuadrados Libertad

Facultad de Ingeniera Industrial Pgina 38


EJERCICIOS DE LABORATORIO

Tratamientos 0.1370 2 0.0685


Bloques 71.6136 8 8.9517
Error 0.3531 16 0.0221
Total 72.1037

0.0685
= = = 3.0995
0.0221
No se rechaza la hiptesis nula de medias de tratamiento ya que del F hallado
en menor que 3.63. Se concluye que los precios no difieren en todas las tiendas

8.9517
= = = 405,0543
0.0221
Se rechaza la hiptesis nula de medias de bloques ya que el F hallado es mayor
que 2.59. Se concluye que hay diferencia entre los artculos observados.

REGRESIN LINEAL

1.- Un ciudadano est estudiando compaas que se harn pblicas por primera
vez. Tiene inters particular en la relacin entre le importe de una oferta y el precio
por accin. Una muestra de 15 empresas que recientemente se hicieron pblicas
presento la siguiente informacin.
Compaa Tamao(millones de Precio por accin, Y
dlares), X
1 9.0 10.8
2 94.4 11.3
3 27.3 11.2
4 179.2 11.1
5 71.9 11.1
6 97.9 11.2
7 93.5 11.0
8 70.0 10.7
9 160.7 11.3
10 96.5 10.6
11 83.0 10.5
12 23.5 10.3
13 58.7 10.7
14 93.8 11.0
15 34.4 10.8

Facultad de Ingeniera Industrial Pgina 39


EJERCICIOS DE LABORATORIO

a) Construir el diagrama de dispersin.


b) Calcular b0 y b1.
c) Interpretar b0 y b1
d) Predecir ara un valor particular.
e) Calcular el error de estimacin.
f) Calcular el coeficiente de estimacin 2 e interprete.
g) Calcular el coeficiente de estimacin r e interprete.
h) Haga un anlisis residual.
i) Cree un intervalo de confianza.
j) Cree un intervalo de prediccin.

Solucin:
a) Construir el diagrama de dispersin.

Facultad de Ingeniera Industrial Pgina 40


EJERCICIOS DE LABORATORIO

b) Calcular b0 y b1.
( ) ( )( ) 15(13114,64) (1193,8)(163,6)
1 = = = 0.00302
( 2 ) ( )2 15(126252,04) (1193,8)2
0 = 1 = 10.906 0.00302 79.5867 = 10.665 = 10.7

c) Interpretar b0 y b1

Por lo tanto la ecuacin de regresin es:


= 10.7 + 0.00302

El valor de b1= 0.00302 significa que para cada tamao de oferta se puede
esperar aumentar 0.00302 el precio por accin. Es decir que por cada 10
ofertas aumentara 0.0302 el precio por accin.
El valor de b0= 10.7 es el punto donde la ecuacin cruza al eje y. si no hay
oferta, es decir si x=0, el precio por accin ser de 10.7. Pero x=0 est fuera
del intervalo de valores incluidos en la muestra.

d) Predecir para un valor particular.

Facultad de Ingeniera Industrial Pgina 41


EJERCICIOS DE LABORATORIO

Para 100:
= 10.7 + 0.00302 = 10.7 + 0.00302*100=11,002

Si el tamao de una oferta es 100 millones de dlares, se obtendr un precio por


accin de 11.002.

e) Calcular el error estndar de estimacin.

( )2
. =
2

Compa Tamao(millone Precio Y Desviaci Desviaci


a s de dlares), X por Calculad n (Y-Y) n (Y-Y)^2
accin o
,Y
1 9.0 10.8 10.72718 0.07282 0.00530275
2 94.4 11.3 10.985088 0.314912 0.09916957
3 27.3 11.2 10.782446 0.417554 0.17435134
4 179.2 11.1 11.241184 -0.141184 0.01993292
5 71.9 11.1 10.917138 0.182862 0.03343851
6 97.9 11.2 10.995658 0.204342 0.04175565
7 93.5 11.0 10.98237 0.01763 0.00031082
8 70.0 10.7 10.9114 -0.2114 0.04468996
9 160.7 11.3 11.185314 0.114686 0.01315288
10 96.5 10.6 10.99143 -0.39143 0.15321744
11 83.0 10.5 10.95066 -0.45066 0.20309444
12 23.5 10.3 10.77097 -0.47097 0.22181274
13 58.7 10.7 10.877274 -0.177274 0.03142607
14 93.8 11.0 10.983276 0.016724 0.00027969
15 34.4 10.8 10.803888 -0.003888 1.5117E-05

1.04
. = = 0.28
15 2
f) Calcular el coeficiente de estimacin 2 e interprete.
Compaa Tamao Precio Y Desviaci Desviaci
Y- )^2
(Y-
(millones por Calculado n (Y-Y) n (Y-Y)^2
de accin
dlares), ,Y
X
1 9.0 10.8 10.72718 0.07282 0.00530275 -0.10666667 0.01137778

Facultad de Ingeniera Industrial Pgina 42


EJERCICIOS DE LABORATORIO

2 94.4 11.3 10.985088 0.314912 0.09916957 0.39333333 0.15471111


3 27.3 11.2 10.782446 0.417554 0.17435134 0.29333333 0.08604444
4 179.2 11.1 11.241184 -0.141184 0.01993292 0.19333333 0.03737778
5 71.9 11.1 10.917138 0.182862 0.03343851 0.19333333 0.03737778
6 97.9 11.2 10.995658 0.204342 0.04175565 0.29333333 0.08604444
7 93.5 11.0 10.98237 0.01763 0.00031082 0.09333333 0.00871111
8 70.0 10.7 10.9114 -0.2114 0.04468996 -0.20666667 0.04271111
9 160.7 11.3 11.185314 0.114686 0.01315288 0.39333333 0.15471111
10 96.5 10.6 10.99143 -0.39143 0.15321744 -0.30666667 0.09404444
11 83.0 10.5 10.95066 -0.45066 0.20309444 -0.40666667 0.16537778
12 23.5 10.3 10.77097 -0.47097 0.22181274 -0.60666667 0.36804444
13 58.7 10.7 10.877274 -0.177274 0.03142607 -0.20666667 0.04271111
14 93.8 11.0 10.983276 0.016724 0.00027969 0.09333333 0.00871111
15 34.4 10.8 10.803888 -0.003888 1.5117E-05 -0.10666667 0.01137778

( )2 ( )2 1.31 1.04
2 = = = 0.2061
( ) 2 1.31
( )2 0.30
2 = = = = 0.229
( )2 1.31
En minitab debido a los decimales calculados tenemos 21.7% lo que nos indica que
el 21.7% del precio por accin est determinado por su relacin lineal con X (tamao
de la oferta).

ANLISIS DE VARIANZA
Grados de Suma de Promedio de los Valor crtico
libertad cuadrados cuadrados F de F
Regresin 1 6786.04809 6786.04809 3.6073227 0.07994066
Residuos 13 24455.4292 1881.18687
Total 14 31241.4773

6786.04809
2 = = = 0.2172
31241.4773

Calcular el coeficiente de estimacin r e interprete.

= 2 = 0.217 = 0.466
La pendiente de la ecuacin de regresin es positiva esta entre -1 y +1.

Facultad de Ingeniera Industrial Pgina 43


EJERCICIOS DE LABORATORIO


= = 43.37
2

g) Haga un anlisis residual.

Anlisis de los residuales

Pronstico Tamao(millones de dlares), Residuos


Observacin X Residuos estndares
-
1 71.9075356 62.9075356 -1.50514744
-
2 107.903462 13.5034623 -0.32308851
3 100.704277 -73.404277 -1.7562961
4 93.5050916 85.6949084 2.050366
-
5 93.5050916 21.6050916 -0.51693089
-
6 100.704277 2.80427699 -0.0670961
7 86.3059063 7.19409369 0.17212837
8 64.7083503 5.29164969 0.12660984
9 107.903462 52.7965377 1.26322821
10 57.509165 38.990835 0.9329082
11 50.3099796 32.6900204 0.78215273
12 35.911609 -12.411609 -0.29696445
-
13 64.7083503 6.00835031 -0.14375787
14 86.3059063 7.49409369 0.17930628
-
15 71.9075356 37.5075356 -0.89741826

h) Cree un intervalo de confianza.


Para b1

Facultad de Ingeniera Industrial Pgina 44


EJERCICIOS DE LABORATORIO

43.37 43.37
1= = = 0.245
( )2 31241,4773
1 /2 1 = 0.00302 1.9 0.245

(-0.46248, 0.46852)
Para y
10.7 73.19 0.004
(10.4111, 10.9823)
i) Cree un intervalo de prediccin.
= 0.009

10.7 73.19 0.009


(10.0262, 11.3672)
Minitab

Regression Analysis: Precio versus Tamao

The regression equation is


Precio = 10.7 + 0.00302 Tamao

Predictor Coef SE Coef T P


Constant 10.6665 0.1457 73.19 0.000
Tamao 0.003017 0.001589 1.90 0.080

S = 0.280786 R-Sq = 21.7% R-Sq(adj) = 15.7%

Analysis of Variance

Source DF SS MS F P
Regression 1 0.28440 0.28440 3.61 0.080
Residual Error 13 1.02493 0.07884
Total 14 1.30933

Predicted Values for New Observations

New Obs Fit SE Fit 95% CI 95% PI


1 10.6967 0.1322 (10.4111, 10.9823) (10.0262, 11.3672)

PROBLEMA

Facultad de Ingeniera Industrial Pgina 45


EJERCICIOS DE LABORATORIO

Se quiere estudiar la relacin entre la pureza del oxgeno (Y) producido en un proceso
qumico de destilacin y el nivel de hidrocarburos(X) presentes en el condensador
principal de la unidad de destilacin

Nivel de Pureza del


Hidrocarburos Oxgeno
(%) (%)

0,99 90,01
1,02 89,05
1,15 91,43
1,29 93,74
1,46 96,73
1,36 94,45
0,87 87,59
1,23 91,77
1,55 99,42
1,4 93,65
1,19 93,54
1,15 92,52
0,98 90,56
1,01 89,54
1,11 89,85
1,2 90,39
1,26 93,25
1,32 93,41
1,43 94,98
0,95 87,33

a) Realizar un anlisis de varianza, utilizando un nivel de significancia de 0.05


b) Realizar un anlisis residual

Solucin:
a)

Facultad de Ingeniera Industrial Pgina 46


EJERCICIOS DE LABORATORIO

X Y X2 Y2 XY
0.99 90.01 0.9801 8101.8001 89.11
1.02 89.05 1.0404 7929.9025 90.83
1.15 91.43 1.3225 8359.4449 105.14
1.29 93.74 1.6641 8787.1876 120.92
1.46 96.73 2.1316 9356.6929 141.23
1.36 94.45 1.8496 8920.8025 128.45
0.87 87.59 0.7569 7672.0081 76.20
1.23 91.77 1.5129 8421.7329 112.88
1.55 99.42 2.4025 9884.3364 154.10
1.4 9365 1.96 8770.3225 131.11
1.19 93.54 1.4161 8749.7316 111.31
1.15 92.52 1.3225 8559.9504 106.40
0.98 90.56 0.9604 8201.1136 88.75
1.01 89.54 1.0201 8017.4116 90.44
1.11 89.85 1.2321 8073.0225 99.73
1.2 90.39 1.44 8170.3521 108.47
1.26 93.25 1.5876 8695.5625 117.50
1.32 93.41 1.7424 8725.4281 123.30
1.43 94.98 2.0449 9021.2004 135.82
0.95 87.33 0.9025 7626.5289 82.96
23.92 1843.21 29.2892 170044.5321 2214.6566

20(2214.6566) (23.92)(1843.21)
= =
( ) 20(29.2892) 23.922

b = 14.947

1843.21 14.947(23.92)
= =
20

a = 74.283

( )2 1843.212
= 2 = 170044.5321 = 173.377
20
( )2 1843.212
= + = 74.283(1843.21) + 14.947(2214.6566) +
20
= 152.13

Facultad de Ingeniera Industrial Pgina 47


EJERCICIOS DE LABORATORIO

= +
= 21.247

1. Plantearemos nuestra hiptesis nula y alterna:

Ho: 1 = 0
Ha: 1 0

2. Determinar el nivel de significancia:


= 0.05
3. Identificar el estadstico de prueba:

4. Formular una regla de decisin: F(0.05,1,18)

5. Clculo del ANOVA

FV GL SC CM F
Regresion 1 152.13 152.13 128.92
Error 18 21.247 1.18
Total 19

FK = 128.92
Fk RC Rechazo HO y Acepto la Ha

Facultad de Ingeniera Industrial Pgina 48


EJERCICIOS DE LABORATORIO

Interpretacin:
El coeficiente de regresin es diferente de 0, por lo tanto la ecuacin no es una
constante. Por cada unidad en el nivel de hidrocarburo que se incrementa, la pureza
b)delComo vamos
oxgeno a hacer
aumenta un anlisis residual, veremos que observacin de las 20 que
en 14.97.
tenemos, debemos eliminar ya que hace que nuestro estudio y desarrollo del modelo salga
errneo.

Utilizaremos los 3 mtodos o tcnicas de anlisis de influencias:

1) Matriz Sombrero:
1 ( )2
= [ + ]
2 ( )2

2) Residuales Eliminados t-student,ti:


= 1

Facultad de Ingeniera Industrial Pgina 49


EJERCICIOS DE LABORATORIO

3) Estadstico de la distancia de Cook:


2
=
2(1 )

REGRESIN MLTIPLE
1.- En los datos siguientes se presenta peso en vaco, caballos de fuerza y velocidad
en 1/4 de milla de 10 automviles deportivos y GT. Supngase que se tiene tambin
el precio de cada uno de estos automviles. Todo el conjunto de datos es el
siguiente:

Automvil deportivo y GT Precio Peso en Caballos Velocidad


(miles de $) vaco (lb) de fuerza en de
(lb) milla (mph)
Accura Integra Type R 25035 2577 195 90.7
Accura NSX-T 93758 3066 290 108.0
BMW Z3 2.8 40900 2844 189 93.2
Chevrolet Camaro Z28 24865 3439 305 103.2
Chevrolet Corvette 50144 3246 345 102.1
Convertible
Dodge Viper RT/10 69742 3319 450 116.2
Ford Mustang GT 23200 3227 225 91.7
Honda Prelude Type SH 26382 3042 195 89.7
Mercedes-Benz CLK320 44988 3240 215 93.0
Mercedes-Benz SLK230 42762 3025 185 92.3
Mitsubishi 3000GT VR-4 47518 3737 320 99.0

Facultad de Ingeniera Industrial Pgina 50


EJERCICIOS DE LABORATORIO

Nissan 240SX SE 25066 2862 155 84.6


Pontiac Firebird Trans Am 27770 3455 305 103.2
Porsche Boxster 45560 2822 201 93.2
Toyota Supra Turbo 40989 3505 320 105.0
Volvo C70 41120 3285 236 97.0

Obtenga la ecuacin de regresin estimada para predecir la velocidad en de milla


Solucin
Regression Analysis: Velocidad en versus Precio (mile, Peso en vac, ...

The regression equation is


Velocidad en de milla (mph) = 72.9 + 0.000104 Precio (miles de $)
- 0.00060 Peso en vaco (lb)
+ 0.0863 Caballos de fuerza (lb)

Predictor Coef SE Coef T P


Constant 72.876 8.407 8.67 0.000
Precio (miles de $) 0.00010445 0.00004315 2.42 0.032
Peso en vaco (lb) -0.000603 0.003147 -0.19 0.851
Caballos de fuerza (lb) 0.08634 0.01366 6.32 0.000

S = 2.58286 R-Sq = 92.0% R-Sq(adj) = 90.0%

Analysis of Variance

Source DF SS MS F P
Regression 3 915.90 305.30 45.76 0.000
Residual Error 12 80.05 6.67
Total 15 995.95

Source DF Seq SS
Precio (miles de $) 1 406.39
Peso en vaco (lb) 1 242.90
Caballos de fuerza (lb) 1 266.61

Unusual Observations

Velocidad
Precio en de
(miles milla
Obs de $) (mph) Fit SE Fit Residual St Resid
11 47518 99.000 103.216 1.523 -4.216 -2.02R

R denotes an observation with a large standardized residual.

a) Ecuacin de regresin mltiple es:

Y = 72.9 + 0.000104 1 - 0.00060 2 + 0.0863 3

1 = Precio (miles de $)

Facultad de Ingeniera Industrial Pgina 51


EJERCICIOS DE LABORATORIO

2 = Peso en vaco (lb)


3 = Caballos de fuerza (lb)

El valor de interseccin es 72.9. este el punto donde la ecuacin de regresin


cruza el eje y, la variable precio tiene una relacin directa: conforme aumenta
el precio aumenta la velocidad, por cada milln de dlares la velocidad
aumenta 0.000104 mph, la variable peso en vaco tiene una relacin inversa:
conforme aumenta el peso en vaco disminuye la velocidad, por cada libra de
peso en vaco la velocidad disminuye 0.00060 mph, la variable caballo de
fuerza tiene una relacin directa: conforme aumentan los caballos de fuerza
aumenta la velocidad, por cada libra de caballo de fuerza la velocidad
aumenta 0.0863mph.

Automvil deportivo y GT Velocidad Y Y-Y (Y-Y)2


Y- )2
(Y-
en de
milla (mph)
Accura Integra Type R 90.7 90.78594 -0.08594 0.00738568 -6.93125 48.0422266
Accura NSX-T 108.0 105.838232 2.161768 4.67324089 10.36875 107.510977
BMW Z3 2.8 93.2 91.7579 1.4421 2.07965241 -4.43125 19.6359766
Chevrolet Camaro Z28 103.2 99.74406 3.45594 11.9435213 5.56875 31.0109766
Chevrolet Corvette 102.1 105.940876 -3.840876 14.7523284 4.46875 19.9697266
Convertible
Dodge Viper RT/10 116.2 116.996768 -0.796768 0.63483925 18.56875 344.798477
Ford Mustang GT 91.7 92.7941 -1.0941 1.19705481 -5.93125 35.1797266
Honda Prelude Type SH 89.7 90.647028 -0.947028 0.89686203 -7.93125 62.9047266
Mercedes-Benz CLK320 93.0 94.189252 -1.189252 1.41432032 -4.63125 21.4484766
Mercedes-Benz SLK230 92.3 91.497748 0.802252 0.64360827 -5.33125 28.4222266
Mitsubishi 3000GT VR-4 99.0 103.215672 -4.215672 17.7718904 1.36875 1.87347656
Nissan 240SX SE 84.6 87.166164 -2.566164 6.58519767 -13.03125 169.813477
Pontiac Firebird Trans 103.2 100.03658 3.16342 10.0072261 5.56875 31.0109766
Am
Porsche Boxster 93.2 93.29134 -0.09134 0.008343 -4.43125 19.6359766
Toyota Supra Turbo 105.0 102.675856 2.324144 5.40164533 7.36875 54.2984766
Volvo C70 97.0 95.57228 1.42772 2.0383844 -0.63125 0.39847656
Total 1562.1 1562.1498 -0.049796 80.0555003 9.9476E-14 995.954375

Facultad de Ingeniera Industrial Pgina 52


EJERCICIOS DE LABORATORIO

Tabla ANOVA
Fuente Gl SS MS F
Regresin 3 915.8989 305.2996 45.7632
Error 16-(3+1)=12 80.0555 6.6713
Total 15 995.9544

b) Coeficiente de determinacin mltiple:

2
915.8989
.123 = = = 0.9196
995.9544
Este coeficiente de determinacin mltiple, calculado como 0.9196, puede
interpretarse diciendo que, de la muestra, 91.96% de la variacin en la velocidad
para de milla puede ser explicada por la variacin en el peso , por la variacin del
precio y por la variacin en los caballo de fuerza.

c) Coeficiente r2 ajustado:
1 161
2 = 1 (1 2 ) = 1 (1 0.9196) =0.8995
(+1) 16(3+1)

En consecuencia, 90% de la variacin en la velocidad por de milla puede ser


explicada por nuestro modelo de regresin mltiple: ajustado para el nmero de
variables de prediccin y el tamao de muestra.

d) Matriz de correlacin:
Precio Peso en Caballos de Velocidad en de
(miles de $) vaco (lb) fuerza (lb) milla (mph)
Precio (miles de $) 1
0.10444597
Peso en vaco (lb) 1 1
Caballos de fuerza 0.48161151
(lb) 5 0.665777 1
Velocidad en de 0.63878048 0.5578625
milla (mph) 1 58 0.934326319 1

En la tabla podemos observar que la correlacin entre la cantidad de Velocidad en


de milla (mph) y Caballos de fuerza (lb) es de 0.934326319, lo cual indica que
existe una fuerte asociacin negativa entre las variables. Tambin podemos

Facultad de Ingeniera Industrial Pgina 53


EJERCICIOS DE LABORATORIO

observar que la correlacin entre la Velocidad en de milla (mph) y el Peso en


vaco (lb) es de 0.557862558, lo cual indica que existe una correlacin moderada
entre estas variables. Adems, observamos tambin que virtualmente no existe
correlacin alguna (0.10444) entre las dos variables explicativas, Precio (miles de
$) y el Peso en vaco (lb). Finalmente, podemos observar que los coeficientes de
correlacin situados en la diagonal principal de la matriz tienen valor de 1.0, puesto
que habr una correlacin perfecta entre la variable y ella misma.

e) Graficas de residuos para velocidad en de milla

La ultima grfica de residuos sirve para examinar el patrn de residuos para los
valores predichos de Y. Si los residuos estandarizados parecen variar para
diferentes niveles del valor predicho de Y, esto nos proporciona evidencia de un
posible efecto curvilneo en al menos una variable explicativa y/o de la necesidad
de transformar la variable dependiente. La primera, segunda y tercera grficas
de residuos implican a las variables explicativas. La aparicin de patrones en la
grfica de los residuos estandarizados contra una variable explicativa puede ser
una indicacin de la existencia de un efecto curvilneo y, por consiguiente, nos
llevara a la posible transformacin de dicha variable independiente. En estas
figuras podemos observar que parece haber un patrn muy pequeo o no
haberlo en la relacin entre los residuos estandarizados y cualquiera de los
valores predichos de Y, X1, X2 o X3. As pues, podemos llegar a la conclusin de
que el modelo de regresin lineal mltiple es apropiado para predecir velocidad
para de milla.
f) Prueba de la Importancia de la Relacin entre la Variable Dependiente y las
Variables Explicativas
H 0 : 1 2 3 0 (No existe relacin lineal entre la variable
dependiente y las variables explicativas).
H1 : Al menos una j 0 (Al menos un coeficiente de regresin no es igual
a cero)
Esta hiptesis nula puede probarse utilizando una prueba F.

La regla de decisin es:

Rechace H0 al nivel de significacin si F FU ( p , n p 1) ; en cualquier


otro caso, no rechace H0.
Para los datos correspondientes al problema de la velocidad por de milla,
presentado en la Tabla Anova, es:

Facultad de Ingeniera Industrial Pgina 54


EJERCICIOS DE LABORATORIO

305.2996
= = = 45.7632
6.6713
Si se elige un nivel de significacin de 0.05, determinamos que el valor crtico
en la distribucin F (con 3 y 12 grados de libertad) es 3.49. Puesto que F = 45.7632
> FU(2,12)= 3.49, podemos rechazar H0 y llegar a la conclusin de que al menos una
de las variables explicativas (precio, peso, caballos de fuerza) est relacionada con
la velocidad para de milla.

g) Error estndar multiple:

80.0555
.123 = = = 2.5829
( + 1) 16 (3 + 1)

h) Inferencias Relativas a los Coeficientes de Regresin de Poblacin:

Para probar la hiptesis de que la pendiente de poblacin k , es cero, para la


regresin mltiple se utiliza la ecuacin siguiente:
1 0
=
1

Por ejemplo para la variable precio:


0.00010445 0
= = 2.4206
0.00004315

F crtico: 2.179
Tenemos que 2.4206> 2.179 por lo tanto no se rechaza Ho. Y llegamos a la
conclusin de que existe una relacin significativa entre la variable X1 (precio) y la
velocidad, tomando en cuenta las otras variables.

i) Estimacin del Intervalo de Confianza


Por ejemplo, si deseramos obtener una estimacin de intervalo de confianza
de 95% de la pendiente de poblacin, 1 (esto es, el efecto del precio, X1, sobre
la velocidad, Y, dejando constante X2 y X3), tendramos, la ecuacin:

Facultad de Ingeniera Industrial Pgina 55


EJERCICIOS DE LABORATORIO

b1 t12 S b1

Como el valor crtico de t al nivel de confianza de 95%, con 12 grados de libertad,


es 2.1788, tenemos:

0.000104 (2.179)(0.00004315)
0.000104 0.000009402
0.000094598 1 0.0001134

Facultad de Ingeniera Industrial Pgina 56


EJERCICIOS DE LABORATORIO

PROBLEMA

La siguiente Tabla contiene 25 observaciones por ao de estas variables.


Utilizaremos estos datos para desarrollar un modelo lineal que prediga el margen
anual de beneficios en funcin de los ingresos por dlar depositado y del nmero
de oficinas.

Ao Ingreso por Nmero de Margen de


dlar Oficinas beneficios
1 3.92 7298 0.75
2 3.61 6855 0.71
3 3.32 6636 0.66
4 3.07 6506 0.7
5 3.06 6450 0.61
6 3.11 6402 0.72
7 3.21 6368 0.77
8 3.26 6340 0.74
9 3.42 6349 0.90
10 3.42 6352 0.82
11 3.42 6352 0.75
12 3.45 6364 0.77
13 3.58 6546 0.78
14 3.66 6672 0.84
15 3.78 6890 0.79
16 3.82 7115 0.79
17 4.07 7234 0.70
18 3.97 7931 0.68
19 4.70 8097 0.55
20 4.96 8468 0.63
21 4.58 8717 0.56
22 4.69 8991 0.41
23 4.71 9179 0.47

Facultad de Ingeniera Industrial Pgina 57


EJERCICIOS DE LABORATORIO

24 4.78 9318 0.32


25 3.72 6352 0.72

k) Construir el diagrama de dispersin.


l) Calcular b0 y b1, b2.
m) Interpretar b0 y b1, b2.
n) Predecir para un valor particular.
o) Calcular el error estndar mltiple de estimacin.
p) Calcular el coeficiente de determinacin mltiple 2 .
q) Calcular el coeficiente de determinacin mltiple .
r) Haga un anlisis residual.
s) Cree un intervalo de confianza.
t) Cree un intervalo de prediccin.
SOLUCIN:

a) Diagramas de dispersin

Scatterplot of Margen de beneficios vs Numero de oficinas

0,9

0,8
Margen de beneficios

0,7

0,6

0,5

0,4

0,3
6000 6500 7000 7500 8000 8500 9000 9500
Numero de oficinas

b) Calcular b0 y b1, b2.


De los datos obtenemos los la ecuacin de la regresin mltiple:

Facultad de Ingeniera Industrial Pgina 58


EJERCICIOS DE LABORATORIO

Regression Analysis: Margen de be versus Ingreso por ; Numero de of

The regression equation is


Margen de beneficios = 1,51 + 0,148 Ingreso por dolar
- 0,000194 Numero de oficinas

Predictor Coef SE Coef T P


Constant 1,5143 0,1010 14,99 0,000
Ingreso por dolar 0,14849 0,06397 2,32 0,030
Numero de oficinas -0,00019395 0,00003756 -5,16 0,000

S = 0,0691125 R-Sq = 76,5% R-Sq(adj) = 74,4%

Analysis of Variance

Source DF SS MS F P
Regression 2 0,34213 0,17107 35,81 0,000
Residual Error 22 0,10508 0,00478
Total 24 0,44722

Source DF Seq SS
Ingreso por dolar 1 0,21475
Numero de oficinas 1 0,12738

Y cuyos coeficientes son los siguientes:

0 = 1.51 =>Representa el punto de interseccin con el eje Y.

1 = 0.148 => Representa la pendiente entre el eje Y y la variable nmero de


oficinas.

2 = 0.000194 => Representa la pendiente entre el eje Y y la variable ingreso


por dlar.

Y con respecto a al valor de los errores estandarizados se puede concluir que los
errores son mnimos, es decir es un buen ajuste.

Facultad de Ingeniera Industrial Pgina 59


EJERCICIOS DE LABORATORIO

La ecuacin de regresin mltiple es:


= 1.51 + 0.1481 0.0001942

c) Interpretar b0 y b1, b2.


El valor de b0=1.51. Este es el punto donde la ecuacin de regresin cruza el
eje Y. Si 1 = 0 y 2 = 0, el margen de beneficios ser 1.51.
El valor de b1= 0.148, quiere decir que por cada aumento del ingreso por dlar,
el margen de beneficios aumentar en 0.148, es decir que por cada 10 ingresos,
aumentar 1.48 el margen de beneficios.
El valor de b2 = -0.000194. Primero, es negativo, de manera que por cada grado
de aumento del numero de oficinas, el margen de beneficios disminuir en
0.000194.
d) Predecir para un valor particular.
Tomamos 1 = 3.50, 2 = 6400.
= 1.51 + 0.148(3.50) 0.000194(6400) = 0.7864
Esto quiere decir, que si el ingreso por dlar es 3.50, y el numero de oficinas es
6400, se obtendr un margen de beneficios de 0.7864.
e) Calcular el error estndar mltiple de estimacin.
Ao Ingreso Numero de Margen Y Desviacin Desviacin
por Oficinas de Calculado (Y-Y) (Y-Y)^2
dlar beneficio
s
(Y)
1 3.92 7298 0.75 0.0053027
0.674348 0.075652 5
2 3.61 6855 0.71 0.0991695
0.71441 -0.00441 7
3 3.32 6636 0.66 0.1743513
0.713976 -0.053976 4
4 3.07 6506 0.7 0.0199329
0.702196 -0.002196 2
5 3.06 6450 0.61 0.0334385
0.71158 0.10158 1
6 3.11 6402 0.72 0.0000687
0.728292 -0.008292 57
7 3.21 6368 0.77 0.0004125
0.749688 0.020312 77
8 3.26 6340 0.74 0.0005071
0.76252 -0.02252 5

Facultad de Ingeniera Industrial Pgina 60


EJERCICIOS DE LABORATORIO

9 3.42 6349 0.90 0.0131528


0.784454 0.115546 8
10 3.42 6352 0.82 0.0013052
0.783872 0.036128 32
11 3.42 6352 0.75 0.0011473
0.783872 -0.033872 12
12 3.45 6364 0.77 0.0002554
0.785984 -0.015984 88
13 3.58 6546 0.78 0.0001016
0.769916 0.010084 87
14 3.66 6672 0.84 0.0068273
0.757312 0.082688 86
15 3.78 6890 0.79 0.0032741
0.73278 0.05722 28
16 3.82 7115 0.79 0.0090155
0.69505 0.09495 02
17 4.07 7234 0.70 0.0000803
0.708964 -0.008964 53
18 3.97 7931 0.68 0.0146540
0.558946 0.121054 70
19 4.70 8097 0.55 0.0071879
0.634782 -0.084782 87
20 4.96 8468 0.63 0.0008243
0.601288 0.028712 78
21 4.58 8717 0.56 0.0040015
0.496742 0.063258 74
22 4.69 8991 0.41 0.0024866
0.459866 -0.049866 17
23 4.71 9179 0.47 0.0019049
0.426354 0.043646 73
24 4.78 9318 0.32 0.0080548
0.409748 -0.089749 83
25 3.72 6352 0.72
0.828272 -0.108277 0.0117239

( )2 0.419181924
.12 = = = 0.1380352267
( + 1) 25 (2 + 1)

f) Calcular el coeficiente determinacin mltiple .

Facultad de Ingeniera Industrial Pgina 61


EJERCICIOS DE LABORATORIO

0.34213
2 = = = 0.765
0.44722
g) Calcular el coeficiente determinacin mltiple
= 2 = 0.765 = 0.87464

h) Haga un anlisis residual.

Facultad de Ingeniera Industrial Pgina 62


EJERCICIOS DE LABORATORIO

i) Cree un intervalo de confianza y un intervalo de prediccin.

Deseamos predecir cul ser mi margen de beneficios, cuando mi ingreso por


dlar es 5.00 y el nmero de oficinas es 5000.

Nos da como intervalo de confianza (0.9633, 1.6108), por ello De los datos arrojados
por el programa podemos concluir que mi margen de beneficios oscila entre 0.9633
y 1.6108. Como intervalo de prediccin tenemos (0.930,1.6411).

PROBLEMAS UTILIZANDO LA DISTRIBUCIN JI CUADRADO PARA TABLAS DE


CONTINGENCIA

1.- La ventaja de ser un equipo local es independiente del deporte? Se


reunieron datos del equipo ganador en diferentes deportes, con los resultados que
se presentan en la tabla adjunta. Utilice un nivel de significancia de 0.10 para probar
la aseveracin de que los triunfos de equipos locales y de visitantes son
independientes del tipo de deporte. De los cuatro deportes incluidos aqu, el bisbol
es el nico en el cual el equipo local puede modificar las dimensiones del campo a
favor de sus propios jugadores. Parece que los equipos de bisbol son eficientes
al utilizar esta ventaja?

Facultad de Ingeniera Industrial Pgina 63


EJERCICIOS DE LABORATORIO

Bsquetbol Bisbol Hockey Ftbol


Triunfos del equipo local 127 53 50 57
Triunfos del equipo 71 47 43 42
visitante

Segn datos de Predicting Professional Sports Game Outcomes from Intermediate


Game Scores, de Cooper, DeNeve y Mosteller, Chance, vol. 5, nm. 3-4.

Solucin:

Paso 1: Se establecen las hiptesis


Ho: Los triunfos de equipos locales y de visitantes son independientes del tipo de
deporte.
H1: los triunfos de equipos locales y de visitantes son dependientes del tipo de
deporte.

Paso 2: Se selecciona el nivel de significancia:


El nivel de significancia es de 0.10

Paso 3: Se escoge el estadstico de prueba


El estadstico de prueba es la distribucin ji cuadrada (X2 ).

2
( )2
= [ ]

Con (r-1)*(c-1) grados de libertad

Paso 4: Se formula la regla de decisin:


El valor crtico es 2 = 6.251 y se encuentra en la tabla de valores crticos de ji
cuadrada, observando que el nivel de significancia = 0.10 en la cola derecha y que
el nmero de grados de libertad est dado por(r -1)(c -1) =(2 -1)(4- 1) = 3.

Facultad de Ingeniera Industrial Pgina 64


EJERCICIOS DE LABORATORIO

En consecuencia la regla de decisin es: Se rechaza Ho si el valor calculado 2 es


mayor que 6.251.

Paso 5: se calcula el valor de ji cuadrada y se toma una decisin:

Bsquetbol Bisbol Hockey Ftbol Total


Triunfos del equipo 127 53 50 57 287
local
Triunfos del equipo 71 47 43 42 203
visitante
Total 198 100 93 99 490

Se calcula frecuencia esperada


( )( )
=

Bsquetbol Bisbol Hockey Ftbol Total


Fo Fe Fo Fe Fo Fe Fo Fe
Triunfos 127 115.97 53 58.57 50 54.47 57 57.99 287
del equipo
local
Triunfos 71 82.03 47 41.43 43 38.53 42 41.01 203
del equipo
visitante
Total 198 198 100 100 93 93 99 99 490

Usando:
( )2
2 = [ ]

Facultad de Ingeniera Industrial Pgina 65


EJERCICIOS DE LABORATORIO

(127 115.97)2 (53 58.57)2 (50 54.47)2 (57 57.99)2


2 = + + +
115.97 58.57 54.47 57.99
(71 82.03)2 (47 41.43)2 (43 38.53)2 (42 41.01)2
+ + + +
82.03 41.43 38.53 41.01
= 4.7369
Puesto que el valor calculado de ji cuadrada es 4.7369 es menor que 6.251, se
encuentra en la regin ubicada a la izquierda del valor critico no se rechaza Ho. Y
se concluye que los triunfos de equipos locales y de visitantes son independientes
del tipo de deporte.
Los equipos de bisbol no son eficientes al utilizar la ventaja de modificar las
dimensiones del campo a favor de sus propios jugadores.

Chi-Square Test: Bsquetbol, Bisbol, Hockey, Ftbol

Expected counts are printed below observed counts


Chi-Square contributions are printed below expected counts

Bsquetbol Bisbol Hockey Ftbol Total


1 127 53 50 57 287
115.97 58.57 54.47 57.99
1.049 0.530 0.367 0.017

2 71 47 43 42 203
82.03 41.43 38.53 41.01
1.483 0.749 0.519 0.024

Total 198 100 93 99 490

Chi-Sq = 4.737, DF = 3, P-Value = 0.192

2.- PROBLEMA
Se realiz una encuesta por parte de una sucursal, situada en Canad, de una
cadena de que opera a nivel nacional oficinas de corretaje inmobiliario, con el
propsito de conseguir un perfil de las casas de una sola familia en algunas
comunidades vecinas. Se desea saber si existe una alguna relacin entre el estilo
arquitectnico y la localizacin geogrfica. Utilizando los archivos de un Censo
canadiense, se selecciona una muestra de 233 casas de una sola familia y se
obtiene un registro de una direccin para cada combinacin de estilo arquitectnico
y localizacin geogrfica. La tabla de contingencia de 5x3 se presenta a
continuacin:

Facultad de Ingeniera Industrial Pgina 66


EJERCICIOS DE LABORATORIO

Estilo Localizacin Geogrfica


East Farmingdale Lewittown
Meadow
Casa de campo 31 14 52
Rancho ampliado 2 1 12
Colonial 6 8 9
Rancho 16 20 24
Niveles divididos 19 17 2

SOLUCIN

Estilo Localizacin Geogrfica


East Meadow Farmingdale Lewittown Totales
Casa de campo 31 14 52 97
Rancho 2 1 12 15
ampliado
Colonial 6 8 9 23
Rancho 16 20 24 60
Niveles 19 17 2 38
divididos
Total 74 60 99 233

Se seguir el mismo procedimiento sistemtico de cinco pasos para prueba de


hiptesis, seguido en los captulos anteriores.

Paso 1: Se establece las hiptesis nula y alternativa.

: No existe relacin entre el estilo arquitectnico y la localizacin geogrfica.


: Existe relacin entre el estilo arquitectnico y la localizacin geogrfica.
Paso 2: Se establece el nivel de significancia:

Facultad de Ingeniera Industrial Pgina 67


EJERCICIOS DE LABORATORIO

= 0.05

Paso 3: Se escoje el estadstico de prueba. El estadstico de prueba es la


distribucin chi cuadrada, que se denota por 2 .

Paso 4: Se formula la regla de decisin.

Hallamos los grados de libertad: ( 1)( 1) = (5 1)(3 1) = 8

2 (0.05,8) = 15.507.

As que la regla de decisin dice que: Se rechaza la , si el valor estadstico es


mayor a 15.507.

Paso 5: Calculamos estadstico de prueba, Resultados, toma de decisin.

Calculamos el estadstico de prueba chi-cuadrada.

( ) ( ) /
31 30.8 +0.2 0.04 0.00013
14 25 -11 121 4.84
52 41.2 +10.8 116.64 2.8311
2 4.8 -2.8 7.84 1.6333
1 3.9 -2.9 8.41 2.1564
12 6.4 +5.6 31.36 4.9
6 7.3 -1.3 1.69 2.3151
8 5.9 +2.1 4.41 0.7475
9 9.8 -0.8 0.64 0.0653
16 19.1 -3.1 9.61 0.5031
20 15.5 +4.5 20.25 1.3065
24 25.5 -1.5 2.25 0.0882
19 12.1 +6.9 47.61 3.9347
17 9.8 +7.2 51.84 5.2898
2 16.1 -14.1 198.81 12.3484
-- -- -- -- 40.975

Facultad de Ingeniera Industrial Pgina 68


EJERCICIOS DE LABORATORIO

CONCLUSION: Vemos que el valor estadstico X2 (0.05,8) = 40.975, es mayor


que el valor crtico 15.507, por lo tanto se rechaza la hiptesis nula.
(Resulta: 40.975 > 15.507)
Es decir, s existe relacin entre el estilo arquitectnico y la localizacin
geogrfica.

Facultad de Ingeniera Industrial Pgina 69


EJERCICIOS DE LABORATORIO

PROBLEMAS UTILIZANDO METODOS NO PARAMETRICOS


PRUEBA DEL SIGNO

PROBLEMA

Una gran cadena de tiendas departa La direccin de una empresa recomend


realizar una capacitacin de computacin en planta para los gerentes, con el
objeto de mejorar su conocimiento, en contabilidad, mantenimiento, produccin y
otras operaciones. Se eligi al azar una muestra de 15 gerentes. El nivel general
de capacidad de cada uno en cunto a la tcnica computacional lo determino un
grupo de expertos antes de que principiara el programa. Su capacidad y
comprensin se evaluaron como sobresalientes, excelentes, buenas, aceptables
o deficientes. Despus del programa de entrenamiento de tres meses, el mismo
grupo de expertos en computacin evalu de nuevo a cada gerente. Las dos
evaluaciones antes y despus se indican junto con el signo de la diferencia. El
signo + indica mejora, y el signo - seala que la capacidad computacional declin
despus del programa de entrenamiento.

NOMBRE ANTES DESPUES DIFERENCIA


Jos Bueno Sobresaliente +
Omar Aceptable Excelente +
Modesto Excelente Bueno -
Miguel Deficiente Bueno +
Wilson Excelente Excelente 0
Edwin Bueno Sobresaliente +
Pedro Deficiente Aceptable +
Luis Excelente Sobresaliente +
Josu Bueno Deficiente -
Bruno Deficiente Bueno +
David Bueno Sobresaliente +
washignton Aceptable Excelente +
Steve Bueno Aceptable -
Rolando Bueno Sobresaliente +
Santiago Deficiente Bueno -

Facultad de Ingeniera Industrial Pgina 70


EJERCICIOS DE LABORATORIO

Se tiene inters en determinar si dicho programa de entrenamiento en planta fue efectivo


para mejorar la capacidad de los gerentes en materia de computacin. Con un nivel de
significancia de 0.10 Tales funcionarios son ms aptos despus de tomar el programa de
capacitacin, que antes?

Solucin:
1) H0 : p = 0.5 (no hay cambio en la capacidad como resultado de la capacitacin)
Ha: p > 0.5 (se increment la capacidad como resultado de la capacitacin)
2) = 0.1
3) prueba binomial

NUMERO DE EXITOS PROBABILIDAD DE EXITO PROBABILIDAD


ACUMULADA
0 0.000 1.000
1 0.001 0.999
2 0.006 0.998
3 0.022 0.992
4 0.061 0.970
5 0.122 0.909
6 0.183 0.787
7 0.209 0.604
8 0.183 0.395
9 0.122 0.212
10 0.061 0.090
11 0.022 0.029
12 0.006 0.007
13 0.001 0.001
14 0.000 0.000

4) RA: < 2 10 >


RC: [10 12]
5) Cantidad de signos + = 10
Como 10 pertenece a la RC Rechazo la HO y acepto la Ha.

Interpretacin:
Se increment la capacidad como resultado de la capacitacin.

Facultad de Ingeniera Industrial Pgina 71


EJERCICIOS DE LABORATORIO

PROBLEMAS

mentales, Cornwall & Hudson, desea vender solo una marca de reproductor de
discos compactos de alta calidad. La lista de equipos reproductores de CDs se ha
reducido a dos marcas: Sony y Pioneer. Para ayudar en la toma de decisin, se
reuni a un grupo de 16 expertos en audio. Se hizo la reproduccin de un pasaje
musical usando componentes Sony (marcados A). Despus se reprodujo el mismo
pasaje utilizando componentes Pioneer (marcados B). Un signo + en la tabla
siguiente indica la preferencia de una persona por los componentes Sony, y un signo
- seala predileccin por Pioneer, y un 0 significa que no hay preferencia.

Experto
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
+ - + - + + - 0 - + - + + - + -

Realice una prueba de hiptesis al nivel de significancia 0.10 para determinar si hay
diferencia en la preferencia entre las dos marcas.

Solucin:

Si p indica la proporcin de la poblacin de expertos en audio que favorecen a Sony,


se trata de probar los siguientes supuestos:

0 : = 0.50
1 : 0.50
Si no se puede rechazar Ho no tendremos pruebas que indiquen que hay
preferencia hacia una marca. Sin embargo, si se puede rechazar Ho, podremos
concluir que las preferencias de los expertos en audio son distintas hacia las dos
marcas. En este caso, la marca que seleccione la mayor cantidad de expertos en
audio ser la ms preferida.

Como podemos observar el experto en audio 8 no expreso su preferencia por lo


tanto eliminamos su observacin reducindose el nmero de muestra a 15.

Con un tamao de muestra n = 15, las probabilidades de la binomial con p = 0.50


son las que aparecen en la siguiente tabla:

Experto Probabilidad
0 0.000031
1 0.000458
2 0.003204
3 0.013885
4 0.041656

Facultad de Ingeniera Industrial Pgina 72


EJERCICIOS DE LABORATORIO

5 0.091644
6 0.152740
7 0.196381
8 0.196381
9 0.152740
10 0.091644
11 0.041656
12 0.013885
13 0.003204
14 0.000458
15 0.000031

= 0.10, tendramos una regin de rechazo cuya rea aproximada fuera 0.05 en
cada extremo de la distribucin. Si iniciamos en el extremo inferior de la distribucin,
vemos que la probabilidad de obtener cero, uno, dos o tres signos positivos es
0.000031 + 0.000458 + 0.003204 + 0.013885 = 0.017578, que es menor que 0.05.
En consecuencia, adoptaremos la siguiente regla de rechazo:
Rechazar H0 si el nmero de signos positivos es menor que 4 o mayor que 11.

Como se han observado 8 signos positivos, no se rechaza la hiptesis nula. No hay


preferencia con respecto a las dos marcas de componentes.
Test and CI for One Proportion: datos

Test of p = 0.5 vs p not = 0.5

Event = 1

Variable X N Sample p 90% CI Z-Value P-Value


datos 8 15 0.533333 (0.321456, 0.745211) 0.26 0.796

Using the normal approximation.

Usando el Minitab el valor de p es 0.796 el cual es mayor al nivel de significancia


= 0.10 por lo tanto no se rechaza la hiptesis nula. No hay preferencia con
respecto a las dos marcas de componentes.

Facultad de Ingeniera Industrial Pgina 73


EJERCICIOS DE LABORATORIO

PRUEBA DE RANGO CON SIGNO DE WILCOXON

PROBLEMA

Uno de los principales fabricantes de autos est estudiando el rendimiento de la


gasolina comn (Gas C) contra el de la gasolina de alto octanaje (Gas AO) en sus
autos econmicos. Se seleccionaron diez ejecutivos y se les pidi que llevaran un
registro del nmero de millas recorridas por galn de gasolina. Los resultados son
los siguientes:

Millas por Galn


Ejecutivo Gas C Gas AO
Pastrana 25 28
Roman 33 31
Prado 31 35
Vargas 45 44
Calderon 42 47
Valdivia 38 40
Morn 29 29
Olrtiga 42 37
Rojas 41 44
Quiroga 30 44

Al nivel de significancia 0.05, existe diferencia en el nmero de millas recorridas por


galn entre gasolina comn y la gasolina de alto octanaje?

Solucin:
1. Planteamos la hiptesis nula y la hiptesis alternativa

Ho: No existe diferencia en el nmero de millas recorridas por galn


entre la gasolina comn y la gasolina de alto octanaje

Ha: Existe diferencia en el nmero de millas recorridas por galn


entre la gasolina comn y la gasolina de alto octanaje

2. Determinar el nivel de significancia

= 0.05
3. Identificar el estadstico de prueba

Facultad de Ingeniera Industrial Pgina 74


EJERCICIOS DE LABORATORIO

4. Regla de decisin
5.

ZK

6. Calculamos el estadstico

(+1)(2+1)
=

= 0 = 6

Retornar
Ejecutivo Gas C Gas AC Diferencia V.A Rango
Signo
Pastrana 25 28 -3 3 4.5 -4.5
Roman 33 31 2 2 2.5 2.5
Prado 31 35 -4 4 6 -6
Vargas 45 44 1 1 1 1
Caldern 42 47 -5 5 7.5 -7.5
Valdivia 38 40 -2 2 2.5 -2.5
Morn 29 29 0 0 - -
Olrtiga 42 37 5 5 7.5 7.5
Rojas 41 44 -3 3 4.5 -4.5
Quiroga 30 44 -14 14 9 -9
T = -23

Hay un ejecutivo que no registra diferencia, por lo tanto:


n = 10 1 = 9

n(n+1)(2n+1) 9(10)(19)
t = = = 16.88
6 6

Facultad de Ingeniera Industrial Pgina 75


EJERCICIOS DE LABORATORIO

T t 23 0
Z= = = 1.36
t 16.88

Zk = -1.36

ZK RA Acepto HO y rechazo la Ha

Interpretacin:
No existe diferencia en el nmero de millas recorridas por galn entre la gasolina comn
y la gasolina de alto octanaje, por lo tanto, se obtiene el mismo rendimiento con ambas
clases de gasolina.

EJERCICIO 2

Como parte de una investigacin de mercado que tena por objeto evaluar la
efectividad de una campaa de publicidad, se seleccionaron 10 ciudades para una
prueba de mercado. Las ventas en dlares en cada una de estas ciudades, en la
semana anterior a la campaa, se registraron. Despus, se realiz la campaa
durante dos semanas y se registraron las ventas que hubo en la primera semana,
inmediatamente despus de la campaa.

Ciudad Ventas antes de la Ventas despus de la


campaa campaa
Kansas City 130 160
Dayton 100 105
Cincinnati 120 140
Columbus 95 90
Cleveland 140 130
Indianapolis 80 82
Louisville 65 55
St. Louis 90 105
Pittsburgh 140 152
Peoria 125 140

Use = 0.05. A qu conclusin llega acerca del valor de la campaa?

Facultad de Ingeniera Industrial Pgina 76


EJERCICIOS DE LABORATORIO

Solucin:

De hecho, tenemos dos poblaciones de ventas, una asociada con cada mtodo. Se
probarn los siguientes supuestos:
H0: las poblaciones son idnticas
H0: las poblaciones no son idnticas
Si no se puede rechazar H0, no tendremos evidencia para concluir que las ventas
difieren cuando se aplica la campaa o cuando no. Sin embargo, si se puede
rechazar H0, llegamos a la conclusin de que las poblaciones difieren en sus ventas.

Ciudad Ventas antes Ventas Diferencias Valor


de la despus de la Absoluto
campaa campaa Diferencias
Kansas City 130 160 -30 30
Dayton 100 105 -5 5
Cincinnati 120 140 -20 20
Columbus 95 90 5 5
Cleveland 140 130 10 10
Indianapolis 80 82 -2 2
Louisville 65 55 10 10
St. Louis 90 105 -15 15
Pittsburgh 140 152 -12 12
Peoria 125 140 -15 15

Ciudad Diferencias Valor Absoluto Lugar Rango con


Diferencias (Rango) signo
Kansas City -30 30 10 -10
Dayton -5 5 2.5 -2.5
Cincinnati -20 20 9 -9
Columbus 5 5 2.5 2.5
Cleveland 10 10 4.5 4.5
Indianapolis -2 2 1 -1
Louisville 10 10 4.5 4.5
St. Louis -15 15 7.5 -7.5
Pittsburgh -12 12 6 -6
Peoria -15 15 7.5 -7.5
Suma -32

En el ejemplo, tenemos n = 10. As, al aplicar la frmula, obtenemos:

n (n 1) (2n 1) 10 (11) (21)


T 19.62
6 6

El valor del estadstico de prueba z es:

T T 32 0
z 1.63
T 19.62
Facultad de Ingeniera Industrial Pgina 77
EJERCICIOS DE LABORATORIO

Al probar la hiptesis nula, que consiste en la ausencia de diferencia, con un nivel


de significancia = 0.05
Se rechaza H0 si z < - 1.96, o si z > 1.96. Como tenemos el valor z = -1.63, no
rechazamos H0 y llegamos a la conclusin de que las dos poblaciones son idnticas.
Con z = -1.63 el valor p es 2(0.5000 0.4484) = 0.1032.

Wilcoxon Signed Rank Test: Diferencias

Test of median = 0.000000 versus median not = 0.000000

N for Wilcoxon Estimated


N Test Statistic P Median
Diferencias 10 10 11.5 0.114 -7.500

Con el valor de p hallado por medio de Minitab, no rechazamos H0 y llegamos a la


conclusin de que las dos poblaciones son idnticas, ya que 0.114 > 0.05.

PRUEBA DE MANN-WHITNEY-WILCOXON

PROBLEMA 1

Se realiz un estudio para analizar la frecuencia del pulso en dos grupos de


personas de edades diferentes, El procesamiento consiste en medir el pulso de las
personas despus de haber hecho diez minutos de ejercicios aerbicos.
Los datos recopilados muestran:
A B
140 130
135 166
150 128
140 126
144 140
154 136
160 132
144 128
136 124
148

Tuvieron diferencias significativas las frecuencias de pulso de ambos grupos (=0.05)?

Facultad de Ingeniera Industrial Pgina 78


EJERCICIOS DE LABORATORIO

Solucin:
1. H0: las distribuciones de frecuencias de pulso de los grupos A y B son iguales

Ha: las distribuciones de frecuencias de pulso de los grupos A y B no son iguales

2. =0.05
3. M.W.W
4. Grafica
5. Calculamos el estadstico:
A B
140 11 130 5
135 7 166 19
150 16 128 3.5
140 11 126 2
144 13.5 140 11
154 17 136 8.5
160 18 132 6
144 13.5 128 3.5
136 8.5 124 1
148 15 Suma 59.5
suma 130.5
= 1(1 + 2 + 1)

Tl=76

Facultad de Ingeniera Industrial Pgina 79


EJERCICIOS DE LABORATORIO

Reemplazando en la frmula: = 10 (10 + 9 + 1) 79 = 124

Tu<130.5 y Tu>59.5 Tu Ra

Usando Minitab:

Interpretacin:
Aceptamos la hiptesis nula y rechazamos la hiptesis alternativa.
Entonces aceptamos que distribuciones de frecuencias de pulso de los grupos A y B no
son iguales, despus de haber realizado 10 minutos de ejercicios aerbicos.

Facultad de Ingeniera Industrial Pgina 80


EJERCICIOS DE LABORATORIO

PROBLEMA 2

Los hornos de microondas de una determinada marca se venden en Dallas y en


San Antonio. Los precios se presentan a continuacin. Use = 0.05 y pruebe si los
precios en Dallas y en San Antonio son los mismos.

Dallas San Antonio


445 460
489 451
405 435
485 479
439 475
449 445
436 429
420 434
430 410
405 422
425
459
430

Solucin:

H0: las dos poblaciones son idnticas.


H1: las dos poblaciones no son idnticas.

Dallas Lugar San Antonio Lugar


445 14.5 460 19
489 23 451 17
405 1.5 435 11
485 22 479 21
439 13 475 20
449 16 445 14.5
436 12 429 7
420 4 434 10
430 8.5 410 3
405 1.5 422 5
425 6
459 18
430 8.5
Suma 116 Suma 160

Usaremos Dallas. As, para este ejemplo, T = 116

Facultad de Ingeniera Industrial Pgina 81


EJERCICIOS DE LABORATORIO

Como los tamaos de la muestra son n1 = 10 y n2 = 13, podemos emplear


la aproximacin normal a la distribucin T de la suma de rangos en las muestras.
La distribucin muestral adecuada se expresa como sigue:

T (1/ 2) (n1 (n1 n2 1)) (1/ 2)( 10 (10 13 1)) 120

T 1/12 n1 n2 (n1 n2 1) 1/12 (10) (13) (10 13 1) 16.12

De acuerdo con el procedimiento acostumbrado de prueba de hiptesis,


calcularemos el estadstico de prueba z . Al calcular el estadstico de prueba,
obtenemos:

T T 116 120
z 0.25
T 16.12

Con un nivel de significancia igual a 0.05, sabemos que para rechazar H0, z debe
ser menor que -1.96 o mayor que +1.96. Con z = -0.25, y el valor p 2(0.5000
0.0987) = 0.8026 mayor que = 0.05, no rechazamos H0.
Por consiguiente, concluimos que las dos poblaciones de ventas de microondas
son idnticas.

Minitab

Mann-Whitney Test and CI: Dallas, San Antonio

N Median
Dallas 10 437.50
San Antonio 13 435.00

Point estimate for ETA1-ETA2 is -4.50


95.6 Percent CI for ETA1-ETA2 is (-26.00,18.99)
W = 116.0
Test of ETA1 = ETA2 vs ETA1 not = ETA2 is significant at 0.8282
The test is significant at 0.8280 (adjusted for ties)

Con el Minitab podemos concluir de que la prueba tiene un p de 0.8282 mayo que
el nivel de significancia por lo tanto no se rechaza la hipotesis nula, las dos
poblaciones son idnticas.

Facultad de Ingeniera Industrial Pgina 82


EJERCICIOS DE LABORATORIO

PRUEBA DE KRUSKAL-WALLIS
EJERCICIO

El gerente regional del banco Financiero est interesado en el ndice de movimiento


de las cuentas personales de cheques en cuatro de los grandes bancos filiales. Se
presentan a continuacin los ndices de movimiento en las muestras seleccionadas de
las cuatro filiales bancarias. Usando el nivel 0.01, determine si hay diferencia entre los
ndices de movimiento de las cuentas personales de cheques de los cuatro bancos
filiales.
Filial 1 Filial 2 Filial 3 Filial 4
208 91 302 99
307 62 103 116
199 86 319 189
142 91 340 103
91 80 180 100
296 131

Solucin:
1. Planteamos la hiptesis nula y la hiptesis alternativa

Ho: Las distribuciones de los ndices de movimientos de las cuentas personales


de chequesde los cuatro bancos filiales son iguales.

Ha: No todas las distribuciones de los ndices de movimientos de las cuentas


personalesde cheques de los cuatro bancos filiales son iguales.

2. Determinar el nivel de significancia

= 0.01
3. Identificar el estadstico de prueba
, 2

4.Formular la regla de decisin


k=4

Facultad de Ingeniera Industrial Pgina 83


EJERCICIOS DE LABORATORIO

x2(,k-1) = x2(0.01,3) = 11.345

HK

5. Calcular el estadstico de prueba

n = 22

Filial 1 Filial 2 Filial 3 Filial 4


208 17 91 5 302 19 99 7
307 20 62 1 103 9.5 116 11
199 16 86 3 319 21 189 15
142 13 91 5 340 22 103 9.5
91 5 80 2 180 14 100 8
296 18 131 12
R1 89 R2 16 R3 85.5 R4 62.5
n1 6 n2 5 n3 5 n4 6

12 (89)2 (16)2 (85.5)2 (62.5)62


= [ + + + ] 3(22 + 1) = 13.635
22(22 + 1) 6 5 5 6

Hk = 13.635
HK RC Rechazo HO y acepto la Ha

Facultad de Ingeniera Industrial Pgina 84


EJERCICIOS DE LABORATORIO

Usando Minitab

Interpretacin:
No todos los ndices de movimientos de las cuentas personales de cheques de los
cuatro bancos filiales son iguales, hay diferencias.

EJERCICIO
Se ha registrado el tamao de los centros acogidos tres programas de experimentacin en
funcin al nmero de aulas, si el nmero de aulas de cada uno de estos centros es el que se
muestra a continuacin, se puede afirmar que el tamao no marca diferencias entre los
centros implicados en los tres programas?

Programa A Programa B Programa C


20 24 13
19 22 15
16 28 18
21 26

Facultad de Ingeniera Industrial Pgina 85


EJERCICIOS DE LABORATORIO

SOLUCIN:

1) Ho: no existe ninguna diferencia entre los k grupos


Ha: existe diferencia significativa entre los k grupos
2) Alfa=0.05
3) Kruskall wallis

4) Grfico

5) Calculo del estadstico:


Comenzamos el rangueo:

20 19 16 21 24 22 28 23 15 18 26
A A A A B B B C C C C
5 4 2 6 9 7 11 8 1 3 10

Calculamos la suma de cada


rango:
R1=17
R2=27
R3=22

12 172 262 232


= ( + + ) (3 12) = 3.0757
11(12) 4 3 4

H pertenece a la regin de aceptacin, entonces aceptamos la hiptesis nula y rechazamos


la hiptesis alternativa

Facultad de Ingeniera Industrial Pgina 86


EJERCICIOS DE LABORATORIO

Usando Minitab:

Interpretacin:
Esto quiere decir que no existen diferencias significativas entre dichos grupos.

EJERCICIO

Un alumno vive en una casa con sistema elctrico solar. A la misma hora de cada
da, rene lecturas de voltaje con un medidor conectado al sistema y los resultados
se listan en la tabla. Utilice un nivel de significancia de 0.05 y pruebe la aseveracin
de que las lecturas de voltaje tienen la misma mediana para los tres diferentes tipos
de da. Podramos esperar que un sistema solar proporcione ms energa elctrica
en das soleados que en das nublados o lluviosos. Podemos concluir que los das
soleados dan como resultado mayores cantidades de energa elctrica?

Soleado Nublado Lluvioso


13.5 12.7 12.1
13.0 12.5 12.2
13.2 12.6 12.3
13.9 12.7 11.9
13.8 13.0 11.6
14.0 13.0 12.2

Solucin:

Las hiptesis nula y alternativa son las siguientes:

Facultad de Ingeniera Industrial Pgina 87


EJERCICIOS DE LABORATORIO

H0: Las lecturas de voltaje tienen la misma mediana para los tres diferentes tipos
de da.
H1: Las lecturas de voltaje no tienen la misma mediana para los tres diferentes tipos
de da.

Soleado Rango Nublado Rango Lluvioso Rango


13.5 15 12.7 9.5 12.1 3
13.0 12 12.5 7 12.2 4.5
13.2 14 12.6 8 12.3 6
13.9 17 12.7 9.5 11.9 2
13.8 16 13.0 12 11.6 1
14.0 18 13.0 12 12.2 4.5
Suma 92 Suma 58 Suma 21

Grados de libertad= k-1=3-1=2


= 0.05
2 =5.9915

El estadstico W se calcula:
12 k
Ri2 12 (92) 2 (58) 2 (21) 2
W 3( n 1) 3(18 1) 14.75
nT (nT 1) i 1 ni
T
18(19) 6 6 6

Estadstico de prueba: H =14.75. Valor crtico: x2 = 5.991. Existe evidencia


suficiente para justificar el rechazo de la aseveracin de que las medianas de las
lecturas de voltaje son iguales en los tres tipos de das diferentes. Parece que los
das soleados dan como resultado mayores cantidades de energa.

Minitab

Kruskal-Wallis Test: voltaje versus codigo

Kruskal-Wallis Test on voltaje

codigo N Median Ave Rank Z


1 6 13.65 15.3 3.28
2 6 12.70 9.7 0.09
3 6 12.15 3.5 -3.37
Overall 18 9.5

H = 14.75 DF = 2 P = 0.001
H = 14.84 DF = 2 P = 0.001 (adjusted for ties)

Con el valor de p =0.001 menor que el nivel de significancia 0.05 podemos concluir
que existe evidencia suficiente para justificar el rechazo de la aseveracin de que
las medianas de las lecturas de voltaje son iguales en los tres tipos de das
diferentes.

Facultad de Ingeniera Industrial Pgina 88

Você também pode gostar