Você está na página 1de 280

1

Programa de certificacin
de Green Belts
IV. Seis Sigma - Anlisis


P. Reyes / Octubre de 2007
2
Diagrama de
Ishikawa
Diagrama de
relaciones
Diagrama
de rbol
Anlisis del Modo y Efecto de
Falla (AMEF)
QFD
Diagrama
Causa Efecto
CTQs = Ys
Operatividad
X's vitales
Diagrama
de Flujo
del
proceso
Pruebas
de
hiptesis
Causas raz
validadas
Causa
Raz?
Definicin
Y=X1 + X2+. .Xn
X's
Causas
potenciales
Medicin Y,
X1, X2, Xn
FASE DE ANLISIS
Si No
Llenar columnas del FMEA
Hasta sol. Propuesta y
comprobar causas con
Pruebas de Hiptesis
3
Seis Sigma - Anlisis
FMEA

Identificacin de causas potenciales

A. Anlisis exploratorio de datos


B. Pruebas de hiptesis
4
Qu es el FMEA?
El Anlisis de del Modo y Efectos de Falla es un grupo sistematizado de
actividades para:

Reconocer y evaluar fallas potenciales y sus efectos.

Identificar acciones que reduzcan o eliminen las
probabilidades de falla.

Documentar los procesos con los hallazgos del anlisis.

Existe el estndar MIL-STD-1629, Procedure for Performing a Failure
Mode, Effects and Criticality Analysis
5
Tipos del FMEA
AMEF de concepto (CFMEA)
A nivel de sistema, subsistema y componente

AMEF de diseo (DFMEA)

AMEF de Proceso (PFMEA)

AMEF de maquinaria (como aplicacin del DFMEA)
6
Tipos de FMEAs
FMEA de Diseo (AMEFD), su propsito es analizar como
afectan al sistema los modos de falla y minimizar los
efectos de falla en el sistema. Se usan antes de la
liberacin de productos o servicios, para corregir las
deficiencias de diseo.

FMEA de Proceso (AMEFP), su propsito es analizar como
afectan al proceso los modos de falla y minimizar los
efectos de falla en el proceso. Se usan durante la
planeacin de calidad y como apoyo durante la produccin
o prestacin del servicio.
7
Salidas del FMEA de Proceso
Una lista de modos potenciales de falla

Una lista de Caracterticas crticas y/o significativas

Una lista de caractersticas relacionadas con la
seguridad del operador y con alto impacto

Una lista de controles especiales recomendados para
las Caractersticas Especiales designadas y
consideradas en el Plan de control
8
Salidas del FMEA de Proceso
Una lista de procesos o acciones de proceso para
reducir la Severidad, eliminar las causas de los modos
de falla del producto o reducir su tasa de ocurrencia, y
mejorar la tasa de Deteccin de defectos si no se
puede mejorar la capacidad del proceso

Cambios recomendados a las hojas de proceso y
dibujos de ensamble
9
FMEA de Proceso - PFMEA
Componente ______________________ Responsable del Diseo ____________AMEF Nmero _________________
Ensamble ________________ Prepar _______________ Pagina _______de _______
Equipo de Trabajo ___________ FECHA (orig.) de FMEA ______(rev.) ______
Funcin
del Producto/
Paso del
proceso
Modos de Falla
Potenciales
Efecto (s)
Potencial (es)
de falla
S
e
v
.
Causa(s)
Potencial(es)
o Mecanismos
de falla
O
c
c
u
r
Controles de
Diseo o
Proceso
Actuales
D
e
t
e
c
R
P
N
Accin
Sugerida
Responsable
y fecha lmite
de Terminacin
Accin
Adoptada
S
e
v
O
c
c
D
e
t
R
P
N
Resultados de Accin
ANALISIS DEL MODO Y EFECTO DE FALLA
AMEF de Diseo / Proceso
11
Modelo del PFMEA Paso 1
Identificar todos los requerimientos funcionales dentro del
alcance

Identificar los modos de falla correspondientes

Identificar un conjunto de efectos asociados para cada modo de
falla

Identificar la calificacin de severidad para cada conjunto de
efectos que de prioridad el modo de falla

De ser posible, tomar acciones para eliminar modos de falla sin
atender las causas
12
Modelo de PFMEA Paso 1
Modos de falla potenciales
No funciona
Funcionamiento parcial / Sobre funcin / Degradacin en el
tiempo
Funcionamiento intermitente
Funcin no intencionada
Los modos de falla se pueden categorizar como sigue:
Manufactura: Dimensional fuera de tolerancia
Ensamble: Falta de componentes
Recibo de materiales: Aceptar partes no conformes
Inspeccin/Prueba: Aceptar partes equivocadas

13
Modelo de PFMEA - Paso 1
Efectos de las fallas potenciales (en usuario final)
Ruido
Operacin errtica
Inoperable
Inestable
Apariencia mala
Fugas
Excesivo esfuerzo
Retrabajos / reparaciones
Insatisfaccin del cliente
Esta calificacin resulta cuando un modo de falla potencial resulta en un defecto con un cliente final y/o una planta de manufactura
/ ensamble. El cliente final debe ser siempre considerado primero. Si ocurren ambos, use la mayor de las dos severidades
Efecto

Efecto en el cliente

Efecto en Manufactura /Ensamble

Calif.

Peligroso
sin aviso

Calificacin de severidad muy alta cuando un modo potencial de
falla afecta la operacin segura del producto y/o involucra un no
cumplimiento con alguna regulacin gubernamental, sin aviso

Puede exponer al peligro al operador (mquina o ensamble)
sin aviso

10

Peligroso
con aviso

Calificacin de severidad muy alta cuando un modo potencial de
falla afecta la operacin segura del producto y/o involucra un no
cumplimiento con alguna regulacin gubernamental, con aviso

Puede exponer al peligro al operador (mquina o ensamble)
sin aviso

9

Muy alto

El producto / item es inoperable ( prdida de la funcin
primaria)

El 100% del producto puede tener que ser desechado op
reparado con un tiempo o costo infinitamente mayor

8

Alto

El producto / item es operable pero con un reducido nivel de
desempeo. Cliente muy insatisfecho

El producto tiene que ser seleccionado y un parte
desechada o reparada en un tiempo y costo muy alto

7

Modera
do

Producto / item operable, pero un item de confort/conveniencia
es inoperable. Cliente insatisfecho

Una parte del producto puede tener que ser desechado sin
seleccin o reparado con un tiempo y costo alto

6

Bajo

Producto / item operable, pero un item de confort/conveniencia
son operables a niveles de desempeo bajos

El 100% del producto puede tener que ser retrabajado o
reparado fuera de lnea pero no necesariamente va al rea
de retrabajo .

5

Muy bajo

No se cumple con el ajuste, acabado o presenta ruidos y
rechinidos. Defecto notado por el 75% de los clientes

El producto puede tener que ser seleccionado, sin desecho,
y una parte retrabajada

4

Menor

No se cumple con el ajuste, acabado o presenta ruidos y
rechinidos. Defecto notado por el 50% de los clientes

El producto puede tener que ser retrabajada, sin desecho,
en lnea, pero fuera de la estacin

3

Muy
menor

No se cumple con el ajuste, acabado o presenta ruidos, y
rechinidos. Defecto notado por clientes muy crticos (menos del
25%)

El producto puede tener que ser retrabajado, sin desecho
en la lnea, en la estacin

2

Ninguno

Sin efecto perceptible

Ligero inconveniente para la operacin u operador, o sin
efecto

1

CRITERIO DE EVALUACIN DE SEVERIDAD SUGERIDO PARA AMEFP
15
Modelo de PFMEA Paso 2
Paso 2 identificar:
Las causas asociadas (primer nivel y raz)

Su tasa de ocurrencia

La designacin apropiada de la caracterstica indicada
en ola columna de clasificacin

Acciones recomendadas para alta severidad y
criticalidad (S x O) as como la Seguridad del operador
(OS) y errores de proceso de alto impacto (HI)
16
Modelo de PFMEA Paso 2
Causa/Mecanismo potencial de falla
Describe la forma de cmo puede ocurrir la falla,
descrito en trminos de algo que puede ser corregido o
controlado
Se debe dar priorioridad a rangos de prioridad de 9 o
10
17
Efecto(s) Potencial(es) de falla
Evaluar 3 (tres) niveles de Efectos del Modo de Falla
Efectos Locales
Efectos en el rea Local
Impactos Inmediatos

Efectos Mayores Subsecuentes
Entre Efectos Locales y Usuario Final

Efectos Finales
Efecto en el Usuario Final del producto o Servicio
CRITERIO DE EVALUACIN DE OCURRENCIA SUGERIDO PARA AMEFP
100 por mil piezas
Probabilidad

Indices Posibles de
falla

ppk

Calif.

Muy alta: Fallas
persistentes

< 0.55

10

50 por mil piezas

> 0.55

9

Alta: Fallas frecuentes

20 por mil piezas

> 0.78

8

10 por mil piezas

> 0.86

7

Moderada: Fallas
ocasionales
5 por mil piezas

> 0.94

6

2 por mil piezas

> 1.00

5

1 por mil piezas

> 1.10

4

Baja : Relativamente pocas
fallas

0.5 por mil piezas

> 1.20

3

0.1 por mil piezas

> 1.30

2

Remota: La falla es
improbable

< 0.01 por mil piezas

> 1.67

1

CRITERIO DE EVALUACIN DE DETECCION SUGERIDO PARA AMEFP
Deteccin

Criterio

Tipos de
Inspeccin

Mtodos de seguridad de Rangos de
Deteccin

Calif





A

B

C




Casi
imposible

Certeza absoluta de no deteccin





X

No se puede detectar o no es verificada

10

Muy
remota

Los controles probablemente no
detectarn





X

El control es logrado solamente con
verificaciones indirectas o al azar

9

Remota

Los controles tienen poca
oportunidad de deteccin





X

El control es logrado solamente con
inspeccin visual

8

Muy baja

Los controles tienen poca
oportunidad de deteccin





X

El control es logrado solamente con
doble inspeccin visual

7

Baja

Los controles pueden detectar



X

X

El control es logrado con mtodos grficos con
el CEP

6

Moderada

Los controles pueden detectar



X



El control se basa en mediciones por variables despus de que las
partes dejan la estacin, o en dispositivos Pasa NO pasa realizado en
el 100% de las partes despus de que las partes han dejado la
estacin

5

Moderada
mente
Alta

Los controles tienen una buena
oportunidad para detectar

X

X



Deteccin de error en operaciones subsiguientes, o medicin
realizada en el ajuste y verificacin de primera pieza ( solo para
causas de ajuste)

4

Alta

Los controles tienen una buena
oportunidad para detectar

X

X



Deteccin del error en la estacin o deteccin del error en
operaciones subsiguientes por filtros multiples de aceptacin:
suministro, instalacin, verificacin. No puede aceptar parte
discrepante

3

Muy Alta

Controles casi seguros para
detectar

X

X



Deteccin del error en la estacin (medicin automtica
con dispositivo de paro automtico). No puede pasar la
parte discrepante

2

Muy Alta

Controles seguros para detectar

X





No se pueden hacer partes discrepantes porque el item ha
pasado a prueba de errores dado el diseo del
proceso/producto

1

Tipos de inspeccin: A) A prueba de error B) Medicin automatizada C) Inspeccin visual/manual


20
Componente ______________________ Responsable del Diseo ____________ AMEF Nmero _________________
Ensamble ________________ Prepar _______________ Pagina _______de _______
Equipo de Trabajo ___________ FECHA (orig.) de AMEF ______(rev.) ______
Funcin
de
Artculo
Modos de Falla
Potenciales
Efecto (s)
Potencial (es)
de falla
S
e
v
.
Causa(s)
Potencial(es)
de los Mecanismos
de falla
O
c
c
u
r
Controles de
Diseo Actual
D
e
t
e
c
R
P
N
Accin
Sugerida
Responsable
y fecha lmite
de Terminacin
Accin
Adoptada
S
e
v
O
c
c
D
e
t
R
P
N
Factura Datos LOCAL:
incorrecta incorrectos Rehacer
la factura
MAXIMO PROXIMO
Contabilidad 7 3 5 105
erronea
CON CLIENTE
Molestia
Insatisfaccin

Resultados de Accin
ANALISIS DEL MODO Y EFECTO DE FALLA
AMEF de Diseo / Proceso
Riesgo = Severidad x
Ocurrencia x Deteccin
Causas probables a
atacar primero
21
Producto de Severidad, Ocurrencia, y Deteccin

RPN / Gravedad usada para identificar principales CTQs

Severidad mayor o igual a 8
RPN mayor a 150
Calcular RPN (Nmero de Prioridad de
Riesgo)
Componente ______________________ Responsable del Diseo ____________ AMEF Nmero _________________
Ensamble ________________ Prepar _______________ Pagina _______de _______
Equipo de Trabajo ___________ FECHA (orig.) de AMEF ______(rev.) ______
Funcin
de
Artculo
Modos de Falla
Potenciales
Efecto (s)
Potencial (es)
de falla
S
e
v
.
Causa(s)
Potencial(es)
de los Mecanismos
de falla
O
c
c
u
r
Controles de
Diseo Actual
D
e
t
e
c
R
P
N
Accin
Sugerida
Responsable
y fecha lmite
de Terminacin
Accin
Adoptada
S
e
v
O
c
c
D
e
t
R
P
N
Factura Datos LOCAL:
incorrecta incorrectos Rehacer
la factura
MAXIMO PROXIMO
Contabilidad 7 3 5 105
erronea
CON CLIENTE
Molestia
Insatisfaccin

Resultados de Accin
ANALISIS DEL MODO Y EFECTO DE FALLA
AMEF de Diseo / Proceso
Riesgo = Severidad x
Ocurrencia x Deteccin
Causas probables a
atacar primero
23
Planear Acciones

Requeridas para todos los CTQs

Listar todas las acciones sugeridas, qu persona
es la responsable y fecha de terminacin.
Describir la accin adoptada y sus resultados.
Recalcular nmero de prioridad de riesgo .
Reducir el riesgo general del diseo
24
Componente ______________________ Responsable del Diseo ____________ AMEF Nmero _________________
Ensamble ________________ Prepar _______________ Pagina _______de _______
Equipo de Trabajo ___________ FECHA (orig.) de AMEF ______(rev.) ______
Funcin
del componente
/ Paso del
proceso
Modos de Falla
Potenciales
Efecto (s)
Potencial (es)
de falla
S
e
v
.
Causa(s)
Potencial(es)
o Mecanismos
de falla
O
c
c
u
r
Controles de
Diseo /
Prcoeso
Actuales
D
e
t
e
c
R
P
N
Accin
Sugerida
Responsable
y fecha lmite
de Terminacin
Accin
Adoptada
S
e
v
O
c
c
D
e
t
R
P
N
Factura correcta Datos LOCAL:
erroneos Rehacer la
factura

MAXIMO PROXIMO
Contabilidad 7 3 5 105
erronea
CON CLIENTE
Molestia
Insatisfaccin

Resultados de Accin
ANALISIS DEL MODO Y EFECTO DE FALLA
AMEF de Diseo / Proceso
Usar RPN para identificar
acciones futuras. Una vez que
se lleva a cabo la accin,
recalcular el RPN.
25
Ejemplo de AMEFP
26
Identificacin de causas
potenciales
Tormenta de ideas
Diagrama de Ishikawa
Diagrama de Relaciones
Diagrama de rbol
Verificacin de causas raz
27
Tormenta de ideas
Tcnica para generar ideas creativas cuando la mejor
solucin no es obvia.

Reunir a un equipo de trabajo (4 a 10 miembros) en
un lugar adecuado

El problema a analizar debe estar siempre visible

Generar y registrar en el diagrama de Ishikawa un
gran nmero de ideas, sin juzgarlas, ni criticarlas

Motivar a que todos participen con la misma
oportunidad
28
Tormenta de ideas
Permite obtener ideas de los participantes
29
Diagrama de Ishikawa
Anotar el problema en el cuadro de la derecha

Anotar en rotafolio las ideas sobre las posibles causas
asignndolas a las ramas correspondientes a:
Medio ambiente
Mediciones
Materia Prima
Maquinaria
Personal y
Mtodos
o
Las diferentes etapas del proceso de manufactura o
servicio

30
Diagrama de causa efecto
Divide los problemas en partes ms pequeas

Muestra las causas potenciales de manera grfica

Tambin se llama diagrama de ishikawa o de las 4 o
6 Ms.

Muestra como interactan las diversas causas
Sigue las reglas de la tormenta de ideas al generarlas
Diagrama de Ishikawa
Medio
ambiente Mtodos Personal
Qu
produce
bajas ventas
de
Tortillinas
Ta Rosa?
Clima
hmedo
Calidad del
producto
Tipo de
exhibidor
Falta de
motivacin
Ausentismo
Rotacin de
personal
Maquinara Materiales
Clientes con
ventas bajas
Malos
itinerarios
Descompostura
del camin
repartidor
Distancia de
la agencia al
changarro
Medicin
Seguimiento
semanal
Conocimiento
de los
mnimos por
ruta
Frecuencia
de visitas
Elaboracin
de pedidos
Posicin de
exhibidores
Falta de
supervi
cin
Programacin
deficiente
Capacidad
instalada
desconocida
Marketing no
tiene en cuenta
cap de p.
Mala prog. De
ordenes de compra
Compras
aprovecha
ofertas

Falta de com..... Entre
las dif. reas de
la empresa
Duplicidad
de funciones
Las un. Reciben
ordenes de dos
deptos diferentes
Altos
inventarios
No hay control
de inv..... En proc.
Demasiados deptos
de inv..... Y desarrollo
Falta de prog. De
la op. En base a
los pedidos
No hay com..... Entre
las UN y la oper.
Falta de
coordinacin al fincar
pedidos entre
marketing y la op.
Falta de control de
inventarios en
compras
Influencia de la
situacin econ del
pas
No hay com..... Entre compras
con la op. general
No hay coordinacin
entre la operacin y las unidades
del negocio
Falta de coordinacin
entre el enlace de compras
de cada unidad con compras
corporativo

Influencia directa de
marketing sobre
compras
Compra de material
para el desarrollo de
nuevos productos por
parte inv..... Y desarrollo
No hay flujo
efectivo de mat.
Por falta de
programacin
de acuerdo
a pedidos
Perdida de mercado
debido a la
competencia
Constantes
cancelaciones
de pedidos
de marketing
No hay coordinacin
entre marketing
operaciones
Falta de comunicacin
entre las unidades
del negocio
Diagrama de relaciones
Dancer
Taco generador
del motor
Poleas guas
Presin del
dancer
Mal guiado
Sensor de velocidad
de lnea
Sensor
circunferencial
Bandas de
transmisin
Empaques de arrastre
Presin de aire de trabajo
Drive principal
Voltaje del motor
Ejes principales
Poleas de transmisin
Que nos puede provocar Variacin de Velocidad
Durante el ciclo de cambio en la seccin del Embobinadores?
Causas a validar
13/0
2/4
0/4
1/2
5/1
1/4
1/4
2/1
1/1
0/3
5/2
4/1
1/5
1/5
Entradas Causa
Salidas Efecto
Diagrama de Interrrelaciones
Permite al equipo identificar y clasificar las relaciones
de causa y efecto que existe entre las variables
Communica-
tion issues
within the
group
External
factors impact
implemen-
tation
Means not
clearly
defined
Plan not
integrated
Fast new
product
introductions
stretch
resources
Lack of
time and
resources
No strong
commitment
to the group
Driver
Driver
Planning
approach not
standardized Outcome
Capacity
may not
meet needs
In = 1 Out = 3
In = 3 Out = 2
In = 2 Out = 4
In = 1 Out = 2
In = 2 Out = 0
In = 0 Out = 5
In = 5 Out = 1
In = 0 Out = 2
In = 5 Out = 0
Qu datos son necesarios para
identificar las cuasas raz?
35
Diagrama de rbol o sistemtico
Meta Medio
Meta
Meta
Medio
Medio
Meta u
objetivo
Medios
o planes
Medios
o planes
Medios


Medios
Medios
Primer
nivel
Segundo
nivel
Tercer
nivel
Cuarto
nivel
Implantar el
Sistema
SMED
Producto DJ
2702
Objetivo?
Preparacin
para el SMED
Fase 1: Separacin
de la preparacin
interna de la externa
Fase 2: Conversin
de preparacin
interna en externa
Fase 3: Refinamiento
de todos los aspectos
de la preparacin.
Filmar la preparacin
Analizar el video
Describir las tareas
Separar las tareas
Elaborar lista de chequeo
Realizar chequeo de
funciones
Analizar el transporte de
herramientas y materiales
Analizar las funciones y
propsito de c/operacin
Convertir tareas de prepa-
racin interna a externas
Realizacin de operaciones
en paralelo.
Uso de sujeciones
funcionales.
Eliminacin de ajustes
5- 12 - Mar-04
10 y 17 Mar-04
17- Mar-04
17- Mar-04
2- Mar-04
24- Mar-04
24- Mar-04
12 - Abr- 04
15 Abr - 04
5 May -04
19 May -04
12- May -04
Qu?
Cmo? Cundo?
Elaboramos un
Diagrama de Arbol
para poder
analizar nuestro
problema siguiendo
el sistema SMED.
Diagrama de Arbol- Aplicacin Sistema SMED
19
37
Seleccin de posibles causas
El equipo discute la lista de
causas de alta prioridad y
decide cules son las ms
importantes (5 a 7).
El equipo se cuestiona lo
siguiente:
Es una causa? (no una
solucin?)
Podemos hacer algo respecto a
la causa?
Estamos seguros que sta
cambiar el efecto?
Estamos de acuerdo?
Causas
1. ________
2. ________
3. ________
4. ________
5. ________
38
Verificacin de posibles causas
Para cada causa probable , el equipo deber
por medio del diagrama 5Ws 1H:
Llevar a cabo una tormenta de ideas para
verificar la causa.
Seleccionar la manera que:
represente la causa de forma efectiva, y
sea fcil y rpida de aplicar.

39
Calendario de las actividades
qu? por qu? cmo? cundo
?
dnde
?
quin?
1
Tacogenerador
de motor
embobinador
1.1 Por variacin de
voltaje durante el
ciclo de cambio
1.1.1 Tomar dimensiones de ensamble entre
coples.
1.1.2 Verificar estado actual y
especificaciones de escobillas.
1.1.3 tomar valores de voltaje de salida
durante el ciclo de cambio.
Abril 04 1804
Embob.
J. R.
2 Sensor
circular y de
velocidad de
linea.
2.1 Por que nos
genera una varin en
la seal de referencia
hacia el control de
velocidad del motor
embobinador
2.1.1 Tomar dimensiones de la distancia
entre poleas y sensores.
2.1.2 Tomar valores de voltaje de salida de
los sensores.
2.1.3 Verificar estado de rodamientos de
poleas.
Abril 04 1804
Embob.
U. P.
3 Ejes
principales de
transmisin.
3.1 Por vibracin
excesiva durante el
ciclo de cambio
3.1.1 Tomar lecturas de vibracin en
alojamientos de rodamientos
3.1.2 Comparar valores de vibraciones con
lecturas anteriores.
3.1.3 Analizar valor lecturas de vibracin
tomadas.
Abril04 1804
Embob.
F. F.
4 Poleas de
transmisin de
ejes
embobinadores
.
4.1 Puede generar
vibracin excesiva
durante el ciclo de
cambio.
4.1.1 Verificar alineacin, entre poleas de
ejes principales y polea de transmisin del
motor.
4.1.2 Tomar dimensiones de poleas(dientes
de transmisin).
4.1.3 Tomar dimensiones de bandas (dientes
de transmisin)
4.1.4 Verificar valor de tensin de bandas.
Abril04 1804
Embob.
J. R.
U. P.
40
Verificacin de posibles causas
Antes de invertir tiempo y dinero en la
implementacin de una mejora para contrarrestar
una causa, asegurarse que la causa sea real.

Estar completamente convencido que la causa es la
verdadera culpable del efecto indeseable.
41
IV A 1. Estudios Multivari
42
Estudios Multivari
La carta multivari permite analizar la variacin dentro
de la pieza, de pieza a pieza o de tiempo en tiempo

Permite investigar la estabilidad de un proceso
consiste de lneas verticales u otro esquema en
funcin del tiempo. La longitud de la lnea o del
esquema representa el rango de valores encontrados
en cada conjunto de muestras
43
Estudios Multivari
La variacin dentro de las muestras (cinco puntos en
cada lnea). La variacin de muestra a muestra como
posicin vertical de las lneas.
E
S
P
E
S
O
R
Nmero de subgrupo
44
Estudios Multivari
Ejemplo de parte metlica
Centro ms grueso
45
Estudios Multivari
Procedimiento de muestreo:
Seleccionar el proceso y la caracterstica a
investigar

Seleccionar tamao de muestra y frecuencia de
muestreo

Registrar en una hoja la hora y valores para
conjunto de partes
46
Estudios Multivari
Procedimiento de muestreo:
Realizar la carta Multivari
Unir los valores observados con una lnea

Analizar la carta para variacin dentro de la parte,
de parte a parte y sobre el tiempo

Puede ser necesario realizar estudios adicionales
alrededor del rea de mxima variacin aparente
Despus de la accin de mejora comprobar con
otro estudio Multivari
47
Su propsito fundamental es reducir el gran nmero de
causas posibles de variacin, a un conjunto pequeo de
causas que realmente influyen en la variabilidad.

Sirven para identificar el patrn principal de variacin de
entre tres patrones principales:

Temporal: Variacin de hora a hora; turno a
turno; da a da; semana a semana; etc.

Cclico: Variacin entre unidades de un mismo
proceso; variacin entre grupos de unidades;
variacin de lote a lote.
Cartas Multivari
48
Posicional:
Variaciones dentro de una misma unidad (ejemplo:
porosidad en un molde de metal) o a travs de una sola
unidad con mltiples partes (circuito impreso).

Variaciones por la localizacin dentro de un proceso que
produce mltiples unidades al mismo tiempo. Por
ejemplo las diferentes cavidades de un molde

Variaciones de mquina a mquina; operador a
operador; planta a planta
7A1. Cartas Multivari
49
Ejemplo: Se toman 3 a 5 unidades consecutivas, repitiendo el
proceso tres o ms veces a cierto intervalo de tiempo, hasta que al
menos el 80% de la variacin en el proceso se ha capturado.



A


1 2 3 4 5 27 28 29 30 31 55 56 57 58 59
VARIACIN POSICIONAL DENTRO DE LA UNIDAD
Cartas Multivari
50
Ejemplo: (cont...)


B


1 2 3 4 5 27 28 29 30 31 55 56 57 58 59
VARIACIN CCLICA DE UNIDAD A UNIDAD
Cartas Multivari
51
Ejemplo: (cont...)


C


1 2 3 4 5 27 28 29 30 31 55 56 57 58 59
VARIACIN TEMPORAL DE TIEMPO A TIEMPO
Cartas Multivari
52
Ejemplo: Un proceso produce flecha cilndricas, con
un dimetro especificado de 0.0250 0.001.

Sin embargo un estudio de capacidad muestra un Cp
= 0.8 y una dispersin natural de 0.0025 (6 o )
contra la permitida de 0.0002.

Se tiene pensado comprar un torno nuevo de
US$70,000 para tolerancia de 0.0008, i.e. Cpk =
1.25. Se sugiri un estudio Multi Vari previo.
Cartas Multivari
53
Se tomaron cuatro lecturas en cada flecha, dos a
cada lado. Estas muestran una disminucin gradual
desde el lado izquierdo al lado derecho de las
flechas, adems de excentricidad en cada lado de la
flecha.

La variacin cclica, de una flecha a la siguiente, se
muestra mediante las lneas que concentran las
cuatro lecturas de cada flecha.

Tambin se muestra la variacin temporal.

Cartas Multivari
.0.2510


0.2500


0.2490
Cartas Multivari
Mximo
Mnimo
Izquierda
Derecha
8 AM 9 AM 10 AM 11 AM 12 AM
55
Un anlisis rpido revela que la mayor variacin es temporal
con un cambio mayor entre las 10 AM y las 11 AM.

A las 10 AM se para el equipo para el almuerzo y se arranca a
las 11 AM, con lecturas similares a las de las 8 AM. Conforme
pasa el tiempo las lecturas tienden a decrecer ms y ms, hasta
que se invierten a las 10 A.M. en forma drstica.

Se investig y se encontr que la temperatura tena influencia
en la variacin.

La variacin en temperatura era causada por que la cantidad de
refrigerante no era la adecuada, lo cual se notaba ms cuando
se paraba el equipo y se volva a arrancar. Se adicion,
reduciendo la variacin en 50% aproximadamente..

Cartas Multivari
56
Tambin se encontr que el acabado cnico era causado por
que la herramienta de corte estaba mal alineada. Se ajust,
contribuyendo a otra reduccin del 10% de la variabilidad.

La excentricidad de las flechas se corrigi al cambiar un
rodamiento excntrico por desgaste en el torno. Se instal un
nuevo rodamiento eliminndose otro 30% de la variabilidad.

La tabla siguiente muestra un resumen de los resultados.
Cartas Multivari
57
Tipo de % var. Causas de Accin % de variacin
Variacin Total Variacin Correctiva Reducida
Temporal 50 Bajo nivel de Adicionar Casi 50
Tiempo a tiempo Refrigerante refrigerante
Dentro de 10 Ajuste no Ajuste de la Casi 10
la flecha no paralelo herramienta de
corte
Dentro de 30 Rodamiento Nuevo Casi 30
la flecha gastado rodamiento

Flecha a 5 -??? - -
flecha
Cartas Multivari
58
Resultados:
La variacin total en la siguiente corrida de produccin se
redujo de 0.0025 a 0.0004

El nuevo Cp fue de 0.002 / 0.0004 = 5.0

Como beneficios se redujo a cero el desperdicio y no hubo
necesidad de adquirir una nueva mquina.

Se observa que antes de cambiar equipo o mquinas, es
conveniente realizar un estudio de variabilidad para
identificar las fuentes de variacin y tratar de eliminarlas.

Cartas Multivari
59
Variacin de
sist. medicin
Variacin
de
proceso
Pieza a
pieza
Lote a lote
Dentro de
la pieza
Mquina a
mquina
Turno a
turno
Tiempo a
tiempo
Dimetro de Flecha
(0.150" +/- .002)
Programa Mquina
Accesorios
Operador a
operador
Ejemplo: Bsqueda de fuentes de variacin con el diagrama sistemtico.

Cartas Multivari
60
Ejemplo (cont..):
Al realizar la prueba de homogeneidad de varianza F, se
encontr que haba una diferencia significante entre los
operadores.

Se Rechaza Ho: o
2
Oper1
= o
2
Oper2
= o
2
Oper3
Para probar si existe diferencia significativa entre
medias de operadores se hacen las siguientes
comparaciones
Ho:
Oper1
=
Oper2
Ho:
Oper1
=
Oper3
Ho:
Oper2
=
Oper3
Ha:
Oper1
=
Oper2
=
Oper3
Cartas Multivari
61
Corrida en Minitab
Se introducen los datos en varias columnas C1 a C3
incluyendo la respuesta (strenght) y los factores
(time y Metal)
SinterTime MetalType Strength
0.5 15 23
0.5 15 20
0.5 15 21
0.5 18 22
0.5 18 19
0.5 18 20
0.5 21 19
0.5 21 18
62
Corrida en Minitab
Utilizar el achivo de ejemplo Sinter.mtw

Opcin: Stat > Quality Tools > Multivari charts

Indicar la columna de respuesta y las columnas de
los factores

En opciones se puede poner un ttulo y conectar las
lneas

63
Resultados
21 18 15
23.5
22.5
21.5
20.5
19.5
18.5
17.5
MetalType
S
t
r
e
n
g
t
h
0.5
1.0
2.0
Multi-Vari Chart for Strength by SinterTime - MetalType
SinterTime
64
IV.A.2 Regresin lineal simple
65
Definiciones
Correlacin
Establece si existe una relacin entre las variables y
responde a la pregunta, Qu tan evidente es esta
relacin?"
Regresin
Describe con ms detalle la relacin entre las variables.

Construye modelos de prediccin a partir de informacin
experimental u otra fuente disponible.

Regresin lineal simple
Regresin lineal mltiple
Regresin no lineal cuadrtica o cbica
66
Correlacin
Propsito: Estudiar la posible relacin
entre dos variables.
A
c
c
i
d
e
n
t
e
s

l
a
b
o
r
a
l
e
s

Numero de rdenes urgentes
Correlacin
positiva,
posible



























El 1er. paso es realizar una grfica de la informacin.
Correlacin de la informacin (R ) de las X y las Y
Correlacin Positiva
Evidente
0
5
10
15
20
25
0 5 10 15 20 25
X
Y

Correlacin Negativa
Evidente
0
5
10
15
20
25
0 5 10 15 20 25
X
Y

Correlacin
Positiva
0
5
10
15
20
25
0 5 10 15 20 25
X
Y

Correlacin
Negativa
0
5
10
15
20
25
0 5 10 15 20 25
X
Y

Sin Correlacin
10
15
20
25
5 10 15 20 25
X
Y

0
5
0
R=1
R=>-1
R=-1
R=0
R=>1
Tabla de Correlacin mnima
Correlaciones (Pearson)
n 95% 99%
de confianza de confianza
3 1.00 1.00
4 0.95 0.99
5 0.88 0.96
6 0.81 0.92
7 0.75 0.87
8 0.71 0.83
9 0.67 0.80
10 0.63 0.76
11 0.60 0.73
12 0.58 0.71
13 0.53 0.68
14 0.53 0.66
n 95% 99%
de confianza de confianza
15 0.51 0.64
16 0.50 0.61
17 0.48 0.61
18 0.47 0.59
19 0.46 0.58
20 0.44 0.56
22 0.42 0.54
24 0.40 0.52
26 0.39 0.50
28 0.37 0.48
30 0.36 0.46
Para un 95% de confianza, con una muestra de 10,
el coeficiente (r) debe ser al menos .63
69
La correlacin puede usarse para informacin de
atributos, variables normales y variables no normales.


La correlacin puede usarse con un predictor o
ms para una respuesta dada.


La correlacin es una prueba fcil y rpida para
eliminar factores que no influyen en la prediccin, para
una respuesta dada.
Correlacin
70
El anlisis de regresin es un mtodo
estandarizado para localizar la correlacin entre dos
grupos de datos, y, quiz ms importante, crear un
modelo de prediccin.

Puede ser usado para analizar las relaciones entre:
Una sola X predictora y una sola Y

Mltiples predictores X y una sola Y

Varios predictores X entre s
Anlisis de Regresin
71
Supuestos de la regresin lineal
Los principales supuestos que se hacen en el anlisis de regresin
lineal son los siguientes:
La relacin entre las variables Y y X es lineal, o al menos bien
aproximada por una lnea recta.

El trmino de error c tiene media cero.

El trmino de error c tiene varianza constante o2.

Los errores no estn correlacionados.

Los errores estn normalmente distribuidos.
c | | + + = X y
1 0
72
Modelo de regresin lineal
Se aume que para cualquier valor de X el valor observado de Y
varia en forma aleatoria y tiene una distribucin de probabilidad
normal






El modelo general es:
Y = Valor medio de Yi para Xi + error aleatorio

c | | + + = X y
1 0
La lnea de regresin se calcula por el mtodo de mnimos cuadrados.
Un residuo es la diferencia entre un punto de referencia en particular (x
i
,
y
i
) y el modelo de prediccin ( y = a + bx ). El modelo se define de tal
manera que la suma de los cuadrados de los residuales es un mnimo. La
suma residual de los cuadrados es llamada con frecuencia la suma de los
cuadrados de los errores (SSE) acerca de la lnea de regresin


























e
i
x
i
y
i
SSE = Ee
i
2
= E(y
i
- y
i
)
2
y = b0 + b1x
Regresin Lineal Simple
a y b son
Estimados de
|0 y |1
74
Grfica de la Lnea de Ajuste
Recta de regresin
Y=-.600.858+5738.89X
R
2
= .895
Altura del muelle
R
e
t
e
n
c
i

n

0.18
0.19
0.20
400
500
600
Regresin
95% Intervalo
de confianza
95% Intervalo
de prediccin
75
Interpretacin de los Resultados
El intervalo de prediccin es el grado de certidumbre de la
difusin de la Y estimada para puntos individuales X. En general,
95% de los puntos individuales (provenientes de la poblacin sobre
la que se basa la lnea de regresin), se encontrarn dentro de la
banda [Lneas azules]

La ecuacin de regresin (Y = -600.858 + 5738.89X) describe la
relacin entre la variable predictora X y la respuesta de
prediccin Y.
R
2
(coef. de determinacin) es el porcentaje de variacin
explicado por la ecuacin de regresin respecto a la variacin total
en el modelo
El intervalo de confianza es una banda con un 95% de
confianza de encontrar la Y media estimada para cada valor de
X [Lneas rojas]
Interpretacin de los Resultados
Los valores p de la constante (interseccin en Y) y las variables
de prediccin, se leen igual que en la prueba de hiptesis.
Ho: El factor no es significativo en la prediccin de la respuesta.
Ha: El factor es significativo en la prediccin de la respuesta.


s es el error estndar de la prediccin = desviacin estndar del
error con respecto a la lnea de regresin.

R
2
(ajustada) es el porcentaje de variacin explicado por la
regresin, ajustado por el nmero de trminos en el modelo y por
el nmero de puntos de informacin.


El valor p para la regresin se usa para ver si el modelo completo
de regresin es significativo.
Ho: El modelo no es significativo en la prediccin de la respuesta.
Ha: El modelo es significativo en la prediccin de la respuesta.
77
Errores residuales
Los errores se denominan frecuentemente residuales.
Podemos observar en la grfica de regresin los errores
indicados por segmentos verticales.


















78
Ejemplo
Considere el problema de predecir las ventas mensuales en
funcin del costo de publicidad. Calcular el coeficiente de
correlacin, el de determinacin y la recta.

MES Publicidad Ventas

1 1.2 101
2 0.8 92
3 1.0 110
4 1.3 120
5 0.7 90
6 0.8 82
7 1.0 93
8 0.6 75
9 0.9 91
10 1.1 105
79
Riesgos de la regresin
Los modelos de regresin son vlidos como ecuaciones de
interpolacin sobre el rango de las variables utilizadas en el
modelo. No pueden ser vlidas para extrapolacin fuera de
este rango.

Mientras que todos los puntos tienen igual peso en la
determinacin de la recta, su pendiente est ms influenciada
por los valores extremos de X.
1.
Y
*A


* *
* * * Sin A y B
* * * *


*B

X
80
Riesgos de la regresin
Los outliers u observaciones aberrantes pueden distorsionar
seriamente el ajuste de mnimos cuadrados.








Si se encuentra que dos variables estn relacionadas
fuertemente, no implica que la relacin sea casual, se debe
investigar la relacin causa efecto entre ellas. Por ejemplo el
nmero de enfermos mentales vs. nmero de licencias
recibidas.

Y
*A *
* * *
* *
* * *
** *
**
* * *
**
* *


X

81
Ejercicio
Calcular la recta de prediccin con sus bandas de confianza,
la correlacin y la determinacin para la respuesta de un Taxi,
los datos se muestran a continuacin:

Distancia Tiempo
0.8 200
2.2 400
1.0 160
0.6 120
1.0 360
1.4 280
2.2 560
0.6 320



82
Regresin lineal mltiple
83
Regresin mltiple
Cuando se usa ms de una variable independiente para predecir
los valores de una variable dependiente, el proceso se llama
anlisis de regresin mltiple, incluye el uso de ecuaciones
lineales.



Se asume que los errores cu tienen las caractersticas siguientes:
Tienen media cero y varianza comn o2.
Son estadsticamente independientes.
Estn distribuidos en forma normal.
u uk k u u u
X X X Y c | | | | + + + + + = .......
2 2 1 1 0
84
Multicolinealidad
Una prueba fcil de probar si hay multicolinealidad entre dos
variables es que su coeficiente de correlacin sea mayor a 0.7

Los elementos de la diagonal principal de la matriz XX se
denominan Factores de inflacin de varianza (VIFs) y se usan
como un diagnstico importante de multicolinealidad. Para el
componente j simo se tiene:



Si es mayor a 10 implica que se tienen serios problemas de
multicolinealidad.
2
1
1
j
j
R
VIF

=
85
Corrida en Minitab
Se introducen los datos en varias columnas C1 a C5
incluyendo la respuesta Y (heatflux) y las variables
predictoras Xs (North, South, East)
HeatFlux Insolation East South North
271.8 783.35 33.53 40.55 16.66
264.0 748.45 36.50 36.19 16.46
238.8 684.45 34.66 37.31 17.66
230.7 827.80 33.13 32.52 17.50
251.6 860.45 35.75 33.71 16.40
257.9 875.15 34.46 34.14 16.28
86
Corrida en Minitab
Utilzar el archivo de ejemplo Exh_regr.mtw
Opcin: Stat > Regression > Regression
Para regresin lineal indicar la columna de respuesta
Y (Score2) y X (Score1)

En Regresin lienal en opciones se puede poner un
valor Xo para predecir la respuesta e intervalos. Las
grficas se obtienen Stat > Regression > Regression
> Fitted line Plots

Para regresin mltiple Y (heatflux) y las columnas
de los predictores (north, south, east)

87
Resultados de la regresin lineal
The regression equation is
Score2 = 1.12 + 0.218 Score1
Predictor Coef SE Coef T P
Constant 1.1177 0.1093 10.23 0.000
Score1 0.21767 0.01740 12.51 0.000
S = 0.1274 R-Sq = 95.7% R-Sq(adj) = 95.1%
Analysis of Variance
Source DF SS MS F P
Regression 1 2.5419 2.5419 156.56 0.000
Residual Error 7 0.1136 0.0162
Total 8 2.6556
Predicted Values for New Observations
New Obs Fit SE Fit 95.0% CI 95.0% PI
1 2.6414 0.0474 ( 2.5292, 2.7536) ( 2.3197, 2.9631)
New Obs Score1
1 7.00
88
Resultados de la regresin lineal
9 8 7 6 5 4 3 2
3.5
2.5
1.5
Score1
S
c
o
r
e
2
S = 0.127419 R-Sq = 95.7 % R-Sq(adj) = 95.1 %
Score2 = 1.11771 + 0.217670 Score1
95% PI
95% CI
Regression
Regression Plot
89
Resultados de la regresin Mltiple
The regression equation is
HeatFlux = 389 - 24.1 North + 5.32 South + 2.12 East
Predictor Coef SE Coef T P
Constant 389.17 66.09 5.89 0.000
North -24.132 1.869 -12.92 0.000
South 5.3185 0.9629 5.52 0.000
East 2.125 1.214 1.75 0.092
S = 8.598 R-Sq = 87.4% R-Sq(adj) = 85.9%
Analysis of Variance
Source DF SS MS F P
Regression 3 12833.9 4278.0 57.87 0.000
Residual Error 25 1848.1 73.9
Total 28 14681.9
Source DF Seq SS
North 1 10578.7
South 1 2028.9
East 1 226.3
90
La regresin slo puede utilizarse con informacin de variables
continuas.

Los residuos deben distribuirse normalmente con media cero.

Importancia prctica: (R
2
). Importancia estadstica: (valores p)

La regresin puede usarse con un predictor X o ms,
para una respuesta dada

Reduzca el modelo de regresin cuando sea posible,
sin perder mucha importancia prctica
Resumen de la Regresin
91
IV.B Pruebas de hiptesis
92
IV.B. Pruebas de hiptesis
1. Conceptos fundamentales
2. Pruebas para medias, varianzas y proporciones

3. Pruebas pareadas de medias
4. Anlisis de varianza (ANOVA)

5. Tablas de contingencia
6. Pruebas no paramtricas

93
IV.B.1 Conceptos
fundamentales
94
Anlisis Estadstico
En CADA prueba estadstica, se comparan algunos valores
observados a algunos esperados u otro valor observado
comparando estimaciones de parmetros (media, desviacin
estndar, varianza)

Estas estimaciones de los VERDADEROS parmetros son obtenidos
usando una muestra de datos y calculando los ESTADSTICOS...

La capacidad para detectar un diferencia entre lo que es
observado y lo que es esperado depende del desarrollo de la
muestra de datos

Incrementando el tamao de la muestra mejora la estimacin y tu
confianza en las conclusiones estadsticas.
95
Conceptos fundamentales
Hiptesis nula Ho
Es la hiptesis o afirmacin a ser probada
Puede ser por ejemplo , , o, t= 5
Slo puede ser rechazada o no rechazada

Hiptesis alterna Ha
Es la hiptesis que se acepta como verdadera cuando se
rechaza Ho, es su complemento
Puede ser por ejemplo = 5 para prueba de dos colas
< 5 para prueba de cola izquierda
> 5 para prueba de cola derecha
Esta hiptesis se acepta cuando se rechaza Ho

96
Conceptos fundamentales
Ejemplos:
Se est investigando si una semilla modificada
proporciona una mayor rendimiento por hectrea, la
hiptesis nula de dos colas asumir que los
rendimientos no cambian Ho: Ya = Yb

Se trata de probar si el promedio del proceso A es
mayor que el promedio del proceso B. La hiptesis
nula de cola derecha establecer que el proceso A es
<= Proceso B. O sea Ho: A <= B.
97
Conceptos fundamentales
Estadstico de prueba
Para probar la hiptesis nula se calcula un estadstico
de prueba con la informacin de la muestra el cual se
compara a un valor crtico apropiado. De esta forma se
toma una decisin sobre rechazar o no rechazar la Ho

Error tipo I (alfa = nivel de significancia, normal=.05)
Se comete al rechazar la Ho cuando en realidad es
verdadera. Tambin se denomina riesgo del productor

Error tipo II (beta )
Se comete cuando no se rechaza la hiptesis nula
siendo en realidad falsa. Es el riesgo del consumidor

98
Conceptos fundamentales
Tipos de errores
Se asume que un valor pequeo para o es deseable, sin
embargo esto incrementa el riesgo |.
Para un mismo tamao de muestra n ambos varan
inversamente
Incrementando el tamao de muestra se pueden reducir ambos
riesgos.
Decisin realizada Ho en realidad es
Verdadera
Ho en realidad es
falsa
No hay evidencia para
rechazar Ho
p = 1-o
Decisin correcta
p = |
Error tipo II
Rechazar Ho p = o
Error tipo I
p = 1 - |
Decisin correcta
99
Conceptos fundamentales
Pruebas de dos colas
Si la Ho: , , o, t= cte. que un valor poblacional,
entonces el riesgo alfa se reparte en ambos extremos
de la distribucin. Por ejemplo si Ho = 10 se tiene:
P(Z>= + Zexcel ) = alfa/2 P(Z<= - Zexcel ) = alfa/2
100
Conceptos fundamentales
Pruebas de una cola
Si la Ho: , , o, t >= Cte. que un valor poblacional,
entonces el riesgo alfa se coloca en la cola izquierda de
la distribucin. Por ejemplo si Ho: >= 10 y Ha: < 10
se tiene una prueba de cola izquierda:
P(Z <= - Zexcel ) = alfa
101
Conceptos fundamentales
Pruebas de una cola
Si la Ho: , , o, t<= Cte. que un valor poblacional,
entonces el riesgo alfa se coloca en la cola derecha de
la distribucin. Por ejemplo si Ho: <= 10 y Ha: >
10 se tiene una prueba de cola derecha:
P(Z>= + Zexcel ) = alfa
102
Conceptos fundamentales
Tamao de muestra requerido
Normalmente se determina el error alfa y beta deseado
y despus se calcula el tamao de muestra necesario
para obtener el intervalo de confianza.

El tamao de muestra (n) necesario para la prueba
de hiptesis depende de:
El riesgo deseado tipo I alfa y tipo II Beta
El valor mnimo a ser detectado entre las medias de la
poblacin (Mu Mu0)
La variacin en la caracterstica que se mide (S o
sigma)
103
Conceptos fundamentales
El Tamao de muestra requerido en funcin del error
mximo E o Delta P intervalo proporcional esperado
se determina como sigue:
2 2
/ 2
2
2
/ 2
2
( )(1 )
( )
Z
n
E
Z p p
n
p
o
o
o
=

=
A
2
2
2 /
2
2 2
2 /
) (
) 1 )( (
) (
t
t t

o
o
o

=
p
Z
n
X
Z
n
104
Conceptos fundamentales
Ejemplo:
Cul es el tamao de muestra mnimo que al 95% de
nivel de confianza (Z=1.96) confirma la significancia de
una corrida en la media mayor a 4 toneladas/hora (E),
si la desviacin estndar (sigma) es de 20 toneladas?

n = (1.96^2)(20^2)/(4)^2 = 96

Obtener 96 valores de rendimiento por hora y determinar
el promedio, si se desva por ms de 4 toneladas, ya
ha ocurrido un cambio significativo al 95% de nivel de
confianza




105
Pruebas de Minitab
Permite hacer las siguientes pruebas:
Prueba z de una muestra
Prueba t de una muestra
Prueba t de dos muestras
Prueba de 1 proporcin
Prueba de 2 proporciones

ANOVA
Diseos factoriales de dos niveles
Diseos de Packett Burman
106
Estimacin puntual
y por intervalo
107
7B2. Estimacin puntual y por
intervalo
Las medias o desviaciones estndar calculadas de una muestra
se denominan ESTADSTICOS, podran ser consideradas como
un punto estimado de la media y desviacin estndar real de
poblacin o de los PARAMETROS.

Qu pasa si no deseamos una estimacin puntual como media
basada en una muestra, qu otra cosa podramos obtener como
margen, algn tipo de error?


Un Intervalo de Confianza

108
Intervalo de confianza
P(Z>= + Zexcel ) = alfa/2
P(Z<= - Zexcel ) = alfa/2
Intervalo de confianza donde
se encuentra el parmetro con
un NC =1-o
Error de estimacin
109
Estimacin puntual y por
intervalo
Cmo obtenemos un intervalo de confianza?

Estimacin puntual + error de estimacin

De dnde viene el error de estimacin?

Desv. estndar X multiplicador de nivel de confianza deseado Zo/2

Por Ejemplo: Si la media de la muestra es 100 y la desviacin
estndar es 10, el intervalo de confianza al 95% donde se
encuentra la media para una distribucin normal es:

100 + (10) X 1.96 => (80.4, 119.6) 1.96 = Z
0.025

110
Estimacin puntual y por
intervalo

95% de Nivel de Confianza significa que slo tenemos un 5% de
oportunidad de obtener un punto fuera de ese intervalo.

Esto es el 5% total, o 2.5% mayor o menor. Si vamos a la tabla Z veremos
que para un rea de 0.025, corresponde a una Z de 1.960.
C. I. Multiplicador Zo/2
99 2.576
95 1.960
90 1.645
85 1.439
80 1.282
Para tamaos de muestra >30, o o conocida usar la distribucin Normal
Para muestras de menor tamao, o o desconocida usar la distribucin t
111
Estimacin puntual y por
intervalo
. 30
2
. 30
2
2 2
2
2 2
, 1 1 , 1
2 2
2
( 1) ( 1)
(1 )
para n
para n
n n
X Z
n
X t
n
n s n s
p p
p Z
n
o
o
o o
o
o

o
_ _
t
>
<

=
=

s s

=
; con n-1 gl.
112
Instrucciones con Minitab
Intervalo de confianza para la media

Stat > Basic Statistics > 1-Sample Z, t

Variable -- Indicar la columna de los datos o Summarized Data

En caso de requerirse dar el valor de Sigma = dato

En Options:

Indicar el Confidence level -- 90, 95 o 99%

OK

113
Instrucciones con Minitab
Intervalo de confianza para proporcin

Stat > Basic Statistics > 1-Proportion

Seleccionar Summarized Data
Number of trials = n tamao de la muestra
Number of events = D xitos encontrados en la muestra

En Options:
Indicar el Confidence Interval -- 90, 95 o 99%

Seleccionar Use test and interval based in normal distribution

114
Para n grande el IC es pequeo
115
Ejemplo
Dadas las siguientes resistencias a la tensin: 28.7,
27.9, 29.2 y 26.5 psi

Estimar la media puntual
X media = 28.08 con S = 1.02

Estimar el intervalo de confianza para un nivel de
confianza del 95% (t = 3.182 con n-1=3 grados de
libertad)
Xmedia3.182*S/n = 28.083.182*1.02/2=(26.46, 29.70)
116
Ejemplos para la media con
Distribucin normal Z
Z 1. El peso promedio de una muestra de 50 bultos de productos
Xmedia = 652.58 Kgs., con S = 217.43 Kgs. Determinar el intervalo
de confianza al NC del 95% y al 99% donde se encuentra la media
del proceso (poblacional). Alfa = 1 - NC

2. Un intervalo de confianza del 90% para estimar la ganancia
promedio del peso de ratones de laboratorio oscila entre 0.93 y
1.73 onzas. Cul es el valor de Z?.

3. 100 latas de 16 onzas de salsa de tomate tienen una media de
Xmedia = 15.2 onzas con una S = 0.96 onzas. A un nivel de
confianza del 95%, las latas parecen estar llenas con 16 onzas?.

4. Una muestra de 16 soluciones tienen un peso promedio de 16.6
onzas con S = 3.63. Se rechaza la solucin si el peso promedio de
todo el lote no excede las 18 onzas. Cul es la decisin a un 90%
de nivel de confianza?.


117
Ejemplos para la media y varianza
con Distribucin t
t 5. 20 cajas de producto pesaron 102 grs. Con S = 8.5 grs. Cul
es el intervalo donde se encuentra la media y varianza del lote
para un 90% de nivel de confianza?. Grados libertad=20 -1 =19


6. Una muestra de 25 productos tienen un peso promedio de 23.87
grs. Con una S = 9.56. Cul es la estimacin del intervalo de
confianza para la media y varianza a un nivel de confianza del
95 y del 98% del peso de productos del lote completo?.

7. Los pesos de 25 paquetes enviados a travs de UPS tuvieron
una media de 3.7 libras y una desviacin estndar de 1.2 libras.
Hallar el intervalo de confianza del 95% para estimar el peso
promedio y la varianza de todos los paquetes. Los pesos de los
paquetes se distribuyen normalmente.


118
Ejemplos para proporciones con
Distribucin Z
Z 8. De 814 encuestados 562 contestaron en forma afirmativa.
Cul es el intervalo de confianza para un 90% de nivel de
confianza?

9. En una encuesta a 673 tiendas, 521 reportaron problemas de
robo por los empleados Se puede concluir con un 99% de nivel
de confianza que el 78% se encuentra en el intervalo de
confianza. ?

119
IV.B.2b Pruebas de hiptesis para
media, varianza y proporcin
120
Elementos de una
Prueba de Hiptesis
Prueba Estadstica- Procedimiento para decidir no rechazar Ho
aceptando Ha o rechazar Ho.

Hiptesis Nula (Ho) - Usualmente es una afirmacin representando
una situacin status quo. Generalmente deseamos rechazar la
hiptesis nula.

Hiptesis Alterna (Ha) - Es lo que aceptamos si podemos rechazar
la hiptesis nula. Ha es lo que queremos probar.

121
Elementos de una
Prueba de Hiptesis
Estadstico de prueba: Calculado con datos de la muestra (Z, t, X
2

or F).

Regin de Rechazo Indica los valores de la prueba estadstica para
que podamos rechazar la Hiptesis nula (Ho). Esta regin esta
basada en un riesgo o deseado, normalmente 0.05 o 5%.
122
Pasos en la Prueba de Hiptesis
1. Definir el Problema - Problema Prctico

2. Sealar los Objetivos - Problema Estadstico

3. Determinar tipo de datos - Atributo o Variable

4. Si son datos Variables - Prueba de Normalidad

123
Pasos en la Prueba de Hiptesis
5. Establecer las Hiptesis
- Hiptesis Nula (Ho) - Siempre tiene el signo =, s, >



- Hiptesis Alterna (Ha) Tiene signos =, > o <.



El signo de la hiptesis alterna indica el tipo de prueba a usar
hipotesis la de parametro Ho > s = , , , , :
2
t o
hipotesis la de parametro Ha < > = , , , , :
2
t o
124
Pasos en la Prueba de Hiptesis
6. Seleccionar el nivel de Alfa (normalmente 0.05 o 5%) o el
nivel de confianza NC = 1 - alfa

7. Establecer el tamao de la muestra, >= 10.

8.Desarrollar el Plan de Muestreo

9.Seleccionar Muestras y Obtener Datos

10. Decidir la prueba estadstica apropiada y calcular el
estadstico de prueba (Z, t, X
2
or F) a partir de los datos.
125
Estadsticos para medias,
varianzas y proporciones
2
1
1 2
2
2
1 2
1 2
2 2
1 1 2 2
1
1 2
; . ; 30;
/
; . ; 30;
/
; 1, 1; . . var
; . ; ' . .
1 1
/
( 1) ( 1)
;
2
p
p
X
Z Una media n conocida
n
X
t Una media n desconocida
S n
S
F DF n n prueba dos ianzas
S
X X
t dos medias s desconocidas pero
S
n n
n s n s
S DF n
n n

o
o

o
o

= >

= <
= =

= =
+
+
= =
+
2
1 2
2 2
1 2
1 2
2
; . ; ' .
.
n
X X
t dos medias s desconocidas diferentes
s s
n n
DF formula especial
o
+

=
+
=
126
Estadsticos para medias,
varianzas y proporciones
Para el caso de muestras pareadas se calculan las
diferencias d individuales como sigue:
2
2
2
2
2
; . . ; . . .
/
( 1)
; ( 1); . . ar
( )
; ( 1)( 1); .
i
d
d
t Pares de medias d para cada par
S n
n S
X DF n prueba una v ianza
O E
X DF r c bondad ajuste
E
o
=

= =

= =

127
Pasos en la Prueba de Hiptesis
11. Obtener el estadstico correspondiente de tablas o Excel.

12.Determinar la probabilidad de que el estadstico de prueba
calculado ocurre al azar.

13.Comparar el estadstico calculado con el de tablas y ver si
cae en la regin de rechazo o ver si la probabilidad es menor a
alfa, rechaze Ho y acepte Ha. En caso contrario no rechaze Ho.

14.Con los resultados interprete una conclusin estadstica
para la solucin prctica.
Prueba de Hiptesis
Pruebas de Hiptesis de dos colas:
Ho: a = b
Ha: a = b


Pruebas de Hiptesis de cola derecha:
Ho: a s b
Ha: a > b


Pruebas de Hiptesis cola izquierda:
Ho: a > b
Ha: a < b


Z
o/2 0
-Z
o/2
Regin de
Rechazo
Regin de
Rechazo
Z
o/2 0
Regin de
Rechazo
Z
o/2 0
-Z
o/2
Regin de
Rechazo
Estadstico
Calculado con
Datos de la muestra
129
Prueba de hiptesis para la varianza
Las varianzas de la poblacin se ditribuyen de
acuerdo a la distribucin Chi Cuadrada. Por tanto las
inferencias acerca de la varianza poblacional se
basarn en este estadstico

La distribucin Chi Cuadrada se utiliza en:
Caso I. Comparacin de varianzas cuando la varianza de
la poblacin es conocida

Caso II. Comparando frecuencias observadas y
esperadas de resultados de pruebas cuando no hay
una varianza de la poblacin definida (datos por
atributos)
130
Prueba de hiptesis para la varianza
Las pruebas de hiptesis para comparar una varianza
poblacional a un cierto valor constante o0, si la
poblacin sigue la distribucin normal es:




Con el estadstico Chi Cuadrada con n-1 grados de
libertad

131
Prueba de hiptesis para la varianza
Ejemplo: El material muestra una variacin (sigma) en la
resistencia a la tensin menor o igual a 15 psi con 95% de
confianza?. En una muestra de 8 piezas se obtuvo una S = 8psi.

X^2c =(7)(8)^2/(15)^2 = 1.99
Como La Chi calculada es menor a la Chi de Excel de 2.17 se debe
rechazar la hiptesis nula. Si hay decremento en la resistencia
2.17
132
Prueba de hiptesis para atributos
Ejemplo: Un supervisor quiere evaluar la habilidad de 3
inspectores para detectar radios en el equipaje en un
aeropuerto.
Hay diferencias significativas para un 95% de confianza?
Valores
observados O
Inspector
1
Inspector 2 Inspector 3 Total por
tratamiento
Radios
detectados
27 25 22 74
Radios no
detectados
3 5 8 16
Total de la
muestra
30 30 30 90
133
Prueba de hiptesis para atributos
Ho: p1 = p2 = p3
Ha: p1 = p2 = p3
Grados de libertad = (No. de columnas -1)*(No. renglones -1)
Las frecuencias esperadas son: (Total columna x Total rengln)
Valores
esperados E
Inspector
1
Inspector 2 Inspector 3 Total por
tratamiento
Radios
detectados
24.67 24.67 24.67 74
Radios no
detectados
5.33 5.33 5.33 16
Total de la
muestra
30 30 30 90
134
Prueba de hiptesis para atributos
El estadstico Chi Cuadrado en este caso es:








El estadstico Chi Cuadrada de alfa = 0.05 para 4 grados de
libertad es 5.99.
El estadstico Chi Cuadrada calculada es menor que Chi de alfa,
por lo que no se rechaza Ho y las habilidades son similares
5.99
Para una muestra grande (n>30)probar la hiptesis de una media u
1.) Ho: =
o
2.) Ha: =
o

3.) Calcular el estadstico de prueba
4.) Establecer la regin de rechazo
Las regiones de rechazo para prueba de 2 colas: -Z
o/2
Z
o/2

o
s
n
Z
calc
=
Si el valor del estadstico de prueba cae en la regin de rechazo
rechazaremos Ho de otra manera no podemos rechazar Ho.
Zo/2
0
-Z
o/2
Regin de
Rechazo
Regin de
Rechazo
Ejemplo de Prueba de hiptesis para la media
136
Prueba de hiptesis de una poblacin
para muestras grandes con Z

Parecera ser correcta la afirmacin de que se mantiene el precio promedio de las computadoras en $2,100?
Probarlo a un 5% de nivel de significancia
Datos
Minoristas n 64 media mu = 2100
Precio prom. X 2251
Desv. Estndar s 812 (Alfa = 0.05
Paso 1. Establecimiento de hiptesis
Ho: uC = 2100 Se inicia con el planteamiento de la hiptesis nula
Ha: uC <> 2100 Por tanto se trata de una prueba de dos colas
Paso 2. Clculo del estadstico de prueba Zc
151 = > Zc = 1.48768473
101.5 Error estndar
Como el valor de Zc es positivo se comparar contra de Zexcel (1-alfa/2) positivo
Paso 3. Determinar la Ze de Excel o de tablas para el valor de probabilidad (Alfa / 2):
Ze ( 0.025 ) = 1.95996398 DIST.NORM.STAND.INV.( -0.025 )
n
s
X
Z
NULA HIPOTESIS
c
.

=
137
Paso 4. Comparando los valores Zc calculado contra Zexcel se tiene
Zexcel ( #REF! ) Zexcel ( -0.025 )
-1.95996398 1.959963985
Zc = 1.487684729
Como Zc es menor que Zexcel, no cae en el rea de rechazo,
y por tanto no hay suficiente evidencia para RECHAZAR Ho
Se concluye que el precio promedio no es diferente de $2,100
O Como el valor P = 0.068 correspondiente a la Z calculada Zc es mayor
que el valor de Alfa / 2 = 0.025, tambin nos da el criterio
para NO RECHAZAR la Ho
Paso 5. El Intervalo de confianza para la media poblacional (1-Alfa = 0.95 Porciento)
al nivel de confianza 1-Alfa
Error estndar 101.5
Z alfa/2 1.95996398
Intervalo de confianza 2251 198.936344
El intervalo de confianza incluye a la media de la hiptesis
por tanto no se rechaza la Ho. 2052.064 <= <= ### )
P(Z>= + Zexcel ) = alfa/2 P(Z<= - Zexcel ) = alfa/2
n
s
Z X estimar para IC
2
. . .
o
=

138
Prueba de hiptesis de una poblacin
para muestras pequeas con t
Se piensa que las ventas promedio de $5,775 se han incrementado gracias a la campaa publicitaria
Probar esta afirmacin a un nivel de significancia alfa de 1%
Se inicia con el planteamiento de la hiptesis Alterna
Datos
Semanas n 15 media mu = 5775
Ventas prom X 6012
Desv. Estndar s 977 (Alfa = 0.01 (1-Alfa = 0.99
(Alfa/2 = 0.005 (1-Alfa/2 = 0.995
Paso 1. Establecimiento de hiptesis
Ho: uC <= 5775
Ha: uV > 5775 Se trata de una prueba de cola derecha
Paso 2. Clculo del estadstico de prueba tc
237 = > tc = 0.93950568
252.2603153 Error estndar
NOTA:En excel poner 2alfa
para obtener t de alfa
Como el valor de tc es positivo se comparar contra de t excel (1- alfa) positivo
Paso 3. Determinar la te de Excel o de tablas para Alfa 0.01
te ( 0.99 2.62449406 DIST.T.INV( 0.02 , gl. 14 )
n
s
X
t
NULA HIPOTESIS
c
.

=
Gl=14;
139
Paso 4. Comparando los valores tc calculado contra t excel se tiene
texcel ( 0.02 gl. 14)
2.62449406
tc = 0.939505684 Valor p para tc es igual a
P(tc) = 0.368130427
Como tc es menor que texcel, no cae en el rea de rechazo, p > Alfa
y por tanto no hay suficiente evidencia para rechazar Ho
Se concluye que la publicidad no ha tenido efecto en las ventas
O Como el valor de P para Zc es 0.368 mayor a Alfa = 0.05 no se rechaza Ho
Paso 5. El Intervalo de confianza para la media poblacional al nivel (1-Alfa = 99 Porciento)
Error estndar 252.260315
Z alfa/2 2.62449406
Como el intervalo de confianza Intervalo de confianza 6012 662.0557002
contiene a la media Hiptesis no se rechaza Ho 5349.94 <= <= 6674.06 )
P(t >= + t excel ) = alfa
n
s
t X estimar para IC
2
. . .
o
=

140
Instrucciones con Minitab para la
prueba de hiptesis de una media
Stat > Basic Statistics > 1-Sample Z, t

Variable -- Indicar la columna de los datos o Summarized Data

En caso de requerirse dar el valor de Sigma = dato

Proporcionar la Media de la hiptesis Test Mean

En Options:
Indicar el Confidence Interval -- 90, 95 o 99%

Indicar el signo de la hiptesis alterna: Less Than, Not equal,
Greater than
OK
141
Prueba de hiptesis
para una proporcin con Z
El gerente de mercado considera que el 50% de sus clientes gasta menos de $10 en cada visita a la tienda.
Ests de acuerdo con esta afirmacin a un nivel de significancia del 5%?
Se inicia con el planteamiento de la hiptesis nula
Datos
Clientes n 50 Proporcin media = 0.5
30 gastaron p 0.6
menos de$10 (Alfa = 0.05 (1-Alfa = 0.95
(Alfa/2 = 0.025 (1-Alfa/2 = 0.975
Paso 1. Establecimiento de hiptesis
Se trata de una prueba de dos colas
Paso 2. Clculo del estadstico de prueba Zc
0.1 = > Zc = 1.41421356
0.07071068 Error estndar
Como el valor de Zc es positivo se comparar contra de Zexcel (alfa/2) positivo
Paso 3. Determinar la Ze de Excel o de tablas para (1-Alfa/2 = 0.975
Ze ( (1-Alfa/2 = 1.95996398 DIST.NORM.STAND.INV.( 0.975 )
n
p
Z
NULA HIP NULA HIP
NULA HIPOTESIS
c
) 1 (
. .
.
t t
t

=
5 . 0 :
5 . 0 :
=
=
c
c
Ha
Ho
t
t
142
Paso 4. Comparando los valores Zc calculado contra Zexcel se tiene
Zexcel ( 0.025 ) Zexcel ( 0.975 )
-1.95996398 1.95996398
Zc = 1.41421356 Valor p para Zc es igual a
P(-Zc) = 0.07926984
Como Zc es menor que Zexcel, no cae en el rea de rechazo, p > Alfa /2
y por tanto no hay suficiente evidencia para rechazar Ho y se concluye
que el porcentaje que compra menos de $10 no difiere del 50% de clientes
O Como el valor P de Zc es 0.079 mayor a Alfa/2 no se rechaza Ho
Paso 5. El Intervalo de confianza para la media poblacional al nivel (1-Alfa = 95 Porciento)
Error estndar 0.07071068
Z alfa/2 1.41421356
Intervalo de confianza 0.6 0.1
Como la media de p = 0.6 se encuentra
dentro del intervalo, no se rechaza Ho ( 0.5 <= 0.7 )
P(Z <= - Zexcel ) = alfa/2
P(Z>= Zexcel ) = alfa/2
n
p p
Z p estimar para IC
) 1 (
. . .
2

=
o
t
<= t
143
Instrucciones con Minitab para la
prueba de hiptesis de una proporcin
Stat > Basic Statistics > 1-Proportion

Seleccionar Summarized Data

Number of trials = n tamao de la muestra
Number of events = D xitos encontrados en la muestra

En Options:
Indicar el Confidence Interval -- 90, 95 o 99%
Indicar la Test Proportion Proporcin de la hiptesis
Indicar el signo de la hiptesis alterna: Less Than, Not equal,
Greater than

Seleccionar Use test and interval based in normal distribution
OK
144
IV.B.2b Pruebas de hiptesis para
comparacin de varianzas, medias, y
proporciones
Prueba de Hiptesis
Supongamos que tenemos muestras de dos reactores que
producen el mismo artculo. Se desea ver si hay diferencia
significativa en el rendimiento de Reactor a Reactor.
Reactor A Reactor B
89.7 84.7
81.4 86.1
84.5 83.2
84.8 91.9
87.3 86.3
79.7 79.3
85.1 82.6
81.7 89.1
83.7 83.7
84.5 88.5

Estadsticas Descriptivas

Variable Reactor N Media Desv.Std

Rendimiento A 10 84.24 2.90
B 10 85.54 3.65

146
Prueba de Hiptesis
Pregunta Prctica: Existe diferencia entre los reactores?
Pregunta estadstica La media del Reactor B (85.54) es significativamente
diferente de la media del Reactor A (84.24)? O, su diferencia se da por
casualidad en una variacin de da a da.
Ho:
Ha:
a
a


=
=
b
b
Ho: Hiptesis Estadstica:
No existe diferencia entre los
Reactores
Ha: Hiptesis Alterna: Las
medias de los Reactores son
diferentes.
Se busca demostrar que los valores observados al parecer no
corresponden al mismo proceso, se trata de rechazar Ho.
147
Prueba de Hiptesis
Hiptesis Alterna: Cuando las
medias de Reactores son
diferentes. A esto se le llama
Hiptesis Alterna (Ha)
Hiptesis Estadstica: No
existe diferencia entre los
Reactores
Esto se llama Hiptesis Nula
(Ho)
Debemos demostrar que los valores que observamos al parecer no
corresponden al mismo proceso, que la Ho debe estar equivocada
148
Qu representa esto?
Reactor A
Reactor B
80.0 82.5 85.0 87.5 90.0 92.5
A AA AAAA A A
B B B B B BB B B B

Representan los reactores un proceso bsico?
Representan los reactores dos procesos diferentes?
149
Prueba F de dos varianzas
Si se toman dos muestras de dos poblaciones normales con
varianzas iguales, la razn de sus varianzas crea una
distribucin muestral F. Las hiptesis son las siguientes:




El estadstico F se muestra a continuacin donde S1 se
acostumbra tomar como la mayor

150
Prueba F de dos varianzas





Sea S1 = 900 psi, n1 = 9, s2 = 300 psi, n2 = 7. A un 95% de nivel de
confianza se puede concluir que hay menor variacin?

Ho: Varianza 1 <= Varianza 2 H1: Varianza 1 > Varianza 2
Grados de libertad para Var1 = 8 y para var 2 = 6

Falfa = F(0.05, 8, 6) = 4.15
Fcalculada = (900^2)/(300^2) = 9 >> Falfa, se rechaza Ho.
Hay evidencia suficiente para indicar que la variacin ya se ha
reducido
151
Prueba de hiptesis de dos pob.
comparando varianzas con F
Se quiere comprobar si las varianzas de dos diferentes mtodos de ensamble de CDs son diferentes en prod .
A un nivel de siginificancia del 5% Qu se puede concluir?
Mtodo 1 Mtodo 2
No. De CDs n1 15 n2 17 Alfa/2 0.025
Desv. Estan. s1 5.4 X2 4.8
Varianza s1
2
29.16 s2
2
23.04
Paso 1. Establecimiento de hiptesis
Por tanto se trata de una prueba de dos colas
Paso 2. Clculo del estadstico de prueba Fc
Grados de libertad
1.266 Numerador = n1 - 1 = 14
Denominador = n2 - 1 = 16
Tomamos a s1
2
como el mayor para comparar Fc contra Fexcel (1- Alfa/2)
Paso 3. Determinar la Fe de Excel o de tablas para Alfa/2 0.025
Fe (0.975) = 2.81701784 DIST.F.INV (0.025, 14,16)
2
2
2
1
2
2
2
1
:
:
o o
o o
=
=
Ha
Ho
2
2
2
1
s
s
Fc =
152
Paso 4. Comparando los valores Fc calculado contra Fexcel (0.025) se tiene
f(F)
Fe(0.025) = 2.81701784
Fc = 1.266 Valor p para Fc es igual a
P(Fc) = 0.32259599
Como Fc es menor que Fexcel, no cae en el rea de rechazo, p > Alfa / 2
y por tanto no hay suficiente evidencia para rechazar Ho
Se concluye que la varianza de los dos mtodos de ensamble no difieren
significativamente
P(F>= + 2.81 ) = alfa/2
153
Instrucciones con Minitab para la
comparacin de dos varianzas
Stat > Basic Statistics > 2-variances

Seleccionar samples in different columns o Summarized data
First-- Indicar la columna de datos de la muestra 1
Second- Indicar la columna de datos de la muestra 2

En Options:
Indicar el Confidence Interval -- 90, 95 o 99%


OK
154
Prueba de hiptesis de dos pob.
Comparando dos medias con Z
Investigar si el ambiente libre de tensiones mejoran el engorde y la calidad de la carne de vacas
Las varianzas poblacionales son desconocidas
Determinar el intervalo de confianza al 90% donde se encuentra la media. Alfa = 0.10
Vacas vacaciones Vacas normales
Vacas n1 50 n2 50
Peso promedio X1 112 X2 105.7
Desv. Estndar s1 32.3 s2 28.7
Paso 1. Establecimiento de hiptesis
Como el planteamiento es que las vacas de vacaciones
ganan ms peso, se inicia planeando la Ha
Paso 2. Clculo del estadstico de prueba Zc
6.3 = > Zc = 1.03099301
6.110613717
Tomamos a X1 como el mayor para comparar Zc contra Ze positiva
Paso 3. Determinar la Ze de Excel o de tablas para una alfa de 0.1
Ze (0.90) = 1.28155157 DIST.NORM.STAND.INV (0.90)
2 1
3
2
2
1
2 1
n
s
n
s
X X
Z
c
+

=
VN VV
VN VV
Ha
Ho


=
=
:
:
155
Paso 4. Comparando los valores Zc calculado contra Zexcel (0.90) se tiene
Ze (0.90)= 1.28
Zc = 1.03099301 Valor p para Zc es igual a
P(-Zc) = 0.149402368
p > Alfa
Como Zc es menor que Zexcel, no cae en el rea de rechazo,
y por tanto no hay suficiente evidencia para rechazar Ho
Se concluye que no hay diferencia entre vacas de vacaciones y normales
Paso adicional. El Intervalo de confianza del 90% sobre la diferencia de medias poblacionales,
con sigmas desconocidas es:
= Error estndar 6.11061372
Z (alfa/2) = 1.64485363
= Intervalo de confianza
6.3 + - 10.05106514
La diferencia es del orden de cero,es decir ( -3.75107 < = u < = 16.3511 )
P(Z>= + 1.28) = 0.90
2 1
2
2
2
1
2 1
n
s
n
s
X X
+ =

o
2 1 2 /
2 1 ) (
X X
s Z X X


o
156
Prueba de dos medias
muestras pequeas
Sigmas descono-
cidas e iguales
Sigmas desconocidas
y desiguales
157
Prueba de hiptesis de dos pob.
Comparando dos medias con t
Investigar si hay diferencia en los promedios de las ventas diarias de dos tiendas
Las varianzas de las dos poblaciones son iguales pero desconocidas
Determinar el intervalo de confianza al 99% donde se encuentra la media (alfa = 0.01)
Tienda 1 Tienda 2
Semanas n1 12 n2 15
Ventas promedio X1 125.4 X2 117.2
Desv. Estandar s1 34.5 s2 21.5
Paso 1. Establecimiento de hiptesis
Por tanto se trata de una prueba de dos colas
Paso 2. Clculo del estadstico de prueba tc
19564.25 Sp
2
= 782.57
25
8.2 = > tc = 0.75684444
10.8344589
Tomamos a X1 como el mayor para comparar tc contra te positiva
Si se toma a X1 como la media menor se debe comparar Zc contra -Ze
Paso 3. Determinar la te de Excel o de tablas para una alfa de 0.01 que corresponde a alfa/2 = 0.005
Se tienen n1 + n2 - 2 grados de libertad o sean 25
te (0.01) = 2.78743581 DIST.T.INV (0.01, 25) Asi es para dos colas
2 2 1
) 1 2 ( ) 1 1 (
2
2
2
1 2
+
+
=
n n
n s n s
s
p
2 1
3 2
2 1
n
s
n
s
X X
t
p p
c
+

=
2
2
2
1
o o =
2 1
2 1
:
:
T T
T T
Ha
Ho


=
=
158
Paso 4. Comparando los valores tc calculado contra texcel (0.01) se tiene
te(0.01,25) = -2.787 te(0.01, 25) = 2.787
Valor p para tc es igual a
tc = 0.7568 P(tc) = 0.46025521
p > Alfa / 2
Como tc es menor que texcel, no cae en el rea de rechazo,
y por tanto no hay suficiente evidencia para rechazar Ho
Se concluye que no hay diferencia sig. En las ventas de las dos tiendas
Paso adicional. El Intervalo de confianza del 99% sobre la diferencia de medias poblacionales,
con sigmas desconocidas es:
= Error estndar 10.8344589
= Intervalo de confianza (8.2 + - 2.787*10.83)
Se observa una diferencia positiva sin embargo el cero est incluido ( -21.98 <= u <= 38.38)
P(t>=2.787 ) = alfa/2 P(t<=-2.787 ) = alfa/2
2 1
) (
2 2
2 /
2 1
n
s
n
s
t X X
p p
+
o
2 1
2 2
n
s
n
s
p p
+
159
Instrucciones con Minitab para la
comparacin de dos medias
Stat > Basic Statistics > 2-Sample t

Seleccionar samples in different columns o Summarized data
First-- Indicar la columna de datos de la muestra 1
Second- Indicar la columna de datos de la muestra 2
Seleccionar o no seleccionar Assume equal variances de acuerdo a
los resultados de la prueba de igualdad de varianzas

En Options:
Indicar el Confidence Interval -- 90, 95 o 99%
Indicar la diferencia a probar Test Difference (normalmente 0)
Indicar el signo de la hiptesis alterna: Less Than, Not equal,
Greater than
En graphs seleccionar las graficas Boxplot e Individual value plot
OK
160
Prueba de hiptesis de dos pob.
Comparando dos proporciones con Z
Investigar si tiene razon el analista sobre si los bonos convertibles se sobrevaloraron ms que los
bonos de ingresos.
Probar la hiptesis a un 10% de nivel de significancia o error de equivocarse en rechazar Ho.
Convertibles Ingresos
Bonos n1 312 n2 205 Alfa 0.1
Sobrevalorad X1 202 X2 102 1-Alfa 0.9
7.8
p1 0.647 p2 0.498 Fraccin de las muestras
Paso 1. Establecimiento de hiptesis
Por tanto se trata de una prueba de cola derecha
Paso 2. Clculo del estadstico de prueba Zc
0.150 = > Zc = 3.393046759
0.04417119
Tomamos a p1 como el mayor para comparar Zc contra Ze positiva (1- Alfa)
Paso 3. Determinar la Ze de Excel o de tablas para 1-Alfa 0.9
Ze (0.9) = 1.28155157 DIST.NORM.STAND.INV (0.9)
2
) 1 (
1
) 1 (
2 2 1 1
2 1
n
p p
n
p p
p p
Z
c


=
2 1 2 1
2 1 2 1
: ...... .......... .......... 0 :
: .... . .... 0 :
t t t t
t t t t
> >
s s
Ha Ha
Ho forma otra Ho
161
Paso 4. Comparando los valores Zc calculado contra Zexcel (0.9) se tiene
Zc = 3.39304676
Ze(0.9) = 1.281551566
Valor p para Zc es igual a
P(-Zc) = 0.00034946
p < Alfa
Como Zc es mayo que Zexcel, si cae en el rea de rechazo,
y por tanto hay suficiente evidencia para rechazar Ho y aceptar Ha
Se concluye que la diferencia en conv. entre los bonos es significativa
Paso adicional. El Intervalo de confianza del 98% sobre la diferencia de medias poblacionales,
con sigmas desconocidas es:
= Error estndar 0.044171193
Zexcel (para alfa/2) 1.644853627
= Intervalo de confianza ( 0.150 0.07265515
Se observa difererencia positiva entre proporciones ( 0.077 <= PI <= 0.223
el cero no est incluido en el intervalo
P(Z>= + 1.28 ) = Alfa
2
) 1 (
1
) 1 (
2 2 1 1
2 1
n
p p
n
p p
s
p p

2 1 2 / 2 1
) (
p p
s Z p p


o
162
Instrucciones con Minitab para la
prueba de hiptesis de dos proporciones
Stat > Basic Statistics > 2-Proportions

Seleccionar Summarized Data
Trials: Events:
First: No. de elementos de la 1. Muestra y D1 xitos encontrados
Second: No. de elementos de la 2. Muestra y D2 xitos encontrados

En Options:
Indicar el Confidence Interval -- 90, 95 o 99%
Indicar la Test Difference Normalmente 0
Indicar el signo de la hiptesis alterna: Less Than, Not equal,
Greater than

Seleccionar Use pooled estimate of p for test
OK
163
IV.B.3 Prueba de datos pareados
164
Prueba de hiptesis de dos pob.
Comparando datos pareados con t
Las muestras pareadas de tamao 25 reportaron una diferencia media de 45.2 y una desviacin
estndar de las diferencias de 21.6. Pruebe la igualdad de medias a un nivel del 5%.
Paso 1. Establecimiento de Hiptesis
No. Pares de muestras n = 25
Paso 2. Se calcula el estadstico tc: Diferencia media = 45.2
Desv. Estndar de difs. = 21.6
Alfa 0.05
gl = 24
= 10.462963
Paso 3. Se determina el valor crtico del estadstico t de Excel o tablas para Alfa / 2 0.025
t excel = 2.06389855 DISTR.T.INV(0.05, 24) Excel divide entre 2 colas
2 1
2 1
:
:


=
=
Ha
Ho
n
s
d
t
d
c
=
Grados de libertad = No. de pares - 1
165
Paso 4. Comparando el estadstico tcalculado contra t excel (0.025, 24) se tiene:
tc = 10.462963
te(0.025,24) = -2.063 te(0.025, 24) = 2.063
Valor p para tc es igual a
P(t > tc) = 0
p < Alfa / 2
Como tc es mayor que t excel, si cae en el rea de rechazo,
y por tanto si hay suficiente evidencia para rechazar Ho y aceptar Ha
se concluye que si hay diferencia significativa entre las medias
Paso 5. El intervalo de confianza para las diferencias en medias pareadas es
t alfa/2 = 2.063
Error estndar = 0.864
Dif. Promedio = 45.2
45.2 + - 0.864
Se observa diferencia positiva significativa entre diferencia de medias 43.4176 <= dm < =46.9824
P(t>=2.063 ) = alfa/2
P(t<=-2.063 ) = alfa/2
n
s
t d para C I
d
d 2 /
. . .
o
=
166
Instrucciones con Minitab para la
comparacin de dos medias pareadas
Stat > Basic Statistics > Paired t

Seleccionar samples in columns o Summarized data
First sample - Indicar la columna de datos de la muestra 1
Second sample - Indicar la columna de datos de la muestra 2

En Options:
Indicar el Confidence Interval -- 90, 95 o 99%
Indicar la diferencia a probar Test Mean (normalmente 0)
Indicar el signo de la hiptesis alterna: Less Than, Not equal,
Greater than
En graphs seleccionar las graficas Boxplot e Individual value plot
OK
167
Robustez
Los procedimientos estadsticos se basan en
supuestos acerca de su comportamiento terico.
Cuando los estadsticos obtenidos no son afectados
por desviaciones moderadas de su expectativa
terica, se dice que son robustos.
168
Resumen
169
IV.B:4 ANOVA para un factor
170
Introduccin
Cuando es necesario comparar 2 o ms medias poblacionales al
mismo tiempo, para lo cual se usa ANOVA.

El mtodo ANOVA tiene los siguientes supuestos:
La varianza es la misma para todos los tratamientos del
factor en todos sus niveles
Las mediciones indiviudales dentro de cada tratamiento se
distribuyen normalmente
El trmino de error tiene un efecto distribuido normalmente
e independiente
171
Introduccin
Con el ANOVA las variaciones en la respuesta se dividen
en componentes que reflejan los efectos de una o ms
variables independientes

La variabilidad se representa como la suma de cuadrados
total que es la suma de cuadrados de las desviaciones de
mediciones individuales respecto a la gran media, se
divide en:
Suma de cuadrados de las medias de los tratamientos
Suma de cuadrados del residuo o error experimental
172
ANOVA Prueba de hiptesis para
probar la igualdad de medias de
varias poblaciones para un factor
diferentes son s unas A Ha
Ho
a
. . ' . lg :
......... :
3 2 1

= = = =
Se trata de probar si el efecto de un factor o
Tratamiento en la respuesta de un proceso o sistema es
Significativo, al realizar experimentos variando
Los niveles de ese factor (Temp. 1, Temp. 2, Temp.3, etc.)
173
ANOVA - Condiciones
Todas las poblaciones son normales

Todas las poblaciones tiene la misma varianza

Los errores son independientes con distribucin
normal de media cero

La varianza se mantiene constante para todos los
niveles del factor

174
ANOVA Ejemplo de datos
Niveles del Factor Peso % de algodn y Resistencia de tela
Peso porc. Respuesta
de algodn Resistencia de la tela
15 7 7 15 11 9
20 12 17 12 18 18
25 14 18 18 19 19
30 19 25 22 19 23
35 7 10 11 15 11
175
ANOVA Suma de
cuadrados total
Xij
Xij
Gran media
2
1 1
) (

= =
=
b
j
a
i
X Xij SCT
176
ANOVA Suma de cuadrados de
renglones (a)-tratamientos
Gran media
Media Trat. 1
Media Trat. a
Media trat. 2
a renglones

=
=
a
i
i
X X b SCTr
1
2
) (
177
ANOVA Suma de cuadrados
del error
Media X1.
X1j
X3j
X2j
Media X2.
Media X3.
Muestra 1 Muestra 2 Muestra 3
2
1 1
) (
i
b
j
ij
a
i
X X SCE =

= =
178
ANOVA Suma de cuadrados
del error
Media X1.
X1j
X3j
X2j
Media X2.
Media X3.
Muestra 1 Muestra 2 Muestra 3
SCTr SCT SCE =
179
ANOVA Grados de libertad:
Totales, Tratamientos, Error
a n a n SCE gl
a SCTr gl
n SCT gl
= =
=
=
) 1 ( ) 1 ( .
1 .
1 .
180
ANOVA Cuadrados medios:
Total, Tratamiento y Error
) /(
) 1 /(
) 1 /(
a n SCE MCE
a SCTr MCTr
n SCT MCT
=
=
=
181
ANOVA Clculo del estadstico
Fc y Fexcel
SCE gl SCTr gl ALFA
FINV Fexcel
MCE
MCTr
Fc
. , . ,
=
=
182
Tabla final de ANOVA
TABLA DE ANOVA
FUENTE DE VARIACIN SUMA DE GRADOS DE CUADRADO VALOR F
CUADRADOS LIBERTAD MEDIO
Entre muestras (tratam.) SCTR a-1 CMTR CMTR/CME
Dentro de muestras (error) SCE n-a CME
Variacin total SCT n-1 CMT
Regla: Rechazar Ho si la Fc de la muestra es mayor que la F de Excel para una cierta alfa
o si el valor p correspondiente a la Fc es menor al valor de alfa especificado
183
ANOVA Toma de decisin
Fexcel
Fc
Alfa
Zona de rechazo
De Ho o aceptar Ha
Zona de no rechazo de Ho
O de no aceptar Ha
Distribucin F
184
ANOVA Toma de decisin
Si Fc es mayor que Fexcel se rechaza Ho
Aceptando Ha donde las medias son diferentes

O si el valor de p correspondiente a Fc es
menor de Alfa se rechaza Ho
185
ANOVA Identificar las medias
diferentes por Prueba de Tukey T
Para diseos balanceado
(mismo nmero de columnas
en los tratamientos) el valor
de q se determina por medio
de la tabla en el libro de texto
b
CME
q T
a n a
=
, , o
186
ANOVA Identificar las medias
diferentes por Prueba de Tukey T
Se calcula la diferencia Di entre cada par de Medias Xis:

D1 = X1 X2 D2 = X1 X3 D3 = X2 X3 etc.

Cada una de las diferencias Di se comparan con el
valor de T, si lo exceden entonces la diferencia es
Significativa de otra forma se considera que las medias
Son iguales
187
ANOVA Identificar las medias
diferentes por Prueba de Diferencia
Mnima Significativa DMS
Para diseos balanceados (los tratamientos
tienen igual no. De columnas), se calcula un
factor DMS contra el que se comparan las
diferencias Xi Xi. Significativas si lo exceden
b
F CME
DMS
a n
=
, 1 ,
) ( 2
o
188
Prueba DMS para Diseos no
balanceados
a n a
k j
k j
F CME
b b
DMS

(
(

+ =
, 1 , ,
) (
1 1
o
Para diseos no balanceados (los
tratamientos tienen diferente no. De
columnas), se calcula un factor DMS
Para cada una de las diferencias Xi Xi
189
Ejemplo:
Considerar un experimento de un factor (mquina)
con tres niveles (mquinas A, B, C). Los datos se
muestran a continuacin y debe verificarse si existe
diferencia significativa a un alfa = 0.05
Mquinas Datos
Su
ma
Prom.
190
Ejemplo:
Como el valor calculado de F(33.2) excede el valor crtico de F, se
rechaza la Hiptesis nula Ho
La tabla completa de ANOVA es la siguientes:
Fuentes
De variacin
Mquinas
Cuadrado
medio
191
Ejemplo:
Con Minitab: Stat>ANOVA>One way unstacked
Responses (in separate columns) A B C
Interpretar los resultados

A B C
5 2 1
7 0 0
6 1 -2
7 -2 -3
6 2 0
192
Ejemplo:
One-way ANOVA: A, B, C
Source DF SS MS F P
Factor 2 137.20 68.60 33.19 0.000 Rechazo Ho
Error 12 24.80 2.07
Total 14 162.00
S = 1.438 R-Sq = 84.69% R-Sq(adj) = 82.14%
Individual 95% CIs For Mean Based on
Pooled StDev
Level N Mean StDev ---------+---------+---------+---------+
A 5 6.200 0.837 (-----*----)
B 5 0.600 1.673 (----*-----)
C 5 -0.800 1.643 (-----*----)
---------+---------+---------+---------+
0.0 2.5 5.0 7.5
Pooled StDev = 1.438
193
Corrida en Minitab
Se introducen las respuestas en una columna C1
Se introducen los subndices de los renglones en una
columna C2



Durability Carpet
18.95 1
12.62 1
11.94 1
14.42 1
10.06 2
7.19 2
7.03 2
14.66 2
194
Corrida en Minitab
Opcin: stat>ANOVA One Way (usar archivo
Exh_aov)
En Response indicar la col. De Respuesta (Durability)

En factors indicar la columna de subndices (carpet)
En comparisons (Tukey)

Pedir grfica de Box Plot of data y residuales Normal
Plot y vs fits y orden

Si los datos estan en columnas pedir ANOVA One
Way (unstacked)

195
Resultados
One-way ANOVA: Durability versus Carpet
Source DF SS MS F P
Carpet 1 45.1 45.1 3.97 0.093 -> No hay diferencia entre las medias
Error 6 68.1 11.3
Total 7 113.1
S = 3.368 R-Sq = 39.85% R-Sq(adj) = 29.82%
Individual 95% CIs For Mean Based on
Pooled StDev
Level N Mean StDev ----+---------+---------+---------+-----
1 4 14.483 3.157 (----------*-----------)
2 4 9.735 3.566 (-----------*-----------)
----+---------+---------+---------+-----
7.0 10.5 14.0 17.5
Pooled StDev = 3.368
Tukey 95% Simultaneous Confidence Intervals
All Pairwise Comparisons among Levels of Carpet
Individual confidence level = 95.00%
Carpet = 1 subtracted from:
Carpet Lower Center Upper -+---------+---------+---------+--------
2 -10.574 -4.748 1.079 (-----------*----------)
-+---------+---------+---------+--------
-10.0 -5.0 0.0 5.0
196
IV.B.5 Uso de Prueba Chi
2 (
_
2)
197
Para qu se utiliza?

1. Para probar si una serie de datos
observada, concuerda con el modelo (serie
esperada) de la informacin.

2. Para probar las diferencias entre las
proporciones de varios grupos (tabla de
contingencia).

_
2
Ho: No hay diferencia
Ha: Hay diferencia
Para todos los casos,
198
H
o
: La moneda es buena

H
a
: La moneda est cargada
Se lanza una moneda al aire 100 veces y que
obtenemos 63 guilas y 37 soles.

La proporcin de guilas y soles sucede por
casualidad? O, se concluye que la moneda est
cargada?
Ejemplo 1: Chi Cuadrada(_
2
)
199
_
2
c=
E
j = 1
g
Estadstico Chi Cuadrada


Observada Esperada
Aguilas 63 50 3.38
Soles 37 50 3.38
_
2
= 3.38 + 3.38
_
2
= 6.76
(f
o
- f
e
)
2
f
e ( f
o
) ( f
e
)
Ejemplo 1: Chi Cuadrada(_
2
)
f
e
(f
o
- f
e
)
2
200
Funcin de Distribucin Acumulada Chi
2
con 1 grado de
libertad (d.f)
H
o
: La moneda es buena.
H
a
: La moneda est cargada.

Para un 95% de confianza antes de concluir que la moneda est
cargada, se requiere que X
2
c
> X
2
Crtica
o que el valor de p sea s
0.05.

Como p s 0.05, se puede concluir -con un 95% de confianza -
que la moneda est cargada.

_2
c
P(_2
c
> x)
6.7600 p = 1 - 0.9907 = 0.0093

De tablas X
2
Crtica,

(0.05, 1)
= 3.8414
Ejemplo 1: Chi cuadrada
201
1. Posicionarse en una celda vaca

2. Accesar el men de funciones con Fx

3. Seleccionar STATISTICAL o ESTADSTICAS, CHIINV.

4. Dar valores de probabilidad (0.05) y grados de libertad,
normalmente (n - 1) para un parmetro o (# de renglones -1)
* (# de columnas - 1) para el caso de tablas de proporciones.


Clculo en Excel del estadstico Chi cuadrada
202
Tabla de contingencia
Una tabla de clasificacin de dos vas (filas y columnas) que
contiene frecuencias originales, se puede analizar para
determinar si las dos variables (clasificaciones) son
independientes o tienen una asociacin significativa.

La prueba Chi Cuadrada probar si hay dependencia entre las
dos clasificaciones.

Adems se puede calcular el coeficiente de contingencia
(correlacin) que en todo caso muestra la fuerza de la
dependencia
203
Tabla de contingencia
Para esta prueba se usa la prueba Chi Cuadrada donde:





Entre mayor sea su valor, mayor ser la diferencia de la
discrepancia entre frecuencias observadas y tericas. Esta
prueba es similar a la de bondad de ajuste.


204
Tabla de contingencia
Ejemplo: Cada una de las 15 celdas hace una contribucin al
estadstico Chi Cuadrado (una celda)







Asumiendo Alfa = 0.1 y Gl= (reng 1)*(Col 1) = 4*2 = 8 Chi-
Cuadrado de alfa = 20.09
Como Chi Cuadrada calculada >> Chi C. Alfa, se rechaza Ho de
igualdad de resultados entre negocios



Los valores observados (f
o
) son los siguientes:
Ho: No existen diferencias en los ndices de defectos de las dos mquinas.
Ha: Existen diferencias en los ndices de defectos de las dos mquinas.
Total 751 28

El ndice de defectos totales es 28 / 779 = 3.6%

mquina 1 f
o
= 517 f
o
= 17 Total = 534
Partes buenas
mquina 2 f
o
= 234 f
o
= 11 Total = 245
779

Partes defectuosas

Ejemplo 2: Chi
2
Para comparacin de dos
grupos; son las mismas proporciones?)
Clculo de los valores esperados

Basados en este ndice, los valores esperados (f
e
) seran:
mquina 1 f
o
= 751*534/779 f
o
= 28*534/779 Total = 534
Partes buenas
mquina 2 f
o
= 751*245/779 f
o
= 28*245/779 Total = 245
779

Partes defectuosas
mquina 1 530.53 3.47
Partes
buenas
mquina 2 233.47 1.53
Partes defectuosas
Ejemplo 2: Chi
2
Para comparacin de dos
grupos; son las mismas proporciones?)
Nota: Chi cuadrada no podr aplicarse en los casos donde los conteos seas menores a 5 en > 20%
de celdas.
Si cualquiera de los conteos esperados en las celdas es menor a uno, no deber usarse Chi
2
.

Si algunas celdas tienen un conteo menor a los esperados, ya sea combinando u omitiendo
renglones y/o columnas, las categoras pueden ser de utilidad.
Prueba de chi cuadrada:


Los conteos esperados estn debajo de los conteos observados
Partes buenas Partes Defectuosas Total
1 532 2 534
530.53 3.47

2 232 3 235
233.47 1.53
Total 764 5 769

Chi
2
= 0.004 + 0.624 + 0.009 + 1.418 = 2.056
DF= 1; valor de p = 0.152

2 celdas con conteos esperados menores a 5.0
Problema: Fugas
Beneficios Potenciales: $10,000 de ahorro en retrabajos, y en la
reduccin de tiempo de ciclo.

Variacin en familias a probar
Operador a operador
H
o
: No existe diferencia en los ndices de defecto de los diferentes
operadores
H
a
: Existe diferencia en los ndices de defecto de los diferentes
operadores

Mquina a mquina
H
o
: No existe diferencia en los ndices de defecto de las diferentes
mquinas
H
a
: Existe diferencia en los ndices de defecto de las diferentes
mquinas

Tamao de la muestra:
5000 + total de oportunidades (172 piezas)
Los conteos esperados estn colocados debajo de los conteos observados
Con fugas Sin fugas Total
1 30 610 640
32.11 607.89

2 235 4217 4452
223.38 4228.62

3 3 253 256
12.84 243.16

4 18 334 352
17.66 334.34

Total 286 5414 5700

Chi
2
= 0.139 + 0.007 + 0.604 + 0.032 + 7.546 + 0.399 + 0.006 +
0.000 = 8.734
DF= (4-1)(2-1) = 3; valor P = 0.033
Prueba de chi
2
(mquina a mquina)
Los conteos esperados estn colocados debajo de los conteos observados.
Con gotera Sin gotera Total
1 6 122 128
6.61 121.39

2 1 127 128
6.61 121.39

3 200 3836 4036
208.55 3827.45

4 54 202 256
13.23 242.77

5 5 699 704
36.38 667.62

6 12 116 128
6.61 121.39
Total 278 5102 5380

Chi
2
= 0.057 + 0.003 + 4.765 + 0.260 + 0.351 + 0.019 +125.666 + 6.847 + 27.065 + 1.475
+ 4.386 + 0.239 = 171.132
DF= 5; valor P = 0.000
Prueba de chi
2
(operador a operador)
Qu sucede si los grupos mltiples de variacin son estadsticamente significativos?
(en este caso, operador a operador y mquina a mquina)
Se utiliza un procedimiento denominado Coeficiente de Contingencia como clave
para determinar qu grupo de variacin debe investigarse primero.
Coeficiente de
Contingencia

x 100
Chi

Cuadrada
N
Chi
2
N CC

Mquina 8.734 5700 0.15

Operador 171.132 5380 3.18
Controlador Mayor

SI el tamao de la muestra (N), es similar para los grupos. Al dividir entre N,
probablemente, llevar a la misma ruta que hubiera alcanzado con slo ver la
estadstica Chi
2
.

Sin embargo, si N tiene una variacin considerable, dependiendo del grupo de
variacin que se investiga, el coeficiente de contingencia puede ser una herramienta
valiosa para determinar la prioridad sobre qu grupo debe investigarse primero.
Con gotera Sin gotera Total
1 6 122 128
6.61 121.39

2 1 127 128
6.61 121.39

3 200 3836 4036
208.55 3827.45

4 54 202 256
13.23 242.77

5 5 699 704
36.38 667.62

6 12 116 128
6.61 121.39
Mucho peor que
lo esperado
Mucho mejor que
lo esperado
Ahora que la informacin nos
ha llevado a investigar a los
grupos de operador a
operador. Qu debemos
hacer ahora?
Encontremos cul de los
operadores estaban fuera del
estndar.
Era alguno de ellos
notablemente peor (o mejor)
que el resto?
(Estos mismos operadores fueron quienes
tuvieron los nmeros ms grandes de chi
2
)
Qu sucede si los grupos mltiples de variacin son estadsticamente significativos?
(en este caso, operador a operador y mquina a mquina)
Operador a operador: = 0.000
Rechace
H
o
y acepte H
a

(Existe una diferencia significativa entre los operadores)

Los operadores 4 y 5 estn fuera del estndar:
El operador 4 es notablemente peor que el resto,
El operador 5 es notablemente mejor que los dems

Cul es el prximo paso? Hable con todos los operadores para averiguar qu diferencias
pueden existen en sus tcnicas.

El operador 4 no tena experiencia en este tipo de trabajo y apenas se estaba acostumbrado a
soldar este producto en particular.

El operador 5 encontr un modo de mejor de hacer el ensamble, con lo cual consigui mejorar
el trabajo de soldadura, aunque esto mostraba un grado de dificultad ergonmica. Se aadi
un colocador para ensamblar la parte en forma segura. (Esto tambin redujo el tiempo que
requeran los operadores para acostumbrarse a trabajar en esta forma)
Ejercicios

1. Se quiere evaluar la habilidad de tres inspectores de rayos
X en un aeropuerto para detectar artculos clave. Como
prueba se pusieron radios de transistores en 90 maletas,
cada inspector fue expuesto a 30 maletas conteniendo radios
mezcladas entre otras que nos los contenan. Los resultados
se resumen a continuacin:
Inspectores
1 2 3

Radios detectados 27 25 22
Radios no detectados 3 5 8

Con un 95% de confianza, existe una diferencia entre los
inspectores?

Ho: p1 = p2 = p3; Ha: al menos una es diferente
Grados de libertad = (columnas - 1) ( filas -1)
Ejercicios

2. Se quiere evaluar si hay preferencia por manejar en un
carril de una autopista dependiendo de la hora del da. Los
datos se resumen a continuacin:

Hora del da
Carril 1:00 3:00 5:00
Izquierdo 44 37 18
Central 28 50 72
Derecho 8 13 30

Con un 95% de confianza, existe una diferencia entre las
preferencias de los automovilistas dependiendo de la hora?

Ho: P1 = P2 = P3; Ha: al menos una es diferente
Grados de libertad = (columnas - 1) ( filas -1)
216
IV.B.6 Pruebas de Hiptesis
no paramtricas
217
Pruebas no paramtricas
Las pruebas paramtricas asumen una distribucin para la
poblacin, tal como la Normal

Las pruebas no paramtricas no asumen una distribucin
especfica de la poblacin

Bajo los mismos tamaos de muestra la Potencia o probabilidad
de rechazar Ho cuando es falsa es mayor en las pruebas
paramtricas que en las no paramtricas

Una ventaja de las pruebas no paramtricas es que los
resultados de la prueba son ms robustos contra violacin de
los supuestos

Prueba de Hiptesis
Variable
Atributo
Tablas de
Contingencia de
Correlacin
No Normal
Normal
Varianza
Medianas
Variancia
Medias

Prueba-F
Homogeneidad
de la Variacin
de Levene
Homogeneidad
de la Variacin
de Bartlett
Correlacin
Prueba de signos
Wilcoxon
Mann-
Whitney
Kurskal-
Wallis
Prueba de Mood
Friedman
Pruebas de t
ANOVA
Correlacin
Regresin
Muestra-1
Muestra-2
Una va
Dos vas
Residuos
distribuidos
normalmente
219

Pruebas de Varianzas
Homogeneidad de la varianza de
Levene : Compara dos o ms
varianzas de muestras de la misma
poblacin.


Pruebas de Variancias

X
2
: Compara la variancia de una
muestra con una variancia de un
universo conocido.

Prueba F : Compara dos varianzas
de muestras.

Homogeneidad de la variancia de
Bartlett: Compara dos o ms
varianzas muestras de la misma
poblacin.


Datos Normales Datos No Normales
Resumen de pruebas de Hiptesis
220
Pruebas de la Mediana

Prueba de signos o Prueba Wilcoxon : Prueba
si la mediana de la muestra es igual a un valor
conocido o a un valor a alcanzar.
Prueba Mann-Whitney : Prueba si dos medianas
de muestras son iguales.
Prueba Kruskal-Wallis: Prueba si ms de dos
medianas de muestras son iguales. Asume que
todas las distribuciones tienen la misma forma.
Prueba de la mediana de Mood : Otra prueba
para ms de dos medianas. Prueba ms firme
para los valores atpicos contenidos en la
informacin.
Prueba Friedman : Prueba si las medianas de las
muestras, clasificadas bajo dos categoras, son
iguales.
Correlacin : Prueba la relacin lineal entre dos
variables.
Pruebas de los Promedios

Prueba t de 1 muestra : Prueba si el promedio
de la muestra es igual a un promedio
conocido o meta conocida.
Prueba t de 2 muestras : Prueba si los dos
promedios de las muestras son iguales.
ANOVA de un factor: Prueba si ms de dos
promedios de las muestras son iguales.
ANOVA de dos factores : Prueba si los
promedios de las muestras clasificadas
bajo dos categoras, son iguales.

Correlacin : Prueba la relacin lineal entre
dos variables.

Regresin : Define la relacin lineal entre una
variable dependiente y una independiente.
(Aqu la "normalidad" se aplica al valor
residual de la regresin)

Datos Normales Datos No Normales
Resumen de pruebas de Hiptesis
Revise y asegrese de que los datos no siguen una distribucin normal.

Desarrollar una Prueba de normalidad (para verificar realmente lo
anormal. Para la prueba de Bartlet el valor de p debe ser < 0.05)

Desarrollar una Prueba de Corridas (para verificar que no existen
sucesos no aleatorios que puedan haber distorsionado la informacin)

Revisar la informacin para detectar errores (tipogrficos, etc.).
Investiguar los valores atpicos.

Una muestra pequea (n < 30) proveniente de un universo normal, se
mostrar algunas veces como anormal.

Intentar transformar los datos. Las transformaciones comunes incluyen:
- Raz cuadrada de todos los datos
- Logaritmo de todos los datos
- Cuadrado de todos los datos

Si la informacin es todava anormal, entonces usar las herramientas no
paramtricas.
Acciones a tomar con datos No Normales
Promedio : Es la media aritmtica de la informacin. Es la suma de todos
los datos, dividida entre el nmero de datos de referencia.

Mediana: Valor del punto medio de los datos, cuando se ordenan en forma
ascendente (en caso de datos pares, obtener promedio).

Moda : Valor que se repite con ms frecuencia sobre el conjunto de datos.
Ejemplo:
Se cuestion a veinte personas sobre cunto tiempo les tomaba estar
listas para ir a trabajar, en las maanas. Sus respuestas (en minutos) se
muestran ms adelante. Cules son el promedio y la mediana para esta
muestra?

30, 37, 25, 35, 42, 35, 35, 47, 45, 60
39, 45, 30, 38, 35, 40, 44, 55, 47, 43


Definiciones
Un dibujo dice ms que mil palabras
El promedio puede estar influenciado considerablemente por los
valores atpicos porque, cuando se calcula un promedio, se incluyen los
valores reales de estos valores.

La mediana, por otra parte, asigna la misma importancia a todas las
observaciones, independientemente de los valores reales de los
valores atpicos, ya que es la que sencuentra en la posicin media de
los valores ordenados.

Promedio = 40.35 Mediana = 39.5


-------+---------+---------+---------+---------+---------+------ C1
Promedio
Mediana
28.0 35.0 42.0 49.0 56.0 63.0

Pruebas Alternativas comnmente usadas
Pruebas para datos No normales

Prueba de Corridas : Calcula la
probabilidad de que un X nmero de
puntos de referencia, est por encima o
por debajo del promedio aleatoriamente.

Prueba de signos, de 1 muestra :
Prueba la probabilidad de que la
mediana de la muestra, sea igual al valor
hipottico.

Prueba Mann-Whitney : Comprueba el
rango de dos muestras, por la diferencia
entre dos medianas del universo.

Prueba de la Mediana de Mood :
Prueba para ms de dos medianas del
universo. Ms robusta para los valores
atpicos o para los errores en la
informacin.



Analoga con datos normales

Prueba de Corridas (la misma
prueba para ambos tipos de
informacin)


Prueba t de una muestra




Prueba t de 2 muestras



ANOVA de un factor

Considere los siguientes datos (que se muestran aqu en orden cronolgico):
325, 210, 400, 72, 150, 145, 110, 507, 56, 120, 99, 144, 110, 110,
320, 290, 101, 0, 80, 500, 201, 50, 140, 80, 220, 180, 240, 309, 80

Es importante tener los datos registrados en orden cronolgico.

Una representacin grfica de los datos se asemeja a esto:
0
100
200
300
400
500
600
Promedio
Primera
"corrida"
Segunda racha"
Nmero total de Rachas: 12
Nmero total de puntos > al promedio: 11
Nmero total de puntos < al promedio: 18
Racha: Un punto o una serie consecutiva de puntos que caen
en un lado del promedio.


Prueba de Rachas
Prueba de Rachas
Promedio K = 184.4483

Nmero de rachas observado = 12

Nmero de rachas esperado = 14.6552
=> No se rechaza Ho
11 observaciones por encima de K; 18 por
debajo
La prueba es significativa en p= 0.2860
No se puede rechazar Ho con valor alfa = 0.05
Este es el valor p
de las Prueba de
Corridas
Prueba de Rachas
H
o
: Los datos son aleatorios
H
a
:Los datos NO so aleatorios
Ya que p > 0.05, no podemos rechazar la hiptesis nula.
Los datos son aceptados, siendo aleatorios.
Promedio
Clculos de la Prueba de Rachas
El estadstico Z cuando n > 20 se calcula como:

Z = (G - MediaG) / DesvStG

Con MediaG = 1 + (2n1*n2) / (n1 + n2)
DesvStG = Raiz [ (2n1*n2) (2n1*n2 - n1 -n2) / (n1 + n2)^2* (n1+n2 -1)

Del ejemplo anterior G = 12; n1 = 11 n2 = 18

MediaG = 14.655 DesStG = 2.4843

Z1 = (12 - 14.655) / 2.4843 = -1.0687
P(Z1) = 0.1430 y para dos colas se tiene

P(Z1) + P(Z2) = 0.2860 > Alfa crtico de 0.05, no rechazndose Ho

Si las n1 y n2 son menores a 21, entonces se consulta la tabla de
valores crticos para el nmero de Rachas G
228
Corrida con Minitab
Stat > Nonparametrics > Runs Test
Variable C1, Above and below the mean
P > 0.05
No rechazar
Ho
Runs Test: C1
Runs test for C1
Runs above and below K = 184.448
The observed number of runs = 12
The expected number of runs = 14.6552
11 observations above K, 18 below
P-value = 0.285
Prueba de Signos de la Mediana
H
o
: La mediana de la muestra es igual a la mediana de la hiptesis
H
a
: Las medianas son diferentes
Ejemplo (usando los datos del ejemplo anterior):

Ho: Valor de la mediana = 115.0
Ha: Valor de la mediana diferente de 115.0

N DEBAJO IGUAL ENCIMA VALOR P MEDIANA
29 12 0 17 0.4576 144.0
Ya que p >0.05, no se puede rechazar la hiptesis nula.
No se puede probar que la mediana real y la mediana hipottica son
diferentes.

En las pginas siguientes se muestra el detalle del clculo.
Clculos de la Prueba de Signos de la Mediana
Ejemplo: Con los datos del ejemplo anterior y ordenndo de menor a
mayor se tiene: n = 29, Mediana de Ho = 115

No. Valor Signo No. Valor Signo No. Valor Signo
1 0 - 11 110 - 21 220 +
2 50 - 12 110 - 22 240 +
3 56 - 13 120 + 23 290 +
4 72 - 14 140 + 24 309 +
5 80 - 15 144 + 25 320 +
6 80 - 16 145 + 26 325 +
7 80 - 17 150 + 27 400 +
8 99 - 18 180 + 28 500 +
9 101 - 19 201 + 29 507 +
10 110 - 20 210 +

Con la mediana en 144. Si el valor contra el cual se desea
probar es 115, entonces hay 12 valores por debajo de el (-) y 17
valores por arriba (+).

Clculos de la Prueba de Signos de la Mediana

El estadstico X es el el nmero de veces que ocurre el signo menos
frecuente, en este caso el 12 (-).

Cmo n > 25, se calcula el estadstico Z para la prueba de signos con:

Z = [ (Y + 0.5) - (0.5*n) ]/ 0.5 \ n

En este caso Z1 = - 0.74278 y P(Z1) = 0.2288 para la cola izquierda
en forma similar P(Z2) 0-2288 para la cola derecha, por lo que la
probabilidad total es 0.4576 >> 0.05 del criterio de rechazo.

Si n hubiera sido < 25 entonces se hubiera consultado la tabla de
valores crticos para la prueba de signo.


Prueba de Signos de la Mediana
Bueno, veamos una grfica de la informacin
100 200 300 400 0 500
Es esto correcto?144 podra ser igual a 115?
115 144
Despus de todo, tal vez
esto SEA lo correcto.
233
Corrida en Minitab
Stat > Nonparametrics > 1-Sample sign Variable C1
Confidence interval 95% Test Median 115 Alternative Not equal








Como P > 0.05 no se rechaza Ho y la mediana es 115
Sign Test for Median: Signos
Sign test of median = 115.0 versus not = 115.0

N Below Equal Above P Median
Signos 29 12 0 17 0.4583 144.0
234
Prueba de Signos de la Mediana
Para observaciones pareadas
Calificaciones de amas de casa a dos limpiadores de ventanas:

Ho: p = 0.5 no hay preferencia de A sobre B
Ha: p<>0.5
Ama Limpiador
B
Casa A
1 10 7
2 7 5
3 8 7
4 5 2
5 7 6
6 9 6
Hay evidencia que indique
cierta preferencia de las amas
de casa por lo limpiadores?
235
Prueba de Signos de la Mediana
Producto
B
Familia A
1 - +
2 - +
3 + -
4 - +
5 0 0
6 - +
7 - +
8 + -
9 - +
10 - +
11 - +
Hay evidencia que indique
cierta preferencia por un
Producto A o B?
Media = 0.5*n
Desv. Estand.= 0.5*raiz(n)

Zc = (Y media) / Desv. Estnd.
Rechazar Ho si Zc ><Zalfa/2
236
Prueba de Signos de la Mediana
Como Zc < Zexcel no se rechaza Ho o
Como p value = 0.067 > 0.025
No hay evidencia suficiente de que los
Consumidores prefieran al producto B
Media = 0.5*11 = 5.5
Desv. Estand.= 0.5*raiz(n) = 1.67

Para Zc = (8 5.5) / 1.67 = 1.497

Zexcel = 1.96 para alfa/2 = 0.025

237
Prueba rango con signo de Wilconox
Es la alternativa no paramtrica de la prueba paramtrica de muestras
pareadas
Ejemplo: HO: Las poblaciones son idnticas Ha: Caso contrario
Trabaja
dor
Mtodo
1
Mtodo
2
Diferen
cias
Abs(difere
n.) Rango
Rango
c/signo
1 10.2 9.5 0.7 0.7 8 8
2 9.6 9.8 -0.2 0.2 2 -2
3 9.2 8.8 0.4 0.4 3.5 3.5
4 10.6 10.1 0.5 0.5 5.5 5.5
5 9.9 10.3 -0.4 0.4 3.5 -3.5
6 10.2 9.3 0.9 0.9 10 10
7 10.6 10.5 0.1 0.1 1 1
8 10 10 0 0 Eliminar
9 11.2 10.6 0.6 0.6 7 7
10 10.7 10.2 0.5 0.5 5.5 5.5
11 10.6 9.8 0.8 0.8 9 9
T = 44
238
Prueba rango con signo de Wilconox
Distribucin muestral T para poblaciones idnticas
Se aproxima a la distribucin normal para n >= 10




En este caso n = pares eliminando las que son iguales con dif. = 0 para el
trabajador 8.

o = raiz(10 x 11 x 21/6) = 19.62
Z = (T )/o = 44/19.62 = 2.24

Z alfa/2 = Z0.025 = 1.96

Como Zc = 2.24 > Z0.025 se rechaza Ho, los mtodos son diferentes



0 =
T

6
) 1 2 )( 1 ( + +
=
n n n
T
o
239
Prueba en Minitab para prueba de
mediana con Wilconox
File> Open worksheet > Exh_Stat
Stat > Nonparametrics > 1-Sample Wilconox
Variables C1 Test Median 77
Altenative Not equal
Achievement
77
88
85
74
75
62
80
70
83
Wilcoxon Signed Rank Test: Achievement
Test of median = 77.00 versus median not = 77.00
for Wilcoxon Estimated
for Wilcoxon Estimated
N Test Statistic P Median
Achievement 9 8 19.5 0.889 77.50

Ho: Mediana = 77 Ha: Mediana <> 77
Como P de 0.889 >> alfa de 0.05 no se rechaza Ho
Prueba de Mann-Whitney
Se llev a cabo un estudio que analiza la frecuencia del pulso en dos
grupos de personas de edades diferentes, despus de diez minutos de
ejercicios aerbicos.

Los datos resultantes se muestran a continuacin.



Edad 40-44
C1
140
135
150
140
144
154
160
144
136
148

Edad 16-20
C2
130
166
128
126
140
136
132
128
124

Tuvieron diferencias
significativas las frecuencias de
pulso de ambos grupos?
Prueba de Mann-Whitney
Ordenando los datos y asignndoles el (rango) de su posicin relativa se tiene (promediando
posiciones para el caso de que sean iguales):
Edad 40-44
C1
(7) 135
(8.5) 136
(11) 140
(11) 140
(13.5) 144
(13.5) 144
(15) 148
(16) 150
(17) 154
(18) 160

n1 = 10
Ta = 130.5


Edad 16-20
C2
(1) 124
(2) 126
(3.5) 128
(3.5) 128
(5) 130
(6) 132
(8.5) 136
(11)140
(15)166


n2 = 9
Tb = 55.5

Prueba de Mann-Whitney
Ho: Las distribuciones de frecuencias relativas de las poblaciones A y B son iguales
Ha: Las distribuciones de frecuencias relativas poblacionales no son idnticas
Ho: q1 = q2 Ha: q1 = q2 q1, q2 = Medianas de las poblaciones
Ordenando los datos y asignndoles su posicin relativa se tiene:
Ua = n1*n2 + (n1) * (n1 + 1) /2 - Ta
Ub = n1*n2 + (n2) * (n2 + 1) /2 - Tb
Ua + Ub = n1 * n2

Ua = 90 + 55 - 130.5 = 14.5 P(Ua) = 0.006 Ub = 90 + 45 - 55.5 = 79.5
El menor de los dos es Ua.
Para alfa = 0.05 el valor de Uo = 25
Como Ua < 25 se rechaza la Hiptesis Ho de que las medianas son iguales.


Dado que p < 0.05, rechazamos la hiptesis nula. Estadsticamente
existe una diferencia significativa entre los dos grupos de edad.
Prueba de Mann-Whitney
Ho: Las distribuciones de frecuencias relativas de las poblaciones A y B son iguales
Ha: Las distribuciones de frecuencias relativas poblacionales no son idnticas

Ua = 14.5 Ub = 79.5
Utilizando el estadstico Z y la distribucin normal se tiene:
45 12.24
Z = [ (U - (n1* n2 / 2 ) / Raiz (n1 * n2 * (n1 + n2 + 1) / 12)
Con Ua y Ub se tiene:
Za = (14.5 - 45) / 12.24 = - 2.49 P(Z) = 0.0064 similar a la anterior
Zb = (79.5 -45) / 12.24 = 2.81 P(total) = 2 * 0.0064 = 0.0128 menor o = 0.05
El valor crtico de Z para alfa 0.025 por ser prueba de dos colas, es 1.96.
Como Za > Zcrtico se rechaza la Hiptesis Ho de que las medianas son iguales.


Dado que p < 0.05, rechazamos la hiptesis nula. Estadsticamente
existe una diferencia significativa entre los dos grupos de edad.
Prueba de Mann-Whitney
4
0
-
4
4

a

o
s

d
e

e
d
a
d

16-20 aos de edad
Diferencias entre los encabezados de
los renglones y las columnas
De esta manera, se calcula la mediana de todas estas diferencias, denominada
"punto estimado". Este punto estimado es una aproximacin de la diferencia entre
las medianas de los dos grupos (ETA1 y ETA2).

Una vez ajustados los "enlaces" (eventos de un mismo valor en ambos grupos de
informacin), Minitab usa este punto estimado para calcular el valor p.
130 166 128 126 140 136 132 128 124
140 10 -26 12 14 0 4 8 12 16
135 5 -31 7 9 -5 -1 3 7 11
150 20 -16 22 24 10 14 18 22 26
140 10 -26 12 14 0 4 8 12 16
144 14 -22 16 18 4 8 12 16 20
154 24 -12 26 28 14 18 22 26 30
160 30 -6 32 34 20 24 28 32 36
144 14 -22 16 18 4 8 12 16 20
136 6 -30 8 10 -4 0 4 8 12
148 18 -18 20 22 8 12 16 20 24
245
Corrida en Minitab
Stat > Nonparametrics > Mann Whitney
First Sample C1 Second Sample C2 Conf. Level 95%
Alternative Not equal
Mann-Whitney Test and CI: C1, C2
N Median P>0.05
C1 10 144.00 Se rechaza Ho
C2 9 130.00
Point estimate for ETA1-ETA2 is 12.00
95.5 Percent CI for ETA1-ETA2 is (4.01,20.00)
W = 130.5
Test of ETA1 = ETA2 vs ETA1 not = ETA2 is significant at 0.0143
The test is significant at 0.0140 (adjusted for ties)
Prueba de Kruskal Wallis
Ordenando los datos de ventas y asignndoles el (rango) de su posicin relativa se tiene
(promediando posiciones para el caso de que sean iguales):
Zona 1
(15.5) 147
(17.5) 17.5
(9) 128
(19) 162
(12) 135
(10) 132
(22) 181
(13) 138



n1 = 8
Ta = 118


Zona 2
(17.5) 160
(14) 140
(21) 173
(4) 113
(1) 85
(7) 120
(25) 285
(5) 117
(11) 133
(6) 119

n2 = 10
Tb = 111.5

Zona 3
(24) 215
(8) 127
(2) 98
(15.5) 127
(23) 184
(3) 109
(20) 169




n3 = 7
Tc = 95.5


N = n1 + n2 + n3 = 25
Prueba de Kruskal Wallis
Ho: Las poblaciones A, B y C son iguales
Ha: Las poblaciones no son iguales
Ho: q1 = q2 = q3 Ha: q1 = q2 = q3 ; q1, q2, q3 = Medianas de las poblaciones

Calculando el valor del estadstico H se tiene:
H = [ 12 /( N* ( N + 1)) ] * [ Ta
2
/ n1 + Tb
2
/ n2 + Tc
2
/ n3 ] - 3 * ( N +1 )
H = 0.01846 * (1740.5 + 1243.225 + 1302.893 ) - 78 = 1.138

Se compara con el estadstico _
2
para o = 0.05 y G.l. = k - 1 = 3-1 = 1 (k muestras)
_
2
crtico = 5.991 (vlido siempre que las muestras tengan al menos 5 elementos)

Como H < _
2
crtico, no se rechaza la Hiptesis Ho: Afirmando que no hay
diferencia entre las poblaciones

248
Corrida en Minitab
Stat > Nonparametrics > Kruskal Wallis
Response C1 Factor C2 OK
Kruskal-Wallis Test: Datos versus Factor
Kruskal-Wallis Test on Datos
Factor N Median Ave Rank Z
Zona 1 7 138.0 14.7 0.98
Zona 2 10 126.5 11.1 -0.82
Zona 3 7 127.0 12.3 -0.10
Overall 24 12.5 P > 0.05
H = 1.08 DF = 2 P = 0.581 No se rechaza Ho
H = 1.09 DF = 2 P = 0.581 (adjusted for ties)
249
Prueba de Medianas de Mood
Realiza prueba de hiptesis de igualdad de medias en un diseo de una
va. La prueba es robusta contra Outliers y errores en datos y es
adecuada para anlisis preliminares

Determina si K grupos independientes han sido extraidas de la misma
poblacin con medianas iguales o poblaciones con formas similares

Con base en la gran mediana, anotar un signo positivo si la
observacin excede la mediana o un signo menos si es menor. Los
valores que coincidan se reparten en los grupos

Hacer una tabla de contingencia K x 2 con las frecuencias de signos
ms y menos en cada grupo K
250
Prueba de Medianas de Mood
Se determina el estadstico Chi Cuadrada con:





Probar Ho: Todas las medianas son iguales
Ha: Al menos una mediana es diferente

Se compara Chi Cuadrada calculada con Chi Cuadrada de alfa para
0.05 y (reng 1)*(Col 1) grados de libertad


=
E
E O
2
2
) (
_
251
Corrida con Minitab
Se les da a 179 participantes una conferencia con
dibujos para ilustrar el tema. Despus se les da la
prueba OTIS que mide la habilidad intelectual. Los
participantes se clasificaron por nivel educativo 0-No
prof., 1-Prof., 2-Prepa

Ho: h1 = h2 = h3 Ha: no todas las medianas son
iguales
File > Open Worksheet > Cartoon.mtw
Stat > Nonparametrics > Moods Median Test
Response Otis Factor ED Ok
252
Corrida con Minitab
Mood Median Test: Otis versus ED
Mood median test for Otis P>0.05
Chi-Square = 49.08 DF = 2 P = 0.0005 Se rechaza Ho
Individual 95.0% CIs
ED N<= N> Median Q3-Q1 ----+---------+---------+---------
+--
0 47 9 97.5 17.3 (-----*-----)
1 29 24 106.0 21.5 (------*------)
2 15 55 116.5 16.3 (----*----)
----+---------+---------+---------+--
96.0 104.0 112.0 120.0
Overall median = 107.0
253
Diseos factoriales aleatorias
bloqueados de Friedman
Esta prueba es una alternativa al ANOVA de dos vas, es
una generalizacin de las pruebas pareadas con
signo. La aditividad es requerida para para estimar
los efectos de los tratamientos

Ho: Los tratamientos no tienen un efecto significativo
Ha: Algunos tratamientos tienen efecto significativo


254
Diseos factoriales aleatorias
bloqueados de Friedman
Resultados de salida:
Se muestra el estadstico de prueba con distribucin
Chi Cuadrada aproximada con gl = Tratamientos 1.

Si hay observaciones parecidas en uno o ms
bloques, se usa el rango promedio y se muestra el
estadstico corregido

La mediana estimada es la gran mediana ms el
efecto del tratamiento
255
Diseos factoriales aleatorias
bloqueados de Friedman
Ejemplo:
Se evala el efecto del tratamiento de una droga en
la actividad enzimtica con tres niveles, probado en
cuatro animales

Open the worksheet EXH_STAT.MTW.
Stat > Nonparametrics > Friedman.
Response, seleccionar EnzymeActivity.
En Treatment, seleccionar Therapy.
En Blocks, seleccionar Litter. Click OK.
256
Diseos factoriales aleatorias
bloqueados de Friedman
Datos:
EnzymeActivity Therapy Litter
0.15 1 1
0.26 1 2
0.23 1 3
0.99 1 4
0.55 2 1
0.26 2 2
-0.22 2 3
0.99 2 4
0.55 3 1
0.66 3 2
0.77 3 3
0.99 3 4
257
Diseos factoriales aleatorias
bloqueados de Friedman
Resultados:
Friedman Test: EnzymeActivity versus Therapy
blocked by Litter
S = 2.38 DF = 2 P = 0.305 No rechazar Ho
S = 3.80 DF = 2 P = 0.150 (adjusted for ties)
Sum
of
Therapy N Est Median Ranks
1 4 0.2450 6.5
2 4 0.3117 7.0
3 4 0.5783 10.5
Grand median = 0.3783
258
Diseos factoriales aleatorias
bloqueados de Friedman
Resultados:
El estadstico de prueba S tiene un valor P de 0.305 sin ajustar
para observaciones en cero y 0.150 para el valor ajustado.

Por tanto no hay evidencia suficiente para rechazar Ho

Las medianas estimadas asociadas con los tratamientos son la
gran mediana ms los efectos estimados de los tratamientos.

El estadstico de prueba se determina con base a los rangos en
cada bloque y totales
259
Diseos factoriales aleatorias
bloqueados de Friedman
Resultados:
260
Diseos factoriales aleatorias
bloqueados de Friedman
Resultados:
261
Diseos factoriales aleatorias
bloqueados de Friedman
Resultados:
262
Prueba de igualdad de
varianzas de Levene
Se usa para probar la hiptesis nula de que las varianzas de k
mltiples poblacionales son iguales

Las igualdad de varianzas en las muestras se denomina
homogeneidad de varianzas

La prueba de Levene es menos sensible que la prueba de
Bartlett o la prueba F cuando se apartan de la normalidad

La prueba de Bartlett tiene un mejor desempeo para la
distribucin normal o aproximadamente normal
263
Prueba de igualdad de
varianzas de Levene
Para dos muestras el procedimiento es como sigue:

Determinar la media

Calcular la desviacin de cada observacin respecto a la
media

Z es el cuadrado de las desviaciones respecto a la media

Aplicar la prueba t a las dos medias de los datos
264
Prueba de igualdad
de Varianzas-Minitab
Se estudian tamaos de papa
inyectando con bacterias y
sujetas a diferentes
temperaturas. Antes del
ANOVA se verifica la
igualdad de varianzas

Stat > ANOVA > Test for
equal variances
Response Rot
Factors Temp Oxigen
Confidence level 95%

Rot Temp Oxygen
13 10 2
11 10 2
3 10 2
10 10 6
4 10 6
7 10 6
15 10 10
2 10 10
7 10 10
26 16 2
19 16 2
24 16 2
15 16 6
22 16 6
18 16 6
20 16 10
24 16 10
8 16 10
265
Resultados
266
Resultados
Test for Equal Variances: Rot versus Temp, Oxygen
95% Bonferroni confidence intervals for standard deviations
Temp Oxygen N Lower StDev Upper
10 2 3 2.26029 5.29150 81.890
10 6 3 1.28146 3.00000 46.427
10 10 3 2.80104 6.55744 101.481
16 2 3 1.54013 3.60555 55.799
16 6 3 1.50012 3.51188 54.349
16 10 3 3.55677 8.32666 128.862
Bartlett's Test (normal distribution)
Test statistic = 2.71, p-value = 0.744 P>0.05 no rechazar Ho
Levene's Test (any continuous distribution)
Test statistic = 0.37, p-value = 0.858
267
Prueba de la concordancia del
Coeficiente de Kendall
El coeficiente expresa el grado de asociacin entre las
calificaciones mltiples realizadas por un evaluador

Ho: Las variables son independientes
Ha: Las variables estn asociadas

Kendall usa la informacin relacionada con las calificaciones
relativas y es sensible a la seriedad de mala clasificacin

Por ejemplo para K = jueces N = Muestras = 10

Rango medio = 220 / 22 S = 1066 Gl = n-1 = 9
Chi Cuadrada crtica = X
2
0.01,9 = 21.67
268
Prueba de la concordancia del
Coeficiente de Kendall
El Estadstico Chi Cuadrada calculado es:





Como Chi Cuadrada de alfa es menor que la calculada, los
cuatro jueces estn asociados significativamente. Constituyen
un panel uniforme. No quiere decir que estn en lo correcto,
solo que responden de manera uniforme a los estmulos
269
El coeficiente de correlacin de
rangos de Spearman (r
s
)
El coeficiente de correlacin es una medida de la asociacin que
requiere que ambas variables sean medidas en al menos una
escala ordinal de manera que las muestras u observaciones a
ser analizadas pueden ser clasificadas en rangos en dos series
ordenadas

Ho: Las variables son independientes
Ha: Las variables estn asociadas

Para el ejemplo anterior si N = 10, el coeficiente es:
N N
d
r
s

=

3
2
6
1
97 . 0 03 . 0 1
990
) 5 . 5 ( 6
1 = = =
s
r
270
Coeficiente de correlacin de
rangos para monotona de
preferencias
Una persona interesada en adquirir un TV asigna
rangos a modelos de cada uno de 8 fabricantes

Preferencia

Precio
(rango)
Fab.
1 7 449.50 (1)
2 4 525.00 (5)
3 2 479.95 (3)
4 6 499.95 (4)
5 1 580.00 (8)
6 3 549.95 (7)
7 8 469.95 (2)
8 5 532.50 (6)


Di cuadrada
Rango
Di
6 36
-1 1
-1 1
2 4
-7 49
-4 16
6 36
-1 1
271
Coeficiente de correlacin de
rangos para monotona de
preferencias
Ho: No existe asociacin entre los rangos
Ha: Existe asociacin entre los rangos o es positiva o negativa

El coeficiente de correlacin de rangos de Spearman es:

Rs = 1 6*suma(di cuadrada) / (n(n cuadrada 1))

En este caso: Rs = 1 6(144)/(8*(64-1) = -0.714

R0 se determina de la tabla de Valores crticos del coeficiente de
correlacin del coeficiente de correlacin de rangos de Spearman

Rt = 0.686

Por tanto si hay asociacin significativa en las preferencias


272
Tabla de constantes
n Alfa=0.05 Alfa = 0.025
5 0.900 -
6 0.829 0.886
7 0.714 0.786
8 0.643 0.738
9 0.600 0.683
10 0.564 0.648
11 0.523 0.623
12 0.497 0.591
13 0.475 0.566
14 0.457 0.545
15 0.441 0.525
16 0.425 0.507
17 0.412 0.490
18 0.388 0.476
19 0.377 0.462
20 0.368 0.450
21 0.359 0.438
22 0.351 0.428
23 0.343 0.418
24 0.336 0.409
25 0.329 0.400
26 0.329 0.392
27 0.323 0.385
28 0.317 0.377
29 0.311 0.370
30 0.305 0.364
273
Corrida con Minitab
Para la corrida en Minitab primero se
deben determinar los rangos en
forma manual para las variables X
y Y.
Stat > Basic statistics > Correlation
Variables Preferencia Precio
Fabric
ante
Prefe-
rencia Precio
Preci
o
1 7 1 449
2 4 5 525
3 2 3 479
4 6 4 499
5 1 8 580
6 3 7 549
7 8 2 469
8 5 6 532
Correlations: Preferencia, Precio
Pearson correlation of
Preferencia and Precio = -0.714
P-Value = 0.047
274
Ejemplo con Minitab
Se estudia la relacin entre colgeno y
Proline en pacientes con cirrosis
Stat > Basic statistics > Correlation
Variables Colgeno Proline
Paciente Colgeno Proline
1 7.1 2.8
2 7.1 2.9
3 7.2 2.8
4 8.3 2.6
5 9.4 3.5
6 10.5 4.6
7 11.4 5
Correlations: Colageno, Proline
Pearson correlation of Colageno
and Proline = 0.935
P-Value = 0.002
275
Resumen de pruebas
no paramtricas
Prueba de signos de 1 muestra: Prueba la igualdad de la
mediana a un valor y determina el intervalo de confianza

Prueba de Wilconox de 1 muestra: Prueba la igualdad de la
mediana a un valor con rangos con signo y determina el
intervalo de confianza

Comparacin de dos medianas poblacionales de Mann Whitney:
Prueba la igualdad de las medianas y determina el intervalo de
confianza


276
Resumen de pruebas
no paramtricas

Comparacin de igualdad de medianas poblacionales de Kruskal
Wallis: Prueba la igualdad de las medianas en un diseo de una
va y determina el intervalo de confianza


Comparacin de medianas poblacionales de Mood: Prueba la
igualdad de medianas con un diseo de una va



277
278
279
Salidas de la Fase de Anlisis
Causas raz validadas

Gua de oportunidades de mejora

Causa
Raz
Resultados
Causas
# de
Causa
SI ES CAUSA RAIZ

SI ES CAUSA RAIZ
NO ES CAUSA RAIZ
NO ES CAUSA RAIZ

SI ES CAUSA RAIZ

SI ES CAUSA RAIZ
NO ES CAUSA RAIZ
Ensamble de ojillos, bloques y
contrapesos no adecuados en
aspas.
Amortiguadores daados.
Desgaste de bujes en los
carretes.
Fabricacin y reemplazo de
ejes y poleas no adecuados en
ensamble de aspas.
Desalineamiento de poleas y
bandas de transmisin de
aspas.
Mtodo de Balanceo no
adecuado.
Desalineacin de pinolas en
cuna.
1

2
3
4

5

6
7
Resumen de la validacin de las causas
X


X




X

X

Você também pode gostar