Você está na página 1de 126

Pruebas de Hipótesis

 Prueba de hipótesis

r
 Pruebas para una muestra

n
to
e
pp
ha
ek
s
 Pruebas para dos muestras

ing
th
dir
e
ak
 Pruebas para más de dos muestras
m
e
w
 Pruebas no paramétricas
w
e
dir
m
ak
e
ek th
ing
s
to
ha
r
pp
en
8. Prueba de Z y T
w
e
dir
m
ak
e
ek th
ing
s
to
ha
r
pp
en
1 NIVEL

r n
to
e
pp
Normales No Normales

ha
ek
s
ng
i
th
dir
e
ak
m
e
w n>30 σ es
n<30
conocida Pruebas de rangos
Prueba t de una
muestra Prueba de Z Wilcoxon
Antecedentes
Según el Teorema de Límite Central, la distribución
muestral seguirá una distribución normal, siempre y
cuando:

r n
to
e
pp
– El tamaño de la muestra es suficientemente grande

ha
ek
s
ing
– Cuando conocemos la desviación estándar de la

th
dir
e
ak
m
población
e
w
• Entonces se puede calcular un valor Z y emplear
la distribución normal.”.
Prueba Z
• Si la distribución es normal siempre podemos
estandarizar nuestros datos y buscar
probabilidades (valores de p)

r n
to
e
pp
ha
ek
s
ing
th
dir
e
ak
m
e
w
Se debe adaptar para comparar los
datos de la muestra contra la media X=media de la muestra
de la población hipotética µ= Valor de referencia de la meta
n= error estándar de la media
• La prueba z compara el valor
promedio con el de la meta o
hipotético. Puede utilizar separa
demostrar una variación de la
media después de un cambio de
proceso.

r n
to
e
pp
ha
ek
s
ing
• Con el valor de Z buscamos los

th
dir
e
ak
valores de p para determinar si
m
e
w
la diferencia entre las 2 medias
es significativa.
Ejemplo
• Se quiere mostrar que el tiempo de respuesta
en un call center es igual a 30 s.

r n
to
e
n=30

pp
ha
ek
s
ing
th
dir
e
x=28.3
ak
m
e
w
s=2.8
Ahora en Minitab
1.Call center
• Es normal?

r n
to
e
pp
ha
• Establecer prueba de Hipótesis

ek
s
ing
th
dir
e
ak
m
e
w
• Normalidad

w
e
dir
m
ak
e
ek th
ing
s
to
ha
r
pp
en
• Stat>>> bassic statistis>> 1- Sample Z

r n
to
e
pp
ha
ek
s
ing
th
dir
e
ak
m
e
w
Prueba de Z
• Opción para ingresar
datos

r n
to
e
pp
1.Si los tienes en

ha
ek
s
ing
th
tu plantilla
dir
e
ak
m
e
w
2. Para ingresarlos
directamente
w
e
dir
m
ak
e
ek th
ing
s
to
ha
r
pp
en
Prueba de Z
w
e
dir
m
ak
e
ek th
ing
s
to
ha
r
pp
en
• Se puede probar cambiar la hipótesis
alternativa

r n
to
e
pp
ha
ek
s
ing
th
dir
e
ak
m
e
w
Es muy común que tamaños de muestra muy grandes sean difíciles
de conseguir. Restricciones tales como costo, tiempo, etc. Pueden
ser de consideración al tomar muestras. Cuando tenemos pequeñas
muestras que sabemos que vienen de una distribución normal,
utilizamos un estadístico similar para pequeñas muestras: la

r
distribución t

n
to
e
pp
ha
ek
s
ng
Compara el promedio de la

i
th
dir
e
distribución sencilla contra el

ak
m
e
valor meta o hipotético. Puede
w
utilizarse para demostrar una
variación de la media después de
un cambio del proceso.
Distribución t
• La distribución t de Student fue descubierta
por William S. Gosset en 1908.
• Gosset era un estadístico empleado por la

r n
to
e
pp
ha
compañía cervecera Guiness, con quien tenía

ek
s
ing
th
dir
e
un contrato que no podía usar sus nombres en
ak
m
e
w
sus publicaciones.
• Él recurrió al Sobrenombre de “Student”
¿Qué es un valor t?
• Mide la diferencia entre un estadístico de muestra
observado y su parámetro de población hipotético en
unidades de error estándar.

r n
to
e
pp
ha
ek
s
• Una prueba t compara el valor t observado con un valor

ing
th
dir
e
crítico en la distribución t con (n-1) grados de libertad

ak
m
e
para determinar si la diferencia entre los valores
w
estimados e hipotéticos del parámetro de la población es
estadísticamente significativa.
Prueba de t
𝑋𝑋−µ n-1= Grados de Libertad
t=
𝑆𝑆/ 𝑛𝑛
X= Promedio de la muestra Región de

r n
to
e
S= Desviación estándar de la rechazo

pp
ha
ek
α

s
muestra

ing
th
dir
e
n= número de la muestra

ak
m
e
µ = Valor a probar
w

Nota: Los GL son los que afectan la dispersión de la distribución.


A mayor muestra, más grados de libertad y más cercanos serán
nuestros datos a la distribución de la población.
Ejemplo
Quick Fill Propane Company llena los
tanques de propano utilizados en las
parrillas de barbacoa. Debido a que el
propano líquido se expande cuando se

r
calienta, los tanques deben ser

n
to
e
pp
ha
llenados sólo al 80% para permitir la

ek
s
ng
posible expansión del líquido en un

i
th
dir
e
ak
día caluroso. ¿En promedio Quik Fill es

m
e
w
capaz de llenar los tanques a 20
libras?
Realizar prueba de hipótesis
Ho: No hay diferencia entre los datos recolectados y el valor
buscado (Promedio = 20 min)
Ha: Si hay diferencia entre los datos recolectados y el valor

r
buscado (Promedio ≠ 20 min)

n
to
e
pp
ha
ek
s
ing
th
dir
e
ak
m
Abrir archivo Tankweight
e
w
w
e
dir
m
ak
e
ek th
ing
s
to
ha
r
pp
en
Obteniendo el valor P
Ahora en Minitab
• Abrir ejercicio
1.Tank Weight

r n
to
e
pp
ha
¿Es normal?

ek
s
ing
th
dir
e
ak
m
e
w
Prueba t de student una muestra

r n
to
e
pp
ha
ek
s
ing
th
dir
e
ak
m
e
w
Prueba t de student una muestra

r n
to
e
pp
ha
ek
s
ing
th
dir
e
ak
m
e
w
Prueba t de student una muestra

r n
to
e
pp
ha
ek
s
ing
th
dir
e
ak
m
e
w
Gráfico de valores individuales

r n
to
e
pp
ha
ek
s
ing
th
dir
e
ak
m
e
w
w
e
dir
m
ak
e
ek th
ing
s
to
ha
r
pp
en
Histograma
w
e
dir
m
ak
e
ek th
ing
s
to
ha
r
pp
en
Valor p
Ejercicio
Un cliente cree que las lámparas que
61.3
compró e instaló en su casa están 60.8
consumiendo gran cantidad de Watts, por lo 61.9
tanto, incrementa el gasto por concepto de 62.2

r
energía eléctrica. La compañía proveedora 61.5

n
to
e
pp
ha
60.7
envió una muestra de 10 lámparas a probar

ek
s
ng
59.9

i
th
y confirmar esta situación. Los Watts
dir
e
ak
60.9

m
consumidos por las lámparas fueron:
e
61.8
w 62.0

La especificación de las lámparas es 60 watts. ¿El cliente tiene razón?


Ejercicio
• Determinar la prueba de 11.3
12.8
hipótesis según corresponda a 11.9
los siguientes datos: 12.2
11.5

r n
to
e
11.9

pp
ha
ek
12.6

s
ng
• La media es diferente a 12.2

i
th
12.5

dir
e
• La media es mayor a 11.8

ak
m
• La media es menor de 12 11.6

e
w
11.7
12.7
11.9
12.3
• 1-sample T (Prueba de T de 1 muestra) Propósito:
Analizar las diferencias entre la media obtenida y un
valor objetivo o una media histórica.

r n
to
e
pp
ha
ek
s
ng
• 2-sample T (Prueba de T de 2 muestras)

i
th
dir
e
ak
m
Propósito: Analizar las diferencias entre la media obtenida
e
w
de dos muestras independientes.
Pruebas de Hipótesis

 Prueba de hipótesis

r
 Pruebas para una muestra

n
to
e
pp
ha
ek
s
 Pruebas para dos muestras

ing
th
dir
e
ak
 Pruebas para más de dos muestras
m
e
w
 Pruebas no paramétricas
Prueba de hipótesis
2 NIVELES
Datos en cada niveles son:

r
Normales

n
to
No Normales

e
pp
ha
ek
Varianzas son:

s
Varianzas son:

ng
i
th
dir
e
ak
m
e
w
Iguales Iguales Diferentes
Diferentes * Mann- Whitney * Mann- Whitney
* Prueba t con
* Prueba t con varianzas * Prueba t con * Prueba t con varianzas
varianzas iguales diferentes varianzas iguales (si diferents (si n>25)
* ANOVA de una vía n>25)
* ANOVA de una vía (si
n>25)
Prueba t 2 muestras
• Diferencias en los promedios de 2 diferentes
muestras.

r
• Ambas deben tener distribución normal

n
to
e
pp
ha
ek
s
ing
th
dir
e
ak
m
e
w
• La hipótesis nula es que los promedios de los
dos grupos son los mismos: Ho = μa = μb

r n
to
e
• La hipótesis alternativa es que los promedios

pp
ha
ek
s
ing
th
son diferentes: Ha = μa ≠ μb
dir
e
ak
m
e
w
w
e
dir
m
ak
e
ek th
ing
s
to
ha
r
pp
en
Ejemplo
w
e
dir
m
ak
e
ek th
ing
s
to
ha
r
pp
en
Ejercicios
w
e
dir
m
ak
e
ek th
ing
s
to
ha
r
pp
en
Hipótesis
Muestreo

r n
to
e
pp
ha
ek
s
ing
th
dir
e
ak
m
e
w

Abrir Recovery time


w
e
dir
m
ak
e
ek th
ing
s
to
ha
r
pp
en
Normalidad
w
e
dir
m
ak
e
ek th
ing
s
to
ha
r
pp
en
Prueba estadística
w
e
dir
m
ak
e
ek th
ing
s
to
ha
r
pp
en
w
e
dir
m
ak
e
ek th
ing
s
to
ha
r
pp
en
w
e
dir
m
ak
e
ek th
ing
s
to
ha
r
pp
en
Prueba de varianzas
w
e
dir
m
ak
e
ek th
ing
s
to
ha
r
pp
en
w
e
dir
m
ak
e
ek th
ing
s
to
ha
r
pp
en
Prueba de las varianzas
w
e
dir
m
ak
e
ek th
ing
s
to
ha
r
pp
en
Muestras de 2 t
w
e
dir
m
ak
e
ek th
ing
s
to
ha
r
pp
en
Asumir varianzas iguales
w
e
dir
m
ak
e
ek th
ing
s
to
ha
r
pp
en
Ejercicio
Prueba t

El valor p es

r
menor a 0.05 ,

n
to
e
pp
ha
por lo que se

ek
s
ing
rechaza Ho

th
dir
e
ak
m
e
w
Ejercicio
• Están analizando un proyecto de
una compañía naviera,
observando el número de días
que le toma a las embarcaciones

r
realizar estas entregas a Japón.

n
to
e
pp
ha
ek
s
• Una nueva ruta esta siendo

ng
i
th
dir
e
ak
probada para ver si reduce el
m
e
w
promedio de los días de cada
viaje.
Abrir Shipping.xls

Facultad de Ingeniería- UNAM


• Normalidad
• Prueba de Varianza

r n
to
e
pp
ha
• Prueba de T2 sample

ek
s
ing
th
dir
e
ak
m
e
w
w
e
dir
m
ak
e
ek th
ing
s
to
ha
r
pp
en
Prueba de ANOVA
• v

w
e
dir
m
ak
e
ek th
ing
s
to
ha
r
pp
en
Prueba de hipótesis
2 NIVELES
Datos en cada niveles son:

r n
to
e
pp
ha
Normales No Normales

ek
s
ng
i
th
Varianzas son: Varianzas son:

dir
e
ak
m
e
w Iguales Diferentes
Iguales Diferentes * Mann- Whitney
* Mann- Whitney
* Prueba t con * Prueba t con
* Prueba t con * Prueba t con
varianzas iguales varianzas diferentes varianzas diferents (si
varianzas iguales (si n>25)
* ANOVA de una vía n>25)
* ANOVA de una vía
(si n>25)
Pruebas de Hipótesis

 Prueba de hipótesis

r
 Pruebas para una muestra

n
to
e
pp
ha
ek
s
 Pruebas para dos muestras

ing
th
dir
e
ak
 Pruebas para más de dos muestras
m
e
w
 Pruebas no paramétricas
Prueba de hipótesis
3 NIVELES
Datos en los niveles son:

r n
to
e
pp
ha
Normales No Normales

ek
s
i ng
Varianzas son: Varianzas son:

th
dir
e
ak
m
e
w
Iguales Iguales Diferentes
Diferentes
* ANOVA de una * ANOVA de una * Kruskall - Wallis
* Kruskall - Wallis
vía vía (si n>25)
* Kruskall - Wallis
• Permite el análisis de medias entre 2 o más
niveles

r n
to
e
pp
ha
ek
s
ing
th
dir
e
ak
m
e
w
Estudio de caso
• Ho: Las medias son iguales
µ0 = µ1 = µ2

r n
to
e
pp
ha
• H1: Las medias no son iguales

ek
s
ing
th
dir
e
ak
µ0 ≠ µ1 ≠ µ2
m
e
w
w
e
dir
m
ak
e
ek th
ing
s
to
ha
r
pp
en
Estudio de caso
Prueba de normalidad
• Para saber si los datos son normales o no , se
realiza una prueba de Hipótesis:

r n
to
e
pp
ha
ek
s
ing
th
dir
e
• Ho: Los datos son normales
ak
m
e
w
• Ha: Los datos NO son normales
4. Centros de Envio.xls
1. Prueba de normalidad

r n
to
e
pp
ha
ek
s
ing
th
dir
e
ak
m
e
w

Se deja de rechazar (“Se acepta”) Ho , los


datos son normales
Prueba de normalidad

r n
to
e
pp
ha
ek
s
ing
th
dir
e
ak
m
e
w

Se acepta Ho , los datos son normales


Prueba de normalidad

r n
to
e
pp
ha
ek
s
ing
th
dir
e
ak
m
e
w

Se acepta Ho , los datos son normales


2.- Prueba de varianzas iguales
• Para saber si los datos tienen varianzas iguales
, se realiza una prueba de Hipótesis:

r n
to
e
pp
ha
ek
s
ing
th
dir
e
• Ho: Las varianzas son iguales
ak
m
e
w
• Ha: Las varianzas NO son iguales
Prueba de varianzas iguales
• Ruta: stat ANOVA ➤test for equal vaiances
Por variable (Días)

r n
to
e
pp
ha
ek
s
ing
th
dir
e
ak
m
e
w

Por factores (Centro de envío) Titulo


Prueba de varianzas iguales
NORMALES

Las varianzas son


iguales

r n
to
e
pp
ha
ek
s
ing
th
dir
e
ak
m
e
w

NO NORMALES
3. Prueba ANOVA
• Ruta: StatANOVA ➤ One Way
• En Respuesta, ingrese Días. En Factor, ingrese

r n
to
e
Centro.

pp
ha
ek
s
ing
th
dir
e
ak
m
e
w
Pruebas de hipótesis
Haga clic en Comparaciones.
Marque De Tukey, nivel de significancia de la

r n
to
e
familia y luego haga clic en Aceptar.

pp
ha
ek
s
ing
th
dir
e
ak
m
e
w
Pruebas de hipótesis
• Haga clic en Gráficas.
• Marque Gráfica de valores individuales y

r n
to
e
Gráficas de caja de datos.

pp
ha
ek
s
ing
th
dir
e
• En Gráficas de residuos, elija Cuatro en uno.
ak
m
e
w
• Haga clic en Aceptar en cada cuadro de
diálogo
w
e
dir
m
ak
e
ek th
ing
s
to
ha
r
pp
en
Pruebas de hipótesis
Pruebas de hipótesis
Se rechaza la Ho, por lo
que si hay diferencia

r n
to
e
pp
ha
ek
s
ing
th
dir
e
ak
m
e
w
Conclusión
• Sin embargo, usted debe interpretar los
resultados de la comparación múltiple para

r n
ver dónde existen diferencias entre los

to
e
pp
ha
ek
s
ng
promedios de los centros de envío.

i
th
dir
e
ak
m
e
w
w
e
dir
m
ak
e
ek th
ing
s
to
ha
r
pp
en
Conclusión
Conclusión
• Las entregas del centro Este tardan más que
las del centro Central.

r n
to
e
• Todos los centros de envío tienen tiempos de

pp
ha
ek
s
ing
th
entrega promedio significativamente distintos.
dir
e
ak
m
e
w
El centro de envíos Oeste tiene la media de
tiempo de entrega más rápida (2.981 días).
w
e
dir
m
ak
e
ek th
ing
s
to
ha
r
pp
en
Conclusión
Conclusión
• Gráfica de probabilidad normal: para detectar
anormalidades. Una línea aproximadamente recta
indica que los residuos se distribuyen

r n
to
e
pp
normalmente.

ha
ek
s
ing
th
dir
e
ak
m
e
w
Conclusión
• Histograma de los residuos: para detectar diversos valores
máximos, valores atípicos y anormalidades. El histograma
debe ser aprox. simétrico y con forma de campana.

r n
to
e
pp
ha
ek
s
ing
th
dir
e
ak
m
e
w
Conclusión
• Residuos contra los valores ajustados: para detectar
varianza no constante, términos de orden superior
omitidos y valores atípicos. Los residuos se deben
dispersar aleatoriamente en torno a cero.

r n
to
e
pp
ha
ek
s
ing
th
dir
e
ak
m
e
w
Conclusión
• Residuos versus orden: para detectar la
dependencia del tiempo de los residuos. Los
residuos no deben exhibir un patrón claro.

r n
to
e
pp
ha
ek
s
ing
th
dir
e
ak
m
e
w
w
e
dir
m
ak
e
ek th
ing
s
to
ha
r
pp
en
Ejercicio
Pruebas de Hipótesis

 Prueba de hipótesis

r
 Pruebas para una muestra

n
to
e
pp
ha
ek
s
 Pruebas para dos muestras

ing
th
dir
e
ak
 Pruebas para más de dos muestras
m
e
w
 Pruebas no paramétricas
w
e
dir
m
ak
e
ek th
ing
s
to
ha
r
pp
e n
Pruebas no paramétricas
w
e
dir
m
ak
e
ek th
ing
s
to
ha
r
pp
en
• Cuando los tamaños de las muestras son
pequeños y las poblaciones originales no son

r n
normales, aplique las pruebas no

to
e
pp
ha
ek
s
ng
paramétricas.

i
th
dir
e
ak
m
e
w
1 NIVEL

r n
to
e
pp
Normales No Normales

ha
ek
s
ng
i
th
dir
e
ak
m
e
w
n<30
n>30 σ es
conocida Pruebas de rangos
Prueba t de una
muestra Prueba de Z Wilcoxon
Prueba de Wilcoxon
• Es usada para hacer pruebas de hipótesis
acerca de la mediana.

r n
to
e
• La prueba estadística se basa en el estadístico

pp
ha
ek
s
ing
th
de Wilcoxon (1945).
dir
e
ak
m
e
w
Ejemplo
Un químico para una compañía farmacéutica quiere
determinar si el tiempo de reacción medio para un

r
antiácido recién desarrollado es menos de 12

n
to
e
pp
ha
ek
s
minutos. El químico mide el tiempo de reacción

ing
th
dir
e
ak
m
para 16 muestras del antiácido 1.
e
w

Abrir Antiacido.xls
Ejemplo
• H0: mediana (12 min)= 12 min
• H1 : mediana (12 min)= 12 min

r n
to
e
pp
ha
ek
s
ing
th
dir
e
ak
m
e
w
• Ruta:statnon parametrics

r n
to
e
pp
ha
ek
Colocar Variables

s
ing
th
dir
e
ak
m
e
Valor objetivo
w
Lo que se va a
probar
w
e
dir
m
ak
e
ek th
ing
s
to
ha
r
pp
en
• Queremos conocer si el
tiempo de espera en el

r n
hospital Universitario de

to
e
pp
ha
ek
s
ng
Nariño es igual a 10 min.

i
th
dir
e
ak
m
e
w

Abrir Waittime. xls


Determinando la hipótesis
Ho: No hay diferencia entre los datos recolectados y el
valor buscado (Promedio = 10 min)

r
Ha: Si hay diferencia entre los datos recolectados y el

n
to
e
pp
ha
ek
s
valor buscado (Promedio ≠ 10 min)

ing
th
dir
e
ak
m
e
w
Prueba de hipótesis
2 NIVELES
Datos en cada niveles son:

r n
to
e
pp
ha
Normales No Normales

ek
s
ing
th
Varianzas son: Varianzas son:

dir
e
ak
m
e
w
Iguales Iguales Diferentes
Diferentes
* Mann- Whitney
* Prueba t * Mann- Whitney
* Prueba t * Prueba t (si n>25)
* ANOVA de una vía * Prueba t (si n>25)
* ANOVA de una vía
(si n>25)
w
e
dir
m
ak
e
ek th
ing
s
to
ha
r
pp
en
Mann Whitney
Ejercicio
Un restaurante italiano cercano a un campus universitario está
considerando la posibilidad de utilizar una nueva receta para
hacer la salsa que echa a las pizzas. Se elige una muestra

r
aleatoria de ocho estudiantes y se pide a cada uno que valore en

n
to
e
pp
ha
una escala de 1 a 10 su opinión sobre la salsa original y sobre la

ek
s
ing
th
salsa propuesta. Los números más altos indican que gusta más el
dir
e
ak
m
e
producto ¿indican los datos una tendencia general a preferir la
w
nueva salsa a la original?

Restaurant.xls
Prueba de hipotesis
3 NIVELES
Datos en los niveles
son:

r n
to
e
pp
ha
Normales No Normales

ek
s
i ng
Varianzas son: Varianzas son:

th
dir
e
ak
m
e
w
Iguales Iguales Diferentes
Diferentes
* ANOVA de una * ANOVA de una * Kruskall - Wallis
* Kruskall - Wallis
vía vía (si n>25)
* Kruskall - Wallis
w
e
dir
m
ak
e
ek th
ing
s
to
ha
r
pp
en
Kruskal Wallis
• Compara medianas de diferentes muestras,
cuando la distribución no es normal.

r n
to
e
• La prueba de Kruskal-Wallis es una alternativa

pp
ha
ek
s
ing
th
no paramétrica al ANOVA de un solo factor. La
dir
e
ak
m
e
w
prueba no requiere que los datos sean
normales
• Supongamos que en el caso de Estudio anterior
de los 3 centros las varianzas sean diferentes

r n
to
e
pp
ha
ek
s
ing
th
dir
e
ak
Se usaría Prueba no Paramétrica Kruskal Wallis
m
e
w
Pruebas no paramétricas
• Ruta: stat non parametrics Kruskal Wallis

r n
to
e
pp
ha
ek
s
ing
th
dir
e
ak
m
e
w

Días como variable ,


como factor Centros de
envío
Pruebas no paramétricas

r n
to
e
pp
ha
ek
s
ing
th
dir
e
ak
m
e
w

Se rechaza la Ho, por lo


que si hay diferencia
w
e
dir
m
ak
e
ek th
ing
s
to
ha
r
pp
en
Ejercicio Catapultas
• En equipos
– Seleccionar 3 tiradores
– Seleccionar una configuración

r n
to
e
pp
ha
ek
s
ng
– Cada tirador deberá realizar 20 tiros

i
th
dir
e
ak
m
– Registrar los tiros
e
w
30 min

¿La distancia alcanzada es distinta entre tiradores?


w
e
dir
m
ak
e
ek th
ing
s
to
ha
r
pp
en
Prueba JI cuadrada
w
e
dir
m
ak
e
ek th
ing
s
to
ha
r
pp
en
Pruebas de hipótesis para
proporciones y porcentajes
Se requiere comparar las proporciones o
porcentajes de las diferentes muestras de datos
para decidir si son estadísticamente diferentes.

r n
to
e
pp
ha
ek
s
ng
Niveles

i
th
dir
e
ak
m
e
w
1 2 3

1 prueba de proporciones
Para comparar una 2 Prueba de proporciones
Ji – cuadrada
proporción vs un target Comparación de 2
Para comparar 3 o más
especifico o proporción proporciones uno vs el otro
histórica
Prueba Ji cuadrada
• La distribución es binomial.

r n
to
e
pp
ha
ek
s
ing
th
dir
e
ak
m
e
w
• La Ji cuadrada mide las diferencias entre los conteos
observados y esperados de la siguiente forma
2 (𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂 − 𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸)2
𝑥𝑥
Ji = �

r
𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸

n
to
e
pp
ha
ek
s
ing
th
dir
e
ak
m
e
w
• Los conteos son sumarizados en una tabla
conocida como tabla de contingencia.
Observado
Consideremos los siguientes datos , donde se quiere
demostrar el tipo de error presentado en la facturación
no difiere de la persona

r n
to
e
pp
ha
Tipo de Arturo Juan Luis Marisol Totales %

ek
s
ng
errores

i
th
dir
e
ak
Fallas en la 3 6 5 1

m
e
captura
Errores en 7 9 w 5 1
los
conceptos
Cálculos 9 12 11 23
erróneos
Totales
Esperado
De acuerdo a los datos observados:
Tipo de Arturo Juan Luis Marisol

r n
to
errores

e
pp
ha
ek
Fallas en la

s
ing
captura

th
dir
e
ak
Errores en los

m
e
conceptos
w
Cálculos
erróneos
w
e
dir
m
ak
e
ek th
ing
s
to
ha
r
pp
en
Minitab
Minitab
• Ruta: Stat>Tables>Chi-Square Test
Como ingresar la información a
minitab:

r n
to
e
pp
La primera opcion cuando

ha
ek
s
ng
tienes los datos en fila en

i
th
dir
e
minitab.

ak
m
e
Summarised datal esta opción w
te permite ingresar los datos
directamente a la prueba de
hipótesis
Ejemplo
• Las mujeres y hombres contestaron un
cuestionario acerca de las diferencias de género,
3 categorías de respuesta.

r n
to
e
pp
ha
¿Existe diferencia en las respuestas por el género?

ek
s
ing
th
dir
e
ak
m
e
A w B C
Hombres 37 49 72
Mujeres 7 50 31
Ejercicio
Con base en la información presentada en la parte de
abajo, decide si la salida de un procedimiento
quirúrgico depende del hospital usado.

r n
to
e
pp
ha
ek
s
ing
th
dir
e
ak
m
e
w
w
e
dir
m
ak
e
ek th
ing
s
to
ha
r
pp
e n
Prueba de Proporciones
w
e
dir
m
ak
e
ek th
ing
s
to
ha
r
pp
en
Comparación de proporciones de dos
poblaciones
Ésta prueba se basa en las proporciones de la muestra del evento, y
utiliza datos de atributos binarios como:
• '0 ó 1',

r
• "Éxito o fracaso"

n
to
e
pp
ha
• "Defectuoso o no defectuoso",

ek
s
ing
th
• "Ocurrencia o no ocurrencia
dir
e
ak
m
e
w
También se puede realizar esta prueba si solo se tiene los datos de
resumen de las dos muestras, tales como "número de ocurrencias" o
"proporción de ocurrencias".
• La prueba busca diferencias significativas

r n
to
e
pp
entre las proporciones de 2 poblaciones

ha
ek
s
ing
th
diferentes.
dir
e
ak
m
e
w
Ejemplo
Dos encuestas de satisfacción de los clientes se han
llevado a cabo en dos zonas diferentes (A y B). Los
resultados fueron:

r n
to
120

e
pp
ha
Planteamiento de hipótesis

ek
s
100

ng
21

i
H0= la satisfacción no tiene diferencia

th
dir
e
ak
80
8 entre región y región (A y B)

m
e
w
60 satisfied
unsatisfied
40
72 79 H1:= la satisfacción del cliente es
20 diferente entre región y región (A y B)
Nivel α = 0.05
0
Area A Area B
RutaMinitab: stat> Basic statistics>2 proportions

r n
to
Como ingresar la información a minitab:

e
pp
ha
ek
s
ing
th
Las primeras 2 opciones son cuando tienes

dir
e
ak
m
los datos en fila en minitab.

e
w
Summarised datal esta opción te permite
ingresar los datos directamente a la prueba
de hipótesisc
Step 3 Interpreting the Results
Primero los resultados para
cada muestra se resumen
junto con sus proporciones

r n
to
e
pp
ha
El valor de P = 0.037, el

ek
s
ng
i
valor es bajo (P<0.05)

th
dir
e
ak
H0 se rechaza

m
e
w
95% Intervalo de confianza para la diferencia:
La diferencia absoluta entre las 2 proporciones es 0.11(90%-79%= 11%)
Sin embargo, como con todas las estadísticas, debemos colocar un intervalo de confianza en
torno a este valor, con el fin de reflejar la cantidad de datos. El intervalo de confianza del 95%
indica que la diferencia entre las proporciones podría estar en cualquier 0,006-0,21
Facultad de Ingeniería- UNAM
Ejercicio
Se quiere determinar si un nuevo programa de
de computación producirá menos defectivo de formas en un
proceso de compras. En la tabla se muestran datos
recolectados antes y después de la implementación del

r n
to
e
pp
ha
software.

ek
s
ing
th
dir
e
Determina si el nuevo software es una mejora.

ak
m
e
w
Software anterior Software nuevo
Piezas ok 193 172
Defectivas 14 10
Ejercicio
• Se quiere determinar si las solicitudes atendidas
correctamente de finanzas Sur y Finanzas centro
dependen de la región.

r n
to
e
pp
ha
ek
s
ing
th
dir
e
Solicitudes Correctas

ak
m
e
w
SUR 1,540 1,499
Centro 2,150 2,002
“ Nada hay más difícil de realizar ni nada de más
dudoso éxito en la práctica que la implantación de
nuevos sistemas, pues el innovador tiene como

r
enemigos a cuantos obtuvieron provecho del

n
to
e
pp
ha
régimen anterior… los cuales no se convencen de

ek
s
ing
la bondad de algo nuevo hasta que no lo ven

th
dir
e
ak
confirmado en la práctica”
m
e
w

El príncipe
Maquiavelo

Você também pode gostar