Escolar Documentos
Profissional Documentos
Cultura Documentos
OBJETIVO ESPECÍFICO:
CONTENIDO TEMÁTICO:
7.1 Introducción,
7.2 Tipos de muestras,
7.3 Escalas de medición,
7.4 Ventajas y desventajas
7.5 Pruebas no paramétricas,
7.6 Chi-Cuadrada y ejemplo,
7.7 Kolmogorov-Smirnov y ejemplo,
7.8 Wilcoxon y ejemplo,
7.9 Mann-Whitney y ejemplo,
7.10 Cochran y ejemplo,
7.11 Friedman y ejemplo,
7.12 Kruskal-Wallis y ejemplo y
7.13 Problemas.
METODOLOGÍA Y ACTIVIDADES:
EVALUACIÓN:
BIBLIOGRAFÍA BÁSICA:
7.1 Introducción.
Las pruebas para hacer inferencias estadísticas pueden ser de dos tipos: paramétricas y no
paramétricas.
72
Diseño de experimentos Mercado H. – Santoyo S.
Las pruebas paramétricas son aquellas que hacen ciertas suposiciones acerca de la naturaleza de la
población de la que se extrajeron las muestras, como: a) población normalmente distribuida y b)
igualdad de varianzas. Se aplica a datos continuos medidos en una escala de intervalo, de
proporciones o escalar.
Las pruebas no paramétricas, también llamadas pruebas de "distribución libre", son aquellas en las
que no existen supuestos sobre la distribución de los parámetros de la población. Se aplican con
mayor frecuencia a los datos nominales y ordinales, si bien pueden emplearse también para analizar
datos continuos transformados a una escala ordinal.
Estadística no Paramétrica
Estadística Paramétrica
El análisis estadístico utilizado para contrastar (comparar) dos o más muestras, depende de como se
obtuvieron las observaciones, y en particular si estas proceden de muestras relacionadas o muestras
independientes.
Las muestras relacionadas se caracterizan porque cada observación realizada en una muestra
presenta solo una observación concordante con la otra muestra. Por tanto, el número de
observaciones (n) es igual en cada una de ellas.
Una prueba de hipótesis basada en este tipo de datos se conoce como Prueba de comparaciones
relacionadas. El objetivo de estas pruebas es reducir lo más posible las fuentes de variación
extrañas, haciendo semejantes a las parejas con respecto a tantas variables como sea posible.
73
Diseño de experimentos Mercado H. – Santoyo S.
Autoapareamiento:
En este caso el sujeto actúa como su propio control o testigo, por ejemplo:
a) Un mismo grupo de individuos puede ser sometido a dos medicamentos de prueba (tratamientos)
en dos ocasiones diferentes y ver como reacciona con cada uno.
b) Cuando se compara un grupo de determinaciones de alguna prueba de laboratorio realizadas
antes y después de aplicar un tratamiento.
c) La aplicación de un método de tratamiento en un brazo, pierna, ojo, etc. de un paciente, mientras
que en el otro brazo, pierna, ojo, etc., recibe el otro tratamiento.
Apareamiento artificial:
Es el organizado por el investigador, se forman parejas combinando individuos respecto a una
característica o características relevantes al estudio en cuestión. Este tipo de apareamiento es más
difícil que los anteriores.
Muestras independientes.
Existen muchas situaciones en las que se desconocen, o no hay factores relevantes necesarios,
para el autoapareamiento. Así mismo, con frecuencia los posibles beneficios derivados del
apareamiento no justifican el tiempo y esfuerzo necesarios. En este caso, la alternativa es
disponer de dos muestras independientes de observaciones. Por muestras independientes nos
referimos a que la elección de una muestra no se vea afectada de manera alguna por la selección
de la otra, por ejemplo: Una serie de datos son obtenidos de un grupo de estudios y son
comparados con otra serie de datos de un grupo testigo compuesto por unidades experimentales
diferentes a las que se compone el grupo experimental. En ambos grupos el número de
observaciones no es necesariamente igual, como es el caso de muestras relacionadas o pareadas.
Con la estadística se analizan características (llamadas variables) de personas o cosas que pueden
tomar diferentes valores cuando son medidas. Medición es la asignación de números a objetos o
sucesos de acuerdo a conjuntos de reglas predeterminadas o arbitrarias.
74
Diseño de experimentos Mercado H. – Santoyo S.
Niveles de medición:
Medición nominal.
Es la escala de medición más baja, puede designarse por nombres o atributos y consiste en clasificar
los datos en categorías mutuamente excluyentes y colectivamente exhaustivas. Se le asignan valores
numéricos a los datos, pero la magnitud del número no tiene otro significado que no sea el de
distinguir uno de otro. Por ejemplo: para la estatura 1 alto, 0 bajo; 0 muerto 1 vivo, en el caso de
bioensayos; para el sexo de los peces 1 juvenil, 2 hembra, 3 macho; para los humanos 1 masculino,
2 femenino.
Medición ordinal.
Consiste en clasificar los datos en categorías y ordenarlos o graduarlos, de tal modo que la magnitud
del número tenga un significado relativo en términos de que una medición sea menor o mayor que
otra. Ejemplos: la constitución física de una persona puede ser clasificada como 1 si es delgada, 2 si
es regular y 3 si es obesa; de acuerdo a su estado de salud como 1 muy sana, 2 sana, 3 enferma, 4
delicada, 5 grave y 6 muy grave; el nivel o grado de educación como 1 si tiene primaria, 2 con
secundaría, 3 con nivel de bachilleres, 4 con licenciatura y 5 con postgrado.
En la gran cantidad de datos recolectados, no es fácil especificar la distribución original. Para operar
con tales datos, necesitamos estadística de distribución libre, es decir, procedimientos que no
dependan de una distribución original específica. Si no especificamos la naturaleza de la
distribución original, entonces ordinariamente no trataremos con parámetros. La estadística no
paramétrica compara distribuciones y no parámetros. Éstas estadísticas pueden ser sensibles a
cambios el localización, dispersión o en ambos.
Ventajas:
1.- Cuando es posible hacer solamente supuestos débiles acerca de la naturaleza de las
distribuciones que fundamentan los datos, entonces los estadísticos no paramétricos son los
apropiados.
2.- A veces, solo será posible poco más que categorizar los datos por falta de una escala de
medición adecuada. En este caso, lo ideal es hacer una prueba no paramétrica. Otras veces, la
categorización puede ser una forma de colectar datos con prontitud.
3.- Cuando es posible asignar rangos a los datos, se dispone de procedimientos no paramétricos. Por
ejemplo, puede asignarse rangos por textura o sabor; o bien por sexos; en un ensayo de variedades
75
Diseño de experimentos Mercado H. – Santoyo S.
que implique muchas localizaciones, las varianzas pueden ser heterogéneas violando los supuestos
usuales para el análisis de varianza, y los rangos pueden ser la mejor medida para el análisis.
4.- Como la estadística no paramétrica usa recuentos, rangos o los signos de diferencias de
observaciones pareadas, suelen ser, aunque no siempre, rápida y fácil de aplicar y aprender.
Desventajas:
1.- Si se sabe que la forma de la población original es razonablemente cercana a una distribución
para la cual hay una teoría normal, o si los datos pueden transformarse de modo que éste sea el caso,
entonces los procedimientos no paramétricos extraen menos información de la que hay disponible
en los datos.
2.- En particular, la eficiencia de los procedimientos no paramétricos es bastante alta para muestras
pequeñas. Por otra parte, la eficiencia puede no ser importante para muestras muy grandes.
3.- Las conclusiones derivadas de la aplicación de estas pruebas, sólo pueden atribuidas a las
muestras con las cuales se trabajó.
Para determinar cual de estas pruebas no paramétricas es la que pudiera se usada en el análisis, se
debe tomar en cuenta: Primero, el número de muestras (una, dos o más de dos); seguidamente, el
tipo de ellas (relacionadas o independientes) y finalmente la escala de medición (nominal, ordinal o
escalar). Las siguientes pruebas no paramétricas son las que más se utilizan y están ordenadas en
función del número de muestras, del su tipo, la escala de medición y su principal función (en
paréntesis).
76
Diseño de experimentos Mercado H. – Santoyo S.
La pruebas que se encuentran subrayadas serán las que se trataran en este capitulo.
77
Diseño de experimentos Mercado H. – Santoyo S.
No. De
Tipo de muestras Escala Prueba Fórmula Hipótesis nula Tabla
muestras
2
Las frecuencias
(f - F ) observadas son B
--- Frecuencias Chi-cuadrada χ =∑ i i
2 K
1 iguales a las χ2
Fi α, a-1
esperadas
1
--- Frecuencias
Kolmogorov-
Sminnov D=
F ia
− f ia La muestra sigue
“tal” distribución
B–9
D α, n
n
Primero de realiza: dj = x1j - x2j,
después el rango de dj La muestra 1 es ≥
después el rango signado de dj que la 2 (T+). B – 12
2 Relacionadas Al menos ordinal Wilcoxon
T- = Σ djRango signado negativo La muestra 1 es ≤ T α, n
T+ = Σ djRango signado positivo que la 2 (T-)
( + 1)
U = n1 n 2 + n1 n1 - R1 No hay diferencia
B – 11
2 Independientes Al menos ordinal MannWhitney 2 entre las dos
U α(2), n1 ,n2
U ′ = n1 n 2 - U muestras
2
( ∑ Gi )
(a -1)[ ∑ G - 2
i ] No hay diferencia
Relacionadas Nominal Cochran Q= a entre las K
B-1
Σ B2j χ2 α, a-1
muestras
∑ Bj -
K a
12
χ
2 No hay diferencia
b
Relacionadas Al menos ordinal Friedman = ∑ 1 Ri2 - 3 b(a+ 1) entre las K
B – 14
χ2 α, a, b
ab (a+ 1 ) muestras
78
Diseño de experimentos Mercado H. – Santoyo S.
12 2 No hay diferencia
Kruskal- k Ri B – 13
K Independientes Al menos ordinal H= ∑ - 3(N + 1) entre las K
Wallis N(N + 1) 1 ni muestras
H α, n1, n2, n3
79
Diseño de experimentos Mercado H. – Santoyo S.
7.6. Chi-cuadrada χ 2,
2
(f - F )
χ =∑ i i
2 K
1
Fi
Hipótesis
Ho: La muestra sigue la proporción 9:3:3:1
Ha: La muestra no sigue dicha proporción
La suma de las proporciones (Pi) 9:3:3:1 es 16, por lo que las frecuencias esperadas (Fi) se obtienen
de acuerdo a la fórmula
P
F = n 16
i
i
Frecuencias Amarilla lisa Amarilla rugosa Verde lisa Verde rugosa Total
2
(f i - Fi )
χ 2 = ∑1K = 0.9201 + 1.3230 + 0.8003 + 5.9290 = 8.972
Fi
χ 2
0.05,3 = 7.815
80
Diseño de experimentos Mercado H. – Santoyo S.
7.7. Kolmogorov-Smirnov
D=
Fia
− f ia
o bien max di
n
Donde fia es la frecuencia acumulada de los datos originales, Fia es la frecuencia acumulada de los
datos según la distribución a prueba y n es la suma de las fi.
Comparar con: Dα ,n de la Tabla B-9.
Ejemplo. Se realizó un muestreo de mariposas nocturnas en los troncos de los árboles con el
propósito de determinar si su distribución es uniforme. Cada Xi es la altura agrupada (en m.) a la
cual fue observada la mariposa.
Ho: Las mariposas se distribuyen uniformemente desde el suelo hasta una altura de 25 m.
Ha: Las mariposas no se distribuyen uniformemente desde el suelo hasta una altura de 25 m.
Con estos datos se sigue el procedimiento descrito por Kolmogorov-Smirnov, para una muestra:
Primero se calcula la frecuencia de la distribución uniforme (iguales frecuencias); enseguida se
calculan las frecuencias esperadas (fia y Fia) y finalmente la diferencia de estas en valor absoluto.
d max = 4 D = 4 / 15 = 0.2667
De la Tabla B-9 se obtiene (D max)0.05,5,15 = 0.3376
Por lo que Ho no es rechazada.
Lo que establece que la distribución de las mariposas se distribuyen uniformemente en la altura de
los árboles.
81
Diseño de experimentos Mercado H. – Santoyo S.
7.8. Wilcoxon
Ejemplo: Se desea saber si la longitud de las patas traseras (LT) de los venados son iguales que la
longitud de las patas delanteras (LD). Se muestrearon 10 venados, arrojando los siguientes
resultados:
n = 10 T- = 3 + 1 = 4 T+ = 4.5+4.5+7+7+9.5+7+9.5+2 = 51
De la Tabla B-12 se obtiene T0.05(2),10 = 8
Como T- es menor que 8, Ho no se rechaza.
82
Diseño de experimentos Mercado H. – Santoyo S.
7.9. Mann-Whitney,
( + 1)
U = n1 n 2 + n1 n1 - R1 U ′ = n1 n 2 - U
2
Rangos de
Machos Hembras
Machos Hembras
220.1 223.4 12 9
218.6 221.5 13 11
229.6 230.2 3 2
228.8 224.3 4 6
222.0 223.8 10 8
224.1 230.8 7 1
226.5 -- 5 --
n1=7 n2=6 R1=54 R2=37
( + 1) 7(7 + 1)
U = n1 n2 + n1 n1 - R1 = 7 x 6 + − 54 = 16 U ′ = n1 n2 -U = 26
2 2
7.10. Cochran,
83
Diseño de experimentos Mercado H. – Santoyo S.
Fórmula:
2
( ∑ Gi )
(a -1)[ ∑ G - 2
i ]
Q= a
Σ B2j
∑ Bj -
a
Comparar con: χ 2
α ,a-1 de la Tabla B.
Ejemplo: Se realizó un muestreo en 5 escuelas de 8 niños cada una, para determinar si habían
realizado cierta tarea. Se desea saber si no hay diferencia entre las escuelas. Los resultados fueron:
Ho: No hay diferencia entre las escuelas Ha: Si hay diferencia entre las escuelas
Escuela
Niño Bj
E1 E2 E3 E4 E5
1 1 0 0 0 1 2
2 1 1 1 1 1 elimina
3 0 0 0 1 0 1
4 1 1 0 1 0 3
5 0 1 1 1 1 4
6 0 1 0 0 1 2
7 0 0 1 1 1 3
8 0 0 1 1 0 2
Gi 2 3 3 5 4 17
2
( ∑ Gi )
(a -1)[ ∑ G - 2
i ]
Q= a
Σ B2j
∑ Bj -
a
(5 - 1)[ 22 + 32 + 32 + 52 + 4 2 - ( 17 2 )/5]
Q= = 2.737
17 - [ 22 + 12 + 32 + 4 2 + 22 + 32 + 22 ]/5
La χ 2
0.05,4 = 9.41 por lo tanto no se rechaza Ho
84
Diseño de experimentos Mercado H. – Santoyo S.
7.11. Friedman
12
χ
2
b
= ∑ 1 Ri2 - 3b(a+ 1)
a b(a+ 1)
donde: a = No. columnas (tratamientos), b = No. hileras (bloques)
Compara con: χ 2
α ,a,b de la Tabla B-14.
Ejemplo: Se probaron 4 dietas para incrementar el peso, cada una en cinco personas, los resultados
fueron:
12
χ
2
= [ 8 2 + 19 2 + 16 2 + 7 2 ] - (3)(5)(4 + 1) = 12.60
(4)(5)(4 + 1)
La χ 2
0.05,3 = 7.815 por lo que se rechaza Ho
7.12. Kruskal-Wallis,
85
Diseño de experimentos Mercado H. – Santoyo S.
2
12 k Ri
H= ∑ - 3(N + 1)
N(N + 1) 1 ni
k
2 2 2 2
12 Ri 12 41 23 14
H= ∑ - 3(N + 1) = + + − 3(13)= 7.269
N (N + 1) 12x13 4 4 4
ni
1
H = 7.269, la H0.05,4,4,4 = 5.692
86
Diseño de experimentos Mercado H. – Santoyo S.
7.13. Problemas.
1. Un alimentador de aves es colocado en seis diferentes alturas. Se registró las veces en que
fueron seleccionados por cada uno de los ocho cardenales. Pruebe que la selección de cada
alimentador fue igual.
Altura del
1 2 3 4 5 6
alimentador
Número observado 2 3 3 4 4 2
Día 1 2 3 4 5 6 7 8 9 10 11
NO 104 116 84 77 61 84 81 72 61 97 84
HC 108 118 89 71 66 83 88 76 68 96 81
3. Los siguientes datos representan los volúmenes (en micrones cúbicos) de eritrocitos tomados
de organismos normales (diploides) e intersexos (triploides). Pruebe la hipótesis de que el
volumen de las células insersexo es 1.5 veces el volumen de las células normales.
Normal 248 236 269 254 249 251 260 245 239 255
4. Se encuestaron 12 personas y se les preguntó si les agradaban (1) o no (0) cuatro alimentos.
Pruebe la hipótesis de que los cuatro alimentos son igualmente agradables.
Persona A1 A2 A3 A4
1 1 1 0 0
2 1 1 0 1
3 1 0 0 0
4 1 0 1 1
5 1 1 0 0
6 0 1 0 0
7 0 1 1 0
8 1 1 1 0
9 0 0 1 1
10 1 0 1 0
11 0 0 0 1
87
Diseño de experimentos Mercado H. – Santoyo S.
12 1 1 0 0
5. Seis mesas de un invernadero fueron utilizadas como bloques. En cada block una de cada
cuatro variedades de plantas caseras fueron sembradas. La altura de las plantas (en cm) se dan en
la siguiente tabla. Pruebe la hipótesis de que las cuatro variedades de plantas tuvieron la misma
altura.
6. Los siguientes datos son los pesos de alimento (en Kg) consumidos por día por venado adulto
colectado en diferentes meses de un año. Pruebe la hipótesis de que el consumo de alimento es el
mismo en los meses probados.
MESES
Venado
Feb. May. Ago. Nov.
1 4.7 4.6 4.8 4.9
2 4.9 4.4 4.7 5.2
3 5.0 4.3 4.6 5.4
4 4.8 4.4 4.4 5.1
5 4.7 4.1 4.7 5.6
6 4.2 4.8
ni
Ri
88