Escolar Documentos
Profissional Documentos
Cultura Documentos
DISEÑO DE EXPERIMENTOS
1.1. INTRODUCCIÓN
En un intento de captar que la Estadística puede ser un campo interesante y estimulante que
toca muchísimos aspectos de gran importancia en la vida diaria, en toda rama del saber
humano, como son las ciencias e ingeniería, es necesario presentar un texto que además de
contener los conceptos teóricos, sea instructivo y legible con énfasis en datos químicos
obtenidos como fruto de la experimentación.
Es muy importante que todo profesional de Ciencias o ingeniería, cuando pretenda realizar
una investigación o un experimento, planifique adecuadamente sus procedimientos y pasos a
seguir, esto quiere decir que “diseñe” un buen plan de acción.
Sin embargo es común que las pruebas experimentales se realicen apelando a la experiencia
y a la intuición, en lugar de seguir un plan experimental adecuado que garantice una buena
respuesta a las interrogantes planteadas.
Proponer nuevos procesos, variar sus condiciones y hacer cambios para reducir los
errores o defectos.
1.2. EL EXPERIMENTO
Los investigadores realizan experimentos en todos los campos del saber, para descubrir algo
acerca de un proceso o sistema en particular.
El término experimento puede tener dos acepciones una general y otra particular:
A menudo, es difícil asignar causa y efecto por el estudio de los datos de observación, si el
interés es establecer relaciones causales se debe trabajar con datos experimentales, donde
se ha controlado o modificado ciertos factores, que son resultados de experimentos
lógicamente diseñados que ofrecen pruebas a favor o en contra de las relaciones causales.
Causa Efecto
(Variable independiente) (Variable dependiente)
X Y
Entonces el experimento “es una prueba o ensayo, que se basa en reproducir algún hecho
diferente de lo habitual, la aparición de circunstancias extrañas en presencia de características
especialmente preparadas para interpretar y extraer conclusiones de lo que ocurra”.
Desde otro punto de vista se puede definir: “un Experimento es la Muestra en espacio y
tiempo en base a la cual se estimaran parámetros poblacionales, y se tomaran decisiones
basadas en las comparaciones de las poblaciones en estudio”.
Cada experimento es una pregunta que se hace respecto a productos y/o procesos.
M.Sc. Lic. Oscar Soliz Vásquez 3 QMC 304
Para que las respuestas no sean confusas es necesario que el experimento sea:
Cuidadosamente conducido.
Adecuadamente analizado
Correctamente interpretado
Diseño del experimento - donde algunas formas para probar una nueva hipótesis son
desarrolladas.
b) Experimentos controlados
Los experimentos controlados son los que se hace variar uno o más factores, mientras
que los demás factores permanecen constantes, sin embargo no es posible controlar
un solo factor presentado siempre un error experimental, que se mide por la variación
de las observaciones.
Por lo que también se define al diseño de experimentos como: la secuencia de pasos tomados
de antemano (Planeados) para asegurar que los datos se obtienen adecuadamente, lo que
permitirá un análisis objetivo conducente a conclusiones válidas del problema de
investigación.
(Factores controlables) X1 X2 … Xk
Materia PROCESO O
RESPUESTA
prima UNIDAD
EXPERIMENTAL
(Factores no controlables) Z1 Z2 … Zk
Unidad experimental – son los elementos sobre los cuales se hacen mediciones y a los
cuales un tratamiento puede ser asignado independientemente. Ejemplo: suelo, agua,
materia o fenómeno que es necesario producir una medición o datos representativos.
Niveles y tratamientos – Los diferentes valores que se asignan a cada factor estudiado
en un diseño experimental se llaman niveles. Una combinación de niveles de todos los
factores se llama tratamiento. En caso de experimentar con un solo factor, la combinación
de niveles es a la vez un tratamiento.
Una definición indica: “La estadística es la ciencia pura y aplicada que crea, desarrolla y
aplica técnicas de modo que pueda evaluarse la incertidumbre de inferencias inductivas”.
Otra definición indica “que es el arte y ciencia de recoger datos observables, cuantificables
y clasificables”. Arte por la habilidad de utilizar un conjunto de artificios necesarios para la
recolección de datos y ajustar a la realidad reduciendo errores; Ciencia porque se aplican
el método científico (observación, experimentación, hipótesis, prueba y errores). (Moya R.
“Estadística….....p. 5)
M.Sc. Lic. Oscar Soliz Vásquez 6 QMC 304
La estadística se encarga de:
Muchos químicos consideran las pruebas estadísticas como métodos que sólo se utilizan
para juzgar los resultados de un experimento concluido, sin embargo es necesario estar
consciente de la importancia de los conceptos estadísticos en la planificación y el diseño
de experimentos.
La media aritmética es una medida de valor central que da una información precisa,
y alrededor de la cual se distribuyen las observaciones individuales. Su valor
numérico se obtiene calculando el promedio aritmético de los valores obtenidos.
X
Xi
N
La mediana es aquel valor que divide a la población en dos grupos de igual número
de observaciones, cuando se han ordenado por su magnitud creciente.
a) Desviación estándar: ( σ , s)
( Xi )
N 1
N 1
x X N
( X) i
i i
CV *100
8.68cm
CV x100 11%
78.89cm
x
N 1
SC SC
CM =
N 1 GL
En química, como en otras ciencias experimentales, las leyes o hipótesis deben ser
demostradas experimentalmente, para lo cual es necesario realizar mediciones. Medir una
propiedad supone admitir que la misma posee un valor definido, el cual se llama valor real.
Sabiendo que los errores son propios de cualquier proceso de medición podemos advertir que
no es conveniente realizar una única medición de la propiedad en estudio. Para una buena
estimación del valor real se deben realizar múltiples medidas en iguales condiciones y luego
promediar los resultados. Entonces para detectar estas diferencias las unidades
experimentales deberán ser homogéneas o de lo contrario pueda existir una variación entre
cada tratamiento y se denomina error.
Los científicos experimentales hacen una distinción fundamental de tres tipos de errores:
aleatorios, sistemáticos y experimentales o crasos.
M.Sc. Lic. Oscar Soliz Vásquez 10 QMC 304
1.5.1. Error aleatorio, error sistemático y error experimental
Error aleatorio
Los errores aleatorios provocan que los resultados individuales se encuentren a ambos
lados del valor medio, afectando a la precisión o reproducibilidad de un experimento.
Error sistemático
Los errores sistemáticos provocan que todos los resultados sean erróneos en el mismo
sentido, con relación a un valor de comparación, afectando a la exactitud o sea la
proximidad al valor verdadero.
Los errores experimentales o crasos pueden definirse como errores graves que no
queda otra alternativa que abandonar el experimento y empezar de nuevo, que pueden
ser atribuibles a errores personales, de medición, instrumentación, accidental y otros.
1 1 X
Y e ( )
2 2
Las tablas dan el valor del área y la variable X se expresa como Z. Estas tablas
pueden usarse para calcular las probabilidades asociadas con cualquier
distribución normal si se conocen la media y la varianza.
X
Z
Si Ẍ=µ ,Z=0 Si X - µ = σ, Z=1
2.12 1.94
Z 0.231
0.78
Esta distribución fue estudiada por William Sealy Gosset (1908), quien escribió
diversas investigaciones de estadística con el seudónimo de “Student” perfeccionada
posteriormente por Ficher (1924).
x
t
Sx
S S
Sx
n n
S
Sx
n
P ( Ẍ – t *Sx ≤ µ ≤ Ẍ + t * Sx ) = 95%
P (Ẍ – t * Sx ≤ µ ≤ Ẍ + t * Sx ) = 99%
L1 = Ẍ – t * Sx L2 = Ẍ + t * Sx
Así mismo existen algunos factores que no se pueden controlar: equipo de flotación,
presión atmosférica, etc.
Por lo tanto se debe caracterizar las variables que influyen en la concentración, para
lograr se puede diseñar el experimento de tal manera que permita estimar los efectos
del factor; CUANTO cambia, la variable respuesta (defectos por unidad); CUANTO se
modifica cada factor y si cambian los factores simultáneamente.
Puede ser peligroso analizar datos que no proceden de una adecuada planificación
experimental, aunque también se puede aprender de los estudios realizados a partir de
datos recogidos por observación, de forma aleatoria y no planificada. Si no se toman las
debidas precauciones en los estudios derivados de la observación muestral, existe un alto
riesgo de cometer los siguientes errores en el análisis estadístico:
Realizar una lista con las cuestiones concretas a las que debe dar respuesta el
experimento y los problemas que se quiere resolver. Un planteamiento claro del
problema contribuye a un mejor conocimiento del fenómeno y la solución.
Calcular el número de observaciones que se deben tomar para alcanzar los objetivos
del experimento. La regla de asignación o diseño experimental, especifica que
unidades experimentales se observarán bajo cada tratamiento (en función del tamaño
muestral, número de repeticiones, orden adecuado, todo en función de los objetivos).
M.Sc. Lic. Oscar Soliz Vásquez 16 QMC 304
Es importante precisar cuál será esta variable y en qué unidades serán medidos,
también es conveniente determinar con claridad la forma de medición, instrumentos de
medida, disponibilidad de instrumentos, etc.
Después de tener las variables de estudio los niveles y variable respuesta se define el
diseño a seguir en la experimentación, y comprobar una hipótesis estadística a
plantearse y el modelo a cual se va a seguir para el cumplimiento del objetivo
7) Análisis estadístico
8) Conclusiones y recomendaciones
Debe quedar claro que el análisis estadístico es un paso más, completamente integrado
en el proceso de planificación, por último se puede indicar que toda persona implicada en
la ejecución del experimento y en la recolección de los datos debe ser informada con
precisión de las estrategias experimentadas diseñadas.
Se puede indicar que existen tres principios básicos que se deben tener en cuenta:
Obtención de replicas
Aleatorización
M.Sc. Lic. Oscar Soliz Vásquez 17 QMC 304
Análisis de bloques
Demuestra que se pueden reproducir los resultados bajo las condiciones actuales.
Proporciona cierto grado de seguridad contra resultados anormales en el
experimento.
Proporciona las medias para estimar la varianza del error experimental, aun
cuando la experimentación previa proporcione estimaciones de la varianza.
Proporciona la posibilidad de aumentar la precisión en la estimación de las medias
de los tratamientos.
La réplica de un experimento proporciona los datos para estimar la varianza del error
experimental. La bloquización proporciona un medio para reducir el error experimental.
Sin embargo, las réplicas y la bloquización por sí solos no garantizan estimaciones
válidas de la varianza del error experimental o de las comparaciones de tratamientos.
ALEATORIZACIÓN SENSIBILIDAD
ESTIMACIÓN VALIDA
DEL ERROR EXP. EFICIENCIA
REPLICACIÓN
ORTOGONA LIDAD
REDUCCIÓN VARIANZA
ERROR EXPERIMENTAL
BALANCE
BLOQUIZACIÓN
CONFUNDIDAD
En una prueba común que trata de explicar fenómenos mediante modelos. Ejemplo: La
tierra es redonda y gira sobre un eje de norte a sur. En estadística un modelo corriente
que describa la naturaleza de una observación consta de una media más un error.
Yi i
A esta relación se conoce como MODELO LINEAL ADITIVO, en donde Yi puede ser único
como la suma de parámetros.
El modelo también sirve para la prueba de la hipótesis. La estadística concede una gran
importancia a las pruebas de hipótesis que están basadas en la nulidad de las diferencias
(diferencia de promedios de muestras es cero).
H0 : µ1 = µ2 o µ1 - µ2 = 0
HA: µ1 ≠ µ2 o µ1 - µ2 ≠ 0
Se han inventado y propuesto muchos diseños experimentales para poder estudiar la gran
diversidad de problemas o situaciones que ocurren en la práctica. Esta cantidad de
diseños hace necesario saber cómo elegir el más adecuado para el problema que se
quiere resolver, conocer cómo es que se clasifica de acuerdo al objetivo y a su alcance.
Estos son los aspectos que más influyen en la selección de un diseño experimental:
Estos aspectos no son independientes entre sí, pero es importante señalar de manera
separada, ya que al cambiar cualquiera de ellos, cambia el diseño experimental a utilizar.
Diseños factoriales 2k
2) Diseños para estudiar el efecto de varios Diseños factoriales 3k
factores sobre una o más variables respuesta Diseños factoriales fraccionarios 2k-p.
Diseños factoriales 2k y 2k - p
Diseños para modelo Diseño de Plakett -Burman
3) Diseños para la optimización de primer orden Diseño simplex
de procesos
Diseños para modelo Diseño central compuesto
De segundo orden Diseño de Box - Behnhen
Diseños factoriales 3k y 3k - p
Muestra 1 2 3 4 5 6
Conc. Mercurio (ng/g) 2.4 2.5 1.3 1.3 0.7 1.2
2. Al realizar el análisis químico de una solución patrón de plata por espectrometría de absorción
atómica, teniendo los siguientes resultados:
Muestra ng/mL 5 5 5 5 5 5 5
Conc. Mercurio (ng/g) 0.125 0.127 0.151 0.139 0.149 0.125 0.123
Determinar los limites de confianza y el intervalo de confianza al 95 y 99%
0,750 0,784 0,762 0,900 0,738 0,756 0,730 0,729 1,151 0,750
0,760 0,721 0,78,5 0,875 0,739 0,758 0,746 0,78,9 0,751 0,722
0,747 0,750 0,750 0,752 0,748 0,754 0,793 0,760 0,794 0,730
0,753 0,750 0,762 0,750 0,758 0,751 0,774 0,749 0,739 0,751
0,811 0,755 0,770 0,662 0,783 0,745 0,756 1,230 0,956 0,990
Determinar: a) La media aritmética, moda, mediana, desviación estandar (por los 2 métodos),
coeficiente de variabilidad, varianza.
b) Los límites de confianza para una probabilidad del 95%; c) ¿Cuál la probabilidad de que una
muestra con 1,00 ppm de plomo de otro río se encuentre del intervalo de valores?
M.Sc. Lic. Oscar Soliz Vásquez 21 QMC 304
CAPITULO Nº 2
Los diseños unifactoriales o de un solo factor son diseños que tienen el objetivo de comparar
dos o más tratamientos. Ejemplo comparar equipos, procesos, reactivos, métodos, etc.
Esta comparación surge como una necesidad en la lógica de pretender la toma de decisiones,
para la solución de un problema. Donde en un problema de investigación o mejora de un
proceso, es necesario realizar comparaciones de tratamientos con el fin de elegir la mejor
alternativa.
Ho : µ1 = µ2 = …………….. = µK = µ
HA : µi = µj para algún i = j
Se debe decidir si los tratamientos son iguales estadísticamente en cuanto a sus medidas,
contra la alternativa de que al menos dos de ellas son diferentes.
El propósito de las pruebas de hipótesis es ayudar al químico, a tomar una decisión en torno a
una población o universo de estudio, al examinar una muestra de ella. La estimación y las
pruebas de hipótesis no son tan distintas como se supone.
Para presentar el análisis de varianza según los diferentes diseños, se sigue el procedimiento:
M.Sc. Lic. Oscar Soliz Vásquez 22 QMC 304
Descripción de los datos
Suposiciones; se presentan el modelo de cada diseño estudiado.
Hipótesis.
Cálculo de la estadística de prueba
Decisión estadística.
Conclusión.
Los modelos dados para cada diseño comparativo se tienen al menos dos fuentes de
variabilidad: los tratamientos o niveles del factor de interés y el error aleatorio.
Son los más simples de todos los diseños que se utilizan para comparar 2 o más
tratamientos, dado que solo considera dos fuentes de variabilidad: los tratamientos y el
error aleatorio.
Este diseño se llama completamente aleatorizado o al azar porque todas las corridas
experimentales se realizan en forma aleatoria y completa ya que al no existir bloques no
existe restricción a la aleatorización.
Si se hacen un total de N pruebas, estas se corren al azar, de tal manera que los posibles
efectos ambientales y temporales se vayan repartiendo equitativamente entre los
tratamientos.
TR A TAM IE NT OS
T1 T2 T3 ……. TK
Y11 Y21 Y31 ……. YK1
Y12 Y22 Y32 ……. YK2
Y13 Y23 Y33 …… YK3
. . . …… .
. . . …… .
. . . ……. .
Y1J Y2J Y3J …… YKJ
En caso de que los tratamientos tengan efecto, las observaciones Yij se pueden describir con
el modelo lineal dado por:
Donde: µ es la media global; ﺡi es un parámetro que mide el efecto del tratamiento i; εij es el
error aleatorio.
Este modelo implica dos fuentes de variabilidad: tratamientos y el error aleatorio. La media
global no es fuente de variabilidad por ser una constante común a todos los tratamientos y
hace los puntos de referencia.
En la práctica puede suceder que los tratamientos que se desean comparar sean demasiados,
entonces se puede comparar una muestra de los tratamientos de modo que el efecto pasa a
ser una variable aleatoria con su propia varianza.
La idea general de esta técnica es separar la variación total en las partes (debida al
tratamiento y al error). Cuando predomina la primera se concluye que los tratamientos tienen
efecto o lo que es lo mismo las medias son diferentes.
(a) (b)
Variabilidad total Variabilidad total
Variabilidad Variabilidad
Debido al tratamiento
Debido al debido al
Tratamiento error
Ho: µ1 = µ2 = …………… µk = µ
Para probar la hipótesis dada mediante la técnica de ANOVA con un criterio de clasificación, lo
primero es descomponer la variabilidad total. Una medida de la variabilidad total presente en
las observaciones es la suma total de cuadrados dada:
k ni
Y ..
SC Yij
i 1 j 1 N
k k ni
SC ni(Yi. Y ..) (Yij Yi.)
i 1 i 1 j 1
M.Sc. Lic. Oscar Soliz Vásquez 25 QMC 304
Donde el primer componente es la suma de cuadrados de tratamiento (SC TRAT) y el segundo
es la suma de cuadrados del error (SC E). SCTRAT mide la variación entre tratamientos,
mientras que SCE mide la variación dentro del tratamiento, ya que si hay mucha variación
entre las observaciones de cada tratamiento entonces Yij – Yij tenderá a ser grande en
términos absolutos.
Las sumas de cuadrados divididas entre sus respectivos grados de libertad se llaman
cuadrados medios (CM).
Fuente de SC GL CM Fo
variabilidad
Tratamientos k
Yi. Y .. k– 1 SCTrat CMTrat
SCTrat CMTrat
i 1 n N k 1 CME
Error SCE SCT SCTrat N–k SCE
CME
k 1
Total k k
Y .. N–1
SCT Yij
i 1 j 1 N
Fo = CMTRAT / CME
Por lo tanto se deduce que si Fo es grande se contradice la hipótesis de que no hay efectos de
tratamientos, en cambio si Fo es pequeño se confirma la validez de Ho. Así para un nivel de
significancia alfa prefijado, se rechaza Ho si F o > F , k-1, N-k donde F , k-1, N-k es el percentil (1 -
)* 100 de la distribución F.
Ejemplo: Se desea mejorar la fibra de llama que se emplea en una manufactura de tejidos. Se
sabe por experiencia que la resistencia es influida por el porcentaje de algodón presente.
Además se sospecha que elevar el contenido de algodón incrementará la resistencia. Para la
investigación experimental se desea probar a cinco niveles de porcentaje de algodón, teniendo
los siguientes resultados:
M.Sc. Lic. Oscar Soliz Vásquez 26 QMC 304
Comparar y determinar ¿Cuál es el porcentaje óptimo para obtener un tejido con mayor
resistencia?
La palabra completo en el nombre del diseño se debe a que en cada bloque se prueban
todos los tratamientos, es decir que los bloques están completos.
Análisis estadístico:
µ = media general ﺡi = efecto del i-esimo tratamiento εij = error aleatorio
βj = efecto del i-esimo bloque
a b
i 0
i 1
0
j 1
j
Ho : µ1 = µ2 = ………………= µk = µ
HA : µi ≠ µj para algún i ≠ j
Análisis estadístico
b a a b
Yi. Yij Y . j Yij Y .. Yij
i 1 j 1 i 1 j 1
Bloques b
Y . j Y .. b–1 SCBloques CMBloques
j 1 a
N b 1 CME
Fo = CMTRAT / CME
Que tiene una distribución F , a-1, (a-1)(b-1) Si Ho es verdadera Fo < F , a-1, (a-1)(b-1)
Ho debe rechazarse si Fo > F , a-1, (a-1)(b-1)
La comparación entre las medias de los bloques se debe realizar, porque si no existe gran
diferencia entre ellas, el análisis por bloques quiza no sea necesario en experimentos futuros.
MUESTRA LABORATORIO
1 2 3
A 5,1; 5,1; 5,2 5,3; 5,4; 5,4 5,3; 5,1; 5,3
B 5,8; 5,4; 5,5 5,4; 5,9; 5,7 5,2; 5,5; 5,4
C 6,5; 6,1; 6,3 6,6; 6,7; 6,8 6,5; 6,4; 6,6
Ho : µi = µj
HA : µi ≠ µj ; para toda i ≠ J
LSD = diferencia mínima significativa; ya que es la diferencia mínima que debe haber
entre dos medias maestrales para poder considerar que los tratamientos
correspondientes son significativamente diferentes.
Si n1 = n2 = …………… = nk = n
Ho : µA = µB vs HA : µA ≠ µB
Ho : µA = µC vs HA: µA ≠ µC
Ho : µA = µD vs HA: µA ≠ µD
Ho : µB = µC vs HA: µB ≠ µC
Ho : µB = µD vs HA: µB ≠ µD
Ho : µC = µD vs HA: µC ≠ µD
De esta forma si dos intervalos se traslapan, entonces no habrá diferencias entre las
medias de los tratamientos correspondientes.
M.Sc. Lic. Oscar Soliz Vásquez 30 QMC 304
b) Método de Tukey
Consiste en comparar las diferencias entre medias maestrales con el valor crítico dado por:
T = q (k, N – k) SY
Ejemplo:
Luego se compara
c) Método de Duncan
Si las k muestras son de igual tamaño se acomodan los k promedios en orden ascendente
y el error estándar de cada promedio se estima con:
SY = CME / n
Si alguna o todas las muestras tienen tamaños diferentes se remplaza n por la media
armónica de las ni al calcular el error estándar de los promedios.
k
nAR k
1
ni
i 1
M.Sc. Lic. Oscar Soliz Vásquez 31 QMC 304
Ejemplo:
Estos valores se comparan con las diferencias de medias de acuerdo al método descrito
para Tukey.
DETERGENTE LAVADO
A 45 43 31
B 47 46 47
C 49 51 55
D 42 37 44
En el diseño cuadrado latino (DCL) se tienen cuatro fuentes de variabilidad que pueden
afectar la respuesta observada, éstas son: los tratamientos, el factor de bloque II (columnas),
el factor de bloque I (renglones) y el error aleatorio. Se llama cuadrado latino por dos razones:
Es un cuadrado debido a que se tiene la restricción adicional de que los tres factores
involucrados se prueban en la misma cantidad de niveles.
Es latino porque se utilizan letras latinas para denotar a los tratamientos o niveles del
factor de interés.
Sean A, B, C, ….., P, los P tratamientos a comparar, por lo tanto ambos factores de bloques
tienen también pbloques cada uno. Este diseño se utiliza para eliminar dos fuentes de
variabilidad problemática, y permite analizar sistemáticamente por bloques en dos direcciones.
4x4 5 x5 6 x6 7x7
ABCD ABCDE ABCDEF ABCDEFG
BCDA BCDEA BCDEFA BCDEFGA
C D AB C D EAB C D EFAB C D E F G AB
D AB C D EAB C D EFAB C D EFG AB C
EABCD EFABCD EFG AB C D
FABCDE FG AB C D E
G AB C D EF
Una desventaja de este diseño cuando es pequeño es que proporcionan un número reducido
de Grados de Libertad del error, por lo que es necesario repetir con el fin de aumentar los
Grados de Libertad del error.
i = 1,2,3,……….p
Yijk = µ + ﺡj + βk + αi + εijk j = 1,2,3,……… p
K = 1,2,3,…….. p
P2 – 1 = (P – 1) + (P – 1) + (P – 1) + (P – 2) (P – 1)
M.Sc. Lic. Oscar Soliz Vásquez 33 QMC 304
ANOVA para un diseño Cuadrado Latino
p
Yi.. Y ... SCrenglon CMrenglon
Renglones
i 1 p
N
P–1
p 1 CME
p
Y ..k Y ... SCcolumna CMcolumna
Columnas
k 1 p
N
P–1
p 1 CME
(P-2)(P-1) SCE
Error Por diferencia
( p 2)( p 1)
p p p
Y ...
Total Y
i 1 j 1 k 1
ijk
N
N–1
Fo = CMTRAT / CME
Ejemplo:
Se estudia el efecto que tiene cinco productos químicos distintos de niquelado (A, B, C, D y E)
sobre el tiempo de reacción del proceso. Cada lote de material a niquelar es lo
suficientemente grande para permitir que solo se realicen cinco pruebas, más aún cada
prueba tarda hora y media en su realización. Por lo que solo se pueden realizar cinco ensayos
al día. Obteniéndose los siguientes resultados de niquelado en g/cm 2 :
MATERIAL DIAS
I II III IV V
1 8 3 7 1 7
2 11 8 3 7 2
3 4 5 1 10 9
4 6 10 6 6 8
5 4 8 8 3 2
Con el diseño cuadrado Greco Latino (DCGL) se controlan tres factores de bloque,
además del factor de tratamiento.
Se llama Cuadrado Greco Latino porque los cuatro factores involucrados se prueban en la
misma cantidad de niveles, de aquí que se pueda escribir como un cuadrado.
Se utilizan letras latinas para denotar a los tratamientos y letras griegas para nombrar a los
niveles o bloques del tercer factor de bloque.
Al igual que en el Cuadrado Latino cada letra debe aparecer solo una vez en cada renglón
y en cada columna, y cada par de letras debe aparecer sólo una vez en todo el arreglo.
COLUMNAS
1 2 3 4
Renglones 1
2
3
4
Este diseño puede utilizarse para controlar sistemáticamente tres fuentes extrañas de
variabilidad o diseño en tres dimensiones.
Permite controlar cuatro factores (renglón, columna, letra griega y letra latina), cada uno con p
niveles usando solamente P2 ensayos.
Es importante no confundir las letras griegas del modelo que representan efectos, con las
letras griegas en el diseño que representan a los niveles del tercer factor de bloque.
Donde las sumas de SC B1, SCB2 y SCB3 miden la variabilidad debida a los factores de bloque
(renglón, columna y de letras griegas respectivamente.
Fo = CMTRAT / CME
EJEMPLO: Con el objetivo de mejorar la calidad en la crianza de pollos se han añadido dos
productos químicos en los alimentos. Las distintas cantidades del primer químico se indican
con las letras A, B, C y D; Las del segundo químico por alfa, beta, gama y delta. Se alimenta a
los pollos ordenando en grupos de acuerdo a su peso inicial de 1, 1.5, 1.8 y 2 kilogramos y
cuatro especies diferentes. El incremento de peso por unidad de tiempo (g/día) viene dado en
el siguiente cuadro:
ESPECIE PESO
1 kilo 1.5 kilos 1.8 kilos 2.0 kilos
Blanco 3 6 10 6
Amarillo 4 6 5 6
Gris 8 10 5 8
Negro 6 3 7 3
3. Se desea purificar el cloruro de sodio a partir de las salmueras del Salar de Uyuni con
un alto grado de pureza y poder obtener un producto de uso medicinal, para lo cual se
realiza un proceso de cristalización utilizando diferentes disolventes, teniendo los
siguientes resultados:
Disolvente Observaciones (g / L)
1 2 3 4
Etanol 95,5 96,0 94,9 95,8
Agua-etanol 90,9 92,7 93.0 93,1
Agua 90,2 90,3 91,2 89,5
1. La eliminación del sodio por medio de la orina es importante para el metabolismo del
cuerpo humano, por lo que se determinó el contenido de ión sodio de una muestra de
orina, utilizando métodos como: un electrodo selectivo de iones; absorción atómica y
gravimetría. Realizando una lectura cada día, pudiendo influir en los resultados el
tiempo de conservación de la muestra. Obteniendo los siguientes resultados en mM.
Lotes de DIAS
material I II III IV V
A 8 10 5 8 3
B 6 1 3 7 8
C 10 7 1 6 10
D 2 7 8 2 9
E 8 4 6 4 11
Joyas DIAS
I II III
Plata 13 44 16
Cobre 22 18 13
Oro 27 22 39
Salmueras Días
1 2 3 4
4.5 ppm 25 26 24 25
5.0 28 30 35 32
6.0 32 34 38 35
7.0 26 30 32 32
DISEÑOS FACTORIALES
3.1. Conceptos básicos de diseños factoriales
En los diseños anteriores estudiados, el objetivo principal era comparar varios tratamientos (o
niveles del mismo factor); no era el objetivo estudiar el efecto de los factores. Sin embargo es
frecuente que en muchos procesos existan varios factores de los que es necesario investigar
de manera simultánea su influencia sobre una o varias variables de respuesta, donde cada
factor tiene la misma importancia.
Los diseños experimentales que permiten estudiar de manera simultánea el efecto de varios
factores son los llamados diseños factoriales.
El objetivo de un diseño factorial es estudiar el efecto de varios factores sobre una o varias
respuestas características de calidad, es decir se busca estudiar la relación entre los factores
o variables independientes y la respuesta, con la finalidad de conocer mejor como es esta
relación y generar conocimiento que permita tomar acciones y decisiones que mejoren el
desempeño del proceso.
Si se estudia un factor en forma separada el resultado puede ser diferente al que daría con un
estudio conjunto, y es más difícil describir el comportamiento general o encontrar el óptimo.
Los factores pueden ser de tipo cualitativo (máquinas, tipo de material, operador, etc), o de
tipo cuantitativo (temperatura, tiempo, velocidad, concentración, presión, etc). Para poder
estudiar la manera en que influye cada factor sobre la variable de respuesta, es necesario
elegir al menos dos niveles de prueba para cada uno de ellos.
Por ejemplo: k = 2 factores ambos con dos niveles de prueba se forma un diseño factorial de 2
x 2 = 22 que consiste de cuatro combinaciones o puntos experimentales.
1. Son necesarios cuando alguna interacción puede estar presente para evitar conclusiones
engañosas.
2. Permiten estimar los efectos de un factor en diversos niveles de los otros factores
produciendo conclusiones válidas.
3. Son diseños que se pueden aumentar para formar diseños compuestos en caso de que se
requiera una exploración más completa.
4. Se pueden correr fracciones de diseños factoriales, las cuales son de gran utilidad en las
primeras etapas de una investigación que involucra a muchos factores.
Existen a niveles del factor A y b niveles del factor B, dispuestos en un diseño factorial,
esto es cada repetición o réplica del experimento contiene todas las combinaciones de
tratamiento ab, hay n repeticiones.
FACTOR B
1 2 … b
Y111, Y112, …… Y121, Y122, …… Y1b1, Y1b2, …..
…….. Y11n ………Y12n …….Y1bn
Y211, Y212,……….. Y221, Y222, ….. Y2b1, Y2b2, ….
………Y21n ………Y22n ……. Y2bn
…….. …………….
…….. ………….
Ya11, Ya12, …… Ya21, Ya22, …. Yab1, Yab2, …..
………… Ya1n …….Ya2n ………Yabn
Se supone que:
Ambos factores son fijos y los efectos de tratamiento se definen como desviaciones de la
media general.
En un diseño factorial de dos factores, tanto los factores (tratamiento) de renglón como de
columna tienen la misma importancia.
Por lo tanto se debe probar la hipótesis acerca de la igualdad de los efectos de renglón:
H0: β1 = β2 = …………….. = βj = 0
Análisis estadístico:
b n a n
Yi.. Yijk Y .i. Yijk
j 1 k 1 i 1 k 1
Yi.. Y ...
SC
n abn
Y . j. Y ...
SC
an abn
a b
Yij . Y ...
SCsubtotal es
i 1 j 1 n N
Luego:
Para la aceptación o el rechaza del efecto de cada factor o de la interacción se debe comparar
Fo con F teórico de las tablas, y de esta manera aceptar o rechazar la hipótesis planteada.
Alimentación Temperatura ( ºC )
M /min 160 180 200 240
0.508 6.0; 8.0; 7.6 7.4; 6.4; 6.0 9.9; 10.4; 9.6 9.8; 10.8; 9.9
0.635 9.9; 11.0; 11.1 11.9; 8.8; 9.2 10.4; 9.9; 9.5 9.2; 8.6; 8.8
0762 9.9; 11.0; 10.7 9.8; 10.4; 8.6 11.4; 10.8; 11.0 10.4; 8.8; 10.2
Analizar los datos y determinar la influencia de estos dos factores en el acabado de la pieza
de polietileno.
Cuando se tienen tres factores (A, B y C) y el número de niveles de prueba en cada uno de
ellos son a, b y c, se puede construir el arreglo factorial a * b * c, que consiste de a*b*c
tratamientos o puntos experimentales.
Modelo estadístico:
En resumen se tiene siete efectos de interés y con ellos se pueden plantear las siete hipótesis
nulas Ho : efecto de A = 0; Ho : efecto de B = 0; ………….cada una aparejada con su
correspondiente hipótesis alternativa.
El ANOVA para probar estas hipótesis, para el diseño factorial a*b*c es:
M.Sc. Lic. Oscar Soliz Vásquez 47 QMC 304
Fuente de SC GL CM Fo
variabilidad
Efecto A SCA a–1 CMA CMA / CME
Efecto B SCB b–1 CMB CMB / CME
Efecto C SCC c–1 CMC CMC / CME
Efecto AB SCAB (a-1)(b-1) CMAB CMAB / CME
Efecto AC SCAC (a-1)(c-1) CMAC CMAC / CME
Efecto BC SCBC (b-1)(c-1) CMBC CMBC / CME
Efecto ABC SCABC (a-1)(b-1)(c-1) CMABC CMABC / CME
Error SCE abc(n – 1) CME
Total SCT abcn - 1
Se tiene siete efectos de interés, y con ellos se puede plantear siete hipótesis estadísticos
para su comprobación, mediante la técnica de la descomposición de cuadrados
Teniendo las fórmulas para el cálculo de la suma de cuadrados que son las siguientes:
a b c n
Y ....
SCT Yijk
i 1 j 1 k 1 l 1 N
a b c
Y . j .. Y ....
SCB
Yi... Y .... Y ..k . Y ....
SCA SCC
i 1 bcn N j 1 acn N k 1 abn N
a b a c
Yij.. Y ....
SCAB
Yi.k . Y ....
SCA SCB SCAC SCA SCC
i 1 j 1 cn N i 1 k 1 bn N
b c
Y . jk . Y ....
SCBC SCB SCC
j 1 k 1 an N
a b c
Yijk . Y ....
SCABC SCA SCB SCC SCAB SCAC SCBC
i 1 j 1 k 1 n N
M.Sc. Lic. Oscar Soliz Vásquez 48 QMC 304
Ejemplo: Se investiga el efecto de la temperatura (A) (ºC); el tamaño de grano (B) ( m); y la
concentración del agente precipitante (C) (ppm); en la cantidad de sedimentación (Y) (%) de
una solución. Para ello se decide correr un experimento factorial de 3 x 2 x 2 con 6 réplicas,
teniendo los siguientes resultados.
A1 A2 A3
B1 B2 B1 B2 B1 B2
C1 60 75 75 67 73 73 62 68 65 71 80 80 76 71 75 75 75 75
86 70 70 67 68 68 76 65 65 72 80 80 70 68 75 75 75 77
C2 53 53 55 52 52 57 44 44 45 60 60 60 52 51 50 56 55 57
55 55 55 52 54 54 48 48 45 67 67 65 52 48 54 59 50 55
Para realizar los diferentes cálculos estadísticos del ANOVA se debe reemplazar los valores
en las fórmulas indicadas anteriormente
Los resultados del diseño factorial de dos factores pueden generalizarse donde existen a
niveles del factor A y b niveles del factor B; c niveles del factor C , etc.
1. La insulina es una proteína que se halla formada por dos cadenas peptídicas unidas por
enlaces disulfuro y se encuentra en muchos alimentos proteicos. A partir del Yacon que es
un tubérculo se quiere separar la insulina por hidrólisis, para lo cual se plantea tres
variedades de Yacon, al cual se aplica la hidrólisis a diferente temperatura, teniendo los
siguientes resultados en mg/kg:
Presión (mmHg)
Temperatura (ºC) 200 215 230 250
10 90.4 90.7 90.2 92.5
90.2 90.6 90.4 93.0
30 90.1 90.5 89.9 100.1
90.3 90.6 90.1 99.0
50 90.5 90.8 90.4 90.3
90.7 90.9 90.1 90.5
a. Determinar el problema y el objetivo
b. Determinar las variables de estudio, respuesta, niveles y diseño.
c. Estimar el análisis de varianza para sacar conclusiones.
Presión Temperatura ( ºF )
(lb/plg2) 250 260 270 280
120 9.6; 9.2; 9.5 11.28; 10.98; 11.00 9.0; 9.1; 9.15 8.5; 8.7; 8.4
130 9.7, 9.75; 9.8 10.10: 10.08; 10.12 9.57; 9.6; 9.65 9.0; 8.9; 9.2
140 8.9; 8.9: 9.0 12.01; 12.0; 12.05 9.03; 9.00; 9.05 10.0; 9.8; 9.6
150 10.0; 9.8; 9.7 10.44; 10.4; 10.5 9.8; 9.8; 9.86 10.1; 10.0; 10.4
a) Determinar el problema y el objetivo
b) Determinar las variables de estudio, respuesta, niveles y diseño.
c) Estimar el análisis de varianza para sacar conclusiones.
4. En una fabrica de ladrillos se quiere mejorar la calidad de sus productos, para lo cual se
realiza un estudio sobre el tipo de arcilla que se utiliza (% Al 2O3) , temperatura de cocción
M.Sc. Lic. Oscar Soliz Vásquez 50 QMC 304
(ºC) y tiempo de cocción (Horas), midiendo la calidad en función a la dureza del producto
acabado, teniendo los siguientes resultados:
Temp. Arcilla (10% Al2O3) Arcilla (15% Al2O3) Arcilla (20% Al2O3)
ºC 12hrs. 18hrs. 24hrs. 12hrs. 18hrs. 24hrs 12hrs 18hrs 24hrs
500 6,8 7,7 8,2 7,5 7,8 8,1 6,9 7,4 8,6
7,0 7,6 8,2 7,5 7,9 8,0 6,8 7,3 8,5
800 7,6 7,8 9,2 7,8 8,2 9,6 7,2 8,1 9,0
7,5 7,9 9,0 7,6 8,2 9,5 7,0 8,0 8,8
1000 7,4 7,7 7,6 7,3 8,0 8,6 7,1 8,3 8,4
7,4 7,6 7,5 7,5 8,1 8,5 7,0 8,2 8,5
DISEÑOS FACTORIALES 2K y 3K
4.1. Introducción
Al obtener información sobre varios factores sin aumentar el tamaño del experimento hay
economía en el material experimental.
Con un diseño factorial 22 se estudia el efecto de dos factores considerando dos niveles en
cada uno. Cada replica de este diseño consiste 2 x 2 = 4 combinaciones o tratamientos que se
pueden denotar de diferentes maneras.
M.Sc. Lic. Oscar Soliz Vásquez 52 QMC 304
La notación de signos (+ , -) es muy práctica para escribir las matrices de diseño; esta
notación combinada con la de Yates permite representar y calcular fácilmente los efectos de
interés.
REPRESENTACIÓN GEOMÉTRICA
(-1, 1) ( 1 , 1)
(-,+) (+,+)
(+)
b ab
Factor B
(1) a
(-)
(-) (+)
Factor A
Cada vértice representa un punto de diseño o tratamiento, el área limitada por este cuadrado
se conoce como región experimental y en principio las conclusiones que se obtengan del
experimento sólo tienen validez sobre la región.
La notación de Yates [(1), a, b, ab] tiene un significado diferente, con ellas se representa el
total o suma de las observaciones en cada tratamiento. El punto (1) es la suma de todos los
datos obtenidos en el tratamiento (-1, -1); a es la suma de todas las mediciones hechas en la
combinación (1, -1) y así sucesivamente.
CÁLCULO DE EFECTOS
En este diseño hay tres efectos de interés: los efectos principales (A y B) y el efecto de
interacción (AB). Con el uso de la notación de Yates como los totales de las n repeticiones en
cada punto de diseño, se tiene que en el nivel alto del factor A se mide a y ab y en el nivel bajo
del mismo se observa b y (1). La media en el nivel alto de A es entonces (a + ab) / 2n y en el
nivel bajo es [b + (1)] / 2n, donde la constante 2n sale del hecho de que en cada nivel del
factor se están sumando 2n datos, que son la mitad de los datos del experimento.
EfectoA
1
a ab b (1) a ab b (1)
2n 2n 2n
Y el efecto de B es:
EfectoB
1
b ab a (1) b ab a (1)
2n 2n 2n
El efecto de interacción entre los factores A y B esta dado por la diferencia entre el efecto de A
en el nivel alto de B y el efecto de A en el nivel bajo de B:
EfectoAB
1
ab (1) a b ab b a (1)
2n 2n 2n
ANALISIS DE VARIANZA
Para poder afirmar que los efectos contribuyen a explicar el comportamiento de la respuesta,
se debe hacer un análisis de varianza. Las sumas de cuadrados que componen el ANOVA se
pueden calcular en forma fácil una vez que se tienen los efectos estimados, pero se debe
definir los contrastes que son las sumas que definen a los efectos.
DEFINICIÓN DE CONTRASTE
Los contrastes correspondientes a los tres efectos A, B, AB en el diseño factorial 2 2 está dado
por:
Contraste A = [ a + ab - b - (1)]
Contraste B = [ b + ab - a – (1)]
Una manera práctica de calcular los contrastes de cualquier efecto, sea principal o de
interacción en el diseño factorial 2k , es mediante el auxilio de la tabla de signos. La tabla de
signos se construye a partir de la matriz de diseño multiplicando las columnas que intervienen
en la interacción que se quiera calcular.
M.Sc. Lic. Oscar Soliz Vásquez 54 QMC 304
Las combinaciones que se realizarán son como sigue:
A B AB Yates
- - + (1)
+ - - a
- + - b
+ + + ab
Después de obtener los contrastes, se procede a estimar los efectos, dividiendo éstos por la
constante que los convierte en diferencias de medias. En particular el diseño factorial 22 está
constante es 2n. Para investigar cuáles de los tres efectos son significativos se procede a
probar las hipótesis dadas por:
Ho : Efecto A = 0
H0 : Efecto B = 0
H0 : Efecto AB = 0
Cada una contra la alternativa de que el efecto es diferente de cero. Estas hipótesis se
prueban con el análisis de varianza, y para ello es necesario calcular las sumas de cuadrados
que corresponden a los efectos A, B, y AB, dados:
2 2 n
Y
SCT Yijl
i 1 j 1 l 1 n2
Como su nombre indica con este diseño se estudian tres factores en dos niveles cada uno, y
consta de 23 = 2 x 2 x 2 = 8 tratamientos diferentes, los cuales pueden nombrarse con la
misma notación que Yates propuso.
TOTALES A B C AB AC BC ABC
(1) - - - + + + -
a + - - - - + +
b - + - - + - +
c - - + + - - +
ab + + - + - - -
ac + - + - + - -
bc - + + - - + -
abc + + + + + + +
Sean A, B, y C los factores que se quieren estudiar y sean (1), a, b, c, ab, ac, bc, abc, los
totales observados en cada uno de los ocho tratamientos escritos en su orden estándar.
2 2 2 n
Y ....
SCT Yijlm
i 1 j 1 l 1 m 1 n2
Y finalmente, la suma de cuadrados del error se calcula por sustracción, para luego calcular el
ANOVA que para este diseño es:
FUENTE DE SC GL CM Fo
VARIABILIDAD
A SCA 1 CMA CMA / CME
B SCB 1 CMB CMB / CME
C SCC 1 CMC CMC / CME
AB SCAB 1 CMAB CMAB / CME
AC SCAC 1 CMAC CMAC / CME
BC SCBC 1 CMBC CMBC / CME
ABC SCABC 1 CMABC CMABC / CME
Error SCE 23 (n – 1) CME
Total SCT n 23 – 1
EJEMPLO:
INGREDIENTES VISCOSIDAD
A B C
- - - 13.3 13.7 13.5
+ - - 14.7 14.4 14.5
- + - 14.6 14.5 14.8
+ + - 14.3 14.1 14.0
- - + 16.9 17.2 17.4
+ - + 15.5 15.4 15.6
- + + 17.0 17.1 17.3
+ + + 18.9 19.0 19.1
M.Sc. Lic. Oscar Soliz Vásquez 58 QMC 304
Estimar los efectos y determinar los más significativos; Realizar el ANOVA y obtener las
conclusiones.
Un diseño 2k donde se consideran k factores con dos niveles de cada uno, y tiene 2 k
tratamientos o puntos de diseño. Las k columnas y 2k renglones que componen la matriz para
este diseño, considerando una replica, se puede construir de la siguiente manera
Cada uno de los efectos se estima a partir de su contraste, el cual a su vez se puede obtener
construyendo la tabla de signos del diseño. Las columnas de signos para los constrastes que
definen a los efectos principales están directamente de la matriz de diseño, mientras que la
columna de un efecto de interacción.
DISEÑO FACTORIAL 25
La tabla de signos para los 15 (quince) efectos potencialmente más importantes, donde se
tiene 5 (cinco) efectos principales y 10 (diez) de interacción doble, 10 (diez) de interacción
triple, 5 (cinco) de interacción cuatriple y 1 (uno) de interacción quintruple. Una vez calculado
la tabla de signos para el factorial 2k podría utilizarse para calcular los contrastes de cualquier
diseño de la familia 2k con k < 5, preservando las letras y los renglones.
M.Sc. Lic. Oscar Soliz Vásquez 59 QMC 304
DISEÑOS FACTORIALES 2K Y SUS EFECTOS DE INTERES, K < 5
Yates A B C D E AB AC AD AE BC BD BE CD CE DE
(1) - - - - - + + + + + + + + + +
A + - - - - - - - - + + + + + +
B - + - - - - + + + - - - + + +
Ab + + - - - + - - - - - - + + +
C - - + - - + - + + - + + - - +
Ac + - + - - - + - - - + + - - +
Bc - + + - - - - + + + - - - - +
Abc + + + - - + + - - + - - - - +
D - - - + - + + - + + - + - + -
Ad + - - + - - - + - + - + - + -
Bd - + - + - - + - + - + - - + -
Abd + + - + - + - + - - + - - + -
Cd - - + + - + - - + - - + + - -
Acd + - + + - - + + - - - + + - -
Bcd - + + + - - - - + + + - + - -
Abad + + + + - + + + - + + - + - -
E - - - - + + + + - + + - + - -
Ae + - - - + - - - + + + - + - -
Be - + - - + - + + - - - + + - -
Abe + + - - + + - - + - - + + - -
Ce - - + - + + - + - - + - - + -
Ace + - + - + - + - + - + - - + -
Bce - + + - + - - + - + - + - + -
Abce + + + - + + + - + + - + - + -
De - - - + + + + - - + - - - - +
Ade + - - + + - - + + + - - - - +
Bde - + - + + - + - - - + + - - +
Abde + + - + + + - + + - + + - - +
Cde - - + + + + - - - - - - + + +
Acde + - + + + - + + + - - - + + +
Bcde - + + + + - - - - + + + + + +
abcde + + + + + + + + + + + + + + +
4.4. Diseños de 32
Estos diseños son alternativas experimentales que permite estudiar efectos de curvatura,
además de efectos lineales y de interacción.
Tratamiento A B A B
Bajo – Bajo -1 -1 0 0
Medio – Bajo 0 -1 1 0
Alto – Bajo 1 -1 2 0
Bajo – Medio -1 0 0 1
Medio – Medio 0 0 1 1
Alto – Medio 1 0 2 1
Bajo – Alto -1 1 0 2
Medio – Alto 0 1 1 2
Alto – Alto 1 1 2 2
Diseño factorial 32 en dos notaciones
M.Sc. Lic. Oscar Soliz Vásquez 60 QMC 304
Este diseño consiste de 32 = 9 tratamientos diferentes que corresponden a todas las combinaciones
de dos factores en tres niveles cada uno, donde los niveles se llaman bajo, medio y alto.
Con: i = 1, 2, 3; j = 1, 2, 3; k = 1, ……., n
Donde: γ = es el efecto del factor A; δ representa el efecto del factor B; (γδ) es la interacción
de ambos y n = número de repeticiones de cada tratamiento
Ho = γi = 0 Ho = δj = 0
HA = γi = 0 HA = δj = 0
3
Yi.. Y ...
SCA
i 1 3n n3
3
Y . j. Y ...
SCB
j 1 3n n3
M.Sc. Lic. Oscar Soliz Vásquez 61 QMC 304
3 3
Yij . Y ...
SCAB SCA SCB
i 1 j 1 n3 n3
3 3 n
Y ...
SCT Yijl
i 1 j 1 k 1 n3
Fuente de SC GL CM F0
variabilidad
Factor SCA k– 1 SCA / GL CMA / CME
A
Factor SCB k-1 SCB / GL CMB / CME
B
Interacción SCAB (k -1)(k-1) SCAB / GL CMAB / CME
AB
Error SCE 32 (n – 1) SCE / GL
Total SCT n 32 - 1
No se debe olvidar que este diseño requiere al menos de dos repeticiones para que haya
grados de libertad para el error
Para conocer el efecto lineal o cuadrático de cada factor, se puede desglosar en los
componentes AL y A2 (efecto lineal o cuadrático) cada uno con grado de libertad. El subíndice
L indica que es la parte lineal del efecto global de A, y el exponente denota la parte
cuadrática.
M.Sc. Lic. Oscar Soliz Vásquez 62 QMC 304
EJERCICIOS DE APLICACIÓN DE DISEÑOS 2K
Determinar: a) Las variables de estudio la variable respuesta, los niveles y las replicas de la
experimentación; b) Analizar los datos y estimar la influencia de variabilidad de cada variable.
M.Sc. Lic. Oscar Soliz Vásquez 64 QMC 304
CAPITULO Nº 5
5.1. Introducción
Cuando crece el número de factores también crece rápido el número de tratamientos en los
diseños factoriales completos 2k . Por ejemplo para k = 6 factores una sola réplica del diseño
factorial completo 26 implica 64 pruebas, para 27 = 128 puntos del diseño, siendo en la práctica
difícil de realizar estas pruebas experimentales.
Si se puede suponer que algunos factores son despreciables, entonces puede obtenerse la
misma información con menor número de ensayos, para lo cual se puede utilizar los DISEÑOS
FACTORIALES FRACCIONARIOS.
El empleo exitoso de estos diseños se basa en tres ideas fundamentales que son:
La notación 2k-1 significa una fracción a la mitad del diseño factorial completo 2 k , k 2(1/2 2k =
2k-1)
En muchos casos no es conveniente fraccionar, principalmente si es pequeño. Ejemplo 22
porque prácticamente desaparece: al tener sólo cuatro tratamientos, fraccionarlo a la mitad
implicaría correr dos tratamientos y con ellos no se podrían estimar los efectos principales.
A B C ABC
-1 -1 -1 -
1 -1 -1 +
-1 1 -1 +
1 1 -1 -
-1 -1 1 +
1 -1 1 -
-1 1 1 -
1 1 1 +
Fracción principal
Fracción complementaria
Al estimar los efectos potencialmente importantes cada efecto estimado tiene un alias.
Ejemplo: para el I = +ABC, la estructura de alias consiste en escribir cuales son las
alias de cada efecto, y esta estructura s deduce fácilmente del generador de la
fracción.
M.Sc. Lic. Oscar Soliz Vásquez 66 QMC 304
Contraste = [ a + abc – b – c]
Contraste BC = [ a + abc – b – c]
Ambos contrastes son iguales que significa que son alias, porque al estimar el efecto
de A también se estima el efecto BC. De igual forma se puede ver que:
En resumen, la estructura de alias del diseño factorial fraccionado 23-1 está dado por:
A + BC
B + AC
C + AB
A x I = A x ABC = A2 BC = BC
Para la interpretación de efectos alias es necesario suponer que solo uno de ellos es el
responsable del efecto observado y que los demás son nulos.
A B C D
- - -
+ - -
- + -
+ + -
- - +
+ - +
- + +
+ + +
A B C D = -ABC
- - - +
+ - - -
- + - -
+ + - +
- - + -
+ - + +
- + + +
+ + + -
o Los niveles que corresponden a los factores de las dos últimas columnas
(factores k – 1 y k) se obtienen multiplicando columnas previas de acuerdo a
los generadores.
M.Sc. Lic. Oscar Soliz Vásquez 68 QMC 304
Ejemplo: se tiene el diseño factorial completo 23
A B C D E
- - -
+ - -
- + -
+ + -
- - +
+ - +
- + +
+ + +
Los niveles para los factores D y E se obtienen a partir de los generadores que
son I = ABD y I = ACE y el tercer generador es el producto ABD x ACE = BCDE.
Por lo tanto I = ABD = ACE
A B C D E
- - - + +
+ - - - -
- + - - +
+ + - + -
- - + + -
+ - + - +
- + + - -
+ + + + +
Los diseños de Plackett – Burman representan otra alternativa para fraccionar diseños
factoriales completos 2k donde el número de puntos de diseño no necesariamente es potencia
de dos pero si es múltiplo de cuatro. Estas nuevas fracciones permiten en un momento dado
optimizar los recursos disponibles.
K= 7 N=8 - - - + + + +
K = 11 N = 12 + - + - - - + + + -+
K = 15 N = 16 - - - - - - - + + + + + + + +
K = 19 N = 20 + - + + - - - - + - + - + + + + - - +
K = 23 N = 24 + - - - - + - + - - + + - - + + - + - + + + +
K = 35 N = 36 - - + - - + + - + - + - - - - + - - + + + - + + + + + - - - + + + - +
M.Sc. Lic. Oscar Soliz Vásquez 69 QMC 304
Corrida A B C D E F G H I J K
1 + - + - - - + + + - +
2 + + - + - - - + + + -
3 - + + - + - - - + + +
4 + - + + - + - - - + +
5 + + - + + - + - - - +
6 + + + - + + - + - - -
7 - + + + - + + - + - -
8 - - + + + - + + - + -
9 - - - + + + - + + - +
10 + - - - + + + - + + -
11 - + - - - + + + - + +
12 - - - - - - - - - - -
Re n Re n
EA
n n
Varianza (efecto )
( Ed )
n
SEefecto Varianza(efecto )
efecto ( E ) A
t test
SEefecto
Para la extrapolación se interpreta como lineal donde (X0 , Y0) y (X1, Y1)
Y1 Yo
Y Yo ( X Xo ) Y
X 1 Xo
Los resultados más altos del nivel de confianza se determinan las variables de
mayor influencia
M.Sc. Lic. Oscar Soliz Vásquez 71 QMC 304
Con los resultados obtenidos se determina cuáles son las variables de mayor
influencia y que deben ser optimizados en su estudio.
Ejemplo:
Se estudia la flotación de un mineral sulfurado de cobre. Los factores que inicialmente se considera
son: Concentración colector (A); Concentración del agente espumante (B); tiempo de
acondicionamiento (C); tiempo de agitación (D); temperatura (E); % de sólidos (F); y pH (G). Se
sospecha que sólo unos cuantos factores son importantes por lo que se decide aplicar el diseño
factorial de Plackett y Burman, midiendo la concentración de cobre en la cabeza de la flotación.
Teniendo los siguientes resultados:
Los patrones de calibración se miden en el instrumento analítico bajo las mismas condiciones
que las utilizadas posteriormente para los materiales de ensayo. Una vez establecida la
gráfica de calibrado, puede obtenerse la concentración de analito por interpolación. Este
procedimiento general plantea varias cuestiones estadísticas importantes:
¿Es lineal la línea de calibrado? Si es una curva, ¿qué forma tiene dicha curva?
Teniendo en cuenta que cada uno de los puntos de la línea de calibrado está sujeto a
errores, ¿cuál es la mejor línea recta (o curva) que pasa por esos puntos?
¿Cuál es el límite de detección del método? Esto es, ¿cuál es la menor concentración
de analito que puede detectarse con un predeterminado nivel de confianza?
El estudio de la variación simultánea de 2 o más características puede hacerse por medio del
estudio de la correlación y de la regresión, y que está íntimamente relacionada con el modelo
del análisis de varianza.
Cuando dos variables cambian juntas, el aumento de una de ellas va asociado con el
incremento en la otra, se dice que las variables están correlacionadas positivamente; si
disminuyen están correlacionadas negativamente y si no hay relación, se dice que no están
correlacionadas.
M.Sc. Lic. Oscar Soliz Vásquez 73 QMC 304
Es importante el conocimiento de la asociación de dos caracteres porque tiene un valor
predictivo.
Existen varios métodos para determinar la correlación entre las que se puede indicar:
Diagramas de dispersión
Coeficiente de correlación
El coeficiente es un valor que indica el grado de asociación entre dos variables, existen
varios casos posibles de correlación.
( X x)(Y y) xy
( x)( y ) ( x)( y )
(X – x) = x desviación de la variable X
(Y – y) = y desviación de la variable Y
x X n y Y n
( X) ( Y)
xy XY n
( X )( Y )
n = número de pares
n – 2 = grados de libertad (GL)
X= 6 y = 3.37
42
x 0 2 4 6 8 10 12 7
364 252 112
M.Sc. Lic. Oscar Soliz Vásquez 75 QMC 304
23.6
y 0 1.1 2.3 3.5 4.8 5.5 6.4 7 113.0 79.57 33.43
42 * 23.6
xy 0 2.2 9.2 21 38.4 55 76.8 7
202.6 141.6 61
xy 61
0.997
( x)( y ) 112 * 33.43
La regresión lineal fue dado a conocer por Galton para explicar fenómenos debidos a la
asociación de dos variables donde X = V.I. y Y = V.D., y matemáticamente “Y es función de X”.
Generalmente se usa la regresión para predecir Y conociendo X o conocer la relación entre
las dos variables.
La regresión se mide por medio del coeficiente de regresión (b) y el valor indica el incremento
promedio de Y al aumentar X en la unidad.
by / x b
xy
x
by /x = b = se lee “regresión de Y sobre X”
Y y b( X x)
x= 6 y = 3.37 b = 0.545
Y = 3.37 + 0.545 (X – 6)
bx / y
xy
y
X x b(Y y)
By /x = b o bx/y
b * bx / y
M.Sc. Lic. Oscar Soliz Vásquez 77 QMC 304
6.4. Tratamiento estadístico para análisis químico
Un químico analítico puede enfrentarse con dos tipos de problemas: 1) A veces se le solicita
sólo una respuesta cualitativa. Por ejemplo, la presencia de boro en agua destilada que es
muy peligrosa en la producción de componentes microelectrónicas; 2) otras veces la
comparación de muestras; 3) en otros casos, los problemas que se le plantean son
cuantitativo. Entonces la química analítica moderna es una ciencia cuantitativa. Obviamente
en muchos casos una respuesta cuantitativa es mucho más valiosa que otra cualitativa.
En un análisis químico puede existir errores aleatorios: éstos provocan que los resultados
individuales difieran uno de otro de manera que caigan a ambos lados del valor medio,
afectando a la precisión, o reproducibilidad, de un experimento. Sin embargo, también
existen errores sistemáticos: éstos provocan que todos los resultados sean erróneos en el
mismo sentido. El error sistemático total es denominado el sesgo de la medida.
En los últimos años los químicos analíticos han reconocido la importancia de proporcionar
para cada análisis un único número que describa su efecto combinado. La incertidumbre de
un resultado es un parámetro que describe un intervalo dentro del cual se espera que se
encuentre la cantidad medida, teniendo en cuenta todas las fuentes de error. Para expresar la
incertidumbre se emplean dos símbolos. La incertidumbre estándar (u) expresa el concepto
como una desviación estándar. La incertidumbre expandida (U) define un intervalo que abarca
una fracción grande de valores dentro de los cuales caerá la cantidad que se está midiendo y
se obtiene multiplicando u por un factor de cobertura, k, elegido según el grado de confianza
exigido para el rango, es decir, U = u x k. Puesto que u es análoga a una desviación estándar,
si le es 2, entonces U proporciona aproximadamente una mitad del intervalo de confianza del
95 %.
Por lo que es importante en un experimento que los datos obtenidos tengan una precisión y
reproducibilidad de los datos, por lo que se plantea la determinación de los siguientes
parámetros en un experimento, principalmente de análisis químico.
Y a b·VR
b) Reproducibilidad o repetibilidad
Si
( Xi X )
n 1
(n 1)·s i
Sr i 1
n
(n 1)
i 1
c) Sesgo
bi X VR
X VR
b(%) ·100
VR
bi (%) b (%)
G exp
Sb
Donde: se compara los valores de Gexp con Gcri extraidos a partir de la tabla de t-
student; si Gexp es menor a Gcri entonces los valores de sesgo pertenecen a la
misma población estadística.
M.Sc. Lic. Oscar Soliz Vásquez 80 QMC 304
Es importante determinar la significancia del sesgo, vale decir los límites de
confianza de acuerdo a las relaciones conocidas.
d) Robustez
Nº A B C D E F G y
1 + + + + + + +
2 + + - + - - -
3 + - + - + - -
4 + - - - - + +
5 - + + - - + -
6 - + - - + - +
7 - - + + - - +
8 - - - + + + -
Ei 2(
R ( ) R ( ) )
N N
2
Se
7
( Ei)
S
F exp
Se
Finalmente se compara Fexp con los valores de Fcri con un nivel de significación de
5%, donde Fexp Fcri los efectos son significativos
M.Sc. Lic. Oscar Soliz Vásquez 81 QMC 304
BIBLIOGRAFÍA
Miller J.C. – Miller J.N. “Estadística para química analítica”. Editorial ADDISON WESLEY
IBEROAMERICANA. Impreso en EE.UU. 1993.
Miller J.C. – Miller J.N. “Estadística y quimiometría para química analítica”. Editorial
PRENTICE HALL. PEARSON EDUCACIÓN S.A. Impreso en Madrid – España. 2002.
Moya C. Rufino. “Estadística descriptiva”. Editorial San Marcos. Impreso en Lima Perú. 1991.
Visauta V. Bienvenido. Análisis estadístico con SPSS 11.0 para Windows”. Editado por Mc
Graw Hill INTERAMERICANA. Impreso en España. 2002.