Escolar Documentos
Profissional Documentos
Cultura Documentos
En la estimacin de parmetros y contrastes de hiptesis se estudi, por ejemplo, la comparacin entre medias de dos poblaciones. Con esta herramienta se puede decidir, por ejemplo, si la dureza de un metal templado con cierto tipo de aceite es mayor que la dureza obtenida con otro tipo. Este problema es un caso particular del estudio de la influencia de un factor o variable explicativa, el tipo de aceite en la dureza del templado. Para el factor en estudio slo se han considerado dos niveles aceite tipo 1 y tipo2. Si se quieren estudiar ms niveles, por ejemplo un aceite tipo 3, o bien la influencia conjunta de dos o ms factores, por ejemplo tipo de aceite y temperatura, en una variable respuesta no se pueden utilizar las tcnicas anteriores. El procedimiento a utilizar es el anlisis de la varianza (ANOVA). A primera vista podra parecer posible abordar estos problemas con las tcnicas de regresin anteriores. Sin embargo, en regresin, las variables explicativas o factores tienen que ser cuantitativas, mientras que en anlisis de la varianza suelen ser cualitativas, como por ejemplo, el tipo de aceite. Adems, los distintos niveles de los factores son generalmente controlables por el experimentador y no pueden tomar cualquier valor, mientras que en los modelos de regresin suelen ser no controlables. Estas formas de anlisis que permiten la influencia del experimentador en el mejoramiento de los procesos y diseo de las experiencias se denominan tcnicas de diseo experimental. Las tcnicas de diseo experimental basadas en la estadstica son particularmente tiles en el mundo de la ingeniera. Los resultados de estos experimentos pueden conducir a: 1. 2. 3. 4. Mejorar el rendimiento del proceso Reducir la variabilidad del proceso y acercarlo a los requerimientos nominales Disminucin del tiempo de diseo y desarrollo Disminucin del costo de operacin
Algunas aplicaciones representativas de los experimentos diseados de manera estadstica en la ingeniera de diseo son: 1. Evaluacin y comparacin de configuraciones de diseo bsicas 2. Evaluacin de diferentes materiales 3. Seleccin de parmetros para obtener diseo robusto (que funcione bien bajo una gama amplia de condiciones) 4. Determinacin de los parmetros ms importantes que impactan sobre el funcionamiento del producto Todo lo anterior est basado en los ANlisis DE VArianza (ANDEVA o ANOVA por su nombre en ingls). Los conceptos bsicos de ANOVA se introducen con el modelo de un factor con varios niveles. Se contrasta si se producen los mismos resultados de la variable respuesta para los distintos niveles del factor, y en caso de no ser as, se comparan las medias correspondientes a los distintos niveles del factor.
43
Notacin: k ni yij
k
: n de niveles del factor : tamao de la m.a.s. del nivel i-simo : observacin j-sima de la variable respuesta correspondiente al nivel i-simo (i=1, 2, ..., k; j= 1, 2, ...,ni)
n=
n
i =1
+ eij i
Para el anlisis de los datos se adopta la hiptesis de que los errores residuales, e ij , son independientes y siguen la misma distribucin N(0, ). Esto equivale a decir que la distribucin de cada observacin Yij es N( , ). i Contraste de igualdad de medias Se trata de probar si las diferencias observadas n los distintos niveles se deben a que alguno (o todos) tiene influencia en la variable respuesta o si se deben al azar. La hiptesis nula es que las diferencias son debidas al azar, es decir: Ho : = =...= k 1 2 H1: Alguna diferencia existe Los resultados se ordenan en una tabla como la siguiente: Variable respuesta Nivel 1 Nivel 2 . . . Nivel k Y1 Y2 . . . Yk Observaciones y11 ... y1n1 y21 ... y2n2 . . . yk1 ... yknk Media Muestral Media Poblacional
y1 y2
. . .
1 2
. . .
yk
El contraste se basa en la comparacin de dos estimaciones independientes de la varianza comn 2 . Para ello se descompone la variabilidad total de los datos en dos componentes: una que refleja la variacin dentro del nivel y la otra que refleja la variacin entre los niveles. En caso de que Ho sea cierto, la segunda componente es cero, no obstante que se observarn diferencias en las medias de los distintos niveles. Hay que probar mediante el contraste que esas diferencias se deben al azar.
44
En caso de rechazar Ho, se considera que las diferencias se deben a la influencia de los distintos niveles. El procedimiento prctico, como en todos los test, es el siguiente: Fijado un nivel de significacin
S e2 =
y
SCE ( k 1) 2
S r2 =
SCD ( n k ) 2
SCE = ni ( yi y ) 2
i =1
SCD =
i =1
(y
j =1 ni
ni
ij
yi ) 2
STC =
i =1
(y
j =1
ij
y )2
Comparaciones mltiples
Existen varios mtodos de comparaciones mltiples, entre los ms conocidos estn : el test de Tukey, el test de Scheffe, el test LSD, el test de Bonferroni, el test de Duncan y otros. Todos ellos utilizan estadsticos de prueba en que se considera la influencia de todas las observaciones y no solamente de los pares en estudio. Adems, entregan p-valores los que se contrastan con el nivel de significacin alfa y se utilizan los criterios clsicos para aceptar o rechazar. Ejemplo: Se mide la temperatura de una mezcla con 4 termmetros obtenindose los siguientes datos:
45
Termmetros 1 2 3 4
Observaciones 63, 63, 62, 65, 66, 63 64, 64, 63, 64, 65 58, 59, 59, 68 61, 61, 62, 60, 63
Los mtodos de diseo experimental permiten resolver estos problemas de manera eficiente durante las primeras etapas del ciclo del producto. Esto ofrece la ventaja de reducir de manera notable tanto el costo total del producto como el tiempo de desarrollo. Se estudiar un modelo con dos factores con interaccin entre ellos. Las mismas ideas son aplicables a modelos con ms factores, aunque se complican los clculos. Statgraphics permite incluir hasta 10 factores con interacciones conjuntas de hasta tres factores. MODELO CON DOS FACTORES E INTERACCION
yijk = + i + j + I ij + e ijk
donde:
i j
I ij
y ijk
: Es el valor k-simo de la variable respuesta dentro del nivel i del factor A y del nivel j del factor B : Es la media global : Mide el efecto del nivel i del factor A : Mide el efecto del nivel j del factor B
: Mide la interaccin entre los factores A y B; es decir, la diferencia entre el valor observado y el previsto con un modelo que supone efectos aditivos de los factores eijk : Es el error o efecto residual. Se adopta la hiptesis de que estos errores son independientes y se distribuyen N (0, )
46
Los parmetros , j e I ij miden los efectos diferenciales respecto a la media global ; es decir, i miden los incrementos (positivos o negativos) sobre la media global producido por cada uno de los niveles de los factores y por la interaccin. Por tanto se deben compensar los efectos de unos niveles con los de otros, esto es:
=
i =1 i j =1
= I ij = I ij = 0
i =1 j =1
es distinto de cero i
Ho: 1 = 2 = ... = r = 0
3.
De forma anloga a lo estudiado para un factor, se hace una descomposicin del tipo : STC = SCA + SCB + SCI + SCD Donde: SCA SCB SCI SCD : Suma de cuadrados entre los niveles de A. Mide la variabilidad debida al factor A. : Suma de cuadrados entre los niveles de B. Mide la variabilidad debida al factor B : Suma de cuadrados que mide la variabilidad debida a la interaccin de los factores : Suma de los cuadrados dentro de los niveles. Mide la variabilidad residual, es decir, la debida a los dems factores no incluidos en el modelo
2.
3.
S I2 ~ F( n )( r ), nr ( s ) 1 1 1 S r2
El procedimiento prctico es el mismo que para todos los test estudiados anteriormente.
47
En caso de rechazar alguna de las hiptesis nulas se puede hacer un estudio comparativo de las diferencias de medias correspondientes. Los fundamentos tericos son los mismos que para un factor. Ejemplo: Se experimenta en un proceso de fabricacin en dos condiciones de funcionamiento, tipos de materia prima,
, 2 1 1
2 , y tres
1 2
2
16 40 30 38 33 44 12 40
3
8 42
20 36
El modelo general ser: Yijk = + i + j + () ij + eijk , donde, i=1, 2 ; j=1, 2, 3 ; k=1, 2 donde por ejemplo, y 211 = 36 es la primera observacin, del segundo nivel del factor 1. ( ) ij es la interaccin (si la hay) entre el funcionamiento y el tipo de materia prima. eijk es todo lo que no podemos controlar en nuestro experimento (error aleatorio). Se supone normalidad e independencia de los errores, es decir, eijk ~ N(0,
2 )
Las hiptesis son: 1ra. Ho: Ho: 2da. Ho: Ho: 3ra. Ho: Ho: Prctica: Entrar en statgraphics al editor de datos y crear el vector FABRICA y las variables dato, func y matprim de acuerdo al siguiente esquema: dato 20 16 30 33 12 8 func 1 1 1 1 1 1 matprim 1 1 2 2 3 3 En el proceso de fabricacin, las dos condiciones producen el mismo efecto
1 = 2
No hay diferencia en las materias primas de nuestro proceso de fabricacin.
1 = 2 = 3
No hay interaccin entre el tipo de funcionamiento y el tipo de materia prima ( ) ij =0 para todo i,j
48
36 40 38 44 40 42
2 2 2 2 2 2
1 1 2 2 3 3
49