Você está na página 1de 14

INTRODUCCIN AL DISEO Y ANLISIS DE EXPERIMENTOS (ADE)

1. OBJETIVOS Al final de este laboratorio, el estudiantes ser capaz de analizar un experimento con un diseo factorial para dos factores a dos niveles cad a uno utilizando EXCE L. La m eta es proveer al estudian te con la habilidad de planear, disear, analizar y concluir vlidamente con bases estadsticas de este tipo particular de experimentos. 2. MATERIALES

Excel versin 98 o ms nuevo Notas de clase provistas en la sesin impartida por el instructor

3. ANTECEDENTES El Diseo y Anlisis de Experimentos (ADE) es el rea de la estadstica que tiene como objeto estudiar los efectos de variab les d e inters d ispuestas en varios niveles en una o varias respuestas o m edidas de desempeo. Sir Ronald A. Fisher introdujo ADE por primera vez en la primera mitad de los aos 1930s en el rea de la agricultura. La m ayora de los campos de ingeniera y cien cias ahora practican las ideas de Fisher junto con las cuantiosas contribuciones de muchos otros investigadores en el rea. Los ingenieros usan experimentos en su prctica diaria para alcanzar diversos objetivos. Algunos ejemplos incluyen: encontrar condiciones f actibles de operacin paa un pro ceso o una m quina, optim izar una medida de desem peo, investigar la s causas de defectos de calidad, disear un sistem a nuevo o hacer un proceso insensible a la variacin externa (robustez). En general, se considera que la experimentacin es una disciplina itera tiva, donde se debe prestar debida atencin a la planeacin, el diseo, y el anlisis del o de los experimentos. Los mtodos estadsticos en ADE pueden hacer m s eficiente la ejecucin de experim entos y a m enudo fortalecen las conclusiones obtenidas de esta manera (Montgom ery, 1997). S in em bargo, es siem pre recomendable usar el conocim iento no-estadstico de un proceso o sistem a para complementar el proceso de experim entacin, as com o para m antener el tam ao y la concentracin del experim ento dentro de lmites adecuados. 4. PROCEDIMIENTO Este laboratorio se divide en dos partes: La primer parte consiste en reproducir el anlisis mostrado por el instructor en la primera sesin con ayuda de EXCEL. En la segunda parte se proveer un conjunto de datos nuevo para que los estudiantes puedan llevar a cabo un anlisis similar a aqul de la primera parte.

Primera parte Se recomienda mantener copias del material de la sesin impartida por el instructor para el material, dado que este manual lo referenciar con frecuencia bajo el nombre de NOTAS. En la sesin de clase, se explic que el objetivo de este experimento es especificar el contenido de la carga y la temperatura del molde en un proceso de moldeo de SMC para mejorar la calidad de la superficie descrita por un ndice de calidad. Supongamos que ya hemos planeado el experimento, y que decidimos usar un diseo factorial para dos factores a dos niveles cada uno, sto es un experimento factorial 22. (Ver pginas 10 y 11 de las NOTAS). Supongamos tambin que el experimento ya se llev a cabo. Ahora lo que necesitamos hacer es el anlisis estadstico 1. Abrir Excel. 2. Introducir los datos experimentales. Aqu estn los datos del experim ento (Pgina 12 de las NOTAS), cada nm ero representa una medicin del ndice d e ca lidad b ajo las con diciones es pecificadas por el rengln y la colum na correspondiente: Temperatura del Molde (oF) 302 327 98 87 89 107 102 105 82 79 84 72 77 78

Carga (%) 40 44

90 85

86 104

94 82

91 67

Esta m anera de representar los resultados de un experim ento es muy conveniente dado que perm ite visualizar la variacin a travs de colum nas y r englones. C omencemos por introducir esta tabla en Excel respetando el formato sealado arriba, y respetando las filas y columnas que se muestran en la ilustracin.

3. Crear una tabla de operaciones preliminares Una vez que se han introducido los datos, podem os calcu lar la tabla de anlisis de varianza usando las frmulas que se detallan en las pginas 12-15 de las NOTAS. Esencialm ente, queremos ver al final la tab la que sigue (de la pgina 16 de las NOTAS).

Sin em bargo, para lleg ar a esta tabl a final, es necesario h acer alguno s clculos p reliminares. Para ello, y siempre siguiendo las frmulas todava de la pgina 12 de las NOTAS, podemos generar la siguiente tabla de clculos preliminares.

Primero introduzca las etiquetas carga, tem peratura, sum as de colum na, sum as de rengln, cuadrados de suma de rengln y suma de cuadrados as como las etiquetas 40, 44, 302 y 327. En la celda D11, se introducirn la suma de las rplicas de los datos tomados bajo un determ inado nivel de carga y de temperatura. En este caso en D11 se introduce la frmula =SUMA(C4:G4), donde el rango C4:G4 contiene los cinco datos tom ados con una carga de 40% y una tem peratura de 302 oF. In troducir frm ulas similares para las celdas D12, E11, y E12. Las sumas de columna y de rengln contienen las sumas correspondientes de datos. En este caso, la celda para la columna 1, D13, contiene la frmula =SUMA(D11:D 12), donde el rango D11:D12 contiene las sum as de datos a travs de cada condicin experim ental espec fica (Nivel de carga, Te mperatura). Introducir una frmula similar para la celda E13. De manera similar, las sumas de rengln contienen las sumas a travs de las columnas para cada rengln. Para el primer rengln, la celda F11 contiene la sum a de D11+E11. Introducir una frmula similar para el segundo rengln. El gran tota l, en celda D13 contien e la sum a de las celdas F11 y F12, que a rengln. su vez contien en sum as de

Una columna ms de clculos (columna G) se necesita para obtener v alores que necesitaremos despus. stos son los cuadrados de las sum as de rengln. Para el primer rengln, por ejem plo, se introduce la frm ula: F11^2. Introduzca frmulas similares para el rengln 2, y para cuadrar el gran total.

La suma de cuadrados en la celda D15 eleva al cuadrado cada medicin experimental y suma estas cantidades. Para lograrlo se introduce la frm ula = SUMA.CUADRADOS (C4:L5), donde el rango C4:L5 contiene todos los datos experimentales. Una vez terminado estos pasos, la tabla de clculos preliminares se deber ver como la tabla siguiente.

4. Crear la tabla de anlisis de varianza Con las frmulas de la pgina 14 y 15 de las NOTAS, procederemos a crear la tabla de anlisis de varianza. Hay que recordar que el primer factor se encuentra variado a 2 niveles, asignam os a =2. De la misma manera, el segundo factor se encuentra variado a b = 2 niveles. Y en total tenem os n = 5 rplicas por combinacin de condiciones experimentales. Procederemos entonces a introducir las siguientes f frmulas): rmulas (pginas 14 y 15 de las NOTAS detallan las

Una vez que se hayan introducido estas frmulas, se debern observar los nmeros siguientes:

Las sumas de cuadrados nos dan una idea un tanto burda de cunta variaci n gener cada una de las fuentes en nuestra medida de desempeo. Los grados de libertad esencialm sumatorias. ente nos indican el nm ero de trm inos independientes en nuestras

El cuadrado medio, que es la suma de cuadrados dividida entre los grados de libertad, puede entenderse como la variacin ajustada proveniente de cada fuente. El cuadrado m edio del erro r es precisam ente nuestro estimador de la varianza en nuestros datos. Los cocien tes F0 comparan la variacin generada por cada una de las fuentes (en el num erador), contra aquella que tenem os como va riacin aleatoria, expresad a p or el cuad rado m edio del e rror o v arianza. Por supuesto, cocientes mayores a 1 indican una variacin producida mayor a la variacin considerada aleatoria, y aquellos m enores a 1, una variacin m enor a aquella co nsiderada aleatoria. Sin em bargo, estos cocientes deben an compararse contra un valo r de tablas para establecer bases estads ticas. ste es el valor F alpha, grados de libertad del numerador, grados de libertad del denominador . Alpha ( ) es la probabilidad de un error tipo I, que en este contexto se refiere a concluir que hay un efecto significativo de alguna fuente cuando en realidad no lo hay. Con la salv edad de checar alguno s supuestos acerca de lo s residuos (que explicamos m s adelante), para obtener conclusiones de la tabla de anlisis de varianza se utilizan generalmente los siguientes criterios: 1) Si F0 F, GL num, GL deno m para determinada fuente de variacin, en tonces concluiremos que esta fuente de variacin afecta significativamente a la medida de desempeo al nivel especificado. 2) Si valor-p para determinada fuente de variacin, entonces concluiremos que esta fuente de variacin afecta significativamente a la medida de desempeo al nivel especificado. Es conveniente notar en este punto que el nivel escogido para estos ejemplos es de 5% ( = 0.05), y que ese valor se introdujo en EXCEL junto con los grados de libertad para el num erador y el denom inador para obtener la F , GL nu m, GL deno m. Alternativam ente se pudo haber encont rado este valor de las tablas de la distribucin F. Tam bin es neces ario hacer hincap i que se utilizaron las funciones de EXCEL par a determinar convenientem ente el valor-p, lo cual puede ser un poco trabajoso si se utilizan las tablas. Una interpretacin general d el valor-p es decir que es el m nimo valor de bajo el que an concluiram os que determinada fuente de variacin tiene un efecto significativo. Con esta in terpretacin no debe sorprender que 5

un valor-p muy bajo (digam os < 0.005) indica una fuerte evidencia en favor de que una fuente de variacin sea significativa. Entonces, salvo un anlisis de residuos, hasta este punto los resultados apuntan a que, al nivel especificado 1) La carga tiene un efecto estads ticamente significativo en el ndice de calidad. sto quiere decir que podramos ajustar independientemente el contenido de carga en nuestra form ulacin para m anipular este ndice). 2) La tem peratura del m olde no tiene un efecto estadstic amente sign ificativo por s so lo si se vara independientemente. 3) Sin em bargo, la interaccin entre a mbos fac tores (nivel de carga y tem peratura de m olde) es significativa. sto quiere decir que cuando se va ran juntos, el ndice de calidad muestra un comportamiento completamente distinto que cuando uno de los factores se vara por s slo. 5. Hacer un anlisis de residuos Cuando se h ace un anlisis de varianza, en realidad lo que se est haciendo es trat ar de ap roximar los datos con un modelo estadstico. En este caso, el modelo es el llamado modelo lineal general de efectos fijos y tiene la forma: yijk=+i+j+()ij+ijk donde i=1,2,,a; j=1,2,,b; y k=1,2,,n es el efecto promedio general, I es el efecto del factor A en su i-simo nivel , j es el efecto del factor B en j-simo nivel, ( )ij es el efecto de la interacci n del factor A con el fa ctor B cuando A est en su i-sim o nivel y B en su j-sim o nivel; y por ltim o, ijk es un componente de error aleatorio denom inado residuo que se supone que sigue una distribucin normal con media igual a 0 y con un valor de desviacin estndar . Podemos obtener las cantidades , 1, 2, 1, 2, ( )11, ( )12, ( )21, ( )22 para nuestro ejemplo, dado que son los efectos fijos. Los podem os calcular de la siguiente m anera: primero definamos una tabla para calcular promedios como se muestra a continuacin tanto en las frmulas como en la salida numrica:

Ahora utilizarem os estos nm eros pa ra encontrar los parm etros de nue stro m odelo estadstico usando las frmulas siguientes (verificar que se obtengan los valores mostrados):

Usaremos e stos trm inos para predecir nuestros dato s experim entales. Ntese, sin em bargo, que solam ente tenemos cuatro combinaciones experimentales (ver pgina 11 de NOTAS), as que solamente podremos hacer estas cuatro predicciones. Sin e mbargo, sabemos que tenemos 5 rplicas por cad a combinacin experim ental (20 datos experimentales en total), por lo tanto, para cad a una de las cin co rplicas nuestra prediccin ser la misma y tendremos una discrepancia. Esta discrepancia es un residuo. Evidentemente en nuestro experimento tenemos 20 residuos. Introduzcamos primero las frmulas para nuestras predicciones:

Para corroborar los valores que se deben mostrar en la pantalla son los siguientes:

Obtengamos ahora los residuos o errores de nuestro experimento.

Para corroborar, los valores que se deben tener en los residuos despus de estas frmulas son:

Estos residuos, tal como lo sealam os anteriorm ente, deben cum plir con tres supuestos: (1) deben ser normalmente distribudos, (2) deben ser independien tes, y (3) deben m antener una desviacin estndar constante . Aunque existen tcnicas estadsticas formales para probar estos tres s upuestos, nuestro inters aqu es m ostrar la intuicin de un mtodo grfico.

Antes de comenzar a graficar, ser necesario crear la si guiente tabla para contar la frecuencia de los datos en intervalos dados (el tamao de los intervalos lo decide uno):

Por otro lado, necesitaremos la siguiente tabla (esencialmente con clculos anteriores):

10

SUPUESTO 1: Los residuos deben ser distribuidos normalmente. Para verificar este supuesto utilizaremos (un tanto liberalmente) un histograma de frecuencia.

El histograma de los residuos debe asemejar una distribucin normal centrada en 0. Al examinar el histograma que obtuvimos, se puede ver que aproxim adamente si gue una form a de ca mpana sim ilar a la de una distribucin for mal, aunque un poco sesgada a la izqui erda. Se considera que desviaciones de norm alidad como las que se m uestran en este histogram a no son de mucha importancia. Se debera revisar la corrida que tiene el residual con m agnitud cercana al 20 para cerci orarse que no es un error de dedo, de organizacin, o incluso de la ejecucin del experimento (como la falta de calibracin, cambio accidental de condiciones, etc.). SUPUESTO 2: Los residuos deben ser independientes. Para verificar este supuesto utilizaremos un par de diagramas de dispersin. SUPUESTO 3: Los residuos deben tener una desviacin estndar constante. Para verificar este supuesto utilizaremos un par de diagramas de dispersin tambin.

11

El primero de los grficos, residuos vs. Orden de experimentacin, se realiza para observar que no haya un patrn reconocible i.e. que los residuos efectivamente se comportan de una manera aleatoria alrededor de 0. Si este no es el caso, puede estarse viola ndo el supuesto de independencia. En este caso la grfica no m uestra un patrn determinado, aunque nuevam ente hay un residuo que sobresale, el cual es el m ismo que se detect en el his tograma. Decidimos dejar este punto porque no se encontr nada que nos indicara que estuviera equivocado en nuestro experim ento, de tal m anera que creemos que es variacin qu e se puede encontrar en nuestro proceso. Los siguientes dos grficos, residuos vs. Carga y residuos vs. Tem peratura, proveen una buena m anera de checar qu e se tenga aproxim adamente la m isma dispersin alred edor d e 0, i.e. que los residuo s tengan un desviacin estndar aproximadamente constante. Dejando de lado el residuo grande que decidimos dejar, lo s grficos de este caso no acusan algo extremadamente problemtico. El ltim o grfico, residuos vs. Predicciones, nos si rve para checar que los residuos no se encuentren correlacionados con la m agnitud de la s predicciones (pues eso violara el supuesto de independencia), as como checar que la dispersin sea aproximadamente la misma. En resumen, hemos verificado que los supuestos de nor malidad, independencia y hom ogeneidad de varianza no se hayan violado en los experim entos a travs del anlisis de residuos . Checar que efectiv amente no haya una violacin a estos supuestos, tran sfiere un buen apoyo estadstico y fortaleza a la s conclusiones de nuestro experimento.

12

6. Crear grficas de efectos principales y de interaccin. Por ltimo, se pueden crear las grfi cas de efectos principales y de inte raccin a m anera de ilustrar nuestras conclusiones, aunque se debe evitar hacer conclusiones basados en el slo uso de estos grficos.

Segunda Parte En la segunda parte de este laborator io, se pide al estudiante repetir el procedimiento anterior con un Nuevo conjunto de datos. Aunque los pasos son los mismos, el anlisis del experimento y las conclusiones se debern basar en el nuevo conjunto de datos. Temperatura de Molde (oF) Carga (%) 40 44 77 76 72 75 275 75 75 77 69 80 62 90 85 86 104 302 98 82 87 79 89 84

13

EJERCICIO ADICIONAL El director de operaciones de ComPsitos S.A., compaa que produce partes de resina polister reforzada con fibra de vidrio (SMC), sabe que el tiempo de curado (tc) de las partes que producen en sus prensas podra ser reducido ya sea incrementando la temperatura del molde (Tw) o precalentando el preformado de SMC, esto es incrementando la temperatura inicial del material (To). Un tiempo menor de curado implicara un potencial aumento de su produccin. El director no sabe, sin em bargo, si am bas acciones son importantes o no, o si es en realidad necesario ejecutar ambas para mejorar m s. Est dispuesto a asignar parte de su presupuesto para comprar una unidad de precalentamiento para el material pero solamente si se puede justificar la adquisicin. Se ha pedido tu ayuda a tom ar esta decisin. T (i nteligentemente) sugieres que se lleve a cabo un experimento factorial 22 para investigar los efectos que ambos, Tw y To, tienen en el tiem po de curado (tc). Aqu estn los resultados (el tiempo de curado se reporta en segundos y la temperatura en grados kelvin.
Temperatura del Molde (K) Temperatura inicial del material (K) 298 323

74.9 66.9

73.4 74.0

413 68.5 75.6

76.1 75.0

81.3 76.5

41.1 40.3

39.1 32.4

423 42.3 41.2

37.7 45.5

35.9 43.3

Se deber comprar una unidad de precalentamiento de material?

En su respu esta, p rovea toda la ev idencia estad stica ne cesaria (tabla de anlisis de varianza, anlisis de residuos, grficos de efectos principales y de intera ccin, etc.) as como una dis cusin de qu indica el anlisis.

14

Você também pode gostar