Você está na página 1de 8

Estadstica para la Calidad y la Productividad

Profesor: Angel Francisco Arvelo L.


1

Diseo de experimentos : Definiciones ,Glosario y Supuestos

Un experimento estadstico es una secuencia de observaciones de una o ms variables
cuantitativas, cuando otras variables cualitativas o cuantitativas que supuestamente las
afectan, llamadas variables de control o factores, son manipuladas o cambiadas por el
experimentador.

Variable de respuesta: Variable cuantitativa continua, objetivo del experimento
Factores: Variables controlables, cualitativas o cuantitativas. que pueden ser
manipuladas o colocadas en diferentes estados.
Niveles del factor: Valores nominales que corresponden a los distintos estados en
los que puede encontrarse un factor.
Los factores pueden ser principales o de bloqueo.
Los factores principales son aquellos cuya influencia sobre las variables de
respuesta se quiere medir con el experimento
Los factores de bloqueo son aquellos factores secundarios, o de estorbo, que
pueden perturbar a las variables de respuesta, y que pueden ser fijados tambin en
distintos niveles para medir su influencia.
Tratamiento: Cada una de las combinaciones de niveles de los distintos factores
principales
Unidad experimental: Objeto (persona o cosa) sobre la cual se va a realizar la
medicin de las variables de respuesta, despus de aplicar un tratamiento dado.
Ensayo: Procedimiento realizado para obtener una observacin
Observacin: Resultado de medir cada una de las variables de respuesta, bajo las
accin de uno de los tratamientos.
Fuente de variacin: Cualquier factor planificado o no que pueda contribuir a
explicar la variabilidad en la respuesta.
Variabilidad residual: Variabilidad debida a factores aleatorios o no planificados en
el experimento.
Rplica: Repeticin del ensayo sobre una nueva unidad experimental que recibe el
mismo tratamiento que la anterior.

Disear el experimento consiste en seleccionar las variables y factores a considerar, para
luego planificar la forma como van a ser tomadas las observaciones, segn el arreglo previsto
en el modelo seleccionado.

Etapas en el diseo de un experimento
Definir los objetivos
Especificar las medidas con las que se trabajar, el procedimiento de los ensayos y las
mediciones.
Definir los factores a considerar y sus niveles
Ejecutar un experimento piloto y evaluarlo.
Seleccionar el tipo de diseo que ser aplicado en el experimento.
Determinar tamao muestral y el nmero de rplicas
Obtener las observaciones segn el diseo seleccionado.
Procesar la informacin, y obtener las conclusiones.

Estadstica para la Calidad y la Productividad
Profesor: Angel Francisco Arvelo L.
2
Tipos de diseo y supuestos
Existen muchas modelos para el diseo experimental.
En el curso slo se analizaran las siguientes:

Diseo completamente aleatorio: Considera un slo factor con k niveles, y las
observaciones se toman en un orden completamente aleatorio.
Si el nmero de observaciones es igual para cada nivel, se dice que es un experimento
balanceado.
Para aplicar este diseo, el experimentador debe considerar que las unidades
experimentales son inicialmente homogneas, y que la variabilidad en las respuestas se
debe exclusivamente a que las unidades experimentales reciben diferentes tratamientos.
Existen dos tipos de modelos completamente aleatorios:

Modelo I: De efectos fijos, donde el investigador selecciona de antemano los k niveles del
factor.
El supuesto para este modelo es : X
ij
= +
i
+ e
ij
Los errores se suponen independiente y normalmente distribuidos con una varianza comn.
La hiptesis a probar es:
o 1 2 k
1 i
0
0
H :
H : Algn
=

= = =


Modelo II: De efectos aleatorios, donde el investigador selecciona al azar los k niveles del
factor dentro de una poblacin de posibles niveles, y por lo tanto los
i
son variables
aleatorias.
Este modelo adems de los supuestos anteriores, supone que cada efecto del factor , es
decir
i
,es independiente del error, y que estos efectos siguen una distribucin normal con
media 0 y una varianza .
2

La hiptesis a probar es:


2
o
2
1
0
0
H :
H :
=

>



Diseo en bloques completos al azar: Considera un slo factor con k niveles, pero dado
que las unidades experimentales no son inicialmente homogneas, el investigador introduce
antes de aplicar los tratamientos un factor de bloqueo, que clasifica a las unidades
experimentales en grupos homogneos, llamados bloques.
La palabra completo se debe a que en cada bloque se experimenta con todos los niveles
del factor.
La asignacin del nivel del factor que le corresponde a cada una de las unidades del bloque
se hace aleatoriamente.
El supuesto del modelo establece: X
ij
= +
i
+
j +
e
ij
, donde las diferentes
j
representan el
efecto del bloque.
La hiptesis a probar es:
o 1 2 k
1 i
0
0
H :
H : Algn
=

= = =



Diseo en cuadrado latino: Considera un slo factor con k niveles, pero con dos factores
de bloqueo.
El nombre de cuadrado latino se deriva del hecho que el factor principal, y los dos de
bloqueo deben tener igual nmero de niveles, y de que las letras latinas representan los
niveles del factor principal, mientas que las filas y columnas los niveles de los factores de
bloqueo.
El supuesto del modelo es : X
ijl
= +
i
+
j +

l
+

e
ijl
, donde las diferentes
j
y los
l

representan el efecto de cada factor de bloqueo.




Estadstica para la Calidad y la Productividad
Profesor: Angel Francisco Arvelo L.
3
Diseo en cuadrado grecolatino: Considera un slo factor con k niveles, y tres factores de
bloqueo.
Las letras latinas representan los niveles del factor principal, mientas que las filas ,las
columnas y las letras griegas los niveles de los factores de bloqueo.
El factor principal y los tres de bloqueo deben tener igual nmero de niveles.
El supuesto del modelo es: X
ijlm
= +
i
+
j +

l
+

m
+ e
ijl
, donde los
j
,
l

m
representan
el efecto de cada uno de los factores de bloqueo.

TABLAS ANOVA

Diseo completamente aleatorio: En este caso las observaciones vienen de la forma {X
ij
}
donde el primer subndice representa el nivel del factor y el segundo el nmero de la
observacin. i = 1,2,
.
,k ; j = 1, 2
, .
,n
i
N =
i k
i
i 1
n
=
=

.
La tabla ANOVA para el caso de efectos fijos es como sigue:
Fuente g.de l Suma de Cuadrados Cuadrado Medio F Signific.

Factor

k-1
i k
2
i i
i 1
n (X X)
=
=


S.C.F
k 1

C.M.F
C.M.E


Valor p

Error

N-k
i
j n i k
2
ij i
i 1 j 1
(X X )
= =
= =


S.C.E
N k



Total

N-1
i
j n i k
2 2
ij
i 1 j 1
(X X)
= =
= =




Cuando Valor p < , se rechaza H
o
, y la conclusin del experimento es que por lo menos
dos niveles del factor tienen diferente media, y que por lo tanto el factor es influyente.
Para identificar los niveles del factor que presentan diferencias significativas existen varios
mtodos: L.S.D , Duncan , Tuckey e Intervalos de confianza.
El mtodo LS.D ( Least Significant Difference) es equivalente al de construir intervalos de
confianza, y consiste en calcular todas las diferencias absolutas entre medias de niveles, es
decir todas las
i j
X X .
i
X X
j
> L.S.D Existe diferencia significativa entre el nivel i y el nivel j del factor.
/ 2;N k
i j
1 1
L.S.D = t C.M.E
n n

+






(
i
X X
j
) L.S.D es el intervalo del (1-) de confianza para
i
-
j
. Cuando este intervalo
contiene al cero, la conclusin es que no existe diferencia significativa entre estos dos
niveles del factor.
Algunas frmulas tiles para simplificar los clculos son:
S.C.F =
i k
2
i i
i 1
n (X X)
=
=

=
2 2 i k
i.
i 1
i
X X
n N
=
=



S.T.C =
i
j n i k
2
ij
i 1 j 1
(X X)
= =
= =

=
i
j n 2 i k
2
ij
i 1 j 1
X
X
N
= =
= =



S.C.E = S.T.C S.C.F


Estadstica para la Calidad y la Productividad
Profesor: Angel Francisco Arvelo L.
4

X
i.
X
La notacin con punto como subndice significa que se ha totalizado sobre este subndice, y
as por ejemplo, significa la suma total de todas observaciones; mientras que
representa la suma de las observaciones en el nivel i.

Diseo en bloques completos al azar: En este caso las observaciones vienen dispuestos
en una forma matricial de dimensin b x k , donde las filas representan los niveles del factor
de bloqueo, y las columnas los niveles del factor principal; de manera que X
ij
representa el
resultado de la observacin con el factor de bloqueo al nivel i , y el principal al nivel j.
La tabla ANOVA para el caso de efectos fijos y una sola rplica es como sigue:
Fuente g.de l Suma de Cuadrados Cuadrado
Medio
F Signific.
Factor
Principal

k-1
j k
2
. j
j 1
b (X X)
=
=


S.C.F
k 1

C.M.F
C.M.E


Valor p
F
Factor de
Bloqueo

b-1
i b
2
i.
i 1
k (X X)
=
=


S.C.B
b 1

C.M.B
C.M.E

Valor p
B

Error

(k-1) (b-1)
i
j k
ij i. . j
j 1
(X X X
i b
2
i 1
X)
= =
= =
+

S.C.E
(k 1)(b 1)



Total

j k i b
2 2
ij
i 1 j 1
(X X)
= =
= =




Valor p
F
< por lo menos dos niveles del factor principal tienen diferente media.
Valor p
B
< por lo menos dos niveles del factor de bloqueo tienen diferente media.
Para identificar los niveles del factor Principal que presentan diferencia significativa, se
aplica el mtodo L.S.D , para las diferencias entre medias muestrales de todas las parejas
de niveles .
/ 2;(a 1)(b 1)
2C
b
.M.E
t

L.S.D = En este caso:
Algunas frmulas tiles para simplificar los clculos son:
2
2 i k
. j
i 1
X
X
b bk
=
=


j k
2
. j
j 1
b (X X)
=
=

= S.C.F =
2 2 i k
i
i 1
X X
k bk
=
=


i b
2
i.
i 1
k (X X)
=
=

S.T.B= =
i
j n i k
2
ij
i 1 j 1
(X X)
= =
= =

i
j n 2 i k
2
ij
i 1 j 1
X
X
bk
= =
= =

S.T.C = =
S.C.E = S.T.C S.C.F - S.C.B


Diseo en cuadrado latino: En este caso las observaciones vienen dispuestos tambin en
una forma matricial cuadrada de dimensin k x k , donde las filas representan los niveles del
primer factor de bloqueo, las columnas los niveles del segundo factor de bloqueo y las letras
latinas los niveles del factor principal.
Cuadrado latino 3 x 3
A B C
C A B
B C A
Cuadrado Latino 4 x 4
A B C D
D A B C
C D A B
B C D A
Cuadrado Latino 5 x 5
A B C D E
E A B C D
D E A B C
C D E A B
B C D E A

Estadstica para la Calidad y la Productividad
Profesor: Angel Francisco Arvelo L.
5
Para una misma dimensin existen muchos arreglos en forma de cuadrado latino, de hecho
al permutar filar o columnas dentro de un cuadrado latino resulta otro cuadrado latino.
Existen por ejemplo, 576 cuadrados latinos 4 x 4.
Al disear el experimento debe sortearse al azar el cuadrado latino a elegir, as como
tambin la fila, la columna y la letra latina que le corresponde a cada uno de los niveles.
Cada observacin se designa por X
ijl;
donde

los subndices representan fila , columna y
letra latina respectivamente.
La tabla ANOVA para el caso de una sola rplica es como sigue:
Fuente g.de l Suma de Cuadrados Cuadrado
Medio
F Signific.
Factor
Principal

k-1
l k
2
l
l 1
k (X X)
=
=



S.C.F
k 1

C.M.F
C.M.E


Valor p
F
Factor Fila
Bloqueo
k-1
i k
2
i
i 1
k (X X)
=
=



S.C.Fila
k 1

C.M.Fila
C.M.E

Valor
p
Fila
Factor
Columna
Bloqueo

k-1
j k
2
j
j 1
k (X X)
=
=



S.C.Columna
k 1


C.M.Columna
C.M.E

Valor
p
columna

Error

(k-1) (k-2)

S.T.C S.C.F- S.C.Fila -
S.C.Columna

S.C.E
(k 1)(k 2)



Total

k
2
- 1
j k i k
2
ij 2
i 1 j 1
X
X
k
= =
= =




Algunas frmulas tiles para simplificar los clculos son:
S.C.F =
l k
2
l
l 1
k (X X)
=
=


=
2 2 l k
l
2
l 1
X X
k k
=
=



S.C. Fila =
l k
2
i
l 1
k (X X)
=
=


=
2 2 i k
i
2
i 1
X X
k k
=
=



S.C. Columna =
j k
2
j
j 1
k (X X)
=
=


=
2
2 i k
j
2
i 1
X
X
k k
=
=





Diseo en cuadrado grecolatino: En este caso las observaciones vienen dispuestos
tambin en una forma matricial cuadrada de dimensin k x k , donde las filas representan los
niveles del primer factor de bloqueo, las columnas los niveles del segundo factor de bloqueo,
las letras griegas los niveles del tercer factor de bloqueo, y las letras latinas los niveles del
factor principal.
Cuadrado greco latino 3 x 3
A B C
C A B
B C A
Cuadrado greco latino 4 x 4
A B C D
B A D C
C D A B
D C B A
Cuadrado grecolatino 5 x 5
A B C D E
B C D E A
C D E A B
D E A B C
E A B C D
Cada observacin se designa por X
ijlm;
donde

los subndices representan fila , columna y
letra latina y letra griegarespectivamente.





Estadstica para la Calidad y la Productividad
Profesor: Angel Francisco Arvelo L.
6
La tabla ANOVA para el caso de una sola rplica es como sigue:
Fuente g.de l Suma de Cuadrados Cuadrado
Medio
F Signific.
Factor
Principal

k-1
l k
2
l
l 1
k (X X)
=
=



S.C.F
k 1

C.M.F
C.M.E


Valor
p
Factor
Factor Fila
Bloqueo

k-1
i k
2
i
i 1
k (X X)
=
=



S.C.Fila
k 1

C.M.Fila
C.M.E

Valor
p
Fila
Factor
Columna
Bloqueo

k-1
j k
2
j
j 1
k (X X)
=
=



S.C.Columna
k 1
C.M.Columna
C.M.E
Valor
p
columna
Factor L.
griega
Bloqueo

k-1
m k
2
m
m 1
k (X X)
=
=



S.C.Lgriega
k 1

C.M.Lgriega
C.M.E
Valor
p
letra griega

Error

(k-1) (k-3)

S.T.C S.C.F- S.C. Fila -
S.C. Columna S,C L griega

S.C.E
(k 1)(k 3)



Total

k
2
- 1
j k i k
2
ij 2
i 1 j 1
X
X
k
= =
= =




Algunas frmulas tiles para simplificar los clculos son:
S.C.F =
l k
2
l
l 1
k (X X)
=
=


=
2 2 l k
l
2
l 1
X X
k k
=
=



S.C. Fila =
l k
2
i
l 1
k (X X)
=
=


=
2 2 i k
i
2
i 1
X X
k k
=
=



S.C. Columna =
j k
2
j
j 1
k (X X)
=
=


=
2
2 i k
j
2
i 1
X
X
k k
=
=




S.C. Letra Griega =
m k
2
m
m 1
k (X X)
=
=


=
2 2 m k
m
2
m 1
X X
k k
=
=





EJEMPLO: Interesa saber si existe diferencia significativa entre las millas recorridas por
galn, entre las gasolinas A, B, C y D.
Se consideraron los siguientes factores de bloqueo:
Fila: Tipo de Vehculo
Columna: Conductor
Letra Griega: Tipo de carretera
Con un arreglo en forma de cuadrado greco latino, el nmero de millas por galn result ser:
Conductor 1 Conductor 2 Conductor 3 Conductor 4
Vehculo 1 B 19 A 16 D 16 C 14
Vehculo 2 A 15 B 18 C 11 D 15
Vehculo 3 D 14 C 11 B 21 A 16
Vehculo 4 C 16 D 16 A 15 B 23
Analizar a un nivel de significacin del 5% si existe diferencia significativa entre los cuatro
tipos de gasolina.
SOLUCION: Se determinan los totales de fila, de columna, de letra latina y de letra griega:




Estadstica para la Calidad y la Productividad
Profesor: Angel Francisco Arvelo L.
7
Totales de fila:
X
1
= 19 +16+16+14 = 65
X
2
= 15 +18+11+15 = 59
X
3
= 14 +11+21+16 = 62
X
4
= 16 +16+15+23 = 70

Totales de letra latina:
X
..1.
= 15 +16+15+16 = 62
X
..2.
= 19 +18+21+23 = 81
X
..3.
= 16 +11+11+14 = 52
X
..4.
= 14 +16+16+15 = 61
Totales de columna:
X
.1..
= 19 +15+14+16 = 64
X
.2..
= 16 +18+11+16 = 61
X
.3..
= 16 +11+21+15 = 63
X
.4..
= 14 +15+16+23 = 68

Totales de letra griega:
X
1
= 14 +18+15+14 = 61
X
2
= 16 +16+21+15 = 68
X
3
= 19 +16+11+16 = 62
X
4
= 15 +11+16+23 = 65


Total general: X.= 256

Se calculan ahora las sumas de cuadrados correspondientes a cada factor:
S.C. Fila =
2 2 i k
i
2
i 1
X X
k k
=
=


=
2 2 2 2
65 59 62 70 256
4 1
+ + +

2
6
= 16.50
S.C. Columna =
2
2 i k
j
2
i 1
X
X
k k
=
=



=
2 2 2 2
64 61 63 68 256
4 1
+ + +

2
6
= 6.50
S.C.F =
2 2 l k
l
2
l 1
X X
k k
=
=


=
2 2 2 2
62 81 52 61 256
4 1
+ + +

2
6
= 111.50

S.C. Letra Griega =
2 2 m k
m
2
m 1
X X
k k
=
=


=
2 2 2 2
61 68 62 65 256
4 1
+ + +

2
6
= 7.50
La suma total de cuadrados es:
S.T.C =
j k i k
2
ij 2
i 1 j 1
X
X
k
= =
= =

= 19
2
+ 16
2
+

.+15
2
+ 23
2
-
2
256
16
= 148
Y la suma de cuadrados debida al error:
S.C.E = 148 16.50 6.50 111.50 7.50 = 6

Finalmente, el resultado de estos clculos es presentado en la tabla ANOVA
Fuente g.de lib. Suma de cuadrados Cuadrado medio F
Gasolinas 3 111.50 37.17 18.6
Vehculos 3 16.50 5.50 2.75
Conductores 3 6.50 2.17 1.08
Caminos 3 7.50 2.50 1.25
Error 3 6.00 2.00
Total 15 148.00

Como el valor crtico dado en la tabla de la Distribucin F es: F
0.05; 3,3
= 9.28 , se concluye
que el nico factor significativo es el tipo de gasolina, por ser el nico cuyo valor F supera
este valor crtico.
Los tres factores de bloqueo resultan no influyentes.
Para identifica cuales tipo de gasolinas presentan diferencias significativas, se hace
necesario ahora encontrar el L.S.D , y hacer las comparaciones mltiples entre todas las
diferencias posibles entre medias.
Las media de cada tipo de gasolina resulta ser:
A
15.50 X = ;
B
20.25 X = ;
C
13 X = ;
D
15.25 X =


Estadstica para la Calidad y la Productividad
Profesor: Angel Francisco Arvelo L.
8
/ 2;(k 1)(k 3)
2C.M.E
k
L.S.D = t

2(6.00)
5.51
4
= = 3.18
B c
X X La nica diferencia de medias que supera este L.S.D es = 7.25 > 5.51
Por lo tanto, la conclusin del experimento es que la gasolina B proporciona un nmero
promedio de millas por galn significativamente mayor que la C ; y las restantes
comparaciones no evidencian una diferencia significativa.

Você também pode gostar