Escolar Documentos
Profissional Documentos
Cultura Documentos
ANLISIS DE LA VARIANZA
Es una tcnica estadstica eficiente para comparar varias medidas muestrales:
1, 2, . . ., n.
El Anlisis de Varianza se origin en investigaciones agrcolas y, por lo tanto, su
lenguaje est cargado de trminos agrcolas como parcelas o bloques
(referencia a la tierra) y tratamientos (referencia a las poblaciones o muestras
que se diferencian en trminos de variedad de semillas, de fertilizantes o
mtodos de cultivo).
En la actualidad, los procedimientos de esta tcnica estadstica tiene una
aplicacin til, en casi todo tipo de diseo experimental.
Por lo tanto es utilizado el Anlisis de Varianza en casi todas las ciencias, por
que su aplicacin es asombrosamente til: se puede adaptar fcilmente para
suministrar, con amplios lmites, una evaluacin adecuada de los datos
obtenidos en un conjunto de experimentos que requieran diversas variables
aleatorias continuas.
Puede darnos respuestas con respecto a los datos muestrales diferentes
clasificaciones como: Anlisis de Varianza de un factor, Anlisis de Varianza de
dos factores, con una sola muestra por grupo.
4.1. Modelo de anlisis de varianza de un factor
Tenemos C poblaciones A1, A2, , Ac, cada una distribuida normalmente con
media i y todas teniendo una varianza comn 2.
Estas poblaciones a menudo se llamaban tratamientos representando, C
manera de ensear estadstica, c marcas de mquinas para producir cierto tipo
de producto.
Se supone que las c poblaciones tienen una varianza comn, puesto que existe
razn para creer que los diferentes tratamientos utilizados con el mismo
propsito pueden diferir en las tendencias centrales, pero no en la dispersin.
Adems, concebimos que estas poblaciones juntas constituyen una poblacin
mayor con media llamada media poblacional mayor que se define como:
i.
= ------C
En los dos supuestos anteriores, deseamos probar la hiptesis nula de que
todas las medidas de tratamientos son iguales:
1
1 = 2 =, .., = C.
Si Ho es verdadera, entonces aceptamos i = , sin embargo. Si Ho es falsa,
entonces esperamos que i se desve de en una cantidad i es decir:
i = i ,
i = 1, 2, , C
:
Observaciones
1
2
.
.
.
.r
Total
ni
Xi
CUADRO N 1
A1
A2
..
x11 x21
...
x12 x22
...
.
.
...
.
.
...
.
.
...
x1r
x2r
...
x1j x2j
...
n1
n2
X1. X2.
Ac
xc1
x2
.
.
.
xcr
xcj
nc
Xc
Total
Xij
N
X
Se puede calcular dos estadsticas sintticas a partir de los datos del cuadro N
1:
_
1) xi. = la media muestral de la i sima columna.
_
xi. = 1/ni xij = 1/ni (xi1 + xi2 + . + xir)
_
que es una estimacin de i. Observndose que el punto(.) en la notacin xi.
indica la media de la columna se obtiene sumando el ndice j.
_
_
2) X = la media total o mayor)
_
_
X = 1/N x ij = 1/N(x1j + x2j + . . . + xcj)
i j
j
j
j
.
que es una estimacin insesgada de y
N = n1 + n2 + . . . + nc
Se puede dividir el conjunto de las i muestras experimentales diferentes en dos
partes distintas en trminos de la suma de las desviaciones al cuadrado
alrededor de la media muestral total. Se espera que cada observacin x ij en la
muestra i se desve de la media total en una cantidad (xij x) en dos partes.
_
_
_
_
( xij X) = (xij xi. + xi. X)
El primer componente del segundo miembro de esta expresin es la desviacin
de xij y de la media muestral i.
El segundo componente del segundo miembro es la desviacin de la media
muestral i y la media total.
_
_ _
_
_
2
SCC = (xi. X) = ni (xi. X) 2
_
_ _
_
2
= ni (xi. - 2 xi. X + X2)
_
_
_
_
2
= ni xi. 2X ni xi. + X2 ni
_
_
_
2
2
= ni xi. 2NX + NX2
_
_
SCC = ni xi. NX2
Como control observemos:
SUMA DE
CUADRADOS
SCC
SCE
SCT
GRADO DE
LIBERTAD
C1
NC
N1
PROMEDIO DE
CUADRADOS
PCC = SCC/C-1
PCE = SCE/N-C
F
F = PCC/PCE
1
2
3
4
5
6
7
8
M1
25
30
28
36
37
32
38
31
M2
31
39
35
38
39
40
42
35
M3
24
30
27
31
32
29
25
28
M4
25
31
24
36
38
29
35
30
4. REGLA DE DECISIN
FE = DISTR. F. INV. (0.05; 3; 28) = 2.9467 2.95
FE = DISTR. F. INV. (0.01; 3; 28) = 4.5681 4.57
8
5. CLCULOS
OBSERVACIONES
1
2
3
4
5
6
7
8
TOTAL
ni
xi
M1
M2
25
31
30
39
28
35
36
38
37
39
32
40
38
42
31
35
257
299
8
8
32.125 37.375
M3
24
30
27
31
32
29
25
28
226
8
28.25
M4
25
31
24
36
38
29
35
30
248
8
3
TOTAL
1,030
32
32.1875
= N - 1 = 32 - 1 = 31
= N - C = 32 - 4 = 28
10
Suma de
Grados
Promedio de
FO
FE
variaciones
Entre Columnas
Dentro de las
Columnas
TOTAL
350.625
468.25
de
libertad
3
28
818.875
31
cuadrados
los cuadrados
116.875
16.72321429
6.989
2.9467
6. TOMA DE DECISIONES
Se rechaza Ho al nivel de significacin del 5% y 1 % por que 6.989 > 2.9467 y
6.989 > 4.5681.
Las cuatro mquinas nuevas son significativamente diferentes en sus
velocidades medias o los efectos de las mquinas son significativos.
MODELO TECNOLGICO POR MS. EXCEL
Anlisis de varianza de un factor.
1. Ingresar los datos a la computadora
11
12
C1
85
72
83
80
83
80
72
85
C2
80
84
81
78
82
84
80
81
82
78
C3
82
80
85
90
88
88
90
85
80
82
Con estos datos podemos concluir que las calificaciones de los empleados
son afectadas significativamente por el programa de capacitacin con una nivel
de significacin del 5% y 1%.
SOLUCIN:
1. HIPTESIS
H0 : 1 = 2 = 3
H0 : 1 2 3.
2. NIVEL DE SIGNIFICACIN
= 0.05, 0.01
3. ESTADSTICA DE PRUEBA
F 2.25 = PCC / PCE
Gl1 = C 1 = 3 1 = 2
Gl2 = N C = 28 3 =25
4.
REGLA DE DECISIN
Fc = DISTR. F. INV. (0.05; 2; 25)ENTER = 3.38519612 3.39
Fc = DISTR. F. INV. (0.01; 2; 25)ENTER = 5.56804025 3.57
14
Para 5%
a) Se acepta H0, cuando Fo 3.38519612 3.39
b) Se acepta H1, cuando Fo > 3.38519612 3.39
Para 1%
a) Se acepta H0, cuando Fo 5.56804025 5.57
b) Se acepta H0, cuando Fo > 3.38519612 3.39
5. CLCULOS
Observac.
1
2
3
4
5
6
7
8
9
10
TOTAL
ni
xi.
C1
85
72
83
80
83
80
72
85
640
8
80
C2
80
84
81
78
82
84
80
81
82
78
810
10
81
C3
82
80
85
90
88
88
90
85
80
82
850
10
85
TOTAL
2300
28
82.1428571
15
= N - 1 = 28 - 1 = 27
= N - C = 28 - 3 = 25
16
Suma de
cuadrados
131.428517
372
503.429
Grados
de
libertad
2
25
27
Promedio
de los
cuadrados
65.7145
14.88
F
observado
F
esperado
4.416
3.39
5.57
6. TOMA DE DECISIONES
Se rechaza Ho al nivel de significacin del 5% y 1 % por que 4.416 > 3.39 y
4.416 < 5.57.
Los tres programas capacitacin son significativamente diferentes en los
niveles de productividad de los empleados.
Modelo Tecnolgico por Ms. Excel
1. Ingresar los datos a la Computadora
18
19
i = j = 0
EL ANLISIS
El anlisis de este modelo comienza, nuevamente, con la participacin de la
suma de cuadrados del total, en componentes significativos y no solapados.
Comenzaremos con la ayuda de una prestacin tabular de los datos muestrales
del cuadro
DATOS MUESTRALES: MODELO DE DOS FACTORES CON UNA SOLA
MUESTRA POR GRUPO
A1
A2
Ac.
s.j
n.j
x.j
B1
B2
.
.
.
Br
si.
ni.
xi.
x 11
x 12
.
.
.
X1r
s1.
n1.
x1.
x21
x 22
.
.
.
x2r
s2.
n2.
x2.
...
...
...
...
...
...
...
...
...
xc1
xc2
.
.
.
xcr
sc.
nr.
xc.
s.1
s.2
.
.
.
s.r
n.1
X1
n.2
X2
.
.
.
.
.
.
n .r
X.r
S suma total
rc = N
X = s/rc
Ai = Tratamientos, i = 1, 2, , c
Bj = Bloques,
j = 1, 2, , r
s.j =
X.j = Medias de las filas = s.j / n.j por ejemplo: x.1 = s.1 / n.1
La suma de cuadrados del total representada por SCT, al igual que
anteriormente, mide las desviaciones al cuadrado de todas las observaciones
de la media muestral total.
Se descompone ahora en tres partes independientes, como se indica en la
siguiente igualdad
SCT =
21
_
(xij X)2
SCC
SCF
SCE =
_
_
(xi. X)2
_
_
(x.j X)2
_ _ _
(xij xi. x.j + X)2
22
Tabla N 3
Fuente de variacin
Tratamiento columnas
Tratamiento de filas
Error
TOTAL
SC
SCC
SCF
SCE
SCT
gl
c1
r - 1
(r-1)(c-1)
rc1
PC
PCC=SCC/C-1
PCF=SCF/r-1
PCE=SCE/(c-1)(r-1)
Fc
Fb
PRUEBA DE HIPTESIS
Para este modelo, pareciera haber dos conjunto de hiptesis a ser evaluadas;
ellos son:
1. Prueba de Hiptesis del Tratamiento
H0: i = 0
H1 : No todas las i son cero
2. Prueba de hiptesis de los efectos de bloques
Ho : BJ = 0
H1 : No todas las BJ son cero
Sin embargo, en realidad nos interesa probar la hiptesis slo el primer
conjunto de hiptesis. No nos importa el problema de si los efectos de bloque
son o no nulos, ya que las medidas de bloques en los supuesto de este
modelo, son simplemente indicativas de las diferencias en los bloques de
material experimental. Esta segunda prueba de hiptesis es, sin embargo
significativa para el modelo completamente aleatorizado a dos criterios, que se
discute posteriormente.
A continuacin, cada una de las medidas maestrales del tratamiento, x i., es una
estimacin insesgada de + i. Por consiguiente, decimos que si las medias
del tratamiento son iguales, entonces i = 0. Nuevamente, observamos que
PCE es una estimacin insesgada de 2, ya sea que i = 0 no, y que PCC es
una estimacin insesgada de 2 slo si i = 0. Cuando i =0 es falsa, PCC
mide tanto las diferencias en los efectos del tratamiento como la variacin
23
aleatoria y, por consiguiente, tiende a ser mucho mayor que PCE. En estas
condiciones, debemos nuevamente aceptar H 0 s, y slo si Fc-1,(c-1)(r-1) = PCC/
PCE = 1 aproximadamente igual a 1. Se rechaza H 0 cuando el valor calculado
de F observada es significativamente mayor que 1
PROBLEMA 3: MODELO DE DOS FACTORES
Se va a efectuar un estudio de los movimientos para determinar el mejor diseo
de trabajo para ensamblar computadoras, cinco diseos se hallan en estudio.
Se selecciono cuatro ensambladores aleatoriamente de entre todos los
ensambladores de la planta y se les ensea minuciosamente a trabajar con
cinco diseos. Cada ensamblador sigue cada diseo durante un da y registra
el nmero de computadoras ensambladas. Para este problema, el modelo que
presentamos es adecuado. En este caso, los tratamientos son los efectos de
los distintos diseos de trabajo y los bloques son los ensambladores
seleccionados aleatoriamente. Probar la hiptesis de hiptesis para este
experimento al nivel de significacin del 1%
ENSAMBLADORES
1
2
3
4
5
6
7
8
D1
10
5
6
4
6
5
10
4
DISEO DE TRABAJO
D2
D3
D4
13
9
14
10
5
10
12
5
10
8
4
11
12
5
10
10
5
10
13
9
14
8
4
11
SOLUCIN
PRUEBA DE HIPTESIS
1. HIPTESIS
H0 : I = 0
H1 : No todas las i son cero
H0 : Bj = 0
H1 : No todas las Bj son cero
2. NIVEL DE SIGNIFICACIN
= 0.05
24
D5
11
6
6
5
6
6
11
5
3. ESTADSTICA DE PRUEBA
Fo 4, 28 = PCC / PCE
c = 5, r = 8
c1 = 51 = 4
r1 = 8 -1 = 7
(c - 1)(r - 1) = (5 - 1)(8 - 1) = (4)(7) = 28
4. REGLA DE DECISIN
FE= DISTR. F. INV. (0.05; 7; 28)ENTER = 2.35925768 2.36
DIBUJAR
a) se acepta Ho cuando Fo 2.36
b) se rechaza Ho cuando Fo > 2.36
5. CLCULOS
Los clculos de produccin (el nmero de computadoras ensambladas) para
experimento son como:
TABLA N 4
ENSAMBLADORES
1
2
3
4
5
6
7
8
si.
ni.
xi.
D1
10
5
6
4
6
5
10
4
50
8
6.25
DISEO DE TRABAJO
D2
D3
D4
13
9
14
10
5
10
12
5
10
8
4
11
12
5
10
10
5
10
13
9
14
8
4
11
86
46
90
8
8
8
10.75
5.75
11.25
D5
11
6
6
5
6
6
11
5
56
8
7
s.j
n.j
x.j
57
36
39
32
39
36
57
32
5
5
5
5
5
5
5
5
328 =S
40= rc
82 = X
11.4
7.2
7.8
6.4
7.8
7.2
11.4
6.4
42 + 112 + 52=
+ 64
+ 16 + 121 + 25 = 3072
26
SCF = 146.40
1/rsi.2 = (502 + 862 + 462 + 902 + 562) / 8
1/rsi.2 = (2500 + 7396 + 2116 + 8100 + 3136) / 8
1/rsi.2 = 232248 / 8
1/rsi.2 = 2906
SCC = 1/r si. 2 C
SCC = 2906 - 2689.6
SCC = 216
SCE = SCT (SCC + SCF)
SCE = 382.40 - (216 + 146.40)
SCE = 382.40 - 362.40
SCE = 20
Clculo de los grados de libertad:
Clculo del grado de libertad de las filas = r 1 = 8 1 = 7
Calculo de grados de libertad de las columnas = c - 1 = 5 - 1 = 4
Clculo de los grados de libertad de error = (c - 1)(r - 1) = (5-1)(8-1) = 28
Clculo de los grados de libertad del total = cr - 1 = 5x8 1 = 39
Calculando el promedio de los cuadrados:
Calculando el promedio de los cuadrados de las Filas
PCF = 146.40 / (8 - 1) = 146.40/7 = 20.91428571
Promedio de los cuadrados entre columnas
PCC = SCC / c - 1 = 216 / (5 - 1) = 216 / 4 = 54
Promedio de los cuadrados del error
PCE = SCE / (c - 1)(r - 1) = 20 / (5-1)(8-1) = 20 / 28 = 0.71428571428
27
Calculando la F observada
F = 54 / 0.71428571428 = 75.6
FUENTE DE
VARIACIN
Entre ensam.
Entre diseos
Error
TOTAL
SC
146.40
216.00
20.00
382.40
G. L.
7
4
28
39
PC
20.9143
54.0000
0.7143
Fo
29.2794
75.6
VALOR
CRTICO F
2.3593
2.7141
6. TOMA DE DECISIONES
Se rechaza Ho porque 75.6 > 2.35925768
Los diseos de trabajo son diferentes
Se rechaza Ho porque 29.28 > 2.3593
Los ensambladores son diferentes
28
29
7.
31
ANALISIS DE LA
VARIANZA
LIMA - PER
32