Você está na página 1de 15

ESTADISTICA APLICADA A LA INGENIERIA FIQ y M

UNIVERSIDAD NACIONAL "JOS FAUSTINO SNCHEZ CARRIN"

Anlisis de

Facultad : Ingeniera Qumica y


Metalrgica.

Escuela : Ingeniera Qumica.

Curso : Estadstica Aplicada a la


Ingeniera

Docente : Ing. Algemiro Julio Muoz


Vilela

Ciclo :V

Integrantes: Kimberly Corpus Martin

Kiara Yajaira Farro Flores

Cielito Massyel Obregn


Durand

Isabella Daniela Perez


Huaman

V CICLO Pgina 14
HUACHO
ESTADISTICA APLICADA - 2015
A LA INGENIERIA FIQ y M

ANALISIS DE VARIANZA

Qu es el anlisis de varianza?
El anlisis de la varianza (o Anova: Analysis of variance) es un mtodo para comparar
dos o ms medias, que es necesario porque cuando se quiere comparar ms de dos
medias es incorrecto utilizar repetidamente el contraste basado en la t de Student.
Las tcnicas iniciales del anlisis de varianza fueron desarrolladas por el estadstico y
genetista R. A. Fisher en los aos 1920 y 1930 y es algunas veces conocido como
"Anova de Fisher" o "anlisis de varianza de Fisher", debido al uso de la distribucin F
de Fisher como parte del contraste de hiptesis.

Introduccin

El anlisis de la varianza parte de los conceptos de regresin lineal. Un anlisis de la


varianza permite determinar si diferentes tratamientos muestran diferencias
significativas o por el contrario puede suponerse que sus medias poblacionales no
difieren. El anlisis de la varianza permite superar las limitaciones de hacer contrastes
bilaterales por parejas que son un mal mtodo para determinar si un conjunto de
variables con n > 2 difieren entre s. El primer concepto fundamental es que todo valor
observado puede expresarse mediante la siguiente funcin:

Donde:

sera el valor observado (variable dependiente) [valor j-simo del tratamiento


i-simo], y es el efecto del tratamiento i.
sera una constante que en la recta de regresin equivale a la ordenada en el
origen,
es una variable que vara de tratamiento a tratamiento.

V CICLO Pgina 14
es una variable aleatoria
ESTADISTICA APLICADA que A
aade a la funcin cierto error que desva
LA INGENIERIA FIQ y la
M
puntuacin observada de la puntuacin pronosticada.

Por tanto, a la funcin de pronstico la podemos llamar "media del tratamiento i":

Podemos resumir que las puntuaciones observadas equivalen a las puntuaciones

esperadas, ms el error aleatorio ( ). A partir de esa idea, se puede


operar:

Restamos a ambos lados de la ecuacin (para mantener la igualdad) la media de


la variable dependiente:

Operando se llega finalmente a que:

Esta eccuacin se reescribe frecuentemente como:

De un factor, que es el caso ms sencillo, la idea bsica del anlisis de la varianza es


comparar la variacin total de un conjunto de muestras y descomponerla como:

Donde:

es un nmero real relacionado con la varianza, que mide la variacin


debida al "factor", "tratamiento" o tipo de situacin estudiado.
es un nmero real relacionado con la varianza, que mide la variacin
dentro de cada "factor", "tratamiento" o tipo de situacin.

En el caso de que la diferencia debida al factor o tratamiento no sea estadsticamente


significativa puede probarse que las varianzas muestrales son iguales:

V CICLO Pgina 14
Donde:
ESTADISTICA APLICADA A LA INGENIERIA FIQ y M
es el nmero de situaciones diferentes o valores del factor se estn
comparando.
es el nmero de mediciones en cada situacin se hacen o nmero de valores
disponibles para cada valor del factor.

As lo que un simple test a partir de la F de Snedecor puede decidir si el factor o


tratamiento es estadsticamente significativo.

Visin general

Existen tres clases conceptuales de estos modelos:

1. El Modelo de efectos fijos.- asume que los datos provienen de poblaciones


normales las cuales podran diferir nicamente en sus medias. (Modelo 1)
2. El Modelo de efectos aleatorios.- asume que los datos describen una jerarqua de
diferentes poblaciones cuyas diferencias quedan restringidas por la jerarqua.
Ejemplo: El experimentador ha aprendido y ha considerado en el experimento
slo tres de muchos ms mtodos posibles, el mtodo de enseanza es un factor
aleatorio en el experimento. (Modelo 2)
3. El Modelo de efectos mixtos.- describen situaciones que ste puede tomar.
Ejemplo: Si el mtodo de enseanza es analizado como un factor que puede
influir donde estn presentes ambos tipos de factores: fijos y aleatorios. (Modelo
3)

Supuestos previos

El ANOVA parte de algunos supuestos o hiptesis que han de cumplirse:

La variable dependiente debe medirse al menos a nivel de intervalo.


Independencia de las observaciones.
La distribucin de los residuales debe ser normal.
Homocedasticidad: homogeneidad de las varianzas.

La tcnica fundamental consiste en la separacin de la suma de cuadrados (SS, 'sum of


squares') en componentes relativos a los factores contemplados en el modelo. Como
ejemplo, mostramos el modelo para un ANOVA simplificado con un tipo de factores en

V CICLO Pgina 14
diferentes niveles. (Si los niveles son cuantitativos y los efectos son lineales, puede
ESTADISTICA APLICADA A LA INGENIERIA FIQ y M
resultar apropiado un anlisis de regresin lineal)

El nmero de grados de libertad (gl) puede separarse de forma similar y corresponde


con la forma en que la distribucin chi-cuadrado ( o Ji-cuadrada) describe la suma de
cuadrados asociada.

TIPOS DE MODELO

Modelo I: Efectos fijos

El modelo de efectos fijos de anlisis de la varianza se aplica a situaciones en las que el


experimentador ha sometido al grupo o material analizado a varios factores, cada uno de
los cuales le afecta slo a la media, permaneciendo la "variable respuesta" con una
distribucin normal.

Este modelo se supone cuando el investigador se interesa nicamente por los niveles del
factor presentes en el experimento, por lo que cualquier variacin observada en las
puntuaciones se deber al error experimental.

Modelo II: Efectos aleatorios (componentes de varianza)

Los modelos de efectos aleatorios se usan para describir situaciones en que ocurren
diferencias incomparables en el material o grupo experimental. El ejemplo ms simple
es el de estimar la media desconocida de una poblacin compuesta de individuos
diferentes y en el que esas diferencias se mezclan con los errores del instrumento de
medicin.

Este modelo se supone cuando el investigador est interesado en una poblacin de


niveles, tericamente infinitos, del factor de estudio, de los que nicamente una muestra
al azar (t niveles) estn presentes en el experimento.

Grados de libertad

V CICLO Pgina 14
Los grados de libertad pueden descomponerse al igual que la suma de cuadrados. As,
ESTADISTICA APLICADA A LA INGENIERIA FIQ y M
GLtotal = GLentre + GLdentro. Los GLentre se calculan como: a - 1, donde a es el
nmero de tratamientos o niveles del factor. Los GLdentro se calculan como N - a,
donde N es el nmero total de observaciones o valores de la variable medida (la variable
respuesta).

Pruebas de significacin

El anlisis de varianza lleva a la realizacin de pruebas de significacin estadstica,


usando la denominada distribucin F de Snedecor.

Tablas ANOVA

Una vez que se han calculado las sumas de cuadrados, las medias cuadrticas, los
grados de libertad y la F, se procede a elaborar una tabla que reuna la informacin,
denominada "Tabla de Anlisis de varianza o ANOVA", que adopta la siguiente forma:

Fuente de Suma de Grados de Cuadrado medio F


variacin cuadrados libertad
Intergrupo t-1

Intragrupo o N-t
Error
Total N-1

EJEMPLOS

1. Los miembros de un equipo ciclista se dividen al azar en tres grupos que


entrenan con mtodos diferentes. El primer grupo realiza largos recorridos a
ritmo pausado, el segundo grupo realiza series cortas de alta intensidad y el
tercero trabaja en el gimnasio con pesas y se ejercita en el pedaleo de alta
frecuencia. Despus de un mes de entrenamiento se realiza un test de
rendimiento consistente en un recorrido cronometrado de 9 Km. Los tiempos
empleados fueron los siguientes:

V CICLO Pgina 14
ESTADISTICA APLICADA A LA INGENIERIA FIQ y M

A un nivel de confianza del 95% Puede considerarse que los tres mtodos
producen resultados equivalentes? O por el contrario Hay algn mtodo
superior a los dems?
Solucin:
Comenzamos calculando los totales y los cuadrados de los totales divididos por
el nmero de observaciones:

A continuacin calculamos los cuadrados de las observaciones y su total:

A partir de estas cantidades bsicas calculamos las Sumas de Cuadrados:


SC (total) = 2984 - 2940 = 44
SC (intra) = 2984 2966,8 = 17,2
SC (entre) = 2966,8 2940 = 26,8

Los cuadrados medios sern:


CM (entre) = 26,8/2 = 13,4
CM (intra) = 17,2/12 = 1,43

Por consiguiente el estadstico de contraste vale:


F = 13,4/ 1,43 = 9,37

V CICLO Pgina 14
El valor de la F terica con 2 y 12 grados de libertad, a un nivel de confianza del
ESTADISTICA APLICADA A LA INGENIERIA FIQ y M
95% es 3,89. Por consiguiente se rechaza la hiptesis nula y se concluye que los
tres mtodos de entrenamiento producen diferencias significativas.
2. Una lista de palabras sin sentido se presenta en la pantalla del
ordenador con cuatro procedimientos diferentes, asignados al azar a
un grupo de sujetos. Posteriormente se les realiza una prueba de
recuerdo de dichas palabras, obtenindose los siguientes resultados:

Qu conclusiones pueden sacarse acerca de las cuatro formas de


presentacin, con un nivel de significacin del 5%?

Solucin:
Comenzamos calculando los totales y los cuadrados de los totales
divididos por el nmero de observaciones:
A continuacin calculamos los cuadrados de las observaciones y su

total:

A partir de estas cantidades bsicas calculamos las Sumas de Cuadrados:


SC (total) = 988 819,8 = 168,2
SC (intra) = 988 902 = 86
SC (entre) = 902 819,8 = 82,2

V CICLO Pgina 14
ESTADISTICA APLICADA A LA INGENIERIA FIQ y M
Los cuadrados medios sern:
CM (entre) = 82,2/3 = 27,4
CM (intra) = 86/22 = 3,9

Por consiguiente el estadstico de contraste vale:


F = 27,4/ 3,9 = 7,03

El valor de la F terica con 3 y 22 grados de libertad, a un nivel de confianza del


95% es 3,05. Por consiguiente se rechaza la hiptesis nula y se concluye que los
cuatro procedimientos de presentacin producen diferencias significativas.

Tablas de Fisher al 95%:


1=0.05

V CICLO Pgina 14
ESTADISTICA APLICADA A LA INGENIERIA FIQ y M

ANOVA de un factor
Tomemos como ejemplo la comparacin de 5 laboratorios que analizan nk veces
con el mismo procedimiento la concentracin de Pb en una misma muestra de
agua de ro. El objetivo del ANOVA aqu es comparar los errores sistemticos
con los aleatorios obtenidos al realizar diversos anlisis en cada laboratorio.
Hemos comentado antes que son condiciones importantes que cada laboratorio
analice sus muestras de manera independiente y con precisiones parecidas a las
del resto de laboratorios. En la tabla 1 se muestran los resultados obtenidos
(expresados en mg/L).

Tabla 1. Resultados del anlisis de plomo en agua de ro realizado por 5


laboratorios (k indica el n de laboratorio).

V CICLO Pgina 14
ESTADISTICA APLICADA A LA INGENIERIA FIQ y M

Observando los valores medios todo parece indicar que existen diferencias entre
los laboratorios. Ahora bien, son dichas diferencias significativas? El ANOVA
responde a esta cuestin. El objetivo del ANOVA es comparar los diversos
valores medios para determinar si alguno de ellos difiere significativamente del
resto. Para ello se utiliza una estrategia bien lgica: si los resultados
proporcionados por los diversos laboratorios no contienen errores sistemticos,
los valores medios respectivos no diferirn mucho los unos de los otros y su
dispersin, debida a los errores aleatorios, ser comparable a la dispersin
presente individualmente en cada laboratorio.

El secreto est, pues, en descomponer la variabilidad total de los datos en dos


fuentes de variacin: la debida a los laboratorios y la debida a la precisin dentro
de cada laboratorio. Matemticamente, la suma de cuadrados total, SST, puede
descomponerse como una suma de dos
sumas de cuadrados:

SST es la suma de las diferencias al cuadrado de cada resultado individual


respecto a la media de todos los resultados y por tanto, representa la variacin
total de los datos. SSR mide las desviaciones entre los resultados individuales
(xkj), de cada laboratorio (donde j indica el n de repeticin) y la media del

laboratorio ( xk ) y, por lo tanto, es una medida de la dispersin dentro de los

laboratorios. Cuando se divide SSR por los correspondientes grados de libertad,


(N - K), se obtiene el cuadrado medio (o MS, del ingls Mean Square) "dentro
de los laboratorios", MSR.

V CICLO Pgina 14
ESTADISTICA APLICADA A LA INGENIERIA FIQ y M
Por su lado, SSlab mide las desviaciones entre los resultados medios de los
laboratorios y el resultado medio global y, dividido por sus grados de libertad, (k
- 1), constituye el cuadrado medio "entre laboratorios", MS lab. La Tabla 2
muestra las diferentes expresiones para calcular las sumas de cuadrados y las
correspondientes varianzas.

Tabla 2. Expresiones para el clculo del ANOVA de un factor (K indica el


nmero de laboratorios y N el nmero total de resultados).

Se calculan, por tanto, MSlab y MSR como una medida de las dispersiones
comentadas y se comparan mediante una prueba de hiptesis F. Si no existe
diferencia estadsticamente significativa entre ellas, la presencia de errores
aleatorios ser la causa predominante de la discrepancia entre los valores
medios. Si, por el contrario, existe algn error sistemtico, MS lab ser mucho
mayor que MSR, con lo cual el valor calculado de F ser mayor que el valor
tabulado Ftab para el nivel de significacin a escogido y los grados de libertad
mencionados.

A continuacin se muestra la tpica tabla ANOVA obtenida para los resultados


del ejemplo de la Tabla 1:

Tabla 3. Tabla ANOVA para los resultados de la Tabla 1.

V CICLO Pgina 14
ESTADISTICA APLICADA A LA INGENIERIA FIQ y M

Como Fcal > Ftab, en este caso se podra concluir que al menos uno de los
laboratorios ha producido resultados la media de los cuales difiere de forma
estadsticamente significativa del resto de laboratorios. El valor de probabilidad
que aparece en la Tabla 3 indica aquel valor de a a partir del cual el ANOVA no
detectara ninguna diferencia significativa. As pues, a menor valor de
probabilidad, mayor seguridad de que existen diferencias significativas.

El ANOVA no indica cuntos laboratorios difieren ni cules son. Una inspeccin


visual de los resultados puede proporcionar sin duda alguna pista, pero si se
quieren tener criterios ms slidos, hay diversas pruebas estadsticas que
permiten saber de qu laboratorios se trata [Massart, 1997].

En el ejemplo que hemos presentado, todos los laboratorios han analizado la


muestra siguiendo un procedimiento analtico comn. Se hubiese podido
plantear que cada laboratorio utilizase dos procedimientos comunes, por ejemplo
el mtodo oficial y un mtodo alternativo. En este caso dispondramos de los
resultados del contenido en plomo obtenidos por una serie de laboratorios con
dos mtodos distintos, y el ANOVA nos proporcionara informacin sobre la
existencia de discrepancias entre laboratorios y entre mtodos. Sera un ejemplo
de ANOVA de dos factores.

CONCLUSIONES
En este artculo hemos visto que el ANOVA puede utilizarse para comparar entre
s las medias de los resultados obtenidos por diversos laboratorios, analistas,

V CICLO Pgina 14
mtodos de anlisis, etc. En el siguiente artculo mostraremos cmo utilizar el
ESTADISTICA APLICADA A LA INGENIERIA FIQ y M
ANOVA para descomponer la variacin total de un proceso en las fuentes de
variacin parciales. Esto nos puede resultar muy til para, por ejemplo,
determinar cules son los factores que afectan ms a un determinado
procedimiento analtico.
Desde el punto de vista prctico, existen mltiples paquetes estadsticos que
permiten ejecutar rpidamente los clculos del ANOVA. Lo que es interesante,
sin embargo, es que el usuario tenga capacidad para extraer conclusiones
qumicas de los resultados obtenidos.

BIBLIOGRAFIA

1. http://www.ugr.es/~jsalinas/weproble/T14res.PDF
2. http://www.monografias.com/trabajos61/analisis-varianza/analisis-
varianza.shtml#ixzz3tIlrgChU
3. https://es.wikipedia.org/wiki/An%C3%A1lisis_de_la_varianza

V CICLO Pgina 14
4. http://rodi.urv.es/quimio/general/anovacast.pdf
ESTADISTICA APLICADA A LA INGENIERIA FIQ y M

V CICLO Pgina 14

Você também pode gostar