Você está na página 1de 51

Estadística de medidas

repetidas
CLASE MARTES 29 DE AGOSTO DE 2017
Media y Desviación Estándar
Para revelar la MEDIDAS REPETIDAS
presencia de ERRORES Es necesario hacer
ALEATORIOS

Veamos los resultados de repetir 5 veces una VALORACION hecha por 4 estudiantes
Para COMPARAR SE
USARAN 2 CRITERIOS

VALOR EL Grado de
PROMEDIO Variabilidad
El valor promedio utilizado Media Aritmética (Media)

Es la suma de todas la
medidas dividida por el
número de medidas
Desviación Estandar, s Para MEDIR LA VARIABILIDAD
EJEMPLO:
El CUADRADO de “s” Es una cantidad muy importante
conocida como
VARIANZA

VARIANZA = ES EL CUADRADO DELA DESVIACIÓN ESTANDAR, S2


El COEFICIENTE DE Medida de la VARIABILIDAD
VARIACION (CV) Conocida también como
DESVIACION ESTANDAR
RELATIVA (DR)

Ejemplo de Expresiónde Error Relativo

Utiliza para COMPARAR PRECISION DE


RESULTADOS
DISTRIBUCION DE MEDIDAS REPETIDAS

Se resume en 1 TABLA DE DISTRIBUCION DE


FRECUENCIAS
Se aprecia UN HISTOGRAMA

Se observa la DISTRIBUCION DE MEDIDAS:


• forma casi simétrica

• en torno a la media

• con medidas agrupadas hacia le centro

Media de los resultados = 0.500 μg/ml


Desviación Estándar = 0.0165 μg/ml
Recordando
Conjunto de todas las posibles medidas se llama POBLACION

SI NO EXISTEN ERRORES SITEMATICOS

μ = MEDIA DE LA POBLACION es el VALOR VERDADERO DE LA CONCENTRACION DE NITRATOS

La MEDIA DE LA MUESTRA proporciona una ESTIMACION DE μ


LA POBLACION

TIENE UNA DESVIACION ESTANDAR DENOTADA POR σ

La DESVIACION ESTANDAR, s, de la muestra proporciona una ESTIMACION DE σ


EN TEORIA
TOMAR CUALQUIER VALOR
UNA CONCENTRACION DE UN
COMPONENTE PUEDE …

ENTONCES, PARA
Se necesita UNA CURVA
DESCRIBIR LA FORMA DE LA
POBLACION CONTINUA
Es simétrica respecto al valor de 
PROPIEDADES DE LA CURVA GAUSSIANA

1. Independientemente de su amplitud,
– el 68.3% de los datos se encuentra bajo el área de la curva definida por su media más/menos
una desviación estándar de esta (± σ);
– el 95.5% de los datos está dentro de ( ± 2 σ), y
– el 99.7% dentro de (± 3σ).

2. Es simétrica respecto al valor de 

3. Cuanto mayor es el valor de  más ancha es (más dispersas están las


medidas)
Simetría respecto de µ

Independientemente de su amplitud,
el 68.3% de los datos se encuentra bajo el área
de la curva definida por su media
más/menos una desviación estándar de
esta (± σ);
el 95.5% de los datos está dentro de ( ± 2 σ), y
el 99.7% dentro de (± 3σ).
Cuanto mayor es el valor de  más ancha es (más dispersas están
las medidas)
Para poder aplicar los métodos estadísticos hay que

partir necesariamente de una serie de suposiciones (hipótesis):

La principal es la de

aceptar que las medidas afectadas por errores


aleatorios (estos también)
siguen una DISTRIBUCIÓN NORMAL ó GAUSSIANA
LIMITES DE CONFIANZA DE LA MEDIA PARA MUESTRAS PEQUEÑAS

Siguiendo con el planteamiento del problema…

“que plantea la necesidad de encontrar el valor verdadero de un componente en un material…”

Si se conoce la DISTRIBUCION MUESTRAL DE LA MEDIA…

Para definir el intervalo Se puede UTILIZAR UNA


MUESTRA
dentro del cual se puede
suponer de manera razonable
que ahí se encuentra el
VALOR VERDADERO
LIMITES DE CONFIANZA DE LA MEDIA PARA MUESTRAS PEQUEÑAS

Para definir el
intervalo dentro del cual Se puede UTILIZAR UNA
se puede suponer de
manera razonable que ahí
MUESTRA
se encuentra el VALOR
VERDADERO …..

INTERVALO DE CONFIANZA
Depende de LA CERTEZA QUE SE
Los VALORES EXTREMOS se QUIERE TENER
llaman LIMITES DE CONFIANZA
(es decir CON CIERTA CONFIABILIDAD)
El subindice (n-1) indica que t depende de esta cantidad se llama GRADOS DE
LIBERTAD (Ѵ)

Numero de desviaciones independientes (Xi - ) que se utilizan al calcular s


La tabla 2.3 Recoge algunos VALORES D de t
PRESENTACION DE RESULTADOPS ANALITICOS

RECORDANDO…

NUESTRO PRINCIPIO

Los resultados cuantitativos carecen de interés

Si no van acompañados de alguna estimación de los errores


involucrados en la medida
PRESENTACION DE RESULTADOS
ANALITICOS

MENOS
FRECUENTE MUY USUAL

REPORTAR EL
REPORTAREL
RESULTADO TAMBIEN SE USAN CITAR
RESULTADO
COMO ERROR ESTIMACIONES DE LA MEDIA Y LA
FORMA DE LIMITES DE INCERTIDUMBRTE
ESTANDAR DE LA DESVIACION ESTANDAR
CONFIANZA
MEDIA

TODOS SON VALIDOS


SE PUEDEN INTERCONVERTIR SIEMPRE QUE SE DIGA EL VALOR DE “n “
REPORTE DE LOS RESULTADOS
ANALITICOS
METODO SUGERIDO

SE FIJAN COMO CIFRAS SIGNIFICATIVAS:

TODOS LOS DIGITOS SEGUROS

+ EL PRIMERO INCIERTO
PROMEDIO= 10.102
10.09 10.11 10.09 10.10 10.12 s = 0.01304

ANALISIS:
LOS RESULTADOS SON TODOS 10.1 con 1 cifra decimal

PERO…

DIFIEREN ENLA 2ª Cifra decimal

DEBE REPORTARSE

+/- S = 10.10 +/- 0.01 (N=5)


Estadística de medidas
repetidas. Continuación
DATOS DISCORDANTES
• Cuando se escoge el nivel de
significación 0,05 (ó 5%), tenemos un
95% de confianza de que hemos
adoptado la decisión correcta y una
probabilidad 0,05 de ser falsa.
Cómo determinar si un valor es realmente un
valor atípico y cómo decide si debe continuar
o no con el análisis de datos?

• Uno de los problemas en el análisis de datos es manejar


los valores atípicos dentro de un grupo de datos.

• Un valor atípico es una observación con un valor que no


parece corresponderse con el resto de los valores en el
grupo de datos.

Por lo general surgen dos preguntas:


1) ¿Es este valor realmente un valor atípico?
2) ¿Puedo eliminar este valor y continuar con el análisis de
datos?
DATOS ATIPICOS
• Con respecto a la pregunta 2, debe saberse que las pruebas
estadísticas se utilizan para identificar valores atípicos, no para
retirarlos del grupo de datos.

• Técnicamente, una observación no debe retirarse a menos que una


investigación halle una causa probable para justificar esta acción
DATOS ATIPICOS
Si en la investigación no se encuentra una causa probable,
¿qué debe hacerse?

• Un enfoque sería realizar un análisis de datos con el valor atípico y sin él.
Si las conclusiones son diferentes, entonces se considera que el valor
atípico tiene influencia y esto debería indicarse en el informe.

• Otra opción es utilizar estimadores rigurosos para caracterizar los grupos


de datos, tal como la mediana de la muestra en lugar de la media.
RECHAZO DE DATOS

• Dos de las pruebas estadísticas utilizadas con mayor frecuencia en un


grupo de datos son la prueba de Dixon y la prueba de Grubbs.

• La prueba de Dixon utiliza relaciones de las diferencias entre datos


que parecen atípicos comparados con los valores del grupo de datos.
DIXON
Por ejemplo, tomemos los datos 5.3, 3.1, 4.9, 3.9, 7.8, 4.7 y 4.3
Ordenando los datos:
3.1, 3.9, 4.3, 4.7, 4.9, 5.3, 7.8

El tamaño de la muestra es 7, y la relación utilizada es el espacio entre el valor atípico


(7.8) y su vecino más próximo (5.3) dividido por el espacio entre los valores más grandes
y más pequeños en el grupo.
Por lo tanto, el índice de Dixon es:
(7.8 – 5.3)/(7.8 – 3.1) = 2.5/4.7 = 0.532
RECHAZO DE DATOS
Este valor se compara con un valor crítico de una tabla, y el valor se declara valor
atípico si supera ese valor crítico.
Si Dcalculado>Dtabulado se rechaza el dato

El valor tabulado depende del tamaño de la muestra, n, y de un nivel de confianza


elegido, que es el riesgo de rechazar una observación válida. La tabla por lo
general utiliza niveles de baja confianza tal como 1% o 5%.
Para un n = 7 y un riesgo del 10%, el valor en la tabla es 0.507. El índice de Dixon
0.532 excede este valor crítico, indicando que el valor 7.8 es un valor atípico.
DIXON
La prueba de Dixon se usa en un número
pequeño de observaciones (menor a 26) y
detecta elementos que se encuentren
sesgados o que son extremos.
GRUBBS
La prueba de Grubbs utiliza una estadística de prueba,
T, que es la diferencia absoluta entre el valor atípico,
XO, y el promedio de la muestra (X) dividida por la
desviación estándar de la muestra, s.
Para el ejemplo anterior, el promedio de la muestra es
= 4.86 y la desviación estándar de la muestra es = 1.48.
La estadística calculada de la prueba es:
GRUBBS

Para un n = 7 y un riesgo del 5%, el valor tabulado es


1.938 y el TCalculado = 1.99 excede este valor crítico,
indicando que el valor 7.8 es un valor atípico.
TEST DE GRUBB PARA DATOS SOSPECHOSOS
Recomendado por las normas ISO

G= Valor Sospechoso – X
S
(Con el valor sospechoso incluido)

Si Gcalculada > Gtabulada el valor sospechoso se rechaza


TEST Q DE DATOS SOSPECHOSOS
Aceptar o rechazar un resultado anómalo (outlier)
Normalmente se producen al cometer errores o fallos en la
metodología aplicada.

Se ordenan los datos en forma creciente y se calcula Q

Q = desvío = Diferencia entre el dato sospechosos y su vecino más cercano


recorrido Diferencia numérica entre el dato de mayor valor y el de menor valor

Si Qcalculada > Qtabulada el dato se rechaza


Ejemplo de aplicación de Prueba Q:
Al efectuar una serie de réplicas para determinar la concentración del ión sulfato
en una muestra de agua para riego se obtuvieron los siguientes resultados.
Determinar si la medida 6.0 es un valor rechazable.

Medida Valor 1. Se ordenan los datos en orden de valor


1 5.0 decreciente
2 5.2 6.0, 5.6, 5.5, 5.2, 5.0
3 5.5 2. Se calcula Q
4 5.6 Q= (6.0-5.6)/ (6.0-5.0) =0.40
5 6.0 3. Se compara Q calculado con Q tabulado
para 5 medidas y un nivel de confianza del
90. Qtab=0.64
0.40<0.64, luego el valor 6.0 no es
rechazable
RECHAZO DE DATOS
• Estas técnicas están diseñadas para detectar un único valor atípico en
un grupo de datos, y por lo tanto no son adecuadas para la detección
de múltiples valores atípicos.
• Una técnica rigurosa y amplia para identificar eficazmente múltiples
valores atípicos es el procedimiento para muchos valores atípicos con
generalización extrema de la desviación de Student.
SABEMOS CUANDO UN
RESULTADO ESTA MUY
LEJOS
DE LA MEDIA O DE LOS
OTROS RESULTADOS

Se califican como Datos


discordantes (atípicos) o puntos
exteriores

¿Se deben guardar como parte del análisis o se deben ignorar?


TEST DE DIXON (PRUEBA Q)
Q calculado
D = es la diferencia entre el valor dudoso y su
vecino mas cercano

w= es la diferencia entre el valor máximo y mínimo de los


datos estudiados

Se debe rechazar el resultado.


Criterio Existe un 90 % de seguridad de que
el dato debe ser rechazado

Q calculado > Q tabla (10% de posibilidad de que el rechazo


sea una decisión equivocada)
TABLA DE VALORES CRITIOS PARA Q
EJEMPLO PRUEBA DE DIXON
CONCLUSIONES

• La ASTM E178, Práctica para manejar observaciones de valores


atípicos, contiene muchos procedimientos estadísticos para realizar
pruebas de valores atípicos. En esta norma se proveen otros criterios
para valores atípicos únicos, así como pruebas para valores atípicos
múltiples, y la norma también da pautas para la elección de la prueba.
• Una referencia más amplia para la prueba de valores atípicos es el libro
Valores atípicos en datos estadísticos, publicado por Wiley. Otra
referencia útil y más práctica es el Volumen 16 de la Sociedad
Estadounidense de Calidad (ASQ) "Referencias básicas para el control
de calidad, técnicas estadísticas"
• Cómo detectar y manejar valores atípicos", ASQC Quality Press.
• En la práctica E178 de ASTM se indican otras referencias.

Você também pode gostar