Escolar Documentos
Profissional Documentos
Cultura Documentos
NORMALIDAD Y TRANSFORMACIÓN
DE DATOS
Página 1 de 17
CONTENIDO
1. Distribución normal
2. Estandarización de valores
3. Prueba de normalidad
4. Transformación de datos
Página 2 de 17
LA DISTRIBUCIÓN NORMAL, PRUEBA DE
NORMALIDAD, TRANSFORMACIÓN Y AJUSTE DE DATOS
1. DISTRIBUCIÓN NORMAL
Un proceso opera en condiciones normales, si tiene los materiales dentro de de
especificaciones y del mismo lote, un método consistente, un medio ambiente
adecuado, el operador capacitado, y el equipo ajustado correctamente, si se
toman mediciones en alguna característica del producto, mostrará el siguiente
comportamiento:
Distribuci ón
– La
Página 3 de 17 SIZE
Cuando se incluyen todos los datos de un proceso o población, sus parámetros
se indican con letras griegas, tales como: promedio o media = µ (mu), y
desviación estándar (indicador de la dispersión de los datos) = σ (sigma).
x-3σ
normales.
x-2σ x-σ
-3 -2
Página 4 de 17
-1
C
Cuu
rvaa
rvssNNoormrm aalesscc
le
DDee
ssvvia cc
ia ionn
io ee
s
Noo
N rm
rmaa
le
l
D
Dee
ss
vv
iacc
iaionn
io ee
sse
LIE LSE
Fig. 4 Distribuciones normales con varias medias y
desviaciones estándar
Página 5 de 17
Existe una relación del porcentaje de probabilidad o área bajo la curva normal
a la desviación estándar. En la figura observamos por ejemplo que el área bajo
la curva para ±1σ tiene un porcentaje de 68.26%, ± 2σ = 95.46% y
± 3σ = 99.73% .
68.26%
95.46%
99.73%
Fig. 5 Área bajo la curva de Distribución normal
Página 6 de 17
Página 7 de 17
Ejemplo 1
a) Determinar el área bajo la curva de menos infinito a Z = - 1.
P(Z<= -1) = 0.1587
Página 8 de 17
Página 9 de 17
Ejemplo 2
a) Determinar el área bajo la curva de menos infinito a Z = 1.
P(Z <= 1) = 0.8413
Página 10 de 17
EJERCICIO 1:
¿Qué porcentaje del área bajo la curva normal estándar o probabilidad está
incluido dentro de los siguientes rangos?
a) P(1.2 <= Z <= 2.2) = P(Z <= 2.2) – P(Z <= 1.2) =
b) P(-2.1 <= Z <= -0.4) = P(Z <= - 0.4) – P(Z <= -2.1) =
c) P( -1.3 <= Z <= 2.7) = P(Z <= 2.7) – P(Z <= -1.3) =
d) P( Z >= 2.4) = P(Z <= -2.4) =
e) P( Z<=-2.9) + P(Z>= 3.1) = P(Z <= -2.9) + P(Z <= -3.1) =
f) P(Z>= 1.9) = P(Z <= -1.9) =
X −µ
Z= sí se consideran los datos completos del proceso.
σ
X −X
Z= sí se consideran sólo los datos de una muestra.
s
Página 11 de 17
69.146%. donde la probabilidad de que la calificación sea menor a 500 es P (X
<= 500). Dado que el porcentaje pedido es P( X ≥ 500 ) la solución es 1-
0.69146 =0.3085, por tanto sólo 30.85% de los participantes pasarán la prueba.
Otra forma es tomando la Z como negativa con P(Z <= -0.5) = 0.3085.
4 8 5
3 0 . 8 5 %
Z 0. 5
Fig. 6 Área bajo la curva de Distribución normal
Ejemplo 1.4 Suponga que un proceso tiene una distribución normal dada tiene
una media de 20 y una desviación estándar de 4. Calcule la probabilidad
P (X >=24) = 1 – P(X <= 24) =
Página 12 de 17
EJERCICIO 2:
3. PRUEBA DE NORMALIDAD
Para probar normalidad de datos, se pueden utilizar los métodos de Anderson
Darling o Ryan, y la gráfica de probabilidad normal.
El P value debe ser mayor a 0.05 para que los datos se distribuyan
normalmente
Página 13 de 17
Probability Plot of Datos
Normal
99.9
Mean 269.3
StDev 30.72
99
N 100
RJ 0.994
95 P-Value >0.100
90
80
70
Percent
60
50
40
30
20
10
5
0.1
150 200 250 300 350
Datos
60
50
40
30
20
10
5
0.1
150 200 250 300 350 400
Datos
Página 14 de 17
4. TRANSFORMACIÓN DE DATOS
Si los datos no son normales, se pueden tratar de transformar con alguna
función para normalizarlos utilizando el Método de Box Cox, que encuentra un
exponente lamda al que se deben elevar los datos:
60
50
40
30
20
10
5
0.1
-4 -2 0 2 4 6 8 10
Torcedura
Fig. 10 Gráfica de probabilidad de un proceso no normal
5. OK
Página 15 de 17
Box-Cox Plot of Torcedura
Lower CL Upper CL
Lambda
20
(using 95.0% confidence)
Estimate 0.345504
Lower CL 0.052120
15 Upper CL 0.642093
10
Limit
0
-2 -1 0 1 2 3 4 5
Lambda
Fig. 11 Determinación del exponente Lambda de Box Cox
Aquí indica que para normalizar los datos, se deben elevar a la 0.5 (raíz
cuadrada), al probar la normalidad de los datos transformados se tiene:
60
50
40
30
20
10
5
0.1
0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5
TorceduraTransf
Fig. 12 Gráfica de probabilidad del proceso normalizado
Página 16 de 17
2. Stat > Reliability / Survival > Distribution Analysis (right sensoring) >
Distribution ID Plot
3. Variables Torcedura
4. Seleccionar Use all distributions
5. OK
Los resultados se muestran a continuación, se indica el valor del coeficiente de
correlación, se puede seleccionar la distribución que tenga el mayor, o el
menor valor de Anderson Darling:
Goodness-of-Fit
Anderson-Darling Correlation
Distribution (adj) Coefficient
Weibull 0.379 0.994
Lognormal 1.566 0.978
Exponential 11.735 *
Loglogistic 1.852 0.974
3-Parameter Weibull 0.400 0.997
3-Parameter Lognormal 0.515 0.994
2-Parameter Exponential 7.325 *
3-Parameter Loglogistic 0.944 0.985
Smallest Extreme Value 7.609 0.909
Normal 1.170 0.978
Logistic 1.330 0.973
Percent
10 50 *
Loglogistic
1 10 0.974
1
0.1 0.1
0.1 1.0 10.0 0.1 1.0 10.0
Torcedura Torcedura
Exponential Loglogistic
99.9 99.9
90
99
50
90
Percent
Percent
10 50
10
1
1
0.1 0.1
0.001 0.010 0.100 1.000 10.000 0.1 1.0 10.0 100.0
Torcedura Torcedura
Fig. 13 Gráficas de varias distribuciones de probabilidad
Página 17 de 17