Escolar Documentos
Profissional Documentos
Cultura Documentos
Facultad de Ingeniera
Departamento de Ingeniera en Minas
Fecha: 16/04/2015
RESUMEN EJECUTIVO
El presente informe abarca la base de datos del gasto de combustible que tienen los camiones de la
compaa minera VOLCAN S.A.A que se dirigen a la Planta San Expedito, para esto se realiza un
anlisis estadstico inferencial que permite diagnosticar si los valores obtenidos por VOLCAN S.A.A
tiene una correlacin normal en su distribucin.
Para representar los intervalos de los datos, se ocupan tres mtodos estadsticos: Mtodo grupal,
mtodo raz de n y mtodo de struges.
En el estudio estadstico bsico de los datos registrados, se obtiene el camin que gasto menos
combustible (3 (L/h)), el que ms gasto (16 (L/h)), el promedio de consumo de combustible (10.61
(L/h)) con la respectiva desviacin estndar (2.77 (L/h)).
Al hacer un histograma, con la frecuencia, porcentaje de acumulado y marca de clase, se infiere la
amplitud y cantidad de intervalos que tiene cada mtodo, adems al graficar la distribucin normal
de cada dato en el histograma se observa una curva similar a la campana de Gauss, lo cual es un
indicio de que los datos tengan una distribucin normal.
En la realizacin del test de Chi Cuadrado se desprende lo siguiente para cada mtodo:
En el mtodo grupal, existe evidencia suficiente para indicar que los valores obtenidos no tienen
una correlacin normal en su distribucin con un nivel de confianza de 95% y 7 grados de
libertad, por lo que se recomienda un nivel de confianza del 99%.
En el mtodo Raz de n, existe evidencia para indicar que los valores se ajustan muy bien a una
distribucin normal con un nivel de confianza de 95% y 74 grados de libertad.
En el mtodo de Struges, existe evidencia suficiente para rechazar la hiptesis nula con un nivel
de confianza de 95% y 11 grados de libertad.
ndice
RESUMEN EJECUTIVO .......................................................................................................................... 2
1
INTRODUCCIN ........................................................................................................................... 5
OBJETIVOS ................................................................................................................................... 6
2.1
2.2
Estadstica Descriptiva......................................................................................................... 7
3.1.1
Rango........................................................................................................................... 7
3.1.2
Media .......................................................................................................................... 7
3.1.3
3.1.4
3.1.5
3.2
3.2.1
3.2.2
3.2.3
Criterio Sturges:........................................................................................................... 8
3.3
3.4
3.4.1
4
PROCEDIMIENTOS ..................................................................................................................... 10
4.1
4.2
4.3
4.4
4.5
RESULTADOS ............................................................................................................................. 15
6.2
6.3
6.4
BIBLIOGRAFA ............................................................................................................................ 21
ANEXOS ..................................................................................................................................... 22
9.1
9.2
9.3
INTRODUCCIN
OBJETIVOS
2.1
Objetivo Principal
Realizar un anlisis estadstico inferencial que permita determinar si el conjunto de valores tomados
por VOLCAN S.A.A tiene una correlacin normal en su distribucin.
2.2
Objetivos Secundarios
MARCO TERICO
1 + 2 + 3
Criterio Grupal:
=
3.2.2
10
Criterio Raz de n:
= /
3.2.3
Criterio Sturges:
= /(1 + 3.322 log())
1
2
1 2
(
)
2
La grafica de su funcin de densidad tiene una forma acampanada y simtrica, la cual se conoce
como campana de Gauss.
=
=1
( )2
Donde:
=
n: Tamao de la muestra.
pi: Probabilidad del i-simo valor o intervalo de valores segn la hiptesis nula.
: Frecuencia absoluta esperada.
: Frecuencia absoluta observada o emprica.
Cuanto mayor sea el valor de 2 , mayores son las discrepancias entre la frecuencia observada y
esperada. De la misma forma, cuanto ms se aproxima a cero el valor de 2 , ms ajustadas estn
ambas distribuciones, sea concuerdan exactamente.
Se utiliza el siguiente criterio de decisin para las hiptesis:
PROCEDIMIENTOS
Para los siguientes procedimientos se cuenta con la base de datos de la tasa de combustible de los
camiones con direccin a Planta San Expedito de la compaa minera VOLCAN S.A.A. Para esto en
necesario hacer un filtro en la base de datos, para estudiar solo los valores que son de importancia.
La realizacin del anlisis se hace con el programa Excel de Microsoft Office.
4.1
3. Donde dice Rango de entrada, seleccionar los datos del consumo de combustible.
4. En Rango de Salida, seleccionar el cuadro donde se quiere ver las estadsticas.
5. Seleccionar las opciones de Resumen de estadsticas y Nivel de confianza para la media
95%.
6. Se obtiene una tabla que indica un conjunto de datos estadsticos, se marcan los datos que
interesan para el trabajo (Tabla 4.1).
Columna1
Media
Error tpico
Mediana
Moda
Desviacin estndar
Varianza de la muestra
Curtosis
Coeficiente de asimetra
Rango
Mnimo
Mximo
Suma
Cuenta
Nivel de confianza(95.0%)
10,60590645
0,036174619
11,36
11,78
2,768717493
7,665796557
0,301648007
-0,870359562
13
3
16
62129,4
5858
0,070915604
10
4.2
11
4.3
4.4
Normalizacin de Datos
1. Crear dos celdas, una con el nombre Z1 y la otra a la derecha de esta, con el nombre de
Z2.
2. En la celda Z1 y Z2 se escribe la formula =NORMALIZACION(x;media;desv_estndar), x
corresponde a LI para Z1 y a LS para Z2, los otros valores se obtienen de la Estadstica
descriptiva (Ilustracin 4.4).
12
4.5
13
6. Hacer la suma completa de la columna ((Ej-Oj)^2)/Ej. Esta suma representa el valor de ChiCuadrado observado.
7. En las celdas realizar una tabla con los nombres de: Chi cuadrado observado, Grados de
libertad, Chi Cuadrado 5% y Chi cuadrado 95%.
8. Grado de libertad es el nmero de intervalos menos la cantidad de estimadores (revisar
tem 3.4.1)
9. En Chi cuadrado 5% y Chi cuadrado 95 %, se escribe la funcin
=PRUEBA.CHICUAD(probabilidad; grados_de_libertad), donde la probabilidad es de 0.05 y
0.95 respectivamente.
10. En Grados de significacin ingresar la funcin =INV.CHICUA(probabilidad;
grados_de_libertad) (Ilustracin 4.9) .
Ilustracin 4.9 Determinacin del Chi cuadrado, grados de libertad y nivel de significacin
Luego todos estos pasos se repiten para cada criterio de tabulacin (revisar el tem 3.2), de modo
de que se pueda hacer una comparacin.
14
RESULTADOS
Los datos entregados por la compaa VOLCAN S.A.A contienen informacin sobre todos los
camiones que operan en su faena, sin embargo el estudio se focaliza en los camiones con direccin
a la planta de San Expedito, los cuales poseen una carga de sulfuros.
A partir de la informacin entregada, se obtuvo la siguiente estadstica para los camiones en estudio
(Tabla 5.1):
Estadstica
Media
Error tpico
Mediana
Moda
Desviacin estndar
Varianza de la muestra
Curtosis
Coeficiente de asimetra
Rango
Mnimo
Mximo
Suma
Cuenta
Nivel de confianza (95.0%)
10,61
0,04
11,36
11,78
2,77
7,67
0,30
-0,87
13,00
3,00
16,00
62129,40
5858,00
0,07
A partir de esto se realizar una prueba de bondad de ajuste, el nmero de intervalos obtenidos
para cada mtodo es el siguiente:
-
Aplicando una prueba de bondad de ajuste, para comprobar si es que los datos de consumo de
combustible de los camiones que se dirigen a la planta de San Expedito, se obtuvieron los siguientes
resultados para cada mtodo:
-
Mtodo grupal
Chi cuadrado observado
Grados de libertad
Chi cuadrado 5%
Chi cuadrado 95%
Nivel de confianza requerido
33,6866986
7
2,16734991
14,0671404
1,9712E-05
15
Mtodo raz de n
Chi cuadrado observado
Grados de libertad
Chi cuadrado 5%
Chi cuadrado 95%
Nivel de confianza requerido
46,91
74
55,1892311
95,0814667
0,99414817
Mtodo de struges:
Chi cuadrado observado
Grados de libertad
Chi cuadrado 5%
Chi cuadrado 95%
Nivel de confianza requerido
39,89451046
11
4,574813079
19,67513757
3,73E-05
16
Los datos entregados por la empresa VOLCAN S.A.A corresponden a datos de muchos camiones con
direcciones distintas, sin embargo el anlisis se centra en el consumo de combustible de los
camiones con direccin a la planta de San Expedito
De estos camiones, se descarta la informacin donde la velocidad es negativa o excede los 50 km/h
lo cual se utiliza como velocidad mxima dentro de la mina. Luego de descartar los datos que no
entran en el estudio, se dividen estos en intervalos a partir de tres mtodos los cuales se consideran
ms apropiados para un estudio estadstico.
-
Mtodo grupal
Mtodo raiz de n
Mtodo de struges
De los cuales, el mtodo raz de n es el que genera una mayor cantidad de intervalos de estudio, por
lo tanto permite un estudio acabado de la seleccin de datos considerada.
Utilizando el mtodo raz de n y el mtodo de struges se obtienen intervalos de amplitud 0,169 y
0,962 respectivamente, provocando que el valor superior del ltimo intervalo corresponda a un
valor mayor al consumo de combustible mximo (16 l/h), debido a esto, el valor del lmite superior
del ltimo intervalo se cierra en 16 l/h aunque se pierda la simetra entre estos.
Previo a una prueba de bondad de ajuste, se realiza una normalizacin de los datos para luego
elaborar una curva normal cannica, con la cual se puede tener un indicio de un posible
comportamiento normal de los datos seleccionados. Luego de la confeccin de la curva normal
cannica, se puede observar que el comportamiento de esta se asimila a una distribucin normal
por cualquiera de los mtodos a utilizar, para corroborarlo, es necesario realizar una prueba de
bondad de ajuste con los datos seleccionados. Los valores de los datos normalizados y la curva
normal cannica para estos se encuentra en la seccin de anexos
El anlisis de los resultados obtenidos se realiza por separado para cada caso.
A partir de estos datos se elabora un histograma (presente en los anexos) para ilustrar los resultados
obtenidos.
Luego de una prueba de bondad de ajuste con las siguientes hiptesis:
-
2
Se comprueba que el valor de
pertenece a la regin crtica, es decir, existe evidencia suficiente
para rechazar H0 con un nivel de confianza de 95% y 7 grados de libertad.
Seguido de esto, se busca un valor de confianza para el cual si se distribuyen normalmente los datos
seleccionados, obteniendo un valor igual a 99,99%. Por lo tanto, el estudio de los datos sera
eficiente slo si se aplica un nivel de confianza de 99,99%.
6.3 Mtodo raz de n
Para el caso del mtodo raz de n se trabaja con una cantidad de 77 intervalos donde el ltimo de
estos no tiene igual amplitud que los anteriores ya que ste se cierra con el mayor valor de los datos
correspondiente a 16 l/h, cada intervalo posee su respectiva marca de clase, frecuencia, porcentaje
acumulado y normalizacin de datos. Con los datos mencionados anteriormente se elabora un
histograma (presente en los anexos) para ilustrar los resultados obtenidos.
Luego de una prueba de bondad de ajuste con las siguientes hiptesis:
-
18
2
Se comprueba que el valor de
pertenece a la regin crtica, es decir, existe evidencia suficiente
para rechazar H0 con un nivel de confianza de 95% y 11 grados de libertad.
Seguido de esto, se busca un valor de confianza para el cual si se distribuyen normalmente los datos
seleccionados, obteniendo un valor igual a 99,99%. Por lo tanto, el estudio de los datos sera
eficiente slo si se aplica un nivel de confianza de 99,99%.
19
CONCLUSIONES Y RECOMENDACIONES
En base al estudio estadstico realizado para la compaa VOLCAN S.A.A. se analiz el consumo de
combustible de la flota de camiones que transportan slfuros hacia la planta de San Expedito con
motivo de identificar el comportamiento de los valores de consumo de cada uno de los camiones.
En base a los resultados del anlisis es posible identificar que:
a) Segn el estudio estadstico de los datos el consumo promedio de combustible es de 10,61
l/h con una moda de 11,78 l/h, una mediana de 11,36 l/h y desviacin estndar de 2,77.
Esto nos indica que la mayor concentracin de datos se encuentra entre 10,612,77 l/h.
Sin embargo existen 949 camiones que su consumo de combustible va por debajo de los
7,84 l/h. Se sugiere a la empresa monitorear la condicin mecnica de los camiones e
identificar los factores que interfieren en el consumo de combustible para que la mayor
concentracin de datos sea menor a la actual y as abaratar costos en cuanto a consumo de
combustible.
b) A al estandarizar las mediciones a valores cannicos sobre la distribucin normal y someter
los datos a una prueba de bondad de ajuste Chi cuadrado en base a tres mtodos de
tabulacin distinto llegamos a diferentes conclusiones.
- Mediante una prueba de bondad de ajuste por el mtodo grupal con un 95% de nivel
de confianza los datos recopilados no cumplen con un comportamiento normal, por lo
tanto no pueden ser estudiados como tal. Para lograr trabajar los datos a partir de una
distribucin normal es necesario utilizar 99,99% de nivel de confianza.
- Mediante una prueba de bondad de ajuste por el mtodo raz de n con un 95% de nivel
de confianza los datos recopilados cumplen con un comportamiento normal, el cual es
muy bueno, por lo tanto no se comete ningn error al estudiar los datos en base a una
distribucin normal.
Mediante una prueba de bondad de ajuste por el mtodo de struges ocurra una
situacin similar que al realizar una tabulacin segn el mtodo grupal. Por lo tanto,
trabajar los datos como una distribucin normal no sera factible a menos que se utilice
un 99,99% de nivel de confianza.
20
BIBLIOGRAFA
1. Jay Devore (2008), Probabilidad y Estadstica para Ingeniera y Ciencias, Sptima Edicin.
California Polytechnic State University
2. Test de Chi Cuadrado, visto el 11/04/2015 en:
http://www.ub.edu/aplica_infor/spss/cap5-2.htm
3. Combustible en minera, visto el 11/04/2015 en:
http://www.ingenieros.cl/wp-content/uploads/2013/06/Discurso-Sergio-Jimenez.pdf
4. Distribucin Normal, visto el 12/04/2015 en:
http://www.vitutor.net/1/55.html
5. Prueba de bondad de ajuste, visto el 12/04/2015 en:
http://www.facmed.unam.mx/deptos/salud/censenanza/planunico/spii/antologia2012/3.pdf
21
ANEXOS
Luego de realizar un filtro de los datos de combustible de la minera VOLCAN S.A.A, se obtiene una
tabla con la estadstica descriptiva de los respectivos datos filtrados (Tabla 9.1). De la cual se
desprenden los datos que se necesitan para hacer los clculos correspondientes.
Estadstica
Media
Error tpico
Mediana
Moda
Desviacin estndar
Varianza de la muestra
Curtosis
Coeficiente de asimetra
Rango
Mnimo
Mximo
Suma
Cuenta
Nivel de confianza (95.0%)
10,61
0,04
11,36
11,78
2,77
7,67
0,30
-0,87
13,00
3,00
16,00
62129,40
5858,00
0,07
Las siguientes tablas, resultados y grficos se determinan aplicando las formulas y procedimientos
descritos en el tem 3 y tem 4. A continuacin se anexaran las tablas y grficos segn el criterio
ocupado (grupal, raz de n y struges):
9.1
Tabla que indica el Lmite inferior, lmite superior, marca de clase (x), frecuencia, distribucin
normal y porcentaje acumulado de los datos:
22
Lmite inferior
Lmite
Xi (marca de
(l/h)
superior (l/h)
clase)
3,00
4,30
3,65
4,30
5,60
4,95
5,60
6,90
6,25
6,90
8,20
7,55
8,20
9,50
8,85
9,50
10,80
10,15
10,80
12,10
11,45
12,10
13,40
12,75
13,40
14,70
14,05
14,70
16,00
15,35
Frecuencia
230,00
241,00
281,00
273,00
619,00
682,00
1631,00
1375,00
294,00
232,00
Distribucin
normal
0,01
0,02
0,04
0,08
0,12
0,14
0,14
0,11
0,07
0,03
Clase
3,65
4,95
6,25
7,55
8,85
10,15
11,45
12,75
14,05
15,35
%
acumulado
0,04
0,08
0,13
0,17
0,28
0,40
0,68
0,91
0,96
1,00
Tabla 9.2 Lmite inferior, lmite superior, Marca de clase, frecuencia, distribucin normal y porcentaje acumulado de los
datos registrados en la mina VOLCAN S.S.A
2000
120,00%
100,00%
80,00%
60,00%
40,00%
20,00%
0,00%
1500
1000
500
0
Frecuencia
% acumulado
Normal canonica
Clase
Grfico 9.1: Histograma para el criterio grupal
Bi
4,30
5,60
6,90
8,20
9,50
10,80
12,10
13,40
14,70
16,00
z1
-2,75
-2,28
-1,81
-1,34
-0,87
-0,40
0,07
0,54
1,01
1,48
z2
-2,28
-1,81
-1,34
-0,87
-0,40
0,07
0,54
1,01
1,48
1,95
Area 1
0,30
1,14
3,53
9,04
19,24
34,48
52,79
70,53
84,36
93,04
Area 2
1,14
3,53
9,04
19,24
34,48
52,79
70,53
84,36
93,04
97,43
23
Ej (esperado) Oj (observado)
0,837
3,926
2,392
4,114
5,507
4,797
10,207
4,660
15,235
10,567
18,316
11,642
17,733
27,842
13,828
23,472
8,684
5,019
4,392
3,960
Chi cuadrado observado
(ej-Oj)^2)/Ej
11,402
1,239
0,091
3,014
1,431
2,431
5,763
6,727
1,547
0,042
33,687
33,69
7,00
2,16
14,06
0,00002
0,99998
9.2
Para de Raz de n
Amplitud de intervalo
= 1.698
24
Tabla que indica el Lmite inferior, lmite superior, marca de clase (x), frecuencia, distribucin
normal y porcentaje acumulado de los datos:
Lmite
inferior
(L/h)
Lmite
superior
(L/h)
Xi (marca
de clase)
Frecuencia
3,00
3,17
3,34
3,51
3,68
3,85
.
.
.
14,72
14,89
15,06
15,23
15,40
15,57
15,74
15,91
3,17
3,34
3,51
3,68
3,85
4,02
.
.
.
14,89
15,06
15,23
15,40
15,57
15,74
15,91
16,00
3,08
3,25
3,42
3,59
3,76
3,93
.
.
.
14,80
14,97
15,14
15,31
15,48
15,65
15,82
15,95
35,00
30,00
28,00
30,00
28,00
25,00
.
.
.
30,00
31,00
32,00
32,00
32,00
34,00
31,00
8,00
Distribucin
%
n normal acumulado
0,00
0,00
0,00
0,01
0,01
0,01
.
.
.
0,05
0,04
0,04
0,03
0,03
0,03
0,02
0,02
0,01
0,01
0,02
0,02
0,03
0,03
.
.
.
0,97
0,97
0,98
0,98
0,99
0,99
1,00
1,00
Tabla 9.6 Lmite inferior, lmite superior, Marca de clase, frecuencia, distribucin normal y porcentaje acumulado de los
datos registrados en la mina VOLCAN S.S.A
150,00%
15,82
14,97
14,13
13,28
12,43
11,58
9,88
10,73
9,03
8,18
7,33
6,48
5,63
4,78
3,93
100,00%
3,08
Frecuencia
50,00%
Frecuencia
0,00%
% acumulado
Normal canonica
Clase
Grfico 9.2: histograma criterio raz de n.
25
Bi
z1
z2
Area 1
Area 2
3,00
3,17
3,34
3,51
3,68
.
.
.
15,06
15,23
15,40
15,57
15,74
15,91
3,17
3,34
3,51
3,68
3,85
.
.
.
15,23
15,40
15,57
15,74
15,91
16,00
-2,75
-2,69
-2,62
-2,56
-2,50
.
.
.
1,61
1,67
1,73
1,79
1,85
1,92
-2,69
-2,62
-2,56
-2,50
-2,44
.
.
.
1,67
1,73
1,79
1,85
1,92
1,95
0,30
0,36
0,43
0,52
0,62
.
.
.
94,61
95,25
95,83
96,35
96,81
97,23
0,36
0,43
0,52
0,62
0,73
.
.
.
95,25
95,83
96,35
96,81
97,23
97,43
0,60
0,51
0,48
0,51
0,48
.
.
.
0,55
0,55
0,55
0,58
0,53
0,14
(ejOj)^2)/Ej
4,70
2,68
1,82
1,72
1,14
.
.
.
0,01
0,00
0,00
0,03
0,03
0,02
26
46,91
74,00
55,19
95,08
9.3
Tabla que indica el Lmite inferior, lmite superior, marca de clase (x), frecuencia, distribucin
normal y porcentaje acumulado de los datos:
Lmite
Lmite
Xi (marca Distribucion
%
inferior
superior
Frecuencia
de clase)
n normal
acumulado
(l/h)
(l/h)
3,00
3,96
3,48
0,01
169,00
0,03
3,96
4,92
4,44
0,01
185,00
0,06
4,92
5,89
5,40
0,02
174,00
0,09
5,89
6,85
6,37
0,04
219,00
0,13
6,85
7,81
7,33
0,07
197,00
0,16
7,81
8,77
8,29
0,10
292,00
0,21
8,77
9,73
9,25
0,13
528,00
0,30
9,73
10,69
10,21
0,14
464,00
0,38
10,69
11,66
11,18
0,14
972,00
0,55
11,66
12,62
12,14
0,12
1482,00
0,80
12,62
13,58
13,10
0,10
706,00
0,92
13,58
14,54
14,06
0,07
210,00
0,96
14,54
15,50
15,02
0,04
179,00
0,99
15,50
16,00
15,75
0,03
81,00
1,00
Tabla 9.10: Lmite inferior, lmite superior, Marca de clase, frecuencia, distribucin normal y porcentaje acumulado de los
datos registrados en la mina VOLCAN S.S.A
27
2000,00
1500,00
1000,00
500,00
Frecuencia
Area 1
0,30
0,82
2,01
4,41
8,73
15,62
25,37
37,62
51,27
64,78
76,63
85,86
92,24
96,15
Area 2
0,82
2,01
4,41
8,73
15,62
25,37
37,62
51,27
64,78
76,63
85,86
92,24
96,15
97,43
15,75
15,02
14,06
13,10
12,14
11,18
9,25
10,21
8,29
7,33
6,37
5,40
4,44
3,48
0,00
1,20
1,00
0,80
0,60
0,40
0,20
0,00
% acumulado
normal canonica
Clase
Bi
3,96
4,92
5,89
6,85
7,81
8,77
9,73
10,69
11,66
12,62
13,58
14,54
15,50
16,00
z1
-2,75
-2,40
-2,05
-1,70
-1,36
-1,01
-0,66
-0,32
0,03
0,38
0,73
1,07
1,42
1,77
z2
-2,40
-2,05
-1,70
-1,36
-1,01
-0,66
-0,32
0,03
0,38
0,73
1,07
1,42
1,77
1,95
28
Oj (observado)
2,88
3,16
2,97
3,74
3,36
4,98
9,01
7,92
16,59
25,30
12,05
3,58
3,06
1,38
(ej-Oj)^2)/Ej
10,76
3,28
0,13
0,08
1,81
2,33
0,85
2,41
0,71
15,26
0,86
1,22
0,19
0,01
29