Escolar Documentos
Profissional Documentos
Cultura Documentos
JORGE BASADRE
GROHMANN
CURSO :
ANÁLISIS ESTADÍSTICO DE DATOS MINEROS
TEMA :
INFORME DE PRÁCTICA N°01
PROFESOR :
ING. SALOMÓN ORTIZ QUINTANILLA
ALUMNO :
JESUS ELIAS ARCAYA ESCOBAR
CÓDIGO :
2010-34532
TACNA-PERÚ
2015
INTRODUCCIÓN
La estadística es una forma de Recopilar, Clasificar, Describir los datos que uno va a estudiar
para hacer un análisis estadístico descriptivo donde nos va informar como van los datos
productivos, ya sea de una empresa como en algunas encuestas y finalmente estos datos son
representados gráficamente, gracias a la Representación de la grafica uno puede realizar una
serie de preguntas necesarias en estadística y resolverlas.
Existen pocas áreas donde el impacto del desarrollo reciente de la estadística se haya hecho
sentir más que en la ingeniería y en la administración industrial. En realidad, sería difícil
exagerar sus aportaciones a los problemas de producción, al uso eficiente de materiales y
fuerzas de trabajo, a la investigación básica y al desarrollo de nuevos productos. Al igual que
en las otras ciencias, también la estadística se ha convertido en una herramienta vital para
los ingenieros; en realidad, el conocimiento de la estadística se ha convertido en una
verdadera necesidad pues sin ella no pueden apreciar, entender o aplicar gran parte del
trabajo realizado en su campo.
La explotación minera es un proceso continuo, donde el control tanto de las reservas como
de los productos es sumamente importante para la continuidad del negocio minero. Es por
ello, que la optimización del proceso requiere un buen punto de partida en el sistema, el cual
obviamente consiste en contar con una buena estimación de las calidades de la mena
presente en el yacimiento.
1) DATOS Y VARIABLES
Cuando se consideran los métodos de organización, reducción y análisis de datos estadísticos, se hace
necesario aclarar los siguientes conceptos.
Datos: son medidas o valores de las características susceptibles de observar y contar, se originan por
la observación de una o más variables de un grupo de elementos o unidades
Variables: es toda característica que varía de un elemento a otro de la población. Dos grandes clases:
Variables Cuantitativas: son las que se describen por medio de números, como por ejemplo el peso,
Altura, Edad, Número de Suspensos…
Cuantitativas discretas. Aquellas a las que se les puede asociar un número entero, es decir,
aquellas que por su naturaleza no admiten un fraccionamiento de la unidad, por ejemplo
número de hermanos, páginas de un libro, etc.
Cuantitativas continuas: Aquellas que no se pueden expresar mediante un número entero,
es decir, aquellas que por su naturaleza admiten que entre dos valores cualesquiera la variable
pueda tomar cualquier valor intermedio, por ejemplo peso, tiempo. etc.
No obstante en muchos casos el tratamiento estadístico hace que a variables discretas las trabajemos
como si fuesen continuas y viceversa.
Variables Cualitativas: son aquellos caracteres que para su definición precisan de palabras, es decir,
no le podemos asignar un número. Por ejemplo Sexo Profesión, Estado Civil, etc.
Ordenables: Aquellas que sugieren una ordenación, por ejemplo la graduación militar, El nivel
de estudios, etc.
No ordenables: Aquellas que sólo admiten una mera ordenación alfabética, pero no establece
orden por su naturaleza, por ejemplo el color de pelo, sexo, estado civil, etc.
2) POBLACION Y ELEMENTO:
Es obvio que todo estudio estadístico ha de estar referido a un conjunto o colección de personas o
cosas. Este conjunto de personas o cosas es lo que denominaremos población. Las personas o cosas
que forman parte de la población se denominan elementos. En sentido estadístico un elemento puede
ser algo con existencia real, como un automóvil o una casa, o algo más abstracto como la temperatura,
un voto, o un intervalo de tiempo.
A su vez, cada elemento de la población tiene una serie de características que pueden ser objeto del
estudio estadístico. Luego por tanto de cada elemento de la población podremos estudiar uno o más
aspectos cualidades o caracteres
Población finita: cuando el número de elementos que la forman es finito, por ejemplo el
número de alumnos de un centro de enseñanza, o grupo clase.
Población infinita: cuando el número de elementos que la forman es infinito, o tan grande que
pudiesen considerarse infinitos.. Como por ejemplo si se realizase un estudio sobre los
productos que hay en el mercado. Hay tantos y de tantas calidades que esta población podría
considerarse infinita.
3) DEFINICIONES:
Clases o intervalos de clase: Grupo de valores que describen una característica. Deben incluir todas
las observaciones y ser excluyentes. Los intervalos contienen los límites de clase que son los puntos
extremos del intervalo. Se denominan intervalos cerrados, cuando contienen ambos límites e intervalos
abiertos si incluyen solo un límite.
Anchura o tamaño del intervalo: es la diferencia entre los límites reales de una clase
Número de clases: es el número total de grupos en que se clasifica la información, se recomienda que
no sea menor que 5 ni mayor que 15
Marca de Clase: Es el punto medio del intervalo de clase, se recomienda observar que los puntos
medios coincidan con los datos observados para minimizar el error.
Los gráficos son útiles porque ponen en relieve y aclaran las tendencias que no se captan fácilmente
en la tabla, ayudan a estimar valores con una simple ojeada y brinda una verificación gráfica de la
veracidad de las soluciones.
Histograma:
Está formado por rectángulos cuya base es la amplitud del intervalo y tiene la característica que la
superficie que corresponde a las barras es representativa de la cantidad de casos o frecuencia de cada
tramo de valores, puede construirse con clases que tienen el mismo tamaño o diferente (intervalo
variable). La utilización de los intervalos de amplitud variable se recomienda cuando en alguno de los
intervalos, de amplitud constante, se presente la frecuencia cero o la frecuencia de alguno o algunos
de los intervalos sean mucho mayor que la de los demás, logrando así que las observaciones se hallen
mejor repartidas dentro del intervalo.
Frecuencia relativa: La frecuencia absoluta, es una medida que está influida por el tamaño de la
muestra, al aumentar el tamaño de la muestra aumentará también el tamaño de la frecuencia absoluta.
Esto hace que no sea una medida útil para poder comparar. Para esto es necesario introducir el
concepto de frecuencia relativa, que es el cociente entre la frecuencia absoluta y el tamaño de la
muestra.
La denotaremos por fi
Porcentaje: La frecuencia relativa es un tanto por uno, sin embargo, hoy día es bastante frecuente
hablar siempre en términos de tantos por ciento o porcentajes, por lo que esta medida resulta de
multiplicar la frecuencia relativa por 100. La denotaremos por pi.
Frecuencia Absoluta Acumulada: Para poder calcular este tipo de frecuencias hay que tener en
cuenta que la variable estadística ha de ser cuantitativa o cualitativa ordenable. En otro caso no tiene
mucho sentido el cálculo de esta frecuencia. La frecuencia absoluta acumulada de un valor de la
variable, es el número de veces que ha aparecido en la muestra un valor menor o igual que el de la
variable y lo representaremos por Ni.
Frecuencia Relativa Acumulada: Al igual que en el caso anterior la frecuencia relativa acumulada es
la frecuencia absoluta acumulada dividido por el tamaño de la muestra, y la denotaremos por Fi
Veamos esto con un ejemplo: Tomamos para ello los datos relativos a las personas activas.
Personas Activas Número Familias
Xi ni Fi pi Ni Fi Pi
Total 50
4) MEDIDAS ESTADISTICAS:
Las medidas estadísticas pretenden "resumir" la información de la "muestra" para poder tener así un
mejor conocimiento de la población. Se clasifican en:
Tipo de medidas:
a) MEDIA:
Media aritmética: La media aritmética de una variable se define como la suma ponderada de los
valores de la variable por sus frecuencias relativas y lo denotaremos por y se calcula mediante la
expresión:
Propiedades:
1. Si multiplicamos o dividimos todas las observaciones por un mismo número, la media queda
multiplicada o dividida por dicho numero.
2. Si le sumamos a todas las observaciones un mismo número, la media aumentará en dicha
cantidad.
3. Además de la media aritmética existen otros conceptos de media, como son la media
geométrica y la media armónica.
b) MEDIANA:
La mediana es el valor central de la variable, es decir, supuesta la muestra ordenada en orden creciente
o decreciente, el valor que divide en dos partes la muestra. Para calcular la mediana debemos tener en
cuenta si la variable es discreta o continua.
Si N es Par, hay dos términos centrales, la mediana será la media de esos dos valores
c) MODA:
La moda es el valor de la variable que tenga mayor frecuencia absoluta, la que más se repite, es la
única medida de centralización que tiene sentido estudiar en una variable cualitativa, pues no precisa
la realización de ningún cálculo.
Por su propia definición, la moda no es única, pues puede haber dos o más valores de la variable que
tengan la misma frecuencia siendo esta máxima. En cuyo caso tendremos una distribución bimodal o
polimodal según el caso.
Por lo tanto el cálculo de la moda en distribuciones discretas o cualitativas no precisa de una explicación
mayor; sin embargo, debemos detenernos un poco en el cálculo de la moda para distribuciones
cuantitativas continuas.
Apoyándonos en el gráfico podemos llegar a la determinación de la expresión para la Moda que es:
Otros autores dan una expresión aproximada para la moda que viene dada por la siguiente expresión:
4.2) MEDIDAS DE DISPERSIÓN:
a) Rango: Es la primera medida que vamos a estudiar, se define como la diferencia existente entre el
valor mayor y el menor de la distribución. Lo notaremos como R. Realmente no es una medida muy
significativa e la mayoría de los casos, pero indudablemente es muy fácil de calcular.
Hemos estudiado varias medidas de centralización, por lo que podemos hablar de desviación con
respecto a cualquiera de ellas, sin embargo, la más utilizada es con respecto a la media.
No es una medida, son muchas medidas, pues cada valor de la variable lleva asociada su
correspondiente desviación, por lo que precisaremos una medida que resuma dicha información.
La primera solución puede ser calcular la media de todas las desviaciones, es decir, si consideramos
como muestra la de todas las desviaciones y calculamos su media. Pero esta solución es mala pues
como veremos siempre va a ser 0.
Luego por lo tanto esta primera idea no es válida, pues las desviaciones positivas se contrarrestan con
las negativas.
*Desviación media: Es la media de los valores absolutos de las desviaciones, y la denotaremos por
dm.
por .
Aunque también es posible calcularlo como:
Desviación típica:
Este estadístico se mide en la misma unidad que la variable por lo que se puede interpretar mejor.
Otros dos estadísticos importantes son la cuasivarianza y la cuasidesviación típica, que como veremos
cuando estudiemos el tema de estimación estadística, son los estimadores de la varianza y desviación
típica poblacionales respectivamente.
Cuasivarianza:
Es una medida de dispersión, cuya única diferencia con la varianza es que dividimos por N-1, la
Cuasidesviación típica:
Coeficiente de Variación:
Es un estadístico de dispersión que tiene la ventaja de que no lleva asociada ninguna unidad, por lo
que nos permitirá decir entre dos muestras, cual es la que presenta mayor dispersión. La denotaremos
por C.V.
Las medidas de localización dividen la distribución en partes iguales, sirven para clasificar a un individuo
o elemento dentro de una determinada población o muestra. Así en psicología los resultados de los test
o pruebas que realizan a un determinado individuo, sirve para clasificar a dicho sujeto en una
determinada categoría en función de la 53-1-u-puntuacióMn obtenida.
Cuartiles: Medida de localización que divide la población o muestra en cuatro partes iguales.
Al igual que ocurre con el cálculo de la mediana, el cálculo de estos estadísticos, depende del tipo de
variable.
Deciles: Medida de localización que divide la población o muestra en 10 partes iguales. No tiene mucho
sentido calcularlas para variables cualitativas discretas. Por lo que lo vamos a ver sólo para las variables
continuas.
dk = Decil k-simo es aquel valor de la variable que deja a su izquierda el k·10 % de la distribución.
k = 1 .. 9
Percentiles: Medida de localización que divide la población o muestra en 100 partes iguales. No tiene
mucho sentido calcularlas para variables cualitativas discretas. Por lo que lo vamos a ver sólo para las
variables continuas.
k=1 .. 99
EJEMPLO:
Como se puede observar la forma de calcular estas medidas es muy similar a la del cálculo de la
mediana. Veamos el cálculo de algunas de estas medidas en el ejemplo que estamos estudiando.
Vamos a calcular Q1,Q3, d3, y p45
Li-1 Li ni Ni
45 55 6 6
55 65 10 16
65 75 19 35
75 85 11 46
85 95 4 50
Cálculo de Q1: Buscamos en la columna de las frecuencias Acumuladas el valor que supere al 25% de
N=50, corresponde al 2º intervalo.(50/4=12.5)
A) Asimetría: Hemos comentado que el concepto de asimetría se refiere a si la curva que forman los
valores de la serie presenta la misma forma a izquierda y derecha de un valor central (media
aritemética)
Para medir el nivel de asimetría se utiliza el llamado Coeficiente de Asimetría de Fisher, que viene
definido:
g1 > 0 (distribución asimétrica positiva; existe mayor concentración de valores a la derecha de la media
que a su izquierda)
Luego:
(1/30) * 0,000110
g1 = ------------------------------------------------- = -0,1586
(1/30) * (0,030467)^(3/2)
Por lo tanto el Coeficiente de Fisher de Simetría de esta muestra es -0,1586, lo que quiere decir que
presenta una distribución asimétrica negativa (se concentran más valores a la izquierda de la media
que a su derecha).
5) Medidas de forma: Coeficiente de Curtosis
Curtosis: El Coeficiente de Curtosis analiza el grado de concentración que presentan los valores
alrededor de la zona central de la distribución. Se definen 3 tipos de distribuciones según su grado de
curtosis:
g2 = 0 (distribución mesocúrtica).
3. TABLA DE
FRECUENCIAS
CLA INTER MARCA
SE VALOS CLASE fi Fi hi Hi FRP FRAP (X-Xmed)2
Lim. Lim.
Inf. Sup. X fi/n Fi/n
1 0.11 0.38 0.244285714 8 8 0.12307692 0.12307692 12.3076923 12.30769231 7.36026656
2 0.38 0.65 0.512857143 6 14 0.09230769 0.21538462 9.23076923 21.53846154 2.86167164
3 0.65 0.92 0.781428571 34 48 0.52307692 0.73846154 52.3076923 73.84615385 6.05602732
4 0.92 1.18 1.05 29 77 0.44615385 1.18461538 44.6153846 118.4615385 0.68303274
5 1.18 1.45 1.318571429 22 99 0.33846154 1.52307692 33.8461538 152.3076923 0.29146656
6 1.45 1.72 1.587142857 21 120 0.32307692 1.84615385 32.3076923 184.6153846 3.09131195
7 1.72 1.99 1.855714286 18 138 0.27692308 2.12307692 27.6923077 212.3076923 7.65762132
8 1.99 2.26 2.124285714 9 147 0.13846154 2.26153846 13.8461538 226.1538462 28.0013981
4.MEDIDAS DE
CENTRALIZACION
MEDIA 1.056415385
MEDIANA 1.23
MODA 1.23
cuartiles:
1
(n) − (Ni − 1)
𝑄 = Li + Wi (4 )
fi
Mediana:
n
− (Nm − 1)
𝑋𝑚 = Lm + Wm (2 )
nm
Percentil:
1
(n) − (Ni − 1)
𝑃 = Li + Wi (100 )
fi
Deciles:
1
(n) − (Ni − 1)
𝐷 = Li + Wi ( 10 )
fi
Moda:
A1
𝑀𝑜 = Li + Wi ( )
A1 + A2
A1=ni-(ni-1)
A2 = ni-(ni+1)
5. medidas de dispersion
VARIANZA 0.259287132
DESV. ESTANDAR 0.509202447
CV 0.482009686
Error estandar de la
media 0.063159
PARA DATOS AGRUPADOS
VARIANZA 0.4375218
DESV. ESTANDAR 0.6614543
CV 0.5496229
6. medidas de posicion
1° Cuartil 0.835
2° Cuartil 1.14
3° Cuartil 1.58
Para datos agrupados
1° Cuartil 0.859286
2° Cuartil 1.586667
3° Cuartil 1.114496
7. Medidas de forma
Coeficiente de
asimetria 0.5626031
Curtosis 0.2621078
DIAGRAMA DE FRECUENCIAS
40
30
20
FI
10
0
Ley de Cu
X
FRECUENCIAS ACUMULADAS ABSOLUTAS
160
140
120
100
80
fi
60
40
20 Ley de Cu
0
CONCLUSIONES
La estadística es método práctico para realizar y evaluar datos de gran
información ya que con ello podemos analizar fácil el proceso productivo de un
trabajo como en mina.
Pero también es importante conocer si los valores en general están cerca o alejados
de estos valores centrales, es por lo que surge la necesidad de estudiar medidas de
dispersión.
BIBLIOGRAFIA
- Estadística Aplicada
- Estadística de centralización
- Estadística descriptiva