Você está na página 1de 74

TEXTO UNIVERSITARIO F.I.M.

-UNA Estadística aplicado a la minería

ESTADISTICA APLICADO A LA MINERIA

CAPITULO I

ESTADISTICA

1.1. LA ESTADISTICA Y LAS ETAPAS DEL METODO ESTADISTICO

Definición.- La estadística es la ciencia que nos proporciona un conjunto de métodos y


procedimientos por recolección y clasificación (organización), análisis e interpretación de
datos en forma adecuada para tomar decisiones cuando prevalecen condiciones de
incertidumbre.

1.2. RAMAS DE LA ESTADISTICA

ESTADISTICA DESCRIPTIVA.- Se encarga de la recolección, clasificación,


presentación, descripción y simplificación de los datos; “descriptivo”, analizar y describir
datos.
Tablas
Recolección Crítica de los Presentación Análisis
de datos datos de los datos Gráfica descriptivo

ESTADISTICA INFERENCIAL.- Es la que proporciona una teoría necesaria para inferir


ó estimar las leyes de una población partiendo de resultados o conclusiones del análisis de
una muestra.

1.3. LA POBLACION Y LA MUESTRA

POBLACION
Se entiende por población o universo la totalidad de individuos ó elementos que pueden
presentar determinadas características susceptibles de ser estudiada.
Ejm: a) Población de ventas anuales de explosivos de FAMESA, SEMEXA, EXSA, etc.
b) Población de puntajes de rendimiento en exámenes de alumnos del 3er. nivel de
estudios de la FIM en la UNA – Puno.
La población puede ser finita o infinita:
Población finita.- Es aquella que tiene un número determinado de elementos.
Población Infinita.- Es aquella que tiene un número infinito de elementos.

MUESTRA
Al conjunto de medidas de conteos obtenidos de alguna población con el propósito de
obtener información acerca de ella. Se suelen tomar muestras cuando es difícil o costoso la
observación de todos los elementos de la población estadística.

DATOS ESTADISTICO- Son números o medidas que han sido recopilados como
resultado de las observaciones, pudiendo ser comparados, analizados e interpretados.

1.4. VARIABLES ESTADISTICAS


Definición.- Una variable estadística es una característica de la población que interesa al
investigador y que puede tomar diferentes valores se denotan con x, y, z, etc.

1
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

Variable Aleatoria.- Sí los valores numéricos provienen de factores fortuitos y sí un valor


no es predicible exactamente con anticipación.

1.4.1 Clasificación de variables

I. Variable Cualitativa.
Cuyos valores consisten en categoría de clasificación. Ejm: La variable “Estado
Civil” adopta las modalidades: soltero, casado, divorciado, viudo, etc.
Esta variable puede clasificarse en: Nominal y Ordinal.

Variable Cualitativa Nominal.- Son cuando se definen categorías y se cuenta el


número de observaciones de cada categoría.
Ejm: a) “Orientación en el tiempo” con las posibles modalidades: presente,
pasado y futuro.
b) "Color de ojos" con las posibles modalidades: castaño, azul, verde, etc.
c) "Partidos políticos" con las posibles modalidades: conservador, liberal,
independiente y socialista.

Variable Cualitativa Ordinal.- Si el investigador va más allá del nivel de


clasificación y busca ordenar sus casos en términos del grado que poseen una
determinada característica.
Ejm: a) "Clase Social" (bajo, medio, alto) es una variable cualitativa ordinal.
b) La variable cualitativa "Estudio" (1er. Nivel; 2do. Nivel; etc.) es variable
cualitativa ordinal.
c) “Educación” (Inicial, Primaria, Secundaria, Superior, etc.).

II. Variable Cuantitativa.


Son aquellas variables que se obtienen como resultado de mediciones o conteos.
Ejm: El peso de personas, Temperatura, la presión sanguínea, el Nº de estudiantes
del 3er. Nivel.
Las variables cuantitativas se clasifican en: Discretas y Continuas.

Variable Discreta.- Toman valores numéricos aislados y no toma ningún valor


entre dos consecutivos fijados.
Ejm: a) Número de monedas de Juán Pérez en el bolsillo.
b) Número de accidentes mineros en el Dpto. de Puno en el mes de julio.

Variable Contínua.- Son aquellos de infinitos valores entre dos números.


Ejm: a) Estatura de los estudiantes de la UNA – Puno.
b) Peso de los estudiantes de la UNA – Puno.

1.5. PARAMETRO Y ESTADIGRAFO

Parámetro.- Es una medida usada para describir una característica de una población,
utilizando la información de la población conjunta, decisión certezas.
Las más usadas:
i) Media población (μ)
ii) Varianza poblacional (σ2)
iii) Proporción poblacional (p).

2
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

Estadígrafo.- Es una medida para describir alguna característica de la muestra y la toma


de decisiones contiene un grado de incertidumbre.
Las más usadas son:
i) Media muestral  X 
ii) Varianza muestral (S2)
iii) Proporción muestral  p̂ 

1.6. ETAPAS DEL METODO ESTADISTICO


Los métodos estadísticos se dividen en 4 etapas:
1. Planificación del estudio
2. Recolección de la información
3. Organización y clasificación de los datos recogidos.
4. Análisis e interpretación de los resultados.

1.6.1. La etapa de la planificación


Tiene por finalidad estudiar los detalles concernientes a la recolección, clasificación y
análisis de la información, en base a los cual se descubrirán las características de una
determinada población o se confirmara ó negará la determinada hipótesis de trabajo.

Esquematización de la planificación: (5 pasos)

Primer Paso.- PLANTEAMIENTO DEL PROBLEMA


a) Definir la naturaleza e importancia del problema que se estudia.
b) Determinación del objetivo final y de los objetivos inmediatos de la investigación

Naturaleza e importancia del problema


Explicar ¿Qué vamos a estudiar?
Explicar ¿Por qué se va a estudiar?

Determinación de objetivos; Determinar objetivo, el final es:


Explicar la posibilidad de aplicación práctica de la investigación
Explicar ¿para que se realiza?
Explicar ¿como se va a hacer? la investigación.

Segundo Paso.- BUSQUEDA Y EVALUACION DE LA INFORMACIÓN EXISTENTE


La evaluación tiene dos partes:
a) La evaluación de trabajos individuales.- Como fueron recogidos los datos,
procedimientos y métodos empleados en su recolección.
b) Evaluación conjunta del material estudiado.- Conclusiones correctas.
Implica analizar en su conjunto si son consistes entre sí o contradictorias.

Tercer Paso.- FORMULACION DE HIPOTESIS


Se trata de probar una hipótesis de trabajo “La hipótesis es simplemente una afirmación
que esta sujeta a la verificación”.

Cuarto Paso.- LA VERIFICACION DE LA HIPOTESIS


a) Diseño de la investigación.- se debe de estudiar sus diferentes etapas, es decir todos
los detalles relacionados con la recolección, organización y análisis de los datos.

3
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

Hacer un balance de recurso disponibles y los necesarios para la investigación.


Es importante:
1. Definir la unidad observada (totalidad de individuos, características estudiadas).
2. Definir lo que se va observar, todos los individuos uniformemente.

b) Ejecución de la investigación.- Redacción, clasificación y análisis de la información


recogida, de acuerdo a lo planificado.

Quinto Paso.- ANALISIS Y PRESENTACION DE RESULTADOS.


Ejecutando el estudio, se considerará la conformidad a lo planificado y con los resultados
se concluirá la hipótesis si es verificada o nó.

1.6.2 Principales métodos de recolección.

a) Métodos de Encuestas y Experimentos.- (Tipo de información recogido


ocasionalmente) La diferencia entre encuesta y experiencia esta en la naturaleza de
los datos recogidos, en la encuesta, los datos ya existen y solo es necesario
recogerlos. En el experimento los que no existen y es necesario provocar su
aparición.

b) Método Censal.- (Tipo de información recogida periódicamente) La finalidad de


conocer las características demográficas, económicas y sociales de la población.

c) Método de Registros.- (Tipo de información recogida continuamente a medida


que se produce) Son datos dinámicos que se conocen cambios que acontecen en ella
(registros).

CONDICIONES DE UNA BUENA MUESTRA.

La muestra debe ser adecuada en cantidad y calidad.


a) Una muestra es buena en cantidad cuando incluye un número óptimo de individuos
dependiendo de dos factores a saber.
i) La frecuencia con la cual el fenómeno que se estudia se encuentra en la visión.
ii) La variabilidad de la población que se estudia.

b) Una muestra es buena en calidad cuando refleja fielmente las características de la


población del cual procede y difiere de él.

ETAPAS DEL MUESTREO

1. Definir explícitamente los objetivos, quede bien definida la unidad de análisis.


2. Definir claramente la población a ser muestreada.
3. Escoger las variables que deben ser observadas en cada unidad del análisis.
4. Especificar el grado de precisión deseada.
5. Selección de los instrumentos de medida.
6. Selección del marco muestral.
7. Ejecución de la prueba piloto o pre-test.
8. Selección de la muestra.

4
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

TIPOS DE MUESTRAS

A) MUESTRAS DE CONVENIENCIA O DE JUICIO.- En los cuales los individuos se


escogen en base a la opinión personal.
Una muestra de opinión es llamada muestra no probabilística, puesto que esta basado en
los puntos de vista subjetivos de una persona y la teoría de la probabilidad no es usual para
medir el error del muestreo.
Ejm: Querer averiguar el % de alumnos del sexo femenino y masculino de la UNA, en vez
de obtener una muestra de las facultades, podríamos limitarnos al estudio de un grupo de
alumnos de alguna facultad representativa. Sin embargo la validez del resultado, dependerá
del acierto que hayamos tenido al seleccionar como típica dicha facultad.

FORMAS DE MUESTREO POR CONVENIENCIA


a) Por voluntarios, en ensayos clínicos para probar nuevos medicamentos
b) Intencional, son escogidos por el investigador.
c) Por acceso más fácil, las unidades son escogidas por estar en mejores
condiciones de accesibilidad.

B) MUESTRAS PROBABILISTICAS.- Son aquellas en que cada individuo de la


población tiene una probabilidad perfectamente conocida de ser incluida en la muestra. La
muestra probabilística requiere dos condiciones fundamentales.

Primero. La probabilidad de elegir que cada individuo sea perfectamente conocida, si no lo


es, no será posible calcular errores al hacerse elección.

Segundo. Se elige al azar, sin permitir la intervención de ningún factor que favorezca la
elección de unos en detrimento de los otros.

TIPOS DE MUESTRAS PROBABILISTICAS. Los más utilizados:


1. Muestreo aleatorio simple.
2. Muestreo aleatorio sistemático
3. Muestreo aleatorio estratificado
4. Muestreo de conglomerados
5. Muestreo por procedimientos combinados.

1. Muestreo aleatorio simple


Es aquella en que cada elemento de la población tiene igual probabilidad de ser incluida en
la muestra, un procedimiento practico si la población no es grande y relativamente fácil y
barato encontrar las unidades de muestreo.

2. Muestreo aleatorio sistemático


Es una primera modificación del muestreo aleatorio simple en la que la elección es
sistemática.
N
I  ; Donde:
n
I = Intervalo de selección
N = Tamaño de la población muestreada
n = Tamaño de la muestra

5
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

3. Muestreo aleatorio estratificado


El proceso de estratificación consiste en dividir la población en Sub-grupos ó estratos
(homogéneos) tal que cada subgrupo se selecciona una muestra aleatoria de tamaño ni;
i = 1, 2, …, k por el método de muestreo aleatorio simple o sistemático de modo que:

n1  n2  ...  nk  n

Las razones para utilizar la estratificación es controlar la representatividad de la muestra y


permitir la aplicación de procedimientos de selección diferentes en los diferentes estratos.

4. Muestreo de conglomerado
Consiste en dividir la población en subgrupos heterogéneos representativos de la población
global cada conglomerado debe ser encarado como una mini-población.
En el muestreo por conglomerados es eficiente tener:
a. Diferencia en las unidades elementales del mismo grupo lo más grande
posible.
b. Diferencia entre grupos lo mas pequeño posible.

5. Muestreo por procedimiento combinado


Como las muestras por conglomerado evitan la necesidad de tener una lista detallada de la
totalidad de la población que se estudia y evita la dispersión de la muestra, se entiende que
una combinación de los dos sistemas eliminan los tres grandes inconvenientes de muestreo
aleatorio simple.

Ejm: Con el fin de diferenciar ventajas y desventajas de estos procedimientos (anteriores)


consideramos: supongamos que en las cuatro regiones del país (norte, centro, sur y oriente)
hay 100 escuelas de post grado con 50 alumnos en cada escuela con el fin de estudiar
determinada característica, resolvemos extraer una muestra de 2000 alumnos.

Hay un total de 400 escuelas con 20,000 alumnos y la elección de los 2,000 a ser
estudiados podrá hacerse por cualquiera de los procedimientos anteriores.

Para el caso “Muestreo por procedimiento combinado”; una muestra estratificada por
conglomerados se obtendría escogiendo separadamente 10 colegios de cada una de las
cuatro regiones (4 x 10 x 50 = 2,000).

Para elegir los 2,000 alumnos, cualesquiera de las siguientes combinaciones serán
posibles:

Tipo de Numero de Alumnos estudiados Total de alumnos


combinación Colegios por colegio estudiados.
A 400 5 2,000
B 200 10 2,000
C 100 20 2,000
D 50 40 2,000
E 40 50 2,000

6
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

ANALISIS DE LOS RESULTADOS

El paso siguiente es la generalización de los resultados a la población de la cual procede.


Dicha generalización generación exige dos requisitos:
a) Estimar los parámetros de la población
b) Juzgar sobre la precisión de tales estimaciones.

1.6.3 Etapa de organización de la información

En esta etapa se considera 3 pasos siguientes:


1. Revisión y corrección de la información recogida
2. Presentación de la información mediante cuadros
3. Presentación de la información mediante gráficos.

RANGO O AMPLITUD DE LOS DATOS (R): Llamado también “recorrido de los


datos”.
Rango: R = máx - min

(Ejm. 01 pág. 9): R = 76 – 60 = 16

FRECUENCIA ABSOLUTA DE UN DATO: (fi).- Número de veces que aparece repetido


dicho valor en las observaciones.

(Ejm. 01 pág. 9): frecuencia absoluta de 68 es 5

FRECUENCIA ABSOLUTA ACUMULADA DE UN DATO: (Fi)- Suma de valores


inferiores o iguales a dicho valor.

(Ejm. 01 pág. 9): frecuencia absoluta acumulada de 68 es 13.

FRECUENCIA RELATIVA DE UN DATO: (hi)


f
hi  i ; n = número de observaciones
n
5
(Ejm. 01 pág. 9): Frecuencia relativa de 68 es  0.25
20

FRECUENCIA RELATIVA ACUMULADA DE UN DATO: (Hi)


i
F
Hi  i  f
I I
j

n
n

7
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

13
(Ejm. 01 pág. 9): Frecuencia relativa acumulada de 68 es:  0.65
20
PROPIEDADES DE LAS FRECUENCIAS

Sea “X” con valores X1, …, Xk :


k
1) f1  f 2  ...  f k = f i 1
i n (Suma se frecuencia absoluta de datos).

k
2) h1  h2  ...  hk = h i 1
i 1 (Suma de frecuencia relativa de datos).

3) Fk = n (Frecuencia absoluta acumulada de datos).

4) Hk = 1 (Frecuencia relativa acumulada de datos).


5) 0  hi  1, i  1, 2,....., k
6) 0  fi  n, i  1, 2,...., k (Frecuencia absoluta ).
7) Fi  Fi 1  fi , donde f1  Fi  Fi 1 (Frecuencia absoluta acumulada)
8) (%) Xi = hi x100 (% de elementos del valor observado).

8
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

DISTRIBUCION DE FRECUENCIAS O TABLAS DE FRECUENCIA DE UNA


VARIABLE DISCRETA
Una distribución de frecuencias es un arreglo de valores observados X 1, …, Xk de la
variable X con sus respectivas frecuencias, en una tabla de la forma:
Frecuencia Frecuencia Frec. Relativa
Valor Frecuencia
Conteo Acumulada Relativa Acumulada
Xi fi Fi hi Hi
X1 f1 F1 h1 H1
X2 f2 F2 h2 H2
. . . . .
. . . . .
. . . . .
XK Fk = n hK Hk = 1
fK
k k
Total f
i 1
i n h 1
i 1
i

Ejm. 01: Sea las alturas de los taladros (Cm.) en una obra de drenaje (cuneta) de mina:
64 73 68 68 76 70 62 67 71 69
68 60 65 68 66 68 67 71 66 72
Solución: n = 20 datos. Orden ascendentemente: 60 62 64 65 66 66 67 67 68 68
68 68 68 69 70 71 71 72 73 76
Rango de datos: R = 76 - 60 = 16
FRECUENCIA Y PORCENTAJE DE TALADROS: CUNETA SEGÚN SUS ALTURAS
Frecuenci Frecuenci
taladros (Cm). a a fi Fi Porcentaje
Conteo hi  Hi 
Xi # Taladros acumulada n n (100 x hi)
fi Fi
60 / 1 1 0.05 0.05 5%
62 / 1 2 0.05 0.1 5%
64 / 1 3 0.05 0.15 5%
65 / 1 4 0.05 0.20 5%
66 // 2 6 0.10 0.30 10 %
67 // 2 8 0.10 0.40 10 %
68 ///// 5 13 0.25 0.65 25 %
69 / 1 14 0.05 0.70 5%
70 / 1 15 0.05 0.75 5%
71 // 2 17 0.10 0.85 10 %
72 / 1 18 0.05 0.9 5%
73 / 1 19 0.05 0.95 5%
76 / 1 20 0.05 1.00 5%

9
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

TOTAL n = 20 1 100%
Ejm. 02 (Propuesto): Se han tomado un muestreo en kilogramos de 30 muestras de colas
de mineral
24, 23, 22, 28, 35, 21, 23, 23, 34, 24, 21, 25, 20, 26, 27
30, 32, 25, 26, 33, 34, 21, 31, 25, 31, 26, 25, 25, 22, 22

Establezca una tabla de frecuencias y porcentajes de peso del muestreo de mineral de


colas.

Solución: n = 30 datos, Orden ascendente: ……………………………………………..


……………………………………………..

Rango de datos: R=

FRECUENCIAS Y PORCENTAJES DEL MUESTREO:


Frec. Abs. Frec. Frec. Rel..
Frec. % %
Xi Conteo acum. Relat. Acum.
“hi” “Hi”
Abs. “fi” “Fi” “Hi”
“hi”

… … … … … … … …
… … … … … … … …
… … … … … … … …
… … … … … … … …
… … … … … … … …
… … … … … … … …
… … … … … … … …
… … … … … … … …
… … … … … … … …
… … … … … … … …
… … … … … … … …
… … … … … … … …
… … … … … … … …
… … … … … … … …
… … … … … … … …
… … … … … … … …
TOTAL

10
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

Ejm.: Los límites reales de los intervalos de clase de la tabla se obtendrá restando y
sumando 0.5 al límite inferior y superior, respectivamente.
TABLA: Individuos de acuerdo a su peso
Pesos en kilos fi .
[ 49.5 , 54.5 > 4
[ 54.5 , 59.5 > 8
[ 59.5 , 64.5 > 12
[ 64.5 , 69.5 > 4
[ 69.5 , 74.5 > 2
TOTAL 30
Si la unidad de medida utilizada en la recolección de datos es 0.01, para los límites reales
de clase será resta o suma de 0.005 (mitad de 0.01) a los límites aparentes.
Ejemplo, Si el intervalo de clase con límite aparente: 55.57 – 59.59. Entonces el intervalo
de clase con límites reales será [ 55.565 , 59.595 >.

INTERVALOS DE CLASE Y AMPLITUD DE CLASE


[ 50, 60 >, intérvalo de clase, 50 y 60 son límites de clase, el menor número “límite
inferior” y el mayor número “límite superior”.
Amplitud de clase, a la diferencia del extremo superior e inferior de cada intervalo de clase
a) Intervalos Semiabiertos.- [a, b >; contendrán siempre el valor inferior, y no al
superior
Ejm: Se han tomado un muestreo en kilogramos de 30 muestras de colas de mineral.
24, 23, 22, 28, 35, 21, 23, 23, 34, 24, 21, 25, 20, 26, 27
30, 32, 25, 26, 33, 34, 21, 31, 25, 31, 26, 25, 25, 22, 22

Ordenando: 20, 21, 21, 21, 22, 22, 22, 23, 23, 23, 24, 24, 25, 25, 25
25, 25, 26, 26, 26, 27, 28, 30, 31, 31, 32, 33, 34, 34, 35
Agrupando estos datos en 5 intervalos tenemos:
Intervalos Valores dentro del intervalo Frecuencia (fi)
[ 20 , 24 > 20, 21, 21, 21, 22, 22, 22, 23, 23, 23 10
[ 24 , 27 > 24, 24, 25, 25, 25, 25, 25, 26, 26, 26 10
[ 27 , 30 > 27, 28 2
[ 30 , 33 > 30, 31, 31, 32 4
[ 33 , 36 > 33, 34, 34, 35 4

b) Intervalos con límites reales de clase.- Intervalos de clase que no se traslapan.


Ejm: Muestras de acuerdo a su peso. (Individuos)
Número de personas
Peso en kilos
fi
50 – 54 4
55 – 59 8
60 – 64 12
65 – 69 4
70 – 74 2
TOTAL 30
11
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

Ejm. 03: Los límites reales de los intervalos de clase de la tabla se obtendrá restando y
sumando 0.5 al límite inferior y superior, respectivamente.
TABLA: Individuos de acuerdo a su peso
Pesos en kilos fi .
[ 49.5 , 54.5 > 4
[ 54.5 , 59.5 > 8
[ 59.5 , 64.5 > 12
[ 64.5 , 69.5 > 4
[ 69.5 , 74.5 > 2
TOTAL 30

Si la unidad de medida utilizada en la recolección de datos es 0.01, para los límites reales
de clase será resta o suma de 0.005 (mitad de 0.01) a los límites aparentes.
Ejemplo, Si el intervalo de clase con límite aparente: 55.57 – 59.59, entonces el intervalo
de clase con límites reales será [ 55.565 , 59.595 >.

MARCA DE CLASE (Xi).- Es el punto medio del intervalo de clase.


Ejm: Así la marca de clase del intervalo 50 – 54 será: (50 + 54)/2 = 52.
La marca de clase es el valor que representa a la información contenida en el intervalo de
clase.

REGLA PARA LA CONSTRUCCION DE UNA DISTRIBUCION DE


FRECUENCIAS DE UNA VARIABLE AGRUPADA EN INTERVALOS

1. Determinación del Rango.- (R)


R = máx {x} – mín {x}, (para intervalos traslapados) ó
R = máx {x} – mín {x} + unidad de medida, (para intervalos de clase no
traslapados).

2. Determinación del número de intervalos de clase.- (redondeo al


inmediato mayor) dos soluciones en referencia:
a) Número de clases: k  n , n = tamaño de la muestra.
Sí n = 25, → k = 5.
b) Fórmula de Sturges: k = 1 + 3.22 log10(n)

3. Determinación del tamaño de los intervalos.- (C)


Amplitud de clase: C = R/k, R = Rango de las observaciones
k = Número de clases
Las clases deben tener la misma longitud, con posible excepción del 1er. y último
intervalo

4. Determinación de los límites de clase.- Tomar el resultado mas bajo de los


datos originales como el límite inferior del 1er. intervalo de clase. Agregar C para

12
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

obtener el límite superior de dicha clase; R = máx {x} – mín {x} (agregar C = 1 para
límite superior de clase). Se añaden los demás intervalos.
5. Determinación de la frecuencia de clase.- Determina el número de
observaciones que caen en cada intervalo de clase.

REPRESENTACION DE LA INFORMACION MEDIANTE GRAFICOS

Los gráficos dan una idea mucho más sintética de los cuadros estadísticos, su finalidad es
mostrar la evolución de determinado fenómeno. En los gráficos se considerará:
1. El Título
2. El gráfico propiamente dicho
3. La notas explicativas

REPRESENTACION GRAFICA DE VARIABLES CUANTITATIVAS


Las más usadas son:
1. Diagrama de barras
2. Histograma
3. Polígono de frecuencias
4. Polígono de frecuencias acumuladas u ojiva

f(x) hi

fi
hi

Xi Ci
Fig. 1 Fig. 2

1) Diagrama de barras
Es propia de las distribuciones que tienen muchas observaciones pero pocos valores
distintos de la variable. (Fig. 1)

2) Histograma
Es una representación grafica de una distribución de frecuencias agrupadas en intervalos
de clase, mediante una serie de rectángulos contiguos (Fig. 2) que tienen:

a) Sus bases sobre un eje horizontal “X” con centros en las marcas de clase y longitud
igual al tamaño de los intervalos de clase.

b) Las alturas proporcionales a la frecuencia absoluta ó relativa tomados sobre el eje


de las “Y”.

13
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

Fig. 3

h’

Polígono de frecuencias

Fig. 4
1.4

3. Polígono de frecuencias.
a) Si la variable es discreta, se obtiene uniendo los dos extremos superiores de las
barras en el diagrama de barras (Fig. 3).
b) Si la variable es agrupada por intervalo de clase, el polígono de frecuencia se
obtiene uniendo los puntos medios de las bases superiores de cada rectángulo en el
histograma (Fig.4).

4. Polígono de frecuencia acumulada u Ojivas. Es valida para variables estadísticas


agrupadas en intervalos de clase.

F Ojiva

Fi

Fig. 5

14
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

X
Xi-1 Xi Intervalos
REPRESENTACION GRAFICA DE VARIABLES CUALITATIVAS

a) Diagrama de los rectángulos.- Se presentan en el eje de las abscisas en distintos


caracteres cualitativos y se levantan sobre ellos rectángulos de bases iguales que
no tienen por que estar traslapados y cuya altura será igual a la frecuencia absoluta
correspondiente.

b) Diagrama de sectores.- Es una representación grafica de un conjunto de datos


estadísticos, en un circulo, por medio de sectores circulares.
Para construir, se divide el círculo en sectores, cuyas áreas serán proporcionales a
los valores de la variable.

TOTAL 360º
PARTE Xº

Ejm. 04: Presupuesto de la facultad de Minas UNA del 2007 al 2010.

AÑOS PRESUPUESTO (miles de soles)


2007 200
2008 250
2009 300
2010 320
Total 1.070

Solución:

Usando la regla de tres:

Para 2007:
1.070 ________360º
200 ________ Xº

Xº = 67º

Para 2008: Xº = 84º


Para 2009: Xº = 101º
Para 2010: Xº = 108º

15
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

Ejm. 05: Los siguientes datos proporcionan las remuneraciones (miles de soles) de 50
obreros de mina.
73, 47, 67, 82, 67, 70, 60, 67, 61, 80,
65, 70, 57, 85, 59, 70, 57, 73, 77, 58,
69, 58, 76, 67, 52, 68, 69, 66, 72, 86,
76, 79, 77, 88, 94, 67, 77, 54, 93, 56,
73, 64, 70, 46, 68, 63, 72, 84, 63, 74.
Se pide:
1) Elaborar una tabla de frecuencias con intervalos de amplitud constante.
2) Construir Histograma y Polígono de frecuencias.
3) Polígono de frecuencia acumulada.

Solución:
Orden ascendente de datos en forma horizontal en 5 filas y 10 columnas.
46, 47, 52, 54, 56, 57, 57, 58, 58, 59,
60, 61, 63, 63, 64, 65, 66, 67, 67, 67,
67, 67, 68, 68, 69, 69, 70, 70, 70, 70,
72, 72, 73, 73, 73, 74, 76, 76, 77, 77,
77, 79, 80, 82, 84, 85, 86, 88, 93, 94.

i) Rango : R = 94 – 46, R = 48
ii) Numero de clase : K  50 , K = 7.07, K≈8
iii) Tamaño/Amplitud de intervalo de clase: C = R/K = 48/8 = 6,
C=6
iv) Remuneraciones de 50 obreros en miles de soles.

Frec. Abs. Frec. Rel. Marc.


Remuneracione Dens. Var.
s
Conteo Abs. Acum. Rel. Acum. h i/C
Clas.
xi
fi Fi hi Hi Xi
[ 46 , 52 > // 2 2 0.04 0.04 0.0067 49 46
[ 52 , 58 > //// 5 7 0.10 0.14 0.0167 55 52
[ 58 , 64 > ////-// 7 14 0.14 0.28 0.0233 61 58
[ 64 , 70 > /////-/////-// 12 26 0.24 0.52 0.0400 67 64
[ 70 , 76 > ////-//// 10 36 0.20 0.72 0.0333 73 70
[ 76 , 82 > ////-// 7 43 0.14 0.86 0.0233 79 76
[ 82 , 88 > //// 4 47 0.08 0.94 0.0133 85 82
[ 88 , 94 > /// 3 50 0.06 1 0.0100 91 88
TOTAL n = 50 1 0.0233 94

16
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

17
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

18
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

EJERCICIOS PROPUESTOS:

Ejercicio: Dada la siguiente distribución de empresas según el número de empleados, se pide:


a) Dibujar el histograma y el polígono de frecuencias.
b) Determinar el porcentaje de empresas que tienen el número de empleados entre 50 y 90.
c) Determinar el porcentaje de empresas con número de empleados inferior a 35.
Tabla: Distribución de 250 empresas según el número de empleados.
Número de empleados Frecuencia (fi)
[ 00 , 10 > 5
[ 10 , 20 > 20
[ 20 , 30 > 35
[ 30 , 40 > 40
[ 40 , 60 > 50
[ 60 , 80 > 30
[ 80 , 100 > 20
[ 100 , 140 > 20
[ 140 , 180 > 15
[ 180 , 260 > 15
TOTAL 250

Ejercicio: Representar gráficamente el siguiente cuadro estadístico.


Tabla: Número de alumnos de la Universidad Nacional del Altiplano Puno, para el presente año.
FACULTAD NUMERO DE ALUMNOS
Ingeniería Metalúrgica 200
Economía 1,500
Ingeniería Industrial 3,000
Contabilidad 800
Derecho 700
Ciencias de la 900
comunicación 400
Ingeniería de Sistemas 600
Ciencias Administrativas

Ejercicio: Construir el gráfico de la siguiente distribución de frecuencias. (N° Defunciones Vs. Xi)
Tabla: Defunciones por accidente en Mina Rinconada - Puno, por causas y sexos, 2009.
Causas del accidente SEXO
Xi Hombres Mujere TOTAL
s
Accidente de transporte 1145 232 1377
Sumersión accidental 346 92 438
Caídas 242 101 347
Envenenamientos 58 43 101
Otros accidentes 653 311 964
TOTAL 2444 779 3223

19
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

CAPITULO II

MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSION DE VARIABLES


CUANTITATIVAS

SUMATORIAS
Definido mediante la notación  , suma de elementos i = 1 hasta “n”.
n

 Xi  X  X  ...  X
i 1
1 2 n

Ejm. 06: Supóngase que se selecciona n = 5 compañías mineras del total del país. Sus
tasas de ganancias, como porcentaje de precio de venta de sus concentrados son
respectivamente: 12.2, 10.8, 10.4, 12.1, y 11.3. Represente simbólicamente estas
cantidades como: X1, X2, X3, X4, X5 respectivamente.
Hallar:
5
a)  Xi = 12.2 + 10.8 + 10.4 + 12.1 + 11.3 = 56.8
i 1
5

b)  Xi (12.2  10.8  10.4  12.1  11.3) 56.8


i 1
   11.36
5 5 5
5
c) X
i 1
i
2
 (12.2)2  (10.8)2  (10.4)2  (12.1)2  (11.3) 2  647.74

MEDIDAS DE TENDENCIA CENTRAL

Es un índice de localización central empleado en la descripción de las distribuciones de


frecuencias. También sirve como una base para medir y evaluar valores extremos (altos ó
bajos).

Tipos de promedio.- Son:

a) La media aritmética ó media


b) La mediana
c) La moda
d) La media geométrica
e) La media cuadrática
f) La media armónica, etc.

20
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

2.1. MEDIA ARITMETICA O MEDIA

2.1.1 MEDIA ARITMETICA – DATOS NO AGRUPADOS  X 


n N

 Xi ,  Xi ; Xi = X1, X2, …, Xn. Valores de la variable X


X  i 1
  i 1
n N
n = número de elementos u observaciones.
µ = Media poblacional.
N = Tamaño de la población.
Ejemplo: Hallar la media aritmética de las observaciones: 3, 4, 7, 8, 2.
n

Solución  Xi 3 4 7 8 2
X  i 1
  4.8
n 5

2.1.2 MEDIA ARITMETICA – DATOS AGRUPADOS  X 


k

fX i i k
; Xi = X1, X2, …, Xk; Valores de X ponderados
X  i 1

n
; ó X  h X
i 1
i i

fi = f1, f2, f3, …, fk; Frecuencias absolutas


k
n   fi
i 1

hi = h1, h2, h3, …, hk; Frec. relativas respectivas

Ejm. 07: Dada la siguiente distribución:


Xi 1 2 3 4 5 Determinar la media aritmética.
Solución: fi 1 3 4 2 2
Xi fi fi Xi
1 1 1
2 3 6
3 4 12
4 2 8
5 2 10
TOTAL 12 37
k

La media aritmética de estos datos será: fX i i


k
n   fi
X  i 1
; i 1
n
37
X   3.08
12

Ejm. 08: Determinar la media aritmética de la distribución.


Miles S/. Ingreso familiar [ 2, 4 > [ 4, 6 > [ 6, 8 > [ 8, 10 > [ 10, 12 >

21
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

N° de familias 5 10 14 8 3
Solución: Los intervalos de clase son representados por sus marcas de clase.
MARCA DE CLASE
CLASES fi Xi fi X i
[2, 4> 5 3 15
[4, 6> 10 5 50
[6, 8> 14 7 98
[ 8 , 10 > 8 9 72
[10 , 12 > 3 11 33
TOTAL 40 268
k

Tenemos: fX i i
268 Rpta. Ingreso familiar en miles de soles S/. 6,700.00
X  i 1
  6.7;
n 40

2.1.3 PROPIEDADES DE LA MEDIA ARITMETICA (Completar las propiedades)


k
1)  f (X
i 1
i i  X )  0;

2)

3)

4)

5)

6)

22
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

2.2. MEDIA PONDERADA ( X P )


r

n X  n X  ...  nr X r
n X j J r
XP  1 1 2 2
n1  n2  ...  nr
 j 1

n
; donde : n  n
i 1
j

 PX i i
XP  i 1
r
; Si : P1 , P2 ,...; Pr , Pesos asociados. X : X 1 , X 2 ,..., X r , Valores de la var iable X
P i 1
i

Ejm. 09: Sí los porcentajes de mujeres en 3 escuelas profesionales diferentes son:


ESCUELA PROFESIONAL N° de alumnos % de mujeres Pi Xi
A
48 50 2400
B
60 70 4200
C
30 40 1200
138 7,800
Hallar el porcentaje global de mujeres en las tres escuelas profesionales.

(50%) 48  (70%) 60  (40%)30 7800


Solución: X P    56.5%
48  60  30 138
El porcentaje global de mujeres en las tres escuelas es de 56.5%.

Ejm. 10: Determinar la evaluación final del alumno Juan Pérez en el curso de Estadística
quién tiene: 08 en examen parcial y 12 en el final; el examen parcial tiene peso 1 y el final
peso 2.
Solución:
CALIFICACIONES PESOS
EXAMENES XiPi
Xi Pi
Parcial 08 1 08
Final 12 2 24
TOTALES 20 3 32
2

PX i i
32
XP  i 1
2
  10.67; La evaluación de Juan Perez es 10.67
3
P
i 1
i

2.3. MEDIANA X%  
La mediana es un valor que divide a un conjunto de observaciones ordenadas en forma
ascendente ó descendente en dos grupos de igual número de observaciones.

X% Med ( X ) mediana

Caso 1.- La variable es discreta y n (# de observaciones) es impar, rango de orden


 n  1
2
Ejm. 11: Hallar la mediana del siguiente conjunto de datos: {3, 6, 8, 2, 1}
Solución: En orden creciente tenemos: 1, 2, 3, 6, 8

23
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

X1 X2 X3 X4 X5; → n es impar (n = 5)
El valor que ocupa el rango:
 n  1   5  1  3ro.  3
2 2
Existen dos observaciones mayores que 3 y dos observaciones menores que 3 (el número
de observaciones mayores que la mediana es igual al número de observaciones menores
que ella).

Caso 2.- La variable es discreta, n es par, la mediana es el promedio aritmético de los dos
valores centrales que equidistan de los extremos.
n n Xn  Xn
y 1: X% 2 2
1

2 2 2

Ejm.12: Considere las observaciones muestrales: 24, 37, 41, 82, 68, 63

Solución: En orden creciente: 24, 37, 41, 63, 68, 82;


n 6
n = 6, los valores que ocupan las posiciones: = ≈ 3ro. → 41
2 2
n 6
 1   1  4to. → 63
2 2

La mediana es entre 41 y 63, el cuál es: X% Med  X  


 41  63  52 .
2

Caso 3.- La variable es continua, el problema consiste en determinar un punto dentro del
intervalo en que está comprendida la mediana.
n
1er. Paso: Calcular , Variable continua para “n” es par ó impar.
2

n
2do. Paso: Fk-1 < < Fk; Fk, Frecuencia acumulada.
2

3er. Paso: Utilizar la fórmula:

 n 
 2  Fk 1 
X%  lmed    * Cmed ;
 Fk  Fk 1 
 

Donde:
lmed = Límite inferior del intervalo de clase que contiene mediana
n = Tamaño de la muestra
Cmed = Amplitud de clase que contiene a la mediana.
Fk = Frecuencia acumulada de la clase q´ contiene a la mediana
Fk-1 = Frecuencia acumulada de la clase inmediata anterior a la
clase que contiene a la mediana.

24
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

Ejm. 13: Dada la distribución:


Clases [ 35, 45 > [ 45, 55 > [ 55, 65 > [ 65, 75 > [ 75, 85 > [ 85, 95 >
fi 5 12 18 14 6 3
Hallar la mediana.

Solución: Tenemos
CLASES fi Fi
[ 35 , 45 > 5 5
[ 45 , 55 > 12 17
[ 55 , 65 > 18 35 ← clase que contiene a la mediana
[ 65 , 75 > 14 49
[ 75 , 85 > 6 55
[ 55 , 95 > 3 58
TOTAL n = 58
n 58
Paso 1): = ≈ 29vo → está en la 29va. Posición.
2 2
Paso 2): Identificación de la clase q’ contiene a la mediana por la frecuencia
acumulada (Fi):
n
Fk-1 < < Fk
2
F3-1 = 17 < 29 < F3 = 35
F2 = 17 < 29 < F3 = 35; La clase q’ contiene a la mediana es el 3ro.
 n 
  Fk 1 
Paso3): X%  lmed   2  * Cmed
 Fk  Fk 1 
 
 29  17 
= 55 +   * 10
 35  17 
= 61.67

2.3.1 Propiedades de la Mediana


k k
1) f
i 1
i Xi  X  f
i 1
i X i  A ; para cualquier observación A del conjunto.

 n 
  Fk 1 
2) La fórmula: X%  lmed   2
 * Cmed ;
 Fk  Fk 1 
 
En términos de las frecuencias relativas acumuladas será:
 1 
  H k 1 
X%  lmed   2  * Cmed ;
H
 k  H k 1 
 

25
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

Completar las propiedades de la Mediana:

3)

4)

5)

6)

7)

2.4. CUARTILES  Qi 
Son valores que dividen a un conjunto de datos ordenados en forma ascendente o
descendente en cuatro partes iguales.
0% 25% 50% 75% 100%
________________________________________________________________
Q1 Q2 Q3

Q1 = 1er. Cuartil, deja 25% de observac. menores o iguales a él y 75% superiores a él


Q2 = 2do. Cuartil, coincide con la mediana.
Q3 = 3er. Cuartil, deja 75% de las observaciones inferiores ó iguales a él y el 25% de éstas
superiores a él.

Determinación de Q1:
1er. Paso.- Calculamos n/4
2do. Paso.- Identificación de la clase que contiene a Q1, por la siguiente
n
desigualdad: Fk-1 ≤ < Fk
4
3er. Paso.- Aplicamos la siguiente fórmula:
n   1 
 4  Fk 1   4  H k 1 
Q1  lQ1    * CQ1 ó Q1  lQ1    * CQ1 ; en frecuencias relativas
F
 k  Fk 1  H
 k  H k 1 
   
Donde:
lQ1 = Límite inferior de la clase que contiene a Q1
n = Tamaño de la muestra
CQ1 = Amplitud de clase que contiene a Q1.
Fk = Frecuencia acumulada de la clase que contiene al primer
cuartil.
Fk-1 = Frecuencia acumulada de la clase inmediata anterior a la
clase que contiene a Q1

26
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

Determinación de Q3:
3n
1er. Paso.- Calculamos
4
2do. Paso.- Identificamos la clase que contiene a Q3, por medio de las frecuencias
acumuladas:
3n
Fj-1 ≤ < Fj
4
3er. Paso.- Aplicamos la siguiente fórmula:
 3n   3 
 4  F j 1   4  H j 1 
Q3  lQ3    * CQ3 ó Q3  lQ3    * CQ3 ; en frec. relativas.
 F j  Fj 1   H j  H j 1 
   

Donde:
lQ 3 = Límite inferior de la clase que contiene a Q3
n = Tamaño de la muestra
CQ3 = Amplitud de clase que contiene a Q3.
Fj = Frecuencia acumulada de la clase que contiene a Q3.
Fj-1 = Frecuencia acumulada de la clase inmediata anterior a la clase que
contiene a Q3

Ejm. 14: Dada la siguiente distribución, determinar los cuarteles Q1 y Q3.


Intervalos de clase [ 4, 14 > [ 14, 24 > [ 24, 34 > [ 34, 44 > [ 44, 54 >
fi 6 18 23 8 3
Solución: Tenemos
CLASES fi Fi
[ 4 , 14 > 6 6
[ 14 , 24 > 18 24 ← Clase que contiene a Q1
[ 24 , 34 > 23 47 ← Clase que contiene a Q2, Q3
[ 34 , 44 > 8 55
[ 44 , 54 > 3 58
TOTAL n = 58

Para Q1:
Paso 1): n/4 = 58/4 = 14.5 → está en la 14.5va. Posición.
Paso 2): Identificamos la clase q´ contienen a Q1 por medio de frecuencia
acumulada (Fi)
n
F1 < = 14.5 < 24 = F2; el intervalo de clase q’ contiene a Q1 es [14, 24 >
4
n 
 4  Fk 1   14.5  6 
Paso3): Q1  lQ1    * CQ1  14    * 10  18.72
 Fk  Fk 1   24  6 
 
Para Q3:

27
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

3n 3*58
Paso 1): = = 43.5 → está en la 43.5va. Posición.
4 4
Paso 2): Identificamos la clase q’ contienen a Q3 por medio de frecuencia
acumulada (Fi)
3n
F2 = 24 < = 43.5 < 47 = F3; el intervalo clase q’ contiene a Q3 es [24,34>
4
 3n 
 4  Fk 1   43.5  24 
Paso 3): Q3  lQ3    * CQ3  24    * 10  32.48
 Fk  Fk 1   47  24 
 

25%_____ 25% _______ 25% _______ 25% _______


4 Q1 = 18.72 Q2 = 26.17 Q3 = 32.48 54

Para Q2:
El cálculo del 2do. cuartil será igual al procedimiento de la mediana, pasos de la
mediana:
1ro.- n/2; n/2 = 58/2 = 29 → está en la 29va. Posición.
2do.- Fk-1 ≤ n/2 < Fk
F2=24 < n/2=29 < F3=47; El intervalo de clase q’ contiene a Q2:
[24, 34 >
 n 
 2  Fk 1 
3er.- Por definición de la mediana: Q2  lQ2    * CQ2
 Fk  Fk 1 
 
 29  24 
 24    *10  26.17
 47  24 

2.5. DECILES (Di)


Valores que dividen a un conjunto de datos ordenados en forma ascendente ó descendente
en 10 partes iguales.

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

D1 D2 D3 D4 D5 D6 D7 D8 D9

D1 = 1er. Decil, deja 10% de las observaciones menores o iguales a él.

D2 = 2do. Decil, deja 20% de las observaciones menores o iguales a él


.
.
.
D9 = 9no. Decil, deja 90% de las observaciones menores o iguales a él y el 10%
superiores a él.

PASOS:

28
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

i xn
1ro.) Calculamos ; i  1, 2,...,9
10

2do.) Identificamos la clase que contiene los Di por medio de la frecuencia acumulada:

Fk-1 ≤ (i x n)/10 < Fk

 i xn 
 10  Fk 1 
3ro.) Se aplica: Di  lDi    * CDi
 F k  Fk 1 
 
Donde: lDi = Límite inferior de la clase que contiene a Di, i = 1, 2, . . ., 9
n = Tamaño de la muestra
CDi = Amplitud de clase que contiene a Di.
Fk = Frecuencia acumulada de la clase que contiene al i-ésimo decil.
Fk-1 = Frecuencia acumulada de la clase inmediata anterior a la clase que contiene
a Di.

2.6. PERCENTILES (Pi)


Son valores que dividen la muestra ordenada en forma ascendente ó descendente en 100
partes iguales.

0% 1% 2% 50% 98% 99% 100%

P1 P2 P50 P98 P99


P1 = 1er. percentil, deja 1% de las observaciones menores ó iguales a él y el 99%
superiores a él.
.
.
.
P99 = 99avo. Percentil, deja 99% de las observaciones menores ó iguales a él y el 1%
superiores a él.

Cálculo de percentiles:
ixn
1ro.) Calculamos ; i  1, 2, ..., 98, 99.
100

2do.) Identificamos la clase que contiene los Pi por medio de la frecuencia


acumulada:
Fk-1 ≤ (i x n)/100 < Fk
 i xn 
 100  Fk 1 
3ro.) Se aplica: Pi  lPi    * CPi
 F k  Fk 1 
 
Donde: lPi = Límite inferior de la clase que contiene a Pi, i = 1, 2, 3, . . ., 99
n = Tamaño de la muestra
CPi = Amplitud de clase que contiene a Pi.

29
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

Fk = Frecuencia acumulada de la clase que contiene a Pi.


Fk-1 = Frecuencia acumulada de la clase inmediata anterior a la clase que
contiene a Pi.

Ejm. 15: Determine el 4to. Decil y el 72vo. Percentil de la siguiente distribución de


frecuencias.
INTERVALOS fi Fi
[ 40 , 50 > 8 8
[ 50 , 60 > 20 28
[ 60 , 70 > 30 58 ← Clase de D4
[ 70 , 80 > 40 98 ← Clase de P72
[ 80 , 90 > 10 108
[ 90 , 100 > 2 110
TOTAL n = 110

Solución:
Cálculo de D4: Cálculo de P72:
i x n 4 x 110 i x n 72 x 110
1er. Paso.-   44   79.2
10 10 100 100

2do. Paso.- Identificación de la clase de D4 y P72 por medio de las frecuencias acumuladas:

D4: F2 = 28 < 44 < 58 = F3 P72: F3 = 58 < 79.2 < 98 = F4

3er. Paso.- Por definición de D4 y P72 tenemos sus cálculos respectivos:


Para D4:
 4n 
 10  Fk 1   44  28 
D4  lD4    * CD4  60    *10  60  5.33  65.33
 Fk  Fk 1   58  28 
 

Para P72:
 72 n 
 100  Fk 1   79.2  58 
P72  lP72    * CP72  70    *10  70  5.3  75.3
 Fk  Fk 1   98  58 
 

Rpta. D4: El valor 65.33 divide la muestra en dos partes: una con 40% de los elementos y
la otra con 60% de elementos.
P72: El valor 75.3 indica que 72% de la distribución está debajo de él y 28% superior a él.
(

2.7. La Moda X  Mo 
Es un valor de la variable que tiene la más alta frecuencia, el valor más frecuente de la
distribución. La moda no siempre existe y no siempre es única. Se tiene:
i) La distribución que tiene una sola moda: “unimodal”

30
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

ii) La distribución que tiene dos modas: “bimodal”


iii) La distribución que tiene más de dos modas: “multimodal”

Ejm. 16: Considere la distribución de los pesos de 14 muestras de Oro (grs):


63, 67, 70, 69, 81, 57, 63, 73, 68, 63, 71, 71, 71, 83

Solución: 63 y 71 ocurren 3 veces, y el resto una vez. La moda de estas muestras es:
X = 63 grs. y X = 71 grs. (distribución bimodal)

Ejemplo: Considere los pesos (Kgr) de Slurrex en 9 taladros de una “X” mina.
82, 65, 59, 74, 60, 67, 71, 73, 70
Solución: No definen una moda.

2.7.1 Propiedades de la Moda:


1) El valor de la moda es independiente de los valores extremos
2) La moda es inestable, varía sí se cambia el intervalo de clase.
3) Es limitado cuando no se dispone de un gran número de valores.
4) Es el valor típico, y por ello el promedio más descriptivo.
5) La moda no se presta a manipulaciones algebraicas posteriores.

2.7.2 Cálculo de la Moda: Datos agrupados en intervalos de clase.


1er. Proceso: Fórmula Czuber
1ro) Identificación de la clase modal (de mayor frecuencia)
(  1 
2do) Fórmula: X  lMo    * CMo
 1   2 
Donde: lMo = Límite inferior clase modal
Δ1 = fMo – f1 (f1 = frecuencia de la clase anterior a la clase modal).
fMo = frecuencia de la clase modal
Δ2 = fMo – f2 (f2 = frecuencia de la clase posterior a la clase modal).
CMo = Amplitud de la clase modal.

Ejm. 17: Determinar la moda de la siguiente distribución:


Intervalos de clase fi
[0, 1> 3
[1, 2> 10
[2, 3> 17
[3, 4> 8
[ 4,5> 5
TOTAL n = 43
Solución:
1ro) Intervalo de Clase de mayor frecuencia absoluta (17), es [ 2, 3 >
2do) Por Czuber:
(  1 
X  M 0  lMo    * CMo , Δ1 = 17 – 10 = 7; Δ2 = 17 – 8 = 9;
 1   2 

31
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

 7 
 2    *1
 79 CMo = 1
 2.44
fi
Clase

2do. Proceso: Gráfica de la moda; construir el histograma de la distribución: identificar la


clase modal (clase con  altura) y diseñar la construcción.

2.8. MEDIA GEOMÉTRICA. ( X G )


Sean 1; …; k valores de la variable X, asociadas a f1, f2, …, fk, respectivamente. La media
geométrica de “X”:

32
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

k
XG  G  n
X 1f1 . X 2f2 . ... . X kf k ; n  fi
i 1

f log X  f log X  ...  f k log10 X k


Aplicando log.: log10 ( X G ) = log10 (G) = 1 10 1 2 10 2
n
k

f 1 log10 X i
 i 1

n
 7 
  f i log10 X i 
Anti log. X G  Anti log. G  Anti log  i 1 
 n 
 
 

Ejm. 18: Los datos en la tabla corresponden al análisis ambiental de la empresa minera
“X”, de hidroxiprolina absorbidos por un gramo de masa intestinal analizados en distintos
trabajadores:
Mgr hidroxiprolina 77.3 61.2 82.4 75.9 61 70.2 65
Número de trabajadores 3 10 15 13 8 5 2
Se pide: a) Cuantos trabajadores son analizados
b) Calcular la X G de la distribución
c) Cuál es la moda.

Solución: Tabla de frecuencias


Xi fi Log fi log X i
Xi
61.0 8 1.785 14.280
61.2 10 1.787 17.870
65 2 1.813 3.626
70.2 5 1.846 9.230
75.9 13 1.880 24.440
77.3 3 1.888 5.660
82.4 15 1.916 28.740
a) Total 56 12.915 103.850 Número de trabajadores analizados:
7
n   fi  56
i 1

 7 
  f i log10 X i 
b) X G  G  Anti log  i 1 
 n 
 
 
 103.850 
X G  G  Anti log   = 71.53
 56 
(
c) X  M o  82.4 (se identifica de la mayor frecuencia absoluta).
2.9. MEDIA ARMÓNICA. ( X H )

33
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

Sean “X1, X2, …., XK,”; valores de la variable X, asociados a las frecuencias absolutas f 1, f2,
..., fk; respectivamente. La media armónica de X es:
n n
XH  H   k k
f 1  f 2  ...  f k ; n   fi .
x1 x2 xk fi i 1 xi
i 1

La ( X H ) como la ( X G ) , solo es aplicable a ciertos problemas.


2.9.1 Propiedades de la Media Armónica
1) La X H se basa en todas las observaciones por lo que está afectado por los valores
de la variable. Da a valores grandes un peso menor frente a la media geométrica, a
valores pequeñas de un peso mayor que el que da la media aritmética, la media
geométrica.
2) La X H es indeterminado si algún valor de la variable es cero.
3) La X H se presta a manipulaciones algebraicas posteriores.
4) H  G  X , solo de la misma serie y cuando los términos no son iguales.

Ejm. 19: Un equipo liviano de mina recorre los 10 kilómetros a razón de 30 km/h, y los 10
km, siguientes a razón de 60 km/h. Determinar la velocidad media durante todo el
recorrido.
30  60
Solución: Si X = = 45 km/h.
2
Pero la velocidad media es: la distancia total recorrida por el tiempo durante el proyecto.
A razón de 30 km/ h, gasta 20 minutos en 10 kilómetros iniciales, y a razón de 60 km/h,
gastó 10 minutos. Por tanto la unidad equipo liviano recorrió un total de 20 km en 20 + 10
= 30 min.  0.5 horas a velocidad media de:
20
= 40 km/h
0.5
n n
XH  H  
ie) Media Armónica entre dos velocidades: f1  f 2  ...  f k k

x1 x2 xk f
i 1
i
xi

2 2 120
XH   
(1/ 30)  (1/ 60) (3 / 60) 3
 40 km / h
2.10. MEDIA CUADRÁTICA ( X C )
Sean: X1, X2, ..., XK, valores de la variable X, asociadas a las frecuencias absolutas f1, f2, ...,
fK, respectivamente. La media cuadrática de “X” es:
1
 k
 2 k

f1 X 1  f 2 X 2  ...  f k X k   fi X i2  fX i i
2
k

XC    i 1   i 1 ;n= f 1

n  n  n i 1

 
Observación.- la relación entre las medias es: H  G  X

34
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

Ejm. 20: En una distribución de frecuencias se multiplican los valores de la variable por 3
y se obtiene una media aritmética de 54; sí se suma 5 a los valores de la variable, se
obtiene una media cuadrática de 24. Calcule la media cuadrática de la variable original.

Solución: Sea “xi” valores de la variable X


1
  k 2 k

f1 X 1  f 2 X 2  ...  f k X k   fi X i2  fX i i
2

XC    i 1   i 1

n  n  n
 

i) 3xi = yi → Y  3 X  54
54
X 
3
X  18
ii) Sí: xi + 5 = Zi
k

→ Z C = Media cuadrática original= Z C  f i Z i2


 i 1

n
k

ZC  f i Z i2
 i 1
 24
n
n

Z 
2
 f i Z i2
  24 
C 2
 i 1

n
Z 
2
C

n n n

 f i  xi  5   fi  xi2  10 xi  25  fx  10 fi xi  f i 25 
2 2
i i
 i 1
 i 1
 i 1
 576
n n n
n

 
ZC
2
 fx 2
i i  10 f i xi  f i 25 
 i 1
 576
n
f X i2   f i xi    fi 
Z 
2
C  i
 10    25    576
n  n   n 

    fn X
2
2
ZC i i
 10  18   25  1  576

Z    f X
2
2
C
i i
 371
n

ZC 
f i X i2
 371
n

35
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

Z C  19.26
MEDIDAS DE DISPERSIÓN O CONCENTRACIÓN

Son los que cuantifican el grado de concentración o de dispersión de los valores de la


variable de un promedio o valor central de la distribución. Las medidas de dispersión se
necesitan para:
a) Para verificar la confiabilidad de los promedios y
b) Sirve como base para el control de la vocación misma,
Alta dispersión  Baja concentración
Baja dispersión  Alta concentración

2.11. DESVIACIÓN MEDIA O PROMEDIO


Sean X1, X2, ..., XK valores de la variable X, con f1, ..., fk. La desviación media de X
respecto a un promedio “p” es:
k

DM (p) = f
i 1
i XI  p
; donde n =
k

f i
i 1
n

La desviación:
Respecto a la media aritmética es:
k

DM ( X ) = f
i 1
i Xi  X
; ó DM ( X ) = h
k

i Xi  X
i 1
n

Respecto a la mediana es:


k

~
DM ( X ) = f i 1
i X i  X%
; ó ~
DM ( X ) = h
k

i X i  X%
i 1
n

Donde: h1, h2, …, hk, son frecuencias relativas

2.11.1 Propiedades de la desviación media.

1.

2.

36
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

Intervalos [0, 2 > [2, 4 > [4, 6 > [6, 8 > [8,10> [10, 12> [12, 14> [14, 16> [16, 18> [18, 20>
N° Estud. 1 2 2 3 6 12 10 8 4 2
Ejm. 21: La siguiente distribución muestra las notas finales en Estadística, obtenida por 50
estudiantes de la facultad de ing. de Minas de la UNA.
Hallar la desviación media con respecto a la media aritmética.
Solución:
Completando la distribución de frecuencias:
Intérvalos Marca de
de clase
fi
clase
f i xi xi  X f i xi  X

 0, 2 > 1 1 1 10.6 10.6


 2, 4 > 2 3 6 8.6 17.2
 4, 6 > 2 5 10 6.6 13.2
 6, 8 > 3 7 21 4.6 13.8
 8, 10 > 6 9 54 2.6 15.6
10, 12 > 12 11 132 0.6 7.2
12, 14 > 10 13 130 1.4 14.0

14, 16 > 8 15 120 3.4 27.2

16, 18 > 4 17 68 5.4 21.6

18, 20 > 2 19 38 7.4 14.8


Total 50 580 155.2

f i Xi  X
;
DM  X   i 1

n
10
Se tiene: n f
i 1
i  50

10

Se tiene: X =  fi X i
580
i 1
  11 .6
n 50
155.2
DM ( X ) =  3.104
50

DM ( X ) = 3.104

2.11.2 DESVIACIÓN ABSOLUTA MEDIA (MAD)

37
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

MAD  Mediana de xi  Mediana de xi


2.12. VARIANZA Y DESVIACIÓN ESTÁNDAR
Sea X1, X2, …, Xk, valores de la variable “X”, con f 1, f2, …, fk respectivamente. La
Varianza muestral de X está dado por:
k

 f (X i i  X )2
n
Var. X   S 2   hi  X i  X 
2
t 1

n 1 n 1

k
Donde: n  f
i 1
i ; y h1 , h2 , ... , hk = frecuencias relativas.
Observación 1: La varianza en términos de la media poblacional “μ”:
k

 f (X i i   )2
N= f
k
es el tamaño de la población.
2  i 1
; i 1
i

N
Observación 2: Una fórmula alternativa para la Varianza muestral es:
k

 fi ( Xi  X ) 2
S2  i 1
;
n

Observación 3: Si S2 = 0,  los Xi coinciden con la media X , esto es que todas las


observaciones están concentradas en un mismo punto, por lo que la dispersión es nula.
La desviación estándar o típica de los valores de la variable “X” se define:
k

 f (X i i  X )2
S2   var( x )   i 1

n 1

2.12.1 Propiedades de la varianza y desviación estándar


1) Var (x) = S2 > 0; sí cste. “C”. Var[C] = 0
2) Var (x + C) = Var (x);
3) Var (CX) = C2 Var (X), C = Cte.
4) Var (CX + b) = C2 Var (X), C y b Cte.
5) Sean X 1 y X 2 las medias de dos submuestras de tamaño n1 y n2 y sean S12 y S 22
las varianzas correspondientes. La varianza de la muestra de tamaño n = n 1 + n2 está
dado:
S2 
1
n 1

(n1  1) S12  ( n2  1) S 22  n1 ( x1  x p ) 2  n2 ( x 2  x p ) 2 
donde: x p es la media ponderada de X 1 y X 2.

L L

La propiedad.  (ni  1) Si2  ni ( X i  X p )2


……………………… (*)
S2  i 1
 i 1

n 1 n 1

38
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

El primer y segundo término de (*) se llaman intravarianza e intervarianza respectivamente.


(Complete las propiedades propuestas)
6) .

7) .

8) Para distribuciones simétricas resulta:

a) El 68.27% de los casos están comprendidos entre X - S y X + S

68.27%

x
-S +S
X
b) El 95.45% de los casos están comprendidos entre X -2S y X +2S, esto es
aproximadamente 95% de los casos están situados dentro de dos unidades de
desviación estándar de la media.

95.45%

x
+2S

c)
X -2S
E
M
El 99.75%
X
de los casos están comprendidos entre X -3S y X +3S
BE
D
Eq
uat
ion 99.73%
.3
-

x
-3S +3S
X
39
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

2.12.2 MÉTODOS ABREVIADOS PARA EL CÁLCULO DE LA VARIANZA Y DESVIACIÓN


ESTÁNDAR
A) Primer método abreviado.- Uso de las siguientes fórmulas:

1  k  1 k 2
S2   
n  1  i 1
fi X i2  nX 2 

y S   
n  1  i1
fiX i2  n X 

Ejm. 22: Calcular la varianza y la desviación estándar de la siguiente distribución


muestral.
Xi 5 7 8 9 11
fi 2 3 5 4 2
k

Solución: S 
2 1  k
 

fi X i2  nX 2  ; fX i i
; también n   f i
k

n  1  i 1  X 
i 1
i 1
n
Completando la distribución de frecuencias:
Xi fi fiXi fiX i2
5 2 10 50
7 3 21 147
8 5 40 320
9 4 36 324
11 2 22 242
Total n = 16 129 1083

129
X   8.1  X 2  65.61
16
1
 S 2   1083  16(65.61) 
15
= 2.216 → S = 1.49

B) Segundo método abreviado.- Sea Ot (origen de trabajo), y sea:


di = Xi – Ot; i = 1, 2, …, k

Las desviaciones de Xt respecto a Ot, se tiene:


Xi = di + Ot
Luego: X  Ot 
 fi di  O  d
t
n
1  k  1 k
S2   
n  1  i 1
f i ( X i  X )2  
 n 1
 f (d
i 1
i i  Ot  Ot  d )2

1 k 1  k 
S2  
n  1 i 1
f i ( X i  X ) 2
=   
n  1  i 1
f i di2  nd 2 

1  k 
S   
n  1  i 1
f i di2  nd 2 

C) Tercer método abreviado.- Para calcular la varianza se siguen los siguientes pasos:

40
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

1er. Paso: Cambio de la variable de X a U, utilizando:

X i  Ot
Ui  ; Donde: i = 1, 2, …, k
C
Ot = Origen de trabajo entre los puntos
medios de las clases.
C = Amplitud de clase
Ui = Valores transformados
Xi = Valores originales de la variable

2do. Paso: Se calcula la media aritmética: ( X )


 k 
  fi U i 
X  Ot  C  i 1   Ot  CU
 n 
 
 

3er. Paso: Cálculo de la Varianza: (S2)


1 k 1  k 
S2  
n  1 i 1
f i ( X i  X ) 2
  
n  1  i 1
f i (Ot  CU i  Ot  CU )2 

1 k C2 k
  i i
n  1 i 1
f (CU  CU ) 2
  fi (U i  U )2
n  1 i 1

C2  k 2
S2   
n  1  i 1
 
f iU i2  n U  y

1  k 2
S C  
n  1  i 1
 
f iU i2  n U 

Ejm. 23: Dada la distribución de frecuencias de 147 estudiantes según su edad. Calcule la
desviación estándar “S”.
Edad [ 20, 30 > [ 30, 40 > [ 40, 50 > [ 50, 60 > [ 60, 70 >
N° Estudiantes 15 22 45 40 25
Solución: Para cálculos ordenados, conviene considerar los siguientes pasos:
Resultados que necesitamos para desarrollar las fórmulas por 2do. y 3er. Método
Abreviado.

1er. Paso:
Sean: Ot = 45 (marca de clase de intervalo que tiene la más alta frecuencia)

di = Xi – Ot,
Marca de
Intervalo fi di fi d i f i di2
Clase Xi

41
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

[ 20, 30 > 15 25 -20 -300 6,000


[ 30, 40 > 22 35 -10 -220 2,200
-520
[ 40, 50 > 45 45 0 900
0
[ 50, 60 > 40 55 10 400 4,000
[ 60, 70 > 25 65 20 500 10,000
n=
TOTAL 380 22,200
147

2do. Paso:
Por el 2do. Método Abreviado:

S 
1  k


f i di2  n d 2  ; d
fd i i
 2.585

n  1  i 1 n

1
S   22, 200  147(2.585) 2   12.055
146

3er. Paso:
Por el 3er. Método Abreviado:
X  Ot
Ui  i ; C = 10
C
Marca de
Intervalo fi Ui fi U i f iU i2
Clase Xi
[ 20, 30 > 15 25 -2 -30 60
[ 30, 40 > 22 35 -1 -22 22
-52
[ 40, 50 > 45 45 0 0
90
[ 50, 60 > 40 55 1 40 40
[ 60, 70 > 25 65 2 50 100
n=
TOTAL 38 222
147

1  k 2
  f Ui
S C  
n  1  i 1
fi U2i  n U  ;

U i

n
 0.2585

1   38  
2

S  10  222  147     10 1.520547


146   147  

S  12.055
2.13. MEDIDAS DE DISPERSIÓN RELATIVA

42
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

Coeficiente de Variación ó Coeficiente de Dispersión, expresado como un porcentaje.


S
C.V . 
X
Ejm. 24: El C.V. de ingreso de 200 personas de una empresa minera es 57% al reajustar
según ley, todos los sueldos en S/. 1,100.00, éste C.V. es ahora de 50% sin embargo la
empresa fija un mínimo de S/. 7,100.00. Antes del reajuste habían 35 personas que tenían
un sueldo promedio de S/.4,000 y todos ganaban menos de S/. 6,000; con la nueva política
de la empresa, sus sueldos serán elevados a S/. 7,100. Determinar la cantidad de dinero que
necesitará mensualmente la empresa, para pago después de hacer los reajustes.
S
Solución: Datos: C.V. =
X

S
i) = 0.57  S = 0.57 X …………….. (1)
X
S
ii)  0.50  S  0.50( X  1,100) ……… (2)
( X  1,100)

(1) en (2):
0.57 X = 0.50 ( X + 1,100)
550
X =  7,857.14 (salario promedio antes del reajuste).
0.07

La ponderación de las medias de dos grupos:


35 personas con sueldo promedio de S/. 4,000
165 personas con sueldo promedio de X 2 que se obtendrá:

35(4,000)  165 X 2
7,857.14 = X p, =
200
luego:
(7857.14)(200) = 35(4000) + 165 X 2

1'571428  140000
X 2 =
165
X 2 = 8,675.32

Las nuevas medias aritméticas ( X ), después de los reajustes serán:


a) El 1er, grupo: n1 = 35 personas tendrá un sueldo promedio de Y 1 = S/. 7100
b) El 2do, grupo: n2 = 165 personas tendrán un sueldo promedio de
Y 2 = S/. 8,675.32 + 1,100 = 9,775.32

Por lo tanto: La cantidad que necesitará la empresa minera:


C.D. = 35 (7100 + 165(9775.32)
= S/. 1’861,427.8
CAPITULO III

DISTRIBUCIONES BIDIMENSIONALES

43
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

3.1. TABLAS BIDIMENSIONALES


Sea (X, Y) variable estadística bidimensional tal que los valores que toman X e Y son:
X: x1, …, xk
Y: y1, …, ye
TABLA 3.1
Valores de Y
y1 y2 .… yj .… ye Total
Valores de X
x1 f11 f12 .… f1j .… f1e f1.
x2 f21 f22 .… f2j .… f2e f2.
. . . . . .
. . . . . .
. . . . . .
xi fi1 fi2 .… fij .… fie fi.
. . . …. . …. . .
. . . …. . .… . .
xk fk1 fk2 .… fkj .… fke fk.
k e

Total f.1 f.2 .… f.j .… f.e n f ij


i 1 j 1

Donde:
fij = Veces q´ se repite el par (xi, yj), frec. absoluta del par (xi, yj);  i = 1, …, k; j = 1, …, e.
e

fi. = f
j 1
ij = Total de pares con primera componente xi (i = 1, …, k)
k
f.j = f
i 1
ij = Total de pares con segunda componente yj (j = 1, …, e)
k e
n f ij = Número total de pares observados
i 1 j 1

3.1.1 DISTRIBUCIONES MARGINALES


Las distribuciones marginales obtenidas de la tabla de doble entrada 3.1 son:
Distribuciones marginales de X Distribuciones marginales de Y
X fi. Y f.j
X1 f1. y1 f.1
. . . .
. . . .
. . . .
xi fi. yj f.i
. . . .
. . . .
xk fk. ye f.e
n e

Total n   fi . Total n   f. j
i 1 j 1

Ejm. 25: Analizar el comportamiento conjunto de las variables: (X) grado de instrucción;
(Y) de procedencia de los empleados del Ministerio de Energía y Minas (datos Tabla 3.2).

44
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

TABLA 3.2: Distribución conjunta de frecuencia de las variables: (Y) Lugar/región de


procedencia, (X) grado de instrucción.
X Primaria Secundaria
Superior Total
Y completa completa
Lima 40 30 20 90
Provincia 35 15 10 60
Otros 30 15 5 50
Total 105 60 35 200 = n
Observamos: 40 empleados (primaria completa) son de Lima.
30 empleados (secundaria completa) son de Lima etc.
Los totales de filas nos dan la distribución marginal de variable “X” (lugar de procedencia),
y los totales de las columnas nos dan la distribución marginal de la variable “Y” ( grado de
instrucción).
Observación: Aquí existen 3 posibilidades, expresar la proporción de elementos en cada
celda:
i) Con relación al total general y se llama frecuencia relativa. Así “h” correspondiente
al par (Xi, Yj) es:
f
hi j  ij ; : i = 1, …, k. j = 1, …, e
n

Las frecuencias relativas marginales de X e Y son:


f
hi .  i. ; i = 1, …, k (frecuencia marginal del valor xi)
n
f
h. j  . j ; j = 1, …, e (frecuencia marginal del valor yj)
n

ii) Con relación al total de cada fila


 f ij 
 ; i = 1, …, k; j = 1,….., e
 f i. 

iii) Con relación al total de cada columna


 f ij 
  ; j = 1, …, e; i = 1,….., k
f
 . j

Ejm. 26: La distribución conjunta de las proporciones (frecuencias relativas) de los datos
de la tabla 3.2 con relación al total de las observaciones (n = 200) es:
TABLA 3.3
X Primaria Secundaria Superior Total
Y completa completa
Lima 20% 15% 10% 45%
Provincia 17.5% 7.5% 5% 30%
Otros 15% 7.5% 2.5% 25%
Total 52.5% 30% 17.5% 100%
40
Afirmamos: h11 x 100 = x 100 = 20% de los empleados son de Lima con primaria
200
completa.

45
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

35
h21 x 100 = x 100 = 17.5% de empleados son de provincias con primaria
200
completa, etc.

Porcentaje marginal = % totales de las filas y columnas de cada una de las variables X e Y.
Así: 45% son de Lima, 30% son de provincia, 25% son de otros.

Ejm. 27: La distribución de las proporciones de los datos de tabla 3.2 con relación al total
 fi j 
de cada columna:   x 100
 f .i 
Tabla 3.4: Distribución en porcentaje con relación a los totales de cada columna de las
variables X e Y de la tabla 3.2
X Primaria Secundaria Superior Total
Y completa completa
Lima 38.1% 50% 57.1% 45%
Provincia 33.3% 25% 28.6% 30%
Otros 28.6% 25% 14.3% 25%
Total 100% 100% 100% 100%
f11 40
ie): x 100 = x 100 = 38.1% de empleados con primaria completa son de
f. 1 105
Lima.
f 21 35
x 100 = x 100 = 33.3% de provincias.
f. 1 105
f 31 30
x 100 = x 100 = 28.6% de otros (extranjero, etc.).
f. 1 105

3.1.2 PROPIEDADES DE LAS FRECUENCIAS


Sean el número de pares observados (X, Y):
1) La suma de frecuencia absoluta es igual al número de pares observados.
k e


i 1 j 1
f ij  n

2) La suma de las frecuencias relativas es = 1.


k e k e f ij 1 k e 1

i 1
j 1
f ij   
i 1 j 1
   f ij  .n  1
n n i 1 j 1 n
k
3) 
i 1
fi. = f1. + f2. + …. + fk. = n
e

4) 
j 1
f.j = f.1 + f.2 + …. + f.e = n
k e

5)  hi = 1 y j 1
f.j = 1
i 1
k e k
6)  
i 1 j 1
fij Xi = 
i 1
fi . Xi

3.1.3 MEDIAS Y VARIANZAS MARGINALES

46
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

Sean (x1, y1); (x1, y2); ….; (x1, ye); (x2, y1); …; (xk, ye) valores de la variable bidimensional
(X, Y) con f11; f12; …; fke respectivamente.

Las medias y varianzas marginales de X e Y son:

k e

 fi . xi
;
j 1
f. j y j
X  i 1
Y 
n n
k e

 fi . ( xi  X ) 2
;
j 1
f. j ( y j  Y ) 2
S x2  i 1
S y2 
n 1 n 1

Por lo tanto: Las desviaciones típicas marginales de “X” e “Y” son:

k e

 fi . ( xi  X ) 2
;  j 1
f. j ( y j  Y ) 2
Sx  i 1
SY 
n 1 n 1

Sean (x1, y1), (x2, y2), …, (xk, ye) valores distintos de la variable (X, Y); con f11, f12, …, fke,
respectivamente. La Covarianza entre las variables X e Y es:
k e

Sxy = Cov  X , Y  

i 1 j 1
f i j ( xi  X )( y j  Y )
; n
k e

 fi j
i 1 j 1
n

Observación: Sean (x1, y1), (x1, y2), …, (xk, ye) valores diferentes de la variable (X, Y) con
f11, f12, …, fke, respectivamente es:

1 k e

Sxy = Cov  X , Y     f i j xi y j  X .Y
n i 1 j 1

Ejm. 28: En una encuesta realizada en una población se obtuvo la siguiente información,
con relación al # de habitantes (X) y dormitorios (Y) en una muestra de 50 viviendas.

47
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

(X) (Y) (X) (Y) (X) (Y) (X) (Y)


Vivienda Habitan. Dormit. Vivienda Habitan. Dormit. Vivienda Habitan. Dormit. Vivienda Habitan. Dormit.
1 6 2 14 2 1 27 3 1 40 4 1
2 3 2 15 3 1 28 6 3 41 4 2
3 5 2 16 3 2 29 4 1 42 6 1
4 5 2 17 3 1 30 2 1 43 3 2
5 8 3 18 5 2 31 6 3 44 4 1
6 5 2 19 3 1 32 4 1 45 4 2
7 6 2 20 3 1 33 4 2 46 5 2
8 5 2 21 5 2 34 4 1 47 5 2
9 4 1 22 3 2 35 4 1 48 4 2
10 2 1 23 5 2 36 4 1 49 8 4
11 8 4 24 2 1 37 3 1 50 2 1
12 4 3 25 3 1 38 4 1
13 2 1 26 4 2 39 4 1

Se pide:
a) Construir una tabla bidimensional
b) Hallar las frecuencias marginales
c) Hallar las frecuencias acumuladas
d) Hallar medias y varianzas marginales

Solución:
a) Tabla Bidimen. frec. Absoluta y marginal. b) c) Frecuencias
acumuladas
Dormit. (Y) Frecuencia Marg. Y
1 2 3 4 de “Xi” 1 2 3 4
Habit. (X) Totales (fi.) X
2 6 6 2 6 6 6 6
3 7 4 11 3 13 17 17 17
4 10 5 1 16 4 23 32 33 33
5 9 9 5 23 41 42 42
6 1 2 2 5 6 24 44 47 47
8 1 2 3 8 24 44 48 50
Frec. Marg. de “Yj”
total (f.J) 24 20 4 2 50 = n

d) Medias:
k e

 fi . xi
208 ;

j 1
f. j y j
84
X  i 1
  4.16 Y    1.68
n 50 n 50

Varianzas Marginales:
1  k  1
Var  X   S 
2
 
n  1  i 1
f i. xi2  n( X ) 2  =
 49
976  50(4.16) 2   2.26

1  e 2 1
Var Y   S    f. j y j  n(Y )  = 172  50(1.68) 2   0.63
2 2

n  1  j 1  49
Cuadro de desarrollo: Para aplicar las fórmulas (anterior); construir la siguiente tabla:
Y

48
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

1 2 3 4 fi. fi. Xi fi. Xi2


X
2 6 6 12 24
3 7 4 11 33 99
4 10 5 1 16 64 256
5 9 9 45 225
6 1 2 2 5 30 180
8 1 2 3 24 192
f.j 24 20 4 2 50 = n fi.Xi = 208 fi. Xi2 = 976
(f.j) (Yj) 24 40 12 8 f.j Yj = 84
(f.j) (Yj2) 24 80 36 32 f.jYj2 = 172

3.2. DISTRIBUCIÓN CONDICIONADA

Sea (X, Y). X: x1, x2, …., xk


Y: y1, y2, …., ye;
Tabla 3.5: Tabla de contingencia para las variables X e Y es:
Y
y1 y2 .… yj .… ye Total (frec. marginal)
X
x1 f11 f12 .… fij .… f1e f1.
x2 f21 f22 .… f2j .… f2e f2.
. . . . . . . .
. . . . . . . .
xi fi1 fi2 .… fij .… fie fi.
. . . . . . . .
. . . . . . . .
xk fk1 fk2 .… fkj .… fke fk.
Total k e

(frec. Marginal) f. 1 f. 2 .… f .j .… f . e n    fi j i 1 j 1

Tabla 3.6: Distribución de la variable “Y” condiconada a X = xi


Valores de “Y” y1 y2 .… yj .… ye Total
Frecuencia absoluta de y
condicionada a
X = xi; fy/x = xi fi1 fi2 .… fij .… fie fi.

Frecuencia relativa de y
condicionada
a X = xi hy/x = xi fi1 fi2 .… fij .… fie 1
fi. fi. .… f.i.. .… fi.

Tabla 3.7: Distribución de la variable X condicionada a Y = yj


Valores de “X” x1 x2 .… xi .… xk Total
Frecuencia absoluta de x

49
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

condicionada a
y = yj
fx/y = yj f1j f2j .… fij .… fke f.j

Frecuencia relativa de x
condicionada a
Y = yj
hx/y = yj f1j f2j .… fij .… fkj 1
f. j f. j f. j f. j

Ejm. 29: En la región Puno, se observó el precio del Oro y la cantidad de producción
durante algunos años, obteniéndose la siguiente tabla.
X 35 30 40 45 48 60 50 44 54 56 42 46
y 100 150 120 200 160 200 150 200 120 150 100 120

X = Precio en miles de dólares


Y = Cantidad en onzas, considerando la variable X agrupada en 5 intervalos de clase de
amplitud constante, se pide:
a) Construir una tabla bidimensional
b) Distribuciones marginales
c) Distribución de X condicionada a Y = 150
d) Distribución de Y condicionada a X = 45

Solución:
R 30
a) Rango de la variable X: R = 60-30 = 30; Amplitud de clase (C): C = ,C 6
k 5
Tabla bidimensional.
Y
100 120 150 160 200 Total
X
30, 36 1 - 1 - - 2
36, 42 - 1 - - - 1
42, 48 1 1 - - 2 4
48, 54 - - 1 1 - 2
54, 60 - 1 1 - 1 3
Total 2 3 3 1 3 n = 12

b) Distribuciones Marginales de X e Y:
X fi. Y f.j
30, 36 2 100 2
36, 42 1 120 3
42, 48 4 150 3
48, 54 2 160 1
54, 60 3 200 3
Total 12 Total 12
c) Dist. de X condicionada a; y = 150 es:
Intervalo
30, 36 36, 42 42, 48 48, 54 54, 60 Total
para X

50
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

1 0 0 1 1 3
fx/y = 150
hx/y = 150 1/3 0 0 1/3 1/3 1

d) Distribución de Y condicionada a; x = 45 (marca de clase del tercer intervalo) es:


Valores de
100 120 150 160 200 Total
Y
fx/y = 45 1 1 0 0 2 4
hy/x = 45 ¼ ¼ 0 0 2/4 1

3.3. MEDIDA DE DEPENDENCIA ENTRE LAS VARIABLES

3.3.1 INDEPENDENCIA DE VARIABLES


Sea la distribución x1, x2, …, xk e y1, …, ye, se tiene la siguiente tabla de contingencia para
las variables X e Y.
Tabla 3.8
Y y1 y2 .… yj .… ye Total
X
x1 f11 f12 .… fij .… f1e f1.
x2 f21 f22 .… f2j .… f2e f2.
. . . . . . . .
. . . . . . . .
xi fi1 fi2 .… fij .… fie fi.
. . . . . . . .
. . . . . . . .
xk fk1 fk2 .… fkj .… fke fk.

Total f.1 f.2 .… f. j .… f. e n  f ij

K x e se verifica la igualdad:
f i . x f. j
fi j  (para i = 1, …, k y j = 1, …, e)
n
Caso contrario, las variables X e Y son dependientes ó están asociadas.

Ejm. 30: Verificar si existe o no dependencia entre el sexo y carrera profesional escogida
por 400 alumnos de economía y administración de la UNA, los datos en la siguiente tabla:
Tabla 3.9: Distribución conjunta de los alumnos según el sexo (Y) y carrera (X)
Y
Masculino Femenino Total
X
Economía f11 = 169 f12 = 71 f1. = 240
Administración f21 = 111 f22 = 49 f2. = 160
Total f.1 = 280 f.2 = 120 400 = n
f1 . x f. 1 (240)(280)
Solución: f11 =   168  a f11  169
n 400
f x f. 2 (240)(120)
f12 = 1 .   72  71  f12
n 400

51
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

f 2 . x f. 1 (160(280)
f21 =   112  111  f 21
n 400

f 2 . x f. 2 (160)(120)
f22 =   48  49  f 22
n 400

Por tanto: Según los resultados no hay dependencia entre las dos variables.

3.4. DIAGRAMA DE DISPERSIÓN

Un diagrama de dispersión es la representación gráfica de (X, Y) en el sistema cartesiano,


en:
Eje “X” valores de x
Eje “Y” valores de y
De esta forma cada par (xi, yi) está representado por un punto en el plano X, Y.

Figura, El diagrama de dispersión representa el grado (intensidad) y naturaleza (forma) de


la relación entre las variables X e Y, si es que existe alguna.

yi (xi yi)

X
xi
Ejm. 31: Se tiene 5 agentes de una compañía “X” números de clientes (Y), números de
años de servicio (X), según la tabla. Trazar el diagrama de dispersión de estos datos.
Agente Años de servicio (X) Número clientes (Y)
A 4 58
B 6 66
C 7 74
D 8 70
E 10 82
Total 35 350

Solución: Gráfico de los pares ordenados (X, Y) de la tabla.


Se observa  dependencia lineal entre las variables X e Y, al aumentar el tiempo de
servicio aumenta el número de clientes.

52
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

Ejm. 32: Ocho individuos fueron sometidos a una prueba sobre el conocimiento de un
idioma extranjero tomándose el tiempo para cada uno de ellos en aprender a operar una
máquina. Así las variables en estudio son:
X: resultado obtenido en la prueba (máximo, 100 puntos)
Y: tiempo en minutos necesarios para aprender a operar satisfactoriamente una máquina.
Trazar el diagrama de dispersión con los siguientes datos:
Indiv. X Y
50 353
2 57 378
3 66 365
4 75 344
5 79 347
6 81 391
7 85 355
8 95 358

Solución: Graficamos los pares ordenados (X,Y) en el sistema cartesiano.

Se observa que no hay ningún tipo de dependencia entre las dos variables

53
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

3.5. CORRELACIÓN Y REGRESIÓN LINEAL

3.5.1 CORRELACIÓN
Determina el grado de reracionamiento entre las variables que se estudian.
1) Correlación directa o positiva: Las variables x e y, varían en un mismo sentido.
2) Correlación inversa o negativa: Las variables x e y, son en sentidos contrarios.
y y y

(a) (b) (c)

0 x 0 x 0 x
Las variables
3.5.2 x,COEFICIENT
y presentan una Dependencia lineal negativa Las variables no presentan
asociación lineal positiva. correlación

3.5.2 COEFICIENTE DE CORRELACIÓN

Sean (x1, y1); …, (xk, yk) variables estadística bidimensional (x, y) con f1, f2, …, fk,
respectivamente. El coeficiente de correlación muestral entre x e y es:
k

Sxy  f ( x  X )( y  Y )
i i i

Corr  x, y   r = SxSy 
i 1
k k ,

i 1
( f i ( xi  X ) 2 ) 
i 1
f i ( yi  Y ) 2

Una fórmula equivalente para calcular el coeficiente de correlación es:


k

 fi xi yi  n X Y
r  i 1
, ó
k k

i 1
fi x  n X
2
1
2
i 1
f i y  nY
2
i
2

k
n  f i xi yi    f i xi    f i yi 
r  i 1
,,
  k 
 n  fi x1   f x   n  f i yi   f y 
2 2 2 2
i i i i 
   i 1 

Se prueba que el coeficiente de correlación es un número comprendido entre:


-1 y 1, ie) -1  r  1
Si, r = -1 ó +1, existe perfecta asociación entre las dos variables.
Si, r = 0; no hay ninguna asociación entre las dos variables o de existir, no es una relación lineal.
Así, la correlación queda caracterizada por el coeficiente de correlación; -1, 1:

-1 0 1
correlación no hay correlación
perfecta (-) correlación perfecta (+)

54
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

COEFICIENTE DE CORRELACION:
Ejm. 32: La tabla presenta la información obtenida sobre 20 estudiantes, a cada uno de ellos se les tomó su peso y altura
Peso (Kgr.)
Xi 20.4 21.4 21.4 22 22.6 24.6 24.8 25.2 25.8 26 26.6 26.6 27.2 27.2 27.8 28 28 31.6 33.4
Altura (cm)
Yi 111 111 114 118 119 121 123 124 122 122 121 127 124 131 128 116 120 133 140
fi 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
Se pide:
a) Representar la información en un diagrama de dispersión.
b) Hallar el coeficiente de correlación entre X e Y.
Solución: a) Diagrama de dispersión de los datos: Altura Vs Peso

k
n  fi xi yi    f i xi    f i yi 
b) Coeficiente de correlación entre: r 
i 1

 k
2
k
2
n  fi x1    f i xi   n  f i yi    f i yi  
2 2

 i 1   i 1 
Kgr. Altura Cm. fi fi Xi fi yi fi Xi fi yi fi Xi yi
Xi Yi
20.4 111 2 40.8 222 832.32 24642 4528.8
21.4 111 1 21.4 111 457.96 12321 2375.4
21.4 114 1 21.4 114 457.96 12996 2439.6
22.0 118 1 22.0 118 484.00 13924 2596.0
22.6 119 1 22.6 119 510.76 14161 2689.4
24.6 121 1 24.6 121 605.16 14641 2976.6
24.8 123 1 24.8 123 615.04 15129 3050.4
25.2 124 1 25.2 124 635.04 15376 3124.8
25.8 122 1 25.8 122 665.64 14884 3147.6
26.0 122 1 26.0 122 676.00 14884 3172.0
26.6 121 1 26.6 121 707.56 14641 3218.6
26.6 127 1 26.6 127 707.56 16129 3378.2
27.2 124 1 27.2 124 739.84 15376 3372.8
27.2 131 1 27.2 131 739.84 17161 3563.2
27.8 128 1 27.8 128 772.84 16384 3558.4
28.0 116 1 28.0 116 784.00 13456 3248.0
28.0 120 1 28.0 120 784.00 14400 3360.0
31.6 133 1 31.6 133 998.56 17689 4202.8
33.4 140 1 33.4 140 1115.56 19600 4676.0
Total 2325 20 511 2436 13289.64 297794 62678.6

55
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

20*(62678.6)  (511)(2436) 8776


r   0.87
 20(13289.64)  (511)   20(297794)  (2436) 
2 2 10086.136

3.5.3 REGRESION

Sea: y = f(x) → y = f(x) + e error.

Regresión es un método empleado para encontrar una función que se ajusta a una nube de
puntos (dispersión) para obtener una predicción aprox. De una variable apartir de la otra.
Así la regresión de la variable Y e X es:

Ŷ = f(x)

3.5.3.1 REGRESION LINEAL SIMPLE


Sí la regresión de Y en X es una función lineal tenemos:

Ŷ = f(x) = α + βx; Donde α y β son constantes.

Sí consideramos el error de predicción (residuo) e = Y – Y� , entonces el modelo lineal


podemos escribir como: y = α + β X + e

56
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

3.5.3.2 MÉTODOS DE MÍNIMOS CUADRADOS PARA ESTIMAR LOS


COEFICIENTES DE REGRESIÓN LINEAL

Para obtener la recta de regresión de y en x:

ŷ     x
y = a0 + a2 x
Ajuste por mínimos cuadrados de una línea recta
Dada una ecuación lineal: y = a0 + a1 + e ó e = y – a 0 – a1X, donde e = error ó residuo entre
el modelo y las observaciones y Sr = ei2, (suma de los cuadrados de los residuos entre
“Y” medida y la “Y” calculada con el modelo lineal)

n n
Sr = Sr   ei  Sr   ( yi  a0  a1 x) ….. (*)
2 2

i 1 i 1

Para determinar los valores de a0 y a1 la ecuación (*) es diferenciada con respecto a cada
coeficiente.
Sr d  n 
I. i)   
a0 a0  i 1
( yi  a0  a1 x) 2 

Sr d  n 
ii)   
a1 a1  i1
( yi  a0  a1 x) 2 

Sr
II. 0
a0

Sr
0
a1

n n
III. na0  ( xi ) a1   yi
i 1 i 1
n
( xi ) a0  ( xi2 ) a1   xi yi
i 1

n xi yi   xi . yi
a1 
n xi2  ( xi ) 2

a1  y  a1 x

57
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

Ejm. 34.- En una encuesta efectuada en una población se obtuvo la siguiente información,
relativo al número de habitantes (X) y número de dormitorios (Y) en una muestra de 50
viviendas. Los datos en la tabla: Número de habitantes (X) que viven en las casas con
número de dormitorios (Y).

Habitantes (Xi) Dormitorios (Yi) Frecuencias (fi)


2 1 6
3 1 7
4 1 10
6 1 1
3 2 4
4 2 5
5 2 9
6 2 2
4 3 1
6 3 2
8 3 1
8 4 2
a) Hallar el coeficiente de correlación entre X e Y
b) Hallar la recta de regresión mínima cuadrática Y en X.

Solución: a.- (propuesto)


Habit. Dormit. fi fi X i f i Yi f i X i2 f i Yi 2 f i X i Yi
Xi Yi
2 1 6
3 1 7
4 1 10
6 1 1
3 2 4
4 2 5
5 2 9
6 2 2
4 3 1
6 3 2
8 3 1
8 4 2
Total

58
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

b) Los coeficientes de regresión estimados de la recta Ŷ     x son:


En términos de Medias muestrales se tiene:
k

 f X Y  nXY
i i i
S xy
ˆ  i 1
k
 2
; ˆ  Y  ˆ X .............  
S
fX
i 1
i i
2
 nX 2 x

393  50  4.16   1.68  43.56


ˆ  
976  50  4.16 
2
110.72
ˆ  0.393

Luego en  * : ˆ  1.68   0.393  4.16 


ˆ  0.045
 La ecuación dela recta de regresión es : Yˆ  0.045  0.393 X

Ejm. 35.- Se han estudiado las calificaciones de 200 alumnos en dos asignaturas:
Matemática I y Estadística, obteniéndose los siguientes resultados: X  13; Y  15
 f X X
2

S 2

i i
4 S y2  2.25
X
n 1
Además se sabe que el coeficiente de correlación de ambas variables es: r = 0.90.
Se pide:
a) ¿Qué nota se puede predecir para un alumno que ha obtenido 14 de Matemática I,
en estadística?.
b) ¿Se puede decir que aquellos alumnos que obtienen mayor calificación en
Matemática I sean los mismos que obtienen mayor calificación en Estadística?.
c) ¿Cuál es la ecuación de la recta de regresión de X sobre Y?

Solución:
 f X X
2

Sí , S 2

i i
4 Sí , S y2  2.25
X
n 1
 Sy  2.25  1.5
 Sx  42

a) Para predecir un valor de la variable “Y” conociendo el valor de “X” es


necesario
obtener la ecuación de la recta de regresión “Y” en “X”.
ie) Yˆ     x
S XY
Sí , r   S XY  rS x S y   0.9   2   1.5   2.7
Sx Sy
Por consiguiente, el coeficiente de regresión ̂ de nuestra recta de regresión es:

59
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

S 2.7
ˆ  XY2   0.675 ; 0.68
Sx 4
Por otro lado el coeficiente de correlación  de esta ecuación es:
ˆ  Y  ˆ X
 ˆ  15   0.68  13  6.16

Será luego la ecuación: Y = 6.16 + 0.68X

Sí un alumno obtuvo una nota 14 en matemática I, en probabilidad y estadística podría


obtener:
Y = 6.16 + 0.68(14) = 15.68

b) Como r = 0.90 podemos decir que al aumentar las notas en matemática I (X);
aumentan también las notas en probabilidad y estadística (Y). Por consiguiente los
alumnos con mayor nota en matemática I, son los mismos que obtienen mayor
calificación en probabilidades y estadística.

c) La recta de regresión de X en Y es:

S
Xˆ  X  XY2
Sy
y Y

2.7
Setiene : Xˆ  13   y  15 
2.25

Xˆ  1.2 y  5

60
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

CAPÍTULO IV

ANALISIS COMBINATORIO

4.1. INTRODUCCION
Nociones básicas de la teoría matemática que estudia las diferentes técnicas de
conteo, conocido como análisis combinatorio.

4.2. PRINCIPIOS BASICOS DEL PROCESO DE CONTAR

A. PRINCIPIO DE MULTIPLICACION.- Sean S = {a1, …, am} y T = {b1, …, bn}


conjuntos de “m” y “n” elementos respectivamente, entonces el número de pares (a j, bk)
formados tomando un elemento de S y un elemento de T es:
m.n
b1 b2 …………………………………… bk ……………………………………………………… bn
a1
a2
……………

aj
………………..

am

B. AGRUPAMIENTOS MULTIPLES.- Sean S1 = {a1, …, an1}; S2 = {b1, …., bn2}


conjuntos de n1 y n2 elementos respectivamente, Sr = {x1, …, xnr} un conjunto de nr
elementos.
Entonces es posible formar: n = n1 . n2 ... nr
grupos ordenados, con r elementos cada grupo, (a j1, bj2, ..., xjr), donde aj1 es un elemento de
S1, bj2 un elemento de S2, ...., xjr un elemento de Sr.

Ejm. 36.- Un conductor de un automóvil puede tomar cualquiera de las 5 rutas para ir de la
ciudad A a la ciudad B; y para ir de la ciudad B a la ciudad C puede tomar cualquiera de las
4 rutas y finalmente para ir de la ciudad C a la ciudad D tiene 6 rutas posibles. Si para ir

61
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

desde A a D debe ir de A a B, de B a C y de C a D, ¿Cuántas rutas posibles tiene para ir de


A a D?
Solución: Sean: n1 = número de rutas de A a B = 5
n2 = número de rutas de B a C = 4
n3 = número de rutas de C a D = 6
El número total de maneras en que se puede construir una ruta completa, escogiendo una
ruta de A a B, otra de B a C y la última de C a D es :
n = n1 . n2 . n3 = (5) (4) (6) = 120
C. PRINCIPIO DE ADICION.- Si dos decisiones son mutuamente excluyentes y la
primera se puede tomar de m maneras y la segunda de n maneras, entonces una o la otra se
puede tomar de m + n maneras.

4.3. ARREGLOS

4.3.1 Arreglos Simples


Un arreglo de n objetos diferentes tomados de k en k es ordenación de k objetos
entre los n datos, de tal manera que estos grupos de k elementos difieren en algún elemento
o en el orden de colocación.
El número de todos los arreglos a formarse con n objetos tomados de k en k es obtenido
por la fórmula.
n!
Akn   n(n  1)(n  2) ... (n  k  1)
 nk!
donde: n! = n(n – 1) (n – 2) … 2.1 y 0! = 1

Ejm. 37.- ¿De cuantas maneras diferentes se pueden sentar 8 personas en una banca, con
capacidad para 5 personas?.
Solución: Se tiene n = 8 y k = 5, el número total de maneras diferentes que pueden
sentarse 8 personas en la banca, con capacidad para 5 personas es:
8! 8!
A58    8  8  1  8  2   8  3   8  4 
 8  5 ! 3!
 8  7   6  5  4 
 6720
4.3.2 Arreglos con Repetición
Son aquellos arreglos en que un elemento cualquiera de los dados, puede repetirse
en el mismo grupo, el número de veces que se indique.

El número de todos los arreglos con repetición a formarse con n objetos tomados de k en k
es obtenido por la fórmula.
 AR  k
n
 nk

Ejm. 38.- Un ómnibus parte de su paradero inicial con 6 personas a bordo y se detiene en
10 paraderos diferentes. ¿De cuántas maneras pueden bajar las 6 personas en los 10
paraderos, sí en un paradero pueden bajar cualquier número de personas?
Solución: La 1ra. Persona puede bajar en cualquiera de los 10 paraderos.
La 2da., 3ra. Lo mismo y la 6ta. De igual forma, entonces el número total de
maneras es:

62
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

 AR  6
10
 106  1'000, 000

4.4. PERMUTACIONES

4.4.1 Permutaciones Simples


Son los diferentes grupos que pueden formarse con los n objetos dados, de modo
que intervengan todos los elementos en cada grupo y cuya diferencia está dada en el orden
de colocación.
El número de permutaciones distintas que pueden formarse con n objetos se obtiene
mediante la fórmula:
Pn  n !  n(n  1)(n  2) ... 3.2.1.

Ejm. 39: Se proyecta presentar 6 conferencistas en una reunión de padres de familia y


profesores de la escuela profesional de Minas. ¿El moderador del programa desea saber
cuántas maneras diferentes se pueden situar en el escenario los 6 conferencistas en fila?
Solución:
P6  6!
 6(6  1)(6  2)  6  3  6  4   6  5 
 720

4.4.2 Permutaciones Circulares


El número de permutaciones circulares distintas que pueden formarse con n objetos
se obtiene mediante la siguiente fórmula:
Pnc   n  1 !
Ejm. 40: De cuántas formas pueden sentarse los 12 miembros del consejo de facultad de
Ingeniería de Minas alrededor de una mesa circular, sí:
a) Pueden sentarse de cualquier forma
b) Dos miembros determinados deben estar uno al lado del otro?

Solución:
a) Sí un miembro puede sentarse en cualquier parte al rededor de la mesa, entonces
los 11 miembros restantes, pueden sentarse de P11 = 11! Maneras
Pnc  11!
 11 11  1  11  2   11  3   11  4   11  5   11  6   11  7   11  8   11  9   11  10 
 39 '916,800
b) Considerando las dos personas que han de ir juntas como una sola. Entonces hay 11
personas para sentarse en círculo, que le pueden hacer de 10! Maneras. Las dos
personas consideradas como una sola pueden a su vez ordenarse entre sí de 2!
Maneras. Por tanto, el número de ordenaciones de 12 miembros del consejo de
facultad alrededor de una mesa circular con 2 miembros determinados sentados
juntos es:
(10!)(2!) = 3’628,800

4.4.3 Permutaciones con Repetición


Sean k1, k2, …, km números enteros positivos tal que:

63
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

k1 + k2 + … + km = n
El número de maneras en que un conjunto de n elementos puede ser dividido en m pares
ordenados (particionado en m subconjuntos) de los cuales, el primero contiene k,
elementos, el segundo k2 elementos, etc., que se obtiene con la siguiente fórmula:
n!
Pnk1 ,k2 ,...,km 
k1 ! . k2 ! ... km !
Ejm. 41: ¿De cuántas maneras diferentes se pueden ordenar 3 bolas blancas, 4 rojas y 4
negras en una fila, si las bolas de igual color no se distinguen entre sí?

Solución: Se pueden ordenar de:


11!
P113,4,4 
3! 4! 4!
39916,800
  11,550
 6   24   24 

4.5. COMBINACIONES

Una combinación de n objetos diferentes tomados de k en k, es una selección de k


Objetos de los n dados sin tener en cuenta la ordenación de los mismos.
El número de combinaciones de n objetos tomando k cada vez se obtiene mediante la
fórmula:
n!
CKn   nk  
k ! n  k  !

El número de combinaciones con repetición ha formarse con n objetos tomados de k en k


se obtiene mediante la fórmula:
 n  k  1 !
 CR  K
n

 n  1 ! k !
Ejm. 42: Una estación total de topografía se puede adquirir en 7 fábricas ¿de cuántas
maneras se puede escoger 4 de las siete fábricas?.

Solución: Escoger 4 fábricas de 7. n = 7 y k = 4

7! 7!
C47  
4! 7  4  ! 4!*3!
5, 040
  35
 24   6 

64
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

Observación.- Para la resolución de problemas de conteo se deberá tener en cuenta lo


siguiente:

i) Estudie el problema y determine si se forma un suceso simple al:


a) Seleccionar elementos de dos o más conjuntos (para el principio de
multiplicación o de agrupamiento múltiple).
b) Seleccionar k elementos de un solo conjunto de n elementos (uso de
arreglos o permutaciones ó combinaciones).

ii) Las reglas de los arreglos y permutaciones puede ser aplicable si los objetos se
toman de un solo conjunto y de cada reordenamiento diferente de los k objetos
de un grupo conduce a un suceso simple diferente.

iii) La regla de las combinaciones puede ser aplicable si los objetos se toman de un
solo conjunto y el reordenamiento de los objetos no produce un nuevo suceso
simple.

iv) A la dificultad para visualizar la regla (o reglas) de conteo apropiada para un


problema determinado que involucra un gran número de objetos, se puede
construir una versión en miniatura del problema de manera que se puedan
contar manualmente los objetos. Esto puede ayudar a ver cómo se resuelve la
versión más complicada.

65
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

CAPITULO V

PROBABILIDADES

5.1. EXPERIMENTO
Un experimento es toda acción sobre la cuál vamos a realizar una medición u
observación, es decir cualquier proceso que genera un resultado definido.

5.2. EXPERIMENTO ALEATORIO


Toda actividad cuyos resultados no se pueden determinar con certeza.
Un experimento es determinístico, cuando el resultado de la observación es determinado en
forma precisa por las condiciones bajo las cuales se realiza dicho experimento.
Ejemplos de Experimento determinístico:
a) Observar la suma de dos números naturales pares
b) Observar el color de una bola extraida de una urna que contiene sólo bolas negras.

Un experimento es aleatorio o no determinístico, cuando los resultados de la observación


no se pueden predecir con exactitud antes de realizar el experimento.
Ejemplos de Experimento aleatorio:
a) Lanzar un dado y observar el número que aparece en la cara superior
b) Lanzar una moneda 8 veces y observar la sucesión de caras y sellos
c) Contar el número de piezas defectuosas de la compresora de aire de la FIM del dia
de hoy
d) Eligir el presidente de estudiantes del 1er. semestre de la FIM de 60 ingresantes.
e) Observar el tiempo de vida de la compresora ATLAS COPCO de la FIM.

5.2.1 Caracterización de un Experimento Aleatorio


a) Cada experimento podrá ser repetido indefinidamente sin cambiar
esencialmente las
condiciones.
b) No se conoce un particular valor del experimento a priori, sin embargo, es
posible describir el conjunto de todos los posibles resultados del experimento.
c) Cuando el experimento es repetido un número grande de veces, aparece un
f
modelo de regularidad, esto es, habrá una estabilidad de la fracción h 
n
(frecuencia relativa), donde n es el número de repeticiones y f es el número de
éxitos de un particular resultado establecido antes de la realización del
experimento.

66
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

5.3. ESPACIO MUESTRAL (S)


Es el conjunto de todos los resultados posibles que se pueden obtener al realizar un
experimento aleatorio.
Ejemplo: Sea el experimento de contar el número de volquetes que descargan mineral en la
chancadora de una mina X durante las horas de un dia determinado.
S = {0, 1, 2, 3, … }

5.3.1 Punto muestral


Es un elemento del espacio muestral de cualquier experimento dado.
5.4. EVENTO
Es todo subconjunto de un espacio muestral.
Los eventos se denotan con letras mayúsculas: A, B, etc.
En particular S y Φ (conjunto vacio) son eventos. Al espacio muestral S se le llama evento
seguro y a Φ evento imposible.

5.5. TECNICAS DE CONTEO

5.5.1 Regla de la adición


Sean dos o más eventos: A1 que ocurre de n1 maneras, A2 que ocurre de n2
maneras, ……., Ak que ocurre de nk maneras, entonces el número de maneras que pueden
ocurrir los eventos, A1, o A2, o ……., Ak, es igual a n1 + n2 + n3 + …. + nk.

5.5.2 Regla de la multiplicación


Sean dos o más eventos:
A1 y A2, ….. Ak, es igual a n1*n2*n3* ….*nk maneras.

5.5.3 Combinación
Es una selección de objetos si el orden no es importante, cada uno de los resultados
se denominan combinación. Por ejemplo sea el conjunto de elementos Z = {A, B, C}, las
combinaciones de 2 elementos que se pueden seleccionar son: AB, AC, BC.
El número de combinaciones de n objetos tomados de k en k es igual a:
n!
Ckn 
k ! n  k  !

Ejm. 43: Un inversionista desea seleccionar tres inversiones de total 10 inversiones. ¿De
cuántas maneras diferentes puede invertir el inversionista?.

Solución: n = 10, y k = 3, por lo que el número de inversiones que puede realizar el


inversionista es:
10!
C310   120 inversiones
3k ! 10  3 !

5.5.4 Permutación
El número de permutaciones de n objetos tomados de k en k es igual a:
n!
Pkn 
 nk!
67
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

Ejm. 44: Un inversionista tiene la intención de invertir $ 5000 en un proyecto, $ 10000 en


segundo proyecto y $ 20,000 en un tercer proyecto. Sí existen en total 10 posibilidades de
inversión. ¿De cuántas maneras diferentes puede invertir el inversionista?.
Solución: n = 10 y k = 3, por lo que el número de inversiones que puede realizar el
inversionista:
10!
P310   720 maneras.
 10  3 !
5.6. TEORIA DE PROBABILIDADES

Asigna probabilidades basado en el supuesto de que todos los resultados son


igualmente probables. Sí un experimento tiene k posibles resultados, este método asignará
una probabilidad de 1/k a cada uno de ellos.

5.7. ESPACIO DE MUESTREO


El espacio de muestreo, denotado por S, es el conjunto de todos los resultados
posibles de un experimento conceptual.

Ejm. 45: Experimento: lanzar dos monedas al aire.


Espacio muestral: S = {CC, CS, SC, SS}.
En este caso cada punto muestral tiene la probabilidad 1/k = ¼ de ocurrir.
La probabilidad de ocurrencia de un evento A se halla:
n  A
P  A 
n S 

5.8. EVENTO Y ESPACIO DE EVENTOS


Un evento es un subconjunto del espacio de muestreo, denotado por letras
mayúsculas A, B, C, ….. La clase de todos los eventos asociados a un experimento dado
recibe el nombre de espacio de eventos y se denotará por “a”.

Ejm. 46: Experimento: Arrojar un dado


Espacio de muestreo S = {1, 2, 3, 4, 5, 6}
Sea: A {El número de puntos que muestra la cara superior del dado es par}
A = {2, 4, 6}
A es un subconjunto de S → A es un evento.

Sea Ai = {i puntos en la cara superior del dado}


A1 = {1}, A2 = {2}, etc.
Los Ai son subconjuntos de S → Los Ai son eventos.
Existen 26 = 64 eventos en la clase de eventos de a incluidos el evento Φ y el
espacio de muestreo S.

5.9. PROBABILIDAD P(.)


P(.) es una función con dominio un espacio de eventos a, y codominio el intérvalo

68
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

(0, 1) del conjunto de los números reales.

Ejm. 47: Sea el espacio muestral S = {CC, CS, SC, SS}. Se lanzan dos monedas al aire
¿Cuál es la probabilidad de que salga 1 cara?.

Solución: Sea el evento A: salen 2 caras. Entonces A = {CS, SC}


n  A 2
P  A    0.5
n S  4
5.9.1 Método de la Frecuencia Relativa
Asigna probabilidades basado en la experimentación o data histórica.

Ejm. 48: Se tiene información acerca de los ingresos mensuales por venta de concentrado
de Oro en la minera Picos blancos en los últimos 30 meses:
Las probabilidades en este caso se asignan mediante las frecuencias relativas.
Ingresos Frecuencia Probabilidad
5000 4 4/30 = 0.1333
6000 7 7/30 = 0.2333
7000 10 10/30 = 0.333
8000 6 6/30 = 0.2
9000 3 3/30 = 0.1
Total 30 1

5.10. LEYES DE PROBABILIDAD

Si Φ es el evento vacío; luego, P(Φ) = 0


Si A es un evento de a; y si Ac es el complemento de A. Luego, P(Ac) = 1 – P(A)
Sean A y B eventos cualesquiera de a. Luego, P(A-B) = P(A) – P(A ∩ B)
Sean A y B eventos cualesquiera de a. Luego, P(AUB) = P(A) + P(B) – P(A ∩ B).

5.10.1 Probabilidad condicional


La probabilidad de que ocurra un evento dado que otro evento ya ha ocurrido se llama
probabilidad condicional. La probabilidad condicional de A dado B se denota por P(A/B).
P( A  B)
P ( A / B) 
P( B)

Ejm. 49: Cierta familia tiene 3 hijos, y sabemos que al menos dos de ellos son niñas.
Suponiendo que los nacientes de niños y niñas son igualmente probables, además que el
sexo del hijo mayor no afecta en ningún modo al sexo del hijo menor, calcule la
probabilidad de que la familia tenga tres niñas.

Solución:
El espacio muestral, S = { MMM, MMH, MHM, HMM, MHH, HMH, HHM, HHH }
Donde: M = mujer y H = hombre
Sean los eventos A: la familia tiene 3 niñas B: la familia tiene por lo menos dos niñas

Luego los elementos de A y B son:

69
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

A = { MMM }, B = { MMM, MMH, MHM, HMM }, A ∩B = { MMM }


La probabilidad condicional de que la familia tenga 3 niñas dado que tiene por lo menos
dos niñas será:
P( A  B)
P( A / B) 
P ( B)
1/ 8 1
 
4/8 4
5.11. PROBABILIDAD TOTAL Y TEOREMA DE BAYES

5.11.1 Teorema de la probabilidad total


Sea A 1, A 2, …, A n un sistema completo de eventos tales que P(.) ≠ 0, sea B un
evento cualquiera del que se conocen las probabilidades condicionales P(B/A i),entonces la
probabilidad del evento B viene dada por:

P(B) = P(A1).P(B/A1) + P(A2).P(B/A2) + … + P(An).P(B/An)


n
Es decir: P ( B)   P( A ) P ( B / A )
i 1
i i

5.11.2 Teorema de Bayes


Dada una probabilidad a priori; al obtener un reporte, un test de producto se obtiene
alguna información adicional su probabilidad a posteriori. El Teorema de Bayes provee los
medios para revisar las probabilidades a priori:
P ( Ai ) P( B / Ai )
P ( Ai / B)  ; Donde:
P( B)
P(A i) = Probabilidad apriori
P(B/Ai) = Probabilidad condicional
P(B): Probabilidad total
P(Ai /B): Probabilidad a posteriori

5.12. DISTRIBUCIONES DE PROBABILIDAD

5.12.1 Variable Aleatoria


V. A., es una descripción numérica de los resultados de un experimento: V. A.
discreta y V.A. contínua.
A. Variable Aleatoria discreta.- Aquel que sólo puede tomar un número finito ó
infinito numerable de valores.
Ejemplos: X1 = número de hijos en una familia
X2 = número de fulminantes vendidos en una semana.
B. Variable Aleatoria continua.- Aquel que puede tomar un número infinito no
numerable de valores.
Ejemplo: X1 = peso de una persona
X2 = tiempo en llegar al centro de estudios UNA.

70
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

5.12.2 Distribución Discreta de Probabilidades


La distribución de probabilidades para una variable aleatoria describe cómo se
distribuyen las probabilidades entre todos los valores de la variable aleatoria, denotada por
f(x), que provee probabilidades a cada valor de la variable aleatoria. Si cumple con las
siguientes condiciones:

 f ( x)  0
  f ( x)  1
Ejm. 50: Se lanzan 3 monedas al aire. Determinar la distribución de probabilidades del
número de caras.

Sea el experimento E: lanzar tres monedas al aire.

El espacio muestral asociado a este experimento es: S = { ccc, ccs, csc, scc, css, scs, ssc, sss
}

La probabilidad de cada punto muestral es 1/8, es decir P(ccc) = P(ccs) = … = P(sss) = 1/8

Definimos la v.a. X: número de caras, que puede tomar los valores Rx = {0, 1, 2, 3}

X Eventos f(x)
0 { sss } 1/8
1 { css, scs, ssc } 3/8
2 { ccs, csc, scc } 3/8
3 { ccc } 1/8

5.12.3 Distribución acumulativa o función de distribución


La función de distribución se define como: F(x) = P(X ≤ x)
Del ejemplo anterior: F(1) = P(X ≤ 1) = P(X = 0) + P(X = 1) = 1/8 + 3/8 = 4/8, en
resumen:

X f(x) F(x)
0 1/8 1/8
1 3/8 4/8
2 3/8 7/8
3 1/8 8/8

5.12.4 Medidas de Resumen de una variable aleatoria discreta

a. Esperanza.- Esperanza ó valor Esperado ó media de una variable aleatoria es la


n
medida de tendencia central:   E X   x
i 1
i f ( xi )

b. Varianza.- Resume la variabilidad de esta variable aleatoria. Es un promedio


ponderado de las desviaciones al cuadrado respecto de la Mediana Varianza:

71
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

n
  E  X i      (X
2
2
  )2 f ( X i ) .
  i 1
i

La desviación estándar “σ”, se define como la raíz cuadrada positiva de la Varianza.

5.12.5 Valor esperado o esperanza matemática de una función de una variable aleatoria
Sea X variable con función probabilidad f(x), y sea Y = g(X) una función real de la
variable X; esperanza matemática de g(X) se define:

E (Y )  E  g  X      g x  f  x 
i i
xRx
5.13. Variable aleatoria continua

Una variable aleatoria continua es aquella variable cuyos valores pueden ser cualquier
número real dentro de un intervalo cualquiera.

Función de densidad

Una función se dice que es de densidad si cumple las dos propiedades siguientes:

f  x  0

 f  x  dx  1


y que además verifica que dado a < b, se tiene:

P  a  x  b 
b
 f  x  dx
a

La probabilidad entre dos valores dados a y b, es el área bajo la curva entre los puntos a y
b.

72
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

Por ser f una función integrable, la probabilidad de un punto es nula:


P  X  a  P  a  x  a 
a
 f  x  dx  0
a

y por ello al calcular la probabilidad de un intervalo no afectara nada el que este sea abierto
o cerrado por cualquiera de sus extremos, pues estos son puntos y por tanto de probabilidad
nula:
P  a  x  b  P  a  x  b  P  A  x  b  P  a  x  b 
La función de distribución de la V. A. continua, F, se define como:

F: IR → [0, 1]

x  F  x   P  X  x   f  t  dt


73
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería

BIBLIOGRAFIA

1. BLUE JOHANNES, 1988 “Métodos estadísticos para Ingenieros”.

2. CALDERON MENDOZA RUBEN, 2004 “Geoestadística práctica”


universidad Nacional Del Altiplano, Puno.

3. CELESTINO GARCIA ORE, 1995, “Estadística descriptiva y probabilidades”,


Concytec, Lima, Perú.

4. MEYER P. 1992 “ Probabilidades y Aplicaciones estadísticas”.

5. MAXIMO MITACC MEZA, 1996, “Tópicos de estadística descriptiva y


probabilidad” Edit. Thales SRL, Lima.

6. MASON/LIND/MARCHAL, 2001, Alfa omega, “Estadística para Administración


y Economía”.

74

Você também pode gostar