Escolar Documentos
Profissional Documentos
Cultura Documentos
CAPITULO I
ESTADISTICA
POBLACION
Se entiende por población o universo la totalidad de individuos ó elementos que pueden
presentar determinadas características susceptibles de ser estudiada.
Ejm: a) Población de ventas anuales de explosivos de FAMESA, SEMEXA, EXSA, etc.
b) Población de puntajes de rendimiento en exámenes de alumnos del 3er. nivel de
estudios de la FIM en la UNA – Puno.
La población puede ser finita o infinita:
Población finita.- Es aquella que tiene un número determinado de elementos.
Población Infinita.- Es aquella que tiene un número infinito de elementos.
MUESTRA
Al conjunto de medidas de conteos obtenidos de alguna población con el propósito de
obtener información acerca de ella. Se suelen tomar muestras cuando es difícil o costoso la
observación de todos los elementos de la población estadística.
DATOS ESTADISTICO- Son números o medidas que han sido recopilados como
resultado de las observaciones, pudiendo ser comparados, analizados e interpretados.
1
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
I. Variable Cualitativa.
Cuyos valores consisten en categoría de clasificación. Ejm: La variable “Estado
Civil” adopta las modalidades: soltero, casado, divorciado, viudo, etc.
Esta variable puede clasificarse en: Nominal y Ordinal.
Parámetro.- Es una medida usada para describir una característica de una población,
utilizando la información de la población conjunta, decisión certezas.
Las más usadas:
i) Media población (μ)
ii) Varianza poblacional (σ2)
iii) Proporción poblacional (p).
2
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
3
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
4
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
TIPOS DE MUESTRAS
Segundo. Se elige al azar, sin permitir la intervención de ningún factor que favorezca la
elección de unos en detrimento de los otros.
5
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
n1 n2 ... nk n
4. Muestreo de conglomerado
Consiste en dividir la población en subgrupos heterogéneos representativos de la población
global cada conglomerado debe ser encarado como una mini-población.
En el muestreo por conglomerados es eficiente tener:
a. Diferencia en las unidades elementales del mismo grupo lo más grande
posible.
b. Diferencia entre grupos lo mas pequeño posible.
Hay un total de 400 escuelas con 20,000 alumnos y la elección de los 2,000 a ser
estudiados podrá hacerse por cualquiera de los procedimientos anteriores.
Para el caso “Muestreo por procedimiento combinado”; una muestra estratificada por
conglomerados se obtendría escogiendo separadamente 10 colegios de cada una de las
cuatro regiones (4 x 10 x 50 = 2,000).
Para elegir los 2,000 alumnos, cualesquiera de las siguientes combinaciones serán
posibles:
6
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
n
n
7
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
13
(Ejm. 01 pág. 9): Frecuencia relativa acumulada de 68 es: 0.65
20
PROPIEDADES DE LAS FRECUENCIAS
k
2) h1 h2 ... hk = h i 1
i 1 (Suma de frecuencia relativa de datos).
8
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
Ejm. 01: Sea las alturas de los taladros (Cm.) en una obra de drenaje (cuneta) de mina:
64 73 68 68 76 70 62 67 71 69
68 60 65 68 66 68 67 71 66 72
Solución: n = 20 datos. Orden ascendentemente: 60 62 64 65 66 66 67 67 68 68
68 68 68 69 70 71 71 72 73 76
Rango de datos: R = 76 - 60 = 16
FRECUENCIA Y PORCENTAJE DE TALADROS: CUNETA SEGÚN SUS ALTURAS
Frecuenci Frecuenci
taladros (Cm). a a fi Fi Porcentaje
Conteo hi Hi
Xi # Taladros acumulada n n (100 x hi)
fi Fi
60 / 1 1 0.05 0.05 5%
62 / 1 2 0.05 0.1 5%
64 / 1 3 0.05 0.15 5%
65 / 1 4 0.05 0.20 5%
66 // 2 6 0.10 0.30 10 %
67 // 2 8 0.10 0.40 10 %
68 ///// 5 13 0.25 0.65 25 %
69 / 1 14 0.05 0.70 5%
70 / 1 15 0.05 0.75 5%
71 // 2 17 0.10 0.85 10 %
72 / 1 18 0.05 0.9 5%
73 / 1 19 0.05 0.95 5%
76 / 1 20 0.05 1.00 5%
9
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
TOTAL n = 20 1 100%
Ejm. 02 (Propuesto): Se han tomado un muestreo en kilogramos de 30 muestras de colas
de mineral
24, 23, 22, 28, 35, 21, 23, 23, 34, 24, 21, 25, 20, 26, 27
30, 32, 25, 26, 33, 34, 21, 31, 25, 31, 26, 25, 25, 22, 22
Rango de datos: R=
… … … … … … … …
… … … … … … … …
… … … … … … … …
… … … … … … … …
… … … … … … … …
… … … … … … … …
… … … … … … … …
… … … … … … … …
… … … … … … … …
… … … … … … … …
… … … … … … … …
… … … … … … … …
… … … … … … … …
… … … … … … … …
… … … … … … … …
… … … … … … … …
TOTAL
10
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
Ejm.: Los límites reales de los intervalos de clase de la tabla se obtendrá restando y
sumando 0.5 al límite inferior y superior, respectivamente.
TABLA: Individuos de acuerdo a su peso
Pesos en kilos fi .
[ 49.5 , 54.5 > 4
[ 54.5 , 59.5 > 8
[ 59.5 , 64.5 > 12
[ 64.5 , 69.5 > 4
[ 69.5 , 74.5 > 2
TOTAL 30
Si la unidad de medida utilizada en la recolección de datos es 0.01, para los límites reales
de clase será resta o suma de 0.005 (mitad de 0.01) a los límites aparentes.
Ejemplo, Si el intervalo de clase con límite aparente: 55.57 – 59.59. Entonces el intervalo
de clase con límites reales será [ 55.565 , 59.595 >.
Ordenando: 20, 21, 21, 21, 22, 22, 22, 23, 23, 23, 24, 24, 25, 25, 25
25, 25, 26, 26, 26, 27, 28, 30, 31, 31, 32, 33, 34, 34, 35
Agrupando estos datos en 5 intervalos tenemos:
Intervalos Valores dentro del intervalo Frecuencia (fi)
[ 20 , 24 > 20, 21, 21, 21, 22, 22, 22, 23, 23, 23 10
[ 24 , 27 > 24, 24, 25, 25, 25, 25, 25, 26, 26, 26 10
[ 27 , 30 > 27, 28 2
[ 30 , 33 > 30, 31, 31, 32 4
[ 33 , 36 > 33, 34, 34, 35 4
Ejm. 03: Los límites reales de los intervalos de clase de la tabla se obtendrá restando y
sumando 0.5 al límite inferior y superior, respectivamente.
TABLA: Individuos de acuerdo a su peso
Pesos en kilos fi .
[ 49.5 , 54.5 > 4
[ 54.5 , 59.5 > 8
[ 59.5 , 64.5 > 12
[ 64.5 , 69.5 > 4
[ 69.5 , 74.5 > 2
TOTAL 30
Si la unidad de medida utilizada en la recolección de datos es 0.01, para los límites reales
de clase será resta o suma de 0.005 (mitad de 0.01) a los límites aparentes.
Ejemplo, Si el intervalo de clase con límite aparente: 55.57 – 59.59, entonces el intervalo
de clase con límites reales será [ 55.565 , 59.595 >.
12
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
obtener el límite superior de dicha clase; R = máx {x} – mín {x} (agregar C = 1 para
límite superior de clase). Se añaden los demás intervalos.
5. Determinación de la frecuencia de clase.- Determina el número de
observaciones que caen en cada intervalo de clase.
Los gráficos dan una idea mucho más sintética de los cuadros estadísticos, su finalidad es
mostrar la evolución de determinado fenómeno. En los gráficos se considerará:
1. El Título
2. El gráfico propiamente dicho
3. La notas explicativas
f(x) hi
fi
hi
Xi Ci
Fig. 1 Fig. 2
1) Diagrama de barras
Es propia de las distribuciones que tienen muchas observaciones pero pocos valores
distintos de la variable. (Fig. 1)
2) Histograma
Es una representación grafica de una distribución de frecuencias agrupadas en intervalos
de clase, mediante una serie de rectángulos contiguos (Fig. 2) que tienen:
a) Sus bases sobre un eje horizontal “X” con centros en las marcas de clase y longitud
igual al tamaño de los intervalos de clase.
13
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
Fig. 3
h’
Polígono de frecuencias
Fig. 4
1.4
3. Polígono de frecuencias.
a) Si la variable es discreta, se obtiene uniendo los dos extremos superiores de las
barras en el diagrama de barras (Fig. 3).
b) Si la variable es agrupada por intervalo de clase, el polígono de frecuencia se
obtiene uniendo los puntos medios de las bases superiores de cada rectángulo en el
histograma (Fig.4).
F Ojiva
Fi
Fig. 5
14
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
X
Xi-1 Xi Intervalos
REPRESENTACION GRAFICA DE VARIABLES CUALITATIVAS
TOTAL 360º
PARTE Xº
Solución:
Para 2007:
1.070 ________360º
200 ________ Xº
Xº = 67º
15
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
Ejm. 05: Los siguientes datos proporcionan las remuneraciones (miles de soles) de 50
obreros de mina.
73, 47, 67, 82, 67, 70, 60, 67, 61, 80,
65, 70, 57, 85, 59, 70, 57, 73, 77, 58,
69, 58, 76, 67, 52, 68, 69, 66, 72, 86,
76, 79, 77, 88, 94, 67, 77, 54, 93, 56,
73, 64, 70, 46, 68, 63, 72, 84, 63, 74.
Se pide:
1) Elaborar una tabla de frecuencias con intervalos de amplitud constante.
2) Construir Histograma y Polígono de frecuencias.
3) Polígono de frecuencia acumulada.
Solución:
Orden ascendente de datos en forma horizontal en 5 filas y 10 columnas.
46, 47, 52, 54, 56, 57, 57, 58, 58, 59,
60, 61, 63, 63, 64, 65, 66, 67, 67, 67,
67, 67, 68, 68, 69, 69, 70, 70, 70, 70,
72, 72, 73, 73, 73, 74, 76, 76, 77, 77,
77, 79, 80, 82, 84, 85, 86, 88, 93, 94.
i) Rango : R = 94 – 46, R = 48
ii) Numero de clase : K 50 , K = 7.07, K≈8
iii) Tamaño/Amplitud de intervalo de clase: C = R/K = 48/8 = 6,
C=6
iv) Remuneraciones de 50 obreros en miles de soles.
16
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
17
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
18
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
EJERCICIOS PROPUESTOS:
Ejercicio: Construir el gráfico de la siguiente distribución de frecuencias. (N° Defunciones Vs. Xi)
Tabla: Defunciones por accidente en Mina Rinconada - Puno, por causas y sexos, 2009.
Causas del accidente SEXO
Xi Hombres Mujere TOTAL
s
Accidente de transporte 1145 232 1377
Sumersión accidental 346 92 438
Caídas 242 101 347
Envenenamientos 58 43 101
Otros accidentes 653 311 964
TOTAL 2444 779 3223
19
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
CAPITULO II
SUMATORIAS
Definido mediante la notación , suma de elementos i = 1 hasta “n”.
n
Xi X X ... X
i 1
1 2 n
Ejm. 06: Supóngase que se selecciona n = 5 compañías mineras del total del país. Sus
tasas de ganancias, como porcentaje de precio de venta de sus concentrados son
respectivamente: 12.2, 10.8, 10.4, 12.1, y 11.3. Represente simbólicamente estas
cantidades como: X1, X2, X3, X4, X5 respectivamente.
Hallar:
5
a) Xi = 12.2 + 10.8 + 10.4 + 12.1 + 11.3 = 56.8
i 1
5
20
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
Solución Xi 3 4 7 8 2
X i 1
4.8
n 5
fX i i k
; Xi = X1, X2, …, Xk; Valores de X ponderados
X i 1
n
; ó X h X
i 1
i i
21
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
N° de familias 5 10 14 8 3
Solución: Los intervalos de clase son representados por sus marcas de clase.
MARCA DE CLASE
CLASES fi Xi fi X i
[2, 4> 5 3 15
[4, 6> 10 5 50
[6, 8> 14 7 98
[ 8 , 10 > 8 9 72
[10 , 12 > 3 11 33
TOTAL 40 268
k
Tenemos: fX i i
268 Rpta. Ingreso familiar en miles de soles S/. 6,700.00
X i 1
6.7;
n 40
2)
3)
4)
5)
6)
22
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
n X n X ... nr X r
n X j J r
XP 1 1 2 2
n1 n2 ... nr
j 1
n
; donde : n n
i 1
j
PX i i
XP i 1
r
; Si : P1 , P2 ,...; Pr , Pesos asociados. X : X 1 , X 2 ,..., X r , Valores de la var iable X
P i 1
i
Ejm. 10: Determinar la evaluación final del alumno Juan Pérez en el curso de Estadística
quién tiene: 08 en examen parcial y 12 en el final; el examen parcial tiene peso 1 y el final
peso 2.
Solución:
CALIFICACIONES PESOS
EXAMENES XiPi
Xi Pi
Parcial 08 1 08
Final 12 2 24
TOTALES 20 3 32
2
PX i i
32
XP i 1
2
10.67; La evaluación de Juan Perez es 10.67
3
P
i 1
i
2.3. MEDIANA X%
La mediana es un valor que divide a un conjunto de observaciones ordenadas en forma
ascendente ó descendente en dos grupos de igual número de observaciones.
23
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
X1 X2 X3 X4 X5; → n es impar (n = 5)
El valor que ocupa el rango:
n 1 5 1 3ro. 3
2 2
Existen dos observaciones mayores que 3 y dos observaciones menores que 3 (el número
de observaciones mayores que la mediana es igual al número de observaciones menores
que ella).
Caso 2.- La variable es discreta, n es par, la mediana es el promedio aritmético de los dos
valores centrales que equidistan de los extremos.
n n Xn Xn
y 1: X% 2 2
1
2 2 2
Ejm.12: Considere las observaciones muestrales: 24, 37, 41, 82, 68, 63
Caso 3.- La variable es continua, el problema consiste en determinar un punto dentro del
intervalo en que está comprendida la mediana.
n
1er. Paso: Calcular , Variable continua para “n” es par ó impar.
2
n
2do. Paso: Fk-1 < < Fk; Fk, Frecuencia acumulada.
2
n
2 Fk 1
X% lmed * Cmed ;
Fk Fk 1
Donde:
lmed = Límite inferior del intervalo de clase que contiene mediana
n = Tamaño de la muestra
Cmed = Amplitud de clase que contiene a la mediana.
Fk = Frecuencia acumulada de la clase q´ contiene a la mediana
Fk-1 = Frecuencia acumulada de la clase inmediata anterior a la
clase que contiene a la mediana.
24
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
Solución: Tenemos
CLASES fi Fi
[ 35 , 45 > 5 5
[ 45 , 55 > 12 17
[ 55 , 65 > 18 35 ← clase que contiene a la mediana
[ 65 , 75 > 14 49
[ 75 , 85 > 6 55
[ 55 , 95 > 3 58
TOTAL n = 58
n 58
Paso 1): = ≈ 29vo → está en la 29va. Posición.
2 2
Paso 2): Identificación de la clase q’ contiene a la mediana por la frecuencia
acumulada (Fi):
n
Fk-1 < < Fk
2
F3-1 = 17 < 29 < F3 = 35
F2 = 17 < 29 < F3 = 35; La clase q’ contiene a la mediana es el 3ro.
n
Fk 1
Paso3): X% lmed 2 * Cmed
Fk Fk 1
29 17
= 55 + * 10
35 17
= 61.67
n
Fk 1
2) La fórmula: X% lmed 2
* Cmed ;
Fk Fk 1
En términos de las frecuencias relativas acumuladas será:
1
H k 1
X% lmed 2 * Cmed ;
H
k H k 1
25
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
3)
4)
5)
6)
7)
2.4. CUARTILES Qi
Son valores que dividen a un conjunto de datos ordenados en forma ascendente o
descendente en cuatro partes iguales.
0% 25% 50% 75% 100%
________________________________________________________________
Q1 Q2 Q3
Determinación de Q1:
1er. Paso.- Calculamos n/4
2do. Paso.- Identificación de la clase que contiene a Q1, por la siguiente
n
desigualdad: Fk-1 ≤ < Fk
4
3er. Paso.- Aplicamos la siguiente fórmula:
n 1
4 Fk 1 4 H k 1
Q1 lQ1 * CQ1 ó Q1 lQ1 * CQ1 ; en frecuencias relativas
F
k Fk 1 H
k H k 1
Donde:
lQ1 = Límite inferior de la clase que contiene a Q1
n = Tamaño de la muestra
CQ1 = Amplitud de clase que contiene a Q1.
Fk = Frecuencia acumulada de la clase que contiene al primer
cuartil.
Fk-1 = Frecuencia acumulada de la clase inmediata anterior a la
clase que contiene a Q1
26
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
Determinación de Q3:
3n
1er. Paso.- Calculamos
4
2do. Paso.- Identificamos la clase que contiene a Q3, por medio de las frecuencias
acumuladas:
3n
Fj-1 ≤ < Fj
4
3er. Paso.- Aplicamos la siguiente fórmula:
3n 3
4 F j 1 4 H j 1
Q3 lQ3 * CQ3 ó Q3 lQ3 * CQ3 ; en frec. relativas.
F j Fj 1 H j H j 1
Donde:
lQ 3 = Límite inferior de la clase que contiene a Q3
n = Tamaño de la muestra
CQ3 = Amplitud de clase que contiene a Q3.
Fj = Frecuencia acumulada de la clase que contiene a Q3.
Fj-1 = Frecuencia acumulada de la clase inmediata anterior a la clase que
contiene a Q3
Para Q1:
Paso 1): n/4 = 58/4 = 14.5 → está en la 14.5va. Posición.
Paso 2): Identificamos la clase q´ contienen a Q1 por medio de frecuencia
acumulada (Fi)
n
F1 < = 14.5 < 24 = F2; el intervalo de clase q’ contiene a Q1 es [14, 24 >
4
n
4 Fk 1 14.5 6
Paso3): Q1 lQ1 * CQ1 14 * 10 18.72
Fk Fk 1 24 6
Para Q3:
27
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
3n 3*58
Paso 1): = = 43.5 → está en la 43.5va. Posición.
4 4
Paso 2): Identificamos la clase q’ contienen a Q3 por medio de frecuencia
acumulada (Fi)
3n
F2 = 24 < = 43.5 < 47 = F3; el intervalo clase q’ contiene a Q3 es [24,34>
4
3n
4 Fk 1 43.5 24
Paso 3): Q3 lQ3 * CQ3 24 * 10 32.48
Fk Fk 1 47 24
Para Q2:
El cálculo del 2do. cuartil será igual al procedimiento de la mediana, pasos de la
mediana:
1ro.- n/2; n/2 = 58/2 = 29 → está en la 29va. Posición.
2do.- Fk-1 ≤ n/2 < Fk
F2=24 < n/2=29 < F3=47; El intervalo de clase q’ contiene a Q2:
[24, 34 >
n
2 Fk 1
3er.- Por definición de la mediana: Q2 lQ2 * CQ2
Fk Fk 1
29 24
24 *10 26.17
47 24
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
D1 D2 D3 D4 D5 D6 D7 D8 D9
PASOS:
28
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
i xn
1ro.) Calculamos ; i 1, 2,...,9
10
2do.) Identificamos la clase que contiene los Di por medio de la frecuencia acumulada:
i xn
10 Fk 1
3ro.) Se aplica: Di lDi * CDi
F k Fk 1
Donde: lDi = Límite inferior de la clase que contiene a Di, i = 1, 2, . . ., 9
n = Tamaño de la muestra
CDi = Amplitud de clase que contiene a Di.
Fk = Frecuencia acumulada de la clase que contiene al i-ésimo decil.
Fk-1 = Frecuencia acumulada de la clase inmediata anterior a la clase que contiene
a Di.
Cálculo de percentiles:
ixn
1ro.) Calculamos ; i 1, 2, ..., 98, 99.
100
29
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
Solución:
Cálculo de D4: Cálculo de P72:
i x n 4 x 110 i x n 72 x 110
1er. Paso.- 44 79.2
10 10 100 100
2do. Paso.- Identificación de la clase de D4 y P72 por medio de las frecuencias acumuladas:
Para P72:
72 n
100 Fk 1 79.2 58
P72 lP72 * CP72 70 *10 70 5.3 75.3
Fk Fk 1 98 58
Rpta. D4: El valor 65.33 divide la muestra en dos partes: una con 40% de los elementos y
la otra con 60% de elementos.
P72: El valor 75.3 indica que 72% de la distribución está debajo de él y 28% superior a él.
(
2.7. La Moda X Mo
Es un valor de la variable que tiene la más alta frecuencia, el valor más frecuente de la
distribución. La moda no siempre existe y no siempre es única. Se tiene:
i) La distribución que tiene una sola moda: “unimodal”
30
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
Solución: 63 y 71 ocurren 3 veces, y el resto una vez. La moda de estas muestras es:
X = 63 grs. y X = 71 grs. (distribución bimodal)
Ejemplo: Considere los pesos (Kgr) de Slurrex en 9 taladros de una “X” mina.
82, 65, 59, 74, 60, 67, 71, 73, 70
Solución: No definen una moda.
31
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
7
2 *1
79 CMo = 1
2.44
fi
Clase
32
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
k
XG G n
X 1f1 . X 2f2 . ... . X kf k ; n fi
i 1
f 1 log10 X i
i 1
n
7
f i log10 X i
Anti log. X G Anti log. G Anti log i 1
n
Ejm. 18: Los datos en la tabla corresponden al análisis ambiental de la empresa minera
“X”, de hidroxiprolina absorbidos por un gramo de masa intestinal analizados en distintos
trabajadores:
Mgr hidroxiprolina 77.3 61.2 82.4 75.9 61 70.2 65
Número de trabajadores 3 10 15 13 8 5 2
Se pide: a) Cuantos trabajadores son analizados
b) Calcular la X G de la distribución
c) Cuál es la moda.
7
f i log10 X i
b) X G G Anti log i 1
n
103.850
X G G Anti log = 71.53
56
(
c) X M o 82.4 (se identifica de la mayor frecuencia absoluta).
2.9. MEDIA ARMÓNICA. ( X H )
33
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
Sean “X1, X2, …., XK,”; valores de la variable X, asociados a las frecuencias absolutas f 1, f2,
..., fk; respectivamente. La media armónica de X es:
n n
XH H k k
f 1 f 2 ... f k ; n fi .
x1 x2 xk fi i 1 xi
i 1
Ejm. 19: Un equipo liviano de mina recorre los 10 kilómetros a razón de 30 km/h, y los 10
km, siguientes a razón de 60 km/h. Determinar la velocidad media durante todo el
recorrido.
30 60
Solución: Si X = = 45 km/h.
2
Pero la velocidad media es: la distancia total recorrida por el tiempo durante el proyecto.
A razón de 30 km/ h, gasta 20 minutos en 10 kilómetros iniciales, y a razón de 60 km/h,
gastó 10 minutos. Por tanto la unidad equipo liviano recorrió un total de 20 km en 20 + 10
= 30 min. 0.5 horas a velocidad media de:
20
= 40 km/h
0.5
n n
XH H
ie) Media Armónica entre dos velocidades: f1 f 2 ... f k k
x1 x2 xk f
i 1
i
xi
2 2 120
XH
(1/ 30) (1/ 60) (3 / 60) 3
40 km / h
2.10. MEDIA CUADRÁTICA ( X C )
Sean: X1, X2, ..., XK, valores de la variable X, asociadas a las frecuencias absolutas f1, f2, ...,
fK, respectivamente. La media cuadrática de “X” es:
1
k
2 k
f1 X 1 f 2 X 2 ... f k X k fi X i2 fX i i
2
k
XC i 1 i 1 ;n= f 1
n n n i 1
Observación.- la relación entre las medias es: H G X
34
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
Ejm. 20: En una distribución de frecuencias se multiplican los valores de la variable por 3
y se obtiene una media aritmética de 54; sí se suma 5 a los valores de la variable, se
obtiene una media cuadrática de 24. Calcule la media cuadrática de la variable original.
f1 X 1 f 2 X 2 ... f k X k fi X i2 fX i i
2
XC i 1 i 1
n n n
i) 3xi = yi → Y 3 X 54
54
X
3
X 18
ii) Sí: xi + 5 = Zi
k
n
k
ZC f i Z i2
i 1
24
n
n
Z
2
f i Z i2
24
C 2
i 1
n
Z
2
C
n n n
f i xi 5 fi xi2 10 xi 25 fx 10 fi xi f i 25
2 2
i i
i 1
i 1
i 1
576
n n n
n
ZC
2
fx 2
i i 10 f i xi f i 25
i 1
576
n
f X i2 f i xi fi
Z
2
C i
10 25 576
n n n
fn X
2
2
ZC i i
10 18 25 1 576
Z f X
2
2
C
i i
371
n
ZC
f i X i2
371
n
35
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
Z C 19.26
MEDIDAS DE DISPERSIÓN O CONCENTRACIÓN
DM (p) = f
i 1
i XI p
; donde n =
k
f i
i 1
n
La desviación:
Respecto a la media aritmética es:
k
DM ( X ) = f
i 1
i Xi X
; ó DM ( X ) = h
k
i Xi X
i 1
n
~
DM ( X ) = f i 1
i X i X%
; ó ~
DM ( X ) = h
k
i X i X%
i 1
n
1.
2.
36
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
Intervalos [0, 2 > [2, 4 > [4, 6 > [6, 8 > [8,10> [10, 12> [12, 14> [14, 16> [16, 18> [18, 20>
N° Estud. 1 2 2 3 6 12 10 8 4 2
Ejm. 21: La siguiente distribución muestra las notas finales en Estadística, obtenida por 50
estudiantes de la facultad de ing. de Minas de la UNA.
Hallar la desviación media con respecto a la media aritmética.
Solución:
Completando la distribución de frecuencias:
Intérvalos Marca de
de clase
fi
clase
f i xi xi X f i xi X
f i Xi X
;
DM X i 1
n
10
Se tiene: n f
i 1
i 50
10
Se tiene: X = fi X i
580
i 1
11 .6
n 50
155.2
DM ( X ) = 3.104
50
DM ( X ) = 3.104
37
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
f (X i i X )2
n
Var. X S 2 hi X i X
2
t 1
n 1 n 1
k
Donde: n f
i 1
i ; y h1 , h2 , ... , hk = frecuencias relativas.
Observación 1: La varianza en términos de la media poblacional “μ”:
k
f (X i i )2
N= f
k
es el tamaño de la población.
2 i 1
; i 1
i
N
Observación 2: Una fórmula alternativa para la Varianza muestral es:
k
fi ( Xi X ) 2
S2 i 1
;
n
f (X i i X )2
S2 var( x ) i 1
n 1
L L
n 1 n 1
38
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
7) .
68.27%
x
-S +S
X
b) El 95.45% de los casos están comprendidos entre X -2S y X +2S, esto es
aproximadamente 95% de los casos están situados dentro de dos unidades de
desviación estándar de la media.
95.45%
x
+2S
c)
X -2S
E
M
El 99.75%
X
de los casos están comprendidos entre X -3S y X +3S
BE
D
Eq
uat
ion 99.73%
.3
-
x
-3S +3S
X
39
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
1 k 1 k 2
S2
n 1 i 1
fi X i2 nX 2
y S
n 1 i1
fiX i2 n X
Solución: S
2 1 k
fi X i2 nX 2 ; fX i i
; también n f i
k
n 1 i 1 X
i 1
i 1
n
Completando la distribución de frecuencias:
Xi fi fiXi fiX i2
5 2 10 50
7 3 21 147
8 5 40 320
9 4 36 324
11 2 22 242
Total n = 16 129 1083
129
X 8.1 X 2 65.61
16
1
S 2 1083 16(65.61)
15
= 2.216 → S = 1.49
1 k 1 k
S2
n 1 i 1
f i ( X i X ) 2
=
n 1 i 1
f i di2 nd 2
1 k
S
n 1 i 1
f i di2 nd 2
C) Tercer método abreviado.- Para calcular la varianza se siguen los siguientes pasos:
40
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
X i Ot
Ui ; Donde: i = 1, 2, …, k
C
Ot = Origen de trabajo entre los puntos
medios de las clases.
C = Amplitud de clase
Ui = Valores transformados
Xi = Valores originales de la variable
1 k C2 k
i i
n 1 i 1
f (CU CU ) 2
fi (U i U )2
n 1 i 1
C2 k 2
S2
n 1 i 1
f iU i2 n U y
1 k 2
S C
n 1 i 1
f iU i2 n U
Ejm. 23: Dada la distribución de frecuencias de 147 estudiantes según su edad. Calcule la
desviación estándar “S”.
Edad [ 20, 30 > [ 30, 40 > [ 40, 50 > [ 50, 60 > [ 60, 70 >
N° Estudiantes 15 22 45 40 25
Solución: Para cálculos ordenados, conviene considerar los siguientes pasos:
Resultados que necesitamos para desarrollar las fórmulas por 2do. y 3er. Método
Abreviado.
1er. Paso:
Sean: Ot = 45 (marca de clase de intervalo que tiene la más alta frecuencia)
di = Xi – Ot,
Marca de
Intervalo fi di fi d i f i di2
Clase Xi
41
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
2do. Paso:
Por el 2do. Método Abreviado:
S
1 k
f i di2 n d 2 ; d
fd i i
2.585
n 1 i 1 n
1
S 22, 200 147(2.585) 2 12.055
146
3er. Paso:
Por el 3er. Método Abreviado:
X Ot
Ui i ; C = 10
C
Marca de
Intervalo fi Ui fi U i f iU i2
Clase Xi
[ 20, 30 > 15 25 -2 -30 60
[ 30, 40 > 22 35 -1 -22 22
-52
[ 40, 50 > 45 45 0 0
90
[ 50, 60 > 40 55 1 40 40
[ 60, 70 > 25 65 2 50 100
n=
TOTAL 38 222
147
1 k 2
f Ui
S C
n 1 i 1
fi U2i n U ;
U i
n
0.2585
1 38
2
S 12.055
2.13. MEDIDAS DE DISPERSIÓN RELATIVA
42
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
S
i) = 0.57 S = 0.57 X …………….. (1)
X
S
ii) 0.50 S 0.50( X 1,100) ……… (2)
( X 1,100)
(1) en (2):
0.57 X = 0.50 ( X + 1,100)
550
X = 7,857.14 (salario promedio antes del reajuste).
0.07
35(4,000) 165 X 2
7,857.14 = X p, =
200
luego:
(7857.14)(200) = 35(4000) + 165 X 2
1'571428 140000
X 2 =
165
X 2 = 8,675.32
DISTRIBUCIONES BIDIMENSIONALES
43
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
Donde:
fij = Veces q´ se repite el par (xi, yj), frec. absoluta del par (xi, yj); i = 1, …, k; j = 1, …, e.
e
fi. = f
j 1
ij = Total de pares con primera componente xi (i = 1, …, k)
k
f.j = f
i 1
ij = Total de pares con segunda componente yj (j = 1, …, e)
k e
n f ij = Número total de pares observados
i 1 j 1
Total n fi . Total n f. j
i 1 j 1
Ejm. 25: Analizar el comportamiento conjunto de las variables: (X) grado de instrucción;
(Y) de procedencia de los empleados del Ministerio de Energía y Minas (datos Tabla 3.2).
44
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
Ejm. 26: La distribución conjunta de las proporciones (frecuencias relativas) de los datos
de la tabla 3.2 con relación al total de las observaciones (n = 200) es:
TABLA 3.3
X Primaria Secundaria Superior Total
Y completa completa
Lima 20% 15% 10% 45%
Provincia 17.5% 7.5% 5% 30%
Otros 15% 7.5% 2.5% 25%
Total 52.5% 30% 17.5% 100%
40
Afirmamos: h11 x 100 = x 100 = 20% de los empleados son de Lima con primaria
200
completa.
45
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
35
h21 x 100 = x 100 = 17.5% de empleados son de provincias con primaria
200
completa, etc.
Porcentaje marginal = % totales de las filas y columnas de cada una de las variables X e Y.
Así: 45% son de Lima, 30% son de provincia, 25% son de otros.
Ejm. 27: La distribución de las proporciones de los datos de tabla 3.2 con relación al total
fi j
de cada columna: x 100
f .i
Tabla 3.4: Distribución en porcentaje con relación a los totales de cada columna de las
variables X e Y de la tabla 3.2
X Primaria Secundaria Superior Total
Y completa completa
Lima 38.1% 50% 57.1% 45%
Provincia 33.3% 25% 28.6% 30%
Otros 28.6% 25% 14.3% 25%
Total 100% 100% 100% 100%
f11 40
ie): x 100 = x 100 = 38.1% de empleados con primaria completa son de
f. 1 105
Lima.
f 21 35
x 100 = x 100 = 33.3% de provincias.
f. 1 105
f 31 30
x 100 = x 100 = 28.6% de otros (extranjero, etc.).
f. 1 105
i 1 j 1
f ij n
4)
j 1
f.j = f.1 + f.2 + …. + f.e = n
k e
5) hi = 1 y j 1
f.j = 1
i 1
k e k
6)
i 1 j 1
fij Xi =
i 1
fi . Xi
46
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
Sean (x1, y1); (x1, y2); ….; (x1, ye); (x2, y1); …; (xk, ye) valores de la variable bidimensional
(X, Y) con f11; f12; …; fke respectivamente.
k e
fi . xi
;
j 1
f. j y j
X i 1
Y
n n
k e
fi . ( xi X ) 2
;
j 1
f. j ( y j Y ) 2
S x2 i 1
S y2
n 1 n 1
k e
fi . ( xi X ) 2
; j 1
f. j ( y j Y ) 2
Sx i 1
SY
n 1 n 1
Sean (x1, y1), (x2, y2), …, (xk, ye) valores distintos de la variable (X, Y); con f11, f12, …, fke,
respectivamente. La Covarianza entre las variables X e Y es:
k e
Sxy = Cov X , Y
i 1 j 1
f i j ( xi X )( y j Y )
; n
k e
fi j
i 1 j 1
n
Observación: Sean (x1, y1), (x1, y2), …, (xk, ye) valores diferentes de la variable (X, Y) con
f11, f12, …, fke, respectivamente es:
1 k e
Sxy = Cov X , Y f i j xi y j X .Y
n i 1 j 1
Ejm. 28: En una encuesta realizada en una población se obtuvo la siguiente información,
con relación al # de habitantes (X) y dormitorios (Y) en una muestra de 50 viviendas.
47
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
Se pide:
a) Construir una tabla bidimensional
b) Hallar las frecuencias marginales
c) Hallar las frecuencias acumuladas
d) Hallar medias y varianzas marginales
Solución:
a) Tabla Bidimen. frec. Absoluta y marginal. b) c) Frecuencias
acumuladas
Dormit. (Y) Frecuencia Marg. Y
1 2 3 4 de “Xi” 1 2 3 4
Habit. (X) Totales (fi.) X
2 6 6 2 6 6 6 6
3 7 4 11 3 13 17 17 17
4 10 5 1 16 4 23 32 33 33
5 9 9 5 23 41 42 42
6 1 2 2 5 6 24 44 47 47
8 1 2 3 8 24 44 48 50
Frec. Marg. de “Yj”
total (f.J) 24 20 4 2 50 = n
d) Medias:
k e
fi . xi
208 ;
j 1
f. j y j
84
X i 1
4.16 Y 1.68
n 50 n 50
Varianzas Marginales:
1 k 1
Var X S
2
n 1 i 1
f i. xi2 n( X ) 2 =
49
976 50(4.16) 2 2.26
1 e 2 1
Var Y S f. j y j n(Y ) = 172 50(1.68) 2 0.63
2 2
n 1 j 1 49
Cuadro de desarrollo: Para aplicar las fórmulas (anterior); construir la siguiente tabla:
Y
48
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
(frec. Marginal) f. 1 f. 2 .… f .j .… f . e n fi j i 1 j 1
Frecuencia relativa de y
condicionada
a X = xi hy/x = xi fi1 fi2 .… fij .… fie 1
fi. fi. .… f.i.. .… fi.
49
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
condicionada a
y = yj
fx/y = yj f1j f2j .… fij .… fke f.j
Frecuencia relativa de x
condicionada a
Y = yj
hx/y = yj f1j f2j .… fij .… fkj 1
f. j f. j f. j f. j
Ejm. 29: En la región Puno, se observó el precio del Oro y la cantidad de producción
durante algunos años, obteniéndose la siguiente tabla.
X 35 30 40 45 48 60 50 44 54 56 42 46
y 100 150 120 200 160 200 150 200 120 150 100 120
Solución:
R 30
a) Rango de la variable X: R = 60-30 = 30; Amplitud de clase (C): C = ,C 6
k 5
Tabla bidimensional.
Y
100 120 150 160 200 Total
X
30, 36 1 - 1 - - 2
36, 42 - 1 - - - 1
42, 48 1 1 - - 2 4
48, 54 - - 1 1 - 2
54, 60 - 1 1 - 1 3
Total 2 3 3 1 3 n = 12
b) Distribuciones Marginales de X e Y:
X fi. Y f.j
30, 36 2 100 2
36, 42 1 120 3
42, 48 4 150 3
48, 54 2 160 1
54, 60 3 200 3
Total 12 Total 12
c) Dist. de X condicionada a; y = 150 es:
Intervalo
30, 36 36, 42 42, 48 48, 54 54, 60 Total
para X
50
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
1 0 0 1 1 3
fx/y = 150
hx/y = 150 1/3 0 0 1/3 1/3 1
K x e se verifica la igualdad:
f i . x f. j
fi j (para i = 1, …, k y j = 1, …, e)
n
Caso contrario, las variables X e Y son dependientes ó están asociadas.
Ejm. 30: Verificar si existe o no dependencia entre el sexo y carrera profesional escogida
por 400 alumnos de economía y administración de la UNA, los datos en la siguiente tabla:
Tabla 3.9: Distribución conjunta de los alumnos según el sexo (Y) y carrera (X)
Y
Masculino Femenino Total
X
Economía f11 = 169 f12 = 71 f1. = 240
Administración f21 = 111 f22 = 49 f2. = 160
Total f.1 = 280 f.2 = 120 400 = n
f1 . x f. 1 (240)(280)
Solución: f11 = 168 a f11 169
n 400
f x f. 2 (240)(120)
f12 = 1 . 72 71 f12
n 400
51
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
f 2 . x f. 1 (160(280)
f21 = 112 111 f 21
n 400
f 2 . x f. 2 (160)(120)
f22 = 48 49 f 22
n 400
Por tanto: Según los resultados no hay dependencia entre las dos variables.
yi (xi yi)
X
xi
Ejm. 31: Se tiene 5 agentes de una compañía “X” números de clientes (Y), números de
años de servicio (X), según la tabla. Trazar el diagrama de dispersión de estos datos.
Agente Años de servicio (X) Número clientes (Y)
A 4 58
B 6 66
C 7 74
D 8 70
E 10 82
Total 35 350
52
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
Ejm. 32: Ocho individuos fueron sometidos a una prueba sobre el conocimiento de un
idioma extranjero tomándose el tiempo para cada uno de ellos en aprender a operar una
máquina. Así las variables en estudio son:
X: resultado obtenido en la prueba (máximo, 100 puntos)
Y: tiempo en minutos necesarios para aprender a operar satisfactoriamente una máquina.
Trazar el diagrama de dispersión con los siguientes datos:
Indiv. X Y
50 353
2 57 378
3 66 365
4 75 344
5 79 347
6 81 391
7 85 355
8 95 358
Se observa que no hay ningún tipo de dependencia entre las dos variables
53
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
3.5.1 CORRELACIÓN
Determina el grado de reracionamiento entre las variables que se estudian.
1) Correlación directa o positiva: Las variables x e y, varían en un mismo sentido.
2) Correlación inversa o negativa: Las variables x e y, son en sentidos contrarios.
y y y
0 x 0 x 0 x
Las variables
3.5.2 x,COEFICIENT
y presentan una Dependencia lineal negativa Las variables no presentan
asociación lineal positiva. correlación
Sean (x1, y1); …, (xk, yk) variables estadística bidimensional (x, y) con f1, f2, …, fk,
respectivamente. El coeficiente de correlación muestral entre x e y es:
k
Sxy f ( x X )( y Y )
i i i
Corr x, y r = SxSy
i 1
k k ,
i 1
( f i ( xi X ) 2 )
i 1
f i ( yi Y ) 2
fi xi yi n X Y
r i 1
, ó
k k
i 1
fi x n X
2
1
2
i 1
f i y nY
2
i
2
k
n f i xi yi f i xi f i yi
r i 1
,,
k
n fi x1 f x n f i yi f y
2 2 2 2
i i i i
i 1
-1 0 1
correlación no hay correlación
perfecta (-) correlación perfecta (+)
54
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
COEFICIENTE DE CORRELACION:
Ejm. 32: La tabla presenta la información obtenida sobre 20 estudiantes, a cada uno de ellos se les tomó su peso y altura
Peso (Kgr.)
Xi 20.4 21.4 21.4 22 22.6 24.6 24.8 25.2 25.8 26 26.6 26.6 27.2 27.2 27.8 28 28 31.6 33.4
Altura (cm)
Yi 111 111 114 118 119 121 123 124 122 122 121 127 124 131 128 116 120 133 140
fi 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
Se pide:
a) Representar la información en un diagrama de dispersión.
b) Hallar el coeficiente de correlación entre X e Y.
Solución: a) Diagrama de dispersión de los datos: Altura Vs Peso
k
n fi xi yi f i xi f i yi
b) Coeficiente de correlación entre: r
i 1
k
2
k
2
n fi x1 f i xi n f i yi f i yi
2 2
i 1 i 1
Kgr. Altura Cm. fi fi Xi fi yi fi Xi fi yi fi Xi yi
Xi Yi
20.4 111 2 40.8 222 832.32 24642 4528.8
21.4 111 1 21.4 111 457.96 12321 2375.4
21.4 114 1 21.4 114 457.96 12996 2439.6
22.0 118 1 22.0 118 484.00 13924 2596.0
22.6 119 1 22.6 119 510.76 14161 2689.4
24.6 121 1 24.6 121 605.16 14641 2976.6
24.8 123 1 24.8 123 615.04 15129 3050.4
25.2 124 1 25.2 124 635.04 15376 3124.8
25.8 122 1 25.8 122 665.64 14884 3147.6
26.0 122 1 26.0 122 676.00 14884 3172.0
26.6 121 1 26.6 121 707.56 14641 3218.6
26.6 127 1 26.6 127 707.56 16129 3378.2
27.2 124 1 27.2 124 739.84 15376 3372.8
27.2 131 1 27.2 131 739.84 17161 3563.2
27.8 128 1 27.8 128 772.84 16384 3558.4
28.0 116 1 28.0 116 784.00 13456 3248.0
28.0 120 1 28.0 120 784.00 14400 3360.0
31.6 133 1 31.6 133 998.56 17689 4202.8
33.4 140 1 33.4 140 1115.56 19600 4676.0
Total 2325 20 511 2436 13289.64 297794 62678.6
55
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
3.5.3 REGRESION
Regresión es un método empleado para encontrar una función que se ajusta a una nube de
puntos (dispersión) para obtener una predicción aprox. De una variable apartir de la otra.
Así la regresión de la variable Y e X es:
Ŷ = f(x)
56
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
ŷ x
y = a0 + a2 x
Ajuste por mínimos cuadrados de una línea recta
Dada una ecuación lineal: y = a0 + a1 + e ó e = y – a 0 – a1X, donde e = error ó residuo entre
el modelo y las observaciones y Sr = ei2, (suma de los cuadrados de los residuos entre
“Y” medida y la “Y” calculada con el modelo lineal)
n n
Sr = Sr ei Sr ( yi a0 a1 x) ….. (*)
2 2
i 1 i 1
Para determinar los valores de a0 y a1 la ecuación (*) es diferenciada con respecto a cada
coeficiente.
Sr d n
I. i)
a0 a0 i 1
( yi a0 a1 x) 2
Sr d n
ii)
a1 a1 i1
( yi a0 a1 x) 2
Sr
II. 0
a0
Sr
0
a1
n n
III. na0 ( xi ) a1 yi
i 1 i 1
n
( xi ) a0 ( xi2 ) a1 xi yi
i 1
n xi yi xi . yi
a1
n xi2 ( xi ) 2
a1 y a1 x
57
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
Ejm. 34.- En una encuesta efectuada en una población se obtuvo la siguiente información,
relativo al número de habitantes (X) y número de dormitorios (Y) en una muestra de 50
viviendas. Los datos en la tabla: Número de habitantes (X) que viven en las casas con
número de dormitorios (Y).
58
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
f X Y nXY
i i i
S xy
ˆ i 1
k
2
; ˆ Y ˆ X .............
S
fX
i 1
i i
2
nX 2 x
Ejm. 35.- Se han estudiado las calificaciones de 200 alumnos en dos asignaturas:
Matemática I y Estadística, obteniéndose los siguientes resultados: X 13; Y 15
f X X
2
S 2
i i
4 S y2 2.25
X
n 1
Además se sabe que el coeficiente de correlación de ambas variables es: r = 0.90.
Se pide:
a) ¿Qué nota se puede predecir para un alumno que ha obtenido 14 de Matemática I,
en estadística?.
b) ¿Se puede decir que aquellos alumnos que obtienen mayor calificación en
Matemática I sean los mismos que obtienen mayor calificación en Estadística?.
c) ¿Cuál es la ecuación de la recta de regresión de X sobre Y?
Solución:
f X X
2
Sí , S 2
i i
4 Sí , S y2 2.25
X
n 1
Sy 2.25 1.5
Sx 42
59
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
S 2.7
ˆ XY2 0.675 ; 0.68
Sx 4
Por otro lado el coeficiente de correlación de esta ecuación es:
ˆ Y ˆ X
ˆ 15 0.68 13 6.16
b) Como r = 0.90 podemos decir que al aumentar las notas en matemática I (X);
aumentan también las notas en probabilidad y estadística (Y). Por consiguiente los
alumnos con mayor nota en matemática I, son los mismos que obtienen mayor
calificación en probabilidades y estadística.
S
Xˆ X XY2
Sy
y Y
2.7
Setiene : Xˆ 13 y 15
2.25
Xˆ 1.2 y 5
60
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
CAPÍTULO IV
ANALISIS COMBINATORIO
4.1. INTRODUCCION
Nociones básicas de la teoría matemática que estudia las diferentes técnicas de
conteo, conocido como análisis combinatorio.
aj
………………..
am
Ejm. 36.- Un conductor de un automóvil puede tomar cualquiera de las 5 rutas para ir de la
ciudad A a la ciudad B; y para ir de la ciudad B a la ciudad C puede tomar cualquiera de las
4 rutas y finalmente para ir de la ciudad C a la ciudad D tiene 6 rutas posibles. Si para ir
61
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
4.3. ARREGLOS
Ejm. 37.- ¿De cuantas maneras diferentes se pueden sentar 8 personas en una banca, con
capacidad para 5 personas?.
Solución: Se tiene n = 8 y k = 5, el número total de maneras diferentes que pueden
sentarse 8 personas en la banca, con capacidad para 5 personas es:
8! 8!
A58 8 8 1 8 2 8 3 8 4
8 5 ! 3!
8 7 6 5 4
6720
4.3.2 Arreglos con Repetición
Son aquellos arreglos en que un elemento cualquiera de los dados, puede repetirse
en el mismo grupo, el número de veces que se indique.
El número de todos los arreglos con repetición a formarse con n objetos tomados de k en k
es obtenido por la fórmula.
AR k
n
nk
Ejm. 38.- Un ómnibus parte de su paradero inicial con 6 personas a bordo y se detiene en
10 paraderos diferentes. ¿De cuántas maneras pueden bajar las 6 personas en los 10
paraderos, sí en un paradero pueden bajar cualquier número de personas?
Solución: La 1ra. Persona puede bajar en cualquiera de los 10 paraderos.
La 2da., 3ra. Lo mismo y la 6ta. De igual forma, entonces el número total de
maneras es:
62
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
AR 6
10
106 1'000, 000
4.4. PERMUTACIONES
Solución:
a) Sí un miembro puede sentarse en cualquier parte al rededor de la mesa, entonces
los 11 miembros restantes, pueden sentarse de P11 = 11! Maneras
Pnc 11!
11 11 1 11 2 11 3 11 4 11 5 11 6 11 7 11 8 11 9 11 10
39 '916,800
b) Considerando las dos personas que han de ir juntas como una sola. Entonces hay 11
personas para sentarse en círculo, que le pueden hacer de 10! Maneras. Las dos
personas consideradas como una sola pueden a su vez ordenarse entre sí de 2!
Maneras. Por tanto, el número de ordenaciones de 12 miembros del consejo de
facultad alrededor de una mesa circular con 2 miembros determinados sentados
juntos es:
(10!)(2!) = 3’628,800
63
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
k1 + k2 + … + km = n
El número de maneras en que un conjunto de n elementos puede ser dividido en m pares
ordenados (particionado en m subconjuntos) de los cuales, el primero contiene k,
elementos, el segundo k2 elementos, etc., que se obtiene con la siguiente fórmula:
n!
Pnk1 ,k2 ,...,km
k1 ! . k2 ! ... km !
Ejm. 41: ¿De cuántas maneras diferentes se pueden ordenar 3 bolas blancas, 4 rojas y 4
negras en una fila, si las bolas de igual color no se distinguen entre sí?
4.5. COMBINACIONES
7! 7!
C47
4! 7 4 ! 4!*3!
5, 040
35
24 6
64
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
ii) Las reglas de los arreglos y permutaciones puede ser aplicable si los objetos se
toman de un solo conjunto y de cada reordenamiento diferente de los k objetos
de un grupo conduce a un suceso simple diferente.
iii) La regla de las combinaciones puede ser aplicable si los objetos se toman de un
solo conjunto y el reordenamiento de los objetos no produce un nuevo suceso
simple.
65
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
CAPITULO V
PROBABILIDADES
5.1. EXPERIMENTO
Un experimento es toda acción sobre la cuál vamos a realizar una medición u
observación, es decir cualquier proceso que genera un resultado definido.
66
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
5.5.3 Combinación
Es una selección de objetos si el orden no es importante, cada uno de los resultados
se denominan combinación. Por ejemplo sea el conjunto de elementos Z = {A, B, C}, las
combinaciones de 2 elementos que se pueden seleccionar son: AB, AC, BC.
El número de combinaciones de n objetos tomados de k en k es igual a:
n!
Ckn
k ! n k !
Ejm. 43: Un inversionista desea seleccionar tres inversiones de total 10 inversiones. ¿De
cuántas maneras diferentes puede invertir el inversionista?.
5.5.4 Permutación
El número de permutaciones de n objetos tomados de k en k es igual a:
n!
Pkn
nk!
67
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
68
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
Ejm. 47: Sea el espacio muestral S = {CC, CS, SC, SS}. Se lanzan dos monedas al aire
¿Cuál es la probabilidad de que salga 1 cara?.
Ejm. 48: Se tiene información acerca de los ingresos mensuales por venta de concentrado
de Oro en la minera Picos blancos en los últimos 30 meses:
Las probabilidades en este caso se asignan mediante las frecuencias relativas.
Ingresos Frecuencia Probabilidad
5000 4 4/30 = 0.1333
6000 7 7/30 = 0.2333
7000 10 10/30 = 0.333
8000 6 6/30 = 0.2
9000 3 3/30 = 0.1
Total 30 1
Ejm. 49: Cierta familia tiene 3 hijos, y sabemos que al menos dos de ellos son niñas.
Suponiendo que los nacientes de niños y niñas son igualmente probables, además que el
sexo del hijo mayor no afecta en ningún modo al sexo del hijo menor, calcule la
probabilidad de que la familia tenga tres niñas.
Solución:
El espacio muestral, S = { MMM, MMH, MHM, HMM, MHH, HMH, HHM, HHH }
Donde: M = mujer y H = hombre
Sean los eventos A: la familia tiene 3 niñas B: la familia tiene por lo menos dos niñas
69
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
70
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
f ( x) 0
f ( x) 1
Ejm. 50: Se lanzan 3 monedas al aire. Determinar la distribución de probabilidades del
número de caras.
El espacio muestral asociado a este experimento es: S = { ccc, ccs, csc, scc, css, scs, ssc, sss
}
La probabilidad de cada punto muestral es 1/8, es decir P(ccc) = P(ccs) = … = P(sss) = 1/8
Definimos la v.a. X: número de caras, que puede tomar los valores Rx = {0, 1, 2, 3}
X Eventos f(x)
0 { sss } 1/8
1 { css, scs, ssc } 3/8
2 { ccs, csc, scc } 3/8
3 { ccc } 1/8
X f(x) F(x)
0 1/8 1/8
1 3/8 4/8
2 3/8 7/8
3 1/8 8/8
71
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
n
E X i (X
2
2
)2 f ( X i ) .
i 1
i
5.12.5 Valor esperado o esperanza matemática de una función de una variable aleatoria
Sea X variable con función probabilidad f(x), y sea Y = g(X) una función real de la
variable X; esperanza matemática de g(X) se define:
E (Y ) E g X g x f x
i i
xRx
5.13. Variable aleatoria continua
Una variable aleatoria continua es aquella variable cuyos valores pueden ser cualquier
número real dentro de un intervalo cualquiera.
Función de densidad
Una función se dice que es de densidad si cumple las dos propiedades siguientes:
f x 0
f x dx 1
P a x b
b
f x dx
a
La probabilidad entre dos valores dados a y b, es el área bajo la curva entre los puntos a y
b.
72
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
y por ello al calcular la probabilidad de un intervalo no afectara nada el que este sea abierto
o cerrado por cualquiera de sus extremos, pues estos son puntos y por tanto de probabilidad
nula:
P a x b P a x b P A x b P a x b
La función de distribución de la V. A. continua, F, se define como:
F: IR → [0, 1]
x F x P X x f t dt
73
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
BIBLIOGRAFIA
74