Você está na página 1de 8

Estadstica Bsica

Medidas de posicin
Media Aritmtica : Promedio aritmtico de los datos, es decir promedia las leyes de los datos presentes en dicho conjunto en el cual todos
tiene el mismo peso ( igual ponderacin).

Mediana : Es el valor donde el 50% de los datos es menor y el 50% es mayor, es decir divide a la muestra en dos partes iguales.

Cuantiles o Percentiles : Valores que dividen la poblacin en partes de igual nmero de datos. La mediana divide la poblacin en dos
partes, los cuartiles en cuatro partes ( la mediana coincide con el segundo cuartil), as con las siguientes divisiones.
Mnimo y Mximo : Establecen el rango en el cual se distribuyen los datos.

Medidas de dispersin
Varianza : Promedio aritmtico de la desviacin cuadrtica entre cada valor y la media. Esta medida cuantifica la dispersin del histograma
y se expresa en el cuadrado de la unidad de la variable en estudio.

Desviacin estndar : Raz cuadrada de la varianza; se expresa en la misma unidad que la variable en estudio. Representa cuan dispersos
se encuentran los datos, a mayor valor mayor dispersin y viceversa.
Coeficiente de variacin : Razn entre la desviacin estndar y la media. De acuerdo a estudios realizados por SME Mining
Engineering Handbook se llego a la conclusin que el coeficiente de variacin (CV) es un parmetro muy importante al momento de poder
interpretar la distribucin de las leyes de un yacimiento y que puede resumirse en la siguiente tabla:

C.V. = Desviacin Estndar / Media

CV
0.0 - 0.25
0.25 - 1.0
1.0 - 2.0
> 2.0

Interpretacin
Caso Simple. Leyes distribuidas simtricamente. La estimacin
de Recursos es fcil. La mayora de los mtodos funcionarn.
Distribuciones sesgadas con moderada dificultad en la
estimacin de recursos. Las distribuciones son tipicamente
lognormal.
Distribuciones altamente sesgadas con un gran rango de leyes.
Dificultad a la hora de estimar los recursos locales.
Distribuciones altamente errticas, datos sesgados o mltiples
poblaciones. La estimacin local es difcil de estimar o
imposible de estimar.

Medidas de forma
Asimetra : Es una medida de forma de una distribucin, la que permite identificar y describir la manera como los datos tienden a reunirse de
acuerdo con la frecuencia con que se hallen dentro de la distribucin. Permite identificar las caractersticas de la distribucin de datos sin
necesidad de generar el grfico.

Curtosis o apuntamiento : La curtosis mide el grado de agudeza o achatamiento de una distribucin con relacin a una distribucin
normal. Adems determina el grado de concentracin que presentan los valores en la regin central de la distribucin.

Tipos de Distribuciones
Distribucin normal o funcin de densidad de probabilidad gausiana: es la curva conocida
Comnmente como campana y es simtrica alrededor de la media.

Distribucin Lognormal: si la variable x es transformada usando el logaritmo y estos valores


Transformados tienen una distribucin normal, se dice que la variable tiene una distribucin
lognormal.

Histograma : Es una representacin grfica de una poblacin muestral, la cual se separa por intervalos
(clases) que cubre todo el dominio de las muestras.
Resumen para FE
P rueba de normalidad de A nderson-D arling
A -cuadrado
V alor P <

18

27

36

45

54

63

393.47
0.005

M edia
D esv .Est.
V arianza
A simetra
Kurtosis
N

23.376
11.455
131.209
1.01790
1.04726
26544

M nimo
1er cuartil
M ediana
3er cuartil
M ximo

2.275
14.890
21.344
29.450
68.730

Grfico de probabilidades : Este grfico es utilizado para reconocer multiples poblaciones, para lo cual es
necesario entender la divisin del grfico de probabilidades.
Las distribuciones de las leyes generalmente no son normales, sino ms bien lognormales.
Por lo tanto si hay dos tipos de mineralizacin, se puede esperar dos subpoblaciones distribuidas
lognormalmente. Ej. Para el cobre: Sfuros y xidos, o para el hierro: estril, baja-mediana y alta ley.

CDF emprica de FE

CDF emprica de FE

Normal

Lognormal
Media
Desv.Est.
N

100

23.38
11.45
26544

Porcentaje

60

40

60

40

20

20

10

20

30
FE

40

50

60

70

10

20

30

40

50

60

Grfica de probabilidad de FE

Normal - 95% de IC

Lognormal - 95% de IC
Media
Desv .Est.
N
AD
Valor P

99.99
99

23.38
11.45
26544
393.470
<0.005

Ubic.
Escala
N
AD
Valor P

99.99
99

95
Porcentaje

95

80
50
20

80
50
20

0.01

0.01

-40

-20

20
FE

70

FE

Grfica de probabilidad de FE

Porcentaje

3.032
0.5003
26544

80

80
Porcentaje

Ubic.
Escala
N

100

40

60

80

10

100
FE

3.032
0.5003
26544
24.849
<0.005

Anlisis Bi-varial
Correlacin: es una medida de similitud entre variables o items.
Modo-R: tiene que ver con similitud entre variables.
Modo-Q:tiene que ver con la similitud entre pares de la variable.

R = cov(x,y)/(desv. est. x * desv. est. y)

-1 < R < 1

Anlisis de regresin : Es una tcnica estadstica utilizada para estudiar la relacin entre variables.
Hay situaciones en que es necesario ajustar una lnea recta a un set de datos pareados.

Y = 0 + 1 X +

.
.

Donde 0, 1 son, respectivamente, el intercepto y la pendiente del modelo de regresin y es un error


aleatorio. Utilizando el mtodos de los mnimos cuadrados.
n

1 =

i =1
n

i =1

n xi yi xi y i
i =1

0 = y 1 x

n x i2 ( x i ) 2
i =1

i =1

Una vez que se ajusta la recta de regresin, en lugar del error aleatorio, se cuenta con un valor observado
que es llamado residual, el cual se representa por ri o por

ei

= y i y i

Estimacin de la varianza del error


La varianza del error, representada por 2 es desconocida y se debe estimar usando los
residuales. Un estimador insesgado de 2 es s2, llamado tambin el cuadrado medio del
Norte
error.
FEMAG = - 4.122 + 1.036*FE
60

( yi y i ) 2
s2 =

i =1

n2

ei
=

i =1

n2

R2 = 94.87%
FEMAG

40

20

0
0

20

40
FE

60

80

Anlisis Multivariado
Regresin mltiple: En estadstica la regresin lineal o ajuste lineal es un mtodo matemtico que modela
la relacin entre una variable dependiente Y, las variables independientes Xi y un trmino aleatorio .
Este modelo puede ser expresado como:

Anlisis discriminante: Es una tcnica estadstica multivariante, cuya finalidad es


describir (si existen) las diferencias entre grupos de objetos sobre los que se observan variables
(variables discriminantes). Ms concretamente, se comparan y describen las medias de las variables
clasificadoras a travs de los grupos.

Anlisis de factores : Es una tcnica estadstica de reduccin de datos usada para explicar las correlaciones
entre las variables observadas en trminos de un nmero menor de variables no observadas llamadas
factores. Las variables observadas se modelan como combinaciones lineales de factores ms expresiones
de error.

Você também pode gostar