Escolar Documentos
Profissional Documentos
Cultura Documentos
Estadstica
descriptiva
Antes de abordar en firme, el modulo de geoestadistica que viene con ArcGIS, es
necesario recordar algunos conceptos de estadstica, en particular de estadstica
descriptiva, que son necesarios para realizar un anlisis geoestadstico con el software.
Tablas de Frecuencias
Una forma de presentar ordenadamente un grupo de observaciones, es a travs de
tablas de distribucin de frecuencias. Para construir una tabla de frecuencia se deben
ordenar los datos de menor a mayor e incluir los siguientes parmetros.
Distribucin normal
Una distribucin de probabilidad sigue una distribucin normal, cuando la
representacin grfica de su funcin de densidad es una curva positiva continua,
simtrica respecto a la media, de mximo en la media, y que tiene 2 puntos de
inflexin situados a ambos lados de la media y a distancia igual a la desviacin
estndar, es decir de la forma:
Propiedades.
Tiene una nica moda, que coincide con su media y su mediana.
La curva normal es asinttica al eje de abscisas.
Es simtrica con respecto a su media. Segn esto, para este tipo de variables
existe una probabilidad de un 50% de observar un dato mayor que la media, y un 50%
de observar un dato menor.
Cuanto mayor sea la desviacin estndar, ms se dispersarn los datos en torno
a la media y la curva ser ms plana. Un valor pequeo de este parmetro indica, por
tanto, una gran probabilidad de obtener datos cercanos al valor medio de la
distribucin.
El coeficiente de sesgo es igual a cero (0).
La curtosis es igual a cero (0).
Para la aplicacin de los mtodos geoestadsticos es necesario verificar la funcin de
probabilidad del conjunto de datos se aproximen a un comportamiento normal, esto lo
veremos ms adelante en el anlisis exploratorio de los datos.
Con el fin de que este sea un ejemplo prctico para abordar el anlisis geoestadistico
con ArcGIS, ilustraremos todo los conceptos con un ejemplo a partir de datos de
monitoreo de niveles piezomtricos de agua subterrnea que se presentan en la tabla
siguiente. Para ello se seguirn los siguientes pasos.
Media. Se le suele llamar promedio, se define como la suma de los valores de todas
las observaciones divididas por el nmero total de datos. Se denota con o X.
En su clculo intervienen todos los datos, por lo tanto, se ven influenciados por la
variacin de cualquiera de ellos. En particular, es sensible a los valores extremos, pues
estos producen grandes modificaciones.
Pozo NP Pozo NP
1 2,0076 28 6,0000
2 2,1313 29 6,1496
3 2,2000 30 8,0054
4 2,2100 31 8,0724
5 2,4449 32 8,0827
6 2,4946 33 9,0188
7 2,8554 34 9,2078
8 2,9876 35 10,1156
9 3,2347 36 10,2553
10 3,2930 37 10,8373
11 3,3317 38 11,5066
12 3,3506 39 11,8241
13 3,4291 40 12,2268
14 3,6896 41 12,3280
15 3,7990 42 12,8004
16 3,9651 43 14,6244
17 3,9980 44 14,9301
18 4,2921 45 16,6351
19 4,4900 46 18,1630
20 4,5286 47 19,1410
21 4,6227 48 24,0632
22 4,6637 49 24,2354
23 5,0499 50 25,5698
24 5,1009 51 27,1534
25 5,2438 52 30,0800
26 5,3826 53 35,3188
27 5,8690
Suma 497,0104
Media (suma/53) 9,3776
Mediana. Es el valor de la serie de datos que deja la mitad de las observaciones por
debajo de ella y la otra mitad por encima, es decir, divide al conjunto de datos en dos
partes iguales y se denota por Me.
Dado que slo depende del orden de los datos, tiene la ventaja de que no es sensible a
los valores extremos.
1. Calcular: n/2
2. La mediana ser el valor de la variable cuya frecuencia absoluta acumulada primero
iguale o supere a N/2. Este ser el intervalo en el que se encuentra la mediana.
3. Aplicar la formula sustituyendo los valores correspondientes.
Fi=29
Fi-1=8
Li= 2.0076
a= 4.17
Moda. Es el dato que ms veces se repite, es decir, aquel dato o rango que presenta
mayor frecuencia absoluta. Puede haber ms de una moda en una distribucin. Se
denota por Mo.
Para datos agrupados, tenemos lo siguiente.
Li=2.0076
a=4.17
d2=29-7 = 22
d1=29-0 = 29
b. Medidas de dispersin
Las medidas de dispersin indican la mayor o menor concentracin de los datos con
respecto a las medidas de centralizacin. Nos dan una idea sobre la homogeneidad o
que tan agrupado estn los datos.
S = 7.774 = 60.44