Você está na página 1de 3

Gui on del M odulo 2 de Estadstica

1. EMPEZAMOS CON LOS PAR AMETROS ESTADISTICOS. MEDIDAS DE CENTRALIZACI ON


Los par ametros estadsticos son valores num ericos que permiten obtener una informaci on resumida de una variable
estadstica. Podemos destacar dos tipos:
1. Par ametros de centralizaci on. Son valores representativos de todos los datos, respecto de distintos puntos vista.
Estudiaremos la moda (Mo), la mediana (Me), y la media ( x).
2. Par ametros de dispersi on. Son valores que miden c omo de separados que est an los datos.
Las calculadoras que incorporan funciones estadsticas permiten obtener de forma autom atica todos estos valores. Sin
embargo, para familiarizarnos con ellos, no viene mal empezar calcul andolos de forma manual.
En primer lugar nos restrigiremos a variables estadsticas para datos simples, aunque para datos agrupados en interva-
los razonaremos de forma an aloga representando a veces al intervalo por su marca de clase.
La moda (Mo) es aquel o aquellos datos con mayor frecuencia absoluta, y por ello, corresponde con el dato o datos m as
frecuentes de la muestra.
En cuanto a la mediana (Me), si ordenamos todos los datos de menor a mayor, incluyendo todas las repeticiones, esta
correspondera al dato que ocupa la posici on central o en el caso de que existan dos en el centro, el valor medio o semisuma
de estos.
Esta forma de calcular la mediana es viable cuando tenemos un n umero peque no de datos. En general, podremos
calcular esta a partir de la tabla que incluye la columna de las frecuencias absolutas acumuladas F
i
. Para ello, siendo como
siempre N el n umero de datos, buscamos
N
2
entre los valores de las frecuencias absolutas acumuladas. Tenemos dos casos:
1. Si dicho valor no se corresponde con ninguna frecuencia absoluta acumulada, la mediana Me coincide con el dato
x
i
cuya frecuencia absoluta acumulada supera por primera vez a
N
2
.
2. Si dicho valor corresponde con la frecuencia absoluta acumulada F
i
de un dato x
i
, la mediana Me ser a el punto
medio o semisuma de este dato x
i
y el siguiente dato x
i+1
, esto es,
Me =
x
i
+x
i+1
2
.
Volveremos a hablar de la mediana cuando presentemos los cuartiles, deciles y percentiles.
La ultima de las medidas de centralizaci on que presentaremos es la media x, que correspondera a lo que en fsica se
conoce como el centro de masas, y no es m as que:
x =
x
1
f
1
+x
2
f
2
+. . . +x
n
f
n
N
=

x
i
f
i
N
.
Para su c alculo resulta muy util la disposici on de los datos en una tabla que incluira una columna para los distintos
datos x
i
, otra para las frecuencias absolutas f
i
y una nueva columna para x
i
f
i
, que seran los productos de los valores
correspondientes a la misma la de las columnas anteriores. La media corresponde a la suma de los valores de esta ultima
columna

x
i
f
i
, partido de N.
2. PAR AMETROS ESTADISTICOS. MEDIDAS DE DISPERSI ON
Existen variables estadsticas con comportamientos distintos que tienen la misma media, y lo mismo ocurre con las otras
medidas de centralizaci on. Por ello, resulta necesario calcular par ametros que muestren como se distribuyen los datos. As,
introduciremos algunos par ametros de dispersi on, que nos informan sobre como de dispersos se encuentran los datos
con respecto de la media. Esos ser an la desviaci on media, varianza, desviaci on tpica y el coeciente de variaci on.
Supongamos que nuestra variable estadstica X toma los distintos valores x
1
, x
2
, . . . , x
n
con frecuencias absolutas
f
1
, f
2
, . . . , f
n
respectivamente, y x es la media. Entonces se dene:
1. La desviaci on media es:
DM(X) =

|x
i
x|f
i
N
.
Dado que |x
i
x| es la distancia del dato x
i
a x, la desviaci on media es un promedio de las distancias de los
datos a la media, y por lo tanto, en cierto sentido, mide lo separados en promedio que est an los datos con respecto
de la media.
2. La varianza se dene como
Var(X) =
2
=

|x
i
x|
2
f
i
N
=

x
2
i
f
i
N
x
2
.
La primera de las expresiones indica que la varianza tambi en mide c omo de separados est an con respecto de la
media, la segunda es la que utilizaremos para calcular la varianza a partir de una tabla.
3. La desviaci on tpica es dt(X) = =

V ar(X).
4. El coeciente de variaci on se dene como CV(X) =

x
.
Para calcular todos estos par ametros, completaremos con nuevas columnas la tabla que hemos utilizado para calcular
la media. Para ello, incluiremos una nueva columna donde calcularemos para cada dato el valor de |x
i
x|, una columna
para |x
i
x|f
i
. La suma de los elementos de esta columna

|x
i
x|f
i
partido de N ser a el valor de la desviaci on media.
Ahora incluiremos una nueva columna con los valores de x
2
i
f
i
, y utilizaremos la suma de estos para incluirlos en la
expresi on de la varianza. De esta, calcularemos la desviaci on tpica y despu es la variaci on media.
3. CUARTILES, DECILES Y PERCENTILES
La mediana de una variable estadstica corresponde a un datoque deja la mitad de los datos por debajo de el.
Vamos a generalizar este concepto para denir los cuartiles, deciles y percentiles, para ello ahora dividiremos los datos
en 4 para los cuartiles, 10 para los deciles, y 100 para los percentiles.
Para los cuartiles, al dividir por 4, tendremos un datoque deja por debajo de el la primera cuarta parte de los datos,
un valor que deja la 2/4 parte de los datos, y otro para la 3/4 parte de los datos. Estos valores se denotan por Q
1
, Q
2
y Q
3
.
Esta sera la idea intuitiva, pero al igual que para la media, no siempre existe tal dato, y entonces denimos el cuartil, como
tambi en el decil o el percentil, como un promedio.
Con la idea de que Q
1
es aquel valor que deja la cuarta parte de los datos por debajo de el, y razonando como para la
media (de hecho, estoy haciendo un copia y pega), dividiremos el n umero de datos entre 4,
N
4
, y utilizando la tabla con
las frecuencias absolutas acumuladas se tiene dos posiblidades:
1. Si dicho valor no corresponde a ninguna frecuencia absoluta acumulada, el primer cuartil Q
1
coincide con el dato
x
i
cuya frecuencia absoluta acumulada supera por primera vez a
N
4
.
2. Si el valor es igual a la frecuencia absoluta acumulada F
i
de un dato x
i
, el primer cuartil Q
1
ser a el punto medio o
semisuma de este dato x
i
y el siguiente dato x
i+1
, esto es, Q
1
=
x
i
+x
i+1
2
.
De la misma forma calcularamos el segundo cuartil Q
2
con
2 N
4
=
N
2
, observa que este coincide con la mediana, y el
tercer cuartil Q
3
con
3 N
4
.
Con la misma idea calcularamos los deciles, al dividir los datos entre 10 obtendramos D
1
, D
2
, . . . , D
9
, donde D
k
se
calcula a partir del valor
k N
10
y la columna de las frecuencias absolutas acumuladas, y los percentiles P
1
, P
2
, . . . , P
99
, con
la misma idea y procedimiento usando el valor
k N
100
.

Você também pode gostar