Você está na página 1de 4

Unidad 2: Medidas estadsticas

Practicum de Estadstica

1o de Bachillerato

En esta unidad vamos a llevar a cabo un estudio preliminar de los datos recogidos es el calculo de
diferentes magnitudes caractersticas de la distribucion. Se definen entonces diversas medidas que seran
capaces de resumir toda la informacion recogida a un pequeno numero de valores. Estas medidas resumen
van a permitir comparar nuestra muestra con otras y dar una idea rapida de como se distribuyen los datos.
Es evidente que todas estas medidas solo pueden definirse para variables cuantitativas.

1. Medidas de centralizacion
Estas medidas tienen por objeto sustituir todos los valores de una distribucion por un valor unico
representativo de todos ellos.

1.1. Media aritmetica (x)


Supongamos que tenemos una muestra de tamano N , donde la variable estadstica x toma los valores
x1 , x2 , . . . , xN . Se define la media aritmetica x, o simplemente media, de la muestra como:
N
X
xi
i=1
x = .
N
Es decir, la media se calcula sencillamente sumando los distintos valores de x y dividiendo por el
numero de datos. En el caso de que los diferentes valores de x aparezcan repetidos, tomando entonces los
valores x1 , x2 , . . . , xk con frecuencias relativas f1 , f2 , . . . , fk , la media podra expresarse como:
k
X
x = xi fi .
i=1

En el caso de tener los N datos en k intervalos de clase, podemos determinar las marcas de cada clase
como la media entre el valor mas alto y mas bajo del intervalo. De este modo, la media se puede calcular,
a partir de dichas marcas de clase ci y el numero ni de datos en cada intervalo:
k
X
ci n i
i=1
x = .
N
Sin embargo, hay que indicar que la expresion anterior es solamente aproximada. En el caso de que sea
posible, es mas exacto para el calculo de la media, no realizar el agrupamiento en intervalos.

Agrupamiento por clases de un conjunto de datos:


El realizar el estudio mediante el agrupamiento en intervalos de clase simplifica el trabajo, pero tambien
supone una perdida de informacion, ya que no se tiene en cuenta como se distribuyen los datos dentro de
cada intervalo. Para que dicha perdida sea mnima, es necesario elegir con cuidado los intervalos. Aunque
no existen ningunas reglas estrictas para la eleccion de los intervalos, los pasos a seguir son:
1. Determinar el recorrido, o rango, de los datos: diferencia entre el mayor y el menor de los valores
que toma la variable.
1
Practicum de Estadstica Medidas estadsticas 2

2. Decidir el numero
k de intervalos de clase en que se van a agrupar los datos: k puede ser entero
mas proximo a N , donde N es el numero total de medidas.
3. Determinar la amplitud de cada intervalo: dividir el recorrido entre el numero de intervalos.
4. Determinar los extremos de los intervalos de clase: Evidentemente el extremo superior de cada
intervalo ha de coincidir con el extremo inferior del siguiente. Es importante que ninguna observacion
coincida con alguno de los extremos, para evitar as una ambiguedad en la clasificacion de este dato.
5. Calcular las marcas de clase de cada intervalo: valor medio entre los lmites inferior y superior de
cada intervalo de clase.

Practica 2a
En una maternidad se han tomado los pesos (en kg) de 50 recien nacidos, obteniendo los siguientes
resultados:
2.8 3.2 3.8 2.5 2.7 3.7 1.9 2.6 3.5 2.3
3.0 2.6 1.8 3.3 2.9 2.1 3.4 2.8 3.1 3.9
2.9 3.5 3.0 3.1 2.2 3.4 2.5 1.9 3.0 2.9
2.4 3.4 2.0 2.6 3.1 2.3 3.5 2.9 3.0 2.7
2.9 2.8 2.7 3.1 3.0 3.1 2.8 2.6 2.9 3.3

1. Calcula la media de los pesos de los ninos.


2. Agrupa los datos por clases.
3. Realiza la tabla de frecuencias de los datos agrupados en intervalos, indicando la marca de cada
clase.

4. Realiza una representacion grafica (histograma) de los datos.


5. Calcula la media a partir de las marcas de clase e indica la diferencia entre el valor obtenido con
las marcas de clase y el obtenido directamente.

1.2. Mediana (Me )


Se trata de una medida central tal que, con los datos ordenados de menor a mayor, el 50 % de los
datos son inferiores a su valor y el 50 % de los datos tienen valores superiores. Es decir, la mediana divide
en dos partes iguales la distribucion de frecuencias o, graficamente, divide el histograma en dos partes de
areas iguales.

1.2.1. Datos no agrupados


En este caso, y suponiendo que tenemos los datos ordenados, la mediana sera el valor central, si N is
impar, o la media aritmetica de los dos valores centrales, si N es par.

1.2.2. Datos agrupados


En este caso, pueden darse dos situaciones:
1. Si alguno de los valores de la variable xj tiene una frecuencia relativa acumulada Fj = 0,5; el valor
de la mediana sera la media entre dicho valor y el siguiente, xj+1 :
xx + xj+1
Me = .
2

2. Si ningun valor de la variable tiene una frecuencia relativa acumulada igual a 0.5, la mediana sera
el primer valor de xj con frecuencia relativa acumulada mayor que 0.5.
Practicum de Estadstica Medidas estadsticas 3

1.3. Moda (Mo )


Se define la moda Mo de una muestra como aquel valor de la variable que tiene una frecuencia maxima.
En otras palabras, es el valor que mas se repite. Hay que indicar que puede suceder que la moda no sea
unica, es decir que aparezcan varios maximos en la distribucion de frecuencias.
En el caso de variables continuas agrupadas en intervalos de clase existira un intervalo en el que la
frecuencia sea maxima, llamado intervalo modal.

Practica 2b
Considera los pesos de la maternidad del ejercicio anterior:
1. Calcula su mediana.
2. Calcula su moda. Tiene sentido este calculo? Cual sera mas adecuado? Calculalo.

1.4. Cuartiles
Vamos a generalizar ahora el concepto de mediana. Hemos visto que esta era el valor de la variable
que divida a la muestra (ordenada) en dos mitades iguales. Definimos ahora los cuartiles como los tres
valores que divididen la muestra en cuatro partes iguales.
As los cuartiles Q1 , Q2 y Q3 seran tres valores que hagan que por debajo de ellos esten respectivamente
el 25 %, el 50 % (coincide con la mediana) y el 75 % de los valores.
Como vemos, el segundo cuartil, Q2 coincide con la mediana, pero para calcular los otros dos reali-
zaremos un proceso similar al de la mediana pero considerando unas frecuencias relativas acumuladas de
0.25 y 0.75 respectivamente.

Practica 2b
Considera los pesos de la maternidad del ejercicio anterior:

1. Calcula su mediana.
2. Calcula su moda. Tiene sentido este calculo? Cual sera mas adecuado? Calculalo.
3. Determina los tres cuartiles que dividen los datos.

2. Medidas de dispersion
Las medidas de centralizacion vistas anteriormente reducen la informacion recogida de la muestra a
un solo valor. Sin embargo, dicho valor central, o medio, sera mas o menos representativo de los valores
de la muestra dependiendo de la dispersion que las medidas individuales tengan respecto a dicho centro.
Para analizar la representatividad de las medidas de centralizacion se definen las llamadas medidas de
dispersion. Estas nos indicaran la variabilidad de los datos en torno a su valor promedio, es decir, si se
encuentran muy o poco esparcidos en torno a su centro.

2.1. Recorrido
Es la diferencia entre el valor maximo y mnimo que toma la variable estadstica.

2.2. Desviacion media respecto a la media aritmetica (Dx )


Se define esta como la media aritmetica de las diferencias absolutas entre los valores de la variable y
la media aritmetica de la muestra:
Xk
Dx = |xi x| fi .
i=1
Practicum de Estadstica Medidas estadsticas 4

2.3. Varianza ( 2 )
Al igual que la desviacion media, esta basada en un valor promedio de las desviaciones respecto
a la media. En este caso, en vez de tomar valores absolutos de las desviaciones, para evitar as que se
compensen desviaciones positivas y negativas, se usan los cuadrados de las desviaciones. Esto hace ademas
que los datos con desviaciones grandes influyan mucho en el resultado final. Se define entonces la varianza
de una muestra como:
Xk
2 = x2i fi x2 .
i=1

2.4. Desviacion tpica ()


La varianza no tiene las mismas unidades que los datos de la muestra. Para conseguir las mismas uni-
dades se define la desviacion tpica (algunas veces llamada desviacion estandar) como la raz cuadrada
de la varianza: v
u k
uX
= =t2 x2i fi x2 .
i=1

Practica 2c
Considera los pesos de la maternidad del ejercicio anterior:
1. Calcula la varianza de los datos.
2. Calcula la desviacion tpica.
3. Razona si la media es representativa.

Ejercicio
Entra en Invertia y considera los valores ultimos alcanzados por el Ibex-35 durante el primer
trimestre de este ano (1-Ene, 31-Mar).

1. Realiza la tabla de frecuencias de los datos, agrupando por intervalos.


2. Realiza una representacion grafica apropiada que indique la evolucion del Ibex-35 en el tiempo.
3. Calcula la media de los datos directamente y a traves de las marcas de cada clase. Compara ambos
resultados.
4. Determina los cuartiles de la distribucion de datos.
5. Indica el valor de la moda.
6. Calcula la desviacion tpica de los datos indicando si la media (calculada directamente) es repre-
sentativa respecto de la muestra.
7. Analiza los datos obtenidos y haz un comentario al respecto.

Você também pode gostar