Escolar Documentos
Profissional Documentos
Cultura Documentos
Practicum de Estadstica
1o de Bachillerato
En esta unidad vamos a llevar a cabo un estudio preliminar de los datos recogidos es el calculo de
diferentes magnitudes caractersticas de la distribucion. Se definen entonces diversas medidas que seran
capaces de resumir toda la informacion recogida a un pequeno numero de valores. Estas medidas resumen
van a permitir comparar nuestra muestra con otras y dar una idea rapida de como se distribuyen los datos.
Es evidente que todas estas medidas solo pueden definirse para variables cuantitativas.
1. Medidas de centralizacion
Estas medidas tienen por objeto sustituir todos los valores de una distribucion por un valor unico
representativo de todos ellos.
En el caso de tener los N datos en k intervalos de clase, podemos determinar las marcas de cada clase
como la media entre el valor mas alto y mas bajo del intervalo. De este modo, la media se puede calcular,
a partir de dichas marcas de clase ci y el numero ni de datos en cada intervalo:
k
X
ci n i
i=1
x = .
N
Sin embargo, hay que indicar que la expresion anterior es solamente aproximada. En el caso de que sea
posible, es mas exacto para el calculo de la media, no realizar el agrupamiento en intervalos.
2. Decidir el numero
k de intervalos de clase en que se van a agrupar los datos: k puede ser entero
mas proximo a N , donde N es el numero total de medidas.
3. Determinar la amplitud de cada intervalo: dividir el recorrido entre el numero de intervalos.
4. Determinar los extremos de los intervalos de clase: Evidentemente el extremo superior de cada
intervalo ha de coincidir con el extremo inferior del siguiente. Es importante que ninguna observacion
coincida con alguno de los extremos, para evitar as una ambiguedad en la clasificacion de este dato.
5. Calcular las marcas de clase de cada intervalo: valor medio entre los lmites inferior y superior de
cada intervalo de clase.
Practica 2a
En una maternidad se han tomado los pesos (en kg) de 50 recien nacidos, obteniendo los siguientes
resultados:
2.8 3.2 3.8 2.5 2.7 3.7 1.9 2.6 3.5 2.3
3.0 2.6 1.8 3.3 2.9 2.1 3.4 2.8 3.1 3.9
2.9 3.5 3.0 3.1 2.2 3.4 2.5 1.9 3.0 2.9
2.4 3.4 2.0 2.6 3.1 2.3 3.5 2.9 3.0 2.7
2.9 2.8 2.7 3.1 3.0 3.1 2.8 2.6 2.9 3.3
2. Si ningun valor de la variable tiene una frecuencia relativa acumulada igual a 0.5, la mediana sera
el primer valor de xj con frecuencia relativa acumulada mayor que 0.5.
Practicum de Estadstica Medidas estadsticas 3
Practica 2b
Considera los pesos de la maternidad del ejercicio anterior:
1. Calcula su mediana.
2. Calcula su moda. Tiene sentido este calculo? Cual sera mas adecuado? Calculalo.
1.4. Cuartiles
Vamos a generalizar ahora el concepto de mediana. Hemos visto que esta era el valor de la variable
que divida a la muestra (ordenada) en dos mitades iguales. Definimos ahora los cuartiles como los tres
valores que divididen la muestra en cuatro partes iguales.
As los cuartiles Q1 , Q2 y Q3 seran tres valores que hagan que por debajo de ellos esten respectivamente
el 25 %, el 50 % (coincide con la mediana) y el 75 % de los valores.
Como vemos, el segundo cuartil, Q2 coincide con la mediana, pero para calcular los otros dos reali-
zaremos un proceso similar al de la mediana pero considerando unas frecuencias relativas acumuladas de
0.25 y 0.75 respectivamente.
Practica 2b
Considera los pesos de la maternidad del ejercicio anterior:
1. Calcula su mediana.
2. Calcula su moda. Tiene sentido este calculo? Cual sera mas adecuado? Calculalo.
3. Determina los tres cuartiles que dividen los datos.
2. Medidas de dispersion
Las medidas de centralizacion vistas anteriormente reducen la informacion recogida de la muestra a
un solo valor. Sin embargo, dicho valor central, o medio, sera mas o menos representativo de los valores
de la muestra dependiendo de la dispersion que las medidas individuales tengan respecto a dicho centro.
Para analizar la representatividad de las medidas de centralizacion se definen las llamadas medidas de
dispersion. Estas nos indicaran la variabilidad de los datos en torno a su valor promedio, es decir, si se
encuentran muy o poco esparcidos en torno a su centro.
2.1. Recorrido
Es la diferencia entre el valor maximo y mnimo que toma la variable estadstica.
2.3. Varianza ( 2 )
Al igual que la desviacion media, esta basada en un valor promedio de las desviaciones respecto
a la media. En este caso, en vez de tomar valores absolutos de las desviaciones, para evitar as que se
compensen desviaciones positivas y negativas, se usan los cuadrados de las desviaciones. Esto hace ademas
que los datos con desviaciones grandes influyan mucho en el resultado final. Se define entonces la varianza
de una muestra como:
Xk
2 = x2i fi x2 .
i=1
Practica 2c
Considera los pesos de la maternidad del ejercicio anterior:
1. Calcula la varianza de los datos.
2. Calcula la desviacion tpica.
3. Razona si la media es representativa.
Ejercicio
Entra en Invertia y considera los valores ultimos alcanzados por el Ibex-35 durante el primer
trimestre de este ano (1-Ene, 31-Mar).