Você está na página 1de 14

MEDIDAS DE TENDENCIA CENTRAL

Y DE POSICIÓN

Son aquellas que localizan el “centro” de una distribución, indicando el valor alrededor
del cual tienden a concentrarse ó distribuirse las demás observaciones. Lo que se
persigue es conseguir un valor que sea representativo del conjunto de datos que se está
analizando.

1. MEDIA ARITMÉTICA.

Se recomienda su uso cuando los datos presentan alta simetría y poca dispersión.
Notación:
Sea X una variable cuantitativa, el promedio de X se denotará por: M(X) ó X

Para su cálculo se usará las siguientes expresiones:

 Para datos No agrupados:


n

∑x
i =1
i
Xi representan las observaciones
y “n” la cantidad de datos a
x=
n promediar.

 Para datos agrupados:


k

∑x f i i
Xi representan las marcas de
x= i =1 clase y “fi” las frecuencias
n absolutas simples.

Propiedades:

 La media aritmética de una cantidad constante es la misma constante:


M(k) = k
 La media de una variable a la que se le suma o resta una constante equivale a
la media de la variable mas o menos dicha constante:
M(X ± k) = M(X) ± k
 La media de una variable multiplicada por una constante equivale a la media
de la variable multiplicada por dicha constante:
M(kX) = kM(X)
 En general, para dos constantes a y b tenemos:
M(aX ± b) = aM(X) ± b

2009 02 30
Ejemplo:

Se sabe que los ingresos mensuales que perciben los trabajadores de una empresa
tienen un promedio de 2800 nuevos soles, determine el nuevo ingreso promedio
que se obtendría luego de realizar los siguientes aumentos:
a) Los ingresos de los trabajadores se incrementan en 250 nuevos soles.
b) Los ingresos se incrementan en un 7.5%
c) Los ingresos se incrementan en un 12.5% más una bonificación de 125
nuevos soles.

Solución:

En cada caso el ingreso se denotará por X y el nuevo ingreso lo representaremos


por Y
a) Y = X + 250 ⇒ M(Y) = M(x) + 250 = 2800 + 250 = 3050
b) Y = X + 0.075X = 1.075X ⇒ M(Y) = M(1.075x) = 1.075*2800 = 3010
c) Y = X + 0.125X + 125 = 1.125X + 125 ⇒ M(Y) = M(1.125x +125)
M(Y) = M(1.125x +125) = 1.125*2800 + 125 = 3275

2. MEDIANA

Se recomienda su uso cuando existe valores “extremos”, es decir, algunas


observaciones muy altas o bajas respecto de la mayoría de datos.

 Para datos No agrupados:

Como primer paso, los datos deben ser ordenados en orden creciente ó
decreciente, luego se bebe determinar el valor que se ubica en la posición
central. En caso de no coincidir el valor central con un dato, se tomará el
promedio de los datos centrales.
Si denotamos las observaciones ordenadas por X1, X2, X3, ... , Xn , la mediana
pude representarse por:

Me = X n +1 Si n es impar Es el dato de la posición [(n+1)/2]


2

X n +X n Es el promedio de los datos que se


+1
Me = 2 2
Si n es par encuentran en la posición: [n/2] y
2 [(n/2)+1]

La mediana es un valor tal que por lo menos el 50% de las observaciones son
menores ó iguales a este valor.

2009 02 31
 Para datos agrupados:

Lo primero es determinar el intervalo en el que se ubica la mediana al que


llamaremos intervalo mediano. Dicho intervalo es aquel en el que se supera o
iguala por primera vez a n/2 en la columna Fi

w n 
Me = L me +  − Fme−1 
f me  2 

Donde:
Lme : límite inferior del intervalo mediano
fme: frecuencia absoluta simple del intervalo mediano
Fme-1 : frecuencia absoluta acumulada anterior al intervalo mediano

3. MODA.

Es el valor que se presenta con mayor frecuencia.

 Para datos No agrupados: Valor que presenta una mayor frecuencia.

 Para datos Agrupados: El primer paso es determinar el intervalo en el que


se ubica la moda al que llamaremos intervalo modal. Dicho intervalo es aquel
que presenta la mayor frecuencia absoluta simple.

 d1 
Mo = L mo +   w ; d1 = fi − fi −1 d 2 = fi − fi +1
 d1 + d 2 

Donde:
Lmo : límite inferior del intervalo modal
fi: frecuencia absoluta simple del intervalo modal
fi-1: frecuencia absoluta simple anterior al intervalo modal
fi+1: frecuencia absoluta simple posterior al intervalo modal

4. MEDIA PONDERADA

Se utiliza cuando los datos a promediar no tienen la misma importancia relativa en el


conjunto de datos, es decir, algunos datos tiene mayor importancia, peso ó
ponderación dentro del conjunto de observaciones.

Se usará la siguiente expresión para su cálculo:


n

∑ X .w
i =1
i i Donde: Wi representa el peso ó
Xp = n ponderación de cada observación Xi.
∑w i =1
i

2009 02 32
5. CUANTILES

Se define así a un número real que divide a una distribución en dos partes con
porcentajes especificados debajo y sobre éste valor.
Para su cálculo, los datos deben estar previamente ordenados.

Los cuantiles más importantes son:

Percentiles: dividen a los datos en 100 partes porcentualmente iguales.


Deciles: dividen a los datos en 10 partes porcentualmente iguales y
Cuartiles: dividen a los datos en 4 partes porcentualmente iguales.

PERCENTILES

 Para datos no agrupados:

Primero debe ordenarse los datos en orden creciente ó decreciente. Luego,


para hallar el percentil Pk se sugiere los siguientes pasos:
La posición i que ocupa el percentil Pk en la lista
 k 
de datos ordenados está determinada por la i= . n
 100 
expresión:

Si i no es entero, se redondea por exceso al valor entero inmediato superior.


Este valor hallado indica la posición que ocupa el k-ésimo percentil.
Si i es entero, el k-ésimo percentil se obtiene promediando los datos
ubicados en las posiciones i é i+1.

 Para datos agrupados en intervalos:

La posición que ocupa el percentil Pk en la lista de datos ordenados esta


 k 
determinada por la expresión:  n
 100 
El intervalo en el cual se aplique la fórmula siguiente es aquel en el que se
supere o iguale a (kn/100) por primera vez en la columna Fi . El valor del
percentil se determina por la expresión:

w  k.n 
Pk = Li +  − Fi −1 
fi  100 

NOTA: El percentil k-ésimo es un valor tal que por lo menos el K% de las


observaciones son menores ó iguales a este valor

2009 02 33
EJERCICIOS:

1. Como método de acondicionamiento cardiovascular


se sugiere a los atletas lesionados y a las personas que
desean un programa de ejercicios aeróbicos de bajo
impacto, el correr en agua. En un estudio para
determinar la relación entre la cadencia de ejercicio y
la frecuencia cardiaca, se midió la frecuencia cardiaca
de 20 voluntarios saludables a 48 ciclos por minuto
(al ciclo consta de dos etapas). Los datos aparecen a
continuación:

87 109 79 80
96 95 92 92
98 101 91 78
112 94 98 94
107 81 96

a) Sin agrupar los datos en una tabla de frecuencias: calcule e interprete el


promedio Mediana y moda para los datos mostrados.
b) Utilizando las expresiones estudiadas para percentiles determine e interprete los
percentiles: 25, 50 y 75.
c) Utilizando Excel calcule e interprete los percentiles 25 50 y 75. Compare
resultados con el procedimiento anterior y comente su apreciación.

2. El ministerio de economía y finanzas ha recopilado información relativa a las


personas por sector económico, según sexo y edad en una ciudad europea con el
propósito de realizar una evaluación de los diferentes sectores que intervienen en la
economía local. Los datos para el año 2006 se expresan en miles de personas en la
siguiente tabla:

EDAD

SECTOR Hombres Mujeres


18-28 28-38 38-48 48-58 18-28 28-38 38-48 48-58

Agricultura 1 3 50 20 0 1 12 5
Industria 2 4 120 15 0 3 25 1
Construcció
3 10 84 9 0 1 5 0
n
Servicios 4 18 216 33 4 20 219 22

Utilizando las expresiones estudiadas para datos agrupados, determine e interprete:


Media, Mediana y Moda para la edad de las personas agrupadas en el sector
industria.

2009 02 34
3. Al estudiar el consumo diario de leche, se verificó que, en cierta región, 20% de las
familias consumen menos e un litro, 50% de las familias consumen entre 1 y 2 litros,
20% consumen entre 2 y 3 litros y el restante porcentaje consume entre 3 y 5 litros.
a) ¿Cuál es la variable bajo estudio?
b) Presente la información adecuadamente en una tabla de frecuencias.
c) Construya un histograma de frecuencias.
d) Calcule e interprete la media y mediana
a) ¿Cuál es el valor del primer cuartil y qué representa en este caso?

4. En una clase del curso Estadística general hay 40 estudiantes varones con una edad
promedio de 20 años; las mujeres en promedio son 10% más jóvenes que los
hombres. Calcule la cantidad de mujeres que existe en este curso si además se sabe
que la edad promedio de toda la clase es de 19 años.

5. En los cuadros que se muestran a continuación se muestran los resultados parciales


obtenidos luego de realizar una encuesta socioeconómica en la capital aplicada a 400
personas.

Numero de personas encuestadas según NSE y


País Principal de destino

NSE
País principal
de A B C D
destino
EE.UU 5 9 4 4
FRANCIA 5 6 6 4
ITALIA 4 6 8 2
NO VIAJO 6 39 138 154

Ingreso promedio de personas encuestadas según NSE y

País principal de destino

NSE
País principal
de
destino A B C D
EE.UU 8101.60 4590.94 2903.45 1732.30
FRANCIA 8142.37 4869.06 3054.94 1648.30
ITALIA 8397.98 5046.72 2863.18 1820.65
NO VIAJO 8432.46 4417.66 2469.43 1462.86

Con la información proporcionada:

2009 02 35
a) Calcule e interprete el ingreso promedio de las personas clasificadas en el nivel
socioeconómico C.
b) Si para el próximo año se espera que los ingresos en el NSE C aumenten 12% y
en el NSE D en 5%, determine un solo valor que represente el nuevo salario
promedio que se espera para ambos NSE.
c) Realice un gráfico que le permita comparar el número de personas de los NSE C
y D según el lugar principal de destino.

6. La siguiente tabla muestra los costos de internamiento en una clínica local


expresado en dólares para una muestra de pacientes.

Intervalos Xi fi Fi hi Hi
170 - 220 25
220 - 270 0
270 - 320 50
320 - 370 25
370 - 420 25

a) Grafique el correspondiente polígono de frecuencias relativas.


b) Calcule e interprete la media, la mediana y la moda de los costos de
internamiento.
c) Para aquellos pacientes que tengan un costo de internamiento esté considerado
dentro del grupo del 10% de los mayores costos, existe un descuento especial.
¿Cuánto debe ser como mínimo costo de internamiento de un paciente para que
pueda tener un descuento especial? (obtenga el resultado usando el concepto de
percentiles).

2009 02 36
MEDIDAS DE DISPERSIÓN

Son aquellas que cuantifican que tan dispersos ó concentrados se encuentran los datos
respecto de una medida de tendencia central.

RANGO INTERCUARTIL

Mide la dispersión del 50% de datos que se ubican hacia el centro de una
distribución, eliminando la influencia de los valores extremos.
RI = Q3 − Q1
donde:
Q1: Es el percentil 25 ó Cuartil 1
Q3: Es el percentil 75 ó Cuartil 3

VARIANZA

Se define como el promedio de los cuadrados de las desviaciones de los datos


respecto de su media aritmética. Mide el grado de dispersión o variación de los
valores de una variable con respecto a su media aritmética.

Notación:
Varianza muestral: S2
Varianza poblacional: σ2

Se debe tener especial cuidado a la hora de calcular esta medida de dispersión,


teniendo bien claro si los datos corresponden a información muestral ó
información poblacional.
Las unidades en las que queda expresada la varianza son unidades al cuadrado,
por lo que para su interpretación será necesario tomar la raíz cuadrada al valor
obtenido. Por ejemplo, si la edad promedio se determinó como 21 años, la
varianza obtenida podría ser 16 años2.

DESVIACIÓN ESTÁNDAR

Se define como la raíz cuadrada positiva de la Varianza.

Fórmulas para la varianza muestral:

Para datos no agrupados Para datos agrupados


2 2
n
 _
 k
 _

∑  xi − x  ∑ fi  x i − x 
s 2 = i =1   s 2 = i =1  
n −1 n −1

2009 02 37
Fórmulas para la varianza poblacional:

Para datos no agrupados Para datos agrupados


2 2
N
 _
 k
 _

∑  xi − x  ∑ fi  x i − x 
σ 2 = i =1   σ2 = i =1  
N N

Propiedades:

 La varianza de una variable X es una cantidad no negativa:


V(X) ≥ 0
 La varianza de una cantidad constante es cero:
V(k) = 0
 La varianza de una variable multiplicada por una constante equivale a la
varianza de la variable multiplicada por dicha constante al cuadrado:

V(kX) = k2.V(X)
 En general, para dos constantes a y b tenemos:

V(aX ± b) = a2.V(X)

Ejemplo:

Se sabe que los ingresos mensuales que perciben los trabajadores de una empresa
tienen un promedio de S/. 4800 con una dispersión de S/. 1200, determine la
nueva desviación estándar del ingreso que se obtendría luego de realizar los
siguientes aumentos:
a) Los ingresos de los trabajadores se incrementan en 250 nuevos soles.
b) Los ingresos se incrementan en un 7.5%
c) Los ingresos se incrementan en un 12.5% más una bonificación de 125
nuevos soles.

Solución:

En cada caso el ingreso se denotará por X y el nuevo ingreso lo representaremos


por Y
a) Y = X + 250 ⇒ V(Y) = V(x) + 0 = 12002
⇒ σy = 1200
b) Y = X + 0.075X = 1.075X ⇒ V(Y) = V(1.075x) = 1.0752*12002
⇒ σy = 1.075*1200 = 1290
c) Y = X + 0.125X + 125 = 1.125X + 125 ⇒ V(Y) = V(1.125x +125)
V(Y) =1.1252*V(y) ⇒ σy = 1.125*1200 = 1350

2009 02 38
COEFICIENTE DE VARIACION

Las medidas de variación estudiadas son medidas de variación absolutas pues


éstas se expresan en las mismas unidades que la variable original (excepto la
varianza que se expresa en unidades al cuadrado). El coeficiente de variación es
una medida de dispersión relativa libre de unidades por lo que es útil para
comparar la variabilidad de dos o mas grupos de datos expresados en distintas
unidades de medida.

Su calculo se determina por:

S S
C.V. = o C.V. =   x100%
X X

σ σ 
C .V.= o C.V. =   x100%
µ µ 

Ejemplo:

A dos grupos de estudiantes de psicología se les somete a una evaluación luego de


haber sido sometidos a un proceso de aprendizaje empleando métodos distintos. Los
resultados se muestran en los siguientes cuadros. Determine ¿cuál grupo ha obtenido
evaluaciones más homogéneas?

Grupo 1 Grupo 2
Puntaje promedio 89 93
Desviación estándar 17 18

Solución:

2009 02 39
EJERCICIOS:

1. Ante las últimas reformas en el sector farmacéutico, el


responsable de una farmacia quiere realizar un estudio
sobre los precios de los fármacos para los dos
semestres del último año teniendo en cuenta las
unidades vendidas. La información de que dispone es
la siguiente:

Precio del fármaco Unidades vendidas


(euros) Primer semestre Segundo semestre
0–3 1645 1473
3-6 1342 1592
6-9 846 980
9 - 12 613 767
12 – 20 740 831
20 - 30 384 226

Realizar un estudio descriptivo (utilizando pare ello medidas de tendencia central y de


dispersión que usted considere convenientes) que permita comparar los ingresos de
ambos semestres.

2. Una empresa de construcción utiliza tres tipos de trabajadores en obra (operario,


maestro y capataz). La empresa actualmente tiene a su cargo dos obras, en las que
los trabajadores participan de acuerdo a la siguiente tabla.

Tipo de Salario por No. de horas trabajadas


trabajador hora (S/.) Obra 1 Obra 2
Operario 3 50 40
Maestro 6 20 35
Capataz 10 10 25
¿Cuál de las obras tiene un mayor promedio de salario por hora?

3. Considere que X é Y representan dos variables cuantitativas continuas y que los


promedios de ambas son 1425 y 1860 respectivamente. Si a la primera variable se le
incrementa el 2.5% y se le resta 620, mientras que a la segunda variable se de
descuenta el 0.75%, determine:
a) Los nuevos promedios de las variables.
b) Sabiendo que se hicieron 85 mediciones de la primera variable y 97 mediciones
de la segunda, determine el promedio de las 182 mediciones.

2009 02 40
4. Las ventas en miles de soles durante 50 semanas de los productos principales A y B
de una compañía poseen las siguientes distribuciones de frecuencias:

Ventas Número de Ventas Número de


A semanas B semanas
11 - 20 2 2-4 5
20 - 30 8 4-6 14
30 - 40 25 6-8 21
40 - 50 9 8 - 10 7
50 - 60 6 10 - 12 3

¿Qué producto tiene un nivel de ventas más homogéneo?

5. Un fisioterapeuta deseaba comparar tres métodos que tenían por objetivo enseñar a
los pacientes el uso de un mecanismo protético. El fisioterapeuta intuía que la
rapidez de comprensión sería diferente en pacientes de diferentes edades. A
continuación se muestra las frecuencias obtenidas luego de recolectar información
para los métodos de enseñanza A y B:

Número de pacientes por método de enseñanza


y grupo de edades

Método de enseñanza Edad para el Método de frecuencias


Grupo de edades enseñanza C
(años) A B 12 10
12 – 22 9 13 20 12
22– 32 11 10 28 18
32– 42 10 12 36 32
42 – 52 12 11 44 44
52 – 62 11 14 52 14
60 5

a. Para el método A calcule el porcentaje de pacientes que tienen como máximo 25


años.
b. Para el método C calcule el coeficiente de variación.
c. Compare la homogeneidad para los métodos de enseñanza A y B.

6. ¿Perdemos la memoria con la edad? En un estudio relacionado con los efectos de la


glucosa en la memoria de hombres y mujeres de edad mayor, C.A. Manning y
colaboradores hicieron pruebas con voluntarios respecto a la memoria a largo plazo.
Durante la prueba leían una lista de palabras a cada persona, después le pedían que
recordara tantas como pudiera, le señalaban las que había omitido y registraban el
número de palabras que recordaba. Los resultados obtenidos fueron agrupados en
una tabla de frecuencias por género que se muestra a continuación:

2009 02 41
Género Género
femenino masculino
Intervalos Xi fi fi
40 - 55 47.5 10 10
55 - 70 62.5 45 25
70 - 85 77.5 80 45
85 - 100 92.5 25 85
100 - 115 107.5 10 15

a) Usando la información presentada, ¿se puede concluir que existe mayor


homogeneidad de resultados para las personas de género femenino? Sustente su
respuesta numéricamente.
b) Considerando la frecuencia conjunta, determine los límites que permiten
clasificar a las personas en las categorías A, B y C de la siguiente manera:
• El 30% de las personas que menor número de palabras recordaban se les
denominará “grupo A”
• El 20% de las personas que mayor número de palabras recordaban se les
denominará “grupo C”

7. El ministerio de economía y finanzas ha recopilado información relativa a las


personas por sector económico, según sexo y edad en una ciudad europea con el
propósito de realizar una evaluación de los diferentes sectores que intervienen en la
economía local. Los datos para el año 2006 se expresan en miles de personas en la
siguiente tabla:

EDAD

SECTOR Hombres Mujeres


18-28 28-38 38-48 48-58 18-28 28-38 38-48 48-58

Agricultura 1 3 50 20 0 1 12 5
Industria 2 4 120 15 0 3 25 1
Construcción 3 10 84 9 0 1 5 0
Servicios 4 18 216 33 4 20 219 22

a) Presente los datos en una tabla de frecuencias que muestre “hombres por sector
económico”
b) Elabore un histograma de frecuencias para la variable “edad”
c) Determine si la edad es más homogénea para el género masculino.

2009 02 42
8. La presión intraocular es la presión de los líquidos del ojo, denominados líquidos
intraoculares, sobre la capa transparente que forma la superficie anterior del ojo
(córnea) y la cubierta externa blanca del globo ocular. Para una muestra de pacientes
de una clínica particular se obtuvo los siguientes resultados:

Presión intraocular (mm Hg) fi


12 2
13 2
14 8
15 18
16 20
17 10

¿Qué tipo de distribución presenta la variable presión intraocular? Sustente


numéricamente su respuesta haciendo uso de las medidas de tendencia central.

9. Los salarios medios mensuales en cinco diferentes sectores de la industria


farmacéutica son dados en la tabla siguiente. Calcule e interprete el salario medio de
toda la industria.

Sector A B C D E
Porcentaje del empleo industrial 30 25 20 20 5
Salario medio mensual en el sector 320 350 320 300 280

2009 02 43

Você também pode gostar