Você está na página 1de 5

ESTADÍSTICA I – Mg.Sc.

Fernando Martín Toribio Román

TEMA 3: DISTRIBUCIÓN DE FRECUENCIAS, MEDIDAD DE TENDENCIA CENTRAL Y MEDIDAS NO


CENTRALES

Objetivo: Agrupar datos en frecuencias y describir sus medidas de tendencia central.

DISTRIBUCIÓN DE FRECUENCIA

La distribución de frecuencia es la representación estructurada, en forma de tabla, de toda la


información que se ha recogido sobre la variable que se estudia.

Variable Frecuencias absolutas Frecuencias relativas


(Valor) Simple Acumulada Simple Acumulada
x x x x x
X1 n1 n1 f1 = n1 / n f1
X2 n2 n1 + n2 f2 = n2 / n f1 + f2
... ... ... ... ...
Xn-1 nn-1 n1 + n2 +..+ nn-1 fn-1 = nn-1 / n f1 + f2 +..+fn-1
Xn nn Sn fn = nn / n Sf

Siendo X los distintos valores que puede tomar la variable.


Siendo n el número de veces que se repite cada valor.
Siendo f el porcentaje que la repetición de cada valor supone sobre el total

Tenemos la siguiente tabla de frecuencias que se debe de completar en los ejercicios y la simbología
usada es:

fi = Frecuencia absoluta (indica la cantidad de datos que se encuentran esa clase es decir una
cantidad del total).

fri = Frecuencia relativa (es un porcentaje de los datos totales)

fri = fi / Nº total de datos

pi = Frecuencia porcentual (viene a ser fri x 100 y nos da en porcentaje)

Característica Frecuencia absoluta Frecuencia relativa Frecuencia porcentual


evaluada
fi fri pi
En esta parte
colocamos los
datos evaluados.
TOTAL n Acá debe sumar 1.000 Acá debe sumar 100 %

Nota: Recuerda que el porcentaje siempre debe dar 100 % ni mas ni menos.

Para el caso de datos cuantitativos continuos donde el número de datos es alto usamos la siguiente tabla:
ESTADÍSTICA I – Mg.Sc. Fernando Martín Toribio Román

Característica Marca de Frecuenci Frecuenci Frecuenci Frecuenci FREC. FREC.


clase a a relativa a a Porcentu Acum..porcentu
Evaluada absoluta acumulad acumulad al al
a a relativa
(intervalos de absoluta % %
clase) Mi fri Fri
fi Fi pi Pi
En esta parte
van las marcas
de clase.

LI1 – LI2 M1 f1 fr1 F1 Fr1 p1 P1

LI2 –LI3 M2 f2 fr2 F2 Fr2 p2 P2

LI3-LI4 M3 f3 fr3 F3 Fr3 p3 P3

TOTAL n 1,000 100,00

Donde:

n = número de datos

K = número de clases K = 1 + 3.3 log n

A = amplitud A = X maximo – X mímino

TIC = Tamaño de intervalo de clase TIC = A / K

LI1 = X min LI2 = LI1 + TIC LI3 = LI2 + TIC LI4 = LI3 + TIC …………….

M1 = (LI1 + LI2) / 2 M2 = (LI2 + LI3) / 2 M3 = (LI3 + LI4) / 2 .................................

fr1 = f1 /n fr2 = f2 / n fr3 = f3 / n fr4 = f4 / 4 ................................................

F1 = f1 F2 = F1 +f2 F3 = F2 + f3 F4 = F3 + f4 ………………………………

Fr1 = fr1Fr2 = Fr1 + fr2 Fr3 = Fr2 + fr3 .......................................

p1 = fr1 x 100 p2 = fr2 x 100 p3 = fr3 x 100 ……………………………

P1 = p1 P2 = P1 + p2 P3 = P2 + p3 ……………………………………
ESTADÍSTICA I – Mg.Sc. Fernando Martín Toribio Román

Nota: Los valores de K se redondea al entero. Igualmente el valor de TIC se redondea aun decimal.

Con los valores de la Frecuencia porcentual % (pi) se realiza el Histograma de frecuencias, generalmente
en el eje X va el valor de las características que se han evaluado, y en el eje Y el valor en porcentaje de
pi. De este gráfico llamado Histograma de Frecuencias se obtiene el Polígono de Frecuencias.

La Ojiva o polígono de frecuencias acumuladas: se dibuja utilizando los valores de la Frecuencia


acumulada relativa (Fri) o con el valor de la Frecuencia acumulada porcentual (Pi), y el valor en el eje X
de la característica evaluada.

MEDIDAS DE TENDENCIA CENTRAL

Son llamadas las medidas que agrupan los datos alrededor de la media, entre ellas tenemos a las
siguientes:

1.- Media: es el valor medio ponderado de la serie de datos. Se pueden calcular


diversos tipos de media, siendo las más utilizadas:
a) Media aritmética: se calcula multiplicando cada valor por el
número de veces que se repite. La suma de todos estos productos se
divide por el total de datos de la muestra:
(X1 * n1) + (X2 * n2) + (X3 * n3) + .....+ (Xn-1 * nn-1) + (Xn * nn)
Xm = ---------------------------------------------------------------------------------------
n
b) Media geométrica: se eleva cada valor al número de veces que
se ha repetido. Se multiplican todo estos resultados y al producto final
se le calcula la raíz "n" (siendo "n" el total de datos de la muestra).

2.- Mediana: es el valor de la serie de datos que se sitúa justamente en el centro de la


muestra (un 50% de valores son inferiores y otro 50% son superiores).
No presentan el problema de estar influido por los valores extremos, pero en cambio no
utiliza en su cálculo toda la información de la serie de datos (no pondera cada valor por
el número de veces que se ha repetido).
3.- Moda: es el valor que más se repite en la muestra.

Medidas de posición no centrales:

Las medidas de posición no centrales permiten conocer otros puntos característicos de la distribución que
no son los valores centrales. Entre otros indicadores, se suelen utilizar una serie de valores que dividen la
muestra en tramos iguales

CUANTILES: CUARTILES, DECILES Y PERCENTILES


ESTADÍSTICA I – Mg.Sc. Fernando Martín Toribio Román

Son medidas de localización similares a las anteriores. Se las denomina CUANTILES (Q). Su
función es informar del valor de la variable que ocupará la posición (en tanto por cien) que nos interese
respecto de todo el conjunto de variables.

Podemos decir que los Cuantiles son unas medidas de posición que dividen a la distribución en un
cierto número de partes de manera que en cada una de ellas hay el mismo de valores de la variable.

Las más importantes son:


CUARTILES, dividen a la distribución en cuatro partes iguales (tres divisiones). C1,C2,C3,
correspondientes a 25%, 50%,75%.
DECILES, dividen a la distribución en 10 partes iguales (9 divisiones).D1,...,D9, correspondientes a
10%,...,90%
PERCENTILES, cuando dividen a la distribución en 100 partes (99 divisiones).P1,...,P99,
correspondientes a 1%,...,99%.

Existe un valor en cual coinciden los cuartiles, los deciles y percentiles es cuando son iguales a
la Mediana y así veremos
2 5 50
 
4 10 100
Distinguiremos entre distribuciones agrupadas, y las que no lo están:
En las distribuciones sin agrupar, primero hallaremos el lugar que ocupa:
Entonces tendremos que :

Ni=1 < (%) . n < Ni  Q = xi


x i  x i 1
en el supuesto que (%).n = Ni  Q 
2
Primero encontraremos el intervalo donde estará el cuantil:
% N  N i 1
lugar Ni=1 < (%) n< Ni Intervalo [Li-1, Li) , en este caso: Q  L i 1  ai
ni

Ejemplo: DISTRIBUCIONES NO AGRUPADAS: En la siguiente distribución

xi ni Ni
5 3 3
10 7 10
15 5 15
20 3 18
25 2 20
n = 20

Calcular la mediana (Me); el primer y tercer cuartil (C1,C3); el 4º decil (D4) y el 90 percentil (P90)

Mediana (Me)
Lugar que ocupa la mediana  lugar 20/2 = 10
Como es igual a un valor de la frecuencia absoluta acumulada, realizaremos es cálculo:
x i  x i 1 10  15
Me    12,5
2 2

Primer cuartil (C1)


Lugar que ocupa en la distribución ( ¼). 20 = 20/4 = 5 Como Ni-1 < (25%).n < Ni , es decir 3 < 5
< 10 esto implicara que C1 = xi = 10
ESTADÍSTICA I – Mg.Sc. Fernando Martín Toribio Román

Tercer cuartil (C3)


Lugar que ocupa en la distribución (3/4).20 = 60/4 = 15, que coincide con un valor de la frecuencia
x i  x i 1 15  20
absoluta acumulada, por tanto realizaremos el cálculo: C 3    17,5
2 2

Cuarto decil (D4)


Lugar que ocupa en la distribución (4/10) . 20 = 80/10 = 8. Como Ni-1 < (%).n < Ni ya que 3 < 8
< 10 por tanto D4 =10.

Nonagésimo percentil (P90)


Lugar que ocupa en la distribución (90/100). 20 = 1800/100 = 18. que coincide con un valor de la
x i  x i 1 20  25
frecuencia absoluta acumulada, por tanto realizaremos el cálculo: P90    22,5
2 2

Ejemplo: DISTRIBUCIONES AGRUPADAS: Hallar el primer cuartil, el cuarto decil y el 90 percentil


de la siguiente distribución:

[Li-1 , Li) ni Ni
[0 , 100) 90 90
[100 , 200) 140 230
[[200 , 300) 150 380
[300 , 800) 120 500
n = 500

Primer cuartil (C4)


Lugar ocupa el intervalo del primer cuartil: (1/4). 500 = 500/4 = 125. Por tanto C4 estará situado
en el intervalo [100 – 200).Aplicando la expresión directamente, tendremos:
125  90
C 4  100  100  125
140

Cuarto decil (D4)


Lugar que ocupa: (4/10) . 500 = 200 . Por tanto D4 estará situado en el intervalo [100 – 200).
200  90
Aplicando la expresión tendremos: D 4  100  100  178,57
140

Nonagésimo percentil (P 90)


Lugar que ocupa: (90/100) . 500 = 450, por tanto P90 estará situado en el intervalo [300 – 800).
450  380 70
Aplicando la expresión tendremos: P90  300  500  300  500  591,67
120 120

Actividad: Realiza el histograma de frecuencias, también halla las medidas de tendencia central y no
central de tus variables en estudio.

Você também pode gostar