Você está na página 1de 16

ORGANIZACIÓN Y PRESENTACION DE DATOS

Al disponer de información captada mediante una


técnica de recolección de información se procede a
resumir los datos para hacer un análisis descriptivo
más sencillo. Debemos conocer algunos
procedimientos para la clasificación tabulación y
representación de información. Por ejemplo

Los siguientes datos corresponden al índice


rendimiento en una prueba de aptitud

1.51 1.28 1.53 1.47 1.58 1.46 1.69 1.66 1.61 1.86
1.23 1.21 1.56 1.09 1.63 1.60 1.89 1.37 2.29 1.89
1.65 1.32 1.69 2.01 1.73 1.22 1.46 1.51 1.47 1.79
1.61 1.57 1.65 1.60 2.18 1.54 1.33 1.65 1.50 1.94
2.29 1.69 1.56 1.67 1.81 1.67 1.38 1.68 1.83 1.63

Donde N= 50; N = tamaño de la muestra o número de


datos.
Es necesario ordenar los Datos en una tabla de
distribución de frecuencias.

TABLA DE FRECUENCIAS
Para elaborar la tabla de distribución de frecuencias
debemos considerar los siguientes elementos.

TAMAÑO DE LA MUESTRA(N) Es la cantidad de datos


recogidos.

ALCANCE(A): es el intervalo cerrado definido por el menor


dato y el mayor dato
A = [ 5 , 35 ]
Rango o recorrido(R) llamada también Amplitud, es la
diferencia entre el mayor dato y el menor dato.
R = 35 – 5
INTERVALO DE CLASE( I): se denota por un intervalo
cerrado o abierto de valores.
NUMERO DE CLASES( K ): Es la cantidad de grupos o
intervalos en que se pueden clasificar los datos.
Se puede utilizar la regla de sturges la cual indica que: k
= 1+ 3,3log(N) donde N es el tamaño de la muestra. El
valor de K debe ser redondeado al entero más cercano.
k = 1+ 3,3log (50)
K = 6,6
Luego K puede tomar valores enteros: 5;6 o 7 nosotros
asumiremos K = 5
ANCHO DE CLASE (W): Para anchos de clases iguales
se puede utilizar la siguiente relación.
𝐑 (𝐑𝐚𝐧𝐠𝐨 )
𝑾=
𝐊 ( 𝐧𝐮𝐦𝐞𝐫𝐨 𝐝𝐞 𝐢𝐧𝐭𝐞𝐫𝐯𝐚𝐥𝐨𝐬 𝐝𝐞 𝐜𝐥𝐚𝐬𝐞 )

𝟏𝟎
𝑾= 𝑾=𝟐
𝟓

Marca de clase Xi es el promedio de los límites de un


intervalo de clase (realmente para el cálculo de frecuencias
no es necesario la marca de clase)

DISTRIBUCIÓN DE FRECUENCIAS

1. Frecuencia absoluta (fi) es el número de veces que


se repite un cierto dato que está dentro de cada
intervalo. La suma total de las frecuencias absolutas

2. Frecuencia absoluta acumulada (Fi) resulta de


acumular sucesivamente las correspondientes
frecuencias absolutas.
3. Frecuencia relativa (hi) es la relación entre la
frecuencia absoluta y el número total de datos, en
cada intervalo de clase, de la frecuencia relativa
siempre va a estar entre 0 y 1
𝐟𝐢
𝒉𝒊 =
𝐧

La sumatoria de todas las frecuencias relativas es igual


a1

4. Frecuencia relativa acumulada (Hi)

Es el cociente entre la frecuencia absoluta acumulada


para cada dato entre el número de datos totales:

𝐅𝐢
𝑯𝒊 =
𝐍

5. Frecuencia relativa porcentual (Pi) También se


puede expresar en porcentaje. Para lo cual el valor
de la frecuencia relativa se multiplica por 100%

Pi%= hi X100%

Hallamos el tamaño de la muestra por conteo simple


N=50.

A. RANGO O RECORRIDO O AMPLITUD(R):

𝑅 = 𝑋𝑚𝑎𝑥 − 𝑋𝑚𝑖𝑛 𝑅 = 𝐷𝑎𝑡𝑜 𝑚𝑎𝑦𝑜𝑟 − 𝐷𝑎𝑡𝑜 𝑚𝑒𝑛𝑜𝑟


𝑅 = 2,29 − 1,09 = 1,2

B. NUMERO DE CLASES(NÚMERO DE INTERVALOS)(k):


𝐤 = 𝟏 + 𝟑, 𝟑𝐥𝐨𝐠 𝑵

𝐤 = 𝟏 + 𝟑, 𝟑𝐥𝐨𝐠 𝟓𝟎 𝐤 = 𝟔, 𝟔 𝐤 =𝟓

C. AMPLITUD O ANCHO DE CLASE(W):

R 1,2
𝑊= 𝑊= 𝑊 = 0,24
K 5

−− − 𝐼1 − − − 𝐼2 − − − 𝐼3 − − − 𝐼4 − − − 𝐼5 − − −
Intervalo Marca de Frecuencia Frecuencia frecuencia Frecuencia Frecuencia
[ Li ; Ls > clase absoluta absoluta relativa relativa relativa
Xi fi acumulada 𝐟𝐢 acumulada porcentual
𝒉𝒊 = Xi . fi (𝑿𝒊 − 𝑿)𝟐 (𝑿𝒊 − 𝑿)𝟐 . 𝒇𝒊
Fi 𝐧 𝐅𝐢 H(%)=hix100%
𝑯𝒊 =
𝐍

[ 1,09 ; 1,33 > 1,21 6 6 0,12 0,12 12 7,26 0,180 1,060


[ 1,33 ; 1,57 > 1,45 14 20 0,28 0,40 28 20,30 0,030 0,450
[ 1,57 ; 1,81 > 1,69 20 40 0,40 0,80 40 33,80 0,004 0,072
[ 1,81 ; 2,05 > 1,93 7 47 0,14 0,94 14 13,51 0,090 0,630
[ 2,05 ; 2,29 > 2,17 3 50 0,06 1 6 6,51 0,290 0,87
∑ 𝐇(%) = 𝟏𝟎𝟎% ∑ 𝐗𝐢. 𝐟𝐢 ∑(𝑿𝒊 − 𝑿)𝟐 . 𝒇𝒊
∑ 𝒇𝒊 = 𝟓𝟎 ∑ 𝒉𝒊 = 𝟏
TOTAL = 𝟖𝟏, 𝟑𝟖 = 𝟒, 𝟎𝟖𝟐
N = 50
Interpretación:

F3 = 20; 20 estudiantes tienen un rendimiento de 1,57 a 1,81

F5 =3; 3 estudiantes tienen un rendimiento de 2,05 a 2, 29

H4=

GRAFICOS ESTADISTICOS

La información contenida en las tablas de frecuencias


resulta más accesible y fácil de interpretar si se
representan por medio de gráficos estadísticos. Estos
son representaciones visuales que emplean símbolos,
barras, polígonos y sectores, de los datos contenidos en
tablas de frecuencias. Que expresan el comportamiento
de una variable en estudio, así como también la
comparación visual del comportamiento de 2 o más
variables similares o relacionadas.

Entre los gráficos más utilizados podemos destacar:

2.4 HISTOGRAMA DE FRECUENCIAS

Consisten en rectángulos cuyas bases son cada uno de


los intervalos y la altura es la frecuencia absoluta
correspondiente a dicho
intervalo.xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxx

2.5 POLIGONO DE FRECUENCIAS

Es una línea poligonal que une los vértices superiores


de las barras de un diagrama de barras, o los puntos
medios de las bases superiores de los rectángulos de
un
histograma.xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxx

MEDIDAS DE RESUMEN O ESTADIGRAFOS

son:

De Tendencia Central (media aritmética, armónica,


geométrica, mediana, moda, etc.)

De Posición los Deciles, cuartiles y percentiles

De dispersión Rango, desviación media, típica, etc.

1.1 MEDIA ARITMETICA(X)

Para poder calcular la media, se supondrá que dentro de


cada categoría las observaciones se distribuyen
uniformemente dentro alrededor del punto medio de la
clase.

Es el valor resultante que se obtiene al dividir la


sumatoria de un conjunto de datos sobre el nº total de
datos.

∑ 𝑿𝒊𝒇𝒊
̅=
𝑿
𝑵

𝟖𝟏, 𝟑𝟖
̅=
𝑿 = 𝟏, 𝟔
𝟓𝟎

Interpretación:

El número promedio del rendimiento es 1,6


1.2 MEDIANA (Me):

Es el estadígrafo que representa el punto medio de los


datos, en el cual cae el 50% de las observaciones, es
decir que separa a la serie de datos ordenados (en forma
creciente o decreciente), en 2 partes de igual número de
datos.

𝒏
− 𝑭𝒎 − 𝟏
𝑴𝒆 = 𝒍𝒊 + ( 𝟐 )𝑾
𝒇𝒎

n= nª total de datos

𝑵
Semisuma de las frecuencias absolutas
𝟐

Li= límite inferior de la clase mediana

Fm-1: frecuencia absoluta acumulada anterior.

fm: frecuencia absoluta del intervalo.

Calcular la Mediana:

𝑵 𝟓𝟎
a) Hallamos la posición = = 25
𝟐 𝟐
b) Buscamos en la frecuencia absoluta acumulada
que sea mayor a 25. En este caso es 40.
c) La clase será [ 1,57 ; 1,81 >
d) Li=1,57 fm=20 w = 1,81- 1,57=0,24 Fm=20
𝟓𝟎
− 𝟐𝟎 𝟓
𝑴𝒆 = 𝟏, 𝟓𝟕 + ( 𝟐 ) 𝟎, 𝟐𝟒 = 𝟏, 𝟓𝟕 + ( ) 𝟎, 𝟐𝟒 = 𝟏, 𝟔𝟑
𝟐𝟎 𝟐𝟎

1.3 MODA (Mo)

Es un estadígrafo que nos indica el valor o cualidad que


se presenta con Mayor frecuencia dentro de una
variable.

𝒅𝟏
𝑴𝒐 = 𝒍𝒊 + ( )𝑾
𝒅𝟏 + 𝒅𝟐

Li : límite inferior de la clase modal.

W : Ancho de la clase modal.

d1. Diferencia de la frecuencia absoluta de la clase


modal menos la anterior.

d2. Diferencia de la frecuencia absoluta de la clase


modal menos la posterior.

d1 = 20 - 14 = 6

d2 = 20 – 7 = 13

Buscamos la mayor frecuencia absoluta en la tabla y


trabajamos en ese intervalo.

𝟔 𝟔
𝑴𝒐 = 𝟏, 𝟓𝟕 + ( ) 𝟎, 𝟐𝟒 = 𝟏, 𝟓𝟕 + ( ) 𝟎, 𝟐𝟒 = 𝟏, 𝟔𝟓
𝟔 + 𝟏𝟑 𝟏𝟗
MEDIDAS DE POSICIÓN

Estadígrafos que dividen un conjunto de datos


ordenados en grupos con el mismo número de
observaciones, etc

Para calcular las medidas de posición es necesario que


los datos estén ordenados de menor a mayor.

Casos particulares son los percentiles, cuartiles,


Deciles

3. CUARTILES (Q)

Son los valores que dividen a un conjunto de datos


ordenados en 4 partes iguales.

Q1 = Primer cuartil

Q2 = segundo cuartil

Q3 = tercer cuartil

Q4 = Cuarto cuartil

Q1 El 25% de las observaciones tienen valores


inferiores o iguales a Q1 en tanto que el 75% restante
tienen valores superiores a Q1

Q2 es el valor que está en el centro y por tanto coincide


con la mediana

Q3 El 75% de las observaciones tienen valores


inferiores o iguales a Q3 y el 25%restante tienen valores
superiores a Q3.
𝒌𝒏
− (𝑭𝒎 − 𝟏)
𝑸𝑲 = 𝒍𝒊 + ( 𝟒 )𝑾
𝑭𝒎 − (𝑭𝒎 − 𝟏)

Donde K = 1, 2,3

n= nª total de datos

𝑲𝑵
Posición
𝟒

Li= límite inferior

Fm-1: frecuencia absoluta acumulada anterior.

Fm: frecuencia absoluta acumulada posterior.

a) Calculo del cuartil 1(el 25% inferior)


𝟏(𝟓𝟎) 𝟓𝟎
b) Hallamos la posición = = 12,5
𝟒 𝟒
a) Buscamos en la columna de la frecuencia absoluta
acumulada que sea mayor a 12,5. En este caso es
20.
b) La clase será [ 1,33 ; 1,57 >

c) Li=1,33 Fm-1=6 w = 1,57- 1,33 =0,24 Fm=20

𝟏(𝟓𝟎)
−(𝟔)
𝟒
d) 𝑸𝟏 = 𝟏, 𝟑𝟑 + ( ) 𝟎, 𝟐𝟒
𝟐𝟎−(𝟔)

𝟏𝟐, 𝟓 − (𝟔) 𝟔, 𝟓
𝑸𝟏 = 𝟏, 𝟑𝟑 + ( ) 𝟎, 𝟐𝟒 = 𝟏, 𝟑𝟑 + ( ) 𝟎, 𝟐𝟒 = 𝟏, 𝟑𝟑 + 𝟎. 𝟏𝟏 = 𝟏, 𝟒𝟒
𝟐𝟎 − (𝟔) 𝟏𝟒
c) cálculo del cuartil 3 (el 25% superior):

𝟑(𝟓𝟎) 𝟏𝟓𝟎
d) Hallamos la posición = = 37,5
𝟒 𝟒
e) Buscamos en la columna de la frecuencia absoluta
acumulada que sea mayor a 37,5. En este caso es 40.
f) La clase será [ 1,57 ; 1,81 >

g) Li=1,57 Fm-1=20 w = 1,81- 1,57=0,24 Fm=40


𝟑(𝟓𝟎)
−(𝟐𝟎)
𝟒
a) 𝑸𝟑 = 𝟏, 𝟓𝟕 + ( ) 𝟎, 𝟐𝟒
𝟒𝟎−(𝟐𝟎)

𝟑𝟕, 𝟓 − (𝟐𝟎) 𝟏𝟕, 𝟓


𝑸𝟑 = 𝟏, 𝟓𝟕 + ( ) 𝟎, 𝟐𝟒 = 𝟏, 𝟓𝟕 + ( ) 𝟎, 𝟐𝟒 = 𝟏, 𝟓𝟕 + 𝟎. 𝟐𝟏
𝟒𝟎 − (𝟐𝟎) 𝟐𝟎
= 𝟏, 𝟕𝟖

Deciles (D) son los valores que dividen a una


distribución de frecuencia en 10mpartes con igual
número de observación.

Se calculan utilizando la formula

𝒌𝒏
− (𝑭𝒎 − 𝟏)
𝑫𝑲 = 𝒍𝒊 + ( 𝟏𝟎 )𝑾
𝑭𝒎 − (𝑭𝒎 − 𝟏)

Donde K = 1, 2,3,...,9 según trate de hallar el primer,


segundo o noveno Decil.

n= nª total de datos

𝑲𝑵
Posición
𝟏𝟎

Li= límite inferior


Fm-1: frecuencia absoluta acumulada anterior.

Fm: frecuencia absoluta acumulada posterior.

h) Calculo del Decil cuatro (D7).

𝟕(𝟓𝟎) 𝟑𝟓𝟎
i) Hallamos la posición = = 35
𝟏𝟎 𝟏𝟎
e) Buscamos en la columna de la frecuencia absoluta
acumulada que sea mayor a 35. En este caso es 40.
f) La clase será [ 1,57 ; 1,81 >

g) Li=1,57 Fm-1=20 w = 1,81- 1,57=0,24 Fm=40

𝟕(𝟓𝟎)
−(𝟐𝟎)
𝟏𝟎
h) 𝑫𝟕 = 𝟏, 𝟓𝟕 + ( ) 𝟎, 𝟐𝟒
𝟒𝟎−(𝟐𝟎)

𝟑𝟓 − (𝟐𝟎) 𝟏𝟓
𝑫𝟕 = 𝟏, 𝟓𝟕 + ( ) 𝟎, 𝟐𝟒 = 𝟏, 𝟓𝟕 + ( ) 𝟎, 𝟐𝟒 = 𝟏, 𝟓𝟕 + 𝟎. 𝟏𝟖 = 𝟏, 𝟕𝟓
𝟒𝟎 − (𝟐𝟎) 𝟐𝟎

PERCENTILES(𝑷𝑲 ).

Se denomina así a los valores que dividen a una


distribución de frecuencias ordenadas en forma
ascendente en cien partes iguales. 𝑷𝟓𝟎 Coincide con la
mediana.

𝒌𝒏
− (𝑭𝒎 − 𝟏)
𝑷𝑲 = 𝒍𝒊 + ( 𝟏𝟎𝟎 )𝑾
𝑭𝒎 − (𝑭𝒎 − 𝟏)

Donde K = 1, 2,3,...,9 según trate de hallar el primer,


segundo o noventainueveavo percentil.
Calculo de PERCENTIL 𝑷𝟔𝟓

Calculo de la Posición

𝑲𝑵 𝟔𝟓(𝟓𝟎) 𝟑𝟐𝟓𝟎
= = = 32,5
𝟏𝟎𝟎 𝟏𝟎𝟎 𝟏𝟎𝟎

Buscamos en la frecuencia absoluta acumulada

𝟔𝟓(𝟓𝟎)
− (𝟐𝟎)
𝑷𝟔𝟓 = 𝟏, 𝟓𝟕 + ( 𝟏𝟎𝟎 ) 𝟎, 𝟐𝟒
𝟒𝟎 − (𝟐𝟎)

𝟑𝟐, 𝟓 − (𝟐𝟎)
𝑷𝟔𝟓 = 𝟏, 𝟓𝟕 + ( ) 𝟎, 𝟐𝟒 = 𝟏, 𝟓𝟕 + (𝟎, 𝟔𝟐𝟓)𝟎, 𝟐𝟒
𝟒𝟎 − (𝟐𝟎)
= 𝟏, 𝟕𝟐

Calculo de PERCENTIL 𝑷𝟗𝟏

Calculo de la Posición

𝑲𝑵 𝟗𝟏(𝟓𝟎) 𝟒𝟓𝟓𝟎
= = = 45,5
𝟏𝟎𝟎 𝟏𝟎𝟎 𝟏𝟎𝟎

Buscamos en la frecuencia absoluta acumulada

𝟗𝟏(𝟓𝟎)
− (𝟒𝟎)
𝑷𝟗𝟏 = 𝟏, 𝟖𝟏 + ( 𝟏𝟎𝟎 ) 𝟎, 𝟐𝟒
𝟒𝟕 − (𝟒𝟎)

𝟒𝟓, 𝟓 − (𝟒𝟎)
𝑷𝟗𝟏 = 𝟏, 𝟖𝟏 + ( ) 𝟎, 𝟐𝟒 = 𝟏, 𝟖𝟏 + (𝟎, 𝟕𝟗)𝟎, 𝟐𝟒
𝟒𝟕 − (𝟒𝟎)
=𝟐
Varianza 𝒔𝟐 Es la media o promedio al cuadrado de
las desviaciones de la variable respecto a su media.

𝟐
∑(𝑿𝒊 − 𝑿̅)𝟐 . 𝒇𝒊
𝒔 =
𝑵−𝟏

𝟒, 𝟎𝟖𝟐
𝒔𝟐 = = 𝟎, 𝟎𝟖𝟑
𝟒𝟗

DESVIACION ESTANDAR O TIPICA(S) Es la raíz


cuadrada de la varianza.

∑(𝑿𝒊 − 𝑿)𝟐 . 𝒇𝒊
𝐒 =√
𝑵−𝟏

𝟒, 𝟎𝟖𝟐
𝐒 =√ = √𝟖𝟑, 𝟑𝟏 = 𝟗, 𝟏𝟑
𝟒𝟗

RANGO SEMI INTERCUARTÍL(R) Es la diferencia entre el


tercer cuartil y el

R = Q3 - Q1

R= 1,78 – 1,44 = 0,34


COEFICIENTE DE VARIABILIDAD (C.V.)

Es el cociente de la desviación estándar y la media


aritmética.

𝒔
𝑪. 𝑽. = 𝟏𝟎𝟎
̅
𝒙
𝟗,𝟏𝟑
𝑪. 𝑽. = 𝟏𝟎𝟎 = 𝟓𝟔𝟎, 𝟏𝟐
𝟏,𝟔𝟑

LOS CUATRO COEFICIENTES DE ASIMETRIA DE


PEARSON

FALTA

CALCULAR EL COEFICIENTE DE CURTOSIS


PERCENTELICIO.

FALTA

Você também pode gostar