Você está na página 1de 15

ORGANIZACIÓN Y PRESENTACION DE DATOS

Al disponer de información captada mediante una técnica de recolección de


información se procede a resumir los datos para hacer un análisis descriptivo
más sencillo. Debemos conocer algunos procedimientos para la clasificación
tabulación y representación de información. Por ejemplo

Los siguientes datos corresponden al índice rendimiento en una prueba


de aptitud

1.51 1.28 1.53 1.47 1.58 1.46 1.69 1.66 1.61 1.86
1.23 1.21 1.56 1.09 1.63 1.60 1.89 1.37 2.29 1.89
1.65 1.32 1.69 2.01 1.73 1.22 1.46 1.51 1.47 1.79
1.61 1.57 1.65 1.60 2.18 1.54 1.33 1.65 1.50 1.94
2.29 1.69 1.56 1.67 1.81 1.67 1.38 1.68 1.83 1.63

Donde N= 50; N = tamaño de la muestra o número de datos.


Es necesario ordenar los Datos en una tabla de distribución de frecuencias.

TABLA DE FRECUENCIAS
Para elaborar la tabla de distribución de frecuencias debemos considerar los
siguientes elementos.

TAMAÑO DE LA MUESTRA (N) Es la cantidad de datos recogidos. N=50


ALCANCE(A): es el intervalo cerrado definido por el menor dato y el mayor dato
A = [ 1,09 ; 2,29 ]
RANGO O RECORRIDO O AMPLITUD (R) es la diferencia entre el mayor dato
y el menor dato. R = 2,29 – 1,09 = 1,2
NUMERO DE CLASES (NUMERO DE INTERVALOS (K): Es la cantidad de
grupos o intervalos en que se pueden clasificar los datos.
Se puede utilizar la regla de sturges la cual indica que: k = 1+ 3,3log(N) donde N
es el tamaño de la muestra. El valor de K debe ser redondeado al entero más
cercano.
k = 1+ 3,3log (50)
K = 6,6
Luego K puede tomar valores enteros: nosotros asumiremos K = 6
ANCHO DE CLASE O AMPLITUD (W): Para anchos de clases iguales se puede
utilizar la siguiente relación.
R (Rango ) 1,2
𝑊=K 𝑊= 𝑊 = 0,2
( numero de intervalos de clase ) 6

Marca de clase Xi es el promedio de los límites de un intervalo de clase

DISTRIBUCIÓN DE FRECUENCIAS

1. Frecuencia absoluta (fi) es el número de veces que se repite un cierto


dato que está dentro de cada intervalo. La suma total de las frecuencias
absolutas
∑ 𝑓𝑖 = 𝑓1 + 𝑓2 + 𝑓3 + ⋯ + 𝑓𝑛 = 𝑁
2. Frecuencia absoluta acumulada (Fi) resulta de acumular sucesivamente
las correspondientes frecuencias absolutas.

3. Frecuencia relativa (hi) es la relación entre la frecuencia absoluta y el


número total de datos, en cada intervalo de clase, de la frecuencia relativa
fi
siempre va a estar entre 0y1 ℎ𝑖 = n
La sumatoria de todas las frecuencias relativas es igual a 1

∑ ℎ𝑖 = ℎ1 + ℎ2 + ℎ3 + ⋯ + ℎ𝑛 = 1

4. Frecuencia relativa acumulada (Hi) Es el cociente entre la frecuencia


absoluta acumulada para cada dato entre el número de datos totales:
Fi
𝐻𝑖 =
N
5. Frecuencia relativa porcentual (H%) También se puede expresar en
porcentaje. Para lo cual el valor de la frecuencia relativa se multiplica por
100% H%= hi X100%

ESTADISTICA PROBLEMAS RESUELTOS

Los siguientes datos corresponden al índice rendimiento en una prueba


de aptitud
1.09 1.32 1.46 1.51 1.57 1.61 1.65 1.69 1.81 1.94
1.21 1.33 1.47 1.53 1.58 1.63 1.66 1.69 1.83 2.01
1.22 1.37 1.47 1.54 1.60 1.63 1.67 1.69 1.86 2.18
1.23 1.38 1.50 1.56 1.60 1.65 1.67 1.73 1.89 2.29
1.28 1.46 1.51 1.56 1.61 1.65 1.68 1.79 1.89 2.29
Donde N= 50; N = tamaño de la muestra o número de datos.
Es necesario ordenar los Datos en una tabla de distribución de
frecuencias.
Hallamos el tamaño de la muestra por conteo simple N=50.

A. RANGO O RECORRIDO O AMPLITUD (R):

𝑅 = 𝑋𝑚𝑎𝑥 − 𝑋𝑚𝑖𝑛 𝑅 = 𝐷𝑎𝑡𝑜 𝑚𝑎𝑦𝑜𝑟 − 𝐷𝑎𝑡𝑜 𝑚𝑒𝑛𝑜𝑟

𝑅 = 2,29 − 1,09 = 1,2

B. NUMERO DE CLASES(NÚMERO DE INTERVALOS)(k):


k = 1 + 3,3log 𝑁
k = 1 + 3,3log 50 k = 6,6 k = 6
C. AMPLITUD O ANCHO DE CLASE(W):

R 1,2
𝑊= 𝑊= 𝑊 = 0,17
K 6

−− − 𝐼1 − − − 𝐼2 − − − 𝐼3 − − − 𝐼4 − − − 𝐼5 − − −
Intervalo Marca Frecuencia Frecuencia frecuencia Frecuencia Frecuencia
de absoluta absoluta relativa relativa relativa
[ Li ; Ls > clase fi acumulada fi acumulada porcentual
ℎ𝑖 = (Xi) .( fi) (𝑋𝑖 − 𝑋̅)2 (𝑋𝑖 − 𝑋̅)2 . 𝑓𝑖
Xi Fi N Fi H(%)=hix100
𝐻𝑖 =
N %

[ 1,09 ; 1,29 > 1,19 5 5 0,10 0,10 10 5,95 0,185 0,925


[ 1,29 ; 1,49 > 1,39 8 13 0,16 0,26 16 11,12 0,051 0,408
[ 1,49 ; 1,69 > 1,59 22 35 0,44 0,70 44 34,98 0,001 0,022
[ 1,69 ; 1,89 > 1,79 8 43 0,16 0,87 16 14,32 0,051 0,408
[ 1,89 ; 2,09 > 1,99 4 47 0,08 0,94 8 7,96 0,137 0,548
[ 2,09 ; 2,29 > 2,19 3 50 0,06 1 6 6,57 0,325 0,975
∑ H(%) ∑ Xi. fi ∑(𝑋𝑖 − 𝑋)2 . 𝑓𝑖
∑ 𝑓𝑖 = 50 ∑ ℎ𝑖 = 1
TOTAL = 100% = 80,90 = 3,286
N = 50

̅
Interpretación:

F3 = 20; 20 estudiantes tienen un rendimiento de 1,57 a 1,81

F5 =3; 3 estudiantes tienen un rendimiento de 2,05 a 2, 29

H4=

GRAFICOS ESTADISTICOS

La información contenida en las tablas de frecuencias resulta más accesible


y fácil de interpretar si se representan por medio de gráficos estadísticos.
Estos son representaciones visuales que emplean símbolos, barras,
polígonos y sectores, de los datos contenidos en tablas de frecuencias. Que
expresan el comportamiento de una variable en estudio, así como también
la comparación visual del comportamiento de 2 o más variables similares o
relacionadas.

Entre los gráficos más utilizados podemos destacar:

2.4 HISTOGRAMA DE FRECUENCIAS

Consisten en rectángulos cuyas bases son cada uno de los intervalos y la


altura es la frecuencia absoluta correspondiente a dicho intervalo.

Histograma y poligono de frecuencia


25

20

15

10

0
1,19 1,39 1,59 1,79 1,99 2,19
2.5 POLIGONO DE FRECUENCIAS

Es una línea poligonal que une los vértices superiores de las barras de un
diagrama de barras, o los puntos medios de las bases superiores de los
rectángulos de un histograma.

MEDIDAS DE RESUMEN O ESTADIGRAFOS

Son: de Tendencia Central (media aritmética, armónica, geométrica,


mediana, moda, etc.)

De Posición los Deciles, cuartiles y percentiles

De dispersión Rango, desviación media, típica, etc.

1.1 MEDIA ARITMETICA(X) Para poder calcular la media, se supondrá


que dentro de cada categoría las observaciones se distribuyen
uniformemente dentro alrededor del punto medio de la clase.
Es el valor resultante que se obtiene al dividir la sumatoria de un
conjunto de datos sobre el nº total de datos.

∑ 𝑋𝑖𝑓𝑖 80,90
𝑋̅ = = = 1,62
𝑁 50

Interpretación:

El número promedio del rendimiento es 1,62

1.2 MEDIANA (Me):


Es el estadígrafo que representa el punto medio de los datos, en el
cual cae el 50% de las observaciones, es decir que separa a la serie
de datos ordenados (en forma creciente o decreciente), en 2 partes de
igual número de datos.

𝑛
− 𝐹𝑚 − 1
𝑀𝑒 = 𝑙𝑖 + (2 )𝑊
𝑓𝑚

n= nª total de datos

𝑁
Semisuma de las frecuencias absolutas
2

Li= límite inferior de la clase mediana


Fm-1: frecuencia absoluta acumulada anterior.

fm: frecuencia absoluta del intervalo.

Calcular la Mediana:

𝑁 50
a) Hallamos la posición = 2 = 25
2
b) Buscamos en la frecuencia absoluta acumulada que sea mayor a
25. En este caso es 35.
c) La clase será [ 1,57 ; 1,81 >
d) Li=1,49 fm=22 w = 1,69 - 1,49 = 0,2 Fm -1=13

25 − 13 12
𝑀𝑒 = 1,49 + ( ) 0,2 = 1,49 + ( ) 0,2 = 1,60
22 22

1.3 MODA (Mo)

Es un estadígrafo que nos indica el valor o cualidad que se presenta con


Mayor frecuencia dentro de una variable.

𝑑1
𝑀𝑜 = 𝑙𝑖 + ( )𝑊
𝑑1 + 𝑑2

Li : límite inferior de la clase modal.

W : Ancho de la clase modal.

Buscamos la mayor frecuencia absoluta en la tabla y trabajamos en ese


intervalo. En este caso es 22

𝑑1 . Diferencia de la frecuencia absoluta de la clase modal menos la


anterior.

𝑑1 = 22 − 8 = 14

𝑑2 . Diferencia de la frecuencia absoluta de la clase modal menos la


posterior.

𝑑2 = 22 – 8 = 14

14 14
𝑀𝑜 = 1,49 + ( ) 0,2 = 1,49 + ( ) 0,2 = 1,59
14 + 14 28
MEDIDAS DE POSICIÓN

Estadígrafos que dividen un conjunto de datos ordenados en grupos con el


mismo número de observaciones, etc

Para calcular las medidas de posición es necesario que los datos estén
ordenados de menor a mayor.

Casos particulares son los percentiles, cuartiles, Deciles

3. CUARTILES (Q)

Son los valores que dividen a un conjunto de datos ordenados en 4 partes


iguales.

Q1 = Primer cuartil

Q2 = segundo cuartil

Q3 = tercer cuartil

Q4 = Cuarto cuartil

Q1 El 25% de las observaciones tienen valores inferiores o iguales a Q1


en tanto que el 75% restante tienen valores superiores a Q1

Q2 es el valor que está en el centro y por tanto coincide con la mediana

Q3 El 75% de las observaciones tienen valores inferiores o iguales a Q3 y


el 25%restante tienen valores superiores a Q3

𝑘𝑛
−(𝐹𝑚−1)
4
.𝑄𝐾 = 𝑙𝑖 + (𝐹𝑚−(𝐹𝑚−1)) 𝑊

Donde K = 1, 2,3

n= nª total de datos

𝐾𝑁
Posición
4

Li= límite inferior


Fm-1: frecuencia absoluta acumulada anterior.

Fm: frecuencia absoluta acumulada posterior.

Calculo del cuartil 1(el 25% inferior)


1(50) 50
a) Hallamos la posición = 4 = 12,5
4
b) Buscamos en la columna de la frecuencia absoluta acumulada que
sea mayor a 12,5. En este caso es 13.
c) La clase será [ 1,29 ; 1,49 >
d) Li=1,29 Fm-1= 5 w = 1,49 - 1,29 =0,2 Fm=13

12,5 −(5)
e) 𝑄1 = 1,29 + ( ) 0,2
13−(5)

12,5 − (5) 7,5


𝑄1 = 1,29 + ( ) 0,2 = 1,29 + ( ) 0,2 = 1,29 + 0.19 = 1,48
13 − (5) 8

Cálculo del cuartil 3 (el 25% superior):


3(50) 150
a) Hallamos la posición = 4 = 37,5
4
b) Buscamos en la columna de la frecuencia absoluta acumulada que
sea mayor a 37,5. En este caso es 43.
c) La clase será [ 1,69 ; 1,89 >

d) Li = 1,69 Fm -1 = 35 w = 1,81- 1,57 = 0,2 Fm=43

37,5 −(35)
a) 𝑄3 = 1,69 + ( ) 0,2
43−(35)

37,5 − (35) 2,5


𝑄3 = 1,69 + ( ) 0,2 = 1,69 + ( ) 0,2 = 1,69 + 0.06
43 − (35) 8
= 1,75

Deciles (D) son los valores que dividen a una distribución de frecuencia en
10mpartes con igual número de observación. Se calculan utilizando la
formula.

𝑘𝑛
− (𝐹𝑚 − 1)
𝐷𝐾 = 𝑙𝑖 + ( 10 )𝑊
𝐹𝑚 − (𝐹𝑚 − 1)

Donde K = 1, 2,3,...,9 según trate de hallar el primer, segundo o noveno


Decil.
n= nª total de datos

𝐾𝑁
Posición
10

Li= límite inferior

Fm-1: frecuencia absoluta acumulada anterior.

Fm: frecuencia absoluta acumulada posterior.

Calculo del Decil siete (D7).


7(50) 350
a) Hallamos la posición = 10 = 35
10
b) Buscamos en la columna de la frecuencia absoluta acumulada que
sea mayor a 35. En este caso es 35.
c) La clase será [ 1,49 ; 1,69 >

d) Li = 1,49 Fm - 1 = 13 w = 1,69 - 1,49 = 0,2 Fm = 35

35 −(13)
e) 𝐷7 = 1,49 + ( 35−(13) ) 0,2

35 − (13) 22
𝐷7 = 1,49 + ( ) 0,2 = 1,49 + ( ) 0,2 = 1,49 + 0.2 = 1,69
35 − (13) 22

PERCENTILES(𝑷𝑲 ).

Se denomina así a los valores que dividen a una distribución de


frecuencias ordenadas en forma ascendente en cien partes iguales. 𝑃50
Coincide con la mediana.

𝑘𝑛
− (𝐹𝑚 − 1)
𝑃𝐾 = 𝑙𝑖 + (100 )𝑊
𝐹𝑚 − (𝐹𝑚 − 1)

Donde K = 1, 2,3,...,9 según trate de hallar el primer, segundo o


noventainueveavo percentil.

Calculo de PERCENTIL 𝑷𝟔𝟓

𝐾𝑁 65(50) 3250
Calculo de la Posición = = = 32,5
100 100 100
Buscamos en la frecuencia absoluta acumulada que sea mayor a 32,5. En
este caso es 35.

65(50)
− (13)
𝑃65 = 1,49 + ( 100 ) 0,2
35 − (13)

32,5 − (13)
𝑃65 = 1,49 + ( ) 0,2 = 1,49 + (0,89)0,2 = 1,67
35 − (13)

Calculo de PERCENTIL 𝑷𝟗𝟏

𝐾𝑁 91(50) 4550
Calculo de la Posición = = = 45,5
100 100 100

Buscamos en la frecuencia absoluta acumulada que sea mayor a 45,5. En


este caso es 47

91(50)
− (43)
𝑃91 = 1,89 + ( 100 ) 0,2
47 − (43)

45,5 − (43)
𝑃91 = 1,89 + ( ) 0,2 = 1,89 + (0,625)0,2 = 2,02
47 − (43)

Varianza 𝒔𝟐 Es la media o promedio al cuadrado de las desviaciones de


la variable respecto a su media.

2 ∑(𝑋𝑖−𝑋̅)2 .𝑓𝑖 3,286


𝑠 = 𝑠2 = = 0.07
𝑁−1 49

DESVIACION ESTANDAR O TIPICA(S) Es la raíz cuadrada de la


varianza.

∑(𝑋𝑖−𝑋)2 .𝑓𝑖 3,286


S =√ S =√ = √0,07 = 0,26
𝑁−1 49

RANGO SEMI INTERCUARTÍL(R) Es la diferencia entre el tercer cuartil y


el primer cuartil.

R = Q3 - Q1 R= 1,75 – 1,48 = 0,27


COEFICIENTE DE VARIABILIDAD (C.V.)

Es el cociente de la desviación estándar y la media aritmética.

𝑠 0,26
𝐶. 𝑉. = 100 𝐶. 𝑉. = 100 = 16,05
𝑥̅ 1.62

ASIMETRIA

Se refiere a si la curva que forman los valores de la serie presenta la misma


forma a la izquierda y derecha de un valor central (promedio aritmético)

Miden el grado de deformación horizontal de la distribución de frecuencias


y se definen como:

Para medir el nivel de asimetría utilizamos el COEFICIENTE DE


ASIMETRIA, que viene dado por:

Coeficiente de asimetría de Pearson

𝑋̅−𝑀𝑜 3(𝑋̅−𝑀𝑒)
𝐴𝑠 = 𝐴𝑠 =
𝑆 𝑆

Los resultados obtenidos pueden ser los siguientes:

As = 0 la distribución es simétrica; existe la misma concentración de valores


a la derecha y a la izquierda de la media

As > 0 la distribución es asimétrica positiva; existe mayor concentración de


valores a la derecha de la media que a su derecha.

As < 0 la distribución es asimétrica negativa; existe mayor concentración


de valores a la izquierda de la media que a su derecha.
𝑋̅ − 𝑀𝑜 1,62 − 1,59 0,03
𝐴𝑠 = = = = 0,12
𝑆 0.26 0,26

3(𝑋̅ − 𝑀𝑒) 3(1,62 − 1,60) 3(0,02)


𝐴𝑠 = = = = 0.23
𝑆 0,26 0,26

COEFICIENTE DE KURTOSIS PERCENTILICIO (K)

Mide el grado de deformación vertical que presentan los valores de la


distribución de frecuencias alrededor de la zona central de la distribución y
se define como:

Los resultados del coeficiente de Curtosis se interpretan:

𝑄 −𝑄
𝐾 = 2(𝑃 3 −𝑃1
90 10 )

Calculo de PERCENTIL 𝑷𝟗𝟎


𝐾𝑁 90(50) 4500
Calculo de la Posición = = = 45
100 100 100

Buscamos en la frecuencia absoluta acumulada


91(50)
− (43)
𝑃90 = 1,89 + ( 100 ) 0,2
47 − (43)

45 − (43)
𝑃90 = 1,89 + ( ) 0,2 = 1,89 + (0,1)0,2 = 1,91
47 − (43)

Calculo de PERCENTIL 𝑷𝟏𝟎

𝐾𝑁 10(50) 500
Calculo de la Posición = = =5
100 100 100

Buscamos en la frecuencia absoluta acumulada

10(50)
− (0)
𝑃10 = 1,09 + ( 100 ) 0,2
5

5 − (0)
𝑃10 = 1,09 + ( ) 0,2 = 1,09 + (1)0,2 = 1,29
5

𝑄3 − 𝑄1 1,75 − 1,48 0,27


𝐾= = = = 0,22
2(𝑃90 − 𝑃10 ) 2(1,91 − 1,29) 1,24

k = 0; la distribución es Mesocúrtica:

Al igual que en la asimetría es bastante difícil encontrar un coeficiente de


Curtosis de cero (0), por lo que se suelen aceptar los valores cercanos (±
0.5 aprox.).

K > 0; la distribución es Leptocúrtica

K < 0; la distribución es Platicúrtica


Cuando la distribución de los datos cuenta con:

Un coeficiente de asimetría (As = ±0.5)

Y un coeficiente de Curtosis de (k = ±0.5),Se le denomina Curva normal.

Você também pode gostar