Você está na página 1de 34

ESTADISTICA DESCRIPTIVA

Es la parte de la estadística que se encarga de la recopilación,


organización, resumen, análisis, interpretación y comunicación
numérica.

DISTRIBUCION DE FRECUENCIAS:
Es una tabla que divide un conjunto de datos en un número de
clases (categorías) apropiadas, mostrando también el número
de elementos de cada clase. La tabla sacrifica parte de la
información contenida en los datos; en lugar de conocer el
valor exacto de cada elemento, solo sabemos que pertenece a
una determinada clase. Por otra parte este tipo de
agrupamiento hace resaltar características importantes de los
datos y lo que se gana en legibilidad compensa con creces la
perdida de la información.
Existen distribuciones numéricas, donde los datos se hallan
agrupados por su tamaño y distribución categórica, si se
hallan agrupados de acuerdo a alguna cualidad. Nosotros
solo trataremos con distribuciones numéricas.

CONSTRUCCION DE UNA DISTRIBUCION DE FRECUENCIAS:


1.Determinar el número de clases o intervalos.
2.Elegir los límites de cada intervalo.
3.Colocar las marcas de clase.
4.Determinar el número de observaciones en cada
intervalo.(f)
5.Determinar las frecuencias relativas (h).
6.Determinar las frecuencias relativas porcentuales (h%)
7.Determinar las frecuencias absolutas acumuladas (F)
8.Determinar las frecuencias relativas acumuladas (H)
9.Determinar las frecuencias relativas acumuladas
porcentuales (H%)
Ejemplo
 1.- Se tomaron datos de los de los caudales
picos anuales en un río de la sierra. Se pide:
 a) Ordenar los datos en una tabla de
frecuencias.
 b) Graficar el histograma y polígono de
frecuencias
 c) Graficar la función escalonada y la ojiva
correspondiente
 d) Calcular la media, mediana y moda
 e) Calcular Q1; d2 y P38
 f) calcular la varianza, desviación estándar y el
coeficiente de variación
Datos sueltos

752 765 660 680 600 905 555 780

480 850 790 790 475 890 990 825

800 548 875 890 810 765 880 900

610 540 1200 723 740 647 652 735

1090 400 910 825 980 582 535 800

805 565 830 895 810 570 845 621

695 675 788 1050 1040 410 700 735

640 725 621 795 835 780 670 890

652 740 1000 690 789 648 720 540

590 793 920 728 590 720 535 560


Datos Ordenados

400 560 640 695 740 793 835 905

410 565 647 700 752 795 845 910

475 570 648 720 765 800 850 920

480 582 652 720 765 800 875 980

535 590 652 723 780 805 880 990

535 590 660 725 780 810 890 1000

540 600 670 728 788 810 890 1040

540 610 675 735 789 825 890 1050

548 621 680 735 790 825 895 1090

555 621 690 740 790 830 900 1200


Definimos el número de intervalos y el ancho de clase
 El número de intervalos: K = 1 + 3.3 log n
n = número de datos, entonces K = 1 + 3.3 log 80 = 7.28
K puede ser 7, 6 ó 8, el entero que mas nos convenga, de
modo que W no tenga muchos decimales.

 El dato mayor es 1200 m3/seg y el dato menor es 400


m3/seg, entonces la diferencia será:
A = 1200 - 400= 800
Determinamos el ancho de cada intervalo: W = A/K =
800/8 = 100

 La tabla de frecuencias será la que se muestra a


continuación
La tabla de frecuencias será:

Intervalo Marca de Frecuencia Frecuencia F.acumul. F. acumu. F.relativa F.relat.acu.

clase Absoluta Relativa absoluta relativa porcentual porcentual

Li - Li+1 Xi hi hi Fi Hi hi % Hi %
400 - 500 450 4 0.0500 4 0.0500 5.00 5.00
500 - 600 550 12 0.1500 16 0.2000 15.00 20.00
600 - 700 650 15 0.1875 31 0.3875 18.75 38.75
700 - 800 750 21 0.2625 52 0.6500 26.25 65.00
800 - 900 850 17 0.2125 69 0.8625 21.25 86.25
900 - 1000 950 6 0.0750 75 0.9375 7.50 93.75

1000 - 1100 1050 4 0.0500 79 0.9875 5.00 98.75

1100 - 1200 1150 1 0.0125 80 1.0000 1.25 100.00


80 1.0000 100.00
GRAFICOS DE LAS DISTRIBUCIONES DE FRECUENCIA.

Histogramas: Son rectángulos adyacentes, cuyas alturas


representan las frecuencias de clase y su base se extiende
entre fronteras de clases sucesivas.

Polígonos de Frecuencia: Son polígonos que se forman al


unir los puntos medios de los techos del histograma.

Diagrama Escalonado: Son rectángulos adyacentes, cuyas


bases representan los intervalos de clase y las alturas las
frecuencias absolutas o relativas acumuladas.

Ojivas: Son los polígonos de frecuencia que se grafican


sobre el diagrama escalonado
Histograma y Poligono de Frecuencia
Función Escalonada y Ojiva
Ejemplos
Ejemplos
ESTADIGRAFOS DE POSICION
Son números que representan alguna medida central de los
datos. Entre ellos tenemos:

1.Media aritmética (x): Es el promedio de todos los datos.

x = Σxifi = E(x)
Σni

Propiedades de la media:
1. Si x=c entonces E(x) = E(c) = c

2. Si x=y+c entonces E(x)= E(y+c)= E(y) + E(c) = Y + c

3. Si x=by entonces E(x) = E(by) = bY


2. Mediana (me); Es aquel valor que se encuentra en la mitad
de una muestra cuyos valores están ordenados en orden de
magnitud.

me = X(n+1)/2 si n es impar

me= Xn/2 + X(n+2)/2 si n es par


2

Para datos clasificados la mediana se calcula así:

Xm = Lm + Wm(n/2 – Fm-1) = Lm + Wm(0.5 – Hm-1)


Fm - Fm-1 Hm - Hm-1
Donde:
Lm = Límite inferior de la clase mediana
Fm-1 = Frecuencia absoluta acumulada hasta la clase inmediata anterior a
la mediana.
Wm =Ancho de clase de la clase mediana.
Clase mediana: Es el intervalo que contiene a la
mediana. Es aquella donde las frecuencias
acumuladas absolutas o relativas superan o igualan
por primera vez a la mitad de los datos.

3. Moda (Mo): Es el valor que aparece con mayor


frecuencia en un grupo de datos. Un grupo de datos
puede no tener ninguna moda o tener mas de una, en
cambio la media y la mediana para un grupo de datos
siempre existen y son únicas.

Para datos sueltos solo se elige el de mayor


frecuencia.
Para datos agrupados:

Mo = Li + Wi (∆1 / ∆1 + ∆2) donde:

Li = Limite inferior de la clase modal


Wi = Ancho de clase de la clase modal
∆1 = Exceso de la frecuencia modal sobre la
frecuencia de la clase inmediata inferior
∆1 = ni – (ni – 1)
∆2 = Exceso de la frecuencia modal sobre la
frecuencia de la clase inmediata posterior
∆2 = ni – (ni+1)
Clase modal: Es el intervalo que contiene la
frecuencia máxima

Nota: Generalmente la media es preferida a


cualquier otra media, pero hay algunos casos en
que es necesario calcular la mediana: Cuando no
se puede calcular la media y cuando entre el
conjunto de datos hay alguno que está alejado,
lo cual puede tratarse de un dato errado y
alteraría el calculo de la media
Calculo de la media, mediana y moda

Li - Li+1 Xi ni hi Ni Hi Xini Xihi


400 - 500 450 4 0.0500 4 0.0500 1800.00 22.50
500 - 600 550 12 0.1500 16 0.2000 6600.00 82.50
600 - 700 650 15 0.1875 31 0.3875 9750.00 121.88

700 - 800 750 21 0.2625 52 0.6500 15750.00 196.88

800 - 900 850 17 0.2125 69 0.8625 14450.00 180.63


900 - 1000 950 6 0.0750 75 0.9375 5700.00 71.25

1000 - 1100 1050 4 0.0500 79 0.9875 4200.00 52.50

1100 - 1200 1150 1 0.0125 80 1.0000 1150.00 14.38

80 1.0000 59400.00 742.50


Calculo de Estadigrafos de Posición

x ni i 59400
 742.50m3 / seg
Media = X=
n i
=
80

.  Hm1 )
(05 (0.5  0.3875)
Mediana = X m = Lm  Wm  700  100  742.86m3 / seg
hm 0.2625

1 (21  15)
Moda= Mo  Li  Wi ( ) = 700  100  760.00m3 / seg
1   2 ((21  15)  (21  17))

(0.25  H i 1 ) (0.25  0.20)


Q1  Li  Wi  600  100  626.67m3 / seg
hi 0.1875

(0.20  H i 1 ) (0.20  0.05)


d 2  Li  Wi  500  100  600.00m3 / seg
hi 0.15

(0.35  H i 1 ) (0.35  0.20)


P35  Li  Wi  600  100  680.00m3 / seg
hi 0.1875
Calculo de Estadigrafos de Disperción

X i2
X i2 hi
Li - Li+1 Xi ni hi

400 - 500 450 4 0.0500 202500 10125.00

500 - 600 550 12 0.1500 302500 45375.00

600 - 700 650 15 0.1875 422500 79218.75

700 - 800 750 21 0.2625 562500 147656.25

800 - 900 850 17 0.2125 722500 153531.25

900 - 1000 950 6 0.0750 902500 67687.50

1000 - 1100 1050 4 0.0500 1102500 55125.00

1100 - 1200 1150 1 0.0125 1322500 16531.25

80 1.0000 575250.00
Calculo de Estadigrafos de Disperción

V ( x)   X i2 hi  X 2  575250.00  742.50 2  23943.75

S ( x)  V ( x)  23943.75  154.74m / seg


3

S x 154.74
C.V .    0.2084  20.84%
X 742.50
Calculo de la media y la varianza, usando el
método abreviado:

Li - Li+1 Xi ni hi Ui Ui hi U i2 hi

400 - 500 450 4 0.0500 -3 -0.1500 0.4500

500 - 600 550 12 0.1500 -2 -0.3000 0.6000

600 - 700 650 15 0.1875 -1 -0.1875 0.1875


700 - 800 750 21 0.2625 0 0.0000 0.0000
800 - 900 850 17 0.2125 1 0.2125 0.2125
900 - 1000 950 6 0.0750 2 0.1500 0.3000

1000 - 1100 1050 4 0.0500 3 0.1500 0.4500

1100 - 1200 1150 1 0.0125 4 0.0500 0.2000

80 1.0000 -0.0750 2.4000


Calculo de la media
Elegimos el origen de trabajo Ot (marca de clase), en el ejemplo Ot =750
Se calcula los

X i  Ot
Ui 
W

Luego calculamos

UyX

U  U i hi  0.0750

X  Ot  WU  750  100*(0.0750)  742.50m3 / seg


Calculo de la varianza

V (u ) 
 i ni
U 2

 U  U i2 hi  U  2.40  (0.075) 2  2.394375


2 2

n i

Finalmente calculamos V(X)

V ( x)  W V (u)  100 * 2.394375  23943.75


2 2
4. Cuantilas o Fractilas: Son estadígrafos que cumplen con la
condición de superar a no mas de cierto porcentaje de las
observaciones y de ser superado a lo sumo por el porcentaje
complementario de las observaciones. Las cuantilas que
estudiaremos son:

a)Cuartiles: Dividen a un conjunto de datos, ordenados por


su magnitud en cuatro partes iguales.

b)Deciles: Dividen a un conjunto de datos ordenados por su


magnitud en 10 partes iguales.

c)Percentiles: Dividen a un conjunto de datos ordenados por


su magnitud en 100 partes iguales.
RELACION ENTRE LA MEDIA MEDIANA Y MODA DE UNA
DISTRIBUCION UNIMODAL
• Si X = Xm = Mo La distribución es simétrica
• Si Mo < Xm < X La distribución es asimétrica y sesgada a la derecha
• Si X < Xm < Mo La distribución es asimétrica y sesgada a la izquierda

ESTADIGRAFOS DE DISPERSION
Son los que miden la variabilidad que hay entre los datos. Estudiaremos la
varianza, la desviación estándar y el coeficiente de variación.

a)Varianza
V(x) = E((X – X)²) = Σ(Xi – X)²ni = Σxi²ni – X² = σ²
Σni Σni
Propiedades de la varianza:
V(x+b) = V(x)
V(ax) = a²V(x)
V(ax+b) = a²V(x)
b) Desviación estándar

Sx = √V(x)

c) Coeficiente de variación

c.v. = Sx
│X│
d) Índices de asimetría

Si quieres cuantificar la simetría, es necesario


conservar la información acerca tanto del signo
como de la distancia de cada dato a la media –
centro de simetría-. Este razonamiento lleva a
utilizar una potencia impar de las desviaciones.

En l caso en que el coeficiente valga cero la


distribución es simétrica alrededor de la media. Los
valores positivos, indicaran distribuciones con
mayor sesgo a la derecha y los valores negativos
indicarán un mayor sesgo a la izquierda.
Existen varias medidas de asimetría, mencionaremos dos de
ellas:

D 1) Coeficiente de Asimetría de Pearson

As = X – Mo = 3(X – Me)
s s

D 2) Índice de Asimetría de Fisher

As = hi(Xi – X)³

e) Coeficiente de apuntamiento o curtosis

Describe lo picuda o plana que es la distribución, es decir si los


datos se concentran demasiado o no, comparados con un
modelo de distribución llamado distribución normal.

La distribución se denominará leptocúrtica cuando


el CAp > 0 (más apuntada que la normal)

La distribución se denominará mesocúrtica cuando


el Cap = 0 (normal)

La distribución se denominará platicúrtica cuando


Cap < 0 (menos apuntada que la normal)
e 1) Curtosis basado en percentiles

K = P75 – P25 – 0.5


P90 – P10

Interpretación: Si la distribución es normal, K tiende a 0. Si K


tiende a 0.5 es leptocúrtica y si K tiende a -0.5, es
platicúrtica.

e 1) Curtosis utilizando momentos

4
K= hi(Xi – X) – 3
S4
f) Rango intercuartílico:

El Rango intercuartílico RI es, sencillamente, la


diferencia entre el tercer y el primer cuartil, es decir.

RI = Q3 – Q1

Esto nos dice en cuántas unidades de los calores que


toma la variable se concentra el cincuenta por ciento
central de los casos.

Você também pode gostar