Você está na página 1de 46

Escuela de Ingenieria Civil

Estadstica Aplicada
Tema 2: Organizacin de Datos.
Tema 3: Medidas de Resumen
Docente: MSC. Selene Yengle Del Castillo
1

Presentacin ordenada de datos

Gnero

Frec.

Hombre

Mujer

Las tablas de frecuencias y las representaciones


grficas son dos maneras equivalentes de presentar la
informacin. Las dos exponen ordenadamente la
informacin recogida en una muestra.
2

Datos desordenados y ordenados en tablas

Variable: Gnero

Modalidades:

H = Hombre
M = Mujer

Gnero Frec.

Frec. relat.
porcentaje

Hombre 4

4/10=0,4=40%

Mujer

6/10=0,6=60%

6
10=tamao
muestral

Muestra:
MHHMMHMMMH

equivale a
HHHH MMMMMM
3

Distribucin Unidimensional de Frecuencias


Frecuencia.- Nmero de veces que se repite cada dato.
Frecuencia de Clase.- Nmero de datos de cada clase o intervalo.
Clases de Frecuencias:
Frecuencia Absoluta Simple( fi ni).- nmero de veces de cada caso
obtenida como resultado del conteo de los datos. Contabilizan el nmero
de individuos
de cada modalidad. Las propiedades son las siguientes:
k
f i 0 y f i n , donde n: tamao de muestra.
i 1

Frecuencia Absoluta Acumulada( Fi Ni).- Se tiene en cuenta las


siguientes propiedades: F1 = f1 y Fk = fn . . Donde:
F1 = f1
F2 = f1 + f2

Fk = f1 + f2 ++ fk
4

Frecuencia Relativa Simple( hi).- esta frecuencia se encuentra


dividiendo cada frecuencia absoluta simple (fi ni) entre n. Se
obtiene utilizando
la formula siguiente:
k
f
hi

, Se tiene en cuenta las sgtes propiedades : 0 hi 1 y

h
i 1

Asimismo tenemos la Frecuencia Relativa Simple Porcentual (hi


%), que se obtiene de la siguiente manera: hi% = hi x 100%.

Frecuencia Relativa Acumulada(


Hi).j Se obtiene aplicando las
Fi
H j hi
siguientes formulas: H i
n

i 1

Adems, se tiene en cuenta las sgtes propiedades: H1=h1 y Hk = 1


F
H1 1
Donde:
n
F
H1 = h1

H2 2
n
H2 = h 1 + h 2
...

Fk
H

k
Hk = h1 + h2 ++ hk
n
Asimismo tenemos la Frecuencia Relativa Acumulada Porcentual
(Hi%), que se obtiene de la siguiente manera: Hi% = Hi x 100%.
5

Tablas de Distribucin de Frecuencias

1 Para Variables Cuantitativas Discretas: La tabla de


Distribucin de Frecuencias toma la siguiente forma:
Valores
Variable (Yi)

fi

Fi

hi

Hi

hi%

Hi%

Y1

f1

F1

h1

H1

h1%

H1%

Y2

f2

F2

h2

H2

H2%

H2%

YK

fK

FK

hK

HK=1

hK%

100%

TOTAL

---

---

100 %

---

Es muy fcil
de realizarlo!

2 Para Variables Cuantitativas Continuas:

Intervalo de Marca de
Clase , Clase (Yi)

fi

Fi

hi

Hi

hi%

Hi%

I1

Y1

f1

F1

h1

H1

h1%

H1%

I2

Y2

f2

F2

h2

H2

H2%

H2%

IK

YK

fK

FK

hK

Hk

hK%

Hk%

TOTAL

---

---

---

100%

---

Donde: I1 = Xmin ; Xmin+A

I2 = Xmin+ A; Xmin+ 2A

..

Ik

Marca de Clase (Yi): Tambin llamado punto medio, se obtiene utilizando la


siguiente formula:
X X

Yi

min A

min

2
7

2.1

2.1.1.

Para Construir esta Tabla se sigue los siguientes pasos:

Determinar el Rango (R):

R= Xmax Xmin

Donde: Xmax : mximo valor de todos los datos


Xmin: mnimo valor de todos los datos
2.1.2.

Determinar el nmero de intervalos (K): Un nmero aproximado de


intervalos nos da la Regla de Sturgess: K=1+3.3 Log(n)
Donde: n: tamao de la muestra y K toma valores entre 5 y 20.
En otros casos este nmero de intervalos la puede determinar el mismo
investigador, este nmero de intervalos debe estar como mnimo entre 5
y 20.

Rango
K

2.1.3.

Determinar la amplitud (A):

2.1.4.

Encontrar una diferencia entre: R R , Donde: R : Rango prima

2.1.5.

Construir los intervalos y la tabla de distribucin de frecuencias

3 Para Variables Cualitativas:

En este caso la tabla de distribucin de frecuencias ser


de la siguiente forma:

Variable (Yi)
Caracterstica A

fi
f1

hi
h1

hi%
h1%

Caracterstica B

f2

h2

H2%

Caracterstica Z

fz

hz

hz%

TOTAL

1.00

100%
9

Cuadros y Grficos Estadsticos

Una vez redactados y organizados los datos, pasamos a realizar un anlisis


estadstico en forma grfica y numrica.
I.

CUADROS ESTADSTICOS

La finalidad de los cuadros estadsticos es ofrecer informacin resumida de la


fase de lectura e interpretacin. Se puede representar variables cualitativas,
cuantitativas o una combinacin de ambas. Las partes de un cuadro son:
Nmero: que viene hacer la identificacin del cuadro.
Ttulo: El ttulo debe ser colocado en la parte superior central y debe reunir dos
condiciones bsicas: Que sea completo y debe contestar a cuatro interrogantes:
Qu?
: Se refiere a la poblacin que se estudia.
Cmo?
: Se refiere a como estn distribuidas las variables.
Donde?
: Se refiere al lugar a que se refiere la informacin.
Cuando?
: Es el periodo del tiempo a que se refiere el estudio.
Cuerpo: Es el conjunto de celdas donde estn anotados los datos numricos.
Fuente: Sirve para nombrar la entidad responsable de donde se obtuvieron los
datos.
Notas Explicativas: Se utiliza en caso de ser necesario.
10

Ejemplo 01
Cuadro que muestra la distribucin de alumnos matriculados en la
Institucin Educativa Asuncin del Distrito de Trujillo del ao lectivo
2008, clasificadas por grado de estudios y sexo.
Solucin: Qu? : Alumnos matriculados.
Cmo? : Grado de estudios y sexo.
Donde?: I.E.Asuncin-Distrito Trujillo.
Cuando?: Ao lectivo 2008.
El ttulo quedara de la siguiente manera:
CUADRO N 01
Nmero de Alumnos Matriculados en la Institucin Educativa
Asuncin, segn grado de estudios y sexo, Distrito de Trujillo-

Ao lectivo 2008
11

Los Tipos de Cuadros Estadsticos, son:


Cuadros Simples.- Se utilizan para representar informacin con una
sola variable ya sea cualitativa o cuantitativa.
Cuadros Compuestos.- Se utiliza para representar informacin con dos
variables ya sea cualitativa, cuantitativa o una combinacin de ambas.

Ejemplo 02
Se tiene la informacin acerca del nivel socioeconmico de los Padres de
familia de la Institucin Educativa Cristo Rey del Distrito de la Esperanza,
correspondientes al ao 2008. En el nivel socioeconmico alto 40, en el
nivel socioeconmico medio 60 y en el nivel socioeconmico bajo 20;
adems sabemos que en el nivel alto son 15 mujeres, del nivel medio 10
son varones y del nivel bajo 5 son varones. Construir los cuadros
estadsticos adecuados para esta informacin.
Solucin:
Qu? :
Cmo?:
Donde?
:
Cuando?
:
El ttulo quedara de la siguiente manera:
CUADRO N..

..
12

CUADRO SIMPLE:

CUADRO COMPUESTO:
CUADRO N 03

..

CUADRO N 02

Nivel
Socioeconmico

N Padres
de Familia

Alto

40

Medio

60

Bajo

20

Total

120

Nivel
Sexo
Socioeconmic
Masculin Femenin
o
o
o

Total

Alto

25

15

40

Medio

10

50

60

Bajo

15

20

Total

40

80

120

13

Ejemplo

Cuntos individuos tienen


menos de 2 hijos?
frec. indiv. sin hijos
+
frec. indiv. con 1 hijo
= 419 + 255
= 674 individuos

Qu porcentaje de individuos
tiene 6 hijos o menos?
97,3%

Qu cantidad de hijos es tal


que al menos el 50% de la
poblacin tiene una cantidad
inferior o igual?
2 hijos

Nmero de hijos

0
1
2
3
4
5
6
7
Ocho+
Total

Frec.
419
255
375
215
127
54
24
23
17
1509

Porcent.
(vlido)
27,8
16,9
24,9
14,2
8,4
3,6
1,6
1,5
1,1
100,0

Porcent.
acum.
27,8
44,7
69,5
83,8
92,2
95,8
97,3
98,9
100,0

50%

14

II. GRAFICOS ESTADSTICOS

Los grficos tienen la ventaja de permitir apreciar ms


rpidamente los datos y as determinar con rapidez las
conclusiones para la toma de decisiones. Las partes de un
grfico son: Ttulo, Grfico propiamente dicho y/o leyenda, y
Fuente.
Tipos de Grfico:
Grfico de Barras
Grfico de sectores pastel
Diagrama de frecuencias
Histograma de frecuencias
Ojivas
Polgonos de Frecuencia
Grfico de Lneas
15

II.1. GRAFICO DE BARRAS

A) Barras Simples.- estn representadas por una serie de rectngulos que


pueden ser horizontal o vertical. Se utiliza para representar informacin con una
sola variable que puede ser de tipo cualitativa o cuantitativa discreta.
B) Barras Dobles.- se utilizan para representar informacin con las variables y
hacer comparaciones.
C) Barras Compuestas Proporcionales.- sirven para representar informacin
en una sola figura.
Se recomienda que todas las barras deben tener el mismo tamao y el espacio
entre barra y barra debe ser de la misma magnitud. Adems estos grficos
mayormente son usados para variables cualitativas.
419
400

375

300

255
215
200

127
100

54
24
0

Nmero de hijos

23

17

EJEMPLO 03: Con la


informacin del ejemplo
02, graficar los diferentes
tipos de grficos de
barras.

7 Ocho o ms

16

II.2. GRAFICO DE SECTORES PASTEL

Este grfico es un diagrama circular en forma de pastel cuyos valores han


sido convertidos en porcentajes para facilitar su comparacin. Este grfico se
utiliza para representar datos cualitativos o cuantitativos discretos.
Pero no usarlo con variables ordinales.
El rea de cada sector es proporcional a su frecuencia (abs. o rel.)

EJEMPLO 04: Con la


informacin del ejemplo 02,
graficar los diferentes tipos de
grficos de barras.
17

II.3. DIAGRAMA DE FRECUENCIAS

Tambin conocido como grfico de bastones, est constituido por


un conjunto de segmentos perpendiculares al eje X con una
longitud directamente proporcional a las frecuencias absolutas o
relativas; para ello en el eje X se colocan los valores de la variable
Yi y en el eje vertical u ordenada van los valores de las frecuencias
absolutas o relativas.
Si en la representacin se refiere a las frecuencias absolutas o
relativas acumuladas, se denominar Diagrama de Frecuencias
Acumuladas, colocndose los valores de la variable Yi en el eje
horizontal y en el vertical las frecuencias acumuladas.
EJEMPLO 05: De un grupo de
edificios se ha considerado el nmero
de pisos y se han obtenido los
siguientes valores:
8,8,9,4,5,6,6,10,6,7,4,5,7,4,10,9,4,6,7
18
,7.

II.4. HISTOGRAMA DE FRECUENCIAS

Es usado para describir datos referentes a variables


continuas, que por lo general se agrupan en Tabla de
Frecuencias con intervalos. Se construyen levantando sobre el
eje de las abcisas, rectngulos sucesivos que tengan por base la
amplitud del intervalo de clase y una altura igual a su frecuencia
absoluta simple (fi) relativa porcentual hi%.
250

200

150

100

50

20

40

60

Edad del encuestado

80

19

II.5. POLIGONOS DE FRECUENCIAS

Los Polgonos de Frecuencias Simples, sirven para representar frecuencias


simples en variables continuas y se construye como sigue:
En cada punto medio o marca de clase (Yi) de cada intervalo se levanta un
segmento de lneas punteadas de altura igual a la respectiva frecuencia fi hi
%, tambin se grafican los puntos (Yi, fi) (Yi, hi%); luego se unen los puntos
formando una lnea poligonal y se cierra esta agregando los puntos medios de
intervalos adicionales anterior y posterior al conjunto de intervalos.
Punto medio anterior (Yo)
: Yo = Y1 A
Punto medio posterior (Yk+1) : Yk+1 = Yk + A
Los Polgonos de Frecuencias Acumuladas (OJIVA), se usa para
representar frecuencias acumuladas absolutas relativas en variables
continuas y se construye como sigue:
En el eje horizontal se ubica los extremos del intervalo adicional anterior y
los puntos medios o marcas de clase (Yi) de los dems intervalos, luego se
grafican los puntos con ordenadas proporcionales a las frecuencias
acumuladas. Finalmente, se unen estos puntos formando as el Polgono
Acumulativo.
Punto medio anterior (Yo)
: Yo = Y1 A
20

EJEMPLO 06: Los siguientes datos corresponden a la


distribucin de frecuencias de los Ingresos por cuota
de matricula y otros aportes en miles de nuevos soles
de 48 colegios nacionales de la Ciudad de Cajamarca,
durante el ao lectivo 2007. Dichos ingresos se
agruparon de la siguiente manera:(Observar cuadro)
Realizar un Histograma de Frecuencias y polgonos de
frecuencias simples y acumulativas.
II.6. GRAFICO DE LINEAS

N
Colegios

08-18

18-28

28-38

38-48

48-58

58-68

68-78

Tambin conocido como Grfico de Series de Tiempo, est


constituido por una lnea poligonal que se construye sobre el plano
cartesiano. En el eje horizontal se ubica el tiempo X (aos, meses
semanas, etc.). En el eje vertical los valores de las observaciones
correspondientes de la variable Y (produccin, poblacin, ventas,
exportaciones, etc.)
Ejemplo 07..

MUCHAS GRACIAS!

21

EJERCICIO 01

Suponga que estamos interesados en estudiar el


nmero de nios en las familias viviendo en la
comunidad. Los datos siguientes fueron reunidos
basados en una muestra aleatoria de n=30 familias
de la comunidad.
2, 2, 5, 3, 0, 1, 3, 2, 3, 4, 1, 3, 4, 5, 7, 3, 2, 4, 1, 0, 5, 8,
6, 5, 4 , 2, 4, 4, 7, 6
Organice estos datos en una tabla de frecuencias,
interprete y realice un grafico adecuado!
22

EJERCICIO 02

Suponga que necesitamos construir una tabla de


frecuencias similar para la edad en aos de los padres
de familia de la Institucin Educativa San Jose de
Trujillo.
Los siguientes datos han sido reunidos basados en una
muestra aleatoria de n=30 padres de familia.
Las mediciones fueron: 42, 38, 51, 53, 40, 68, 62, 36,
32, 45, 51, 67, 53, 59, 47, 63, 52, 64, 61, 43, 56, 58, 66,
54, 56, 52, 40, 55, 72, 69.
23

TEMA 03: MEDIDAS


ESTADISTICAS
Docente: Ms. Selene Yengle Del Castillo

24

Parmetros y estadsticos

Parmetro: Es una cantidad numrica calculada


sobre una poblacin. Ejm.:
Rendimiento acadmico medio de los alumnos de
las universidades de un pas.
La idea es resumir toda la informacin que hay en la
poblacin en unos pocos nmeros (parmetros).

Estadstico: Es una cantidad numrica calculada


sobre una muestra. Ejm.:
El Rendimiento Acadmico medio de los que
estamos en esta aula.
Somos una muestra (representativa?) de la
poblacin. Si un estadstico se usa para aproximar
un parmetro tambin se le suele llamar estimador.

Normalmente nos interesa conocer un parmetro, pero por la dificultad


que conlleva estudiar a *TODA* la poblacin, calculamos un estimador
sobre una muestra y confiamos en que sean prximos. Ms adelante
veremos como elegir muestras para que el error sea confiablemente
Estadstica U.N.C.
pequeo.

25

25

CLASES DE MEDIDAS DE RESUMEN:

Estadstica U.N.C.

26

26

Un brevsimo resumen sobre estadsticos

Posicin
Dividen un conjunto ordenado de datos en grupos con la
misma cantidad de individuos.

Centralizacin
Indican valores con respecto a los que los datos parecen
agruparse.

Media, mediana y moda

Dispersin
Indican la mayor o menor concentracin de los datos con
respecto a las medidas de centralizacin.

Cuantiles, percentiles, cuartiles, deciles,...

Desviacin tpica, coeficiente de variacin, rango, varianza

Forma
Asimetra
Apuntamiento o curtosis
27

MEDIDAS DE TENDENCIA CENTRAL

Son aquellas medidas que nos indican la posicin de un valor respecto a la variable y adems nos indica como los datos tienden a
agruparse.

x por:
MEDIA ARITMTICA (mean).- se representa

M(x). Es la media aritmtica (promedio) de los valores


de una variable. Suma de los valores dividido por el
tamao muestral.
n Agrupados: x , x , ..., x
a)Frmula para Datos No
1
2
n
xi

x i 1
n
Ejm: Hallar la Media de los siguientes datos: 2,2, 3, 7 es
(2+2+3+7)/4=3,5

La media aritmtica es conveniente cuando los datos se concentran


simtricamente con respecto a ese valor. Muy sensible a valores extremos.
Representa el centro de gravedad de los datos.
Estadstica U.N.C.

28

28

b) Frmula para Datos Agrupados: si est en intervalos usar como xi las marcas de clase. Si no ignorar la columna de intervalos.

x f

i i

i 1

Intervalos de clase
Xi

fi

Xifi

(Variable)
L0 L1

x1

f1

X1f1

L1 L2

x2

f2

X2f2

...

Lk-1 Lk

xk

fk

Xkfk

TOTAL
n
La media aritmtica tambin se puede calcular tomando como
ponderaciones a las frecuencias relativas simples (hi);
k

EJEMPLOS..

x xi hi
i 1

Estadstica U.N.C.

29

29

MEDIANA (median).- Se representa por: Me. Es un valor que


divide a las observaciones en dos grupos con el mismo nmero de
individuos; de tal manera que el 50% de los datos son menores
que el valor mediano y el otro 50% son valores mayores que la
mediana.
a) Frmulas para Datos No Agrupados:
a.1) Si el nmero de datos es impar, se elige la media del dato
n 1
central y se utiliza la sgte. Frmula:

Posicin.Me

Hallar la Mediana de 1, 2, 4,5 ,6 ,6 ,8 es 5


a.2)Si el nmero de datos es par, se elige la media de los
dos datos centrales y se utiliza la sgte. Frmula:

n n
Posicin.Me ; 1
2 2

Mediana de 1,2,4,5,6,6,8,9 es (5+6)/2=5,5


La Mediana es conveniente cuando los datos son asimtricos. No
es sensible a valores extremos. Ejemplo:
Mediana de 1,2,4,5,6,6,800 es 5. La media es 117,7!
30

Estadstica U.N.C.

30

b) Frmulas para Datos Agrupados: Consideremos dos casos:

Caso a: Cuando Fi-1 < n/2; Me = Yi


Variable Discreta

Yi 1 Yi
Caso b: Cuando Fi-1 = n/2;Me
2
Caso a: Cuando Fi-1 = n/2; Me = Yi-1

n
Variable Continua Caso b: Cuando F < n/2;
Fi 1

i-1
Me Y i -1 2
fi

Donde:

Fi-1 : Frecuencia absoluta acumulada anterior al intervalo posicin mediana.


Yi : Marca de clase de la posicin mediana.
Yi-1 : Marca de clase anterior a la posicin mediana.
A : Amplitud del intervalo de clase.
n/2 : Nmero de datos dividido entre dos.
fi : Frecuencia absoluta simple del intervalo posicin mediana.
Yi-1 : Lmite Real Inferior del intervalo mediano.

Estadstica U.N.C.

31

31

Pasos a seguir en el clculo de la Mediana:

Obtener las frecuencias absolutas acumuladas .


Buscar la mitad de las observaciones, por medio de n/2.
Localizar el resultado anterior (n/2) en la columna de las frecuencias absolutas
acumuladas y denominarle Fi-1 . Si no aparece el valor n/2, al valor inmediatamente
anterior se denomina Fi-1 y al inmediatamente superior se denomina F i.
Si Fi-1 es menor que n/2 igual que n/2, entonces el valor de la mediana ser igual
aplicando las formulas de los casos antes mencionados.
EJEMPLOS

MODA (mode).- Se representa por: Mo. Es el/los valor/es donde la


distribucin de frecuencia alcanza un mximo. Tambin se define como
aquel valor de la variable que presenta la mayor frecuencia (absoluta
simple) el valor que ms se repite.
La frmula es: Mo = Yi (igual a la marca de clase de la mayor
frecuencia absoluta simple).
El valor ms frecuente se denomina fi, el valor inmediatamente anterior fi-1 y el
valor inmediatamente superior en posicin fi+1.
Estadstica U.N.C.

32

32

Estadsticos de posicin

Se define el cuantil de orden como un valor de la variable por debajo


del cual se encuentra una frecuencia acumulada

Casos particulares son los percentiles, cuartiles, deciles, quintiles,...

33

Estadsticos de posicin

Percentil de orden k = cuantil de orden k/100


La mediana es el percentil 50
El percentil de orden 15 deja por debajo al 15% de las
observaciones. Por encima queda el 85%

Cuartiles: Dividen a la muestra en 4 grupos con


frecuencias similares.
Primer cuartil = Percentil 25 = Cuantil 0,25
Segundo cuartil = Percentil 50 = Cuantil 0,5 = mediana
Tercer cuartil = Percentil 75 = cuantil 0,75

34

CUARTILES.- Divide a la muestra en 4 grupos con frecuencias similares. Se representa por Qi, donde i=1,2,3. La frmula es la siguiente:

n
Fi 1
4
fi

Qi Y i -1

25%

25%
Q1

Q2

25%
Q3

25%

DECILES.- Divide a la muestra en 10 grupos con frecuencias similares. Se


representa por Di, donde i=1,2,3,4,5,6,7,8,9. La frmula es la siguiente:
n

i
Fi 1
10% 10% 10% 10% 10% 10% 10% 10% 10% 10%
10

A
Di Y i -1

fi
D1 D2 D3 D4 D5 D6 D7 D8 D9

PERCENTILES CENTILES.- Divide a la muestra en 100 grupos con


frecuencias similares. Se representa por Pi, donde i=1,2,3,,99. La frmula es
la siguiente: i n F
i 1
1% 1%1%1%1% . 1%
100

A
Pi Y i -1

fi
P1 P2 P3 P4 P5 . P50
P99

35
Estadstica U.N.C.
35
EJEMPLOS..

Ejemplos
El

5% de los recin nacidos tiene un peso demasiado


bajo. Qu peso se considera demasiado bajo?

Percentil 5

15
10
5
0

frecuencia

20

25

Percentil 5 del peso

3
Peso al nacer (Kg) de 100 nios

Estadstica U.N.C.

5
36

36

Estadsticos

Ejemplo
Nmero de aos de escolarizacin

3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Total

Frecuencia
5
5
6
12
25
68
56
73
85
461
130
175
73
194
43
45
22
30
1508

Estadstica U.N.C.

Porcentaje
,3
,3
,4
,8
1,7
4,5
3,7
4,8
5,6
30,6
8,6
11,6
4,8
12,9
2,9
3,0
1,5
2,0
100,0

Porcentaje
acumulado
,3
,7
1,1
1,9
3,5
8,0
11,7
16,6
22,2
52,8
61,4
73,0
77,9
90,7
93,6
96,6
98,0
100,0

20%?

Nmero de aos de escolarizacin


N
Vlidos
1508
Perdidos
0
Media
12,90
Mediana
12,00
Moda
12
Percentiles
10
9,00
20
11,00
25
12,00
30
12,00
40
12,00
50
12,00
60
13,00
70
14,00
75
15,00
80
16,00
90
16,00

90%?

37

37

Ejemplo con variable en intervalos


Peso

M.
Clas
e

fre
c

Fr.
acu
m.

40 50 45

50 60 55

10

15

60 70 65

21

36

70 - 80

75

11

47

80 - 90

85

52

90 100

95

55

100
130

115

58

En el histograma se identifica unidad de rea con


individuo.
Para calcular la media es necesario elegir un punto
representante del intervalo: La marca de clase.
La media se desplaza hacia los valores extremos.
No coincide con la mediana. Es un punto donde el
histograma estara en equilibrio si tuviese masa.
Estadstica U.N.C.

38

38

Ejemplo (continuacin)

Peso

M. Clase

fi

Fi

40 50

45

50 60

55

10

15

60 70

65

21

36

70 - 80

75

11

47

80 - 90

85

52

90 - 100

95

55

100 130

115

58

x f

x
i

i i

45(5) 55(10) 115(3)


69,3
58

Fi 1

( A)
Mediana Y i 1 2
f

58

15

29 15
(10) 60

60 2
10

66
,
6

21
21

58

n
58
i
75
Fi 1
36
100
100
( A) 70
10 70 43,5 36 (10) 76,8
P75 Y i 1

fi
11
11

Moda

= marca de clase de [60,70) = Y3 = 65

Estadstica U.N.C.

39

39

Medidas de dispersin

Mn.

P25

P50

P75

Mx.

El rango es 8-1=7
Es muy sensible a los valores extremos.

25%

0.02

2,1,4,3,8,4.

0.03

0.04

0.05

Miden el grado de dispersin (variabilidad) de los datos,


independientemente de su causa.
Amplitud o Rango (range):
Diferencia entre observacines extremas.
25% 25%

25%

Rango intercuartlico

Rango

la distancia entre primer y tercer cuartil.

Rango intercuartlico = P75

- P25

0.00

Es

intercuartlico (interquartile range):


0.01

Rango

150

160

170

180

190

Parecida

al rango, pero eliminando las observaciones ms


extremas inferiores y superiores.
No es tan sensible a valores extremos.
40

Estadstica U.N.C.

40

Varianza S2 (Variance): Mide el promedio de las desviaciones (al


cuadrado) de las observaciones con respecto a la media.
S2

S2

1
( xi x ) 2

n i

Datos

1
2
(
x

x
)
fi

i
n 1 i

No agrupados

Datos agrupados

Es

sensible a valores extremos (alejados de la media).


Sus unidades son el cuadrado de las de la variable. De interpretacin difcil
para un principiante.
La expresin es fea, pero de gran belleza natural (fsicamente). Contiene la
informacin geomtrica relevante en muchas situaciones donde la energa
interna de un sistema depende de la posicin de sus partculas.
Energa de rotacin (va el coeficiente de inercia): patinadores con brazos
extendidos (dispersos) o recogidos (poco dispersos)

Energa elstica: Muelles estirados con respecto a su posicin de


equilibrio (dispersos) frente a muelles en posicin cercana a su posicin
de equilibrio (poco dispersos)

Estadstica U.N.C.

41

41

Desviacin tpica (standard


deviation)
Es la raz cuadrada de la varianza
Tiene las misma dimensionalidad
(unidades) que la variable.
Versin esttica de la varianza.
Cierta distribucin que veremos
ms adelante (normal o
gaussiana) quedar
completamente determinada por
la media y la desviacin tpica.
A una

distancia de una desv. tpica de


la media hay ms de la ms de la
mitad.
A una distancia de dos desv. tpica de
la media las tendremos casi todas.
Estadstica U.N.C.

S S

50

40

30

20

10

Desv. tp. = 568,43


Media = 2023

N = 407,00

Peso recin nacidos en partos gemelares

42

42

Coeficiente de variacin
Es la razn entre la desviacin tpica y la media.
Mide

la desviacin tpica en forma de


qu tamao tiene con respecto a la media
Tambin se la denomina variabilidad relativa.
Es frecuente mostrarla en porcentajes

S
CV 100%
x

Si la media es 80 y la desviacin tpica 20 entonces CV=20/80=0,25=25%


(variabilidad relativa).

Es una cantidad adimensional. Interesante para comparar la


variabilidad de diferentes variables.
Si

el peso tiene CV=30% y la altura tiene CV=10%, los individuos presentan


ms dispersin en peso que en altura.

No debe usarse cuando la variable presenta valores negativos o


donde el valor 0 sea una cantidad fijada arbitrariamente
Por

ejemplo 0C 0F

Esta Medida de Dispersin es til para comparar la dispersin entre


dos o ms distribuciones de variables con diferentes unidades de
medida.

Estadstica U.N.C.

43

43

MEDIDAS DE FORMA

Asimetra o Sesgo:

Se utilizan para medir el grado de deformacin de una


distribucin de frecuencias tomando como referencia la
Distribucin Normal.
En las distribuciones SIMTRICAS media y mediana
coinciden. Si slo hay una moda tambin coincide.
M(x)=Me=Mo y As=O
La asimetra es positiva o negativa en funcin de a qu
lado se encuentra la cola de la distribucin.
Distrib. Asimtrica positiva: M(x)>Me>Mo y As > O
Distrib. Asimtrica Negativa: M(x)<Me<Mo y As < O
La media tiende a desplazarse hacia las valores extremos
(colas).
Las discrepancias entre las medidas de centralizacin son
indicacin de asimetra.
Las frmulas delx
Coeficiente
de Asimetra (As) son:
Mo
As

s
3 x Me
As
s
Estadstica U.N.C.

44

44

Apuntamiento o Kurtosis

La kurtosis nos indica el grado de apuntamiento (aplastamiento)


o levantamiento de una distribucin con respecto a la
distribucin normal o gaussiana. Es adimensional.
Platicrtica (aplanada): curtosis < 3
m4
m4
2 ; Donde :
Mesocrtica (como la normal): curtosis = 3 K
2
m2 s 2
Leptocrtica (apuntada): curtosis > 3

En el curso sern de especial inters


las mesocrticas y simtricas
(parecidas a la normal).

m4

i 1

fi

y m2 s 2

Apuntada como la normal

xi x 2 fi
i 1

Apuntada

0.4
0.2

0.5

0.1

1.0

0.2

0.6

1.5

0.3

0.8

2.0

Aplanada

xi x

x s

xs

x s

68 %

82 %

0.0

0.0

0.0

57 %

0.0

Estadstica
0.2
0.4U.N.C.0.6

0.8

1.0

-3

-2

-1

-2

-1

45

452

Qu hemos visto?

Parmetros
Estadsticos y estimadores
Clasificacin
Posicin (cuantiles, percentiles,...)

Medidas de centralizacin: Media, mediana y moda

Diagramas de cajas
Diferenciar sus propiedades.

Medidas de dispersin

con unidades: rango, rango intercuartlico, varianza, desv.


tpica
sin unidades: coeficiente de variacin

Asimetra

positiva
negativa

Qu usamos para comparar dispersin de dos poblaciones?

Podemos observar asimetra sin mirar la grfica?


Cmo me gustan los datos?

Medidas de apuntamiento (curtosis)

Cmo me gustan los datos?


46

Você também pode gostar