Você está na página 1de 100

Estadgrafos Descriptivos

Son indicadores estadsticos


que con ayuda de los grficos
y tablas describen las
caractersticas principales de
los datos de la (s) de estudio
CASO: Acciones Negociadas en la
Bolsa de Valores de Lima
Datos: 1.-Cotizaciones Diarias de los ADRs de Telefnica de
Espaa (TEF): 1/10/01 - 23/01/02
Fecha Cierre Fecha Cierre Fecha Cierre Fecha Cierre
1 1/10/01 32.70 20 29/10/01 35.75 39 27/11/01 41.56 58 26/12/01 40.08
2 2/10/01 32.51 21 30/10/01 34.60 40 28/11/01 40.50 59 27/12/01 40.20
3 3/10/01 32.75 22 31/10/01 35.61 41 29/11/01 39.65 60 28/12/01 40.00
4 4/10/01 32.70 23 5/11/01 36.31 42 30/11/01 40.30 61 2/1/02 40.90
5 5/10/01 31.40 24 6/11/01 36.55 43 3/12/01 38.97 62 3/1/02 42.50
6 9/10/01 32.26 25 7/11/01 38.60 44 4/12/01 40.40 63 4/1/02 41.43
7 10/10/01 33.01 26 8/11/01 40.22 45 5/12/01 42.90 64 7/1/02 39.77
8 11/10/01 32.86 27 9/11/01 39.40 46 6/12/01 43.00 65 8/1/02 39.50
9 12/10/01 32.50 28 12/11/01 38.80 47 7/12/01 42.57 66 9/1/02 38.40
10 15/10/01 33.61 29 13/11/01 40.12 48 10/12/01 41.65 67 10/1/02 37.76
11 16/10/01 34.84 30 14/11/01 40.44 49 11/12/01 42.05 68 11/1/02 37.90
12 17/10/01 35.43 31 15/11/01 42.00 50 12/12/01 41.40 69 14/1/02 36.51
13 18/10/01 34.65 32 16/11/01 42.05 51 13/12/01 40.51 70 15/1/02 36.90
14 19/10/01 33.90 33 19/11/01 42.62 52 14/12/01 40.15 71 16/1/02 35.60
15 22/10/01 34.36 34 20/11/01 41.35 53 17/12/01 41.40 72 17/1/02 36.80
16 23/10/01 35.55 35 21/11/01 40.10 54 18/12/01 41.45 73 18/1/02 37.40
17 24/10/01 37.20 36 22/11/01 39.50 55 19/12/01 40.50 74 21/1/02 36.95
18 25/10/01 36.57 37 23/11/01 40.56 56 20/12/01 39.90 75 22/1/02 35.95
19 26/10/01 36.81 38 26/11/01 41.27 57 21/12/01 40.10 76 23/1/02 36.91
Grfico
GrficoLineal
Lineal
Cotizaciones Diarias de los ADRs de Telefnica de Espaa (TEF):
1/10/01 - 23/01/02
44.00
US$

42.00

40.00

38.00

36.00

34.00

32.00

30.00

Fuente : Bolsa de Valores de Lima

Fuente : Bolsa de Valores de Lima.


Grfico
GrficoLineal
Lineal
Cotizaciones Diarias de las Acciones de Credicorp (BAP):
1/10/01 - 23/01/02

US$ 9.50

9.30

9.10

8.90

8.70

8.50

8.30

8.10

7.90

7.70

7.50

Fuente : Bolsa de Valores de Lima


2. Tabla de Distribucin de Frecuencias

Cotizaciones de Cierre Diarias de los ADRs de


Telefnica de Espaa :01-10-01 - 23-01-02 - (US$)
( Yi -1 - Yi +1 ] Yi fini Fi
Ni hi % Hi%
1 31.39 - 33.05 32.22 9 9 11.84 11.84
2 33.05 - 34.71 33.88 5 14 6.58 18.42
3 34.71 - 36.37 35.54 8 22 10.53 28.95
4 36.37 - 38.03 37.2 12 34 15.79 44.74
5 38.03 - 39.69 38.86 8 42 10.53 55.26
6 39.69 - 41.35 40.52 20 62 26.32 81.58
7 41.35 - 43.01 42.18 14 76 18.42 100.00
TOTAL n = 76 100.00

Fuente : Bolsa de Valores de Lima.


2. Tabla de Distribucin de Frecuencias

Cotizaciones de Cierre Diarias de las Acciones de Credicorp:


01-10-01 - 23-01-02 - (US$)
( Yi -1 - Yi +1 ] Yi fin i Ni
Fi hi% H i%
1 7.79 - 8.00 7.895 10 10 13.51 13.51
2 8.00 - 8.21 8.105 9 19 12.16 25.68
3 8.21 - 8.42 8.315 11 30 14.86 40.54
4 8.42 - 8.63 8.525 3 33 4.05 44.59
5 8.63 - 8.84 8.735 14 47 18.92 63.51
6 8.84 - 9.05 8.945 23 70 31.08 94.59
7 9.05 - 9.26 9.155 4 74 5.41 100.00
TOTAL n = 74 100.00

Fuente : Bolsa de Valores de Lima.


3. POLIGONO DE DISTRIBUCION FRECUENCIA
Cotizaciones Diarias de los ADRs de Telefnica de Espaa
hi%
Cotizaciones Diarias de los ADRs Telef. Espaa
25

20

15

10

0
32.2 33.9 35.5 37.2 38.9 40.5 42.2 Yi (US$)

X=38.18 Me =38.86 Mo =40.79


3. POLIGONO DE DISTRIBUCION FRECUENCIA
Cotizaciones Diarias de las Acciones de Credicorp
hi%
35

30

25

20

15

10

0
7.695 7.895 8.105 8.315 8.525 8.735 8.945 9.155
X=8.56 Me =8.69 Mo =8.91Yi (US$)
ESTADIGRAFOS DE TENDENCIA
CENTRAL

1. Promedio o Media Aritmtica


Es la ms comn, posee las mejores caractersticas para el caso de
la estadstica inferencial, se denomina simplemente como Media

2. La Mediana
Es el valor que divide a los datos debidamente ordenados o tabulados
en dos partes de igual tamao. Es aplicable especialmente para casos
de variables con valores extremos

3. La Moda
Es el valor que se presenta ms frecuente. Es aplicable especialmente
en casos de variable nominal o no cuantitativa
Polgono de Distribucin Normal

1 Unimodal 2 Simtrica: Dos mitades idnticas

4 Forma de Campana

3 Asinttica 3 Asinttica
Cola Cola
- +
Media = Mediana = Moda
1. PROMEDIO O MEDIA ( X )
a) Para Datos sin Agrupar

X = Xi
n
Xi = Valores de una variable cuantitativa
n = n de datos u observaciones

b) Para Datos Agrupados


Para una Tabla Simple Para una Tabla Intervlica

X = Xi f i X = Yi f i
n n
Yi = promedio de los limites
de los intervalos o marca de clase
1. a Promedio o Media (X ) para Datos No Tabulados
FORMULA
X = Xi = x1 + x2 + . . . x n
n n
Xi = Valores de una variable cuantitativa
n = n de datos u observaciones
Ejemplo
Xi = N de clientes atendidos por da : 15, 24, 13, 12, 10, 25
X = 15 +24 + 13 + 12 +10 + 25 = 16.5 17
6
Interpretacin : El nmero promedio de clientes atendidos es 16.5 17
1. b Promedio (X ) - Datos Tabulados: Tabla Simple

Datos: N de
unidades vendidas
de un grupo de
vendedores.
Xi : N de unidades
vendidas.
Unidad de anlisis:
Cada vendedor

X = Xi fi = 251 = 12.55 13
n 20
Interpretacin : El nmero promedio de unidades vendidas fue
de 13
1.c Promedio (Y): Datos Tabulados: Tabla Intervlica

X= Yi fi = 434 = 14.467
n 30
Interpretacin : El Tiempo promedio de ensamblado fue
de 14.47 minutos
PROPIEDADES DE LA MEDIA
Sea X una variable cuantitativa
Media aritmtica de : M(x) = X = Xi
n
A, B : Constantes
1. M (A) = A

2. a) M (AX) = A x M (X)
b) M( 1 x X) = 1 x M(X)
A A

3. a) M( A + X) = A + M(X)
b) M( 1 + X) = 1 + M(X)
A A
4. M(A + B x X ) = A + B x M(X)
Ejercicios:
La remuneracin promedio de los trabajadores de un empresa es de 1
935 soles. M(X) = 1935
Por concepto de reparto de utilidades percibieron una nica vez un
bonificacin de 500 soles.
Si adems la empresa acord in incremento de la remuneraciones del
orden del 20%
1 ) Cul ser la remuneracin promedio incluyendo solo la bonificacin?
M( X + 500 ) = M(x) + 500 = 1 935 + 500 = 2 435 soles
2) Cul ser la remuneracin promedio incluyendo la bonificacin y el
incremento de las remuneraciones?
M( 500 + X + 0.2 X ) = M ( 500 + 1.2 X ) = 500 + 1.2 M(X)

= 500 + 1.2 (1935)

Desventajas De La Media
Aritmtica
CUANDO SE PRESENTAN DATOS
EXTREMOS O DISCORDANTES, LA MEDIA
ARITMTICA YA NO ES REPRESENTATIVA
DE LA MAYORA DE LOS DATOS.

NO SE PUEDE CALCULAR LA MEDIA


ARITMTICA CUANDO ALGN LMITE DE
LOS INTERVALOS NO EST
DETERMINADO.
1.DMedia Aritmtica para Sub-grupos (Media de
Medias)
Si Consideran k sub-muestras de tamaos n1, n2, , nk,
a los cuales les corresponden las medias aritmticas,
luego la media aritmtica de todos los
datos est dada por:

X n i i
X1 , X 2 ,
. . . , XK X i 1
K

n
i 1
i
EJEMPLO
LA EMPRESA A TIENE 100 EMPLEADOS, CON UN
SUELDO PROMEDIO MENSUAL POR EMPLEADO DE
$300.
LA EMPRESA B TIENE 400 EMPLEADOS, CON UN
SUELDO PROMEDIO MENSUAL DE $250.

LA EMPRESA C TIENE 250 EMPLEADOS Y UN SUELDO


PROMEDIO MENSUAL DE $280.

CUL ES EL SUELDO PROMEDIO MENSUAL POR


EMPLEADO PARA LAS 3 EMPRESAS EN CONJUNTO?
Empresa:
A B C
n1 100, n 2 400, n 3 250
X1 300, X 2 250, X 3 280
Luego :
300 *100 250 * 400 280 * 250
X
100 400 250
X 266,67
1. E Media Aritmtica Ponderada

LA VARIABLE X TIENE K VALORES, X1, X2, , XK.

EL VALOR Xi TIENE PESO Wi. LA MEDIA ARITMTICA


DE X ESTA DADA POR:
K

X W i i
X M X i 1
K

W
I 1
i
2. La Mediana (Me)
La mediana es la medida de tendencia central
que divide al conjunto de datos ordenados en
dos grupos, cada uno con el mismo nmero de
datos.

50%
50%

Me
2.a La Mediana para Datos No Tabulados

SI(Sin
X1 ,agrupar)
X 2 ,..., X n : SON LOS DATOS, ENTONCES
X 1 , X 2 ,..., X n , SON LOS DATOS ORDENADOS
DE MENOR A MAYOR
Luego :
Si n es impar :
Me X n 1

2

Si n es par :
X n X n
1
2 2
Me

2
a1) Mediana para datos sin Agrupar
Proceso :
1. Ordenar de menor a mayor
2. Ubicar el (los) valor(res ) centrales
3. a) Si n (# de valores) es impar: La mediana es el valor central de los
datos, puesto que divide a los datos en dos partes iguales
Ejem. Xi : # de sucursales por empresa : 2, 3, 1, 0, 3, 4, 1

X(1), X(2), X(3), X(4), X(5), X(6), X(7)


0, 1, 1, 2, 3, 3, 4

n = 7 (impar) => Me = X(n+1)/2 =X4 = 2


La mediana es 2, divide los datos en dos partes iguales de 3 valores
Interpretacin : El 50% de las empresas tienen 2 sucursales o

menos.
a1) .../// Mediana para Datos sin Agrupar
Proceso :
3. b) Si n (# de valores) es par
Existen dos valores centrales.
La mediana es el promedio de los dos valores centrales
Ejem. Xi : # de sucursales por empresa : 2, 5, 3, 1, 0, 3, 4, 1
0, 1, 1, 2, 3, 3, 4,5

Los valores 2 y 3 son los valores centrales, y divide a los datos en


dos partes iguales
n = 8 (par) => Me = (2+3) / 2 = 2 3

Interpretacin: El 50% de las empresas tienen 2 o 3 o menos


sucursales
PARA DATOS TABULADOS
b) Variable discreta (Tabla Simple)
n
- SI NO COINCIDE CON ALGN Fi , HACEMOS
2
n
Fj1 Fj Me X j
2

n
- SI COINCIDE CON ALGN Fi , HACEMOS
2
n X j X j1
Fj1 Fj Me
2 2
b) Mediana para Datos Agrupados Tabla Simple
La mediana es el valor de la variable Xi que divide a los datos en dos
partes iguales.

n/2 = 20/2 = 10

Me = n/2 = 10: No coincide con F3 = 11

Me = 12

Interpretacin : El 50% de los


vendedores registraron 12
unidades vendidas menos
Xi: Posibles
valores de X

Datos
Originales
Ordenados

X(i):

n/2 = 10 n/2 = 10
Me
Los valores 12 es el valor central, ya que divide a los datos en
dos partes iguales

Entonces: Me = 12
b) Mediana para Datos Agrupados Tabla Simple
La mediana es el valor de la variable Xi que divide a los datos en dos
partes iguales.

n/2 = 20/2 = 10

n/2 = 10: coincide con F3 = 10


Me = (12+13)/2 = 12.5

Interpretacin : El 50% de los


vendedores registraron 12 o 13
unidades vendidas menos
Datos
Originales
Ordenados

n/2 = 10 n/2 = 10
Los valores 12 y 13 son los valores centrales, y dividen a los
datos en dos partes iguales

n = 20 (par) => Me = (12+13) / 2 = 12.5


c) Mediana para una Tabla Intervlica:

SE CALCULA n 2
SE UBICA n/2 ENTRE DOS Fi
n
Fj1 Fj
2
SE APLICA LA FRMULA :
n
2 Fj1
Me L j c j
fj

donde:

Lj ES EL LMITE INFERIOR DEL


INTERVALO J.
cj ES LA AMPLITUD DEL
INTERVALO J.
fj ES LA FRECUENCIA SIMPLE DEL
INTERVALO J.
Fj1 ES LA FRECUENCIA ACUMULADA
DEL INTERVALO J 1.
Mediana para Datos Tabulados -Tabla Intervlica
n/2 = 15 => f3= 12 < (n/2 = 15) < (f4 = 20) => j = 4
Aplicar la siguiente frmula: Me = 14 + 2 x(15 - 12) = 14.75
8
Tiempo en Minutos Operarios
[ Lim. Inf - Lim. Sup.) Yi f i Fi
8 - 10 9 3 3
10 - 12 11 4 7
12 - 14 13 5 Fj-112
Contiene
Lj = 14 - 16 15 fj=8 20 a n/2 = 15
16 - 18 17 6 26
18 - 20 19 4 30
n= 30
Interpretacin : El 50% de los operarios registraron 14.75 minutos
de ensamblado menos
3. La
LaModa
Moda un grupo de datos es el valor de la
variable que ms se repite en la muestra. Se
denota por Mo.

Cuando todos los datos tienen la misma


frecuencia, la moda no existe, tambin existen
datos que tienen ms de una moda.
a) Moda para Datos No Agrupados
Siguiendo la definicin de la moda.

Sea X : El numero de hijos por hogar en una pequea comunidad


Xi: 3, 2, 1, 2, 1, 3, 4, 0, 2, 3, 3
La Moda es el valor de la variable que ms se repite.

Mo = 3 : La mayora de los hogares tienen 3 hijos

Nota
Un conjuntos de datos puede tener ms de una Moda.
Ejemplo
Xi: 3, 2, 1, 2, 1, 1, 3, 1, 4, 0, 2, 3, 3
Mo1 = 1 Md2 = 3
La mayora de lo hogares tienen 1 y 3 hijos respectivamente.
b) Moda para Datos Agrupados - Tabla Simple
La Moda es el valor de la variable Xi que le corresponde
el mayor fi (Frec. Absoluta Simple)
Es decir: Mo = Xj > fi

Md = 6 > fi

Interpretacin : La mayora de los


vendedores registraron 12
unidades vendidas
c) Moda para datos agrupados en una Tabla
Intervlica

Se debe identificar la mayor frecuencia a la cual


llamaremos fj, y luego aplicar la siguiente frmula:

f j f j1
Mo L j c j
f j f j1 f j f j1

Mo = Lj + cj ( d1 )
d1 + d2
Moda para Datos Agrupados - Tabla Intervlica
1. Hallar el intervalo que le corresponde el mayor valor de fi
2. Aplicar frmula

Mo = Lj + cj d1
d1 + d2
donde :
Lj = Limite inferior del intervalo-j que tiene la mayor fi
cj = Amplitud Intervlica
fj = Es la mayor frecuencia absoluta simple
d1 = fj - fj-1
d2 = fj - fj+1
c) Moda para Datos Agrupados - Tabla Intervlica
Intervalo de mayor fi: [14, 16)
Aplicar la frmula: d1 = 8 - 5 = 3 d2 = 8 - 6 = 2
Mo = 14 + 2 x (3) = 15.2
(3+ 2)
Tiempo en Minutos Operarios
[ Y i - 1 - Y i +1 ) Yi f i Fi
8 - 10 9 3 3
10 - 12 11 4 7
12 - 14 13 5 12
14 - 16 15 8 20 > fi
16 - 18 17 6 26
18 - 20 19 4 30
Interpretacin : La mayora de los operarios registraron 15.2
minutos de ensamblado
Es el valor mayor
2. MODA (Mo) que ms se repite.

Moda para datos Agrupados


Intervalos de tiempo de llegada (horas) QUIEN ATENDIO LA CONSULTA
Frequency Porcentaje
<= 30 Frequency Porcentaje
9180 85.4
min Prof. de la
6933 65.2
30' - 1 h 680 6.3 salud
1-2 469 4.4 Tcnico 1369 12.9
2-4 288 2.7
No
4-6 65 .6 2334 21.9
Especializado
ms de 6
65 .6 100.0
hrs.
100.0 Total 10636
Total 10747

Mo = Atendido por Prof.de la


Mo = 30 min o menos
Salud
Relacin entre Media, Mediana y Moda
1. Si el polgono es Simtrico

Media = Mediana = Moda

Media = Me = Mo
2. Si el polgono es Asimtrico (+)

Media > Mediana> Moda

Mo Me Media
3. Si el polgono es Asimtrico (-)

Media< Mediana < Moda

Media Me Mo
Relacin entre Media, Mediana y Moda
Nota:
Los softwares estadsticos como el Minitab y el
SPSS calculan los estadgrafos como la media,
mediana y moda solo para datos sin agrupar.

En el Minitab la secuencia es: Stat/ basic


statistic/ display statistic descriptive/ seleccionar
variable/ statistic/ seleccionar los estadgrafos /
Ok.
DERIVADOS
DERIVADOSDE DELALAMEDIANA
MEDIANA
Son otros Estadgrafos Descriptivos que proporcionan
un valor representativo de algn porcentaje especfico de
los datos . Ejemplo el 20% , 35%, 95% de los datos

Slo se utilizan cuando el nmero de los datos ( n) es grande


(n > 50).

Estos son :

1.Quartiles ( Q1, Q2, Q3)


2.Quintles (C1, C2, C3, C4 )
3.Deciles (D1, D2, D3, D9 )
4.Percentiles Centiles (P1, P2, P3, ... , P99) .P
Estaturas de jugadores:

Cul es la estatura mnima a partir del cual se


encuentra el 20% de los jugadores con mayores
estaturas?
20%

estatura mnima

Qu medida estadstica debemos utilizar?


Percentiles
Los percentiles dividen
un conjunto de datos en
100 partes
porcentualmente iguales.

Dado un percentil Pk, el K% de los datos son menores


o iguales al valor de Pk y el otro (100-k)% superiores al
valor de Pk
Cuartiles y Deciles
Cuartiles dividen un conjunto
de datos en 4 partes
porcentualmente iguales. Se
denotan por Q1, Q2 , Q3.

Deciles dividen un conjunto de


datos en 10 partes
porcentualmente iguales. Se
denotan por D1, D2, ... , D8 , D9.
Percentiles para datos no agrupados
Ordene los datos de manera ascendente.
Calcule la posicin i del percentil k:

k n 1
i E, d E: parte entera
100 d: parte decimal

Si es entero, el valor Si es decimal, el valor


del percentil ser el del percentil se
dato que ocupe dicha obtendr:
posicin.

Pk X ( E ) 0, d * ( X ( E 1) X ( E ) )
DERIVADOS DE LA MEDIANA
PERCENTILES O CENTILES Divide la poblacin(datos) en
100 partes iguales (de 1% c/u)
Son 99 percentiles : p1, p2, p3, ... p99

p1 p2 p3 p4 p80 p98 p99


p20 p40 p60
.... .... .... .... ....
1% 1% 1% 1% US$ 40.08 1% 1%
US$ 35.07 US$ 41.32
US$ 37.15
Yi = Cotizaciones de los ADRs de Telefnica de Espaa
Interpretacin:
p20: El 20% de los das las cotizaciones fueron a US$ 35.07
p40: El 40% de los das las cotizaciones fueron = US$ 37.15
p60: El 60% de los das las cotizaciones fueron US$ 40.08
p80: El 80% de los das las cotizaciones fueron US$ 41.32
Ejemplo
Se eligi a 11 alumnos del saln y se les pregunto sobre la nota que
obtuvieron en la 1 prctica calificada del curso:

12; 15; 20; 12; 10; 18; 17; 15; 15; 08; 10

a) Hallar e interpretar Q1 y D7

b) Hallar e interpretar P85 y P15

c) Hallar la nota mnima que debe tener el alumno para pertenecer al


tercio superior.

d) Hallar la nota mxima para pertenecer al 28% de los alumnos que


tienen las menores notas.
1. Percentiles
Son medidas de posicin, se denotan por Pi

Pi : Es el percentil - i , para i = 1, , 99.

El percentil Pk (i = K) separa al conjunto de datos


ordenados de menor a mayor, en dos grupos, de
manera que k% de los datos caen por debajo del
percentil.
Percentiles para Datos Tabulados o Agrupados
De forma similar a la mediana:
SE CALCULA k n 100
SE UBICA kn/100 ENTRE DOS Fi
Para una kn De forma
Tabla Fj1 Fj similar a la
Simple 100 Mediana
SE APLICA LA FRMULA :
kn
100 Fj1
Para una
tabla
Pk L j c j
Intervlica fj


donde:

L j Es el lmite inferor del intervalo - j


c j Es la amplitud del intervalo - j
f j Es la frecuencia absoluta simple del invervalo j.
Fj1 Es la frecuencia absoluta acumulativa del intervalo j - 1.
(anteror al intervalo j.)
Equivalencias:
Se puede observar que:
Q1 = P25
Q2 = P50 = Me
Q3 = P75

25 75

P50= Q2
Q1 Q3
2. Tabla de Distribucin de Frecuencias

Cotizaciones de Cierre Diarias de las Acciones de Credicorp:


01-10-01 - 23-01-02 - (US$)
( Yi -1 - Yi +1 ] Yi ni Ni hi% H i%
1 7.79 - 8.00 7.895 10 10 13.51 13.51
2 8.00 - 8.21 8.105 9 19 12.16 25.68
3 8.21 - 8.42 8.315 11 30 14.86 40.54
4 8.42 - 8.63 8.525 3 33 4.05 44.59
5 8.63 - 8.84 8.735 14 47 18.92 63.51
6 8.84 - 9.05 8.945 23 70 31.08 94.59
7 9.05 - 9.26 9.155 4 74 5.41 100.00
TOTAL n = 74 100.00

Calcular e interpretar: q1, q3, p10, p60, y p90,


Estadgrafos de Dispersin
Mide la variabilidad del conjunto de datos, a fin de
ser comparado con otro conjunto de datos
Es el ms simple usado especialmente para datos
1. Rango no agrupados

Es el ms conocido tiene
2. Varianza y Desviacin las propiedades adecuadas
Estndar para la Estadstica Inferencial

3. Rango o Recorrido Usado especialmente en el caso de


Intercuartlico datos con valores extremos
Es un estadgrafo relativo :
4. Coeficiente de Variacin Dispersin y Tendencia Central en
un solo estadgrafo.
ESTADIGRAFOS DE DISPERSION

1. EL RANGO (R) : R = MAX. - MIN.

Ejemplo Xi : # de sucursales por empresa


Sector 1 : Xi = 2, 3, 1, 0, 3, 4, 1
Sector 2 : Xi = 10, 3, 1, 2, 15, 5
Sector 1 : Sector 2
Mnimo = 0 Mnimo = 1
Mximo = 4 Mximo = 15

R = MAX. - MIN. = 4 - 0 = 4 R = MAX. - MIN. = 15 - 1 = 14

Interpretacin : La dispersin de N de sucursales de la empresass


del Sector 2 es mayor que la Sector 1
RANGO INTERCUARTLICO:
Es la diferencia entre el Cuartil mayor (Q 1)
y el Cuartil menor (Q3).

RI = Q 3 Q 1

Como se puede observar este valor slo considera


al 50% de las observaciones centrales de la
distribucin.
La Varianza:
Esta medida es la ms utilizada porque considera
al total de datos de la muestra.
Se define como el promedio de los cuadrados de
las distancias de cada dato a la media aritmtica.

PARA DATOS SIN TABULAR :

X X
n n

X
2
i
2
i nX 2

V X S2 i 1
i 1
n 1 n 1
Para datos agrupados o tabulados :

X i X fi
n n

ii
2
X 2
f n X 2

V X S
2 i 1
i 1
n 1 n 1
Nota: Si los datos estn tabulados en una tabla
intervlica se reemplaza Xi por Yi es la marca clase o
punto medio
La Desviacin estndar: Es la raz cuadrada
positiva de la varianza.

S V X
3. Varianza y Desviacin Estndar- Datos No agrupados
X : Nmero de artculos vendidos por da:
VENDEDOR 1 Datos Xi 13 20 15 13 12 11
VENDEDOR 2 Datos Xi 35 25 10 8 5

X= X=

La dispersin de las unidades vendidas del


vendedor 2 es mayor que las del vendedor1
Parmetro: Varianza Poblacional: 2
2 = (Xi )2 = Xi 2 n 2
n n

Estadgrafo: Varianza Muestral S2

S2 = (Xi X )2 = Xi 2 n X 2
n -1 n1
Esta varianza la que se a utilizar en el curso
Ejemplo:
n
Datos acerca de las edades de ocho clientes:
xi 285
i 1
x= 35,625
n 8
n
2
x2i - nx
s2 i 1

n -1

11011 8(35,625) 2
2
s = 122,554
8 -1
s 122,554 11,07
s 11,07
CV( x) * 100 * 100% 30,23%
x 35,625
La Varianza
Para datos Agrupados o Tabulados
m

fj j
( y
j 1
- x ) 2

2
V(X) = s =
n-1
m

y 2 2
j f j - nx
2 j 1
V(X) = s =
n-1
j = 1,..., m
Ejemplo:

Datos acerca de los pagos mensuales de consumo con tarjeta de


crdito de 500 clientes de InterBank.
Ejemplo:
Haciendo los clculos se tiene.
6 6
n 500 j1
y j fj 3 800 000
j1
y 2j fj 34 100 000 000

3 800 000
Media : x 7 600
500
34 100 000 000 - 500(7600) 2
Varianza : V(X) = s2 = 10 460 921,84
500 - 1

Desv.Estndar : s 10 460 921,84 3 234,3348

3 234,3348
Coef . de Variacin : CV( x) * 100% 42 ,56%
7 600
Ejemplo
Los siguientes datos corresponden a las edades de un
grupo de alumnos:

24 17 23 18 19 20 19 21 20 17

Obtenemos:
10
198

i 1
X i 198 X
10
19,8
10

i 3970
X 2

i 1
n

X 2
i nX 2
3970 1019.8
2
V X S
2 i 1

n 1 10 1
5,5111
S 5,5111 2,3475
S 2,3475
C.V.(X) *100 *100
X 19,8
11,8561%
Ejemplo
Para la siguiente tabla de frecuencias calcular: varianza,
desviacin estndar y coeficiente de variacin:

HORAS Xi fi Xi*fi Xi2*fi

2,8 3,3 3,05 2 6,10 18,6050

3,3 3,8 3,55 6 21,30 75,6150

3,8 4,3 4,05 10 40,50 164,0250

4,3 4,8 4,55 17 77,35 351,9425

4,8 5,3 5,05 8 40,40 204,0200

5,3 5,8 5,55 5 27,75 154,0125

5,8 6,3 6,05 2 12,10 73,2050

TOTAL 50 225,50 1041,425


225,50
X 4,51
50
1041,425 50 4,51
2
V X S
2
0,4984
50 1
S 0,4984 0,7060
S 0,7060
C.V. X *100 *100 15,6541%
X 4,51
Propiedades de la Varianza
1. La varianza de un conjunto de datos siempre es
un nmero no negativo. Esto es, V(x)0.
2. La varianza de una constante es igual a cero.
Esto significa que si: x1 = x2 = ... = xn = b, luego
V(x) = 0.
3. Si a cada observacin se suma o resta una
constante b>0, la varianza del nuevo conjunto de
datos coincide con el valor de los datos originales.
Esto es: V(xb)=V(x).
4. Si a cada observacin se le multiplica por una
constante b, la varianza del nuevo conjunto de
datos es igual a la varianza del conjunto de datos
originales multiplicada por el cuadrado de la
constante.
V(bx) = b2V(x).
5. La propiedad del cambio de escala es un caso
especial de la unin de la 3ra y 4ta propiedad.
V(axb)= a2 V(x)
Resumen de Propiedades de la Varianza

Si K es una constante, X e Y son variables:

1. V(X) 0

2. V(K ) = 0

3. V(K X ) = K2 V(X)

4. V(K X) = V(X)

5. V( X + Y) = V(X) + V(Y) + COV(XY)


V( X - Y) = V(X) + V(Y) - COV(XY)
COEFICIENTE DE VARIACIN:
VARIACIN
Es una medida de dispersin relativa, sirve para comparar las
dispersiones de dos o ms grupos de datos. normalmente se da en
porcentaje.

S
C.V.(X) *100
X
El C.V.es til para comparar dos o mas grupos de datos inclusive con
diferente unidades de medida, como ejemplo valores monetarios en
soles y dlares.

En la practica se considerar un grupo de datos heterogeneo o con


considerable dispersin cuando el C.V. es superior al 30%
Aplicacin del Coeficiente de Variacin
Analizar comparativamente los sueldos de los trabajadores de una
empresa de segn su categora.

Segn la desviacin estndar (S):


Los Sueldos de los empleados es mas homogneo,
Los Sueldos de los operarios es mas heterogneo

Segn la dispersin relativa (CV)


CV(direc.) < CV(empl) < CV (operar.)
Uso de la Desviacin
Estndar
Si se tiene un nmero de datos grande (n > 30), y la
distribucin de frecuencias es simtrica, se cumple que:

1. En el intervalo X S; X S se
encuentra el 68,27% d elo datos (0.6827 * n) .

2. En el intervalo X - 2S; X 2S se encuentra


el 95,45% de lo datos (0.9545 * n).

3. En el intervalo X - 3S; X 3S se encuentra


el 99,73% de los datos (0.9973 * n).
Uso de la Desviacin Estndar
Uso de la Desviacin Estndar
Estadsticos de Concentracin 3 ( x - Me )
Coeficiente de Asimetra CAs =
s
Si CAs<0, la distribucin es asimtrica negativa o hacia la izquierda.
Si CAs=0, la distribucin es simtrica.
Si CAs>0, la distribucin es asimtrica positiva o hacia la derecha.
Estadsticos de Forma Q 3 - Q1
k=
Coeficiente de Kurtosis 2 ( P 90 - P10 )
Si k = 0,263 la distribucin es mesokrtica.
Si k < 0,263 la distribucin es platikrtica.
Si k > 0,263 la distribucin es leptokrtica
Resumen
Interprete los siguientes resultados:

Cotizaciones diarias de los ADRs Telef. Espaa


(US$)
hi%
25

20

15

10

0
32.2 33.9 35.5 37.2 38.9 40.5 42.2 Yi (US$)
Permite indentificar
los datos extremos
DIAGRANA DE CAJAS

mximo

Q3 (cuartil-3)
Ri=IQ rango
(Rango interquatilico) Me (mediana)
Q1(cuartil-1)
(mediana)

mnimo
Valores
50% central de los datos Extremos
(outliers)

P25 P50 P75

700 10000

Sueldos (nuevos soles)


Diagrama de caja
Un diagrama de caja es una grfica que describe la
distribucin de un conjunto de datos tomando como referencia
los valores de los cuartiles como medida de posicin y el
valor del rango intercuartil como medida de referencia de
dispersin.

Diagrama de caja de la Resistencia

20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39

Resistencia
Diagramas de cajas
Permite:
Comparar las medianas

de dos o mas conjuntos


de datos.

Observar el tipo de
distribucin de los datos
(simtrica o asimtrica).

Determinar la dispersin
en el 50% central de los
datos.

Identificar la presencia
de valores extremos
(datos atpicos)
Construccin de un diagrama de caja

1. Se calcula: Q1, Q2 , Q3 , RIC y 1,5RIC.


2. Se traza una lnea de referencia horizontal o vertical (para la escala)
3. Se traza un rectngulo con los extremos en el primer y tercer cuartil y
se traza una recta vertical en la mediana.
4. Se dibujan los lmites a 1,5 rango intercuartil de los quartiles 1 y 3, Se
considera que los datos fuera de estos lmites son atpicos.
5. Li =Q1-(1,5)RIC; Ls=Q3 +(1,5)RIC.
6. Las lneas antes y despus de las cajas se llaman bigotes, se traza
desde los extremos de la caja hasta el mnimo y mximo dentro de los
lmites inferior y superior.
7. Se marcan con un asterisco los valores fuera de los lmites (valores
atpicos).

bigote
Ejemplo 1
Se desea analizar el consumo de gas natural en los hogares
de un distrito limeo, el gasto mensual en este combustible,
en nuevos soles de 36 hogares se muestra a continuacin.
20,6 21,2 21,8 23,5 24 24,3 24,5 24,6 24,6

24,6 24,8 24,9 25 25,2 25,4 26,3 27,1 27,3

27,5 28,3 28,4 28,6 29,3 29,4 29,5 29,5 29,5

29,6 30,4 30,4 30,9 31,5 32,4 32,5 32,7 37,6

Realice un diagrama de caja con esta informacin. Comente el


resultado.
Solucin
Despus de ordenar los datos:
1. Clculos: Q1=24,60; Q2 = 27,40 Q3 = 29,53
RIC = 4,93 1,5RIC = 7,395
LI = 24,60 7,395 = 17,205
LS = 29,53+7,395 = 36,925
2. Construccin de la escala:
Solucin
Ejemplo 2
Dos modos que usan los empleados de una
fbrica para ir a trabajar diariamente son A y B. A
continuacin vemos unas muestras de tiempos en
minutos de cada modo:

Modo A 28 29 32 37 33 25 29 32 45 34
Modo B 29 31 33 32 34 30 31 32 35 33

Trace un diagrama de caja para cada modo y en base a los


resultados obtenidos, Qu modo de trasporte debe
preferirse?, Explique sus razones.
Solucin
Evaluacin
Llene los espacios en blanco de tal
Llenemanera
los espacios
que laenproposicin
blanco de tal manera que Distribucin del ndice de calidad para productos fabricados en dos plantas
la proposicin resultante
200

resulte verdadera 150

Indice de calidad
1.El ndice de calidad
100

mediano es
aproximadamente______ 50

________ en ambas
0

plantas. Fuente: Elaboracin propia


Planta A Planta B

2.El ndice de calidad en la


planta A presenta
Valor
Extremo
(outlier)
DIAGRANA DE CAJAS MULTIPLE
DIAGRANA DE CAJAS MULTIPLE
Nota: Haciendo
clic
en cada caja
muestra los
estadgrafos de
cada grupo

Você também pode gostar