Você está na página 1de 56

CICLO 2012-III Módulo:

II
Unidad: I Semana: 03

Lic. Max Tejero Alegre


ESTADISTICA

SEMANA 3:
MEDIDAS DE DISPERSION
ORIENTACIONES

Es importante conocer los estadígrafos de


dispersión ya que nos dan una idea que tan
juntos o que tan separados están los datos.
Son medidas que nos dicen que tan
dispersos se encuentran los datos con
respecto a su media.
CONTENIDO TEMATICO

1. MEDIDAS DE DISPERSIÓN
1.1 Rango
1.2 Rango intercuartílico
1.3 Varianza
1.4 Desviación estándar
1.5 Coeficiente de variabilidad

2. MEDIDAS DE LA FORMA DE LA DISTRIBUCIÓN


2.1 Asimetría
2.2 Curtosis

4
OBJETIVOS
Al finalizar el Tema 6, el participante será capaz de:
1. Calcular e interpretar las principales medidas de
dispersión:
A) Rango
B) Rango intercuartílico
C) Varianza
D) Desviación estándar
E) Coeficiente de variabilidad

2. Calcular e interpretar las principales medidas de


la forma de la distribución.
A) Coeficiente de asimetría
B) Coeficiente de curtosis
5
Las Medidas de Dispersión
Llamadas también medidas de variabilidad
Son útiles porque:
1. Permiten juzgar la confiabilidad de la medida
de tendencia central.
2. Los datos demasiados dispersos tienen un
comportamiento especial.
3. Es posible comparar dispersión de diversas
muestras.

6
Las Medidas de Dispersión

Se dice al grado en que los datos numéricos


tienden a extenderse alrededor de un valor
medio.
Se utilizan distintas medidas de dispersión o
variación, las más empleadas son el rango,
la desviación media, varianza, desviación
estándar o típica.
AMPLITUD O RANGO
Llamado también recorrido, amplitud total o alcance.
La amplitud de la muestra es la medida de variabilidad
más sencilla entre todas las mencionadas; y se define
como la diferencia entre la observación más grande y
la más pequeña.
a) Obtención: se obtiene de la influencia entre
el dato mayor y el dato menor más una
unidad significativa, a fin de incluir ambos
valores extremos.

r  xmax  xmin
8
Ejemplo:
En los últimos seis meses la empresa
“BARATURA” tuvo ventas de S/. 5, 17, 17, 19, 20,
20. La empresa “LOCURA” vendió aprox. S/. 9,
12, 15, 17, 19 y 20.
Para encontrar la amplitud se hace lo siguiente:
A= Valor Max - Valor Mínimo
Ax= 20 - 5 = 15 Ay= 20 - 9 = 11
• Aunque es una medida muy fácil de calcular,
ignora toda la información de la muestra
entre las observaciones más grande y más
pequeña.
• Sin embargo, vale la pena resaltar que el
rango se utiliza mucho en aplicaciones
estadísticas al control de calidad, donde lo
común es emplear muestras con
tamaños
• n=4 ó n=5
Ejemplo :
Los siguientes datos representan el peso de 10
niños al nacer, (en Kg.). Calcule e interprete el
rango.
2,860 3,150 3,450 2,950 3,780
4,170 3,920 3,280 4,050 3,120

Rango = (4,170 - 2,860) + 0.001


Rango = 1,311 Kg.

11
b) Interpretación :
La diferencia entre el bebe de mayor peso y el
bebe menor peso es 1,311 Kg.
c) Cálculo : a partir de datos agrupados, se utiliza
la siguiente fórmula:
R= (Ls - Li ) + 1
donde:
L : Límite superior de la
s
última clase
: Límite inferior de la
L primera clase
i

12
Ejemplo :
La distribución de frecuencias siguiente representa el tiempo
que espera un paciente para ser atendido, en un consultorio
externo. Calcule e interprete el rango

Rango = (36-12) + 1

R = 25 minutos

Interpretación: la diferencia de tiempo entre el paciente que


más espera y el que menos espera para ser atendido es 25
minutos.

13
f) Ventajas y desventajas : del rango

Ventajas:
fácil de calcular
fácil de entender e interpretar

Desventajas:
sólo considera los valores extremos
no toma en cuenta ni el número de
datos ni el valor de estos
no es posible calcular en tablas con
extremos abiertos.

14
El Rango Intercuartílico
Permite ubicar el
50% de los datos
que se encuentran
en el centro de la
distribución, es
decir, el 25% de los
datos son menores
al primer cuartil y
también 25% de los
datos son mayores
al tercer cuartil.

15
50 %
25 25 %

Q1 Q3

Rango
Intercuartílico

25(334)
Lugar Q1  P25   83.5o se ubica en la 3ra clase
100

 25(334)   60  1 
 100  Q  8.82 años
Q  7.5  4
1  68  1
 

16
75(334 )
Lugar Q 3  P75   250 .5o se ubica en la 5ta clase
100

 75(334)   248  1 
 100 
Q  15.5  4 Q  15.65 años
3  40  3
 

A. El 50% de los trabajadores con experiencia


intermedia se encuentran entre 8,82 y 15,65
años.

B. El rango intercuartílico es 6 años 10 meses


aproximadamente

17
Ejemplo:

Si P25 = 7,2 13,4  7,2


DC   3,1
P75 = 13,4 2

Interpretación:
50% central de las observaciones varía en 3,1 con
respecto a la mediana.

18
• MEDIDAS DE DISPERSION
Se denomina Medidas de dispersión, a los
parámetros estadísticos que miden cómo de
diseminados se encuentran los datos de una
distribución.
Los más utilizados se refieren al grado de
lejanía de los datos respecto a la media y
son la Desviación Media (D. M.), la Varianza
( S 2 ) , la Desviación Típica ( S ), y el
Coeficiente de Variación ( C V ).

DESVIACION MEDIA
La Desviación Media ( D.M. ), es un
promedio de los valores absolutos de las
desviaciones | xi – x |, de cada elemento xi,
de la distribución respecto a su media x
Para datos sin agrupar :
n
∑ │X - X │
i=1
DM = --------------------------------
n
• Para datos agrupados :
n
∑ ( ni │X - X │ )
i=1
DM = ---------------------------------------
n
• VARIANZA
La Varianza de un conjunto de datos
se define como el cuadrado de la
desviación Típica y viene dada por S 2

Datos sin Agrupar


n
∑ │X - X │ 2
i=1
S2 = --------------------------------
n
• Para datos agrupados :

n
∑ ( ni │X - X │2 )
i=1
S2 = ---------------------------------------
n
• DESVIACION TIPICA O ESTANDAR

La desviación típica o desviación estándar,


σ, es la raíz cuadrada de la varianza:
La razón de ser de este parámetro es
conseguir que la medida de dispersión se
exprese en las mismas unidades que los
datos a los que se refiere. Por ejemplo, en
una distribución de estaturas en la que los
datos están dados en centímetros (cm), la
media viene dada en centímetros, pero la
varianza en centímetros cuadrados (cm2).
• Para evitar este inconveniente se calcula su
raíz cuadrada, obteniéndose así la desviación
típica en centímetros. El par de parámetros
formado por la media y la desviación típica
(X, σ) aporta una información suficientemente
buena sobre la forma de la distribución.
PARA DATOS SIN AGRUPAR :

n
∑ │X - X │ 2
i=1
S = ----------------------------
n
• Para datos agrupados :

n
∑ ( ni │X - X │2 )
i=1
S = ---------------------------------------
n
• COEFICIENTE DE VARIACION
El coeficiente de variación, C.V., es el
cociente entre la desviación típica (σ ) y la
media de la distribución X :
σ
CV = ---------------
X
Este parámetro sirve para relativizar el valor
de la desviación típica y así poder
comparar la dispersión de dos poblaciones
estadísticas con gamas de valores muy
discretas.
Su principal desventaja de esta medida de
Variación es que no nos indica nada acerca de la
dispersión de los valores que caen entre los
extremos.
2.- La Varianza y la Desviación Estándar:
Mide de la dispersión de los valores alrededor
de la media. Se calcula como la Suma de
cuadrados (SS) de las desviaciones respecto a la
media dividida por el número total de
observaciones válidas menos 1.
Varianza de la muestra (S2)

S2 S(X - X)2
n - 1

Método abreviado:

S2 SX2 -nX2
n - 1
2.2. Desviación Estándar
de la muestra (S)

S(X -X)2
S
n - 1
Método abreviado:

S S X2 - nX2
n-1
Ejemplo:
En la empresa “Vida Feliz” el
jefe de personal ha detectado la
tardanza (en minutos) de 7
empleados durante la hora de
entrada : 15, 10, 20, 7, 10, 17,
15
Calcular la S2 y la S.
¿Existe razones suficientes para
pensar que las tardanzas (en
minutos) se encuentran dispersas o
varían mucho?.

Procedimiento:
Paso 1:
Calcular la media
Fórmula:
S Xi
X
n

15+10+20+7+10+17+15
X =
7

X 13.43 minutos
Paso 2:
Calcular la Varianza
(método abreviado):

S2 1388 - 7(13.43)2

7-1

S2 = 20.91 tardanzas 2
Paso 3:
Calcular la Desviación
estándar:

S = 20.91

S = 4.57 tardanzas
La Varianza
Es una medida de desviación promedio con
respecto a la media aritmética

a) Cálculos : a partir de datos no agrupados.


n 2
para una muestra 2
 (X  x )
i

S  i 1

n 1

N 2

para un población 2
(X ) i

  i 1

37
La Desviación Estándar
Llamada también desviación típica representa la
variabilidad (o desviaciones) promedio de los
datos con respecto a la media aritmética. Es la raíz
cuadrada de la varianza, sea poblacional o
muestral.
a) Cálculos : a partir de datos no agrupados
n

 (X i  x )
2
para la muestra
2
S s  i 1
n 1
N
 ( X i   )
2

para la población   
2
 i 1

N
38
Ejemplo :
A continuación se presentan las tarifas (en unidades
monetarias) de dos laboratorios de análisis clínicos.
El laboratorio I tiene sus tarifas en soles y el
laboratorio II en dólares ¿Cuál de ellos tiene un plan
tarifario más homogéneo o estable?.
Laboratorio I (soles) Laboratorio II (dólares)
40,70,60,48,52,65,58 70,35,150,140,82,110,140,120

Calculamos la media y desviación estándar por cada


una de los laboratorios

39
Laboratorio I
n
 Xi 393
x  i 1

n

7
 56.14

x Xi  x  Xi  x  2

 X  393   Xi  x   0   Xi  x 
2
 632,86

40
Si   X i  x   632.86
2

n
 (X i  x )2 632 .86
S i 1
  10 .27
n 1 7 1

S
CV   100
x

10.27
CV   100  18 .29
56.14

41
Laboratorio II

x Xi  x  Xi  x  2

 X  847   Xi  x   0,04   Xi  x  2
 11372,88

42

n
Si  X i  x  2
 11372 .88
i 1

n
 (X i  x ) 2
11372 ,88
S i 1
  40 . 30
n 1 8 1

S 40,30
CV   100 CV   100  30 ,06
x 105,87

El Laboratorio II presenta una mayor variabilidad


en el plan tarifario.
43
6.2 Medidas de Asimetría o Sesgo
6.2.1 Coeficiente de Asimetría
Es un indicador del grado de asimetría que presenta
una distribución.
3 ( X  Md )
S kp 
S

Valores posibles
 3 asimetría negativa
S kp  
 3 asimetría positiva

44
Si Skp tiende a 3 la distribución es asimétrica hacia la
derecha o asimetría positiva.

Si Skp tiende a -3 la distribución es asimétrica a la


izquierda o asimetría negativa.

En distribuciones simétricas, no existe sesgo, es decir


Skp = 0.

En la práctica, el coeficiente de Asimetría de Pearson


varía entre -1 y +1

45
Coeficiente de Curtósis
Es una medida del grado de apuntalamiento,
generalmente comparada con el apuntalamiento
de la distribución normal.

0 , 5 ( P0 , 75  P0 , 25 )
Ku 
P0 , 9  P0 ,1

46
Valores posibles
a) Leptocúrtica (concentración al centro): Si el grado de
apuntalamiento de una distribución es mayor que el de
la distribución normal. Kμ  0,5
b) Mesocúrtica (distribuidos simétricamente): Si el
grado de apuntalamiento de una distribución es igual
que el de la distribución normal. Kμ  0,25
c) Platicúrtica (aplanada).Si el grado de apuntalamiento
de una distribución es menor que el de la distribución
normal. 0 ≤ Kμ ≤ 0,25
Platicurtica Mesocurtica Leptocúrtica
0,0 0,25 0,50

5/21/18 ANIVAL TORRE 47


Ejemplo :
La tabla muestra la edad (en años) de 70
pacientes atendidos en el servicio de emergencia
de un hospital local.
4 67 18 15 11 3 24
3 85 15 15 14 5 26
5 6 16 15 13 7 21
6 7 17 16 10 8 22
7 7 15 17 6 12 17
25 10 13 17 4 15 16
13 12 13 13 8 17 9
2 15 14 14 14 18 9
4 16 20 16 18 20 15
5 17 14 17 20 21 12
A) Calcular e interpretar la asimetría de la distribución
B) Calcular e interpretar la curtosis de la distribución.
48
Los resultados han sido obtenidos usando Microsoft
Excel

3(14,27  13,50 )
S kp   0,202
11,42

0,5(17,00 7,00)
Ku   0,263
23,00 4,00

49
Asimetría negativa a la
izquierda
As<0

Asimetría Negativa a la Izquierda

50
Simétrica

51
Asimetría positiva a la
Derecha.
Asimetría Positiva a la Derecha.

52
Curtosis Negativa
Curtosis Negativa

Platicúrtica

53
Curtosis Nula

Curtosis nula

Mesocúrtica

54
Curtosis Positiva

Curtosis Positiva

Leptocúrtica

55
GRACIAS

Você também pode gostar