Você está na página 1de 20

Universidad Nacional Tecnolgica de Lima Sur

Facultad de Ingeniera y Gestin

Estadstica Descriptiva
Tema 5:
Medidas de Dispersin y
Deformacin

Mg. Myrna Manco Caycho

1
Resumen sobre estadgrafos
Posicin: Tendencia Central
Media aritmtica, mediana, moda,

Posicin: Localizacin
Cuartiles, deciles, percentiles, ..

Dispersin
Recorrido, Recorrido Intercuartlico,
Varianza, Desviacin tpica, coeficiente de
variacin,
Forma
Asimetra
Apuntamiento o curtosis 2
Observemos en nuestro entorno

Todo el universo parece


obedecer a la constante de que
nada es constante
Representacin grfica
Se obtuvo la siguiente grfica a partir de un sistema de
ventas va web para una empresa dedicada a la produccin y
venta de productos qumicos.

Qu aspectos
relevantes
ventas

observamos?

produccin
Medidas de Dispersin
Miden el grado de variabilidad de los datos entre s o con respecto a
una medida de tendencia central.

Recorrido o Rango estadstico: Diferencia entre observaciones


extremas.
R = Vmx Vmn

Ejemplo: Sean los conjuntos de observaciones:

X: 12, 4, 6, 9
Y: 6, 3, 5, 16
a) Hallar el recorrido de cada uno de los grupos.
b) Cul es el grupo ms homogneo?
Recorrido Intercuartlico (RI)
Es la distancia entre primer y

0.05
Mn. Mx.
tercer cuartil. P25 P50 P75

0.04
RI = P75 - P25

0.03
Parecida al rango, pero 25% 25% 25% 25%

0.02
eliminando las observaciones
Rango intercuartlico
ms extremas inferiores y

0.01
superiores. Rango

0.00
No es tan sensible a valores 150 160 170 180 190
extremos.

6
Varianza (S2) Conceptos previos
Notacin: Media aritmtica =

Desviacin: Xi -

Sean los datos: 0, 10 Desviacin: x2 - = 10 5 = 5

x1 Media x2

x1 - = 0 5 = -5

La suma de las desviaciones es .


Varianza
Mide el promedio de los cuadrados de las desviaciones de
las observaciones.

1
S 2

n 1 i
( xi x ) 2

Siendo
n: nmero de observaciones

Media
8
Propiedades de la varianza

Es sensible a valores extremos (alejados de la media).

Sus unidades son el cuadrado de las de la variable. De interpretacin difcil para


un principiante.

Contiene la informacin geomtrica relevante en muchas situaciones donde la


energa interna de un sistema depende de la posicin de sus partculas.

Energa de rotacin (va el coeficiente de inercia): patinadores con brazos


extendidos (dispersos) o recogidos (poco dispersos)

Energa elstica: Muelles estirados con respecto a su posicin de equilibrio


(dispersos) frente a muelles en posicin cercana a su posicin de equilibrio
(poco dispersos)

9
Desviacin tpica
Es la raz cuadrada de la varianza
S S 2
Tiene las misma dimensionalidad
(unidades) que la variable. 50

La distribucin normal quedar 40

completamente determinada por la


media y la desviacin tpica. 30

20
A una distancia de una desv. tpica de la
media hay ms de la mitad.
10
Desv. tp. = 568,43
A una distancia de dos desv. tpica de la Media = 2023
media las tendremos casi todas. 0
50 90 1. 1 2. 2. 2. 3.
N = 407,00
30 . 70 10 50 90 30
0 0 0 0 0 0 0 0

Peso recin nacidos en partos gemelares


10
Dispersin en distribuciones
normales
0.05

0.05
0.04

0.04
0.03

0.03
0.02

0.02
0.01

x s

0.01
x 2s
68.5 %
95 %
0.00

0.00
150 160 170 180 190
150 160 170 180 190

Centrado en la media y a una desv. tpica de distancia hay


aproximadamente el 68% de las observaciones.

A dos desviaciones tpicas tenemos el 95% (aprox.)


11
Coeficiente de variacin
Mide la desviacin tpica en forma de
qu tamao tiene con respecto a la media S
Tambin se la denomina variabilidad relativa.
CV .100%
Es frecuente mostrarla en porcentajes x
Es una cantidad adimensional. til para comparar la variabilidad de diferentes
variables.

No debe usarse cuando la variable presenta valores negativos o donde el valor 0


sea una cantidad fijada arbitrariamente
Por ejemplo 0C 0F

Fuente: http://tarwi.lamolina.edu.pe/~arrubio/Parte%202.pdf 12
Interpretacin del CV
Jorge Chue Gallardo et. al. Estadstica descriptiva y probabilidades

Valor de CV Interpretacin
05 Los datos son muy homogneos
5 10 Los datos son homogneos
10 15 Los datos son regularmente homogneos
15 20 Los datos son regularmente heterogneos
20 25 Los datos son heterogneos
25 a ms Los datos son muy heterogneos

Estadstica Descriptiva.
UNTELS 13
Ejemplo
Los siguientes datos
muestran las ventas va
web de dos grupos de
trabajadores. El grupo 1
realiz ventas en moneda
nacional y el grupo 2 en
moneda extranjera
(dlares).

Grupo 1: 80, 90, 70


Grupo 2: 10, 30, 20
A) Calcule la media y la desviacin estndar en cada
grupo.
B) Cul de los grupos es ms homogneo?
Datos casi normales. Eje x medido en desviaciones tpicas
Encuentras relacin entre recorrido intercuartlico y desviacin
tpica?
Y entre los bigotes y dos desviaciones tpicas? Podras
caracterizar las observaciones anmalas?
0.3

0.3
densidad

densidad
0.2

0.2
0.1

0.1
x s x 2s x s x 2s
66 % 95 % 71 % 94 %
0.0

0.0
-3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3
0.4

0.3
0.3
densidad

densidad

0.2
0.2

0.1
0.1

x s x s x 2s
x 2s
68 % 94 % 70 % 94 %
0.0

0.0

-3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3

15
Asimetra
Una distribucin es simtrica si la
mitad izquierda de su distribucin
es la imagen especular de su mitad
derecha.

En las distribuciones simtricas


media y mediana coinciden. Si slo
hay una moda tambin coincide

La asimetra es positiva o negativa


en funcin de a qu lado se
encuentra la cola de la distribucin.

La media tiende a desplazarse


hacia las valores extremos (colas).

Las discrepancias entre las


medidas de centralizacin son
indicacin de asimetra.

16
Estadsticos para detectar Asimetra
Primer Coeficient e de Pearson :
x Mo
CA
S
Primer Coeficient e de Pearson (Distribuiones unimodales )

CA
3 x Me
S
Segundo Coeficient e de Pearson :
Q3 Q1 2Me
CA
Q3 Q1
Estadstica Descriptiva.
UNTELS 17
Estadsticos para detectar asimetra

0.20
0.5
0.20

0.4

0.15
0.15

0.3

0.10
0.10

0.2

0.05
0.05

0.1
x s x s
x s
66 % 78 %
78 %
0.00

0.00
0.0

8 10 12 14 16 18 20 -2 -1 0 1 2 3 0 2 4 6 8 10 12 14

x x x

Distribucin asimtrica Distribucin asimtrica


negativa Distribucin simtrica positiva 18
Apuntamiento o curtosis
La curtosis nos indica el grado de apuntamiento (aplastamiento) de
una distribucin con respecto a la distribucin normal o
gaussiana. Es adimensional.

Q3 Q1
K
2P90 P10

Platicrtica (aplanada): curtosis < 0.263 o se aproxima a cero

Mesocrtica (como la normal): curtosis = 0.263

Leptocrtica (apuntada): curtosis > 0.263 o se aproxima a 0.5


19
Apuntamiento o curtosis
En el curso sern de especial inters las mesocrticas y
simtricas (parecidas a la normal).

Aplanada Apuntada como la normal Apuntada


2.0

0.8
0.3
1.5

0.6
0.2
1.0

0.4
0.1
0.5

0.2
x s
x s x s
68 %
57 % 82 %
0.0

0.0
0.0

0.0 0.2 0.4 0.6 0.8 1.0 -3 -2 -1 0 1 2 3 -2 -1 0 1 2

Platicrtica Mesocrtica Leptocrtica


20

Você também pode gostar