Você está na página 1de 40

TRABAJO FINAL ESTADSTICA I

MEDIDAS DE DISPERSIN, POSICIN, FORMA Y COEFICIENTE DE


VARIACIN DE PEARSON

INTEGRANTES:
.
.
.
.
CAPTULO 1.
MEDIDAS DE DISPERSIN
MEDIDAS DE DISPERSIN

Varianza
Medidas de
dispersin Rango Desviacin estndar

Coeficiente de variacin

Rango Intercuartil

Rango interfractil
IMPORTANCIA DE LA MEDIDA DE
DISPERSIN DE UNA DISTRIBUCION
1. Nos proporciona informacin
adicional que nos permite juzgar
la confiabilidad de nuestra
medida de tendencia central. Si
los datos se encuentran muy
dispersos, como los que
representa la curva C de la
siguiente figura, la posicin central
es menos representativa de los
datos, como un todo, que cuando
stos se agrupan ms cerca
alrededor de la media, como en la
curva A de la misma figura.
IMPORTANCIA DE LA MEDIDA DE
DISPERSIN DE UNA DISTRIBUCION

2. Evitar riesgos al elegir distribuciones


que tengan las dispersiones ms grandes

3. Existen problemas caractersticos para


datos muy dispersos, debemos ser
capaces de reconocer esa dispersin
amplia para poder abordar esos
problemas
EL RANGO
CONCEPTO:
El rango es la diferencia entre el ms alto y el ms pequeo de los valores
observados.

FRMULA:
EL RANGO
EJEMPLO:
La siguiente tabla representa los pagos anuales hechos por la asociacin Blue
Cross-Blue Shield a dos hospitales, Cumberland y Valley Falls:

El rango de los pagos anuales a Cumberland es:


$1,883,000 - $863.000 = $1,020,000.
Para el hospital Valley Falls, el rango es:
$690,000 - $490,000 = $200,000.
EL RANGO INTERFRACTIL
CONCEPTO:
El rango interfractil es una medida de la dispersin entre dos fractiles de una
distribucin de frecuencias, es decir, la diferencia entre los valores de los dos
fractiles.
CONCEPTO DE FRACTIL: En una distribucin de frecuencias, la localizacin de un
valor en determinada fraccin de los datos o arriba de ellos es un fractil.

Los fractiles tienen nombres especiales, dependiendo del nmero de partes iguales en
que dividen a los datos.
Los fractiles que los dividen en 10 partes iguales se llaman deciles.
Los cuartiles dividen los datos en cuatro partes iguales.
Los percentiles dividen al conjunto de datos en 100 partes iguales.
EL RANGO INTERFRACTIL
EJEMPLO:
Tomado los datos del ejemplo anterior calculando el rango sobre pagos hechos por Blue Cross-Blue Shield,
encontraremos el rango interfractil entre el primer y segundo tercio de los donativos recibidos por Cumberland de
la organizacin Blue Cross-Blue Shield.
EL RANGO INTERFRACTIL
EJEMPLO:
Los pagos hechos al hospital Cumberland fueron 12. Dividimos entonces estos datos en tercios, como 12 / 4 = 3,
obtenemos de manera exacta, 4 pagos por cada tercio.

De un total de 12 datos tomados, cada tercio contiene 4 pagos, si dividimos 4/ el


total de datos que es 12, y lo multiplicamos por 100, tendremos un 33.33% en el
primer tercio. Entonces, 33.33% de los elementos est en $1,041,000 o debajo de
este valor sabiendo que los datos de la tabla estn en miles.
EL RANGO INTERFRACTIL

En el segundo tercio (8/12)*100 = 66.66%, 8 valores, entre el total de pagos que


es 12, por 100 para indicarlo en porcentaje. Esto quiere decir que 66.66% es
menor o igual que $1,624,000.
Ahora podemos calcular el rango interfractil entre los fractiles .33 y .66
restando $1,0141,000 del valor $1,624,000. Esta diferencia de $583,000 es la
dispersin entre el valor ms alto del primer tercio de los pagos y el valor ms
alto del segundo tercio.
EL RANGO INTERCUARTIL
CONCEPTO:
El rango intercuartil mide aproximadamente qu tan lejos de la mediana
debemos ir en cualquiera de las dos direcciones antes de recorrer una mitad de
los valores del conjunto de datos.
EL RANGO INTERCUARTIL
EJEMPLO:
La compaa Casual Life Insurance estudia la compra de una nueva flota de autos. El director del Departamento
de Finanzas, Tom Dawkins, obtuvo una muestra de 40 empleados para determinar el nmero de millas que cada
uno maneja en un ao. Los resultados del estudio son los siguientes. Calcule el rango intercuartil.

Solucin:
Tenemos 40 datos, dividimos estos datos en cuatro partes, 40/4 = 10.
El valor ms alto del primer cuartil es = 8100
El valor ms alto del segundo cuartil es = 10000
El valor ms alto del tercer cuartil es = 12700
Rango intercuartil = Q3 - Q1 = 12,700 - 8,100 = 4,600 millas.
VARIANZA

CONCEPTO:
Para calcular la varianza de
una poblacin, la suma de
los cuadrados de las
distancias entre la media y
cada elemento de la
poblacin se divide entre el
nmero total de
observaciones en
poblacin.
DESVIACIN ESTNDAR

CONCEPTO:
La desviacin estndar de la
poblacin es simplemente
la raz cuadrada de la
varianza de la poblacin.
EJEMPLO CLCULO VARIANZA Y
DESVIACIN ESTNDAR
EJEMPLO CLCULO VARIANZA Y
DESVIACIN ESTNDAR

VARIANZA

VARIANZA (OTRA
FRMULA)
DESVIACIN
ESTNDAR
CAPTULO 2. MEDIDAS
DE POSICIN
MEDIDAS DE POSICIN

Tambin se les denomina medidas no centrales, se usan para


estudiar la distribucin de los datos, asocindolos a intervalos
porcentualmente equivalentes.
Las medidas de posicin ayudan a describir la posicin que tiene
un valor especfico en relacin con el resto de los datos.
Sea x1, x2, ,xn un conjunto de n mediciones debidamente
ordenadas, el p-simo percentil es el valor de x tal que p
porciento (%) de las mediciones son menores que este valor de
x; y 100-p por ciento son mayores.
MEDIDAS DE POSICIN
Lo percentiles son los valores de la variable 1% 1% 1% 1% 1%
que dividen un conjunto de datos Min
ordenados en 100 partes iguales. Por lo P1 P2 P3 P98 P99 Max
que cada serie tiene 99 percentiles.
Los deciles son los valores de la variable 10% 10% 10% 10% 10% 10% 10% 10% 10% 10%
que dividen un conjunto de datos Min
D10 D20 D30 D40 D50 D60 D70 D80 D90 Max
ordenados en 10 partes iguales. Por lo que
cada serie tiene 9 deciles.
Los quintiles son los valores de la variable 20% 20% 20% 20% 20%
que dividen un conjunto de datos Min
ordenados en cinco partes iguales. Por lo P20 P40 P60 P80 Max
que cada serie tiene 4 quintiles.
25% 25% 25% 25%
Los cuartiles son los valores de la variable Q3
que dividen un conjunto de datos Min Q1 Q2 Max
ordenados en cuatro partes iguales. Por lo P25 P50 P75
que cada serie tiene 3 cuartiles.
La frmula de los cuartiles es: 1 = 1 2 = 1 3 = 3 1
( 4 +2) ( 2 +2) ( 4 +2)
MEDIDAS DE POSICIN
Sean las presiones sanguneas de la sangre (mm Hg) de 7 hombres de mediana edad:
151, 124, 132, 170, 146, 124 y 113
Identifique los cuartiles.
Calcule el intervalo intercuartil.

a) En primer lugar se ordenan los datos


b) Si el nmero de observaciones (n) es impar, el cuartil 2 es la mediana, el valor numrico de la
observacin que se ubica en el centro del arreglo ordenado. El cuartil 1 es el percentil 25 (P25), el
valor numrico de la observacin que se ubica a del arreglo ordenado. El cuartil 3 es el
percentil 75 (P75) el valor numrico de la observacin que se ubica en las partes del arreglo
ordenado.
c) Si el nmero de observaciones (n) es par, los cuartiles se obtienen con el promedio de los dos
valores intermedios en el arreglo ordenado.
CUARTILES Y PERCENTILES
Definimos los cuartiles como los tres valores que dividen la muestra en cuatro partes
iguales.
As el primer cuartil Q 1/4 sera la medida tal que el 25 % de los datos sean
inferiores a su valor y el 75 % de los datos sean superiores.
El segundo cuartil Q 1/2 coincide con la mediana, mientras que el tercer cuartil Q
3/4 marcara el valor tal que las tres cuartas partes de las observaciones sean inferiores a
l y una cuarta parte sea superior.
La forma de calcular los cuartiles es igual a la ya vista para la mediana, pero sustituyendo
N/2 por N/4 y3 N/4 para Q1/4 y Q 3/4 respectivamente.
CUARTILES Y PERCENTILES
De la misma manera se definen los percentiles, tambin llamados percentiles, como
aquellos valores Pk (con k = 1, 2, 99) que dividen la muestra en 100 partes iguales. Es
decir, el percentil Pk deja por debajo de l al k por ciento de la muestra ordenada. La
forma de calcular deciles y percentiles es igual a la de la mediana y los cuartiles,
sustituyendo N/2 por la fraccin del nmero total de datos correspondiente.
Evidentemente algunos valores de cuartiles, deciles y centiles coinciden, cumplindose,
por ejemplo:
DIAGRAMA DE CAJA Y BIGOTES
CONCEPTO:
Los diagramas de Caja-Bigotes (boxplots o box and whiskers) son una presentacin visual
que describe varias caractersticas importantes, al mismo tiempo, tales como la
dispersin y simetra.
Para su realizacin se representan los tres cuartiles y los valores mnimo y mximo de los
datos, sobre un rectngulo, alineado horizontal o verticalmente. Una grfica de este tipo
consiste en una caja rectangular, donde los lados ms largos muestran el recorrido
intercuartlico.
Este rectngulo est dividido por un segmento vertical que indica donde se posiciona la
mediana y por lo tanto su relacin con los cuartiles primero y tercero (recordemos que el
segundo cuartil coincide con la mediana).
Las lneas que sobresalen de la caja se llaman bigotes. Estos bigotes tienen un lmite de
prolongacin, de modo que cualquier dato o caso que no se encuentre dentro de este
rango es marcado e identificado individualmente.
DIAGRAMA DE CAJA Y BIGOTES
EJEMPLO: CLCULO DE CUARTILES:
Distribucin de frecuencias (en tallos y Q1, el cuartil Primero es el valor
hojas), que representan la edad de un mayor que el 25% de los valores de
la distribucin. Como N = 20 resulta
colectivo de 20 personas.
que N/4 = 5; el primer cuartil es la
media aritmtica de dicho valor y el
36 25 37 24 39 20 36 45 31 31
siguiente:
39 24 29 23 41 40 33 24 34 40 Q1 = (24 + 25) / 2 = 24,5
Q2, el Segundo Cuartil es, evidentemente, la
ORDENAR LOS DATOS.
mediana de la distribucin, es el valor de la
Para calcular los parmetros estadsticos, lo variable que ocupa el lugar central en un
primero es ordenar la distribucin conjunto de datos ordenados. Como N/2 =10;
la mediana es la media aritmtica de dicho
20 23 24 24 24 25 29 31 31 33 34 36 36 37 valor y el siguiente:
39 39 40 40 41 45 me= Q2 = (33 + 34) / 2 =33,5
DIAGRAMA DE CAJA Y BIGOTES
Q3, el Tercer Cuartil, es el valor que El bigote de la izquierda representa al
sobrepasa al 75% de los valores de la colectivo de edades ( Xmn, Q1)
La primera parte de la caja a (Q1, Q2),
distribucin. En nuestro caso, como
La segunda parte de la caja a (Q2, Q3)
3N / 4 = 15, resulta: El bigote de la derecha viene dado por (Q3,
Q3 = (39 + 39) / 2 = 39 Xmx).

DIBUJAR LA CAJA Y LOS BIGOTES


DIAGRAMA DE CAJA Y BIGOTES

INFORMACIN DEL DIAGRAMA:


Podemos obtener abundante informacin de una distribucin a partir de estas
representaciones. Veamos alguna:
La parte izquierda de la caja es mayor que la de la derecha; ello quiere decir que las edades
comprendidas entre el 25% y el 50% de la poblacin est ms dispersa que entre el 50% y el
75%.
El bigote de la izquierda (Xmm, Q1) es ms corto que el de la derecha; por ello el 25% de los
ms jvenes estn ms concentrados que el 25% de los mayores.
El rango intercuartlico = Q3 - Q1 = 14,5; es decir, el 50% de la poblacin est comprendido en
14,5 aos.
CAPTULO 3.
COEFICIENTE DE
VARIACIN DE PEARSON
COEFICIENTE DE VARIACIN DE PEARSON
CONCEPTO: EJEMPLO:
Con el coeficiente de variacin de Pearson, De un conjunto de edades de unos nios,
relativizamos el concepto de desviacin, ya que su desviacin tpica sera 2.16 aos,
comparamos la desviacin tpica con la media hallar el coeficiente de variacin.
del conjunto de valores que estudiamos, con
este coeficiente de Pearson intentamos saber el
nmero de veces que la desviacin tpica, S, es
ms grande o ms pequea que la media.

lo que nos indica que la dispersin


. . = relativa de este conjunto de valores
sera del 43%; la desviacin es el 43%
del valor de la media.
CAPTULO 4. MEDIDAS DE
FORMA DE DISTRIBUCIN
DE LOS DATOS
COEFICIENTE DE ASIMETRA.
CONCEPTO:
Esa situacin en la que los datos estn repartidos de igual forma a uno y otro lado de la media se conoce
como simetra, y se dice en ese caso que la distribucin de los datos es simtrica. En ese caso, adems, su
mediana, su moda y su media coinciden.
Una distribucin es asimtrica a la derecha si las frecuencias (absolutas o relativas) descienden ms
lentamente por la derecha que por la izquierda.
Si las frecuencias descienden ms lentamente por la izquierda que por la derecha diremos que la
distribucin es asimtrica a la izquierda

FRMULA:
FORMA DE LA DISTRIBUCIN

a) Asimtrica b) Simtrica c) Asimtrica


Sesgada a la Con forma de Sesgada a la
izquierda campana derecha
COEFICIENTE DE ASIMETRA.
Ejemplo:
Calcular previamente la media, la moda y la
A modo de ejemplo, se analiza la asimetra de desviacin tpica de la distribucin, teniendo en
la distribucin de los precios (en euros) por cuenta que est agrupada en intervalos de amplitud
habitacin en los hoteles ubicados en una variable.
determinada zona turstica
Coeficiente de asimetra
Por tanto, la distribucin es asimtrica a la derecha o positiva, tal
como puede observarse tambin en la correspondiente
representacin grfica, que muestra cola a la derecha, puesto que
las densidades de frecuencia descienden ms lentamente por la
derecha que por la izquierda.
CURTOSIS
CURTOSIS

Tambin se puede
calcular con la
frmula
CURTOSIS
Gracias!

Você também pode gostar