Você está na página 1de 65

ESTADISTICA Y PROBABILIDADES

VARIANZA-DESVIACIN ESTANDAR
COEF. VARIACIN -VALORES Z
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
El rango es la diferencia entre la observacin mayor
y la menor en una serie de datos. Esto es,
Rango = X mayor X menor
En el caso que sea para datos no agrupados
Rango = Lmax-Lmin
Lmax: limite mayor
Lmin: Limite menor

El rango mide la dispersin total en una serie de
datos. La debilidad del rango es que no toma en
cuenta la forma en que los datos se distribuyen
realmente entre el valor menor y el mayor.
RANGO
DETECCIN DE VALORES
ATIPICOS
EJEMPLO
39 29 43 52 39
44 40 31 44 35
VARIANZA-DESVIACIN ESTANDAR
COEF. VARIACIN -VALORES Z
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
DETECCIN DE VALORES
ATIPICOS
SOLUCIN
29 31 35 39 39 40 43 44 44 52


Rango = 52 - 29 = 23

Para determinar el rango de los tiempos necesario
para arreglarse, los datos se ordenan de menor a
mayor
VARIANZA-DESVIACIN ESTANDAR
COEF. VARIACIN -VALORES Z
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
DETECCIN DE VALORES
ATIPICOS
RANGO INTERCUARTIL
El rango intercuartil de un conjunto de datos es la
diferencia entre el tercer cuartil y el primer cuartil.
Es el rango donde se encuentra el 50% central de
los datos.
Elimina la sensibilidad de los valores de datos
extremos.
Este no varia como el rango.
Formula:
RQ = Q
3
- Q
1

VARIANZA-DESVIACIN ESTANDAR
COEF. VARIACIN -VALORES Z
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
DETECCIN DE VALORES
ATIPICOS
Para calcular el rango intercuartil del tiempo
necesario para arreglarse antes de salir al trabajo
se siguen los siguientes pasos:

(1) Ordenar de menor a mayor la muestra
(2) Calcular el cuartil 1 y el 3
(3) Utilizamos la formula

29 31 35 39 39 40 43 44 44 52
Muestra de tamao 10 ya ordenada
PASOS PARA HALLAR EL RANGO
INTERCUARTIL
VARIANZA-DESVIACIN ESTANDAR
COEF. VARIACIN -VALORES Z
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
DETECCIN DE VALORES
ATIPICOS
29 31 35 39 39 40 43 44 44 52
El rango intercuartil consta de 9 numerales
Posicin 3
Posicin 8
VARIANZA-DESVIACIN ESTANDAR
COEF. VARIACIN -VALORES Z
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
DETECCIN DE VALORES
ATIPICOS
DIAGRAMA DE CAJAS
VARIANZA-DESVIACIN ESTANDAR
COEF. VARIACIN -VALORES Z
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
DETECCIN DE VALORES
ATIPICOS
Construir el diagrama de cajas de la siguiente tabla de
datos, que corresponde a la renta de apartamentos.
425 430 430 435 435 435 435 435 440 440
440 440 440 445 445 445 445 445 450 450
450 450 450 450 450 460 460 460 465 465
465 470 470 472 475 475 475 480 480 480
480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570
575 575 580 590 600 600 600 600 615 615
EJEMPLO
VARIANZA-DESVIACIN ESTANDAR
COEF. VARIACIN -VALORES Z
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
DETECCIN DE VALORES
ATIPICOS
Resumen de cinco datos
Valor mnimo = 425 Primer cuartil (Q
1
) = 450
Mediana (Q
2
) = 475
Tercer cuartil (Q
3
) = 525 Valor mximo = 615
425 430 430 435 435 435 435 435 440 440
440 440 440 445 445 445 445 445 450 450
450 450 450 450 450 460 460 460 465 465
465 470 470 472 475 475 475 480 480 480
480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570
575 575 580 590 600 600 600 600 615 615
EJEMPLO: APARTAMENTOS EN
RENTA
VARIANZA-DESVIACIN ESTANDAR
COEF. VARIACIN -VALORES Z
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
DETECCIN DE VALORES
ATIPICOS
EJEMPLO: APARTAMENTOS EN
RENTA
Diagrama de caja

Limite menor: Q1 - 1.5(IQR) = 450 - 1.5(75) = 337.5
Limite mayor: Q3 + 1.5(IQR) = 525 + 1.5(75) = 637.5

No hay valores atpicos.

VARIANZA-DESVIACIN ESTANDAR
COEF. VARIACIN -VALORES Z
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
DETECCIN DE VALORES
ATIPICOS
VARIANZA
VARIANZA POBLACIONAL




VARIANZA MUESTRAL


VARIANZA-DESVIACIN ESTANDAR
COEF. VARIACIN -VALORES Z
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
DETECCIN DE VALORES
ATIPICOS
Datos recogidos de los sueldos de 12 recin
egresados de la carrera de Ingeniera Industrial.
VARIANZA-DESVIACIN ESTANDAR
COEF. VARIACIN -VALORES Z
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
DETECCIN DE VALORES
ATIPICOS
Resumen de clculos para hallar la varianza
VARIANZA-DESVIACIN ESTANDAR
COEF. VARIACIN -VALORES Z
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
DETECCIN DE VALORES
ATIPICOS
Luego empleando la formula para hallar la
varianza tenemos.


VARIANZA-DESVIACIN ESTANDAR
COEF. VARIACIN -VALORES Z
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
DETECCIN DE VALORES
ATIPICOS
Es sensible a los valores extremos
Si a todos los valores de la variable se les
suma un nmero, la varianza no vara
Si todos los valores de la variable se
multiplican por un nmero, la varianza
queda multiplicada por el cuadrado de dicho
nmero
No existe otro parmetro que no sean la
media que haga que la sumatoria de las
desviaciones respecto al parmetro sea
mnima.
PROPIEDADES DE LA VARIANZA
VARIANZA-DESVIACIN ESTANDAR
COEF. VARIACIN -VALORES Z
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
DETECCIN DE VALORES
ATIPICOS
La desviacin estndar, tambin llamada desviacin
tpica, es una medida de dispersin usada
en estadstica que nos dice cunto tienden a alejarse
los valores concretos del promedio en una distribucin

DESVIAVIN ESTNDAR POBLACIONAL



DESVIACIN ESTNDAR MUESTRAL

DESVIACIN ESTNDAR
VARIANZA-DESVIACIN ESTANDAR
COEF. VARIACIN -VALORES Z
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
DETECCIN DE VALORES
ATIPICOS
Para el ejemplo de los ingresos de los 12
egresados tendremos que la desviacin
estndar muestral es:

VARIANZA-DESVIACIN ESTANDAR
COEF. VARIACIN -VALORES Z
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
DETECCIN DE VALORES
ATIPICOS
Resulta imposible una comparacin directa de dos o ms
medidas de dispersin por ejemplo: se puede decir que
la desviacin estndar de $1 200, de la distribucin del
ingreso es mayor que la desviacin estndar de 4.5 das
de la distribucin de faltas de asistencias? Obviamente
no es as porque no podemos comparar directamente
dlares y das de inasistencia en el trabajo.
A fin de realizar una
comparacin significativa de la
distribucin de ingresos y las
faltas, se necesita convertir
cada una de esas medidas a un
valor relativo, es decir, a un
porcentaje.

COEFICIENTE DE VARIACIN
VARIANZA-DESVIACIN ESTANDAR
COEF. VARIACIN -VALORES Z
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
DETECCIN DE VALORES
ATIPICOS
Karl Pearson (1857- 1936) contribuyo de manera
importante a la ciencia estadstica, y desarrollo una
medida relativa denominada coeficiente de
variacin (CV).
El coeficiente de variacin permite comparar la
dispersin entre dos poblaciones distintas e
incluso, comparar la variacin producto de dos
variables diferentes (que pueden provenir de una
misma poblacin).
El coeficiente de variacin
elimina la dimensionalidad de
las variables y tiene en cuenta
la proporcin existente entre
una medida de tendencia y la
desviacin tpica o estndar.


COEFICIENTE DE VARIACIN
VARIANZA-DESVIACIN ESTANDAR
COEF. VARIACIN -VALORES Z
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
DETECCIN DE VALORES
ATIPICOS
Se calcula:


Donde es la desviacin tpica. Se puede dar en
tanto por ciento calculando:



Este ndice solo se debe calcular para variables
con todo los valores positivos, para dar seguridad
de uno mayor a cero (un coeficiente de variacin
positivo).
COEFICIENTE DE VARIACIN
VARIANZA-DESVIACIN ESTANDAR
COEF. VARIACIN -VALORES Z
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
DETECCIN DE VALORES
ATIPICOS
En una cierta empresa se hizo un estudio de las
notas obtenidas en un curso de capacitacin y los
aos de servicio de los mismos empleados que
tomaron el curso de capacitacin.
La calificacin media de los
empleados fue de 14 puntos y
la desviacin estndar de 2
puntos. Y la media de los aos
de servicio fue de 18 aos y la
desviacin estndar fue de 3
aos.

EJEMPLO
VARIANZA-DESVIACIN ESTANDAR
COEF. VARIACIN -VALORES Z
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
DETECCIN DE VALORES
ATIPICOS
Podemos ver que hay menor dispersin relativa con
respecto a la media en la distribucin de notas (14.29%
< 16.67%).


VARIANZA-DESVIACIN ESTANDAR
COEF. VARIACIN -VALORES Z
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
DETECCIN DE VALORES
ATIPICOS
VALOR Z DE LA DISTRIBUCIN
NORMAL
Como sabemos, la curva normal de frecuencias tiene la
forma de campana, en cuyo centro se ubican tres
medidas de tendencia central (promedio [media
aritmtica], mediana y moda).
En particular, el promedio o media
aritmtica es la medida
representativa de un universo
muestral, mientras que a los lados
de este valor se encuentran valores
ms altos y ms bajos,
aproximadamente la mitad para
cada lado, los cuales se dispersan
segn una medida denominada
desviacin estndar.

VARIANZA-DESVIACIN ESTANDAR
COEF. VARIACIN -VALORES Z
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
DETECCIN DE VALORES
ATIPICOS
Primero se convierte, o se estandariza, la distribucin
que se tiene, en la distribucin normal estndar
utilizando un valor z (tambin denominado puntuacin
z, valor estadstico, desviacin normal estndar, o
simplemente desviacin normal).
El valor Z se define matemticamente con la frmula:



Donde:
Z = valor estadstico de la curva normal de frecuencias.
X = cualquier valor de una muestra estadstica.
x = promedio o media aritmtica obtenido de la
muestra estadstica, valor representativo.
= desviacin estndar.

VALOR Z DE LA DISTRIBUCIN
NORMAL
VARIANZA-DESVIACIN ESTANDAR
COEF. VARIACIN -VALORES Z
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
DETECCIN DE VALORES
ATIPICOS
Pasos:
Calcular el promedio y la desviacin estndar de las
observaciones de la muestra en estudio.
Del valor del cual se desea obtener una inferencia
estadstica, calcular la diferencia que existe con
respecto al promedio: X - X.
Dividir la diferencia calculada entre la desviacin
estndar obtenida de la muestra en estudio, que
corresponde al valor Z.
Localizar el valor Z calculado, en la tabla de
probabilidades asociadas con valores tan extremos
como los valores observados de Z en la distribucin
normal y obtener la probabilidad de que exista una
magnitud de discrepancia entre los valores X y X .

VALOR Z DE LA DISTRIBUCIN
NORMAL
VARIANZA-DESVIACIN ESTANDAR
COEF. VARIACIN -VALORES Z
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
DETECCIN DE VALORES
ATIPICOS
Un mdico que labora en una poblacin acostumbra
efectuar mediciones de peso a sus pacientes, de los
cuales dos tienen pesos que difieren particularmente del
promedio. El mdico est interesado en saber si los
pesos de sus dos pacientes corresponden a esa
poblacin y qu tanto difiere de la representacin de su
grupo de asistencia mdica y de estudio.

Los pesos corporales de la poblacin estudiada se
encuentran listados del ms bajo al ms alto en la tabla
siguiente, y el mdico ha marcado los puntos donde se
localizan la media aritmtica, la mediana y la moda. Los
pesos de sus pacientes problema son de 54 y 80 kg.

EJEMPLO
VARIANZA-DESVIACIN ESTANDAR
COEF. VARIACIN -VALORES Z
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
DETECCIN DE VALORES
ATIPICOS
VARIANZA-DESVIACIN ESTANDAR
COEF. VARIACIN -VALORES Z
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
DETECCIN DE VALORES
ATIPICOS
Aplicacin de la prueba estadstica.
Tomando en cuenta los pasos, se calcula el promedio
o media aritmtica. De acuerdo con la siguiente
frmula:


La desviacin estndar se calcula con la ecuacin
siguiente:

VARIANZA-DESVIACIN ESTANDAR
COEF. VARIACIN -VALORES Z
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
DETECCIN DE VALORES
ATIPICOS
Una vez calculados el promedio y la desviacin
estndar, se calcula el valor Z.





En la tabla de probabilidades asociadas en valores
extremos como los de 2 en la distribucin normal, se
busca la localizacin de los valores Z
1
y Z
2
calculados,
a fin de obtener la probabilidad de su magnitud de
discrepancia con respecto a la media aritmtica.

VARIANZA-DESVIACIN ESTANDAR
COEF. VARIACIN -VALORES Z
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
DETECCIN DE VALORES
ATIPICOS
El primer valor de Z
1
es 1.69, de modo que se localiza
el 1.6 y en la interseccin de la columna 0.09,
correspondiente a las centsimas, se observa el valor
0.4545. Esta es la probabilidad de que el valor 54 kg
pertenezca a la poblacin de pesos corporales, donde
el promedio es 73.2 kg y la desviacin estndar 11.39
kg.
El segundo valor de Z
2
es 0.6, de manera que en la
tabla se observa esa cifra y en la interseccin de la
columna 0.00 se halla el valor 0.2257.

VARIANZA-DESVIACIN ESTANDAR
COEF. VARIACIN -VALORES Z
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
DETECCIN DE VALORES
ATIPICOS
Interpretacin.
La siguiente figura contiene tanto el polgono de
frecuencias en funcin de una serie de clases
elaboradas con las observaciones de 150 pesos
corporales, como los lmites de las desviaciones
estndar con respecto al promedio.
Los valores Z de los dos pesos problema se dibujan
con dos flechas, de acuerdo con los valores de
peso que corresponden. La Z
1
se encuentra muy
por fuera de -1 desviacin estndar y muy cercana
a -2 desviaciones estndar. Para ser ms precisos,
tiene 1.69 desviaciones estndar, igual al valor Z;
en cambio, el valor Z
2
tiene 0.6 desviaciones
estndar y an se encuentra dentro del lmite de +1
desviacin estndar.

VARIANZA-DESVIACIN ESTANDAR
COEF. VARIACIN -VALORES Z
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
DETECCIN DE VALORES
ATIPICOS
VARIANZA-DESVIACIN ESTANDAR
COEF. VARIACIN -VALORES Z
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
DETECCIN DE VALORES
ATIPICOS
reas bajo la curva normal tipificada de 0 a z
z 0 1 2 3 4 5 6 7 8 9
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753
0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517
0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879
0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224
0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549
0.7 0.2580 0.2611 0.2642 0.2673 0.2703 0.2734 0.2764 0.2793 0.2823 0.2652
0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133
0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3364 0.3389
1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621
1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830
1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015
1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177
1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319
1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441
1.6 0.4452 0.4463 0.4474 0.4485 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545
VARIANZA-DESVIACIN ESTANDAR
COEF. VARIACIN -VALORES Z
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
DETECCIN DE VALORES
ATIPICOS
TEOREMA DE CHEBYSHEV
Para cualquier conjunto de datos con
media x y desviacin estndar muestral
s, la proporcin de los datos
comprendidos en el intervalo [x-ks, x+ks]
es mayor o igual a [1-(1/k)], donde k es
una constante mayor o igual que uno
VARIANZA-DESVIACIN ESTANDAR
COEF. VARIACIN -VALORES Z
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
DETECCIN DE VALORES
ATIPICOS
Dada una distribucin de un conjunto de
observaciones de tamao n suficientemente
grande, que es simtrica y forma
aproximadamente acampanada.
Entonces:
Entre x-S y x+S se encuentra el 68.27% de las observaciones

Entre x-2S y x+2S se encuentra el 95.45% de las observaciones

Entre x-3S y x+3S se encuentra el 99.73% de las observaciones
REGLA EMPRICA
VARIANZA-DESVIACIN ESTANDAR
COEF. VARIACIN -VALORES Z
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
DETECCIN DE VALORES
ATIPICOS
La distribucin simtrica acampanada se conoce
como la distribucin normal
REGLA EMPRICA
VARIANZA-DESVIACIN ESTANDAR
COEF. VARIACIN -VALORES Z
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
DETECCIN DE VALORES
ATIPICOS
EJEMPLO
Para una distribucin de salarios, que sigue
aproximadamente una distribucin de
frecuencias simtrica de campana, la media se
calcula que es S/.5000 y la desviacin estndar
es S/.500. Utilizando la regla emprica

- Aproximar Entre cules cantidades est el
68% de los salarios?
- Aproximar Entre cules cantidades est el
95% de los salarios?
-Aproximar Entre cules cantidades estn casi
todos los salarios?

VARIANZA-DESVIACIN ESTANDAR
COEF. VARIACIN -VALORES Z
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
DETECCIN DE VALORES
ATIPICOS
VARIANZA-DESVIACIN ESTANDAR
COEF. VARIACIN -VALORES Z
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
S/.4500 Y S/.5500
4500=5000-1*500
5500=5000+1*500
S/.4000 Y S/.6000
4000=5000-2*500
6000=5000+2*500
S/.3500 Y S/.6500
3500=5000-3*500
6500=5000+3*500
SOLUCIN
Entonces aprox.
el 68% esta entre:
Entonces aprox.
el 95% esta entre:
Entonces aprox.
casi todos los datos
estn entre:
DETECCIN DE VALORES
ATIPICOS
Los valores atpicos son aquellos que son
mucho mayores o mucho menores que los
dems.

Existen criterios paramtricos basados en los
percentiles para definir los valores atpicos.
DEFINICIN
VARIANZA-DESVIACIN ESTANDAR
COEF. VARIACIN -VALORES Z
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
DETECCIN DE VALORES
ATPICOS
DETECCIN DE VALORES
ATIPICOS

Los pesos de los nios se consideran muy bajos si
estn por debajo del percentil 3 de una poblacin de
caractersticas similares, y muy altos si estn por
encima del percentil 97.
EJEMPLO
VARIANZA-DESVIACIN ESTANDAR
COEF. VARIACIN -VALORES Z
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
DETECCIN DE VALORES
ATIPICOS

Se consideran valores atpicos por defecto a
aquellos que son menores que el primer
cuartil menos 1,5 veces el recorrido
intercuartilico. Si los valores son menores que
la diferencia entre el primer cuartil menos 3
veces el recorrido intercuartilico se denominan
valores atpicos de segundo grado por
defecto.

VALORES ATPICOS POR
DEFECTO
VARIANZA-DESVIACIN ESTANDAR
COEF. VARIACIN -VALORES Z
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
DETECCIN DE VALORES
ATIPICOS

Se consideran valores atpicos por exceso a
aquellos que son mayores que el tercer cuartil
mas 1,5 veces el recorrido intercuartilico. Si los
valores son mayores que la suma del tercer
cuartil mas 3 veces el recorrido intercuartilico
se denomina valores atpicos de segundo
grado por exceso.
VALORES ATPICOS POR
EXCESO
VARIANZA-DESVIACIN ESTANDAR
COEF. VARIACIN -VALORES Z
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
DETECCIN DE VALORES
ATIPICOS

Los cuartiles primero y tercero de un conjunto
de datos son 80 y 90, respectivamente. Calcular
los valores a partir de los cuales serian
considerados valores atpicos de primero y
segundo grado, por exceso y por defecto.
El recorrido intercuartilico es:
RIC = 90 80 = 10.

EJEMPLO
VARIANZA-DESVIACIN ESTANDAR
COEF. VARIACIN -VALORES Z
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
DETECCIN DE VALORES
ATIPICOS
Los valores atpicos por exceso son aquellos que
son mayores que el tercer cuartil, 90, mas 1,5
veces el RIC, 15, es decir, los mayores de 105.
Los valores mayores de 105, pero inferiores a la
suma del tercer cuartil, 90, mas 3 veces el
recorrido intercuartilico, 30, es decir, menores de
120, son valores atpicos de primer grado por
exceso; los valores mayores de 120 son valores
atpicos de segundo grado por exceso.

SOLUCIN A
VARIANZA-DESVIACIN ESTANDAR
COEF. VARIACIN -VALORES Z
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
DETECCIN DE VALORES
ATIPICOS
SOLUCIN B
Los valores atpicos por defecto son aquellos que
son menores que el primer cuartil, 80, menos 1,5
veces el RIC, 15, es decir, los menores de 65.
Los valores menores de 65, pero mayores que la
diferencia entre el primer cuartil y 3 veces el
recorrido intercuartilico, 30, es decir, mayores de
50, son valores atpicos de primer grado por
defecto; los valores menores de 50 son valores
atpicos de segundo grado por defecto.

VARIANZA-DESVIACIN ESTANDAR
COEF. VARIACIN -VALORES Z
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
DETECCIN DE VALORES
ATIPICOS

Esta manera de definir los valores atpicos tiene
una serie de ventajas, no siempre hay valores
atpicos, puede haberlos o no. En ocasiones se
consideran valores atpicos aquellos que exceden
un determinado percentil
CONCLUSIN
VARIANZA-DESVIACIN ESTANDAR
COEF. VARIACIN -VALORES Z
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
DETECCIN DE VALORES
ATIPICOS
1. Introducir nuevas herramientas para
analizar V.A. bidimensionales de
naturaleza cuantitativa continua
2. Aprender a cuantificar la intensidad de la
relacin entre dos variables.
3. Realizar anlisis cuantitativo de la
relacin existente entre dichas variables
a efectos de predecir una de ellas en
funcin de la otra.
V. A. BIDIMENSIONAL: Cuando sobre cada
individuo se observan dos caractersticas
aleatorias expresables numricamente.

Ejemplos:
Poblacin estudiantes universitarios se
observa la ESTATURA (cms) y el PESO
(kgs) de cada estudiante.
Para el control del consumo de energa en
una factora se anota cada da el CONSUMO
y la TEMPERATURA DIARIA (C).
Es un grfico en el que se representa cada
observacin por un punto en un plano
cuya abscisa es el valor de la primera
variable y cuya ordenada es el de la
segunda.
Permite observar de forma grfica la
relacin constatada entre dos variables
En general, cuanto ms estrechamente se
agrupen los puntos del diagrama de
dispersin alrededor de una recta, ms
fuerte es el grado de relacin existente
entre las dos variables consideradas.
ESTATURA
P
E
S
O
150 160 170 180 190 200
45
55
65
75
85
95
TEMPER
C
O
N
S
U
M
O
-3 1 5 9 13 17 21
0
100
200
300
400
500
EDAD
E
S
T
A
T
U
R
A
19 22 25 28 31 34
150
160
170
180
190
200
Son dos parmetros estadsticos
que permiten cuantificar en un
ndice numrico el grado de relacin
LINEAL existente entre dos variables
La covarianza entre dos variables no es ms
que el promedio de los productos de las
desviaciones de ambas variables respecto de
sus medias respectivas:
1 N
) Y )(Y X (X
COV
i i
Y) (X,

COVARIANZA
INCONVENIENTE: Depende de las
dimensiones de las variables
El producto (Xi- X)(Yi Y) ser en promedio
positivo si existe una relacin creciente entre
las variables (si la Y tiende a crecer cuando lo
hace la X) y negativo si la relacin es negativa
COVARIANZA
TEMPER
C
O
N
S
U
M
O
-3 1 5 9 13 17 21
0
100
200
300
400
500
1
2
3
4
ES ADIMENSIONAL.
Es la covarianza dividida por las
desviaciones tpicas de las dos variables

COEFICIENTE DE CORRELACIN
LINEAL

Est siempre comprendido entre 1 y 1.
Cuanto ms estrecho es el grado de
relacin lineal entre las dos variables ms
cercano estar de 1 (o de 1)
Por el contrario, un valor nulo de r
xy

indicara una relacin lineal inexistente o
muy dbil
COEFICIENTE DE CORRELACIN LINEAL
CUIDADO!!!!
Covarianza y Correlacin lineal miden slo el
grado de relacin lineal existente entre dos
variables.
Dos variables pueden tener una relacin
muy estrecha y sin embargo resultar r
xy

cercano a 0 por ser dicha relacin no lineal.


La existencia de una relacin estadstica entre
dos variables, no significa que haya una
relacin de causalidad entre las mismas.
Una correlacin constatada entre dos
variables puede ser debida a:
Existe una relacin causal unidireccional.
Por ejemplo : relacin temperatura
consumo.
Las dos variables dependen parcialmente de
otras que no se estn considerando. Por
ejemplo: relacin peso estatura.

Você também pode gostar