Você está na página 1de 67

Modelacin y Anlisis de Riesgo con

Crystal Ball 11.1


Curso de capacitacin
Clase 1: Estadstica Descriptiva

Modelacin y Anlisis de
Riesgo

Javier Gil Antelo

Candidato a Dr. En Finanzas / Universidad De La Habana


MSC en Finanzas Univ. De La Habana 2002
MSC en Direccin Univ. De La Habana 2004.
Administrador de empresas. UPSA, 1998.
Docente Programas de Maestra: UAGRM, UTEPSA, NUR,
UASB
en:
Administracin
Financiera
Internacional;
Decisiones Financieras Estratgicas, Decisiones Financieras
Operativas, Anlisis de carteras; Evaluacin Financiera de
Inversiones, Planeacin Financiera.
Cargo actual: Director Ejecutivo GS1 Bolivia
email: javier.gil@gs1.org.bo
www.javiergilantelo.jimdo.com

Algn da el conocimiento estadstico ser tan


necesario para ser un buen y eficiente ciudadano,
como lo es saber leer.
H.G Wells
Escritor ingls, Padre de la ciencia-ficcin
1866-1946.

Modelacin y Anlisis de
Riesgo

Uso de datos e informacin en la actualidad


En la dcada de los 60, la localizacin de datos relevantes era realmente
una tarea difcil.
Esto ha cambiado! Hoy la obtencin de datos no es un problema:
La cantidad de artculos que se compran en una tienda de comestibles se
registra en la caja automticamente;
Las compaas de telfonos llevan un registro de la duracin de cada
llamada, la hora a la que se hizo y el nmero de la persona a la que se llam;
Existen aparatos mdicos que de manera automtica monitorean y registran
el ritmo cardaco, la presin sangunea y la temperatura del cuerpo de un ser
humano; gran cantidad de informacin econmica y negocios se registra y
reporta casi instantneamente.
Empresas como CNN, USA Today (en Estados Unidos) y Yahoo!, por ejemplo
cuentan con sitios en la Red (websites) en los que se puede consultar los
precios de las acciones financieras en menos de 20 minutos.
Modelacin y Anlisis de
Riesgo

Uso de datos e informacin en la actualidad


No hay duda de que hoy se dispone de muchos ms datos tiles que en el pasado.
Sin embargo, no se cuenta con suficientes personas capaces de convertir esos datos
en informacin til, y de interpretarlos correctamente.
En la actualidad se requiere habilidad para poder utilizar todo este cmulo de
informacin.
En primer lugar se necesita ser crtico al utilizar la informacin que otros generan.
En segundo, es necesario saber transformar grandes cantidades de datos a un
formato accesible y comprensible, de manera que uno pueda interpretar y juzgar
estos datos, y con base en eso tomar decisiones.
Hoy, todos los estudiantes no slo poseen calculadoras, sino que muchos de ellos
cuentan con su propia computadora o cuando menos tienen acceso a una en la
institucin educativa a la que pertenecen.
Tambin se cuenta con una gran cantidad de software para estadstica, y de datos
almacenados electrnicamente.
SPSS, MINITAB, SAS, VISUALSTATISTICS, ETC.
Modelacin y Anlisis de
Riesgo

Uso de datos e informacin en la actualidad


El enfoque que debe darse en la enseanza de la estadstica se basa en tres ideas
fundamentales:
Las aplicaciones de la estadstica, que es hoy da un instrumento metodolgico
bsico tanto en la investigacin experimental, como en el mundo empresarial,
poltico y profesional;
El uso de computadores, que en la actualidad son un recurso imprescindible en el
anlisis de datos;
El anlisis didctico de los conceptos y tcnicas estadsticas.
En primer lugar, se trata de un curso de estadstica debe ser de carcter aplicado,
dirigido a personas que usarn la estadstica como herramienta en su trabajo.
Se debe huir, por tanto, del desarrollo terico excesivo para el cual existen en la
actualidad cursos y libros de texto excelentes.
Se debe pensar en el estudiante no matemtico, por lo que se pretende que,
desde el primer momento quede patente la aplicabilidad de cada uno de los temas.
Modelacin y Anlisis de
Riesgo

Por qu Estadstica?

En reuniones sociales una persona puede decir que es mdico y los concurrentes empiezan
con dolores y tratan de obtener una consulta gratuita.
Si dice que es matemtico, por qu estudiaste algo tan difcil?, y lo miran con esa mezcla de
admiracin, horror y respeto con que se mira a un brujo.
Si dice que es estadstico, sigue a sus palabras un silencio profundo. El motivo de este
silencio puede deberse a muchas razones: ignorancia.
Algo de historia:
Los eruditos del siglo XVII demostraron especial inters por la Estadstica Demogrfica como
resultado de la especulacin sobre si la poblacin aumentaba, decreca o permaneca esttica.
En los tiempos modernos tales mtodos fueron resucitados por algunos reyes que necesitaban
conocer las riquezas monetarias y el potencial humano de sus respectivos pases.
El primer empleo de los datos estadsticos para fines ajenos a la poltica tuvo lugar en 1691 y
estuvo a cargo de Gaspar Neumann, un profesor alemn. Este investigador se propuso destruir la
antigua creencia popular de que en los aos terminados en siete mora ms gente que en los
restantes, y para lograrlo hurg pacientemente en los archivos parroquiales de la ciudad. Despus
de revisar miles de partidas de defuncin pudo demostrar que en tales aos no fallecan ms
personas que en los dems.
Modelacin y Anlisis de
Riesgo

7
Ing. Hubert Gil Antelo

El oscurantismo matemtico
Para muchos no hay nada ms aterrador que el recuerdo de una clase de matemtica.
La matemtica ha sido manejada con excesivo rigor, muy similar a la poca en la que
se hablaba en latn para que todos pudieran entenderlo. Aquella fue una poca de
oscurantismo. Y en la matemtica ocurre igual, muchos huyen de ella debido a los
sacerdotes del oscurantismo matemtico.
Y esta realidad deja muchas veces daos difciles de reparar en quienes en edad
temprana vivieron experiencias traumticas, trabajar con quebrados, resolver
cincuenta mil ejercicios de factores, aprender de memoria mtodos y formulas
inventadas hace mil aos.
La matemtica desmitificada puede convertirse en una fuente de creatividad
inagotable que puede ayudar a entender complejas interrelaciones entre los elementos
de un mundo sistmico.
Para acabar con el oscurantismo matemtico hay que quitarle el halo de misterio que
rodea a las nmeros, formulas, teoremas y principios matemticos.
Se los debe despojar de tanto formalismo. Hay que volverlos simples.
Modelacin y Anlisis de
Riesgo

Datos e informacin
Las buenas decisiones de hoy en da son conducidas por datos.
En todos los aspectos de nuestras vidas, y ms an en el mundo de los de los negocios,
una diversidad asombrosa de datos est disponible para el reconocimiento y la
aproximacin analtica.

Actualmente, gerentes de negocios y profesionales son ms exigidos a justificar sus


decisiones basndose en la informacin proporcionada por datos. Necesitan sistemas
de soporte de decisiones basadas en modelos.
Las habilidades estadsticas le permiten recolectar, analizar e interpretar inteligente los
datos relevantes en su toma de decisin. En este contexto, los conceptos estadsticos
y el razonamiento estadstico permite:
Solucionar problemas diversos.
Agregar soporte a las decisiones.
Reducir el trabajo de adivinar.

La estadstica de negocios es una ciencia que le asiste en la toma de decisiones


econmicas bajo incertidumbre basadas en algunas escalas numricas y mensurables.
Modelacin y Anlisis de
Riesgo

Conceptos estadsticos bsicos


Como punto de partida de la administracin de riesgos, conviene enfatizar
en la importancia de la medicin como esquema de control y gestin.
La medicin condicione el comportamiento de los individuos, y les permite
contar con un mecanismo objetivo para la mejora de cualquier situacin
que se este analizando.
Dentro de los beneficios de medir se encuentran:
Permite gerenciar los recursos y, cuando conviene, la reduccin de costos.
Mejorar de planeacin y cumplimiento de cronogramas, compromisos y
metas.
Permite un incremento de la productividad, y el pago de los incentivos por su
mejoramiento.
Genera un mecanismo objetivo de comparacin de desempeo.
Permite la generacin de informacin necesaria para una adecuada toma de
decisiones.
Modelacin y Anlisis de
Riesgo

10

Conceptos estadsticos bsicos


No quiere decir esto que se debe desconocer la experiencia y la intuicin
de quienes conocen los detalles de la operacin, o de quienes estn a la
cabeza de una organizacin, ya que son precisamente los que poseen la
mayor cantidad de informacin sobre las caractersticas del negocio, y las
causas para las desviaciones que se suelen presentar con respecto a lo
planeado.
Todo lo contrario. Gracias a la medicin es ms fcil aprovechar el
conocimiento y aplicarlo a nuevas situaciones. As mismo, simplifica
comunicar a otros los anlisis hechos en condiciones de incertidumbre, y
facilitar la toma de decisiones.
Lo ideal es que todos los involucrados en el proceso, conozcan y
entiendan los elementos estadsticos bsicos que hacen posible resumir y
valorar la enorme cantidad de datos que hoy en da se producen en los
diferentes sistemas de informacin.
Modelacin y Anlisis de
Riesgo

11

Conceptos estadsticos bsicos


El proceso de la medicin de riesgos es poder brindar elementos de juicio
que permitan mejorar la calidad de las decisiones. No se trata de saber y
recitar frmulas, ya que hoy en da las hojas de clculo permiten obtener
cualquier resultado en cuestin de segundos, algo que hace unos aos
tomaba considerable cantidad de tiempo.
Resuelto el problema de los clculos, el reto consiste en saber como
interpretarlos y aplicarlos a la solucin de problemas.
El sentido comn, asistido por el computador, permite aumentar considerablemente
la productividad.

Es importante recordar que nadie conoce la que va a ocurrir,


Lo mximo que se puede hacer es extender las experiencias del pasado y
prepararnos para las eventualidades que puedan surgir en el futuro.
Para analizar el riesgo, es importante contar con informacin histrica de manera
organizada.
Modelacin y Anlisis de
Riesgo

12

Pasos para organizar la informacin

Los pasos a seguir son:


Recoleccin de informacin
Revisin y clasificacin de datos
Construccin de un modelo
Extrapolacin del pasado por medio del modelo
El primer paso implica la recoleccin de datos e informacin relevante y correcta.
Debido al desorden o carencia de sistemas de informacin puede ser el ms difcil de todos.
Posteriormente, la informacin obtenida debe ser depurada y ajustada, ya que puede que
existan muy pocos o muchos datos, o que algunos de ellos no sean relevantes o sean
inexactos.

A partir de informacin ajustada, se construya un modelo que permita refleja la situacin


analizada y obtener respuestas y predicciones.
Aqu es importante contar con un balance entre un modelo muy sofisticada y uno sencillo que
pueda ser utilizado y comprendido por todo el mundo.

Finalmente, se pronostican las situaciones que se desean analizar.


Para ello, el modelo permite extrapolar u anticipar los hechos. Lo ideal es contar con un modelo
que de respuestas a las preguntas fundamentales, y que facilite el proceso de toma de
decisiones.

Al final, se sabe que el modelo no puede predecir el futuro, y es tan limitado como efectivos
hayan sido los cuatro pasos anteriores.
Modelacin y Anlisis de
Riesgo

13

Estadstica descriptiva
Para comenzar, es conveniente tener en cuenta que la decisiones que se toman
a todo nivel dependen de la escala de conocimientos e informacin que se tenga,
y de acuerdo con ellos, el proceso de toma de decisiones se puede clasificar en:
Decisiones en condiciones de certidumbre
Decisiones en condiciones de riesgo y certidumbre
Decisiones en condiciones de incertidumbre total

En las decisiones en condiciones de certidumbre, quien toma la decisin sabe


con certeza la consecuencia de sus acciones, y escoge de entre las alternativas
que tiene, la que mejor le convenga a sus intereses o los que representa.
En el segundo caso, que toma las decisiones puede estimar con algn grado de
certeza las probabilidades de ocurrencia de un evento, a diferencia de la
condicin de incertidumbre total, en las que dichas probabilidades de ocurrencia
se ignoran por completo,
Cuando ser la fecha en que el hombre llegar con una nave tripulada a Jpiter.
Modelacin y Anlisis de
Riesgo

14

Estadstica descriptiva
A lo largo del curso se analizaran el segundo grupo de decisiones por lo
que es importante el manejo bsico de probabilidades y algunos
conceptos estadsticos.
En condiciones de riesgo los criterios de decisin se basan en dos
posibilidades:
Maximizar el valor esperado (mayores ingresos)
Minimizar la prdida esperada (menores costos)

En contraste, en condiciones de incertidumbre total se adoptan otro tipo


de criterios para la toma de decisiones, dentro de las que se destacan:
Maximax
Maximin
Igualmente probable
Criterio de realismo
Etc.
Modelacin y Anlisis de
Riesgo

15

Estadstica descriptiva
As, es necesario asegurar el conocimiento de una serie de conceptos
estadsticos fundamentales, los que gracias al extensivo uso de las hojas
de clculo son muy fciles de trabajar y calcular.
Para ello, en lugar de hace nfasis en la forma de hacer los cmputos
matemticos, se presentan los conceptos aplicados en una serie de
ejemplos, a fin de practicar las diferentes funciones del Microsoft Excel, y
con ello facilitar su comprensin y utilizacin.
Todo ello sin perder de vista la importancia de manejar el concepto bsico.

Como se mencion anteriormente, es imposible predecir el futuro.


Para poder estimar con algn grado de certidumbre o exactitud la forma
en que se va a comportar un sistema, siempre es necesario revisar su
comportamiento histrico y la situacin actual.
El mejor acercamiento posible es el de entender y describir de la mejor manera
posible su funcionamiento, e identificar la forma en que se interrelacionan los
aspectos crticos.
Modelacin y Anlisis de
Riesgo

16

Estadstica descriptiva
Por ejemplo, un meteorlogo interesado en pronosticar el estado del tiempo, puede
analizar el comportamiento histrico del clima de la regin, y recopilar informacin
importante tal como: temperatura, imgenes satelitales, humedad relativa, corrientes
de viento, etc.
El anlisis integrado le permitir hacer un pronostico educado (aunque no por ello exacto) de
lo que podr ocurrir en las prximas horas, incluso das.

Para estudiar el comportamiento de los riesgos, es necesario predecir, y por ende,


hacer inferencias del comportamiento de elementos o situaciones objetos de
anlisis, los cuales comnmente se denominan la poblacin.
Una muestra, es un subgrupo de elementos de la poblacin.
Es de gran importancia el poder seleccionar una muestra representativa y suficientemente
grande, para poder realiza anlisis efectivos.
Tpicamente, las mediciones que se realizan sobre la muestra servirn como reflejo de las
caractersticas de la poblacin.

Las medidas ms utilizadas se agrupan dentro de lo que se denomina estadstica


descriptiva.
Modelacin y Anlisis de
Riesgo

17

Medidas estadsticas

Modelacin y Anlisis de
Riesgo

18

Medidas de tendencia central:


Primer momento

Modelacin y Anlisis de
Riesgo

19

Medidas de tendencia central


Medida de tendencia central: Es un valor nico que resume un conjunto
de datos, mediante un nico valor. Seala el centro de los valores.
El concepto de promedio es familiar a todos.
En los ngeles el costo promedio de viajar una milla en auto es de 55.8 centavos
de dlar, en Boston es de 49,8 centavos de dlar, y en Filadelfia, de 49,0
centavos. Esto incluye el importe del seguro, la depreciacin, los permisos, el
combustible, el aceite, las llantas y el mantenimiento general del automvil.
Cada persona en Estados Unidos recibe un promedio de 598 piezas por correo
por ao.
Las casas en USA cambian de dueo cada 11.8 aos en promedio. Los cambios
ms rpidos se presentan en Arizona, donde el promedio en el estado es 6.2
aos. En otros estados los promedios son: en Nevada, 6.5 aos; en Carolina del
Norte, 7.4 aos; en Utah, 8.4 aos, y en Tennessee, 8.8 aos.

Modelacin y Anlisis de
Riesgo

20

Media poblacional
Muchos estudios utilizan todos los valores de una poblacin.
Si se reporta que la calificacin promedio en el examen de admisin de la
Universidad de Florida, en otoo del 2000, es de 19,6; ste es un ejemplo
de una media poblacional porque se tienen las puntuaciones de todos los
estudiantes que ingresaron en esa poca.
La media poblacional de datos sin procesar, datos que no han sido
agrupados en una distribucin de frecuencias o en una representacin de
tallo y hoja, es la suma de todos los valores de la poblacin, dividida entre
el nmero total de dichos datos.
Para calcular la media de una poblacin se utiliza la siguiente frmula:
Suma de todos los valores de l a poblacin
Media poblacional
Nmero de valores en la poblacin
Modelacin y Anlisis de
Riesgo

21

Media poblacional
En vez de expresar con palabras las instrucciones completas para calcular
la media poblacional (o cualquier otra medida), es ms conveniente utilizar
los smbolos matemticos.
La media aritmtica de una poblacin, usando smbolos matemticos, es:
X

Donde:
N
representa la media de la poblacin. Es la letra griega mu minuscula.
N es el nmero total de elementos en la poblacin.
X representa cualquier valor en particular.
es la letra griega sigma mayscula, indica la operacin de sumar.
X simboliza la suma de todos los valores X.
Cualquier caracterstica medible de una poblacin se denomina parmetro.
La medida de una poblacin es un parmetro.
Modelacin y Anlisis de
Riesgo

22

Media muestral
Con frecuencia se selecciona una muestra de la poblacin, con objeto de
evaluar algo acerca de una caracterstica especfica de la poblacin.
Por ejemplo, un departamento de control de calidad necesita tener la
seguridad de que el dimetro exterior de un repuesto que se esta
produciendo, es aceptable.
Resultara muy costoso y tardado verificar el dimetro exterior de todos
los repuestos que se producen.
Por tanto, podra seleccionarse una muestra de 5 repuestos y calcular el
dimetro exterior promedio de los mismos para estimar el dimetro de
todos los repuestos que se producen.
Para datos a granel, es decir, no agrupados, la media muestral es la
suma de todos los valores dividida entre el total de los mismos.
Modelacin y Anlisis de
Riesgo

23

Media muestral
Para encontrar la media de una muestra se tiene:
Media muestral

Suma de todos los valores de l a muestra


Nmero de valores en la muestra

La media de una muestra y la media de una poblacin se calculan de la


misma manera, pero la simbologa utilizada es diferente.
La frmula para la media de una muestra es:
X

X
n

Donde X simboliza la media muestral. Se lee X con barra. La letra n


designa al nmero total de valores en la muestra.
La media de una muestra, o cualquier otra medida basada en datos
muestrales, se denomina dato estadstico. Si el dimetro medio de una
muestra de repuestos es 0.625 pulgadas, este valor es un dato
estadstico.
24
Modelacin y Anlisis de
Riesgo

Propiedades de la media aritmtica


La media aritmtica es una medida de tendencia central que se utiliza
ampliamente. Tiene varias propiedades importantes:
Todo conjunto de datos tiene un valor medio.
Para evaluar la media se consideran todos los valores.
Un conjunto de datos slo tiene una media, la cual es un valor nico.
La media es una medida muy til para comparar dos o ms
poblaciones. Por ejemplo, puede emplearse para comparar el trabajo
en la produccin de los operarios del primer turno de una planta
donde se fabrican zapatos, con la labor de los empleados del
segundo turno.

Modelacin y Anlisis de
Riesgo

25

Desventajas de la media aritmtica


Sin embargo, la media tiene varias desventajas.
Recuerde que para su clculo se utiliza el valor de cada elemento de la
poblacin y de la muestra, o de una poblacin. Si uno o dos de estos
valores es muy grande o muy pequeo, la media podra no ser un
promedio adecuado para representar los datos.
Por ejemplo, supngase que los ingresos anuales en dlares de un
pequeo grupo de corredores de acciones de Merril Lynch son 62.900,
61.600. 62.500, 60.800 y 1.200.000. El ingreso medio es 289.560 dlares,
pero resulta obvio que no es representativo de este grupo porque todos,
excepto un corredor, tienen un ingreso en el intervalo de 60.000 a 63.000
dlares. Un ingreso especial (el de 1.2 millones de dlares) est afectando
indebidamente a la media.
Como no se tiene informacin acerca de sus ingresos, no es posible
determinar la media aritmtica del ingresos para esta distribucin.
Modelacin y Anlisis de
Riesgo

26

La mediana

Ya se seal que para datos que contienen uno o dos valores muy grandes o muy
pequeos, la media aritmtica puede no ser representativa.
El punto central de tales datos puede describirse mejor utilizando una medida de
tendencia central denominada mediana.
Para ilustrar la necesidad de una medida de esa naturaleza, que no sea la media
aritmtica, suponga que quiere adquirir un condominio en Palm Beach. Su agente de
bienes races le indic que el precio promedio de las unidades disponibles en este
momento es de $110.000 dlares. De todas formas querra usted considerar lo
anterior?
Si tuviera un presupuesto mximo entre $60.000 y $75.000, podra pensar que est
fuera de sus posibilidades. Sin embargo, al verificar los precios individuales de los
condominios podra cambiar de idea.
Los precios son de $60.000, $65.000, $70.000, $80.000, y un penthouse muy lujoso
cuesta $275.000. La media aritmtica del precio es $110.000 segn lo indic el
agente de bienes races, pero un valor de $275.000 est haciendo que la media
aritmtica se incline hacia arriba, por lo que el promedio no es representativo.
Parecera que un precio entre $65.000 y $75.000 es un promedio ms tpico o
representativo, y de hecho lo es. En casos como este, la mediana proporciona una
medida de tendencia central ms exacta.
Modelacin y Anlisis de
Riesgo

27

La mediana
Mediana. Es el valor que corresponde al punto medio de los valores
despus de ordenarlos de menor a mayor, o de mayor a menor. Cincuenta
por ciento de las observaciones son mayores que la mediana, y 50% son
menores que ella.
La mediana del precio de las unidades disponibles es de $70.000. Para
determinar esto, los precios se ordenaron de menor ($60.000) a mayor
($275.000), y se seleccin el valor intermedio ($70.000).
Precios ordenados
de menor a mayor

Precios ordenados
de mayor a menor

$60.000

$275.000

$65.000

$80.000

$70.000

MEDIANA

$70.000

$80.000

$65.000

$275.000

$60.000

Modelacin y Anlisis de
Riesgo

28

La mediana
Observe que existe el mismo nmero de precios por debajo de la
mediana de $70.000, que por arriba. Por tanto la mediana no es
afectada por observaciones extremadamente bajas o muy altas.
Si el precio ms elevado hubiera sido $90.000, o bien $300.000, o
hasta de 1 milln de dlares, la mediana de los precios seguira siendo
$70.000. De manera semejante, si el precio ms bajo hubiera sido
$20.000 o bien $50.000, la mediana seguira siendo $70.000.
En el ejemplo anterior hay un nmero impar de observaciones (cinco).
Cmo se determina la mediana cuando el nmero de observaciones
es par?
Como antes, se ordenan los valores. Despus, lo que se acostumbra es
calcular la media aritmtica de las dos observaciones centrales.
Observe que cuando el nmero de observaciones es par, puede no ser
uno de los valores dados.
Modelacin y Anlisis de
Riesgo

29

Propiedades de la mediana

Las propiedades importantes de la mediana son:


Es nica; esto es, a semejanza de la media, slo existe una mediana para un
conjunto de datos.
No se ve afectada por valores extremadamente grandes o muy pequeos, y por
tanto es una medida valiosa de tendencia central cuando se presenta esta clase
de valores.
Puede calcularse para datos ordinales. (Recuerde que los datos de nivel ordinal
se pueden ordenar de menor a mayor como en el caso de las respuestas a la
pregunta de un estudio de mercado: Excelente, muy bien, bien, regular y
mal.
Para usar un ejemplo sencillo, supngase que cinco personas evaluaron una
nueva barra de chocolate. Una persona la consider excelente, otra la evalu
como buena, una ms como buena, otra como regular, y la ltima la considero
mala. La respuesta mediana es buena. La mitad de las respuestas estn arriba
de buena, y la otra mitad abajo de ella.
Modelacin y Anlisis de
Riesgo

30

La moda

La moda es otra medida de tendencia


central.
Moda: es el valor de la observacin
que aparece con ms frecuencia.
La moda es especialmente til para
describir los niveles de medicin
nominales y ordinales.
Como ejemplo de uso para datos de
nivel nominal, una compaa ha
desarrollado cinco aceites para bao.
El diagrama 3.1 muestra los
resultados de un estudio de mercado
diseado para descubrir la preferencia
de los consumidores de aceites.
El mayor nmero de opiniones
favoreci a Lamoure, como lo indica
la barra ms alta. De modo que la
moda corresponde a Lamoure.
Modelacin y Anlisis de
Riesgo

31

Ejemplo

A continuacin se muestran los sueldos anuales en dlares de gerentes de


control de calidad en algunos estados. Cul es el valor de los sueldos?
Estado

Sueldo

Estado

Sueldo

Estado

Sueldo

Arizona

35.000

Illinois

58.000

Ohio

50.000

California

49.100

Lousiana

60.000

Tennessee

60.000

Colorado

60.000

Maryland

60.000

Texas

71.400

Florida

60.000

Massachussets

40.000

West Virginia

60.000

Idaho

40.000

New Yrsey

65.000

Wyoming

55.000

Una revisin de las cantidades revela que el sueldo anual de $60.000 dlares
aparece con mayor frecuencia (seis veces) que cualquier otra percepcin. Por
tanto, la moda es $60.000.
En resumen, se puede determinar la moda para datos de cualquiera de los
niveles nominal, ordinal, de intervalo y de razn.
La moda tambin tiene la ventaja de no verse afectado por valores
extremadamente altos o muy bajos. Al igual que la mediana, puede utilizarse
como
medida
de detendencia central en distribuciones
con clases de extremo.
32
Modelacin
y Anlisis
Riesgo

Ing. Hubert Gil Antelo

Desventajas de la moda
Sin embargo, la moda tiene algunas desventajas, y esto hace que
utilice con menos frecuencia que la media o la mediana.
En muchos conjuntos de datos no hay valor modal, porque
ningn valor aparece ms de una vez.
Por ejemplo, en el siguiente conjunto de datos no hay moda: $19,
$21, $23, $20 y $18. Puesto que cada valor es diferente, podra
argumentarse que cada valor es modal.
Por el contrario, en ciertos conjuntos de datos hay ms de una
moda. Supngase que las edades en un grupo de individuos son
22, 26, 27, 27, 31, 35 y 35. Tanto 27 como 35 son edades
modales. Por tanto, este conjunto de edades se denomina
bimodal (ya que hay dos modas).
Sera cuestionable utilizar los dos valores de moda para
representar la tendencia central de este conjunto de datos de
edades.
Modelacin y Anlisis de
Riesgo

33
Ing. Hubert Gil Antelo

Medidas de dispersin:
Segundo momento

Modelacin y Anlisis de
Riesgo

34
Ing. Hubert Gil Antelo

Por qu estudiar la dispersin?


Un promedio, como la media o la mediana, solamente localiza el centro de
los datos, y esto es importante desde ese punto de vista.
Por ejemplo, si una gua geogrfica informa que el cauce de un ro tiene en
promedio 1.20 metros de profundidad, lo cruzara sin tener informacin
adicional? Probablemente no.
Deseara saber algo acerca de la variacin de la profundidad Es la
profundidad mxima del ro 1.50 metros, y la mnima 1.10 metros? Si es
el caso, probablemente decidira cruzar.
Qu ocurrira si se entera de que la profundidad del ro vara de 0.50
metros a 3.50 metros? Su decisin probablemente sera no atravesarlo.
Antes de decidir si cruza o no el ro, usted necesita informacin acerca
de la profundidad tpica y la variacin en la profundidad del ro.

Modelacin y Anlisis de
Riesgo

35

Por qu estudiar la dispersin?


Ejemplo de dos conjuntos de datos con igual media

Datos con baja dispersin

Modelacin y Anlisis de
Riesgo

Datos con alta dispersin

36
Ing. Hubert Gil Antelo

Por qu estudiar la dispersin?

Un valor pequeo en una medida de


dispersin indica que los datos se
acumulan estrechamente, por ejemplo,
alrededor de la media aritmtica. En
consecuencia el valor medio se considera
representativo de los datos.
Por el contrario, una medida de dispersin
grande indica que la media no es confiable.
El diagrama siguiente organiza los datos
de 100 empleados de una empresa, en un
histograma basado en el nmero de aos
que han sido empleados de la compaa.
La media es 4.9 aos, pero la variabilidad
de los datos va de 6 meses a 16.8 aos. El
valor medio de 4.9 aos, no es muy
representativo de todos los empleados.

Modelacin y Anlisis de
Riesgo

37
Ing. Hubert Gil Antelo

Por qu estudiar la dispersin?

Una segunda razn para estudiar la dispersin de


un conjunto de datos es comparar la dispersin de
dos o ms distribuciones.
Por ejemplo, supngase que la nueva computadora
PDM/3 se ensambla en Baton Rouge y tambin en
Tucson.
La median aritmtica de la produccin diaria en la
planta de Baton Rouge es 50, y en la de Tucson
tambin es 50.
Con base en ambos valores medios se podra
concluir que las distribuciones de las producciones
diarias son idnticas.
Sin embargo, los registros de produccin de nueve
das en las dos plantas revelan que esta conclusin
no es correcta.
La produccin en Baton Rouge vara de 48 a 52
ensambles por da, pero la produccin en Tucson es
ms errtica, ya que vara de 40 a 60 ensambles por
da.
Modelacin y Anlisis de
Riesgo

38
Ing. Hubert Gil Antelo

Varianza y desviacin estndar


La varianza y la desviacin estndar se basan en las desviaciones con
respecto a la media.
Varianza: La media aritmtica de las desviaciones cuadrticas con
respecto a la media.
Cabe indicar que la varianza es no negativa, y es cero solamente si
todas las observaciones son iguales.
Desviacin estndar: La raz cuadrada positiva de la varianza.
La varianza poblacional: las frmulas para la varianza poblacional y la
varianza muestral son un poco diferentes.
La varianza poblacional de datos no agrupados, es decir, los datos que no
estn tabulados en una distribucin de frecuencias se obtienen de la
siguiente frmula:
Modelacin y Anlisis de
Riesgo

39
Ing. Hubert Gil Antelo

Varianza y desviacin estndar


2

2
(
X

Donde:
2
es el smbolo de la varianza de una poblacin ( es la
letra griega sigma minscula. Se expresa comnmente como
sigma cuadrado.
Xes el valor de una observacin en la poblacin.
es la media aritmtica de la poblacin.
N
es el nmero total de observaciones de la poblacin.
Modelacin y Anlisis de
Riesgo

40
Ing. Hubert Gil Antelo

Desviacin estndar poblacional


Resulta difcil interpretar la varianza para un solo conjunto de
observaciones. La varianza de 106.8 para las edades de los pacientes
en aislamiento, no est en trminos de aos, sino de aos al
cuadrado.
Existe una forma de solucionar este dilema. Al obtener la raz
cuadrada de la varianza poblacional, se transforma en un valor que
tiene la misma unidad de medicin que se utiliza en los datos
originales.
La raz cuadrada de 106.8 aos al cuadrado, es 10.3 aos. A esta
magnitud: raz cuadrada de la varianza poblacional, se denomina
desviacin estndar poblacional.
N

Desviacin estndar poblacional


Modelacin y Anlisis de
Riesgo

(x )
i 1

41
Ing. Hubert Gil Antelo

Varianza muestral
La formula de la varianza muestral ha sufrido una ligera modificacin en
el denominador. En lugar de introducir n (nmero en la muestra) en vez
de N (nmero de la poblacin), el denominador se hace igual a n 1.

Donde:
S2
X
X
N

s2

2
( xi x )
n 1

es el smbolo para representar la varianza muestral.


es el valor de cada observacin de la muestra.
es la media de la muestra.
es el nmero total de observaciones muestrales.

Modelacin y Anlisis de
Riesgo

42
Ing. Hubert Gil Antelo

Desviacin estndar muestral


Desviacin estndar muestral: Este concepto se utiliza como un
estimador de la desviacin estndar poblacional. Segn se indic
antes, esta ltima es la raz cuadrada de la varianza de la poblacin.
En forma semejante, la desviacin estndar muestral es la raz
cuadrada de la varianza muestral.

( X )
X
n

Modelacin y Anlisis de
Riesgo

n 1

43
Ing. Hubert Gil Antelo

Interpretacin y usos de la desviacin estndar

En general la desviacin estndar se emplea como una medida para


comparar la dispersin de dos o mas conjuntos de observaciones.
Por ejemplo, se ha calculado que la desviacin estndar para las
cantidades quincenales invertidas en el plan de participacin de utilidades
de la empresa Dupree Paint Company es $7.51 dlares. Supngase que
estos empleados trabajan en el estado de Georgia (EUA).
Si la desviacin estndar para un grupo de empleados en Texas es $10.47,
y los valores medios son aproximadamente iguales, esto indica que las
sumas invertidas por los empleados en Georgia, no se dispersan tanto
como los empleados de Texas (porque $7.51 $10.47).
Como las cantidades invertidas en Georgia se acumulan ms hacia la
media, el valor medio para estos empleados es ms confiable que la
correspondiente al grupo de Texas.
Modelacin y Anlisis de
Riesgo

44
Ing. Hubert Gil Antelo

Teorema de Chebyshev

Se ha indicado que una desviacin estndar pequea para un conjunto de valores,


indica que los mismos se localizan cerca de la media.
Por el contrario, una desviacin con valor grande indica que las observaciones estn
lejos de la media..
El matemtico ruso P.L Chebyshev (1821-1894) desarroll un teorema que permite
determinar la proporcin mnima de los valores que se encuentran dentro de un
nmero especfico de desviaciones estndar con respecto a la media.
Por ejemplo, con base al Teorema de Chebyshev:
Por lo menos tres de cada cuatro valores, o 75%, deben encontrarse entre la
media ms dos desviaciones estndar y entre la media menos dos desviaciones
estndar. Esta relacin se aplica sin importar la forma de la distribucin.
Por lo menos ocho de cada nueve valores, o 88.9%, estara entre la media ms
tres desviaciones estndar y la media menos tres desviaciones estndar.
Al menos 24 de 25 valores, es decir, 96%, se encontrarn entre la media, ms y
menos, cinco desviaciones estndar.
Modelacin y Anlisis de
Riesgo

45
Ing. Hubert Gil Antelo

Teorema de Chebyshev

En trminos generales, el teorema de Chebyshev establece que:


TEOREMA DE CHEBYSHEV: Para un conjunto cualquiera de
observaciones (muestra o poblacin), la proporcin mnima de valores
que se encuentra dentro de k desviaciones estndar desde la media es
por lo menos 1 1/k2, donde k es una constante mayor que 1.
EJEMPLO: En el ejemplo anterior y su solucin, la media aritmtica de la
cantidad quincenal que depositan los empleados de la empresa Dupree
Paint en el plan de participacin de utilidades fue $51.54 dlares y se obtuvo
una desviacin estndar de $7.51. Al menos, Qu porcentaje de las
contribuciones se encuentra entre ms 3.5 desviaciones estndar y menos
3.5 desviaciones estndar, respecto a la media.
Respuesta: Aproximadamente el 92%.
1-

Modelacin y Anlisis de
Riesgo

1
2

3.5

1
0.92
12.5

46
Ing. Hubert Gil Antelo

Teorema de Chebyshev: Regla emprica


El teorema de Chebyshev se refiere a cualquier conjunto de valores, esto
es, la distribucin de los valores puede tomar cualquier forma.
Sin embargo, en una distribucin simtrica en forma de campana, se
obtiene mayor precisin al explicar la dispersin con respecto a la media.
Estas relaciones entre la desviacin estndar y la media constituyen la
llamada regla emprica, que algunas veces se conoce como regla
normal.
Regla emprica: En una distribucin de frecuencias simtrica, con forma
de campana, aproximadamente 68% de las observaciones estarn ms
una y menos una desviacin estndar desde la media; aproximadamente
el 95% de las observaciones se encontraran entre ms dos y menos dos
desviaciones estndar desde la media; prcticamente todas las
observaciones (99.7%) se hallaran entre ms tres y menos tres
desviaciones estndar desde la media.
Modelacin y Anlisis de
Riesgo

47
Ing. Hubert Gil Antelo

Teorema de Chebyshev: Regla emprica


Una regla emprica indica que en cualquier distribucin normal
las probabilidades delimitadas entre :
1 68 %

2 95 %
3 99 %

95%
68%
99%
68%
95%
-3

-2

Modelacin y Anlisis de
Riesgo

-1

99%
0
48

z
1

Teorema de Chebyshev: Regla emprica


Estas
relaciones
se
presentan en forma grfica,
para el caso de una
distribucin en forma de
campana, con media de 100,
y desviacin estndar de 10.
Si
X=100
y
S=10,
prcticamente todas las
observaciones se hallan
entre 100+3(10) y 100-3(10),
es decir entre 70 y 130.
Por lo tanto, la amplitud de
variacin es 60, que se
obtiene de 130-70.
Modelacin y Anlisis de
Riesgo

49

Dispersin relativa

Resulta imposible una comparacin directa de dos o ms medidas de


dispersin (por ejemplo, la desviacin estndar de una distribucin de
ingresos anuales y la desviacin estndar de una distribucin de
inasistencias, ambas del mismo grupo de empleados.)
Se puede decir que la desviacin estndar, $1.200 dlares de la
distribucin del ingreso es mayor que la desviacin estndar de 4.5 das de
la distribucin de faltas de asistencia?
Obviamente no es as, porque no podemos comparar directamente
dlares y das de inasistencia al trabajo.
A fin de realizar una comparacin significativa de la distribucin de ingresos
y las faltas, se necesita convertir cada una de esas medidas a un valor
relativo, es decir un porcentaje.
Karl Pearson (1857-1936), contribuy de manera importante a la ciencia
estadstica, y desarroll una medida relativa denominada coeficiente de
variacin (CV).
Modelacin y Anlisis de
Riesgo

50

Dispersin relativa

Es una medida muy til cuando:


I.
Los datos estn en unidades diferentes (como dlares y das de
inasistencia).
II. Los datos estn en las mismas unidades, pero los valores
medios estn muy distantes (como sucede con los ingresos de
ejecutivos superiores, y los ingresos de empleados no
calificados).
Coeficiente de variacin: Es la razn (cociente) de la desviacin
estndar y la media aritmtica, expresada como un porcentaje.
En trminos de una frmula para una muestra:

S
Coeficiente de variacin CV (100)
X
Modelacin y Anlisis de
Riesgo

51
Ing. Hubert Gil Antelo

Ejemplo

Un estudio sobre el monto de bonos pagados y los


aos de servicio de varios empleados, dio como
resultado los siguientes datos estadstico: la media
de los bonos pagados fue $200 dlares, y la
desviacin estndar fue $40. La media del nmero
de aos de servicio fue 20 aos, y la desviacin
estndar 2 aos. Compare las dispersiones
relativas de las dos distribuciones empleando el
coeficiente de variacin.
Las distribuciones estn en unidades diferentes
(dlares y aos de servicio). Por tanto se
convierten en coeficiente de variacin.
Se puede ver que existe mayor dispersin relativa
con respecto a la media en la distribucin de los
bonos pagados en comparacin con la distribucin
de los aos de servicio. (20% 10%).
Modelacin y Anlisis de
Riesgo

PARA LOS
BONOS:

CV

S
$40
(100)
(100) 20%
X
$20

PARA LOS AOS:


CV

S
2
(100) (100) 10%
X
10

52
Ing. Hubert Gil Antelo

Medidas de asimetra:
Tercer momento

Modelacin y Anlisis de
Riesgo

53
Ing. Hubert Gil Antelo

Asimetra

Anteriormente se describi numricamente la tendencia central de un conjunto de


observaciones mediante la moda, la media y la mediana.
En este captulo se describen varias medidas que muestran la magnitud de la
dispersin en un conjunto de datos, medida por la amplitud de variacin y la desviacin
estndar.
Otra caracterstica de un conjunto de datos es su forma. Son cuatro las formas que se
observan comnmente:
Simtrica
Positivamente asimtrica
Negativamente asimtrica
Bimodal
En un conjunto de datos simtrico de observaciones, la media y la mediana son
iguales y los valores de los datos se encuentran distribuidos uniformemente alrededor
de estos valores.
Los valores de los datos menores que la media y la mediana son una imagen en el
espejo de los que son mayores.
Modelacin y Anlisis de
Riesgo

54

Asimetra

Una distribucin es simtrica si la mitad


izquierda de su distribucin es la
imagen especular de su mitad derecha.
En las distribuciones simtricas media y
mediana coinciden. Si slo hay una
moda tambin coincide
La asimetra es positiva o negativa en
funcin de a qu lado se encuentra la
cola de la distribucin.
La media tiende a desplazarse hacia
las valores extremos (colas).
Las discrepancias entre las medidas de
centralizacin son indicacin de
asimetra.
Modelacin y Anlisis de
Riesgo

55

Asimetra
Un conjunto de valores es sesgado (o asimtrico) hacia la derecha o
positivamente asimtrico si hay un solo pico y los valores se encuentran
extendidos ms a la derecha del pico que hacia la izquierda.
En este caso la media es mayor que la mediana.
En una distribucin sesgada hacia la izquierda o negativamente
asimtrica hay un solo pico, pero las observaciones se encuentran ms
extendidas hacia la izquierda, en la direccin negativa, que hacia la
derecha.
En una distribucin negativamente asimtrica la media es menor que la
mediana.
Las distribuciones positivamente asimtricas son ms comunes. Los
salarios con frecuencia muestran este esquema.
Una distribucin bimodal puede tener dos o ms picos. Esto es, con
frecuencia, el caso cuando los valores provienen de dos o ms
poblaciones.
Modelacin y Anlisis de
Riesgo

56

Asimetra

Asimetra hacia la izquierda


Asimetra hacia la derecha
Modelacin y Anlisis de
Riesgo

57

Asimetra
En la literatura estadstica hay varias formulas que se usan para
calcular la asimetra. La ms simple, desarrollada por Karl Pearson,
se basa en la diferencia entre la media y la mediana.
Coeficiente de Asimetra de Pearson CA

3(Media - Mediana)
s

De acuerdo con esta relacin el coeficiente de asimetra puede variar


desde -3 hasta 3.
Un valor cercano a -3, como por ejemplo, -2,57, indica una
considerable asimetra negativa.
Un valor como 1,63, indica una asimetra positiva moderada. El
valor 0 que se presenta cuando la media y la mediana son
iguales, seala que la distribucin es simtrica y que no hay
ninguna asimetra.
Modelacin y Anlisis de
Riesgo

58

Asimetra

La mayora de los paquetes estadsticos utilizan la siguiente frmula:

n

Coeficiente de Asimetra de Pearson CA

(n - 1)(n - 2)

X X

La frmula anterior permite entender mejor la asimetra. El segundo miembro de la


frmula contiene la diferencia de cada valor respecto a la media, dividida entre la
desviacin estndar. Esto es la porcin (X-X)/s. A esto se llama estandarizacin.
Hay que observar que el resultado de esto es indicar la diferencia entre cada valor y
la media, en unidades de la desviacin estndar. Si esta diferencia es positiva, el
valor de que se trata es mayor que la media; si es negativa, es menor que la media.
Cuando se elevan al cubo estos valores, se conserva la informacin relativa al
sentido de la diferencia. Debe recordarse que la expresin de la desviacin estndar,
la diferencia entre cada valor y la media, se eleva al cuadrado, lo que da como
resultado que todos los valores son positivos.
Modelacin y Anlisis de
Riesgo

59

Asimetra
La mayora de los paquetes estadsticos utilizan la siguiente frmula:

n

Coeficiente de Asimetra de Pearson CA

(n - 1)(n - 2)

X X

Si el conjunto de valores que se considera es simtrico, al elevar al cubo


los valores estandarizados y sumarlos se obtendr un resultado cercano
a cero.
Si hay varios valores grandes, claramente alejados de los otros, la suma
de las diferencias al cubo ser un valor positivo grande. Varios valores
mucho ms pequeos darn como resultado una suma de cubos
negativa.

Modelacin y Anlisis de
Riesgo

60

Medidas de curtosis:
Cuarto momento

Modelacin y Anlisis de
Riesgo

61

Curtosis

La curtosis es una medida de la concentracin de la distribucin en torno a


su media.
La curtosis nos indica el grado de apuntamiento (aplastamiento) de una
distribucin con respecto a la distribucin normal o gaussiana. Es
adimensional.
Platicrtica: curtosis < 0
Mesocrtica: curtosis = 0
Leptocrtica: curtosis > 0
Su frmula es:
n
n(n 1)
xi x
K

(n 1)(n 2)(n 3) i 1

3(n 1) 2

(n 2)(n 3)

Si K es positiva, la distribucin tiene una concentracin superior a la de una


curva normal. Si es negativa, ocurre lo contrario.
Modelacin y Anlisis de
Riesgo

62

Curtosis
160

Los grficos que se ven


poseen la misma media y
desviacin tpica, pero con
diferente
grado
de
apuntamiento.

140

120

100

Frecuencia

80

400

60

40

300

45 48 51 54 57 60 63 66 69 72 75 78 81 84

Platicrtica
300
200

200

Frecuencia

Frecuencia

100

100

0
3

27
16

37
32

47
42

57
52

67
62

77
72

87
82

97
92

108

27

102 138

37
32

Leptocrtica

Modelacin y Anlisis de
Riesgo

0
45
41

Mesocrtica

63

53
49

61
57

69
65

77
73

85
81

93
89

99

Otras medidas de dispersin

La desviacin estndar es la medida de dispersin que se utiliza con


mayor frecuencia. Sin embargo, existen otros mtodos para describir la
variacin o dispersin de un conjunto de datos.
Un mtodo es determinar la ubicacin de los valores que dividen un
conjunto de observaciones en partes iguales. Estas medidas son los
cuartiles, los deciles y los centiles (o percentiles).
Los cuartiles dividen un conjunto de observaciones en cuatro partes
iguales.
Para explicarlo con mayor claridad, considere cualquier conjunto de valores
organizados del mnimo al mximo. La mediana al valor central de un
conjunto de datos organizados de menor a mayor. Esto es, 50% de las
observaciones son mayores a la mediana y 50% son menores.
25%

25%

Q1
Modelacin y Anlisis de
Riesgo

25%

Q2
64

25%

Q3

Otras medidas de dispersin

En forma similar, los cuartiles dividen un conjunto de observaciones en cuatro


partes iguales.
El primer cuartil, generalmente simbolizado como Q1, es el valor abajo del
cual se encuentra 25% de las observaciones, y el tercer cuartil,
comnmente designado por Q3, es el valor por abajo del cual se encuentra
75% de las observaciones.
Lgicamente, Q2 (el segundo cuartil) es la mediana.
Los valores que corresponden a Q1, Q2 y Q3 dividen a un conjunto de datos
en cuatro partes iguales.
En forma similar, los deciles dividen a un conjunto de observaciones en 10
partes iguales, y los centiles en 100 partes iguales. Por tanto, si un alumno se
entera que su promedio de calificaciones escolares se encuentra en el octavo
decil del resultado escolar de su universidad, puede concluir que 80% de los
estudiantes tienen un promedio menor al suyo, y 20% tienen un promedio mayor.
Modelacin y Anlisis de
Riesgo

65

Otras medidas de dispersin

Ejemplos
El 5% de los recin nacidos tiene un peso demasiado bajo. Qu peso se considera demasiado
bajo?
Percentil 5
Qu peso es superado slo por el 25% de los individuos?
Percentil 75
El colesterol se distribuye simtricamente en la poblacin. Se considera patolgico los valores
extremos. El 90% de los individuos son normales Entre qu valores se encuentran los individuos
normales?
Entre el percentil 5 y el 95
Entre qu valores se encuentran la mitad de los individuos ms normales de una poblacin?
Entre el cuartil 1 y 3
Supongamos que el 78% de los resultados del GMAT es menor o igual a 600 puntos. Entonces,
600 es el percentil 78 de la distribucin.
78% de todos los resultados

200
Modelacin y Anlisis de
Riesgo

66

22%

600

800

Otras medidas de dispersin

Ejemplos:
Qu peso no llega a alcanzar el 25% de los
individuos?
Primer cuartil = percentil 25 = 60 Kg.
Qu peso es superado por el 25% de los
individuos?
Tercer cuartil = percentil 75= 80 Kg.
Entre qu valores se encuentra el 50% de los
individuos con un peso ms normal?
Entre el primer y tercer cuartil = entre 60 y
80 Kg.
Observar que indica cmo de dispersos estn los
individuos que ocupan la parte central de la
muestra. (rango intercuartlico).
Modelacin y Anlisis de
Riesgo

67

50%
% 25% %
%
5
2
25
25

Você também pode gostar