Escolar Documentos
Profissional Documentos
Cultura Documentos
Modelacin y Anlisis de
Riesgo
Modelacin y Anlisis de
Riesgo
Por qu Estadstica?
En reuniones sociales una persona puede decir que es mdico y los concurrentes empiezan
con dolores y tratan de obtener una consulta gratuita.
Si dice que es matemtico, por qu estudiaste algo tan difcil?, y lo miran con esa mezcla de
admiracin, horror y respeto con que se mira a un brujo.
Si dice que es estadstico, sigue a sus palabras un silencio profundo. El motivo de este
silencio puede deberse a muchas razones: ignorancia.
Algo de historia:
Los eruditos del siglo XVII demostraron especial inters por la Estadstica Demogrfica como
resultado de la especulacin sobre si la poblacin aumentaba, decreca o permaneca esttica.
En los tiempos modernos tales mtodos fueron resucitados por algunos reyes que necesitaban
conocer las riquezas monetarias y el potencial humano de sus respectivos pases.
El primer empleo de los datos estadsticos para fines ajenos a la poltica tuvo lugar en 1691 y
estuvo a cargo de Gaspar Neumann, un profesor alemn. Este investigador se propuso destruir la
antigua creencia popular de que en los aos terminados en siete mora ms gente que en los
restantes, y para lograrlo hurg pacientemente en los archivos parroquiales de la ciudad. Despus
de revisar miles de partidas de defuncin pudo demostrar que en tales aos no fallecan ms
personas que en los dems.
Modelacin y Anlisis de
Riesgo
7
Ing. Hubert Gil Antelo
El oscurantismo matemtico
Para muchos no hay nada ms aterrador que el recuerdo de una clase de matemtica.
La matemtica ha sido manejada con excesivo rigor, muy similar a la poca en la que
se hablaba en latn para que todos pudieran entenderlo. Aquella fue una poca de
oscurantismo. Y en la matemtica ocurre igual, muchos huyen de ella debido a los
sacerdotes del oscurantismo matemtico.
Y esta realidad deja muchas veces daos difciles de reparar en quienes en edad
temprana vivieron experiencias traumticas, trabajar con quebrados, resolver
cincuenta mil ejercicios de factores, aprender de memoria mtodos y formulas
inventadas hace mil aos.
La matemtica desmitificada puede convertirse en una fuente de creatividad
inagotable que puede ayudar a entender complejas interrelaciones entre los elementos
de un mundo sistmico.
Para acabar con el oscurantismo matemtico hay que quitarle el halo de misterio que
rodea a las nmeros, formulas, teoremas y principios matemticos.
Se los debe despojar de tanto formalismo. Hay que volverlos simples.
Modelacin y Anlisis de
Riesgo
Datos e informacin
Las buenas decisiones de hoy en da son conducidas por datos.
En todos los aspectos de nuestras vidas, y ms an en el mundo de los de los negocios,
una diversidad asombrosa de datos est disponible para el reconocimiento y la
aproximacin analtica.
10
11
12
Al final, se sabe que el modelo no puede predecir el futuro, y es tan limitado como efectivos
hayan sido los cuatro pasos anteriores.
Modelacin y Anlisis de
Riesgo
13
Estadstica descriptiva
Para comenzar, es conveniente tener en cuenta que la decisiones que se toman
a todo nivel dependen de la escala de conocimientos e informacin que se tenga,
y de acuerdo con ellos, el proceso de toma de decisiones se puede clasificar en:
Decisiones en condiciones de certidumbre
Decisiones en condiciones de riesgo y certidumbre
Decisiones en condiciones de incertidumbre total
14
Estadstica descriptiva
A lo largo del curso se analizaran el segundo grupo de decisiones por lo
que es importante el manejo bsico de probabilidades y algunos
conceptos estadsticos.
En condiciones de riesgo los criterios de decisin se basan en dos
posibilidades:
Maximizar el valor esperado (mayores ingresos)
Minimizar la prdida esperada (menores costos)
15
Estadstica descriptiva
As, es necesario asegurar el conocimiento de una serie de conceptos
estadsticos fundamentales, los que gracias al extensivo uso de las hojas
de clculo son muy fciles de trabajar y calcular.
Para ello, en lugar de hace nfasis en la forma de hacer los cmputos
matemticos, se presentan los conceptos aplicados en una serie de
ejemplos, a fin de practicar las diferentes funciones del Microsoft Excel, y
con ello facilitar su comprensin y utilizacin.
Todo ello sin perder de vista la importancia de manejar el concepto bsico.
16
Estadstica descriptiva
Por ejemplo, un meteorlogo interesado en pronosticar el estado del tiempo, puede
analizar el comportamiento histrico del clima de la regin, y recopilar informacin
importante tal como: temperatura, imgenes satelitales, humedad relativa, corrientes
de viento, etc.
El anlisis integrado le permitir hacer un pronostico educado (aunque no por ello exacto) de
lo que podr ocurrir en las prximas horas, incluso das.
17
Medidas estadsticas
Modelacin y Anlisis de
Riesgo
18
Modelacin y Anlisis de
Riesgo
19
Modelacin y Anlisis de
Riesgo
20
Media poblacional
Muchos estudios utilizan todos los valores de una poblacin.
Si se reporta que la calificacin promedio en el examen de admisin de la
Universidad de Florida, en otoo del 2000, es de 19,6; ste es un ejemplo
de una media poblacional porque se tienen las puntuaciones de todos los
estudiantes que ingresaron en esa poca.
La media poblacional de datos sin procesar, datos que no han sido
agrupados en una distribucin de frecuencias o en una representacin de
tallo y hoja, es la suma de todos los valores de la poblacin, dividida entre
el nmero total de dichos datos.
Para calcular la media de una poblacin se utiliza la siguiente frmula:
Suma de todos los valores de l a poblacin
Media poblacional
Nmero de valores en la poblacin
Modelacin y Anlisis de
Riesgo
21
Media poblacional
En vez de expresar con palabras las instrucciones completas para calcular
la media poblacional (o cualquier otra medida), es ms conveniente utilizar
los smbolos matemticos.
La media aritmtica de una poblacin, usando smbolos matemticos, es:
X
Donde:
N
representa la media de la poblacin. Es la letra griega mu minuscula.
N es el nmero total de elementos en la poblacin.
X representa cualquier valor en particular.
es la letra griega sigma mayscula, indica la operacin de sumar.
X simboliza la suma de todos los valores X.
Cualquier caracterstica medible de una poblacin se denomina parmetro.
La medida de una poblacin es un parmetro.
Modelacin y Anlisis de
Riesgo
22
Media muestral
Con frecuencia se selecciona una muestra de la poblacin, con objeto de
evaluar algo acerca de una caracterstica especfica de la poblacin.
Por ejemplo, un departamento de control de calidad necesita tener la
seguridad de que el dimetro exterior de un repuesto que se esta
produciendo, es aceptable.
Resultara muy costoso y tardado verificar el dimetro exterior de todos
los repuestos que se producen.
Por tanto, podra seleccionarse una muestra de 5 repuestos y calcular el
dimetro exterior promedio de los mismos para estimar el dimetro de
todos los repuestos que se producen.
Para datos a granel, es decir, no agrupados, la media muestral es la
suma de todos los valores dividida entre el total de los mismos.
Modelacin y Anlisis de
Riesgo
23
Media muestral
Para encontrar la media de una muestra se tiene:
Media muestral
X
n
Modelacin y Anlisis de
Riesgo
25
26
La mediana
Ya se seal que para datos que contienen uno o dos valores muy grandes o muy
pequeos, la media aritmtica puede no ser representativa.
El punto central de tales datos puede describirse mejor utilizando una medida de
tendencia central denominada mediana.
Para ilustrar la necesidad de una medida de esa naturaleza, que no sea la media
aritmtica, suponga que quiere adquirir un condominio en Palm Beach. Su agente de
bienes races le indic que el precio promedio de las unidades disponibles en este
momento es de $110.000 dlares. De todas formas querra usted considerar lo
anterior?
Si tuviera un presupuesto mximo entre $60.000 y $75.000, podra pensar que est
fuera de sus posibilidades. Sin embargo, al verificar los precios individuales de los
condominios podra cambiar de idea.
Los precios son de $60.000, $65.000, $70.000, $80.000, y un penthouse muy lujoso
cuesta $275.000. La media aritmtica del precio es $110.000 segn lo indic el
agente de bienes races, pero un valor de $275.000 est haciendo que la media
aritmtica se incline hacia arriba, por lo que el promedio no es representativo.
Parecera que un precio entre $65.000 y $75.000 es un promedio ms tpico o
representativo, y de hecho lo es. En casos como este, la mediana proporciona una
medida de tendencia central ms exacta.
Modelacin y Anlisis de
Riesgo
27
La mediana
Mediana. Es el valor que corresponde al punto medio de los valores
despus de ordenarlos de menor a mayor, o de mayor a menor. Cincuenta
por ciento de las observaciones son mayores que la mediana, y 50% son
menores que ella.
La mediana del precio de las unidades disponibles es de $70.000. Para
determinar esto, los precios se ordenaron de menor ($60.000) a mayor
($275.000), y se seleccin el valor intermedio ($70.000).
Precios ordenados
de menor a mayor
Precios ordenados
de mayor a menor
$60.000
$275.000
$65.000
$80.000
$70.000
MEDIANA
$70.000
$80.000
$65.000
$275.000
$60.000
Modelacin y Anlisis de
Riesgo
28
La mediana
Observe que existe el mismo nmero de precios por debajo de la
mediana de $70.000, que por arriba. Por tanto la mediana no es
afectada por observaciones extremadamente bajas o muy altas.
Si el precio ms elevado hubiera sido $90.000, o bien $300.000, o
hasta de 1 milln de dlares, la mediana de los precios seguira siendo
$70.000. De manera semejante, si el precio ms bajo hubiera sido
$20.000 o bien $50.000, la mediana seguira siendo $70.000.
En el ejemplo anterior hay un nmero impar de observaciones (cinco).
Cmo se determina la mediana cuando el nmero de observaciones
es par?
Como antes, se ordenan los valores. Despus, lo que se acostumbra es
calcular la media aritmtica de las dos observaciones centrales.
Observe que cuando el nmero de observaciones es par, puede no ser
uno de los valores dados.
Modelacin y Anlisis de
Riesgo
29
Propiedades de la mediana
30
La moda
31
Ejemplo
Sueldo
Estado
Sueldo
Estado
Sueldo
Arizona
35.000
Illinois
58.000
Ohio
50.000
California
49.100
Lousiana
60.000
Tennessee
60.000
Colorado
60.000
Maryland
60.000
Texas
71.400
Florida
60.000
Massachussets
40.000
West Virginia
60.000
Idaho
40.000
New Yrsey
65.000
Wyoming
55.000
Una revisin de las cantidades revela que el sueldo anual de $60.000 dlares
aparece con mayor frecuencia (seis veces) que cualquier otra percepcin. Por
tanto, la moda es $60.000.
En resumen, se puede determinar la moda para datos de cualquiera de los
niveles nominal, ordinal, de intervalo y de razn.
La moda tambin tiene la ventaja de no verse afectado por valores
extremadamente altos o muy bajos. Al igual que la mediana, puede utilizarse
como
medida
de detendencia central en distribuciones
con clases de extremo.
32
Modelacin
y Anlisis
Riesgo
Desventajas de la moda
Sin embargo, la moda tiene algunas desventajas, y esto hace que
utilice con menos frecuencia que la media o la mediana.
En muchos conjuntos de datos no hay valor modal, porque
ningn valor aparece ms de una vez.
Por ejemplo, en el siguiente conjunto de datos no hay moda: $19,
$21, $23, $20 y $18. Puesto que cada valor es diferente, podra
argumentarse que cada valor es modal.
Por el contrario, en ciertos conjuntos de datos hay ms de una
moda. Supngase que las edades en un grupo de individuos son
22, 26, 27, 27, 31, 35 y 35. Tanto 27 como 35 son edades
modales. Por tanto, este conjunto de edades se denomina
bimodal (ya que hay dos modas).
Sera cuestionable utilizar los dos valores de moda para
representar la tendencia central de este conjunto de datos de
edades.
Modelacin y Anlisis de
Riesgo
33
Ing. Hubert Gil Antelo
Medidas de dispersin:
Segundo momento
Modelacin y Anlisis de
Riesgo
34
Ing. Hubert Gil Antelo
Modelacin y Anlisis de
Riesgo
35
Modelacin y Anlisis de
Riesgo
36
Ing. Hubert Gil Antelo
Modelacin y Anlisis de
Riesgo
37
Ing. Hubert Gil Antelo
38
Ing. Hubert Gil Antelo
39
Ing. Hubert Gil Antelo
2
(
X
Donde:
2
es el smbolo de la varianza de una poblacin ( es la
letra griega sigma minscula. Se expresa comnmente como
sigma cuadrado.
Xes el valor de una observacin en la poblacin.
es la media aritmtica de la poblacin.
N
es el nmero total de observaciones de la poblacin.
Modelacin y Anlisis de
Riesgo
40
Ing. Hubert Gil Antelo
(x )
i 1
41
Ing. Hubert Gil Antelo
Varianza muestral
La formula de la varianza muestral ha sufrido una ligera modificacin en
el denominador. En lugar de introducir n (nmero en la muestra) en vez
de N (nmero de la poblacin), el denominador se hace igual a n 1.
Donde:
S2
X
X
N
s2
2
( xi x )
n 1
Modelacin y Anlisis de
Riesgo
42
Ing. Hubert Gil Antelo
( X )
X
n
Modelacin y Anlisis de
Riesgo
n 1
43
Ing. Hubert Gil Antelo
44
Ing. Hubert Gil Antelo
Teorema de Chebyshev
45
Ing. Hubert Gil Antelo
Teorema de Chebyshev
Modelacin y Anlisis de
Riesgo
1
2
3.5
1
0.92
12.5
46
Ing. Hubert Gil Antelo
47
Ing. Hubert Gil Antelo
2 95 %
3 99 %
95%
68%
99%
68%
95%
-3
-2
Modelacin y Anlisis de
Riesgo
-1
99%
0
48
z
1
49
Dispersin relativa
50
Dispersin relativa
S
Coeficiente de variacin CV (100)
X
Modelacin y Anlisis de
Riesgo
51
Ing. Hubert Gil Antelo
Ejemplo
PARA LOS
BONOS:
CV
S
$40
(100)
(100) 20%
X
$20
S
2
(100) (100) 10%
X
10
52
Ing. Hubert Gil Antelo
Medidas de asimetra:
Tercer momento
Modelacin y Anlisis de
Riesgo
53
Ing. Hubert Gil Antelo
Asimetra
54
Asimetra
55
Asimetra
Un conjunto de valores es sesgado (o asimtrico) hacia la derecha o
positivamente asimtrico si hay un solo pico y los valores se encuentran
extendidos ms a la derecha del pico que hacia la izquierda.
En este caso la media es mayor que la mediana.
En una distribucin sesgada hacia la izquierda o negativamente
asimtrica hay un solo pico, pero las observaciones se encuentran ms
extendidas hacia la izquierda, en la direccin negativa, que hacia la
derecha.
En una distribucin negativamente asimtrica la media es menor que la
mediana.
Las distribuciones positivamente asimtricas son ms comunes. Los
salarios con frecuencia muestran este esquema.
Una distribucin bimodal puede tener dos o ms picos. Esto es, con
frecuencia, el caso cuando los valores provienen de dos o ms
poblaciones.
Modelacin y Anlisis de
Riesgo
56
Asimetra
57
Asimetra
En la literatura estadstica hay varias formulas que se usan para
calcular la asimetra. La ms simple, desarrollada por Karl Pearson,
se basa en la diferencia entre la media y la mediana.
Coeficiente de Asimetra de Pearson CA
3(Media - Mediana)
s
58
Asimetra
n
Coeficiente de Asimetra de Pearson CA
(n - 1)(n - 2)
X X
59
Asimetra
La mayora de los paquetes estadsticos utilizan la siguiente frmula:
n
Coeficiente de Asimetra de Pearson CA
(n - 1)(n - 2)
X X
Modelacin y Anlisis de
Riesgo
60
Medidas de curtosis:
Cuarto momento
Modelacin y Anlisis de
Riesgo
61
Curtosis
(n 1)(n 2)(n 3) i 1
3(n 1) 2
(n 2)(n 3)
62
Curtosis
160
140
120
100
Frecuencia
80
400
60
40
300
45 48 51 54 57 60 63 66 69 72 75 78 81 84
Platicrtica
300
200
200
Frecuencia
Frecuencia
100
100
0
3
27
16
37
32
47
42
57
52
67
62
77
72
87
82
97
92
108
27
102 138
37
32
Leptocrtica
Modelacin y Anlisis de
Riesgo
0
45
41
Mesocrtica
63
53
49
61
57
69
65
77
73
85
81
93
89
99
25%
Q1
Modelacin y Anlisis de
Riesgo
25%
Q2
64
25%
Q3
65
Ejemplos
El 5% de los recin nacidos tiene un peso demasiado bajo. Qu peso se considera demasiado
bajo?
Percentil 5
Qu peso es superado slo por el 25% de los individuos?
Percentil 75
El colesterol se distribuye simtricamente en la poblacin. Se considera patolgico los valores
extremos. El 90% de los individuos son normales Entre qu valores se encuentran los individuos
normales?
Entre el percentil 5 y el 95
Entre qu valores se encuentran la mitad de los individuos ms normales de una poblacin?
Entre el cuartil 1 y 3
Supongamos que el 78% de los resultados del GMAT es menor o igual a 600 puntos. Entonces,
600 es el percentil 78 de la distribucin.
78% de todos los resultados
200
Modelacin y Anlisis de
Riesgo
66
22%
600
800
Ejemplos:
Qu peso no llega a alcanzar el 25% de los
individuos?
Primer cuartil = percentil 25 = 60 Kg.
Qu peso es superado por el 25% de los
individuos?
Tercer cuartil = percentil 75= 80 Kg.
Entre qu valores se encuentra el 50% de los
individuos con un peso ms normal?
Entre el primer y tercer cuartil = entre 60 y
80 Kg.
Observar que indica cmo de dispersos estn los
individuos que ocupan la parte central de la
muestra. (rango intercuartlico).
Modelacin y Anlisis de
Riesgo
67
50%
% 25% %
%
5
2
25
25