Escolar Documentos
Profissional Documentos
Cultura Documentos
Trabajo presentado para el XII Premio de Investigacin sobre Seguros y Fianzas 2005, Mtro. Juan Carlos Vargas Aguilar Jaguar
XII
NDICE
RESEA INTRODUCCIN CAPTULO 1 1.1 1.2 1.3 1.4 ESTADSTICA DESCRIPTIVA . . 1 3 5 5 5 6 6 6 6 7 7 8 8 8 8 8 9 9 9 9 9 9 10 10 10 11 11 11 11 11 12 12
Estadstica Descriptiva e Inferencia Estadstica Poblacin y Muestra Tipo de Datos Distribucin de Frecuencias 1.4.1 Tabla de Distribucin de Frecuencias 1.4.2 Intervalos de Clase 1.4.2.1 1.4.2.2 1.4.2.3 1.4.2.4 Lmites Nominales de Clase Fronteras de Clase Longitud de la Clase (c) Marca de Clase (xi)
1.4.3 Frecuencia (fi) 1.4.4 Frecuencia Acumulada (Fi) 1.4.5 Frecuencia Relativa (fi*) 1.4.6 Frecuencia Relativa Acumulada (Fi*) 1.5 Descripcin Grafica de los Datos 1.5.1 Histograma de Frecuencias 1.5.2 Polgono de Frecuencias 1.5.3 Curvas de Frecuencias 1.5.4 Ojiva 1.6 Medidas Numricas Descriptivas 1.6.1 Medidas de Tendencia Central 1.6.1.1 1.6.1.2 1.6.1.3 1.6.2.1 1.6.2.2 1.6.2.3 1.6.2.4 Media Aritmtica Mediana Moda Rango Varianza Desviacin Estndar
1.7 2.1
Ejemplo de Estadstica Descriptiva Definiciones Bsicas de Probabilidad 2.1.1 Definicin Clsica de Probabilidad 2.1.2 Definicin Emprica de Probabilidad 2.1.3 Definicin Subjetiva de Probabilidad
12 17 17 17 18 18 18 23 24 25 27 27 27 28 28 28 29 30 31 31 33 34 36 38 38
CAPTULO 2
DISTRIBUCIONES DE PROBABILIDAD
Distribuciones de Probabilidad de Variables Aleatorias Discretas Distribuciones de Probabilidad de Variables Aleatorias Continuas Valor Medio y Varianza de Distribucin 2.6.1 Valor Medio de una Distribucin 2.6.2 Varianza de una Distribucin
. . DE PROBABILIDAD
2.7
Algunas Distribuciones de Probabilidad 2.7.1 Distribuciones Discretas 2.7.1.1 2.7.1.2 2.7.1.3 2.7.2.1 2.7.2.2 2.7.2.3 2.7.2.4 2.7.2.5 2.7.2.6 Distribucin Binomial Distribucin de Poisson
Distribucin Hipergeomtrica Distribucin Normal Distribucin Uniforme Distribucin Gama Distribucin de Weibull Distribucin Beta DE
CAPTULO 3
ESTIMACIN
PARA DATOS EMPRICOS Y LA DETERMINACIN DEL TAMAO DE MUESTRA 3.1 40 40 41 41 Estimacin de la Distribucin de Probabilidad para Datos Empricos 3.1.1 Representacin de la Distribucin de Probabilidad de los Datos Empricos 3.1.1.1 3.1.1.2 Mtodo del Rango Mediano para la Estimacin de la Distribucin de Probabilidad para Muestras Pequeas Mtodo de Frecuencias Relevantes para la Estimacin de la
ii
Distribucin de Probabilidad 3.1.2 Seleccin de la Distribucin de Probabilidad Terica una Distribucin de Probabilidad 3.1.4.1
42 44 44 45 47 47 49 51 52 53 55 55 55 57 57 58 60 61 62
3.1.3 Mtodo de los Momentos para la Estimacin de Parmetros de 3.1.4 Introduccin a las Pruebas de Hiptesis Estadsticas Pruebas de Bondad de Ajuste 3.1.4.1.1 3.1.4.1.2 3.2
3.2.1 Determinacin del Tamao de Muestra Requerido para 3.2.2 Determinacin del Tamao de Muestra Requerido para la Estimacin CAPTULO 4 4.1 4.2 4.3 4.4 4.5 4.6 4.7 4.8 SIMULACIN
Mtodo Congruencial Mixto para la Generacin de Nmeros Aleatorios con Distribucin Uniforme en el Intervalo (0,1) Mtodo de la Transformada Inversa para la Generacin de Variables Aleatorias NoUniformes Notacin Utilizada en Teora de Colas
CAPTULO 5
CASO PRCTICO: DETERMINACIN DE LAS CUOTAS DE TARIFA PARA EL SEGURO DE RESPONSABILIDAD CIVIL AGENTES DE SEGUROS (PERSONAS FSICAS)1 64 67 67 67 68 68
i. CARACTERSTICAS GENERALES DEL PLAN i.1 i.2 i.3 i.4 Nombre Comercial del Plan Descripcin de la Cobertura Bsica Temporalidad del Plan Operacin y Ramo en el que se Registrar
iii
ii. HIPTESIS ESTADSTICAS Y FINANCIERAS ii.1 ii.2 Hiptesis Estadsticas Hiptesis Financieras ii.2.1 Utilidad Tcnica iii. PROCEDIMIENTOS TCNICOS iii.1 iii.2 iii.3 iii.4 Gastos de Administracin Gastos de Adquisicin Gastos Totales Simulacin Estocstica iii.4.1 Definicin del Sistema iii.4.2 Anlisis de Datos iii.4.2.1 iii.4.2.2
68 68 69 69 69 69 69 69 69 70 70
Estimar la Distribucin de Probabilidad del Volumen de Prima Intermediada por Agente 70 Estimar la Distribucin de Probabilidad Emprica de los Siniestros Utilizando el Mtodo del Rango Mediano para Muestras Pequeas 72 74 75 75 76 76
iii.4.2.3
Generacin de Carteras del Seguro de Responsabilidad Civil Agentes de Seguros (Personas Fsicas) Utilizando Simulacin Estocstica 77 78 79 80 82 85 89 92 93
iii.4.6 Interpretacin de los Resultados iii.5 Procedimientos para el Clculo de Cuotas iii.5.1 Clculo de Cuotas sin Deducible iii.5.2 Clculo de Cuotas con Deducible ANEXO DE NOTA TCNICA 1 ANEXO DE NOTA TCNICA 2 ANEXO ELECTRNICO
CONCLUSIONES Y RECOMENDACIONES
iv
95 96
RESEA Ttulo:
Uso de la Estimacin de la Distribucin de Probabilidad para Muestras Pequeas y de la Simulacin en la Inferencia de Carteras de Seguros.
Factores para impulsar el desarrollo de la industria del seguro en Estudio relacionado con: Mxico. Sin duda, el uso de nuevas tecnologas y tcnicas matemticas han sido algunos de los factores que han fomentado el desarrollo del seguro en Mxico en particular y en el mundo en general. Por esta razn, se inscribe este estudio que se relaciona con el tema sealado en el prrafo anterior, ya que ste aporta una metodologa novedosa que conjunta tcnicas de confiabilidad y de simulacin que a su vez permiten trabajar con pocos datos y en base en estos realizar inferencias positivas. Para las entidades aseguradoras laborar con muestras pequeas es una situacin cada vez ms comn, ya que ante las innovadoras necesidades de proteccin; planear, tomar decisiones o calcular tarifas de riesgos de los cuales se tiene poca informacin se vuelve una tarea compleja.
Objetivos:
Objetivo General Mostrar las ventajas del uso de las tcnicas de estimacin de distribuciones empricas para muestras pequeas y de la simulacin en la inferencia de carteras de seguros. Aportando as, un mtodo para hacer inferencias de la cartera a pesar de que los datos de sta no cumplan el supuesto de provenir de una muestra suficientemente grande. Finalmente, ilustrar la aplicacin de la metodologa propuesta mediante un ejemplo en el que se determina la cuota base para el seguro de Responsabilidad Civil Agentes de Seguros. Objetivos Particulares Presentar a los elementos necesarios que emplea la tcnica propuesta por este trabajo: Estadstica descriptiva. Distribuciones de probabilidad para variables aleatorias discretas y continuas. Construccin de distribuciones empricas para muestras pequeas. Pruebas de bondad de ajuste. Determinacin del tamao de muestra. Modelado de sistemas. Simulacin. Ilustrar la metodologa propuesta mediante un caso prctico.
La probabilidad emprica o ley de los grandes nmeros, uno de los conceptos ms fuertes en la teora del seguro, asume la existencia de una muestra suficientemente grande pero, cmo debe proceder el asegurador cuando su informacin estadstica es insuficiente? o cmo corregir sta deficiencia para hacer inferencias que causen impacto positivo en la toma de decisiones o en la elaboracin de tarifas de seguros? El presente trabajo representa una alternativa de solucin a la problemtica detallada en el punto anterior, permitiendo el desarrollo de inferencias positivas en la toma de decisiones o en la elaboracin de tarifas de seguros. En este material se incluye un anexo electrnico el cual facilita lector entender la metodologa propuesta, este anexo contiene archivo que el autor emple para determinar la cuota base para seguro de Responsabilidad Civil Agentes de Seguros utilizando tcnica planteada por este trabajo. al el el la
El uso de nuevos mtodos, tcnicas y tecnologas, es sin duda el umbral de acceso futuro de la denominada matemtica del seguro. El autor.
INTRODUCCIN
Da a da en el campo del seguro surgen nuevas necesidades de proteccin, mismas que provocan que quienes laboran en esta industria tengan que trabajar con pocos datos y con base en stos estudiar los riesgos a cubrir, tomar decisiones, planear y calcular tarifas que permitan determinar el costo o la prima del seguro en cuestin. Sin embargo, si los profesionistas del seguro no utilizan bases tcnicas para obtener el mejor provecho de estos datos insuficientes, el seguro se convierte en un juego de azar que puede colapsar la estabilidad financiera de la empresa y consecuentemente impedir las obligaciones de sta con el pblico usuario de estos servicios. En busca de dar solucin a la problemtica antes mencionada se elabora la presente tesis que conjunta el uso de dos tcnicas, la estimacin de la distribucin de probabilidad para muestras pequeas primero, y la simulacin de eventos discretos despus, mismas que permiten la elaboracin de inferencias de carteras de seguros que causen impacto positivo a las entidades aseguradoras. Previo a la realizacin de esta tesis, se observ que en nuestro pas no existen escritos acerca de la aplicacin de estos mtodos en los campos del seguro, por lo que con el fin de hacer este trabajo accesible al mayor nmero de profesionistas del seguro, as como a los estudiantes de este tipo de tcnicas, se decidi que este trabajo se desarrollara de manera gradual; tratando que los conceptos y los mtodos sean claros y concisos, apoyndose en algunos casos en la exposicin de ejemplos. Este escrito se divide en cinco captulos, en el primero se estudiar la coleccin, la agrupacin y el anlisis previo de datos, es decir lo que se conoce como estadstica descriptiva. En el segundo captulo se hablar de la probabilidad, de las variables aleatorias y finalmente de las distribuciones de probabilidad, ya que sera muy difcil utilizarlas sin saber qu son.2 En el tercer captulo se estudiar el mtodo del rango mediano; ya que ste permite estimar una distribucin de probabilidad a partir de un conjunto de datos pequeo o limitado; y se mostrarn el uso de dos pruebas importantes en estadstica que permiten comprobar la bondad de los ajustes de las distribuciones estimadas por este mtodo; adems se estudiar cmo determinar el tamao de muestra ya que la simulacin es una metodologa que realiza experimentos de muestreo mediante un modelo del sistema. En el cuarto captulo se hablar del modelado de sistemas y de la simulacin de eventos discretos. En el quinto captulo se ejemplificar la metodologa propuesta que adems se conjunta con la matemtica del seguro mediante la elaboracin de una nota tcnica, en la que se determinarn las cuotas base para el seguro de responsabilidad civil agentes de seguros (personas fsicas); producto del cual existe o exista muy poca informacin estadstica y que adems que en aos anteriores a que se volviera un seguro obligatorio se observaba la falta de homogeneidad en el sector respecto a los precios calculados por diferentes compaas, lo que pone en tela de juicio las metodologas utilizadas por stas para calcular sus tarifas ante la carencia de datos.
El lector que posea conocimientos previos de los dos primeros captulos de este trabajo, podr pasar al captulo 3 sin prdida de generalidad.
Finalmente, se realizarn las conclusiones de esta tesis. Por lo tanto, este trabajo desea mostrar de manera gradual, clara y concisa las ventajas del uso de la estimacin de distribuciones empricas para muestras pequeas y de la simulacin en carteras de seguros. Aportando as, un mtodo para hacer inferencias de la cartera a pesar de que los datos de sta no cumplan el supuesto de provenir de una muestra suficientemente grande.
1.1
La estadstica descriptiva comprende las tcnicas que se emplean para resumir y describir datos numricos.4 Estos mtodos pueden ser grficos o implicar el clculo de medidas numricas. La inferencia estadstica trata de generalizaciones basadas en muestras de datos.5
1.2
Poblacin y Muestra
Antes de estudiar descripciones estadsticas particulares, permitamos hacer la siguiente diferencia. La poblacin es la coleccin de toda la posible informacin que caracteriza un fenmeno. En estadstica, la poblacin es un concepto mucho ms general del que tiene la acepcin comn de esta palabra. En este sentido, una poblacin es cualquier coleccin ya sea de un nmero finito de mediciones o una coleccin grande, virtualmente infinita, de datos acerca de algo de inters. Por otro lado, la muestra es un subconjunto representativo seleccionado de una poblacin.6 Poblacin Tamao N Muestra Tamao n
n<N
3 4
5 6
Algunas tcnicas de inferencia estadstica sern estudiadas en el captulo 3. KAZMIER, Leonard J., Estadstica Aplicada a la Administracin y a la Economa, p. 1. MILLER, Irwin, John E. FREUD y Richard A. JOHNSON, Probabilidad y Estadstica para Ingenieros, p. 2. CANAVOS C. George, Probabilidad y Estadstica Aplicaciones y Mtodos, p. 1.
1.3
Tipo de Datos
Los datos pueden ser cuantitativos, con valores expresados numricamente, o cualitativos en cuyo caso se tabulan las caractersticas de las observaciones.7
1.4
Distribucin de Frecuencias
Es una tcnica usual en la estadstica que permite el anlisis de conjuntos grandes de datos.8
7 8
KAZMIER, op. cit. p. 1 Cfr. AGUILAR Jurez, Isabel Patricia y Leonardo BAUELOS Saucedo, Notas del Curso Propedutico de Probabilidad y Estadstica, p. 12. 9 Ibid. p. 2. 10 KAZMIER, op. cit. p. 9. 11 Idem. 12 MARN Diazaraque, Juan Miguel, Apuntes de Estadstica Estadstica Descriptiva, p. 8.
n k 1 + 3.22log(n)
(1)
Para la construccin de una tabla de distribucin de frecuencias es conveniente tomar en consideracin las siguientes recomendaciones empricas: 13 1. La tabla de distribucin de frecuencias constar de entre 5 y 20 clases. 2. Todas las clases sern de la misma longitud. Para efectos de clculo, considerando la recomendacin 2, la siguiente frmula puede emplearse para determinar el intervalo de clase aproximado por usar:14
Intervalo aproximado =
(2)
1.4.2.1
Los lmites nominales de clase inferior y superior indican los valores incluidos dentro de la clase.15 Los lmites de clase nominales o simplemente de clase tendrn la misma aproximacin que los datos y el lmite superior de una clase diferir del lmite inferior de la clase siguiente, en una unidad de aproximacin, es decir:16 Datos Lmites Diferencia (lim. inf. de la clase siguiente lim. sup. de la clase) 1 0.1 0.01
1.4.2.2
Fronteras de Clase
Las fronteras de clase o lmites exactos de clase, son los puntos especficos que sirven para separar clases adyacentes en una escala de medicin de variables continuas. Las fronteras de clase pueden determinarse identificando los puntos intermedios entre los lmites nominales de clase superior e inferior, respectivamente de clases adyacentes.17
13 14 15 16 17
AGUILAR Jurez, Isabel Patricia y Leonardo BAUELOS Saucedo, op. cit. p. 4. KAZMIER, op. cit. p. 9. Cfr. AGUILAR Jurez, Isabel Patricia y Leonardo BAUELOS Saucedo, op. cit. p. 2. AGUILAR Jurez, Isabel Patricia y Leonardo BAUELOS Saucedo, op. cit. p. 2. Cfr. KAZMIER, op. cit. p. 9.
1.4.2.3
1.4.2.4
Las marcas de clase de una distribucin de frecuencias se obtienen promediando los lmites nominales de clase consecutivos o las fronteras de clases sucesivas.19
fi * =
fi = n
fi
i
fi
(3)
18 19 20 21 22
AGUILAR Jurez, Isabel Patricia y Leonardo BAUELOS Saucedo, op. cit. p. 4. Cfr. MILLER, Irwin, John E. FREUD y Richard A. JOHNSON, op. cit. p. 10. Cfr. AGUILAR Jurez, Isabel Patricia y Leonardo BAUELOS Saucedo, op. cit. p. 3. Idem. Idem.
Fi * =
Fi F = i n fi
i
(4)
1.5
Las propiedades de las distribuciones de frecuencias relacionadas con su forma se hacen ms evidentes por medio de graficas, y en este subcaptulo introduciremos algunas formas ms comunes de representar grficamente la informacin proporcionada por los datos.
1.5.4 Ojiva
Las distribuciones acumuladas por lo general se representan grficamente en forma de ojivas, 27 las cuales son similares a los polgonos de frecuencias acumuladas sobre las fronteras de clase en lugar de dibujar las frecuencias ordinarias sobre las marcas de clase.
23 24 25 26
Idem. MILLER, Irwin, John E. FREUD y Richard A. JOHNSON, op. cit. p. 12. Ibid. p. 13. KAZMIER, op. cit. p. 11.
1.6.1.1
Media Aritmtica29
a) Si x 1, x 2 , ..., x n son los datos contenidos en la muestra y se encuentran sin agrupar, entonces la media aritmtica ser:
x=
Donde n es el tamao de la muestra.
xi
i=1
(5)
b) Si los datos se encuentran agrupados en una tabla de distribucin de frecuencias, y se utiliza el mismo concepto que para los datos sin agrupar, se define la media aritmtica como:
x=
x f
i=1
i i
= x i fi * puesto que
i =1
fi = fi * n
(6)
Donde: m = Nmero de clases xi = Marca de la clase i fi = Frecuencia de la clase i n = Numero total de datos
27 28 29
MILLER, Irwin, John E. FREUD y Richard A. JOHNSON, op. cit. p. 15. CANAVOS, op. cit. p. 12. AGUILAR Jurez, Isabel Patricia y Leonardo BAUELOS Saucedo, op. cit. p. 9 10.
10
1.6.1.2
Mediana
La mediana de un conjunto de observaciones es el valor para el cual, cuando todas las observaciones se ordenan de manera creciente, la mitad de stas es menor que este valor y la otra mitad mayor. Si el nmero de observaciones en el conjunto es impar, la mediana es el valor de la observacin que se encuentra a la mitad del conjunto ordenado. Si el nmero es par se considera la mediana como el promedio aritmtico de los valores de las dos observaciones que se encuentran a la mitad del conjunto ordenado.
1.6.1.3
Moda
La moda de un conjunto de observaciones es el valor de la observacin que ocurre con mayor frecuencia en el conjunto.
1.6.2.1
Rango
El rango o R, es la diferencia entre los valores ms alto y ms bajo incluidos en el conjunto de datos.31 As, cuando My representa el mayor valor del grupo y Mn al menor, el rango de datos no agrupados es:
R = My Mn
(7)
1.6.2.2
Varianza
La varianza de las observaciones x 1, x 2 , ..., x n es, en esencia, el promedio del cuadrado de las distancias entre cada observacin y la media del conjunto de observaciones.32 La varianza se denota por:33
30 31 32 33
KAZMIER, Leonard J., op. cit. p. 51. Idem. CANAVOS, op. cit. p. 15 Estas frmulas son aplicables a poblaciones finitas.
11
Varianza de la poblacin:
2 =
(x i x )2
i=1 n
(8)
Varianza de la muestra:
s2 =
(x i x )2
i=1
(9)
n -1
1.6.2.3
Desviacin Estndar
La raz cuadrada positiva de la varianza recibe el nombre de desviacin estndar34 y se denota por:35
(x i x )2
i=1 n
(10)
s=
(x i x )2
i=1
(11)
n -1
1.6.2.4
El coeficiente de variacin indica la magnitud relativa de la desviacin estndar en comparacin con la media de la distribucin de las medidas, expresada como porcentaje.36 As, las frmulas son: Coeficiente de Variacin de la Poblacin: Coeficiente de Variacin de la Muestra:
100 s 100 x
(12) (13)
34 35 36
Idem. Estas formulas son aplicables a poblaciones finitas. KAZMIER, op. cit. p.57.
12
4, 27, 100, 33, 32, 57, 77, 3, 45, 79, 10, 80, 4, 47, 35, 25, 90, 38, 6, 68, 57, 46, 40, 47, 87, 67, 66, 78, 80, 92, 68, 79, 78, 100, 76, 88, 89, 94, 48, 34, 90, 90, 22, 78, 56, 100, 91, 25, 80, 23, 5, 93, 30, 90 y 45. Se pide lo siguiente: 1. 2. 3. Elaborar la tabla de distribucin de frecuencias. Elaborar la descripcin grafica de los datos. Calcular las medidas numricas descriptivas.
Solucin: 1. Elaborar la tabla de distribucin de frecuencias. a) Determinar el nmero k de intervalos: Para esto se utilizar la ecuacin 1; adems el nmero de datos n, es de 55.
7 es un nmero de intervalos aceptable ya que se encuentra ente 5 y 20. b) Determinar el intervalo de clase aproximado: Para esto se utilizar la ecuacin 2; adems en los datos en la muestra se observa que el menor es 3 y el mayor 100.
Intervalo aproximado =
entonces,
Intervalo aproximado =
c) Una vez lo anterior, se siguieron las definiciones proporcionadas en los subcaptulos 1.4.2.1 al 1.4.2.4 para calcular a las clases los lmites nominales, las fronteras, su longitud y sus marca de clase; los conceptos 1.4.3 y 1.4.4 para calcular las frecuencias y las frecuencias absolutas, en cada una de las clases; mientras que las ecuaciones 3 y 4 se utilizaron para calcularles su frecuencia relativa y su frecuencia relativa acumulada, respectivamente. Obtenindose finalmente, la siguiente tabla de distribucin de frecuencias: TABLA DE DISTRIBUCIN DE FRECUENCIAS
Frecuencia Marcas Frecuencia Frecuencia Relativa Relativa Acumulada de Clase Frecuencia Acumulada fi Fi xi Fi* fi* 9.5 6 6 0.10909 0.10909 23.5 6 12 0.10909 0.21818 37.5 6 18 0.10909 0.32727 51.5 9 27 0.16364 0.49091 65.5 4 31 0.07273 0.56364 79.5 10 41 0.18182 0.74545 93.5 14 55 0.25455 1.00000 55 1.00000
100 3 = 13.86 7
Intervalos de Clase Lmites Fronteras 3 16 2.5 16.5 17 30 16.5 30.5 31 44 30.5 44.5 45 58 44.5 58.5 59 72 58.5 72.5 73 86 72.5 86.5 87 100 86.5 100.5
2.
13
HISTOGRAM A DE FRECUENCIAS 16 14 12 Clientes 10 8 6 4 2 0 9.5 23.5 37.5 51.5 65.5 79.5 93.5 Das de As is te ncia al Gim nas io 6 6 6 4 9 10
14
b) Polgono de frecuencias
POLGONO DE FRECUENCIAS 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0 -4.5
Clientes
9.5
23.5
37.5
51.5
65.5
79.5
93.5
107.5
c) Curva de Frecuencias
CURVA DE FRECUENCIAS
14 13 12 11 10 9 8 7 6 5 4 3 2 1 0 -4.5
Clientes
9.5
23.5
37.5
51.5
65.5
79.5
93.5
107.5
14
d) Ojiva
OJIVA
55 50 45 40 35 30 25 20 15 10 5 0 2.5 16.5 30.5 44.5 58.5 72.5 86.5 100.5
Clientes
3.
Calcular las medidas numricas descriptivas. a) Media Aritmtica Para calcularla se utiliz la ecuacin 6, obtenindose el siguiente resultado:
x=
x
i=1
= 58.04
b) Mediana Siguiendo el concepto presentado en el subcaptulo 1.6.1.2, se realiza lo siguiente: Se ordenan los datos en forma creciente, como se tiene un nmero de datos impar (55), la mediana ser el valor de la observacin que se encuentra a la mitad del conjunto ordenado es decir el dato 28:
Orden Dato 1 3 2 4 3 4 4 5 5 6 7 8 6 10 22 23 9 25 20 45 31 68 42 87 10 25 21 46 32 76 43 88 11 27 22 47 33 77 44 89
Por lo tanto, la mediana es 66. c) Moda Siguiendo el concepto presentado en el subcaptulo 1.6.1.2, se obtuvo que sta es 90, ya que es el dato con mayor frecuencia (4).
15
R = My Mn = 100 3 = 97
n
s2 =
(x
i=1
x)
n -1
n
= 898.11
f) Desviacin Estndar Para calcularla se utiliz la ecuacin 11, obtenindose el siguiente resultado:
s=
(x
i=1
x)
n -1
= 29.97
g) Coeficiente de Variacin Para calcularlo se utiliz la ecuacin 13, obtenindose el siguiente resultado:
s 100 = 51.64% x
Del ejercicio anterior, se puede decir que la representacin grfica de los datos es asimtrica, las medidas de tendencia central media aritmtica, mediana y moda se calcularon en 58.04, 60 y 90, lo que confirma la carencia de simetra de los datos, adems se observa dispersin alta en los datos, situacin que se confirma con los resultados obtenidos por el rango, la desviacin estndar y el coeficiente de variacin. En este subcaptulo se ejemplific lo que se mostr de manera terica en los anteriores, esperando que el lector al final de este captulo pueda efectuar el anlisis previo a la realizacin de inferencias; sin embargo para que stas sean desarrolladas, es necesario profundizar en el conocimiento de las distribucin de probabilidad y; por lo tanto, ste ser el objetivo del captulo siguiente.
16
P( A ) =
Ejemplo 2.1.1 Sea el experimento aleatorio consistente en lanzar al aire una moneda legal, es decir que los sucesos elementales que salga sol y que salga guila son igualmente posibles. Si se designa mediante la letra A, el suceso que salga sol, se tiene que:
P( A ) =
37
En este subcaptulo se manejarn intuitivamente las palabras suceso y/o evento, pero estas sern definidas de manera formal en el subcaptulo 2.2. 38 ENCICLOPEDIA CIENTFICA CULTURAL VOLUMEN ESTADSTICA p. 55.
17
P(A ) = lim fi * ( A)
n
Ejemplo 2.1.2 Sea el experimento aleatorio del ejemplo anterior que consiste en lanzar una moneda al aire. Los dos sucesos posibles: son que salga sol y que salga guila. Si en 500 lanzamientos ha salido 263 veces sol, la probabilidad del suceso: A = que salga sol, ser:
P(A ) = fi * ( A) =
Cfr. Ibid, p. 56 Cfr. KAZMIER, Leonard J., Estadstica Aplicada a la Administracin y a la Economa, p. 65. CANAVOS C. George, Probabilidad y Estadstica Aplicaciones y Mtodos, p. 32 36.
18
Definicin 2.2.3 Se dice que el espacio muestral es continuo si sus resultados consisten en un intervalo de nmeros reales. Ejemplo 2.2.1 Considerando la representacin de las fichas de un domino abajo mostrada, diga qu tipo de espacio muestral es ste.
0 0 1 1 2 2 3 3 4 4 5 5 6 6 0 1 1 2 2 3 3 4 4 5 5 6 0 2 1 3 2 4 3 5 4 6 0 3 1 4 2 5 3 6 0 4 1 5 2 6 0 5 1 6 0 6
Solucin:
Discreto.
Con respecto a los resultados de un espacio muestral, se puede estar interesado en un subconjunto de stos. De esta manera se tienen las siguientes definiciones. Definicin 2.2.4 Un evento del espacio muestral es un grupo de resultados contenidos en este espacio, cuyos miembros tiene una caracterstica comn. Por caracterstica comn debe entenderse que nicamente un grupo de resultados en particular satisface la caracterstica y los restantes, contenidos en el espacio muestral, no; Se dice que un evento ha ocurrido si los resultados del experimento aleatorio incluyen a algunos de los que definen al evento. En este contexto, el espacio muestral, evento en si mismo, puede entenderse como un evento seguro, puesto que se tiene un 100% de certidumbre de que ocurrir un resultado del espacio muestral cuando el experimento se lleve a cabo. Ejemplo 2.2.4 De cuntos resultados consta el evento de que al seleccionar una ficha en el domin del ejemplo 2.2.1 aparezca un uno? Solucin: De siete y son los siguientes:
0 0 1 1 0 1 1 2 0 2 1 3 0 3 1 4 0 4 1 5 0 5 1 6 0 6
Definicin 2.2.5 El evento que contiene a ningn resultado del espacio muestral recibe el nombre de evento nulo o vaco.
19
El evento nulo o vaco se representa mediante el siguiente smbolo: Ejemplo 2.2.5 De un ejemplo de un evento nulo, considerando el domino del ejemplo 2.2.1. Solucin: El vacio. Sean E1 y E 2 cualesquiera dos eventos que se encuentren en un espacio muestral dado denotado por S . Valindose de estos se indican las siguientes definiciones: Definicin 2.2.6 El evento formado por todos los posibles resultados en E1 o E 2 o en
ambos, recibe el nombre de la unin de E1 y E 2 y se denota por E1 E 2 . Ejemplo 2.2.6 Considere el domino del ejemplo 2.2.1, De cuntos elementos est formado E1 E 2 si E1 es el conjunto de todas las fichas que tienen 0 y E 2 las fichas que tienen 1? Solucin: De 13 elementos y son los siguientes:
0 0 1 1 0 1 1 2 0 2 1 3 0 3 1 4 0 4 1 5 0 5 1 6 0 6
Definicin 2.2.7
si no tienen resultados en comn; en otras palabras E1 E 2 = evento vaco. Ejemplo 2.2.8 Utilizando el domin del excluyentes. Solucin: E1 : El conjunto de todas las fichas con 0. ejemplo 2.2.1, diga dos eventos mutuamente
E 2 : El conjunto de fichas en las que los puntos de cada una suman por lo menos 7.
20
0 0 1 1 2 2 3 3 4 4 5 5 6 6
0 1 1 2 2 3 3 4 4 5 5 6
0 2 1 3 2 4 3 5 4 6
0 3 1 4 2 5 3 6
0 4 1 5 2 6
0 5 1 6
0 6
Definicin 2.2.9
el evento E 2 est contenido en E1 y se denota por E 2 E1 . Ejemplo 2.2.9 Utilizando el domin del ejemplo 2.2.1, d dos eventos en los que uno est contenido en otro. Solucin: E1 : El conjunto de fichas en que los puntos de cada una suman por lo menos 7.
E 2 : El conjunto de fichas en las que los puntos de cada una suman exactamente 7.
0 0 1 1 2 2 3 3 4 4 5 5 6 6 0 1 1 2 2 3 3 4 4 5 5 6 0 2 1 3 2 4 3 5 4 6 0 3 1 4 2 5 3 6 0 4 1 5 2 6 0 5 1 6 0 6
21
Definicin 2.2.10 El complemento de un evento E con respecto al espacio muestral S , es aquel que contiene todos los resultados de S que no se encuentran en E , y se denota por E . Ejemplo 2.2.10 Utilizando el espacio muestral del ejemplo 2.2.1, d un evento y el complemento de ste. Solucin: E : El conjunto de fichas en las que los puntos de cada una suman por lo menos 7. E : El conjunto de fichas en las que los puntos de cada una suman menos de 7.
0 0 1 1 2 2
0 1 1 2 2 3 3 4 4 5 5 6
0 2 1 3 2 4 3 5 4 6
0 3 1 4 2 5 3 6
0 4 1 5 2 6
0 5 1 6
0 6
3 3 4 4 5 5 6 6
Antes de formalizar la definicin de probabilidad, se dir que sta es un nmero real que mide la posibilidad colectiva, de ocurrencia, de los resultados del evento cuando se lleve a efecto el experimento. A continuacin se da la definicin axiomtica de la probabilidad. Definicin 2.2.11 Sea S cualquier espacio muestral y E cualquier evento de ste. Se llamar funcin de probabilidad sobre el espacio muestral S a P (E ) si satisface los siguientes axiomas: 1. P (E ) 0 2.
P (S ) = 1
22
Los siguientes teoremas42 son consecuencias de estos tres axiomas: Teorema 1. Teorema 2.
P ( ) = 0 .
Teorema 3. Sea S un espacio muestral que contiene a cualesquiera dos eventos entonces,
A y B;
P ( A B ) = P ( A) + P (B ) P ( A B )
2.3
El propsito de una variable aleatoria es transformar cada punto de un espacio muestral en un punto de un eje real, de tal manera que dicha transformacin sea una funcin. De manera formal, este concepto se define en el siguiente prrafo. Definicin 2.3.1 Sea S un espacio muestral sobre el que se encuentra definida una funcin de probabilidad. Sea X una funcin de valor real definida sobre S , de manera que transforme los resultados de S en puntos sobre la recta de los reales. Se dice entonces que X es una variable aleatoria. Ya que una variable aleatoria es una caracterizacin cuantitativa de los resultados de un espacio muestral, sta posee intrnsecamente la naturaleza discreta o continua de este espacio. Definicin 2.3.2 Se dice que una variable aleatoria X es discreta si el nmero de valores que puede tomar es contable (ya sea finito o infinito), y si stos pueden arreglarse en una secuencia que corresponde con los enteros positivos. Los siguientes son ejemplos tpicos de variables aleatorias discretas: 1. El nmero de tornillos defectuosos en una muestra de 10 extrada de una produccin industrial. 2. El nmero de personas que esperan en la oficina de un doctor. Definicin 2.3.3 Se dice que una variable aleatoria en uno o ms intervalos de la recta de los reales.
Los siguientes son ejemplos tpicos de variables aleatorias continuas: 1. La estatura de una persona. 2. La cantidad de azcar en una mandarina.
42 43
Las demostraciones de estos teoremas pueden ser consultadas en la bibliografa citada para este subcaptulo. CANAVOS, op. cit. p. 52 53.
23
2.4
En general, una variable aleatoria discreta X representa los resultados de un espacio muestral en forma tal que por P ( X = x ) se entender la probabilidad de que X tome el valor de x . De esta forma, al considerar los valores de una variable aleatoria es posible desarrollar una funcin matemtica que asigne una probabilidad a cada realizacin x de la variable aleatoria X . Esta funcin recibe el nombre de funcin de probabilidad45 de la variable aleatoria X . El Trmino ms general, distribucin de probabilidad, se refiere a la coleccin de valores de la variable aleatoria y a la distribucin de probabilidades entre stos. Sin embargo, hacer referencia a la distribucin de probabilidad de X no slo implica la existencia de la funcin de probabilidad, sino tambin la existencia de la funcin de distribucin acumulativa de X . Definicin 2.4.1
X una variable discreta. Se llamar a p ( x ) P( X = x ) funcin de probabilidad de la variable aleatoria X , si satisface las siguientes propiedades: 1. p ( x ) 0 para todos los valores de x de X ; 2. p ( x ) = 1. x
Sea 3.
p (xi X x j ) =
X = xi
p(x )
X es la
xj
Definicin 2.4.2 La funcin de distribucin acumulativa de la variable aleatoria probabilidad de que X sea menor o igual a un valor especfico x y est dada por:
F (x ) P( X x ) =
xi x
p(x )
i
Por lo tanto, en el caso discreto, una variable aleatoria X est caracterizada por la funcin de probabilidad puntual p ( x ) , la cual determina la probabilidad puntual de que X = x , y por la funcin de distribucin acumulativa de F ( x ) , la que representa la suma de las probabilidades puntuales hasta el valor de x de
X inclusive.
En general, la funcin de distribucin acumulativa F ( x ) de una variable aleatoria discreta es una funcin no decreciente de los valores de X , de tal manera que 1. 0 F ( x ) 1 para cualquier x; 2. 3.
F ( xi ) F (x j ) si xi x j ;
P( X > x ) = 1 F (x ).
Adems, puede establecerse que para variables aleatorias de valor entero se tiene que: 4. P ( X = x ) = F ( x ) F ( x 1) ; 5.
P(xi X x j ) = F (x j ) F (xi 1)
44 45
Ibid, 53 57. El nombre completo de esta funcin es el de funcin de masa de probabilidad de una variable aleatoria discreta.
24
Ejemplo 2.4.1 El nmero de vagonetas solicitadas en renta a una agencia de alquiler en un perodo de 50 das se identifica en la siguiente tabla:
2.5
La distribucin de probabilidad de una variable aleatoria continua X est caracterizada por una funcin f ( x ) que recibe el nombre de funcin de densidad de probabilidad. Esta funcin f ( x ) no es la misma funcin de probabilidad que para el caso discreto. Como la probabilidad de que X tome el valor especfico x es cero, la funcin de densidad de probabilidad no representa la probabilidad de que X = x . Ms bien, sta proporciona un medio para determinar la probabilidad de un intervalo a X b . La funcin de densidad de probabilidad de una variable aleatoria continua X formalmente de la siguiente manera: Si existe una funcin f ( x ) tal que 1. 2. 3.
se define
f ( x ) 0, < x < ,
f (x )dx = 1,
y
b
P(a X b ) = f ( x )dx
a
46
Ibid, p. 57 62.
25
Al igual que en el caso de una variable aleatoria discreta, la funcin de distribucin acumulativa F ( x ) de una variable aleatoria continua X es la probabilidad de que X tome un valor menor o igual a algn x especifico. Esto es,
P( X x ) = F ( x ) =
en donde t es una variable artificial de integracin. Dado que para cualquier variable aleatoria continua
x
f (t )dt,
X,
P( X = x ) = f (t )dt = 0 ,
x
entonces:
P( X x ) = P( X < x ) = F (x ) .
La distribucin acumulativa F ( x ) , es una funcin lisa no decreciente de los valores de la variable aleatoria con las siguientes propiedades: 1. F ( ) = 0 ;
F ( ) = 1; 3. P (a < X < b ) = F (b ) F (a ) ; 4. dF ( x ) dx = f ( x ) .
2.
Ejemplo 2.5.1 El tiempo requerido por los estudiantes para presentar un examen de una hora es una variable aleatoria con funcin de densidad dada por
a) Determinar el valor de c que hace de f ( x ) una funcin de densidad. b) Una vez calculada c, obtener F ( x )
cx 2 + x f (x ) = 0
0 x 1 en otro caso
Solucin: a)
(cx
0
+ x )dx = 1 , de donde
3 c 1 + =1 c = 3 2 2 x x3 x2 3 2 b) F ( x ) = t + t dt = + , 0 x 1 2 2 2 0
26
Finalmente,
x<0 0 x3 x2 F (x ) = + 0 x 1 2 2 x >1 1
2.6 Valor Medio y Varianza de Distribucin
En lugar de usar la caracterizacin completa de una distribucin, por lo regular es suficiente con describirla (aunque incompletamente), en trminos de ciertas cantidades que caracterizan propiedades generales de dicha distribucin. Las dos cantidades ms importantes son el valor medio o media
y la varianza
2 ; y a continuacin se definen.
En el caso de una
E ( x ) = = xi p ( x i )
i
E (x ) = =
xf (x )dx .
2.
Var ( x ) = 2 = ( xi ) p (xi )
Var ( x ) = 2 =
(x ) f (x )dx.
2
47 48
Cfr. KREYSZIG, Erwin, Introduccin a la Estadstica Aplicada Principios y Mtodos, p. 97. Cfr. Ibid, p. 97.
27
2.7
Este subcaptulo est dedicado al conocimiento probabilidad, tanto discretas como continuas.
2.7.1.1
Distribucin Binomial
Es una de las distribuciones discretas de probabilidad ms tiles. Sus reas de aplicacin incluyen inspeccin de calidad, ventas, mercadotecnia, medicina, investigacin de opiniones y otras.49 La distribucin binomial es un modelo aplicable para situaciones de toma de decisiones en las que puede suponerse que un proceso de muestreo responde a un proceso Bernoulli. Un proceso Bernoulli es un proceso de muestreo en el que: 1. En cada ensayo u observacin slo son posibles dos resultados mutuamente excluyentes. Por convencin stos resultados se llaman xito y fracaso. 2. Los resultados de la serie de ensayos, u observaciones, constituyen eventos independientes. 3. La probabilidad de xito de cada ensayo, indicada por p , es constante de un ensayo a otro. Esto es, el proceso es estacionario. La distribucin binomial puede servir para determinar la probabilidad de obtener un nmero establecido de xitos en un proceso Bernoulli. Se requiere de tres valores: el nmero establecido de xitos ( x ) ; el nmero de ensayos, u observaciones (n ) , y la probabilidad de xito en cada ensayo
( p ) .50
Para resolver problemas que satisfacen las condiciones enunciadas en el prrafo anterior, se utilizar una frmula que se obtendr de la siguiente forma: si p y 1 p son probabilidades de xito y fracaso en cada ensayo, entonces la probabilidad de obtener x xitos y n x fracasos en algn orden especfico es p (1 p )
x n x
p para cada xito, un factor 1 p para cada fracaso, y los x factores p y los n x factores 1 p son multiplicados todos a la vez. En vista de que esta probabilidad se aplica a cualquier punto del espacio muestral que representa x xitos y n x fracasos (en
hay un factor cualquier orden especfico), slo tenemos que contar cuntos puntos de esta clase existen, y multiplicar entonces p
x
(1 p ) ' s
(1 p )n x
49 50
28
que podemos obtener x xitos en n ensayos es el nmero de combinaciones de x objetos seleccionados de un conjunto de n objetos as llegamos al siguiente resultado.51 x Funcin de Probabilidad Parmetros
n n x p( x; n, p ) = p x (1 p ) x x = 0, 1, 2, ..., n
Media
n , entero positivo p , 0 p 1
Varianza
np
npq
2.7.1.2
Distribucin de Poisson
La distribucin de Poisson puede utilizarse para determinar la probabilidad de ocurrencia de un nmero establecido de eventos cuando stos ocurren en un continuum temporal o espacial. Este proceso se llama proceso de Poisson; aunque semejante al proceso Bernoulli,53 se distingue de l en que los eventos ocurren a lo largo de un continuum (durante un intervalo temporal, por ejemplo) y en que no se dan ensayos propiamente dichos. Un ejemplo de un proceso de este tipo sera el nmero de personas que llegan a una tienda de autoservicio en un tiempo determinado, el nmero de bacterias en un cultivo, etctera. Como en el caso del proceso Bernoulli, se supone que los eventos son independientes y el proceso es estacionario. Para determinar la probabilidad de ocurrencia de un nmero establecido de eventos en un proceso de Poisson slo se requiere de un valor: el nmero medio de eventos a largo plazo en la dimensin temporal o espacial especfica de inters. Por lo general esta media se representa como , o en ocasiones como . La frmula para determinar la probabilidad de un nmero establecido de xitos x en una distribucin de Poisson es:54
51 52 53 54
MILLER, Irwin, John E. FREUND y Richard A. JOHNSON, Probabilidad y Estadstica para Ingenieros, p. 93 94. CANAVOS op. cit. p. 91. Vid. 2.7.1.1 KAZMIER op. cit. p. 99.
29
Funcin de Probabilidad
Parmetro
p( x; ) =
e x! x = 0, 1, 2, ...
Media
>0
Varianza
2.7.1.3
Distribucin Hipergeomtrica
Cuando el muestreo se realiza sin reemplazo de cada elemento muestreado tomado de una poblacin finita de elementos, no se aplica el proceso Bernoulli, porque cuando se eliminan elementos de la poblacin existe un cambio sistemtico en la probabilidad de xito. Cuando en una situacin que de otro modo correspondera a un proceso Bernoulli, se hace uso del muestreo sin reemplazo, la distribucin discreta adecuada es la distribucin hipergeomtrica. Concediendo que x es el nmero establecido de xitos, N el nmero total de elementos de la poblacin, k el nmero total de xitos incluidos en la poblacin y n el nmero de elementos de la muestra, la frmula para determinar probabilidades hipergeomtricas es:56 Funcin de Probabilidad Parmetros
k N k x n x p( x; N , n, k ) = N n x = 0, 1, 2, ..., n x k, nx N k
Media
nk N
55 56
nk ( N k )( N n ) N 2 ( N 1)
30
2.7.2.1
Distribucin Normal
La distribucin normal de probabilidad es una distribucin de probabilidad continua. La curva de probabilidad que representa a la distribucin normal de probabilidad tiene forma de campana, como lo ejemplifican las curvas de probabilidad de la siguiente figura.
.58
57 58
31
La distribucin normal de probabilidad es importante para la inferencia estadstica por tres razones: 1. Se sabe que las medidas obtenidas por muchos procesos aleatorios siguen esta distribucin. 2. Las probabilidades normales suelen servir para aproximar otras distribuciones de probabilidad, como las distribuciones binomial y Poisson. 3. Las distribuciones estadsticas como la media muestral y la proporcin muestral tiene distribucin normal cuando el tamao de muestra es grande, independientemente de la poblacin origen. Como sucede en todas las distribuciones continuas de probabilidad, un valor de probabilidad de una variable aleatoria continua slo puede determinarse para un intervalo de valores. Se dice que una variable aleatoria X se encuentra normalmente distribuida si su funcin de densidad de probabilidad est dada por: Funcin de Densidad de Probabilidad Parmetros
f ( x; , ) =
1 e [( x ) 2
Media
, Varianza
< <
< x <
>0
probabilidad diferente, las tablas de probabilidad normales se basan en una distribucin en particular: la distribucin normal estndar. sta es la distribucin normal de probabilidad con = 0 y = 1 . Todo valor de x precedente de una poblacin con distribucin normal puede convertirse en el equivalente valor estndar de z mediante la frmula:
z=
Un valor de z reformula el valor x original en trminos del nmero de unidades de la desviacin estndar por las cuales el valor original difiere de la media de la distribucin. Un valor negativo z indicara que el valor x original estaba por debajo de la media.59
59
32
X y de Z.60
2.7.2.2
Distribucin Uniforme
Supngase que ocurre un evento en que una variable aleatoria toma valores de un intervalo infinito, de manera que stos se encuentran distribuidos igualmente sobre el intervalo. Esto es, la probabilidad de que la variable aleatoria tome un valor en cada subintervalo de igual longitud es la misma. Se dice entonces que la variable aleatoria se encuentra distribuida uniformemente sobre el intervalo. La distribucin uniforme proporciona una representacin adecuada para redondear diferencias que surgen al medir cantidades fsicas entre los valores observados y los reales. Por ejemplo, si el peso de un individuo se redondea al kilogramo ms cercano. Se dice que una variable aleatoria
60 61
33
Parmetros
a, b,
Varianza
p a p
pb p
(a + b )
2
Media
(b a )2
12
2.7.2.3
Distribucin Gama63
Esta distribucin se emplea de manera extensa en una gran diversidad de reas; por ejemplo, para representar el tiempo aleatorio de la falla slo si de manera exacta los componentes fallan y la falla de cada componente ocurre a una frecuencia constante = 1 por unidad de tiempo. Tambin se emplea en problemas de lneas de espera para representar el intervalo (de tiempo) total para completar una reparacin si sta se lleva a cabo en subestaciones; completar la reparacin de cada subestacin es un evento independiente que ocurre a una frecuencia constante igual a = 1 . Existen algunos ejemplos que no siguen el patrn anterior pero se aproximan de manera adecuada mediante el empleo de la distribucin gama, como los ingresos familiares y la edad del hombre al contraer matrimonio por primera vez. Se dice que la variable aleatoria X tiene una distribucin gama si su funcin de densidad de probabilidad est dada por:
62 63
34
Parmetros
xf0
para cualquier otro caso
, ,
Varianza
>0 >0
Media
Donde: ( ) =
x
0
1 x
e dx, > 0
4.
n n = 1! 2 2 1 5. = .64 2
La distribucin gama es muy verstil puesto que exhibe varios perfiles que dependen del valor del parmetro . En la siguiente figura se ilustran distintos perfiles de la funcin de densidad gama para distintos valores de y . Como puede observarse, para 1, la distribucin gama tiene un perfil en forma de J transpuesta. Para > 1, presenta un pico que ocurre en x = ( 1) . Para un valor fijo , el perfil bsico de la distribucin gama no se altera si el valor
cambia. Lo anterior da como resultado que las cantidades y de escala, de la distribucin gama.
64
35
.65
Cuando es un entero positivo, la distribucin gama se conoce tambin como distribucin de Erlang; por otro lado, si = 1 , la distribucin Erlang (gama) se reduce a lo que se conoce como la distribucin exponencial negativa. Otro caso especial del modelo de probabilidad gama es la distribucin chi-cuadrado66 cuando = v 2 y = 2 ; est distribucin se encuentra caracterizada por un mismo parmetro v , que recibe el nombre de grados de libertad.
2.7.2.4
Distribucin de Weibull67
En los ltimos 25 aos esta distribucin se emple como modelo para situaciones de tiempofalla y con el objetivo de lograr una amplia variedad de componentes mecnicos y elctricos. Se dice que una variable aleatoria X densidad de probabilidad est dada por: tiene una distribucin de Weibull si su funcin de
65 66
CANAVOS op. cit. p. 152. La funcin de densidad de probabilidad de una variable aleatoria chicuadrado se determina por:
x 1 x v 21e 2 xf0 (v 2 )2 v 2 f ( x; v ) = 0 para cualquier otro caso.
67
Como se ver, esta distribucin interviene en la inferencia estadstica y de manera especial al hacer inferencia respecto a las varianzas. Vid: Ibid, p. 158. Ibid, p. 159 163.
36
Parmetros
x e f ( x; , ) = 0
x 1
, ,
Varianza
f0 f0
Media
1 +
2 1 +
2 1 2 1 +
La distribucin Weibull es una familia de distribuciones que dependen de dos parmetros: el de forma, y el de escala, . En la siguiente figura se muestran varias grficas de la distribucin Weibull para distintos valores de y ; y como puede observarse, esta distribucin tiene distintos perfiles dependiendo del valor . Por ejemplo, si p 1, tiene una forma de J transpuesta, y si f 1, la funcin de densidad presenta un pico nico.
FIGURA 2.8 Grficas de la funcin de densidad de Weibull para distintos valores de y .68 Existen dos casos especiales en la distribucin de Weibull que merecen mencin especial. Cuando el parmetro de forma es igual a uno, la distribucin de Weibull (al igual que la gama), se reduce a la distribucin exponencial negativa. Cuando = 2 y el parmetro de escala se reemplaza por 2 , la funcin de densidad de Weibull se reduce a lo que se conoce como distribucin de Rayleigh.69
68 69
Ibid, p. 160. La funcin de densidad de probabilidad de una variable Rayleigh se determina por:
f x; 2
x x2 2 e 2 = 0
2
x>0
Esta distribucin es utilizada en problemas de ruido asociados con sistemas de comunicacin. Vid: BILLINTON, Roy y Ronald N. ALLAN, Reliability Evaluation of Engineering Systems Concepts and Techniques, p. 192.
37
2.7.2.5
Se ha notado con anterioridad que la distribucin exponencial (negativa) es un caso especial de los modelos de Weibull y gama. Ya que es un caso especial de la distribucin gama (Erlang), la variable aleatoria exponencial es el tiempo que transcurre hasta que se da el primer evento de Poisson. Es decir, la distribucin exponencial puede modelar el lapso entre dos eventos consecutivos de Poisson que ocurren de manera independiente y a una frecuencia constante: esta distribucin se emplea con bastante frecuencia con objeto de modelar problemas del tipo tiempofalla y como modelo para el intervalo en problemas de lneas de espera. Si una variable aleatoria X tiene una distribucin exponencial, su funcin de densidad est dada por: Funcin de Densidad de Probabilidad Parmetro
1 e f ( x; ) = 0
xf0
,
para cualquier otro caso
Media
f0
Varianza
La distribucin exponencial se caracteriza por un parmetro , que representa el lapso promedio de tiempo entre dos eventos independientes de Poisson. En el contexto de la confiabilidad, recibe el nombre de tiempo promedio entre fallas; y 1 es la frecuencia de la falla.
f(x)
2.7.2.6
Distribucin Beta72
Una distribucin que permite representar una gran variedad de perfiles es la distribucin beta. Se ha utilizado para representar variables fsicas cuyos valores se encuentran restringidos a un
70 71 72
CANAVOS op. cit. p. 163 167. Crf. MILLER, Irwin, John E. FREUND y Richard A. JOHNSON, op. cit. p. 161. CANAVOS op. cit. p. 147 151.
38
intervalo de longitud finita y para encontrar ciertas cantidades que se conocen como lmites de tolerancia sin necesidad de la hiptesis de una distribucin normal. Adems, la distribucin beta juega un gran papel en la estadstica bayesiana. Se dice que una variable aleatoria X posee una distribucin beta si su funcin de densidad de probabilidad est dada por: Funcin de Densidad de Probabilidad Parmetros
( + ) 1 1 ( )( ) x (1 x ) f ( x; ) = 0
0 p x p1
f0
f0
Varianza
2
Media
( + )
Las cantidades distintos de
( + ) ( + + 1)
como 1 , la
p 1 y 1, el perfil es una J. Cuando tanto y son ambos menores que uno, la distribucin presenta un pico en x = ( 1) ( + 2) . Finalmente, la distribucin beta es simtrica cuando = . En la siguiente figura observe los
perfiles de esta distribucin.
p1
.73
En este captulo se estudiaron las principales distribuciones de probabilidad y se discutieron algunas reas de aplicacin de cada modelo, sin embargo el lector debe de considerar que para un experimento aleatorio siempre se elegir la distribucin de probabilidad que mejor se ajuste a este, para tal eleccin en el siguiente captulo se muestran algunas pruebas de bondad de ajuste as como algunos mtodos de inferencia estadstica.
73
39
CAPTULO 3 ESTIMACIN DE DISTRIBUCIONES DE PROBABILIDAD PARA DATOS EMPRICOS Y LA DETERMINACIN DEL TAMAO DE MUESTRA
En numerosas ocasiones la informacin con que se cuenta para analizar el comportamiento de cierto experimento, o para intentar hacer un pronstico, es tan poca, que resulta insuficiente si se intenta utilizar las tcnicas clsicas. Sin embargo, ante la cotidianeidad con que se presenta esta problemtica se han desarrollado otras tcnicas que permiten librar la situacin. Por esta razn, el objetivo de este captulo es el de estudiar los mtodos de estimacin de la distribucin de probabilidad para datos empricos, entre los que se destaca el mtodo del rango mediano que sirve para tal fin cuando se cuenta con una muestra pequea o insuficiente; as como los mtodos de determinacin del tamao de muestra, ya que sta debe de ser lo suficientemente grande para que las inferencias elaboradas en una poblacin o estudio, como lo es el de simulacin se apeguen a la realidad.
de
la
Distribucin
de
Probabilidad
para
Datos
Datos Empricos Representacin Grfica de la Distribucin de Probabilidad de los Datos Empricos Seleccin de la Distribucin de Probabilidad Terica Estimacin de Parmetros de la Distribucin de Probabilidad Torica Prueba de Bondad de Ajuste Distribucin de Probabilidad Seleccionada
FIGURA 3.1 Algoritmo para la Estimacin de la Distribucin de Probabilidad para Datos Empricos.75 El algoritmo anterior muestra los pasos a seguir para estimar la distribucin de probabilidad de los datos empricos obtenidos. Es necesario hacer nfasis en que el trmino experimento abarca un gran nmero de actividades cuyo objetivo es generar y coleccionar datos (pruebas de laboratorio, datos de campo, reportes de usuario; y otros similares).
74 75
KNEZEVIC, Jezdimir, Reliability, Maintainability and Supportability a Probabilistic Approach p. 150 - 151. Ibid. p. 151.
40
3.1.1.1 Mtodo del Rango Mediano para la Estimacin Distribucin de Probabilidad para Muestras Pequeas76
de
la
De acuerdo con el teorema de Bernoulli, la probabilidad de ocurrencia de un evento se define por la razn de su frecuencia entre el nmero total de resultados, n, cuando sta se aproxima a infinito, pero cuando el nmero de casos es insuficiente los datos no pueden ser agrupados y consecuentemente no se puede determinar de esta manera su distribucin de probabilidad. Ante este problema se han desarrollado algunos mtodos para estimar la distribucin de probabilidad; entre stos destaca el mtodo del rango mediano el cual es el ms utilizado y se presenta a continuacin. El rango mediano (RM) representa la proporcin acumulada de los datos correspondientes al rango bajo consideracin, la funcin de distribucin acumulada de datos empricos F' () puede determinarse para la variable aleatoria X, como sigue:
n + 0.4 y la funcin de densidad de los datos empricos f ' () : 1 f' (x i ) = (n + 0.4 ) (x i+1 x i )
F' (x i ) = RM(x i ) =
(i 0.3 )
(3.1)
(3.2)
Es necesario mencionar que para aplicar estas expresiones a los datos empricos, estos deben de ser ordenados en forma ascendente, i.e. i = 1 corresponde al resultado con el valor numrico ms bajo.77 Para aclarar este mtodo y hacer los clculos de manera fcil se presenta el siguiente ejemplo.
76
En este caso se considera muestra pequea a aquella que consta de menos de 50 datos, esto porque existen unas tablas que proporcionan las probabilidades acumuladas de los datos (en orden ascendente) correspondientes al rango bajo consideracin; estas probabilidades son calculadas mediante el mtodo del rango mediano RM aqu explicado cuya aproximacin es correcta al valor en tablas con 1% de error para 4 datos y de 0.1% para ms de 50. 77 Ibid. p. 151 -156.
41
Ejemplo 1.3.1.1 El tiempo de falla de nueve dispositivos probados se lista a continuacin: 85, 35, 38, 100, 52, 70, 27, 49 y 104. Calcule y trace la grfica de la distribucin de probabilidad. Solucin: El primer paso es ordenar en forma ascendente los datos: i 1 2 3 4 5 6 7 8 9
xi 27 35 38 49 52 70 85 100 104 Una vez ordenados los datos se calculan F' (x i ) y f' (x i ) con las ecuaciones 3.1 y 3.2 respectivamente, considerando que el tamao de muestra es n = 9 . i 1 2 3 4 5 6 7 8 9 xi
F' (x i )
f ' (x i )
27 0.0745 0.013298 35 0.1809 0.035461 38 0.2872 0.009671 49 0.3936 0.035461 52 0.5000 0.005910 70 0.6064 0.007092 85 0.7128 0.007092 100 0.8191 0.026596 104 0.9255
Finalmente, con los resultados de la tabla anterior se traza la grfica de la distribucin de probabilidad para los datos de este ejemplo.
DISTRIBUCIN DE PROBABILIDAD
0.040000 0.030000
f '(xi) 0.020000
0.010000 0.000000 0 20 40 60 80 100 120
xi
42
Un ejemplo detallado de esta metodologa se encuentra en el subcaptulo 1.7. En el ejemplo mencionado los datos son el nmero de das que cada uno de 55 clientes asisti a un gimnasio durante los 4 primeros meses del ao. A partir de los datos, se obtuvo una tabla de distribucin de frecuencias y un histograma de frecuencias, mismos que se muestran a continuacin:
TABLA DE DISTRIBUCIN DE FRECUENCIAS Frecuencia Marcas Frecuencia Frecuencia Relativa de Clase Frecuencia Acumulada Relativa Acumulada Fi* fi Fi xi fi* 9.5 6 6 0.10909 0.10909 23.5 6 12 0.10909 0.21818 37.5 6 18 0.10909 0.32727 51.5 9 27 0.16364 0.49091 65.5 4 31 0.07273 0.56364 79.5 10 41 0.18182 0.74545 93.5 14 55 0.25455 1.00000 55 1.00000
Intervalos de Clase Lmites Fronteras 3 16 2.5 16.5 17 30 16.5 30.5 31 44 30.5 44.5 45 58 44.5 58.5 59 72 58.5 72.5 73 86 72.5 86.5 87 100 86.5 100.5
HISTOGRAM A DE FRECUENCIAS 14
Clientes
9 6 6 6 4
10
9.5
23.5
37.5
51.5
65.5
79.5
93.5
De igual modo se calcularon las medidas numricas descriptivas de los datos, algunas de stas son las siguientes: Media Aritmtica: x =
x
i=1
n
2
= 58.04
Varianza: s =
2
(x
i=1
x)
n -1
= 898.11
43
Una vez hecha la hiptesis sobre la distribucin de probabilidad que siguen los datos, ser necesario determinar los parmetros de sta. El mtodo que en el siguiente subcaptulo se presenta servir para tal objetivo. Ejemplo 3.1.2 Mediante la comparacin del histograma del subcaptulo 1.7 (mismo que se muestra nuevamente en el subcaptulo 3.1.1.2) con las distribuciones de probabilidad continuas estudiadas en el subcaptulo 2.7.2 se formula la hiptesis de que tal conjunto de datos obedece una distribucin gama.
3.1.3 Mtodo de los Momentos para la Estimacin de Parmetros de una Distribucin de Probabilidad
Quiz este mtodo sea el ms antiguo para la estimacin de parmetros. ste consiste en igualar los momentos apropiados de la poblacin con los correspondientes momentos muestrales para estimar un parmetro desconocido de la distribucin. Definicin 3.1.3 Sea X 1 , X 2 , ... X n una muestra aleatoria de una distribucin con funcin
78
44
M r' =
1 n r Xi n i =1
Ejemplo 3.1.3 Con la media aritmtica y la varianza calculadas en 1.7 (mismos que se muestra nuevamente en el subcaptulo 3.1.1.2) obtenga los parmetros79 de una distribucin gama, utilizando el mtodo de los momentos. Solucin: media = Varianza = 58.04 = 898.11 =
2
= =
15.4749 3.7503
79 80 81
Cuando un parmetro es estimado, a ste se le coloca el smbolo . KAZMIER, Leonard J., Estadstica Aplicada a la Administracin y a la Economa, p. 164 - 165. CANAVOS C. George, Probabilidad y Estadstica Aplicaciones y Mtodos, p. 303.
45
En este subcaptulo se describir nicamente el mtodo del valor crtico para la prueba de hiptesis, porque las pruebas de bondad de ajuste que se estudiaran en el siguiente utilizan esta metodologa. Los pasos bsicos de la prueba de hiptesis con el Mtodo del Valor Crtico son los siguientes:
Ha .
estadstico que se especifica para rechazar la hiptesis nula. Si se especifica un nivel de significancia de 5%, la hiptesis nula se rechaza slo si el resultado muestral es tan diferente del valor hipottico que una diferencia por ese monto o un monto superior ocurrira al azar con una probabilidad de 0.05 o menos. Ntese que si se usa el nivel de significancia de 5%, hay una probabilidad de 0.05 de rechazar la hiptesis nula aun siendo efectivamente cierta. Esto se llama error tipo I. La probabilidad del error tipo I siempre es igual al nivel de significancia empleado como estndar para rechazar la hiptesis nula; se le designa con la letra griega minscula (alfa), de modo que designa tambin al nivel de significancia. Los niveles de significancia de uso ms frecuente en la prueba de hiptesis son los de 5% y 1%. Ocurre un error tipo II si la hiptesis nula no se rechaza, y es por lo tanto aceptada, cuando en realidad es falsa. En la siguiente tabla se resumen los tipos de decisiones y las posibles consecuencias de las decisiones tomadas en pruebas de hiptesis. Estados Posibles Hiptesis nula Hiptesis nula cierta falsa Aceptacin correcta Error tipo II Error tipo I Rechazo correcto
82
46
entonces el(los) valor(es) crtico(s) de la estadstica de prueba.83 En cualquier caso, un valor crtico identifica el valor de la estadstica de prueba requerido para rechazar la hiptesis nula.
Paso 5. Determinar el valor de la estadstica de prueba. Por ejemplo, al probar un valor hipottico
de la media poblacional, se recolecta una muestra aleatoria y se determina el valor de la media muestral. Si el valor crtico fue establecido como un valor z, la media muestral se convierte a un valor z. de la estadstica de prueba. Se rechaza o no entonces la hiptesis nula. Si la hiptesis nula es rechazada, no se rechazar la hiptesis alternativa.
Paso 6. Tomar la decisin. El valor observado de la estadstica muestral se compara con el valor crtico
3.1.4.1
Las pruebas de bondad de ajuste84 se emplean para decidir cundo un conjunto de datos se apega a una distribucin de probabilidad dada.85
R=
i=1
i =k
(fi f t )2
ft
Para emplear las tablas , se fija previamente el error o umbral de probabilidad, de acuerdo con las necesidades del problema. Si el perjuicio que ocasiona tomar como malo un ajuste, no sindolo, es pequeo, convendr tomar un nivel de significancia (probabilidad de rechazar un ajuste bueno) grande, 5%. Solamente si el perjuicio es grande, se tomar = 1% = 0.1% .
83
84
Estos valores pueden ser uno o dos, dependiendo de si estn implicadas las as llamadas pruebas unilaterales o bilaterales. La calidad del ajuste de una curva se basa principalmente en el criterio del error cuadrtico, el cual se define como la suma de
{fi * f t }2
sobre todos los intervalos del histograma. El ajuste que tenga menor error cuadrtico ser el
85
47
Como grados de libertad v (para manejar las tablas parmetros estimados, todo esto menos 1, es decir
2)
v = k m 1.
2
Si el valor resultante R es inferior al valor de correspondiente a y a los grados de libertad v , no se rechaza la hiptesis. Si es superior se rechaza la hiptesis y por consiguiente habr de buscar otra distribucin.86 Ejemplo 3.1.4.1.1 Con la tabla de distribucin de frecuencias obtenida en 1.7 (misma que se muestra nuevamente en el subcaptulo 3.1.1.2); y por medio de la prueba de chicuadrado con = 0.5% demuestre que el ajuste obedece a una distribucin gama con los parmetros estimados en el ejemplo anterior. Solucin: A partir de lo anterior se plantea la siguiente hiptesis: H0: Los datos se distribuyen Gama con: H1: Los datos no se distribuyen Gama con: vs
15.4749 3.7503
15.4749 3.7503
Intervalos de Clase Lmites Fronteras 3 16 2.5 16.5 17 30 16.5 30.5 31 44 30.5 44.5 45 58 44.5 58.5 59 72 58.5 72.5 73 86 72.5 86.5 87 100 86.5 100.5 101 114 100.5 114.5 115 128 114.5 128.5 129 142 128.5 142.5 143 156 142.5 156.5 157 170 156.5 170.5 171 184 170.5 184.5 185 198 184.5 198.5 199 212 198.5 212.5 213 226 212.5 226.5 227 240 226.5 240.5 241 254 240.5 254.5
Marcas Frecuencia de Clase Frecuencia Acumulada xi fi Fi 9.5 6 6 23.5 6 12 37.5 6 18 51.5 9 27 65.5 4 31 79.5 10 41 93.5 14 55 107.5 0 55 121.5 0 55 135.5 0 55 149.5 0 55 163.5 0 55 177.5 0 55 191.5 0 55 205.5 0 55 219.5 0 55 233.5 0 55 247.5 0 55 55
86
48
Fronteras 2.5 16.5 16.5 30.5 30.5 44.5 44.5 58.5 58.5 72.5 72.5 86.5 86.5 100.5 100.5 114.5 114.5 128.5 128.5 142.5 142.5 156.5 156.5 170.5 170.5 184.5 184.5 198.5 198.5 212.5 212.5 226.5 226.5 240.5 240.5 254.5
2 (3, 0.005 )
mencionado de exigir frecuencias tericas de cierto tamao ( f t > 5 ), por lo que no siempre puede utilizarse por insuficiencia de los mismos. A partir de la ley de Kolmogorov, que estudia las diferencias entre las frecuencias acumuladas para los valores de la muestra con respecto a las probabilidades acumuladas correspondientes a la funcin de distribucin acumulativa de la variable terica, se ha ideado una prueba que permite verificar la bondad de un ajuste independientemente del nmero de efectivos frecuencia observada (fi) que se disponga. La prueba consta de las siguientes fases: Fase 1. Se calcula el valor D n
D n = m ax Fi * - F ( x )
49
muestra y F ( x ) 87 son las probabilidades tericas acumuladas correspondientes a los mismos valores. Fase 2.
en donde Fi * son las frecuencias relativas acumuladas para cada uno de los n valores de la
D n (1 ) lmite proporcionado en las tablas de la prueba de Kolmogorov para un determinado nivel de confianza 1 - .
Fase 3. Si D n encontrado < D n (1 ) en tablas H0, no se rechaza con un nivel de confianza 1 . Si D n encontrado > D n (1 ) en tablas H0, se rechaza con un margen de error ( , generalmente es igual a 5% 1%).88 Ejemplo 3.1.4.2 Con la tabla de distribucin de frecuencias obtenida en 1.7 (misma que se muestra nuevamente en el subcaptulo 3.1.1.2); y por medio de la prueba de Kolmogorov con = 5% demuestre que el ajuste obedece a una distribucin gama con los parmetros estimados en el ejemplo 3.1.3. Solucin: A partir de lo anterior se plantea la siguiente hiptesis: H0: Los datos se distribuyen Gama con: H1: Los datos no se distribuyen Gama con: VS
15.4749 3.7503
15.4749 3.7503
87
88
50
Intervalos de Clase Lmites Fronteras 3 16 2.5 16.5 17 30 16.5 30.5 31 44 30.5 44.5 45 58 44.5 58.5 59 72 58.5 72.5 73 86 72.5 86.5 87 100 86.5 100.5 101 114 100.5 114.5 115 128 114.5 128.5 129 142 128.5 142.5 143 156 142.5 156.5 157 170 156.5 170.5 171 184 170.5 184.5 185 198 184.5 198.5 199 212 198.5 212.5 213 226 212.5 226.5 227 240 226.5 240.5 241 254 240.5 254.5
Frecuencia Probabilidad Marcas Frecuencia Relativa Acumulada de Clase Frecuencia Acumulada Acumulada Terica fi Fi Fi* xi max Fi*- F(x) F(x) 9.5 6 6 0.1091 0.0336 0.075 23.5 6 12 0.2182 0.1724 0.046 37.5 6 18 0.3273 0.3760 0.049 51.5 9 27 0.4909 0.5747 0.084 0.168 65.5 4 31 0.5636 0.7315 79.5 10 41 0.7455 0.8401 0.095 93.5 14 55 1.0000 0.9090 0.091 107.5 0 55 1.0000 0.9501 0.050 121.5 0 55 1.0000 0.9734 0.027 135.5 0 55 1.0000 0.9862 0.014 149.5 0 55 1.0000 0.9930 0.007 163.5 0 55 1.0000 0.9965 0.004 177.5 0 55 1.0000 0.9983 0.002 191.5 0 55 1.0000 0.9992 0.001 205.5 0 55 1.0000 0.9996 0.000 219.5 0 55 1.0000 0.9998 0.000 233.5 0 55 1.0000 0.9999 0.000 247.5 0 55 1.0000 1.0000 0.000 Dn= 0.168 55
Considerando que, n = 18 se obtiene que D18 (0.95 ) = 0.318 . Como D18 < D18 (0.95 ) la hiptesis nula H0 no se rechaza. Por lo tanto, se puede tomar este ajuste como bueno. Tanto la prueba chicuadrado como la de Kolmogorov calificaron este ajuste como bueno, sin embargo posiblemente existan otras distribuciones de probabilidad que satisfagan las pruebas de bondad de ajuste, por lo que se elegir a la distribucin que tenga el menor error cuadrtico, como se mencion en 3.1.4.1.
89
51
p s2 s
de
Muestra
Requerido
para
la
Supongamos que se especifican el tamao deseado de un intervalo de confianza y el nivel de confianza asociado con l. Si es conocida o puede estimarse a partir de los estudios similares por ejemplo, el tamao de muestra requerido con base en el uso de la distribucin normal es Cuando lo que se busca determinar es el tamao de la muestra, todo resultado fraccionario se redondea siempre al valor inmediato superior. Adicionalmente, todo tamao de muestra calculado por debajo de 30 debe ser incrementado a 30 porque la frmula se basa en la distribucin normal.
z n= E
Donde:
z= =
E=
Es el valor utilizado para el nivel de confianza especificado. Es la desviacin estndar de la poblacin (o su estimacin). Es el error de muestreo de ms o de menos permitido en el intervalo.
Cuando el error de muestreo no se conoce este puede ser estimado con la frmula que a continuacin se presenta:
E X =
90 91
52
En este caso n se refiere al nmero de elementos en la muestra preliminar al muestreo que se va realizar. Ejemplo 3.2.1 Un administrador de recursos humanos desea estimar el nmero medio de horas de capacitacin al ao para los supervisores con un margen de error inferior a 2 horas (de ms o de menos) y confianza de 90%. Con base en datos de aos previos el administrador estima que la desviacin estndar es = 20 horas. El tamao de muestra requerido es:
de
Muestra
Requerido
para
la
El tamao de muestra mnimo requerido puede determinarse especificando el nivel de confianza requerido y el error de muestreo aceptable y haciendo una estimacin inicial (subjetiva) de , la proporcin poblacional desconocida:
n=
z (1 ) E2
2
Cuando lo que se busca determinar es el tamao de la muestra, todo resultado fraccionario se redondea siempre al valor inmediato superior. Adicionalmente, todo tamao de muestra calculado por debajo de 100 se debe de incrementar a 100 porque la formula se basa en la distribucin normal.
Donde:
= E=
z=
Es el valor utilizado para el nivel de confianza especificado. Es la estimacin inicial de la proporcin poblacional Es el error de muestreo de ms o de menos permitido en el intervalo (siempre la mitad del intervalo de confianza completo).
Si no es posible determinar un estimado inicial de , se le deber estimar en 0.50. Esta estimacin es conservadora en tanto que representa el valor para el que se requerira el tamao de muestra mayor. Cuando el error de muestreo no se conoce este puede ser estimado con la frmula del error estndar que a continuacin se presenta:
E sp =
p(1 p ) n
En este caso n se refiere al nmero de elementos en la muestra preliminar al muestreo que se va realizar. Ejemplo 3.2.2 El director administrativo de una universidad desea estimar, con un margen de error inferior a 0.05 y confianza del 90%, la proporcin de estudiantes inscritos en programas de maestra en ingeniera de sistemas hayan cursado la carrera de actuara. Cul sera el tamao de muestra mnimo si los datos e informacin previos indican que la proporcin no ser mayor a 0.30?
92
53
Solucin:
Con este ejemplo, se concluye la teora necesaria para efectuar el anlisis de datos de un fenmeno o de varios; y con el cual se obtienen conjeturas y/o caractersticas de stos, mismas que pueden ser representadas con un modelo del sistema; y con el uso de otra metodologa conduce a la elaboracin de inferencias del sistema, la metodologa que esta tesis presenta es la de simulacin y se expone en el siguiente captulo.
54
CAPTULO 4 SIMULACIN
El modelado de simulaciones se basa principalmente en la computacin, la probabilidad y la estadstica, las bases necesarias de stas dos ltimas fueron presentadas en los captulos previos, por esta razn en este captulo se complementa a estos elementos, con el modelado de sistemas, esto para poder realizar experimentos de muestreo sobre un modelo del sistema, es decir realizar simulacin.
4.1
La teora General de Sistemas (TGS) se presenta como una forma sistemtica y cientfica de aproximacin y representacin de la realidad y, al mismo tiempo, como una orientacin hacia una prctica estimulante para formas de trabajo multidisciplinarias. En la TGS lo importante son las relaciones y los conjuntos que a partir de ellas emergen; ofreciendo un ambiente adecuado para la interrelacin y comunicacin entre especialistas y especialidades. Los objetivos originales de la Teora General de Sistemas son los siguientes: Impulsar el desarrollo de una terminologa general que permita describir las caractersticas, funciones y comportamientos sistmicos. Desarrollar un conjunto de leyes aplicables a todos estos comportamientos. Promover una formalizacin (matemtica) de estas leyes.93
Entidad:
Atributos:
Relacin: Ambiente:
93
RINCON, Juana, Cooperacin del Personal Acadmico: Mecanismo para la Integracin del Sistema Universitario Nacional. http://members.tripod.com/~gepsea/sistema.htm 94 Cfr. Ibid.
55
Objetivo:
Actividad proyectada o planeada que se ha seleccionado antes de su ejecucin y est basada tanto en apreciaciones subjetivas como en razonamientos tcnicos de acuerdo con las caractersticas que posee el sistema. Son aquellos que importan y procesan elementos de sus ambientes.95
Son aquellos en los cuales ningn elemento de afuera entra y ninguno sale del sistema.96
Subsistemas:
Se entiende por stos a un conjunto de elementos y relaciones que responden a estructuras y funciones especializadas dentro de un sistema mayor. En trminos generales, los subsistemas tienen las mismas propiedades que los sistemas. Es una representacin del sistema o de una parte de ste.
A B S T R A C C I N
MODELO
REALIDAD
A P L I C A C I N
FIGURA 4.1 Rompimiento entre la Realidad y el Modelo.97 La figura anterior ilustra la relacin entre el modelo y la realidad donde se aprecia un rompimiento entre ellos, este rompimiento se da en el proceso de abstraccin al seleccionar los elementos ms importantes, y en la determinacin de las reglas o leyes de relacin entre dichos elementos, de ah el sumo cuidado que el investigador debe procurar para la construccin del modelo.98
95
sta es una caracterstica propia de todos los seres vivos. Que un sistema sea abierto significa que establece intercambios permanentes con su ambiente, intercambios que determinan su equilibrio, capacidad reproductiva o continuidad, es decir su viabilidad o permanencia en el entorno. 96 stos alcanzan su estado de mximo equilibrio al igualarse con el medio. En ocasiones el trmino sistema cerrado es tambin aplicado a sistemas que se comportan de una manera fija, rtmica o sin variaciones. 97 SAUTTO Vallejo, Jos Maclovio, La tcnica de la Simulacin Digital en la Investigacin de Operaciones. p. 10. 98 Idem.
56
4.3
Simulacin
Desde el punto de vista de la investigacin de operaciones, la simulacin es una tcnica de muestreo estadstico controlada para estimar el desempeo de sistemas estocsticos complejos cuando los modelos analticos no son suficientes. Ms que describir el comportamiento global de un sistema directamente, el modelo de simulacin describe la operacin del mismo en trminos de los eventos individuales de cada una de las componentes del sistema. En particular, el sistema se divide en elementos cuyo comportamiento se puede predecir, al menos en trminos de distribuciones de probabilidad para cada uno de los diferentes estados posibles del sistema y sus insumos. Tambin se construyen dentro del modelo las interrelaciones entre esos elementos. Entonces, la simulacin proporciona un medio para dividir el trabajo de construir un modelo en componentes ms pequeas que se pueden formular con mayor facilidad (por ejemplo, una componente puede ser un sistema de lneas de espera sencillo) y despus combina estas componentes en su orden natural. Una vez construido el modelo se activa usando nmeros aleatorios para generar los eventos simulados a travs del tiempo, de acuerdo con las distribuciones de probabilidad apropiadas. El resultado es una simulacin de la operacin del sistema real a travs del tiempo en la que se puede registrar su comportamiento agregado. Si este proceso se repite para las diferentes configuraciones del diseo y las polticas de operacin del sistema y se compara su desempeo, se pueden identificar las configuraciones que ms prometen. Debido al error estadstico, es imposible garantizar que la configuracin que produzca el mejor comportamiento simulado sea la ptima pero al menos debe ser cercana a la ptima si el experimento de simulacin estuvo bien diseado. As, la simulacin, en general, no es otra cosa que la tcnica de realizar experimentos de muestreo sobre el modelo del sistema. Los experimentos se llevan a cabo en el modelo en lugar de hacerlo en el propio sistema real ya que esto ltimo resultara inconveniente, muy caro y muy tardado. Por lo dems, los experimentos simulados deben considerarse en esencia iguales a los experimentos estadsticos comunes, por lo que tambin debern tener como fundamento la teora estadstica formal.99
4.4
Resultara limitante o redundante dar una serie de pasos a seguir al resolver problemas de simulacin, sin embargo algunos autores que escriben al respecto proponen ciertos pasos de acuerdo a su experiencia personal, a continuacin se compilan algunos de estos no como una secuencia a seguir, sino como una referencia de la cual partir: 1. Definicin del Sistema. Para tener una definicin exacta del sistema, se debe de hacer un anlisis en el que se determine, cules son las entidades del mismo, consecuentemente sus atributos, relaciones y el ambiente. 2. Coleccin y Anlisis de Datos. Una vez definido lo anterior, se deben recolectar datos sobre cada uno de los componentes del sistema; despus proceder a un anlisis estadstico de stos; ya que los resultados de ste facilitaran el siguiente paso. 3. Formulacin del Modelo. Definir y construir el modelo con el cual se espera obtener los resultados deseados.
99
100
HILLER, Frederick S. y Gerald J. LIEBERMAN, Introduccin a la Investigacin de Operaciones, p. 900902. Cfr. COSS Bu, Ral, Simulacin un Enfoque Prctico, p. 1214. SAUTTO op. cit. 1214.
57
4. Implementar el Modelo en la Computadora. En este paso el modelo del sistema se lleva a la computadora, ya sea que ste se programe en algn lenguaje de computacin o utilizando un paquete. 5. Validacin y Calibracin. En este paso el modelo se alimenta con ciertas condiciones conocidas del sistema, se comparan los resultados obtenidos con los esperados, en caso de que estos difieran, se mueven los parmetros de calibracin del sistema hasta obtener los resultados esperados. Este proceso conduce con frecuencia a un ciclo que puede conducir al paso 3. 6. Experimentacin. Consiste en generar los datos deseados. En esta etapa se contestan las siguientes preguntas: Qu grado de precisin requiere? y consecuentemente Tamao de Muestra? 7. Interpretacin. En esta etapa se interpretan los resultados que arroja la simulacin y se elaboran las sugerencias. 8. Implementacin de la Solucin. Una vez aprobadas las sugerencias se procede a su implementacin.
4.5
Ejemplo de Simulacin
Considere el modelo M/M/1 de teora de colas (entradas Poisson, tiempo de servicio exponencial y un solo servidor). En particular, suponga que los valores de la tasa de llegadas
y la tasa de servicio
son:
= 3 por hora
= 5 por hora
Para resumir la operacin fsica del sistema, los clientes que llegan se unen a una cola, eventualmente son servidos y despus se van. Es necesario que el modelo de simulacin describa y sincronice la llegada de los clientes y el servicio de los mismos. Comenzando en el tiempo 0, el reloj simulador registra el tiempo (simulado) t que ha transcurrido hasta ahora durante la corrida de simulacin. La informacin sobre el sistema de colas que define el estado actual, es decir, el estado del sistema es
N (t ) + 1, N (t ) 1,
Existen mtodos para hacer que avance el reloj simulador y registrar la operacin del sistema. Ahora se describir e ilustrarn de incrementos de tiempo fijo que sirve para avanzar el tiempo. En el mecanismo de incrementos de tiempo fijo se usa repetidamente el siguiente procedimiento de dos pasos:
58
Resumen de Incrementos de Tiempo Fijo 1. Se avanza el tiempo una cantidad fija pequea. 2. Se actualiza el sistema determinando los eventos que ocurrieron durante este lapso y el estado del sistema que resulta. Tambin se registra la informacin deseada sobre el comportamiento del sistema. En el caso del modelo de lneas de espera que se analiza ahora, slo pueden ocurrir dos tipos de eventos durante cada uno de estos intervalos, a saber, una o ms llegadas y una o ms terminaciones de servicio. Es ms, la probabilidad de que ocurran dos o ms llegadas o dos o ms terminaciones de servicio durante una unidad de tiempo es despreciable para este modelo si la unidad de tiempo es relativamente pequea. Entonces, los nicos dos eventos posibles en esa unidad de tiempo, que se tienen que investigar son la llegada de un cliente y la terminacin de servicio de un cliente. Cada uno de estos eventos tiene una probabilidad conocida. A manera de ejemplo se usar 0.1 horas (6 minutos) como la cantidad fija pequea en que se avanza el reloj cada vez. (Normalmente se usara un intervalo mucho ms chico para que en realidad sea despreciable la probabilidad de llegadas o terminaciones de servicio mltiples, pero esta eleccin crear ms movimientos con el fin de ejemplificar). Debido a que tanto los tiempos entre llegadas como los de servicio tienen una distribucin exponencial, la probabilidad PLl de que un intervalo de 0.1 horas incluya una llegada es
PLl = 1 e 3 / 10 = 0.259 ,
y la probabilidad PS de que incluya una salida (terminacin de servicio), dado que se estaba sirviendo un cliente al inicio del intervalo es
PLl = 1 e 5 / 10 = 0.393 .
Para generar aleatoriamente cualquiera de los dos eventos de acuerdo a estas probabilidades. La computadora se usa para generar un nmero aleatorio uniforme en el intervalo (0,1), es decir, se tiene una observacin aleatoria a partir de una distribucin uniforme entre 0 y 1. Si este nmero aleatorio se denota por rLl ,
dado que haba un cliente en servicio al principio del intervalo. Sin clientes en servicio (es decir, sin clientes en el sistema) se supone que no pueden ocurrir salidas durante el intervalo aunque haya ocurrido una llegada.
59
La siguiente tabla, muestra los resultados al usar este enfoque para 10 iteraciones del procedimiento de incrementos de tiempo fijo comenzando sin clientes en el sistema y usando minutos como unidad de tiempo.
t tiempo (min) 0 6 12 18 24 30 36 42 48 54 60 Llegada en el intervalo? No No Si No No No Si Si No Si Salida en el intervalo? Si No Si Si No
r Ll 0.722 0.577 0.138 0.410 0.845 0.931 0.014 0.026 0.557 0.228
N(t) 0= 0+0-0= 0+0-0= 0+1-1= 0+0-0= 0+0-1= 0+0-0= 0+1-0= 1+1-1= 1+0-1= 0+1-0=
0 0 0 0 0 0 0 1 1 0 0
Como se observ en la tabla, el siguiente paso del procedimiento (actualizar el sistema) incluye el registro de las medidas de desempeo deseadas sobre el comportamiento agregado al sistema durante este intervalo.101 En el ejemplo anterior se apreci que en simulacin es necesario tener conocimiento de lo siguiente: 1. Generacin de nmeros aleatorios uniformes en el intervalo (0,1). 2. Generacin de variables aleatorias nouniformes. 3. Conocer la notacin empleada en teora de colas. Por esta razn, en los siguientes subcaptulos se desarrollan estos temas.
4.6 Mtodo Congruencial Mixto para la Generacin de Nmeros Aleatorios con Distribucin Uniforme en el Intervalo (0,1)
Los generadores congrueneciales lineales generan una secuencia de nmeros pseudoaleatorios en la cual el prximo nmero pseudoaleatorio es determinado a partir del ltimo nmero generado, es decir el nmero pseudoaleatorio X n +1 es derivado a partir del nmero pseudoaleatorio X n . Para el caso particular del generador congruencial mixto, la relacin de recurrencia es la siguiente:
X n +1 = (aX n + c ) mod m
101
60
donde:
X0 = a= c= m=
el multiplicador (a > 0 )
la semilla (X 0 > 0 )
Esta relacin de recurrencia dice que X n +1 es el residuo de dividir aX n + c entre el mdulo. Lo anterior significa que los valores posibles de X n +1 son 0, 1, 2, , m 1 , es decir m representa el nmero posible de valores diferentes que pueden ser generados. Con el propsito de ilustrar la generacin de nmeros pseudoaleatorios a travs de este mtodo, suponga que se tiene un generador en el cual los valores de los parmetros son: a = 5 , c = 7 , X0 = 4 y m = 8 . Para estos valores, la secuencia de nmeros pseudoaleatorios y nmeros uniformes (X n +1 / m ) son mostrados en la siguiente tabla, el perodo del generador es 8.102
Nmeros n Xn (5Xn +7)/8 Xn +1 Uniformes 0 4 3 + 3/8 3 3/8 1 3 2 + 6/8 6 6/8 2 6 4 + 5/8 5 5/8 3 5 4 + 0/8 0 0 4 0 0 + 7/8 7 7/8 5 7 5 + 2/8 2 2/8 6 2 2 + 1/8 1 1/8 7 1 1 + 4/8 4 4/8
para
la
Generacin
de
1 R
x = F (R )
-1
102 103
61
que se va a simular. Puesto que F ( x ) est definida en el intervalo (0,1), se puede generar un numero aleatorio uniforme R y tratar de determinar el valor de la variable aleatoria para la cual su distribucin acumulada es igual a R , es decir, el valor simulado de la variable aleatoria que sigue una distribucin de probabilidad f ( x ) , se determina al resolver la siguiente ecuacin:
F ( x ) = R x = F 1 ( R )
La dificultad principal de este mtodo descansa en el hecho de que en algunas ocasiones es difcil encontrar la transformada inversa. Ejemplo 4.7 Distribucin exponencial
e x si x 0 f (x ) = si x < 0 0
La distribucin acumulada de esta distribucin es:
F ( x ) = e x dt = 1 e x
0
y utilizando el mtodo de la transformada inversa, es decir, igualando la distribucin acumulada con el nmero uniforme R, se obtiene:
Pero si R sigue una distribucin uniforme, entonces 1 R tambin sigue esta distribucin. Por consiguiente:
1 e x = R e x = 1 R 1
x=
Ln R .
62
Primero en entrar Primero en salir ltimo en entrar ltimo en salir Servicio en forma aleatoria Prioridad Disciplina General
La representacin de una cola es de la siguiente forma A/B/X/Y/Z. Normalmente se utilizan los primeros tres smbolos, omitindose los smbolos Y y Z. As M/D/2 representa un sistema de espera con tiempo entre llegadas exponencial, servicio determinstico, dos estaciones de servicio, ningn limite en la capacidad del servicio y como disciplina primero en llegar primero en servicio.104 En los captulos previos as como en este, se han desarrollado y analizado los conceptos y herramientas requeridas para el uso de la estimacin de la distribucin de probabilidad y de la simulacin; por consiguiente en el captulo precedente se avanzar con una aplicacin en el que se conjunten stas tcnicas.
104
63
CAPTULO 5 CASO PRCTICO: DETERMINACIN DE LAS CUOTAS DE TARIFA PARA EL SEGURO DE RESPONSABILIDAD CIVIL AGENTES DE SEGUROS (PERSONAS FSICAS)
En el presente captulo se conjunta a los elementos de la Matemtica del Seguro con los que se presentaron en las pginas previas, para determinar sobre bases tcnicas, las primas netas de riesgo a fin de garantizar con un elevado grado de certidumbre, el cumplimiento de las obligaciones que contraigan con sus asegurados las instituciones de seguros, estas bases deben de ser presentadas en una nota tcnica, como lo mencionan los artculos 36 y 36-A entre otros de la Ley General de Instituciones y Sociedades Mutualistas de Seguros105. Se entiende por nota tcnica a la documentacin que integra el conjunto de procedimientos tcnicos esenciales en el diseo de un seguro para efectos de su registro; ya sea que se trate de un seguro nuevo o de la sustitucin de uno previamente registrado.106 En nuestro pas es la Comisin Nacional de Seguros y Fianzas (C.N.S.F.) el organismo encargado de conocer y resolver sobre los registros, control, revisin, supervisin, etctera de cualquier actividad aseguradora; entre stos el procedimiento para el registro de un seguro o nota tcnica. La CNSF hace del conocimiento de los sectores supervisados, los consumidores y el pblico en general, las disposiciones especificas que emite con base en un marco jurdico aplicable, a travs de circulares que se publican en el Diario Oficial de la Federacin (DOF) y dentro de stas, se encuentran las que regulan el registro de Tarifas y Documentacin Contractual, entre las que se destaca a la circular S8.1107; en la que se seala la forma y trminos para el registro de productos de seguros, la disposicin dcima segunda menciona los datos que stas debern contener segn apliquen para la operacin, ramo y seguro que se trate. Atendiendo sas disposiciones se elabor el presente captulo el cual corresponde a una nota tcnica para el Seguro de Responsabilidad Civil Agentes de Seguros (Personas Fsicas), misma que a continuacin se presenta.
Ley General de Instituciones y Sociedades Mutualistas de Seguros. VARGAS Aguilar, Juan Carlos, Fundamentos para el Desarrollo de Productos en Daos, p. 96. Diario Oficial de la Federacin, 20 de Febrero de 2004.
64
NOTA TCNICA DE LA TARIFA PARA EL SEGURO DE RESPONSABILIDAD CIVIL AGENTES DE SEGUROS (PERSONAS FSICAS)
NDICE108 i. CARACTERSTICAS GENERALES DEL PLAN i.1 i.2 i.3 i.4 Nombre Comercial del Plan Descripcin de la Cobertura Bsica Temporalidad del Plan Operacin y Ramo en el que se Registrar Pgina 67 ... .. . . 67 67 68 68 68 68 69 69 69 69 69 69 69 70 70 70 72 75 75 76 76 76 77 78 79 80
ii. HIPTESIS ESTADSTICAS Y FINANCIERAS ii.1 Hiptesis Estadsticas ii.2 Hiptesis Financieras ii.2.1 Utilidad Tcnica iii. PROCEDIMIENTOS TCNICOS iii.1 iii.2 iii.3 iii.4
. . . ..
iii.5
Gastos de Administracin Gastos de Adquisicin . Gastos Totales .. Procedimientos para la Generacin de Datos Mediante Simulacin Estocstica iii.4.1 Definicin del Sistema iii.4.2 Anlisis de Datos iii.4.2.1 Estimar la Distribucin de Probabilidad del Volumen de Prima Intermediada por Agente iii.4.2.2 Estimar la Distribucin de Probabilidad Emprica de los Siniestros Utilizando el Mtodo del Rango Mediano para Muestras Pequeas iii.4.2.3 Determinar las Probabilidades de Siniestro para Diferentes Montos de Prima Intermediada iii.4.3 Formulacin del Modelo .. iii.4.4 Implementar el Modelo en la Computadora iii.4.5 Experimentacin ... iii.4.5.1 Determinar el Tamao iii.4.5.1 de Muestra iii.4.5.2 Generacin de Carteras del Seguro de Responsabilidad Civil Agentes de Seguros (Personas Fsicas) Utilizando Simulacin Estocstica ... iii.4.6 Interpretacin de los Resultados .. Procedimientos para el Clculo de Cuotas . iii.5.1 Clculo de Cuotas sin Deducible .
108
En este captulo la numeracin cambia para no confundir al lector con la de la nota tcnica.
65
85 89 92
66
i i.1
El plan que se enva a ustedes para efectos de registro y vigilancia se denomina SEGURO DE RESPONSABILIDAD CIVIL PARA AGENTES DE SEGUROS (Personas Fsicas).
i.2
La Compaa se obliga a reparar o, a su eleccin, indemnizar los daos y perjuicios que el Asegurado cause al pblico, conforme a la legislacin en materia de responsabilidad civil vigente en los Estados Unidos Mexicanos, por actos negligentes o imperitos (acciones u omisiones); resultantes de su actividad de agente de seguros, ocurridos y reclamados al Asegurado durante la vigencia de esta pliza, amparndose las siguientes responsabilidades: 1. La responsabilidad por daos directos al patrimonio: Se entendern bajo este concepto. Los daos en sentido estricto (prdidas o menoscabos sufridos en el patrimonio), as como los perjuicios (privaciones de ganancia lcita que necesariamente se hubiese obtenido de no haberse presentado los daos) que se causen a los clientes del Asegurado, sin incluir daos corporales o daos materiales a sus propiedades o un perjuicio consecuencial a ambos. La responsabilidad de la Compaa empieza despus de la aplicacin del deducible a cargo del Asegurado. 2. La responsabilidad por prdida o destruccin de documentos: La responsabilidad civil legal por daos y perjuicios que sufran los clientes del Asegurado por daos materiales destruccin o prdidas de documentos que los clientes le hayan entregado para el desarrollo de las actividades encomendadas. No se incluyen bajo el concepto de documentos, dinero, moneda extranjera, otros signos pecuniarios, metales amonedados, ttulos de crdito, valores, cualquier otro ttulo representativo de dinero, mercancas, valores o promesas, por ltimo, archivos o almacenamientos para el procesamiento electrnico de datos. Las reclamaciones contra este concepto procedern de acuerdo con el orden siguiente: Primero En el caso de prdida de documentos, el Asegurado proceder a una bsqueda diligente y de ella levantar una constancia circunstanciada. Segundo En los dems casos la Compaa determinar si procede efectuar gestiones extrajudiciales, judiciales o tcnicas para obtener la restauracin o la reposicin de documentos; los gastos
67
y costos sern por cuenta de la Compaa, despus de aplicar el deducible a cargo del Asegurado. Tercero Despus de agotar las posibilidades de encuentro, restauracin o reposicin, la Compaa determinar la procedencia y extremos de la responsabilidad civil legal, para proceder a indemnizar al cliente del Asegurado; despus de la aplicacin del deducible a cargo de ste. 3. La responsabilidad civil legal personal de los empleados y trabajadores del Asegurado frente al pblico (quienes se consideraran Asegurados), derivada del ejercicio de la actividad materia de este seguro.
i.3
i.4
Este plan se utilizar dentro de las operaciones de RESPONSABILIDAD CIVIL Y RIESGOS PROFESIONALES.
ii
La Compaa cuenta con una cartera escasa para este tipo de seguros, ya que tiempo antes no era obligatorio para los agentes de seguros contratar una pliza por errores u omisiones, por este motivo cuando se han suscrito negocios de este tipo se ha hecho siguiendo las medidas recomendadas por nuestro reasegurador (reaseguro facultativo) en el ramo de responsabilidad civil.
ii.1
Hiptesis Estadsticas
La informacin de nuestra cartera para los aos 1998, 1999 y 2000 misma que se muestra en el anexo 1; aunque escasa permite hacer inferencias con impacto positivo, con el uso de los mtodos que se detallan en procedimientos tcnicos.
109
Generalmente en los seguros para operaciones en daos se otorga la cobertura menor o igual a un ao.
68
ii.2
Hiptesis Financieras
iii iii.1
iii.2
Gastos de Adquisicin
iii.3
Gastos Totales
iii.4
la
Generacin
de
Datos
Mediante
Debido a que los datos de la cartera no constituyen una muestra suficientemente grande, estos sern utilizados como referencia para generar ms datos con el supuesto de provenir de la misma funcin de distribucin, para tal objetivo los procedimientos utilizados sern: Definicin del Sistema. Anlisis de Datos: Estimar la Distribucin de Probabilidad del Volumen de Prima Intermediada por Agente. Estimar la Distribucin de Probabilidad Emprica de los Siniestros utilizando el Mtodo del Rango Mediano para Muestras Pequeas. Determinar las Probabilidades de Siniestro para Diferentes Montos de Prima Intermediada. Formulacin del Modelo. Implementar el Modelo en la Computadora. Experimentacin. Determinar el Tamao de Muestra Requerido. Generacin de Carteras del Seguro de Responsabilidad Civil Agentes de Seguros (Personas Fsicas) Utilizando Simulacin Estocstica. Interpretacin de los Resultados.
110
Es la utilidad que espera (planea y desea) obtener el asegurador despus del pago de los siniestros y de los gastos de administracin y de adquisicin.
69
Agente de Seguros Contrato Compaa de Seguros Pago Indemnizacin Tercero Afectado Dao
En la figura anterior se muestra un modelo del sistema, en este mismo se aprecia que el contrato de seguro cubrir al asegurado por errores u omisiones que ste cause a terceros en su actividad de agente de seguros.112 Para entender mejor el sistema observe la siguiente tabla: RELACIONES EN EL SISTEMA Atributo Entidad Financiera que asegura al Agente de seguros mediante el pago de una prima y consecuentemente pagar los daos que ste cause a un tercero hasta el lmite de responsabilidad contratado. Intermediario (para asesora y venta de seguros) entre la Compaa y el pblico en general. Persona a quien le causa un dao el asegurado (agente de seguros) y que se conoce al momento del siniestro.
iii.4.2 Anlisis de Datos iii.4.2.1 Estimar la Distribucin de Probabilidad del Volumen de Prima Intermediada por Agente113
Se utiliz el software Arena para estimar la Distribucin de Probabilidad que mejor se ajusta a los datos del Anexo 2 obtenindose los siguientes resultados:
Vid: 4.2 El Sistema y Otros Conceptos Relacionados con ste. Vid: i.2 Descripcin de la Cobertura Bsica. Vid: Captulo 1 Estadstica Descriptiva.
70
Distribution Summary Distribution: Exponential114 Expression: 0.999 + EXPO(1.32e+006) Square Error: 0.011007 Chi Square Test115 Number of intervals =4 Degrees of freedom =2 Test Statistic = 8.07 Corresponding p-value = 0.0193 Kolmogorov-Smirnov Test116 Test Statistic = 0.499 Corresponding p-value < 0.01 Data Summary Number of Data Points Min Data Value = Max Data Value = Sample Mean = Sample Std Dev = = 168 1 1.42e+007 1.32e+006 2.38e+006
Function Erlang Exponential Beta Weibull Gamma Normal Lognormal Triangular Uniform
Sq Error 0.011 0.011 0.0152 0.0442 0.159 0.237 0.278 0.329 0.388
Histogram Summary Histogram Range = 0.999 to 1.42e+007 Number of Intervals = 12 Es decir que la Distribucin de Probabilidad que mejor aproxima el Volumen de Prima Intermediada por Agente es:
Vid: 2.2.7.5 Distribucin Exponencial Negativa. Vid: 3.1.4.1.1 Prueba de Bondad de Ajuste ChiCuadrado. Vid: 3.1.4.1.2 Prueba de Bondad de Ajuste de Kolmogorov.
71
x 1 e f (x; ) = 0.999 + 0
donde: = 1'320,000
iii.4.2.2 Estimar la Distribucin de Probabilidad Emprica de los Siniestros Utilizando el Mtodo del Rango Mediano para Muestras Pequeas117
En la siguiente tabla se muestran los siniestros presentados en los aos de 1998 al 2000 y cuyas cifras estn en moneda nacional: SINIESTRO AO EN QUE SE PRESENTO MONTO 1998 2,000.00 1998 10,250.40 1999 427,845.73 2000 238,501.00 2000 30,404.61 A estos datos se les aplic el mtodo del rango mediano para muestras pequeas obtenindose lo siguiente: SINIESTRO NDICE MONTO 1 2,000.00 2 10,250.40 3 30,404.61 4 238,501.00 5 427,845.73 F(xi) 0.1796 0.3648 0.5500 0.7352 0.9204 f(xi) 0.00002245 0.00000919 0.00000089 0.00000098
117
Vid: 3.1.1.1 Mtodo del Rango Mediano para la Estimacin de la Distribucin de Probabilidad para Muestras Pequeas.
72
f '(xi)
0,00001500 0,00001000 0,00000500 0,00000000 0 50.000 100.000 150.000 200.000 250.000 300.000
MONTO DE SINIESTROS
Una vez que a los datos se les aplic la metodologa para muestras pequeas y se obtuvo el grfico arriba mostrado, despus se utiliz el software Arena para determinar qu funcin de distribucin se aproximaba ms; el resultado fue una distribucin gama, sin embargo esto se tiene que probar. Distribution Summary Distribution: Gamma118 Expression: -0.001+GAMM(8.29e+003, 0.121) Square Error: 0.291965 Kolmogorov-Smirnov Test119 Test Statistic = 1.23e+003 Corresponding p-value < 0.01 Data Summary Number of Data Points Min Data Value = Max Data Value = Sample Mean = Sample Std Dev = =2 0 2e+003 1e+003 1.41e+003 Function Gamma Exponential Erlang Uniform Weibull Lognormal Normal Triangular Beta Sq Error 0.292 0.298 0.298 0.3 0.306 0.345 0.364 0.416 -1.#J
Histogram Summary Histogram Range = -0.001 to 2e+003 Number of Intervals = 5 A partir de lo anterior se plantea la siguiente hiptesis: H0: Los siniestros se distribuyen Gama
118 119
vs
Vid: 2.7.2.3 Distribucin Gama. Vid: 3.1.4.1.2 Prueba de Bondad de Ajuste de Kolmogorov.
73
Para probar lo anterior debemos estimar los parmetros de esta distribucin, recordemos lo siguiente: Se dice que la variable aleatoria X tiene una distribucin gama si su funcin de densidad de probabilidad est dada por: Funcin de Densidad de Probabilidad
f (x; ; ) =
()
Media
x 1e
( )
x
Utilizando el mtodo de los momentos120 se estimaron los parmetros que a continuacin se presentan: media = Varianza =
x=
141,800.35 =
s 2 = 35,107878,306 = 2
= 247,586.69
= 0.5727301
Con los parmetros anteriores se obtienen las Probabilidades Tericas Acumuladas F(xi), y aplicando la prueba de Kolmogorov Smirnov121 se llega a la siguiente tabla:
PRUEBA DE HIPTESIS Siniestro 2.000,00 10.250,40 30.404,61 238.501,00 427.845,73 F'(xi) 0,17962963 0,36481481 0,55000000 0,73518519 0,92037037 F(xi) 0,07086374 0,17850845 0,32321123 0,80490556 0,92327200 Dn 0,10876589 0,18630636 0,22678877 0,06972038 0,00290163
De la tabla anterior, se tiene que: Dn encontrado Dn( ) de Kolmogorov Smirnov =5% (1- =95%) 0.227 0.565
Como Dn encontrado < Dn( ) de Kolmogorov Smirnov, no se rechaza la hiptesis nula. Por lo tanto, la Distribucin de Probabilidad estimada de los siniestros para este seguro es:
120 121
Vid: 3.1.3 Mtodo de los Momentos para la Estimacin de Parmetros de una Distribucin de Probabilidad. Vid: 3.1.4.1.2 Prueba de Bondad de Ajuste de Kolmogorov.
74
x 1 x 1e () f (x; , ) = 0
xf0
donde:
= 0.5727301 = 247,586.69
iii.4.2.3 Determinar las Probabilidades de Siniestro para Diferentes Montos de Prima Intermediada
Se ordenaron los datos de las tres carteras de mayor a menor con el supuesto de que el Monto de Suma Asegurada es igual (o muy semejante) al Monto de Prima Intermediada, se calcul la frecuencia de siniestros y se considero sta como probabilidad. Obtenindose los siguientes resultados.
xf0
donde:
= 1'320,000 .
122
75
1 si b 0.0217 y el Volumen Promedio de Prima Intermedia da $1'500,000 .00 Siniestro = 1 si b 0.0732 y el Volumen Promedio de Prima Intermedia da > $1'500,000 .00 0 e. o. c.
5. El Monto del Siniestro se obtiene a partir del nmero aleatorio c, el cual se asume como probabilidad y por medio de la de la funcin inversa de la siguiente distribucin de probabilidad:
x 1 1 x e () f (x; , ) = 0
xf0
donde:
= 0.5727301 = 247,586.69
2/53
E = Sp =
p = 0.03780 n = 53
p(1 p ) n
Vid: 4.4 Etapas de un Estudio de Simulacin 4. Vid: 4.4 Etapas de un Estudio de Simulacin 6. Vid: 3.2.2 Determinacin del Tamao de Muestra Requerido para la Estimacin de la Proporcin. En la matemtica del seguro, la frecuencia ms probable es el promedio de las frecuencias.
76
Sustituyendo estos valores se obtiene lo siguiente: E = 0.02617498 Para determinar el tamao de muestra se utilizar la siguiente frmula:
n=
z 2 (1 ) E2
Donde, z es el valor usado para el intervalo de confianza especificado, es la estimacin inicial de la proporcin poblacional y E es el error de muestreo de ms o de menos permitido en el intervalo. z = 1.96 (para un intervalo del 95% de confianza)
= 0.03780
E = 0.02617498 Sustituyendo estos valores se obtiene lo siguiente: n = 203.6048 204 Es decir que, empleando la frecuencia ms probable como proporcin se determin el tamao de muestra requerido para un intervalo de confianza del 95%, el cual fue de 204 carteras con 53 elementos cada una y el nmero esperado de siniestros (de las 204 carteras) ser de 2.
iii.4.5.2 Generacin de Carteras del Seguro de Responsabilidad Civil Agentes de Seguros (Personas Fsicas) Utilizando Simulacin Estocstica
Las 204 carteras (muestras) fueron generadas y una parte de una de stas se presenta como ejemplo:127
127
77
Corrida :
10 Dato 1 2 3 4 5 . . . 13 14 15 16 17 18 19 20 21 22 . . . 47 48 49 50 51 52 53 TOTAL Volumen de Prima Lmite de Nmero Aleatorio Siniestro a b c Responsabilidad Promedio Intermediada Si=1; No=0 Monto 0.60701 0.28362 0.87833 $100,000.00 $1,232,846.78 0 $0.00 0.01593 0.49260 0.67002 $100,000.00 $21,202.37 0 $0.00 0.61458 0.74905 0.69245 $100,000.00 $1,258,500.62 0 $0.00 0.87556 0.36999 0.95287 $100,000.00 $2,750,841.19 0 $0.00 0.22355 0.93993 0.13336 $100,000.00 $333,984.90 0 $0.00 . . . . . . . . . . . . . . . . . . . . . 0.32089 0.90674 0.24424 $100,000.00 $510,812.80 0 $0.00 0.83043 0.85914 0.71354 $100,000.00 $2,342,363.40 0 $0.00 0.68382 0.42638 0.90787 $100,000.00 $1,519,921.82 0 $0.00 0.74583 0.09648 0.04296 $100,000.00 $1,808,095.98 0 $0.00 0.70071 0.66475 0.04963 $100,000.00 $1,592,365.31 0 $0.00 0.60689 0.00075 0.86659 $100,000.00 $1,232,427.17 1 $313,740.97 0.07316 0.63342 0.44348 $100,000.00 $100,284.62 0 $0.00 0.65819 0.79660 0.69581 $100,000.00 $1,417,032.29 0 $0.00 0.23762 0.31606 0.32421 $100,000.00 $358,123.59 0 $0.00 0.14671 0.77476 0.84020 $100,000.00 $209,419.53 0 $0.00 . . . . . . . . . . . . . . . . . . . . . 0.81860 0.91850 0.50501 $100,000.00 $2,253,323.60 0 $0.00 0.28000 0.56115 0.70373 $100,000.00 $433,622.41 0 $0.00 0.98254 0.71406 0.07092 $100,000.00 $5,342,789.70 0 $0.00 0.00521 0.67292 0.68969 $100,000.00 $6,891.30 0 $0.00 0.80741 0.84845 0.34504 $100,000.00 $2,174,278.30 0 $0.00 0.65123 0.01114 0.76253 $100,000.00 $1,390,398.55 1 $200,926.36 0.33116 0.98586 0.90498 $100,000.00 $530,911.49 0 $0.00 $5,300,000.00 2 $514,667.33
Monto Efectivos Acumulado $286.092,73 $57.401.254,00 $547.608,06 $57.115.161,27 $593.402,98 $56.567.553,21 $721.006,39 $55.974.150,23 $1.100.897,71 $55.253.143,83 $936.760,75 $54.152.246,12 $766.512,16 $53.215.485,36 $674.462,47 $52.448.973,21 $764.009,36 $51.774.510,74 $662.161,26 $51.010.501,38 $8.765.547,13 $50.348.340,12 $10.515.121,22 $41.582.793,00 $10.013.586,28 $31.067.671,78 $4.909.816,98 $21.054.085,49
78
$500.000 $600.000 $600.000 $700.000 $700.000 $800.000 $800.000 $900.000 $900.000 $1.000.000 $1.000.000 $1.100.000 $1.100.000 $1.200.000
25 11 6 3 2 2 1
14 5 3 1 0 1 1
$7.559.375,76 $16.144.268,51 $3.244.993,69 $8.584.892,75 $2.263.908,39 $5.339.899,06 $855.760,57 $3.075.990,68 $0,00 $2.220.230,10 $1.053.123,47 $2.220.230,10 $1.167.106,63 $1.167.106,63
Estos resultados sern utilizados para el clculo de cuotas mismo que se explica en el siguiente punto.
iii.5
Para el clculo de cuotas se utilizarn las formulas que a continuacin se presentan. Monto en Primas Puras = Suma de Siniestros = De donde, P
s
i =1
P=
s
i =1
(1)
q=
i =1
(2)
129
Una gran parte de los objetos asegurados afectados por siniestros sufre slo una prdida parcial, es decir no se destruye v (lmite de responsabilidad o suma asegurada, dependiendo del seguro) en su totalidad, sino slo una parte de v, la cual suele ser expresada, v, en donde es la fraccin destruida de v; y es llamada grado del dao. v = s es la fraccin de la prdida econmica causada por un siniestro, tendremos casos donde s = v y la relacin
Si
s =0. v
En los
s = 1 , quedando as definida la prdida total. En la mayora de los casos ser v s casos intermedios, s < v, por lo que ser una expresin decimal entre 0 y 1, v
79
= v nq
i =1 q n i i =1
n
i2
(3)
Las Primas de Riesgo Pt se calculan de la siguiente forma: Pt = P + En nuestro caso = 1. La Cuota de Riesgo se obtiene como sigue: P = nt
i =1
(4)
(5)
=
Donde, Gastos de Administracin 1 = Gastos de Adquisicin 2 = Otros Gastos 3 = Utilidad 4 =
1 ( 1 + 2 + 3 + 4 )
(6)
iii.5.1
del riesgo es de
130
Para elaborar sta tabla, se consider que en el caso de los siniestros mayores a $100,000.00 slo se paga sta cantidad ya que el exceso queda a cargo del asegurado; en el caso de tener un siniestro menor a esta cantidad se paga el valor del siniestro. Lo anterior porque en el Ramo de Responsabilidad Civil los seguros se otorgan a primer riesgo. El seguro a primer riesgo es una modalidad que consiste en asegurar un bien por un valor determinado hasta el cual queda cubierto el riesgo. Vid: VARGAS, op. cit. p. 140.
80
Clase $0 $10.00 0 $20.00 0 $30.00 0 $40.00 0 $50.00 0 $60.00 0 $70.00 0 $80.00 0 $90.00 0 $10.000 $20.000 $30.000 $40.000 $50.000 $60.000 $70.000 $80.000 $90.000 $100.00 0
i =1
mi
mi
s
i =1
Acumulados
i =1
si
im
2,8609 5,4761 5,9340 6,9118 11,0090 9,3676 7,6651 6,7446 7,6401 176,621 6 240,230 9
i2m
0,1886 0,8703 1,4914 2,4025 5,0675 5,1779 4,9032 5,0643 6,4921 176,268 6 207,92 62
399 328 292 268 248 224 207 195 186 177
71 36 24 20 24 17 12 9 9 17 7
$286.092,73 $547.608,06 $593.402,98 $691.181,12 $1.100.897,7 1 $936.760,75 $766.512,16 $674.462,47 $764.009,36 $17.662.161, 26
$24.023.088,6 1 $23.736.995,8 8 $23.189.387,8 1 $22.595.984,8 3 $21.904.803,7 1 $20.803.905,9 9 $19.867.145,2 4 $19.100.633,0 8 $18.426.170,6 2 $17.662.161,2 6
P=
i =1
si =24023.088.61
q=
i =1
i =1 n i =1
2 i
= v nq
i =1 i =1 n
i2
81
Pt
v
i =1
=
i
Con base a la siguiente tabla se calcula la cuota de tarifa: Gastos de Administracin = = Gastos de Adquisicin = Utilidad Mnima Esperada = = =
1
15% 9% 5%
Finalmente, se construy una escala de peligrosidad haciendo uso de las probabilidades encontradas en iii.4.2.3, obtenindose la Tarifa siguiente: Cuota Aplicable al Lmite de Responsabilidad $100,000.00 M. N. 19.23 64.64
Las cuotas obtenidas, se aplicaron a las carteras que previamente se simularon, los resultados de dicha aplicacin causaron impacto positivo; y se concluye que permiten la sana operacin de ste seguro.
v = 1,081200,000.00,
i i =1
donde v =100,000 y n = 10,812. Clase Despus de Aplicar Deducible $0 $2.500 $12.500 $2.500 $12.500 $22.500
m
m
i =1
mi
s
i =1
Acumulados
s
i =1
im
0,1836 3,0012 4,4692
i2m
0,0034 0,2938 0,8605
13 36 24
82
20 24 17 12 9 9 177
P=
i =1
si =21293,981.50
q=
i =1
i =1 n i =1
2 i
= v nq
i =1 i =1 n
i2
Pt
v
i =1
=
i
Con base a la siguiente tabla se calcula la cuota de tarifa: Gastos de Administracin = Gastos de Adquisicin = = Utilidad Mnima Esperada = = =
1
15% 9% 5%
Finalmente, se construy una escala de peligrosidad haciendo uso de las probabilidades encontradas en iii.4.2.3, obtenindose la Tarifa siguiente:
83
Las cuotas obtenidas, se aplicaron a las carteras que previamente se simularon, los resultados de dicha aplicacin causaron impacto positivo; y se concluye que permiten la sana operacin de ste seguro. La aplicacin del deducible propuesto permite que exista un descuento de casi el 11% respecto a las cuotas manejadas sin deducible. Los resultados de la metodologa propuesta en este trabajo, resultaron ser satisfactorios para la problemtica de este seguro, ya que permitirn a la compaa tener una tarifa justa y no tener problemas de insuficiencia de primas para el pago de siniestros; as como hacer frente a los gastos de administracin y de adquisicin; adems la institucin tendr la posibilidad de obtener utilidad. Con esta nota tcnica se ejemplific, en un caso real las ventajas del uso de la Estimacin de la Distribucin de Probabilidad para Muestras Pequeas y de la Simulacin en la Inferencia de Carteras de Seguros. Aportando as, un mtodo que permite hacer inferencias de la cartera a pesar de que los datos de sta no cumplan el supuesto de provenir de una muestra lo suficientemente grande. Finalmente, en las siguientes pginas se proceder a exponer las conclusiones de la presente tesis.
84
PLIZA 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34
85
35 36 37 TOTAL
0 0 0 1
0 0 0 2,000
CARTERA 1999 RESPONSABILIDAD CIVIL AGENTES DE SEGUROS CIFRAS EN MONEDA NACIONAL LMITE DE RESPONSABILIDAD 28,296,000 28,332,300 9,432,000 9,687,200 100,000 418,000 420,000 100,000 5,000,000 4,622,350 2,000,000 1,366,292 1,000,000 150,000 11,000,000 9,385,000 934,830 1,000,000 162,000 19,250,000 420,000 2,000,000 1,000,000 175,000 75,000 200,000 1,000,000 1,000,000 3,000,000 SINIESTROS NMERO MONTO 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 427,846 0 0 0 0 0 0 0 0 0
PLIZA 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29
86
30 31 32 33 34 35 36 37 38 39 TOTAL
75,000 3,000,000 1,150,000 250,000 75,000 1,000,000 125,000 1,000,000 1,481,246 500,000 150,182,218
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 10,250 0 0 2 438,096
CARTERA 2000 RESPONSABILIDAD CIVIL AGENTES DE SEGUROS CIFRAS EN MONEDA NACIONAL LMITE DE RESPONSABILIDAD 100,000 9,498,600 28,246,500 9,415,500 9,511,000 3,000,000 9,511,000 49,121,500 3,000,000 100,000 100,000 100,000 500,000 5,000,000 1,000,000 500,000 4,706,350 2,500,000 500,000 1,000,000 SINIESTROS NMERO MONTO 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 30,405 0 0
PLIZA 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
87
21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 TOTAL
150,000 5,000,000 2,000,000 200,000 944,590 500,000 19,128,400 162,000 500,000 420,000 175,000 1,000,000 2,000,000 500,000 300,000 500,000 1,000,000 75,000 500,000 500,000 250,000 1,370,000 75,000 100,000 1,150,000 75,000 5,000,000 1,000,000 200,000 200,000 200,000 125,000 1,000,000 1,766,586 500,000 250,000 500,000 186,727,026
0 0 0 0 1 238,501 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 2 268,906
88
89
7 5 5 5
ESTADSTICA 1999 - 2002 Cifras en Moneda Nacional Volumen de Prima Promedio Nmero de Intermediada Agentes 2,152,758 9 3,211,147 3 2,743,185 5 2,748,725 3 1,806,382 3 1,922,538 3 2,131,275 1 1,803,425 1 2,336,643 4 2,265,370 2 1,214,540 1 1,732,305 1 2,994,966 5 3,458,190 2 4,101,368 3 3,152,309 5 6,719,605 1 2,269,985 3 4,023,990 1 5,321,472 3 2,548,482 3 3,803,252 3 1,454,335 1 3,384,760 1 7,333,795 1 3,574,620 1 2,012,715 1 3,013,220 1 10,868,885 1
90
Total
1,465,768 14,245,380 1,624,933 6,149,430 3,236,355 3,102,965 5,378,095 8,836,350 6,981,670 7,949,690 12,755,430 9,510,265 221,051,850
2 1 2 1 1 1 1 1 1 1 1 1 5,997
91
ANEXO ELECTRNICO
92
CONCLUSIONES Y RECOMENDACIONES
En el presente trabajo se estudi de manera previa el tema de estadstica descriptiva ya que el paso inicial de toda investigacin es coleccionar, agrupar y analizar los datos con los que se desea trabajar o simplemente con los que se trabajar. Una vez hecho lo anterior, el siguiente paso consiste en hacer inferencias sobre el comportamiento de los datos; motivo por el cual esta tesis dedic el segundo captulo al tema de distribuciones de probabilidad, ya que a travs de estas se pueden hacer conjeturas sobre los datos cuando stos forman un conjunto suficientemente grande. Ante el problema de trabajar con pocos datos, situacin comn en el campo del seguro, en este trabajo se explic el mtodo del rango mediano ya que este permite estimar una distribucin de probabilidad a pesar de que los datos no sean de una muestra suficientemente grande; adems se mostraron dos pruebas tiles para acreditar que los datos se ajustan a la distribucin estimada. As mismo, para calcular el nmero de veces que se trabajar con el modelo simulado se mostr como determinar el tamao de muestra. Tambin, se habl de la simulacin y para entenderla mejor se estudi el modelado de sistemas porque con esta tcnica se simula realmente un modelo del sistema. Finalmente, la metodologa expuesta por esta tesis se ejemplifico con una nota tcnica en la que se calculan las cuotas base para el seguro de responsabilidad civil agentes de seguros, producto que careca de homogeneidad respecto a los precios calculados por diferentes compaas aseguradoras y consecuentemente se observaba la carencia de tcnica para extraer el mayor provecho como sea posible a pocos datos. Como dato adicional, cuando se calcularon las cuotas para seguro del que se habla en el captulo cinco, se contaba con la tarifa que el reasegurador entreg a la compaa que proporcion los datos, los costos para diferentes lmites de responsabilidad publicados por otra compaa de seguros (informacin de dominio pblico) y con los pocos datos de la cartera proporcionada por la compaa. Mediante el uso de la metodologa aqu propuesta, se observ que la tarifa entregada por el reasegurador y la publicada por la otra compaa llevan a nmeros rojos, mientras que la que se desarrolla en este trabajo con el uso de las tcnicas propuestas proporciona las consecuencias positivas implcitas de un buen clculo, hacer frente a los siniestros, utilidad para la empresa y el pago de los gastos de administracin y adquisicin, observndose que la construccin del modelo y los supuestos del mismo son buenos. Se recomienda a las personas que deseen emplear esta tcnica tomen en cuenta lo siguiente: 1. La construccin del modelo juega un papel importante en los resultados que se obtengan por el uso de stas tcnicas. 2. Esta metodologa slo puede emplearse por cada riesgo del que se tenga informacin, aunque sta sea escasa. 3. Est metodologa slo puede aplicarse a cada grupo o clase de riesgos de los que se tenga informacin.
93
4. Siempre ser mejor trabajar con una muestra lo suficientemente grande, claro que ante la carencia de datos esta metodologa es una buena opcin. 5. Independientemente de la aplicacin final de los datos obtenidos con estas tcnicas, tal aplicacin debe de ser supervisada una vez puesta en prctica para evitar desvos respecto a lo planeado y en caso contrario nuevamente estudiar el riesgo para disear programas correctivos; esta recomendacin constituye un paso obligado independientemente de las tcnicas utilizadas. La realidad, es que el uso de nuevas tcnicas en campos especializados y con innovadoras exigencias, como lo es el del seguro permite la consolidacin de vnculos entre estos, cultivando lazos fructferos en este manantial inextinguible de siempre nuevos conocimientos por aprender.
94
NOTA FINAL
La compaa de seguros que proporcion su informacin para el clculo de la tarifa del Seguro de Responsabilidad Civil Agentes de Seguros (Persona Fsicas), determinaba las primas para este riesgo con una tarifa proporcionada por el resaegurador, el mtodo de cotizacin que ste propone se conoce como pay back adems de un descuento en el caso de deducible, el pay back se da en un intervalo permisible que indica el nmero de plizas que se deben de vender para hacer frente a un siniestro. A los elementos de las carteras simuladas se les aplic esta metodologa para hacer comparacin con el propuesto por esta tesis, el resultado fue que el pay back debera de ser menor; lo que implica que las primas deberan de ser mayores; adems de que haciendo uso del deducible no se poda dar el descuento propuesto, por lo tanto hacer uso de la tarifa propuesta por el reasegurador para este riesgo llevar a nmeros rojos a la compaa de seguros. La tarifa publicada por una empresa competidora es ms baja que la propuesta por esta tesis, lo que implica que no permite pagar los siniestros que se presenten, adems tampoco permite hacer frente a los gastos de administracin, los de adquisicin y la compaa de seguros no obtendr utilidad, por lo tanto las primas de la competencia llevaran a nmeros rojos a la empresa competidora. Finalmente, la tarifa calculada con la metodologa propuesta por esta tesis garantiza la solvencia del asegurador, ya que el uso de sta permite hacer frente a todos los compromisos que se adquieren con la venta de seguros para este riesgo.
95
BIBLIOGRAFA
AGUILAR Jurez, Isabel Patricia y Leonardo BAUELOS Saucedo Notas del Curso Propedutico de Probabilidad y Estadstica. Mxico. Trabajo No publicado. 2002. 97 p. BILLINTON, Roy y Ronald N. ALLAN Reliability Evaluation of Engineering Systems Concepts and Techniques. 2nd Edition. United States of America. Plenum Publishing Corporation. 1992. 453 p. CANAVOS C. George Probabilidad y Estadstica Aplicaciones y Mtodos. 1a. Edicin. [Tr: Edmundo Gerardo Urbina Medal] [R. T. Gustavo Javier Valencia Ramrez] Mxico. Mc Graw Hill. 1988. 651 p. COMISIN NACIONAL DE SEGUROS Y FIANZAS (CNSF) Circular S 8.1 Mxico. Diario Oficial de la Federacin. Febrero 20, 2004. COSS Bu, Ral Simulacin un Enfoque Prctico. 1a Edicin. Mxico. Editorial Limusa. 1988. 158 p. ENCICLOPEDIA CIENTFICA CULTURAL Volumen estadstica. [Tx: Juan Luis Gutirrez Duchos] Espaa. Cultural S. A. de Ediciones. 1980. 243 p.
96
HILLER, Frederick S. y Gerald J. LIEBERMAN Introduccin a la Investigacin de Operaciones. 4a. Edicin [Tr. Marcia A. Gonzlez Osuna] [R. T. Jos Humberto Cant Delgado Perla J. Fernndez Reyna Marco A. Montufar Bentez] Mxico. Mc Graw Hill Interamericana Editores. 1999. 998 p. KAZMIER, Leonard J. Estadstica Aplicada a la Administracin y a la Economa. 3a. Edicin. [R. T. Alejandro Alegra Hernndez] Mxico. Mc Graw Hill. 1998. 416 p. KNEZEVIC, Jezdimir Reliability, Maintainability and Supportability a Probabilistic Approach United Kingdom. Mc. Graw Hill Book Company Europe. 1993. 291 p. KREYSZIG, Erwin Introduccin a la Estadstica Aplicada Principios y Mtodos. 1a. Edicin. [Versin espaola: Arturo Galn Martnez] [R. Octavio A. Rascon Chvez] Mxico. Editorial Limusa. 1979. 505 p. MARN Diazaraque, Juan Miguel Apuntes de Estadstica Estadstica Descriptiva, p. 333 Espaa. Universidad Carlos III de Madrid. 2004. http://halweb.uc3m.es/ MILLER, Irwin, John E. FREUD y Richard A. JOHNSON Probabilidad y Estadstica para Ingenieros. 4a. Edicin. [Tr: Virgilio Gonzlez Pozo] [R. T. Graciela Rojas de Finck] Mxico. Prentice Hall Hispanoamericana. 1992. 624 p. RINCON, Juana Cooperacin del Personal Acadmico: Mecanismo para la Integracin del Sistema Universitario Nacional. San Fernando de Apure, Venezuela. Universidad Simn Rodrguez. 1998. http://members.tripod.com/~gepsea/sistema.htm
97
SAUTTO Vallejo, Jos Maclovio La tcnica de la Simulacin Digital en la Investigacin de Operaciones. Mxico. Tesis UNAM. 1991. 146 p. SECRETARA DE HACIENDA Y CRDITO PBLICO Reglas que Establecen las Orientaciones de Poltica General Aplicables a los Agentes y Apoderados de Seguros y Fianzas. Mxico. Diario Oficial de la Federacin. Febrero 27, 2004. VARGAS Aguilar, Juan Carlos Fundamentos para el Desarrollo de Productos en Daos Mxico. Tesis UNAM. 2003. 164 p. Ley General de Instituciones y Sociedades Mutualistas de Seguros. Archivo de la CNSF 2001. Mxico. Diario Oficial de la Federacin. Enero 16, 2002.
98