Você está na página 1de 104

Uso de la Estimacin de la Distribucin de Probabilidad para Muestras Pequeas y de la Simulacin en la Inferencia de Carteras de Seguros.

Trabajo presentado para el XII Premio de Investigacin sobre Seguros y Fianzas 2005, Mtro. Juan Carlos Vargas Aguilar Jaguar

XII

Premio de Investigacin sobre Seguros y Fianzas 2005

Tercer Lugar Categora de Seguros

NDICE
RESEA INTRODUCCIN CAPTULO 1 1.1 1.2 1.3 1.4 ESTADSTICA DESCRIPTIVA . . 1 3 5 5 5 6 6 6 6 7 7 8 8 8 8 8 9 9 9 9 9 9 10 10 10 11 11 11 11 11 12 12

Estadstica Descriptiva e Inferencia Estadstica Poblacin y Muestra Tipo de Datos Distribucin de Frecuencias 1.4.1 Tabla de Distribucin de Frecuencias 1.4.2 Intervalos de Clase 1.4.2.1 1.4.2.2 1.4.2.3 1.4.2.4 Lmites Nominales de Clase Fronteras de Clase Longitud de la Clase (c) Marca de Clase (xi)

1.4.3 Frecuencia (fi) 1.4.4 Frecuencia Acumulada (Fi) 1.4.5 Frecuencia Relativa (fi*) 1.4.6 Frecuencia Relativa Acumulada (Fi*) 1.5 Descripcin Grafica de los Datos 1.5.1 Histograma de Frecuencias 1.5.2 Polgono de Frecuencias 1.5.3 Curvas de Frecuencias 1.5.4 Ojiva 1.6 Medidas Numricas Descriptivas 1.6.1 Medidas de Tendencia Central 1.6.1.1 1.6.1.2 1.6.1.3 1.6.2.1 1.6.2.2 1.6.2.3 1.6.2.4 Media Aritmtica Mediana Moda Rango Varianza Desviacin Estndar

1.6.2 Medidas de Variabilidad

Coeficiente de Variacin (CV)

1.7 2.1

Ejemplo de Estadstica Descriptiva Definiciones Bsicas de Probabilidad 2.1.1 Definicin Clsica de Probabilidad 2.1.2 Definicin Emprica de Probabilidad 2.1.3 Definicin Subjetiva de Probabilidad

12 17 17 17 18 18 18 23 24 25 27 27 27 28 28 28 29 30 31 31 33 34 36 38 38

CAPTULO 2

DISTRIBUCIONES DE PROBABILIDAD

2.2 2.3 2.4 2.5 2.6

Desarrollo Axiomtico de la Probabilidad El Concepto de Variable Aleatoria

Distribuciones de Probabilidad de Variables Aleatorias Discretas Distribuciones de Probabilidad de Variables Aleatorias Continuas Valor Medio y Varianza de Distribucin 2.6.1 Valor Medio de una Distribucin 2.6.2 Varianza de una Distribucin

. . DE PROBABILIDAD

2.7

Algunas Distribuciones de Probabilidad 2.7.1 Distribuciones Discretas 2.7.1.1 2.7.1.2 2.7.1.3 2.7.2.1 2.7.2.2 2.7.2.3 2.7.2.4 2.7.2.5 2.7.2.6 Distribucin Binomial Distribucin de Poisson

Distribucin Hipergeomtrica Distribucin Normal Distribucin Uniforme Distribucin Gama Distribucin de Weibull Distribucin Beta DE

2.7.2 Distribuciones Continuas

Distribucin Exponencial Negativa DISTRIBUCIONES

CAPTULO 3

ESTIMACIN

PARA DATOS EMPRICOS Y LA DETERMINACIN DEL TAMAO DE MUESTRA 3.1 40 40 41 41 Estimacin de la Distribucin de Probabilidad para Datos Empricos 3.1.1 Representacin de la Distribucin de Probabilidad de los Datos Empricos 3.1.1.1 3.1.1.2 Mtodo del Rango Mediano para la Estimacin de la Distribucin de Probabilidad para Muestras Pequeas Mtodo de Frecuencias Relevantes para la Estimacin de la

ii

Distribucin de Probabilidad 3.1.2 Seleccin de la Distribucin de Probabilidad Terica una Distribucin de Probabilidad 3.1.4.1

42 44 44 45 47 47 49 51 52 53 55 55 55 57 57 58 60 61 62

3.1.3 Mtodo de los Momentos para la Estimacin de Parmetros de 3.1.4 Introduccin a las Pruebas de Hiptesis Estadsticas Pruebas de Bondad de Ajuste 3.1.4.1.1 3.1.4.1.2 3.2

Prueba de Bondad de Ajuste ChiCuadrado Prueba de Bondad de Ajuste de Kolmogorov

Determinacin del Tamao de Muestra la Estimacin de la Media de la Proporcin

3.2.1 Determinacin del Tamao de Muestra Requerido para 3.2.2 Determinacin del Tamao de Muestra Requerido para la Estimacin CAPTULO 4 4.1 4.2 4.3 4.4 4.5 4.6 4.7 4.8 SIMULACIN

Teora General de Sistemas Simulacin Ejemplo de Simulacin

El Sistema y Otros Conceptos Relacionados con ste Etapas de un Estudio de Simulacin

Mtodo Congruencial Mixto para la Generacin de Nmeros Aleatorios con Distribucin Uniforme en el Intervalo (0,1) Mtodo de la Transformada Inversa para la Generacin de Variables Aleatorias NoUniformes Notacin Utilizada en Teora de Colas

CAPTULO 5

CASO PRCTICO: DETERMINACIN DE LAS CUOTAS DE TARIFA PARA EL SEGURO DE RESPONSABILIDAD CIVIL AGENTES DE SEGUROS (PERSONAS FSICAS)1 64 67 67 67 68 68

i. CARACTERSTICAS GENERALES DEL PLAN i.1 i.2 i.3 i.4 Nombre Comercial del Plan Descripcin de la Cobertura Bsica Temporalidad del Plan Operacin y Ramo en el que se Registrar

1 Captulo con numeracin especial.

iii

ii. HIPTESIS ESTADSTICAS Y FINANCIERAS ii.1 ii.2 Hiptesis Estadsticas Hiptesis Financieras ii.2.1 Utilidad Tcnica iii. PROCEDIMIENTOS TCNICOS iii.1 iii.2 iii.3 iii.4 Gastos de Administracin Gastos de Adquisicin Gastos Totales Simulacin Estocstica iii.4.1 Definicin del Sistema iii.4.2 Anlisis de Datos iii.4.2.1 iii.4.2.2

68 68 69 69 69 69 69 69 69 70 70

Procedimientos para la Generacin de Datos Mediante

Estimar la Distribucin de Probabilidad del Volumen de Prima Intermediada por Agente 70 Estimar la Distribucin de Probabilidad Emprica de los Siniestros Utilizando el Mtodo del Rango Mediano para Muestras Pequeas 72 74 75 75 76 76

iii.4.2.3

Determinar las Probabilidades de Siniestro para Diferentes Montos de Prima Intermediada

iii.4.3 Formulacin del Modelo iii.4.5 Experimentacin iii.4.5.1 iii.4.5.2

iii.4.4 Implementar el Modelo en la Computadora Determinar el Tamao de Muestra

Generacin de Carteras del Seguro de Responsabilidad Civil Agentes de Seguros (Personas Fsicas) Utilizando Simulacin Estocstica 77 78 79 80 82 85 89 92 93

iii.4.6 Interpretacin de los Resultados iii.5 Procedimientos para el Clculo de Cuotas iii.5.1 Clculo de Cuotas sin Deducible iii.5.2 Clculo de Cuotas con Deducible ANEXO DE NOTA TCNICA 1 ANEXO DE NOTA TCNICA 2 ANEXO ELECTRNICO

CONCLUSIONES Y RECOMENDACIONES

iv

NOTA FINAL BIBLIOGRAFA

95 96

RESEA Ttulo:
Uso de la Estimacin de la Distribucin de Probabilidad para Muestras Pequeas y de la Simulacin en la Inferencia de Carteras de Seguros.

Factores para impulsar el desarrollo de la industria del seguro en Estudio relacionado con: Mxico. Sin duda, el uso de nuevas tecnologas y tcnicas matemticas han sido algunos de los factores que han fomentado el desarrollo del seguro en Mxico en particular y en el mundo en general. Por esta razn, se inscribe este estudio que se relaciona con el tema sealado en el prrafo anterior, ya que ste aporta una metodologa novedosa que conjunta tcnicas de confiabilidad y de simulacin que a su vez permiten trabajar con pocos datos y en base en estos realizar inferencias positivas. Para las entidades aseguradoras laborar con muestras pequeas es una situacin cada vez ms comn, ya que ante las innovadoras necesidades de proteccin; planear, tomar decisiones o calcular tarifas de riesgos de los cuales se tiene poca informacin se vuelve una tarea compleja.

Objetivos:

Objetivo General Mostrar las ventajas del uso de las tcnicas de estimacin de distribuciones empricas para muestras pequeas y de la simulacin en la inferencia de carteras de seguros. Aportando as, un mtodo para hacer inferencias de la cartera a pesar de que los datos de sta no cumplan el supuesto de provenir de una muestra suficientemente grande. Finalmente, ilustrar la aplicacin de la metodologa propuesta mediante un ejemplo en el que se determina la cuota base para el seguro de Responsabilidad Civil Agentes de Seguros. Objetivos Particulares Presentar a los elementos necesarios que emplea la tcnica propuesta por este trabajo: Estadstica descriptiva. Distribuciones de probabilidad para variables aleatorias discretas y continuas. Construccin de distribuciones empricas para muestras pequeas. Pruebas de bondad de ajuste. Determinacin del tamao de muestra. Modelado de sistemas. Simulacin. Ilustrar la metodologa propuesta mediante un caso prctico.

Problemtica en el Sector Asegurador:

La probabilidad emprica o ley de los grandes nmeros, uno de los conceptos ms fuertes en la teora del seguro, asume la existencia de una muestra suficientemente grande pero, cmo debe proceder el asegurador cuando su informacin estadstica es insuficiente? o cmo corregir sta deficiencia para hacer inferencias que causen impacto positivo en la toma de decisiones o en la elaboracin de tarifas de seguros? El presente trabajo representa una alternativa de solucin a la problemtica detallada en el punto anterior, permitiendo el desarrollo de inferencias positivas en la toma de decisiones o en la elaboracin de tarifas de seguros. En este material se incluye un anexo electrnico el cual facilita lector entender la metodologa propuesta, este anexo contiene archivo que el autor emple para determinar la cuota base para seguro de Responsabilidad Civil Agentes de Seguros utilizando tcnica planteada por este trabajo. al el el la

Importancia para el Sector Asegurador: Observacin:

El uso de nuevos mtodos, tcnicas y tecnologas, es sin duda el umbral de acceso futuro de la denominada matemtica del seguro. El autor.

INTRODUCCIN
Da a da en el campo del seguro surgen nuevas necesidades de proteccin, mismas que provocan que quienes laboran en esta industria tengan que trabajar con pocos datos y con base en stos estudiar los riesgos a cubrir, tomar decisiones, planear y calcular tarifas que permitan determinar el costo o la prima del seguro en cuestin. Sin embargo, si los profesionistas del seguro no utilizan bases tcnicas para obtener el mejor provecho de estos datos insuficientes, el seguro se convierte en un juego de azar que puede colapsar la estabilidad financiera de la empresa y consecuentemente impedir las obligaciones de sta con el pblico usuario de estos servicios. En busca de dar solucin a la problemtica antes mencionada se elabora la presente tesis que conjunta el uso de dos tcnicas, la estimacin de la distribucin de probabilidad para muestras pequeas primero, y la simulacin de eventos discretos despus, mismas que permiten la elaboracin de inferencias de carteras de seguros que causen impacto positivo a las entidades aseguradoras. Previo a la realizacin de esta tesis, se observ que en nuestro pas no existen escritos acerca de la aplicacin de estos mtodos en los campos del seguro, por lo que con el fin de hacer este trabajo accesible al mayor nmero de profesionistas del seguro, as como a los estudiantes de este tipo de tcnicas, se decidi que este trabajo se desarrollara de manera gradual; tratando que los conceptos y los mtodos sean claros y concisos, apoyndose en algunos casos en la exposicin de ejemplos. Este escrito se divide en cinco captulos, en el primero se estudiar la coleccin, la agrupacin y el anlisis previo de datos, es decir lo que se conoce como estadstica descriptiva. En el segundo captulo se hablar de la probabilidad, de las variables aleatorias y finalmente de las distribuciones de probabilidad, ya que sera muy difcil utilizarlas sin saber qu son.2 En el tercer captulo se estudiar el mtodo del rango mediano; ya que ste permite estimar una distribucin de probabilidad a partir de un conjunto de datos pequeo o limitado; y se mostrarn el uso de dos pruebas importantes en estadstica que permiten comprobar la bondad de los ajustes de las distribuciones estimadas por este mtodo; adems se estudiar cmo determinar el tamao de muestra ya que la simulacin es una metodologa que realiza experimentos de muestreo mediante un modelo del sistema. En el cuarto captulo se hablar del modelado de sistemas y de la simulacin de eventos discretos. En el quinto captulo se ejemplificar la metodologa propuesta que adems se conjunta con la matemtica del seguro mediante la elaboracin de una nota tcnica, en la que se determinarn las cuotas base para el seguro de responsabilidad civil agentes de seguros (personas fsicas); producto del cual existe o exista muy poca informacin estadstica y que adems que en aos anteriores a que se volviera un seguro obligatorio se observaba la falta de homogeneidad en el sector respecto a los precios calculados por diferentes compaas, lo que pone en tela de juicio las metodologas utilizadas por stas para calcular sus tarifas ante la carencia de datos.

El lector que posea conocimientos previos de los dos primeros captulos de este trabajo, podr pasar al captulo 3 sin prdida de generalidad.

Finalmente, se realizarn las conclusiones de esta tesis. Por lo tanto, este trabajo desea mostrar de manera gradual, clara y concisa las ventajas del uso de la estimacin de distribuciones empricas para muestras pequeas y de la simulacin en carteras de seguros. Aportando as, un mtodo para hacer inferencias de la cartera a pesar de que los datos de sta no cumplan el supuesto de provenir de una muestra suficientemente grande.

CAPTULO 1 ESTADSTICA DESCRIPTIVA


El estudio de la estadstica se puede dividir en tres partes: reunir datos, analizarlos y, a partir de ellos, hacer inferencias. En este captulo se tratar principalmente, el anlisis de datos, es decir, la organizacin y el reporte de los mismos; ya que la elaboracin de ste, es un requisito indispensable para hacer inferencias del conjunto de datos estudiado. El presente captulo, se integra de siete subcaptulos, los seis primeros explican algunos conceptos y mtodos de la estadstica descriptiva; mientras que en el ltimo se ilustra mediante un ejemplo lo estudiado en los anteriores.

1.1

Estadstica Descriptiva e Inferencia Estadstica3

La estadstica descriptiva comprende las tcnicas que se emplean para resumir y describir datos numricos.4 Estos mtodos pueden ser grficos o implicar el clculo de medidas numricas. La inferencia estadstica trata de generalizaciones basadas en muestras de datos.5

1.2

Poblacin y Muestra

Antes de estudiar descripciones estadsticas particulares, permitamos hacer la siguiente diferencia. La poblacin es la coleccin de toda la posible informacin que caracteriza un fenmeno. En estadstica, la poblacin es un concepto mucho ms general del que tiene la acepcin comn de esta palabra. En este sentido, una poblacin es cualquier coleccin ya sea de un nmero finito de mediciones o una coleccin grande, virtualmente infinita, de datos acerca de algo de inters. Por otro lado, la muestra es un subconjunto representativo seleccionado de una poblacin.6 Poblacin Tamao N Muestra Tamao n

n<N

3 4

5 6

Algunas tcnicas de inferencia estadstica sern estudiadas en el captulo 3. KAZMIER, Leonard J., Estadstica Aplicada a la Administracin y a la Economa, p. 1. MILLER, Irwin, John E. FREUD y Richard A. JOHNSON, Probabilidad y Estadstica para Ingenieros, p. 2. CANAVOS C. George, Probabilidad y Estadstica Aplicaciones y Mtodos, p. 1.

1.3

Tipo de Datos

Los datos pueden ser cuantitativos, con valores expresados numricamente, o cualitativos en cuyo caso se tabulan las caractersticas de las observaciones.7

1.4

Distribucin de Frecuencias

Es una tcnica usual en la estadstica que permite el anlisis de conjuntos grandes de datos.8

1.4.1 Tabla de Distribucin de Frecuencias


Una tabla de distribucin de frecuencias es una clasificacin de los datos (numricos) en clases o categoras de acuerdo a sus valores.9 Los datos organizados en una distribucin de frecuencias se llaman datos agrupados. En contraste con ello, en el caso de los datos no agrupados se enlistan todos los valores observados.10 Un ejemplo tpico de una tabla de distribucin de frecuencias es el que se muestra en el subcaptulo 1.7. El contenido de una tabla completa de distribucin de frecuencias, as como los elementos necesarios para su elaboracin se explican en el siguiente subcaptulo. Si se acepta que en la construccin de una tabla de distribucin de frecuencias se realiza una clasificacin de datos, resulta indispensable contar primeramente con el criterio de clasificacin a utilizar, mismo que se define a travs de los lmites de clase o mediante las fronteras de la clase.

1.4.2 Intervalos de Clase


El intervalo de clase identifica el rango de valores incluidos dentro de una clase y puede determinarse restando el lmite exacto de la clase superior el lmite exacto de la clase inferior.11 Algunos autores manejan que el nmero, k, de intervalos que se deben considerar en una tabla de distribucin de frecuencias, est dado por la frmula emprica que a continuacin se presenta:12

7 8

KAZMIER, op. cit. p. 1 Cfr. AGUILAR Jurez, Isabel Patricia y Leonardo BAUELOS Saucedo, Notas del Curso Propedutico de Probabilidad y Estadstica, p. 12. 9 Ibid. p. 2. 10 KAZMIER, op. cit. p. 9. 11 Idem. 12 MARN Diazaraque, Juan Miguel, Apuntes de Estadstica Estadstica Descriptiva, p. 8.

n k 1 + 3.22log(n)

si n no es muy grande. en otro caso.

(1)

Para la construccin de una tabla de distribucin de frecuencias es conveniente tomar en consideracin las siguientes recomendaciones empricas: 13 1. La tabla de distribucin de frecuencias constar de entre 5 y 20 clases. 2. Todas las clases sern de la misma longitud. Para efectos de clculo, considerando la recomendacin 2, la siguiente frmula puede emplearse para determinar el intervalo de clase aproximado por usar:14
Intervalo aproximado =

[mayor valor en datos no agrupados ] [menor valor en datos no agrupados ]


nmero de clases deseadas

(2)

1.4.2.1

Lmites Nominales de Clase

Los lmites nominales de clase inferior y superior indican los valores incluidos dentro de la clase.15 Los lmites de clase nominales o simplemente de clase tendrn la misma aproximacin que los datos y el lmite superior de una clase diferir del lmite inferior de la clase siguiente, en una unidad de aproximacin, es decir:16 Datos Lmites Diferencia (lim. inf. de la clase siguiente lim. sup. de la clase) 1 0.1 0.01

Enteros Dcimas Centsimas

Enteros Dcimas Centsimas

1.4.2.2

Fronteras de Clase

Las fronteras de clase o lmites exactos de clase, son los puntos especficos que sirven para separar clases adyacentes en una escala de medicin de variables continuas. Las fronteras de clase pueden determinarse identificando los puntos intermedios entre los lmites nominales de clase superior e inferior, respectivamente de clases adyacentes.17

13 14 15 16 17

AGUILAR Jurez, Isabel Patricia y Leonardo BAUELOS Saucedo, op. cit. p. 4. KAZMIER, op. cit. p. 9. Cfr. AGUILAR Jurez, Isabel Patricia y Leonardo BAUELOS Saucedo, op. cit. p. 2. AGUILAR Jurez, Isabel Patricia y Leonardo BAUELOS Saucedo, op. cit. p. 2. Cfr. KAZMIER, op. cit. p. 9.

1.4.2.3

Longitud de la Clase (c)

Se denota por c y es la diferencia entre la frontera superior y la inferior de la clase.18

1.4.2.4

Marca de Clase (xi)

Las marcas de clase de una distribucin de frecuencias se obtienen promediando los lmites nominales de clase consecutivos o las fronteras de clases sucesivas.19

1.4.3 Frecuencia (fi)


Es el nmero de datos de la muestra que corresponden a la clase en cuestin. Para determinar la frecuencia de una clase, basta con realizar un conteo del nmero de observaciones en la muestra que se encuentra en sta; ya sea por sus lmites nominales o por sus fronteras, esto ltimo es debido a que ambos (lmites y fronteras) determinan exactamente la misma clasificacin.20

1.4.4 Frecuencia Acumulada (Fi)


Es el nmero de datos en la muestra cuyo valor no excede la frontera superior de la clase en cuestin. Para calcular Fi basta contabilizar las frecuencias observadas en la clase de inters y en las anteriores.21

1.4.5 Frecuencia Relativa (fi*)


Es la proporcin de los datos en la muestra que pertenecen a la clase en cuestin. Si denotamos por n al nmero de datos en la muestra y a i como al nmero de la clase, la frecuencia relativa se expresa como sigue:22

fi * =

fi = n

fi
i

fi

(3)

18 19 20 21 22

AGUILAR Jurez, Isabel Patricia y Leonardo BAUELOS Saucedo, op. cit. p. 4. Cfr. MILLER, Irwin, John E. FREUD y Richard A. JOHNSON, op. cit. p. 10. Cfr. AGUILAR Jurez, Isabel Patricia y Leonardo BAUELOS Saucedo, op. cit. p. 3. Idem. Idem.

1.4.6 Frecuencia Relativa Acumulada (Fi*)


Es la proporcin de datos en la muestra que no exceden la frontera de la clase en cuestin.23

Fi * =

Fi F = i n fi
i

(4)

1.5

Descripcin Grafica de los Datos

Las propiedades de las distribuciones de frecuencias relacionadas con su forma se hacen ms evidentes por medio de graficas, y en este subcaptulo introduciremos algunas formas ms comunes de representar grficamente la informacin proporcionada por los datos.

1.5.1 Histograma de Frecuencias


El histograma de frecuencias se construye con rectngulos adyacentes, las alturas de los rectngulos representan las frecuencias de la clase y sus bases se extienden en fronteras de clases sucesivas.24 Las marcas sobre la escala horizontal pueden ser los lmites de la clase, las fronteras de la clase, las marcas de clase (que resulta ser lo ms comn) o valores claves arbitrarios.

1.5.2 Polgono de Frecuencias


En el polgono de frecuencias las frecuencias de clase son trazadas sobre las marcas de clase, esto es, se dibujan los puntos (x i , fi ) donde x i es la marca de la clase de la isima clase y fi es la frecuencia correspondiente y los puntos sucesivos se unen por medio de lneas rectas despus de haber agregado clases con frecuencia cero en los puntos lmite de la distribucin.25

1.5.3 Curvas de Frecuencia


Una curva de frecuencia es un polgono de frecuencias suavizado.26

1.5.4 Ojiva
Las distribuciones acumuladas por lo general se representan grficamente en forma de ojivas, 27 las cuales son similares a los polgonos de frecuencias acumuladas sobre las fronteras de clase en lugar de dibujar las frecuencias ordinarias sobre las marcas de clase.
23 24 25 26

Idem. MILLER, Irwin, John E. FREUD y Richard A. JOHNSON, op. cit. p. 12. Ibid. p. 13. KAZMIER, op. cit. p. 11.

1.6 Medidas Numricas Descriptivas


En los subcaptulos anteriores se plantearon las tcnicas grficas para describir los patrones de distribucin ocultos en un conjunto de datos. En ste se definen algunas medidas numricas que se emplean comnmente para describir conjuntos de datos. En estadstica, una medida descriptiva de una poblacin, o parmetros de poblacin, se representa por lo general con alguna de las letras del alfabeto griego, mientras que una medida descriptiva de una muestra, o estadstica muestral, se representa por alguna de las letras del alfabeto latino. Esto lo notar el lector ms adelante.

1.6.1 Medidas de Tendencia Central28


La tendencia central de un conjunto de datos es la disposicin de stos para agruparse ya sea alrededor del centro o de ciertos valores numricos. Existen principalmente tres medidas de tendencia central: la media aritmtica, la mediana y la moda. Mismas que a continuacin se detallan.

1.6.1.1

Media Aritmtica29

a) Si x 1, x 2 , ..., x n son los datos contenidos en la muestra y se encuentran sin agrupar, entonces la media aritmtica ser:

x=
Donde n es el tamao de la muestra.

xi
i=1

(5)

b) Si los datos se encuentran agrupados en una tabla de distribucin de frecuencias, y se utiliza el mismo concepto que para los datos sin agrupar, se define la media aritmtica como:

x=

x f
i=1

i i

= x i fi * puesto que
i =1

fi = fi * n

(6)

Donde: m = Nmero de clases xi = Marca de la clase i fi = Frecuencia de la clase i n = Numero total de datos

27 28 29

MILLER, Irwin, John E. FREUD y Richard A. JOHNSON, op. cit. p. 15. CANAVOS, op. cit. p. 12. AGUILAR Jurez, Isabel Patricia y Leonardo BAUELOS Saucedo, op. cit. p. 9 10.

10

1.6.1.2

Mediana

La mediana de un conjunto de observaciones es el valor para el cual, cuando todas las observaciones se ordenan de manera creciente, la mitad de stas es menor que este valor y la otra mitad mayor. Si el nmero de observaciones en el conjunto es impar, la mediana es el valor de la observacin que se encuentra a la mitad del conjunto ordenado. Si el nmero es par se considera la mediana como el promedio aritmtico de los valores de las dos observaciones que se encuentran a la mitad del conjunto ordenado.

1.6.1.3

Moda

La moda de un conjunto de observaciones es el valor de la observacin que ocurre con mayor frecuencia en el conjunto.

1.6.2 Medidas de Variabilidad


Las medidas de variabilidad o dispersin, se ocupan de la descripcin de la variabilidad entre los valores.30 Se dispone de diversas tcnicas para medir el grado de variabilidad en un conjunto de datos. Las que describiremos en este subcaptulo son el rango, la varianza, la desviacin estndar y el coeficiente de variacin.

1.6.2.1

Rango

El rango o R, es la diferencia entre los valores ms alto y ms bajo incluidos en el conjunto de datos.31 As, cuando My representa el mayor valor del grupo y Mn al menor, el rango de datos no agrupados es:

R = My Mn

(7)

1.6.2.2

Varianza

La varianza de las observaciones x 1, x 2 , ..., x n es, en esencia, el promedio del cuadrado de las distancias entre cada observacin y la media del conjunto de observaciones.32 La varianza se denota por:33

30 31 32 33

KAZMIER, Leonard J., op. cit. p. 51. Idem. CANAVOS, op. cit. p. 15 Estas frmulas son aplicables a poblaciones finitas.

11

Varianza de la poblacin:

2 =

(x i x )2
i=1 n

(8)

Varianza de la muestra:

s2 =

(x i x )2
i=1

(9)

n -1

1.6.2.3

Desviacin Estndar

La raz cuadrada positiva de la varianza recibe el nombre de desviacin estndar34 y se denota por:35

Desviacin estndar de la poblacin:

(x i x )2
i=1 n

(10)

Desviacin estndar de la muestra:

s=

(x i x )2
i=1

(11)

n -1

1.6.2.4

Coeficiente de Variacin (CV)

El coeficiente de variacin indica la magnitud relativa de la desviacin estndar en comparacin con la media de la distribucin de las medidas, expresada como porcentaje.36 As, las frmulas son: Coeficiente de Variacin de la Poblacin: Coeficiente de Variacin de la Muestra:

100 s 100 x

(12) (13)

1.7 Ejemplo de Estadstica Descriptiva


Un gimnasio durante los 4 primeros meses del ao recolect datos de 55 clientes referentes a la frecuencia con que se presentaron a realizar algn tipo actividad fsica, el nmero de das que cada uno de ellos se present se lista a continuacin:

34 35 36

Idem. Estas formulas son aplicables a poblaciones finitas. KAZMIER, op. cit. p.57.

12

4, 27, 100, 33, 32, 57, 77, 3, 45, 79, 10, 80, 4, 47, 35, 25, 90, 38, 6, 68, 57, 46, 40, 47, 87, 67, 66, 78, 80, 92, 68, 79, 78, 100, 76, 88, 89, 94, 48, 34, 90, 90, 22, 78, 56, 100, 91, 25, 80, 23, 5, 93, 30, 90 y 45. Se pide lo siguiente: 1. 2. 3. Elaborar la tabla de distribucin de frecuencias. Elaborar la descripcin grafica de los datos. Calcular las medidas numricas descriptivas.

Solucin: 1. Elaborar la tabla de distribucin de frecuencias. a) Determinar el nmero k de intervalos: Para esto se utilizar la ecuacin 1; adems el nmero de datos n, es de 55.

k 1+ 3.22log(n) = k = 1+ 3.22log(55 ) = 6.60 = 7

7 es un nmero de intervalos aceptable ya que se encuentra ente 5 y 20. b) Determinar el intervalo de clase aproximado: Para esto se utilizar la ecuacin 2; adems en los datos en la muestra se observa que el menor es 3 y el mayor 100.
Intervalo aproximado =

[mayor valor en datos no agrupados ] [menor valor en datos no agrupados ]


nmero de clases deseadas

entonces,
Intervalo aproximado =

c) Una vez lo anterior, se siguieron las definiciones proporcionadas en los subcaptulos 1.4.2.1 al 1.4.2.4 para calcular a las clases los lmites nominales, las fronteras, su longitud y sus marca de clase; los conceptos 1.4.3 y 1.4.4 para calcular las frecuencias y las frecuencias absolutas, en cada una de las clases; mientras que las ecuaciones 3 y 4 se utilizaron para calcularles su frecuencia relativa y su frecuencia relativa acumulada, respectivamente. Obtenindose finalmente, la siguiente tabla de distribucin de frecuencias: TABLA DE DISTRIBUCIN DE FRECUENCIAS
Frecuencia Marcas Frecuencia Frecuencia Relativa Relativa Acumulada de Clase Frecuencia Acumulada fi Fi xi Fi* fi* 9.5 6 6 0.10909 0.10909 23.5 6 12 0.10909 0.21818 37.5 6 18 0.10909 0.32727 51.5 9 27 0.16364 0.49091 65.5 4 31 0.07273 0.56364 79.5 10 41 0.18182 0.74545 93.5 14 55 0.25455 1.00000 55 1.00000

100 3 = 13.86 7

Intervalos de Clase Lmites Fronteras 3 16 2.5 16.5 17 30 16.5 30.5 31 44 30.5 44.5 45 58 44.5 58.5 59 72 58.5 72.5 73 86 72.5 86.5 87 100 86.5 100.5

2.

Elaborar la descripcin grafica de los datos. a) Histograma de frecuencias

13

HISTOGRAM A DE FRECUENCIAS 16 14 12 Clientes 10 8 6 4 2 0 9.5 23.5 37.5 51.5 65.5 79.5 93.5 Das de As is te ncia al Gim nas io 6 6 6 4 9 10

14

b) Polgono de frecuencias
POLGONO DE FRECUENCIAS 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0 -4.5

Clientes

9.5

23.5

37.5

51.5

65.5

79.5

93.5

107.5

Das de As is tencia al Gim nas io

c) Curva de Frecuencias
CURVA DE FRECUENCIAS
14 13 12 11 10 9 8 7 6 5 4 3 2 1 0 -4.5

Clientes

9.5

23.5

37.5

51.5

65.5

79.5

93.5

107.5

Das de Asiste ncia al Gim nas io

14

d) Ojiva
OJIVA
55 50 45 40 35 30 25 20 15 10 5 0 2.5 16.5 30.5 44.5 58.5 72.5 86.5 100.5

Clientes

Das de Asistencia al Gimnasio

3.

Calcular las medidas numricas descriptivas. a) Media Aritmtica Para calcularla se utiliz la ecuacin 6, obtenindose el siguiente resultado:

x=

x
i=1

= 58.04

b) Mediana Siguiendo el concepto presentado en el subcaptulo 1.6.1.2, se realiza lo siguiente: Se ordenan los datos en forma creciente, como se tiene un nmero de datos impar (55), la mediana ser el valor de la observacin que se encuentra a la mitad del conjunto ordenado es decir el dato 28:
Orden Dato 1 3 2 4 3 4 4 5 5 6 7 8 6 10 22 23 9 25 20 45 31 68 42 87 10 25 21 46 32 76 43 88 11 27 22 47 33 77 44 89

Orden 12 13 14 15 16 17 18 19 Dato 30 32 33 34 35 38 40 45 Orden 23 24 25 26 27 28 29 30 Dato 47 48 56 57 57 66 67 68 Orden 34 35 36 37 38 39 40 41 Dato 78 78 78 79 79 80 80 80

Orden 45 46 47 48 49 50 51 52 53 54 55 Dato 90 90 90 90 91 92 93 94 100 100 100

Por lo tanto, la mediana es 66. c) Moda Siguiendo el concepto presentado en el subcaptulo 1.6.1.2, se obtuvo que sta es 90, ya que es el dato con mayor frecuencia (4).

15

d) Rango Para calcularlo se utiliz la ecuacin 7, obtenindose el siguiente resultado:

R = My Mn = 100 3 = 97
n

e) Varianza Para calcularla se utiliz la ecuacin 9, obtenindose el siguiente resultado:

s2 =

(x
i=1

x)

n -1
n

= 898.11

f) Desviacin Estndar Para calcularla se utiliz la ecuacin 11, obtenindose el siguiente resultado:

s=

(x
i=1

x)

n -1

= 29.97

g) Coeficiente de Variacin Para calcularlo se utiliz la ecuacin 13, obtenindose el siguiente resultado:

s 100 = 51.64% x
Del ejercicio anterior, se puede decir que la representacin grfica de los datos es asimtrica, las medidas de tendencia central media aritmtica, mediana y moda se calcularon en 58.04, 60 y 90, lo que confirma la carencia de simetra de los datos, adems se observa dispersin alta en los datos, situacin que se confirma con los resultados obtenidos por el rango, la desviacin estndar y el coeficiente de variacin. En este subcaptulo se ejemplific lo que se mostr de manera terica en los anteriores, esperando que el lector al final de este captulo pueda efectuar el anlisis previo a la realizacin de inferencias; sin embargo para que stas sean desarrolladas, es necesario profundizar en el conocimiento de las distribucin de probabilidad y; por lo tanto, ste ser el objetivo del captulo siguiente.

16

CAPTULO 2 DISTRIBUCIONES DE PROBABILIDAD


En este captulo se estudiar de manera breve qu es probabilidad, sus enfoques y su definicin formal; esto porque la probabilidad tiene un papel crucial en la aplicacin de la inferencia estadstica. De igual modo, se examinar qu es una variable aleatoria, concepto relacionado con eventos numricos cuyo valor se determina por medio de un proceso aleatorio; as mismo, se diferenciar a las variables aleatorias: discretas y continuas; y a partir de estos conceptos se definirn las distribuciones de probabilidad y se estudiarn las caractersticas ms importantes de stas. Finalmente, se aprender sobre algunas distribuciones especficas de probabilidad: discretas y continuas; mismas que han demostrado empricamente ser modelos tiles para diversos problemas prcticos y se discutirn algunas reas de aplicacin de cada modelo, con lo que se pretende proporcionar al lector una idea y comprensin suficiente para utilizar los modelos de manera apropiada.

2.1. Definiciones Bsicas de Probabilidad37


Histricamente se han desarrollado tres enfoques conceptuales para definir la probabilidad y determinar valores de probabilidad: los enfoques clsico, emprico (de frecuencia relativa) y el subjetivo.

2.1.1 Definicin Clsica de Probabilidad


Dado un experimento cualquiera, que puede dar lugar a varios sucesos elementales igualmente posibles se define como probabilidad de un suceso, A, al cociente entre el nmero de sucesos favorables, m, y el nmero de sucesos elementales posibles n.38

P( A ) =

nmero de sucesos favorables A m = nmero de sucesos posibles n

Ejemplo 2.1.1 Sea el experimento aleatorio consistente en lanzar al aire una moneda legal, es decir que los sucesos elementales que salga sol y que salga guila son igualmente posibles. Si se designa mediante la letra A, el suceso que salga sol, se tiene que:

P( A ) =

nmero de sucesos favorables A 1 = = 0.5 nmero de sucesos posibles 2

37

En este subcaptulo se manejarn intuitivamente las palabras suceso y/o evento, pero estas sern definidas de manera formal en el subcaptulo 2.2. 38 ENCICLOPEDIA CIENTFICA CULTURAL VOLUMEN ESTADSTICA p. 55.

17

2.1.2 Definicin Emprica de Probabilidad


Dado un experimento aleatorio cualquiera, que puede dar lugar a varios sucesos elementales, se define como probabilidad emprica de un suceso, A, a la frecuencia relativa de aparicin de dicho suceso, cuando el nmero de observaciones crece indefinidamente.39

P(A ) = lim fi * ( A)
n

Ejemplo 2.1.2 Sea el experimento aleatorio del ejemplo anterior que consiste en lanzar una moneda al aire. Los dos sucesos posibles: son que salga sol y que salga guila. Si en 500 lanzamientos ha salido 263 veces sol, la probabilidad del suceso: A = que salga sol, ser:

P(A ) = fi * ( A) =

263 = 0.526 500

2.1.3 Definicin Subjetiva de Probabilidad


La probabilidad de un evento es el grado de certidumbre que un individuo concede a la ocurrencia del evento, con base de todas las evidencias de que dispone.40 Ejemplo 2.1.3 Un comentarista deportivo considera que existe una probabilidad de 0.7 de que el equipo X gane el campeonato.

2.2. Desarrollo Axiomtico de la Probabilidad41


Para formalizar la definicin de probabilidad, a travs de axiomas, se repasarn brevemente las definiciones de los conceptos siguientes: Definicin 2.2.1 El conjunto de todos los posibles resultados de un experimento aleatorio recibe el nombre de espacio muestral. El conjunto de todos los posibles resultados puede ser finito, infinito numerable o infinito no numerable. Por ejemplo, el nmero de reservaciones sin cancelar de un vuelo comercial constituye un espacio muestral finito, dado que este nmero nunca exceder la capacidad del avin, que es finita. El nmero de llegadas al servicio constituye un espacio muestral infinito numerable porque es posible colocar los resultados en una correspondencia uno a uno con los enteros positivos. El peso del equipaje constituye un espacio muestral infinito innumerable. A continuacin se proporcionan las siguientes definiciones. Definicin 2.2.2 Se dice que un espacio muestral es discreto si sus resultados pueden ponerse en correspondencia uno a uno con el conjunto de los enteros positivos.
39 40 41

Cfr. Ibid, p. 56 Cfr. KAZMIER, Leonard J., Estadstica Aplicada a la Administracin y a la Economa, p. 65. CANAVOS C. George, Probabilidad y Estadstica Aplicaciones y Mtodos, p. 32 36.

18

Definicin 2.2.3 Se dice que el espacio muestral es continuo si sus resultados consisten en un intervalo de nmeros reales. Ejemplo 2.2.1 Considerando la representacin de las fichas de un domino abajo mostrada, diga qu tipo de espacio muestral es ste.
0 0 1 1 2 2 3 3 4 4 5 5 6 6 0 1 1 2 2 3 3 4 4 5 5 6 0 2 1 3 2 4 3 5 4 6 0 3 1 4 2 5 3 6 0 4 1 5 2 6 0 5 1 6 0 6

Solucin:

Discreto.

Con respecto a los resultados de un espacio muestral, se puede estar interesado en un subconjunto de stos. De esta manera se tienen las siguientes definiciones. Definicin 2.2.4 Un evento del espacio muestral es un grupo de resultados contenidos en este espacio, cuyos miembros tiene una caracterstica comn. Por caracterstica comn debe entenderse que nicamente un grupo de resultados en particular satisface la caracterstica y los restantes, contenidos en el espacio muestral, no; Se dice que un evento ha ocurrido si los resultados del experimento aleatorio incluyen a algunos de los que definen al evento. En este contexto, el espacio muestral, evento en si mismo, puede entenderse como un evento seguro, puesto que se tiene un 100% de certidumbre de que ocurrir un resultado del espacio muestral cuando el experimento se lleve a cabo. Ejemplo 2.2.4 De cuntos resultados consta el evento de que al seleccionar una ficha en el domin del ejemplo 2.2.1 aparezca un uno? Solucin: De siete y son los siguientes:
0 0 1 1 0 1 1 2 0 2 1 3 0 3 1 4 0 4 1 5 0 5 1 6 0 6

Definicin 2.2.5 El evento que contiene a ningn resultado del espacio muestral recibe el nombre de evento nulo o vaco.

19

El evento nulo o vaco se representa mediante el siguiente smbolo: Ejemplo 2.2.5 De un ejemplo de un evento nulo, considerando el domino del ejemplo 2.2.1. Solucin: El vacio. Sean E1 y E 2 cualesquiera dos eventos que se encuentren en un espacio muestral dado denotado por S . Valindose de estos se indican las siguientes definiciones: Definicin 2.2.6 El evento formado por todos los posibles resultados en E1 o E 2 o en

ambos, recibe el nombre de la unin de E1 y E 2 y se denota por E1 E 2 . Ejemplo 2.2.6 Considere el domino del ejemplo 2.2.1, De cuntos elementos est formado E1 E 2 si E1 es el conjunto de todas las fichas que tienen 0 y E 2 las fichas que tienen 1? Solucin: De 13 elementos y son los siguientes:
0 0 1 1 0 1 1 2 0 2 1 3 0 3 1 4 0 4 1 5 0 5 1 6 0 6

Definicin 2.2.7

El evento formado por todos los resultados comunes tanto a E1 como a

E 2 o en ambos, recibe el nombre de la interseccin de E1 y E 2 y se denota por E1 E 2 .


Ejemplo 2.2.7 De cuntos elementos est formado E1 E 2 si E1 y E 2 son los eventos que se describen en el ejemplo anterior? Solucin: De un elemento. Definicin 2.2.8 Se dice que los eventos E1 y E 2 son mutuamente excluyentes o disjuntos

si no tienen resultados en comn; en otras palabras E1 E 2 = evento vaco. Ejemplo 2.2.8 Utilizando el domin del excluyentes. Solucin: E1 : El conjunto de todas las fichas con 0. ejemplo 2.2.1, diga dos eventos mutuamente

E 2 : El conjunto de fichas en las que los puntos de cada una suman por lo menos 7.

20

0 0 1 1 2 2 3 3 4 4 5 5 6 6

0 1 1 2 2 3 3 4 4 5 5 6

0 2 1 3 2 4 3 5 4 6

0 3 1 4 2 5 3 6

0 4 1 5 2 6

0 5 1 6

0 6

Definicin 2.2.9

Si cualquier resultado de E 2 tambin es un resultado de E1 , se dice que

el evento E 2 est contenido en E1 y se denota por E 2 E1 . Ejemplo 2.2.9 Utilizando el domin del ejemplo 2.2.1, d dos eventos en los que uno est contenido en otro. Solucin: E1 : El conjunto de fichas en que los puntos de cada una suman por lo menos 7.

E 2 : El conjunto de fichas en las que los puntos de cada una suman exactamente 7.
0 0 1 1 2 2 3 3 4 4 5 5 6 6 0 1 1 2 2 3 3 4 4 5 5 6 0 2 1 3 2 4 3 5 4 6 0 3 1 4 2 5 3 6 0 4 1 5 2 6 0 5 1 6 0 6

21

Definicin 2.2.10 El complemento de un evento E con respecto al espacio muestral S , es aquel que contiene todos los resultados de S que no se encuentran en E , y se denota por E . Ejemplo 2.2.10 Utilizando el espacio muestral del ejemplo 2.2.1, d un evento y el complemento de ste. Solucin: E : El conjunto de fichas en las que los puntos de cada una suman por lo menos 7. E : El conjunto de fichas en las que los puntos de cada una suman menos de 7.

0 0 1 1 2 2

0 1 1 2 2 3 3 4 4 5 5 6

0 2 1 3 2 4 3 5 4 6

0 3 1 4 2 5 3 6

0 4 1 5 2 6

0 5 1 6

0 6

3 3 4 4 5 5 6 6

Antes de formalizar la definicin de probabilidad, se dir que sta es un nmero real que mide la posibilidad colectiva, de ocurrencia, de los resultados del evento cuando se lleve a efecto el experimento. A continuacin se da la definicin axiomtica de la probabilidad. Definicin 2.2.11 Sea S cualquier espacio muestral y E cualquier evento de ste. Se llamar funcin de probabilidad sobre el espacio muestral S a P (E ) si satisface los siguientes axiomas: 1. P (E ) 0 2.

P (S ) = 1

3. Si para los eventos E1 , E 2 , E 3 ,

Ei E j = para toda i j , entonces


P(E1 E 2 ...) = P(E1 ) + P(E 2 ) + L .

22

Los siguientes teoremas42 son consecuencias de estos tres axiomas: Teorema 1. Teorema 2.

Para cualquier evento E S , 0 P (E ) 1 .

P ( ) = 0 .

Teorema 3. Sea S un espacio muestral que contiene a cualesquiera dos eventos entonces,

A y B;

P ( A B ) = P ( A) + P (B ) P ( A B )

2.3

El Concepto de Variable Aleatoria43

El propsito de una variable aleatoria es transformar cada punto de un espacio muestral en un punto de un eje real, de tal manera que dicha transformacin sea una funcin. De manera formal, este concepto se define en el siguiente prrafo. Definicin 2.3.1 Sea S un espacio muestral sobre el que se encuentra definida una funcin de probabilidad. Sea X una funcin de valor real definida sobre S , de manera que transforme los resultados de S en puntos sobre la recta de los reales. Se dice entonces que X es una variable aleatoria. Ya que una variable aleatoria es una caracterizacin cuantitativa de los resultados de un espacio muestral, sta posee intrnsecamente la naturaleza discreta o continua de este espacio. Definicin 2.3.2 Se dice que una variable aleatoria X es discreta si el nmero de valores que puede tomar es contable (ya sea finito o infinito), y si stos pueden arreglarse en una secuencia que corresponde con los enteros positivos. Los siguientes son ejemplos tpicos de variables aleatorias discretas: 1. El nmero de tornillos defectuosos en una muestra de 10 extrada de una produccin industrial. 2. El nmero de personas que esperan en la oficina de un doctor. Definicin 2.3.3 Se dice que una variable aleatoria en uno o ms intervalos de la recta de los reales.

X es continua si sus valores consisten

Los siguientes son ejemplos tpicos de variables aleatorias continuas: 1. La estatura de una persona. 2. La cantidad de azcar en una mandarina.

42 43

Las demostraciones de estos teoremas pueden ser consultadas en la bibliografa citada para este subcaptulo. CANAVOS, op. cit. p. 52 53.

23

2.4

Distribuciones de Probabilidad de Variables Aleatorias Discretas44

En general, una variable aleatoria discreta X representa los resultados de un espacio muestral en forma tal que por P ( X = x ) se entender la probabilidad de que X tome el valor de x . De esta forma, al considerar los valores de una variable aleatoria es posible desarrollar una funcin matemtica que asigne una probabilidad a cada realizacin x de la variable aleatoria X . Esta funcin recibe el nombre de funcin de probabilidad45 de la variable aleatoria X . El Trmino ms general, distribucin de probabilidad, se refiere a la coleccin de valores de la variable aleatoria y a la distribucin de probabilidades entre stos. Sin embargo, hacer referencia a la distribucin de probabilidad de X no slo implica la existencia de la funcin de probabilidad, sino tambin la existencia de la funcin de distribucin acumulativa de X . Definicin 2.4.1

X una variable discreta. Se llamar a p ( x ) P( X = x ) funcin de probabilidad de la variable aleatoria X , si satisface las siguientes propiedades: 1. p ( x ) 0 para todos los valores de x de X ; 2. p ( x ) = 1. x
Sea 3.

p (xi X x j ) =

X = xi

p(x )
X es la

xj

Definicin 2.4.2 La funcin de distribucin acumulativa de la variable aleatoria probabilidad de que X sea menor o igual a un valor especfico x y est dada por:

F (x ) P( X x ) =

xi x

p(x )
i

Por lo tanto, en el caso discreto, una variable aleatoria X est caracterizada por la funcin de probabilidad puntual p ( x ) , la cual determina la probabilidad puntual de que X = x , y por la funcin de distribucin acumulativa de F ( x ) , la que representa la suma de las probabilidades puntuales hasta el valor de x de

X inclusive.

En general, la funcin de distribucin acumulativa F ( x ) de una variable aleatoria discreta es una funcin no decreciente de los valores de X , de tal manera que 1. 0 F ( x ) 1 para cualquier x; 2. 3.

F ( xi ) F (x j ) si xi x j ;
P( X > x ) = 1 F (x ).

Adems, puede establecerse que para variables aleatorias de valor entero se tiene que: 4. P ( X = x ) = F ( x ) F ( x 1) ; 5.

P(xi X x j ) = F (x j ) F (xi 1)

44 45

Ibid, 53 57. El nombre completo de esta funcin es el de funcin de masa de probabilidad de una variable aleatoria discreta.

24

Ejemplo 2.4.1 El nmero de vagonetas solicitadas en renta a una agencia de alquiler en un perodo de 50 das se identifica en la siguiente tabla:

Demanda posible Nmero de X Das 3 3 4 7 5 12 6 14 7 10 8 4 50

p (x ) 0.06 0.14 0.24 0.28 0.20 0.08 1.00

P(X x ) 0.06 0.20 0.44 0.72 0.92 1.00

2.5

Distribuciones de Probabilidad de Variables Aleatorias Continuas46

En el caso continuo, la probabilidad de que una variable aleatoria x es cero.

X tome un valor especfico

La distribucin de probabilidad de una variable aleatoria continua X est caracterizada por una funcin f ( x ) que recibe el nombre de funcin de densidad de probabilidad. Esta funcin f ( x ) no es la misma funcin de probabilidad que para el caso discreto. Como la probabilidad de que X tome el valor especfico x es cero, la funcin de densidad de probabilidad no representa la probabilidad de que X = x . Ms bien, sta proporciona un medio para determinar la probabilidad de un intervalo a X b . La funcin de densidad de probabilidad de una variable aleatoria continua X formalmente de la siguiente manera: Si existe una funcin f ( x ) tal que 1. 2. 3.

se define

f ( x ) 0, < x < ,

f (x )dx = 1,

y
b

P(a X b ) = f ( x )dx
a

para cualesquiera a y b , entonces f ( x ) es la funcin de densidad de probabilidad de la variable aleatoria continua X .

46

Ibid, p. 57 62.

25

Al igual que en el caso de una variable aleatoria discreta, la funcin de distribucin acumulativa F ( x ) de una variable aleatoria continua X es la probabilidad de que X tome un valor menor o igual a algn x especifico. Esto es,

P( X x ) = F ( x ) =
en donde t es una variable artificial de integracin. Dado que para cualquier variable aleatoria continua
x

f (t )dt,

X,

P( X = x ) = f (t )dt = 0 ,
x

entonces:

P( X x ) = P( X < x ) = F (x ) .
La distribucin acumulativa F ( x ) , es una funcin lisa no decreciente de los valores de la variable aleatoria con las siguientes propiedades: 1. F ( ) = 0 ;

F ( ) = 1; 3. P (a < X < b ) = F (b ) F (a ) ; 4. dF ( x ) dx = f ( x ) .
2.

Ejemplo 2.5.1 El tiempo requerido por los estudiantes para presentar un examen de una hora es una variable aleatoria con funcin de densidad dada por

a) Determinar el valor de c que hace de f ( x ) una funcin de densidad. b) Una vez calculada c, obtener F ( x )

cx 2 + x f (x ) = 0

0 x 1 en otro caso

Solucin: a)

(cx
0

+ x )dx = 1 , de donde

3 c 1 + =1 c = 3 2 2 x x3 x2 3 2 b) F ( x ) = t + t dt = + , 0 x 1 2 2 2 0

26

Finalmente,

x<0 0 x3 x2 F (x ) = + 0 x 1 2 2 x >1 1
2.6 Valor Medio y Varianza de Distribucin

En lugar de usar la caracterizacin completa de una distribucin, por lo regular es suficiente con describirla (aunque incompletamente), en trminos de ciertas cantidades que caracterizan propiedades generales de dicha distribucin. Las dos cantidades ms importantes son el valor medio o media

y la varianza

2 ; y a continuacin se definen.

2.6.1 Valor Medio de una Distribucin47


El valor medio o media de una distribucin se representar por distribucin discreta se define como

En el caso de una

E ( x ) = = xi p ( x i )
i

y en el caso de una distribucin continua por

E (x ) = =

xf (x )dx .

2.6.2 Varianza de una Distribucin48


La varianza de una distribucin se representa por frmula
i

2.

En el caso discreto se define segn la


2

Var ( x ) = 2 = ( xi ) p (xi )

y en el caso continuo mediante la frmula

Var ( x ) = 2 =

(x ) f (x )dx.
2

47 48

Cfr. KREYSZIG, Erwin, Introduccin a la Estadstica Aplicada Principios y Mtodos, p. 97. Cfr. Ibid, p. 97.

27

2.7

Algunas Distribuciones de Probabilidad


de las principales distribuciones de

Este subcaptulo est dedicado al conocimiento probabilidad, tanto discretas como continuas.

2.7.1 Distribuciones Discretas


Se considerarn tres distribuciones discretas que tienen mucha importancia en estadstica. stas son, la distribucin binomial, la de Poisson y la hipergeomtrica.

2.7.1.1

Distribucin Binomial

Es una de las distribuciones discretas de probabilidad ms tiles. Sus reas de aplicacin incluyen inspeccin de calidad, ventas, mercadotecnia, medicina, investigacin de opiniones y otras.49 La distribucin binomial es un modelo aplicable para situaciones de toma de decisiones en las que puede suponerse que un proceso de muestreo responde a un proceso Bernoulli. Un proceso Bernoulli es un proceso de muestreo en el que: 1. En cada ensayo u observacin slo son posibles dos resultados mutuamente excluyentes. Por convencin stos resultados se llaman xito y fracaso. 2. Los resultados de la serie de ensayos, u observaciones, constituyen eventos independientes. 3. La probabilidad de xito de cada ensayo, indicada por p , es constante de un ensayo a otro. Esto es, el proceso es estacionario. La distribucin binomial puede servir para determinar la probabilidad de obtener un nmero establecido de xitos en un proceso Bernoulli. Se requiere de tres valores: el nmero establecido de xitos ( x ) ; el nmero de ensayos, u observaciones (n ) , y la probabilidad de xito en cada ensayo

( p ) .50

Para resolver problemas que satisfacen las condiciones enunciadas en el prrafo anterior, se utilizar una frmula que se obtendr de la siguiente forma: si p y 1 p son probabilidades de xito y fracaso en cada ensayo, entonces la probabilidad de obtener x xitos y n x fracasos en algn orden especfico es p (1 p )
x n x

p para cada xito, un factor 1 p para cada fracaso, y los x factores p y los n x factores 1 p son multiplicados todos a la vez. En vista de que esta probabilidad se aplica a cualquier punto del espacio muestral que representa x xitos y n x fracasos (en
hay un factor cualquier orden especfico), slo tenemos que contar cuntos puntos de esta clase existen, y multiplicar entonces p
x

(1 p ) ' s

; claramente, en este producto de las p ' s y de las

(1 p )n x

por este nmero. Evidentemente, el nmero de formas en

49 50

CANAVOS op. cit. p. 89. KAZMIER op. cit. p. 96.

28

que podemos obtener x xitos en n ensayos es el nmero de combinaciones de x objetos seleccionados de un conjunto de n objetos as llegamos al siguiente resultado.51 x Funcin de Probabilidad Parmetros

n n x p( x; n, p ) = p x (1 p ) x x = 0, 1, 2, ..., n
Media

n , entero positivo p , 0 p 1
Varianza

np

npq

FIGURA 2.1. Grficas de la funcin binomial de probabilidad.52

2.7.1.2

Distribucin de Poisson

La distribucin de Poisson puede utilizarse para determinar la probabilidad de ocurrencia de un nmero establecido de eventos cuando stos ocurren en un continuum temporal o espacial. Este proceso se llama proceso de Poisson; aunque semejante al proceso Bernoulli,53 se distingue de l en que los eventos ocurren a lo largo de un continuum (durante un intervalo temporal, por ejemplo) y en que no se dan ensayos propiamente dichos. Un ejemplo de un proceso de este tipo sera el nmero de personas que llegan a una tienda de autoservicio en un tiempo determinado, el nmero de bacterias en un cultivo, etctera. Como en el caso del proceso Bernoulli, se supone que los eventos son independientes y el proceso es estacionario. Para determinar la probabilidad de ocurrencia de un nmero establecido de eventos en un proceso de Poisson slo se requiere de un valor: el nmero medio de eventos a largo plazo en la dimensin temporal o espacial especfica de inters. Por lo general esta media se representa como , o en ocasiones como . La frmula para determinar la probabilidad de un nmero establecido de xitos x en una distribucin de Poisson es:54

51 52 53 54

MILLER, Irwin, John E. FREUND y Richard A. JOHNSON, Probabilidad y Estadstica para Ingenieros, p. 93 94. CANAVOS op. cit. p. 91. Vid. 2.7.1.1 KAZMIER op. cit. p. 99.

29

Funcin de Probabilidad

Parmetro

p( x; ) =

e x! x = 0, 1, 2, ...
Media

>0
Varianza

FIGURA 2.2 Grficas de la funcin de probabilidad de Poisson.55

2.7.1.3

Distribucin Hipergeomtrica

Cuando el muestreo se realiza sin reemplazo de cada elemento muestreado tomado de una poblacin finita de elementos, no se aplica el proceso Bernoulli, porque cuando se eliminan elementos de la poblacin existe un cambio sistemtico en la probabilidad de xito. Cuando en una situacin que de otro modo correspondera a un proceso Bernoulli, se hace uso del muestreo sin reemplazo, la distribucin discreta adecuada es la distribucin hipergeomtrica. Concediendo que x es el nmero establecido de xitos, N el nmero total de elementos de la poblacin, k el nmero total de xitos incluidos en la poblacin y n el nmero de elementos de la muestra, la frmula para determinar probabilidades hipergeomtricas es:56 Funcin de Probabilidad Parmetros

k N k x n x p( x; N , n, k ) = N n x = 0, 1, 2, ..., n x k, nx N k
Media

N , n, k , enteros positivos 1 n N; 1 k N; N = 1, 2, ...


Varianza

nk N
55 56

nk ( N k )( N n ) N 2 ( N 1)

CANAVOS op. cit. p. 100. KAZMIER op. cit. p. 98.

30

FIGURA 2.3 Grficas de la funcin hipergeomtrica de probabilidad.57

2.7.2 Distribuciones Continuas


De manera especfica en este subcaptulo se estudiarn los siguientes modelos de probabilidad: normal, uniforme, gama, de Weibull, exponencial negativa y beta.

2.7.2.1

Distribucin Normal

La distribucin normal de probabilidad es una distribucin de probabilidad continua. La curva de probabilidad que representa a la distribucin normal de probabilidad tiene forma de campana, como lo ejemplifican las curvas de probabilidad de la siguiente figura.

FIGURA 2.4 Grficas de la funcin de densidad normal para diferentes valores de

.58

57 58

CANAVOS op. cit. p. 110. CANAVOS op. cit. p. 132.

31

La distribucin normal de probabilidad es importante para la inferencia estadstica por tres razones: 1. Se sabe que las medidas obtenidas por muchos procesos aleatorios siguen esta distribucin. 2. Las probabilidades normales suelen servir para aproximar otras distribuciones de probabilidad, como las distribuciones binomial y Poisson. 3. Las distribuciones estadsticas como la media muestral y la proporcin muestral tiene distribucin normal cuando el tamao de muestra es grande, independientemente de la poblacin origen. Como sucede en todas las distribuciones continuas de probabilidad, un valor de probabilidad de una variable aleatoria continua slo puede determinarse para un intervalo de valores. Se dice que una variable aleatoria X se encuentra normalmente distribuida si su funcin de densidad de probabilidad est dada por: Funcin de Densidad de Probabilidad Parmetros

f ( x; , ) =

1 e [( x ) 2
Media

, Varianza

< <

< x <

>0

Puesto que toda diferente combinacin de

generara una distribucin normal de

probabilidad diferente, las tablas de probabilidad normales se basan en una distribucin en particular: la distribucin normal estndar. sta es la distribucin normal de probabilidad con = 0 y = 1 . Todo valor de x precedente de una poblacin con distribucin normal puede convertirse en el equivalente valor estndar de z mediante la frmula:

z=

Un valor de z reformula el valor x original en trminos del nmero de unidades de la desviacin estndar por las cuales el valor original difiere de la media de la distribucin. Un valor negativo z indicara que el valor x original estaba por debajo de la media.59

59

KAZMIER op. cit. p. 115.

32

FIGURA 2.5 Correspondencia entre las probabilidades de

X y de Z.60

2.7.2.2

Distribucin Uniforme

Supngase que ocurre un evento en que una variable aleatoria toma valores de un intervalo infinito, de manera que stos se encuentran distribuidos igualmente sobre el intervalo. Esto es, la probabilidad de que la variable aleatoria tome un valor en cada subintervalo de igual longitud es la misma. Se dice entonces que la variable aleatoria se encuentra distribuida uniformemente sobre el intervalo. La distribucin uniforme proporciona una representacin adecuada para redondear diferencias que surgen al medir cantidades fsicas entre los valores observados y los reales. Por ejemplo, si el peso de un individuo se redondea al kilogramo ms cercano. Se dice que una variable aleatoria

X est distribuida uniformemente sobre el intervalo (a, b ) si

su funcin de densidad est dada por:61

60 61

Ibid, p. 137. Ibid, p. 143 147.

33

Funcin de Densidad de Probabilidad

Parmetros

1 (b a ) a xb f ( x; a, b ) = 0 para cualquier otro caso

a, b,
Varianza

p a p
pb p

(a + b )
2

Media

(b a )2
12

FIGURA 2.6 Grfica de la funcin de densidad de probabilidad uniforme.62

2.7.2.3

Distribucin Gama63

Esta distribucin se emplea de manera extensa en una gran diversidad de reas; por ejemplo, para representar el tiempo aleatorio de la falla slo si de manera exacta los componentes fallan y la falla de cada componente ocurre a una frecuencia constante = 1 por unidad de tiempo. Tambin se emplea en problemas de lneas de espera para representar el intervalo (de tiempo) total para completar una reparacin si sta se lleva a cabo en subestaciones; completar la reparacin de cada subestacin es un evento independiente que ocurre a una frecuencia constante igual a = 1 . Existen algunos ejemplos que no siguen el patrn anterior pero se aproximan de manera adecuada mediante el empleo de la distribucin gama, como los ingresos familiares y la edad del hombre al contraer matrimonio por primera vez. Se dice que la variable aleatoria X tiene una distribucin gama si su funcin de densidad de probabilidad est dada por:

62 63

Ibid, p. 144. Ibid, p. 152 159.

34

Funcin de Densidad de Probabilidad


1 x 1e ( ) f ( x; , ) = 0 x

Parmetros

xf0
para cualquier otro caso

, ,
Varianza

>0 >0

Media

Donde: ( ) =

x
0

1 x

e dx, > 0

Algunas propiedades de esta funcin son: 1. (1) = 1 2. ( + 1) = ( ) 3. ( + 1) = !

4.

n n = 1! 2 2 1 5. = .64 2

La distribucin gama es muy verstil puesto que exhibe varios perfiles que dependen del valor del parmetro . En la siguiente figura se ilustran distintos perfiles de la funcin de densidad gama para distintos valores de y . Como puede observarse, para 1, la distribucin gama tiene un perfil en forma de J transpuesta. Para > 1, presenta un pico que ocurre en x = ( 1) . Para un valor fijo , el perfil bsico de la distribucin gama no se altera si el valor

cambia. Lo anterior da como resultado que las cantidades y de escala, de la distribucin gama.

son los factores de forma

64

KREYSZIG op. cit. p. 164 165.

35

FIGURA 2.7 Grficas de la funcin de densidad gama para distintos valores de

.65

Cuando es un entero positivo, la distribucin gama se conoce tambin como distribucin de Erlang; por otro lado, si = 1 , la distribucin Erlang (gama) se reduce a lo que se conoce como la distribucin exponencial negativa. Otro caso especial del modelo de probabilidad gama es la distribucin chi-cuadrado66 cuando = v 2 y = 2 ; est distribucin se encuentra caracterizada por un mismo parmetro v , que recibe el nombre de grados de libertad.

2.7.2.4

Distribucin de Weibull67

En los ltimos 25 aos esta distribucin se emple como modelo para situaciones de tiempofalla y con el objetivo de lograr una amplia variedad de componentes mecnicos y elctricos. Se dice que una variable aleatoria X densidad de probabilidad est dada por: tiene una distribucin de Weibull si su funcin de

65 66

CANAVOS op. cit. p. 152. La funcin de densidad de probabilidad de una variable aleatoria chicuadrado se determina por:
x 1 x v 21e 2 xf0 (v 2 )2 v 2 f ( x; v ) = 0 para cualquier otro caso.

67

Como se ver, esta distribucin interviene en la inferencia estadstica y de manera especial al hacer inferencia respecto a las varianzas. Vid: Ibid, p. 158. Ibid, p. 159 163.

36

Funcin de Densidad de Probabilidad

Parmetros

x e f ( x; , ) = 0

x 1

xf0 para cualquier otro caso

, ,
Varianza

f0 f0

Media

1 +

2 1 +

2 1 2 1 +

La distribucin Weibull es una familia de distribuciones que dependen de dos parmetros: el de forma, y el de escala, . En la siguiente figura se muestran varias grficas de la distribucin Weibull para distintos valores de y ; y como puede observarse, esta distribucin tiene distintos perfiles dependiendo del valor . Por ejemplo, si p 1, tiene una forma de J transpuesta, y si f 1, la funcin de densidad presenta un pico nico.

FIGURA 2.8 Grficas de la funcin de densidad de Weibull para distintos valores de y .68 Existen dos casos especiales en la distribucin de Weibull que merecen mencin especial. Cuando el parmetro de forma es igual a uno, la distribucin de Weibull (al igual que la gama), se reduce a la distribucin exponencial negativa. Cuando = 2 y el parmetro de escala se reemplaza por 2 , la funcin de densidad de Weibull se reduce a lo que se conoce como distribucin de Rayleigh.69

68 69

Ibid, p. 160. La funcin de densidad de probabilidad de una variable Rayleigh se determina por:

f x; 2

x x2 2 e 2 = 0
2

x>0

para cualquier otro caso.

Esta distribucin es utilizada en problemas de ruido asociados con sistemas de comunicacin. Vid: BILLINTON, Roy y Ronald N. ALLAN, Reliability Evaluation of Engineering Systems Concepts and Techniques, p. 192.

37

2.7.2.5

Distribucin Exponencial Negativa70

Se ha notado con anterioridad que la distribucin exponencial (negativa) es un caso especial de los modelos de Weibull y gama. Ya que es un caso especial de la distribucin gama (Erlang), la variable aleatoria exponencial es el tiempo que transcurre hasta que se da el primer evento de Poisson. Es decir, la distribucin exponencial puede modelar el lapso entre dos eventos consecutivos de Poisson que ocurren de manera independiente y a una frecuencia constante: esta distribucin se emplea con bastante frecuencia con objeto de modelar problemas del tipo tiempofalla y como modelo para el intervalo en problemas de lneas de espera. Si una variable aleatoria X tiene una distribucin exponencial, su funcin de densidad est dada por: Funcin de Densidad de Probabilidad Parmetro

1 e f ( x; ) = 0

xf0

,
para cualquier otro caso
Media

f0

Varianza

La distribucin exponencial se caracteriza por un parmetro , que representa el lapso promedio de tiempo entre dos eventos independientes de Poisson. En el contexto de la confiabilidad, recibe el nombre de tiempo promedio entre fallas; y 1 es la frecuencia de la falla.
f(x)

x FIGURA 2.9 Grfica de la funcin de densidad exponencial.71

2.7.2.6

Distribucin Beta72

Una distribucin que permite representar una gran variedad de perfiles es la distribucin beta. Se ha utilizado para representar variables fsicas cuyos valores se encuentran restringidos a un
70 71 72

CANAVOS op. cit. p. 163 167. Crf. MILLER, Irwin, John E. FREUND y Richard A. JOHNSON, op. cit. p. 161. CANAVOS op. cit. p. 147 151.

38

intervalo de longitud finita y para encontrar ciertas cantidades que se conocen como lmites de tolerancia sin necesidad de la hiptesis de una distribucin normal. Adems, la distribucin beta juega un gran papel en la estadstica bayesiana. Se dice que una variable aleatoria X posee una distribucin beta si su funcin de densidad de probabilidad est dada por: Funcin de Densidad de Probabilidad Parmetros

( + ) 1 1 ( )( ) x (1 x ) f ( x; ) = 0

0 p x p1

f0

para cualquier otro caso

f0
Varianza
2

Media

( + )
Las cantidades distintos de

( + ) ( + + 1)
como 1 , la

de la distribucin beta son, ambas, parmetros de perfil. Valores

darn distintos perfiles para la funcin de densidad beta. Si tanto

son menores que uno, la distribucin beta tiene un perfil en forma de U. Si

distribucin tiene un perfil de J transpuesta; y si

p 1 y 1, el perfil es una J. Cuando tanto y son ambos menores que uno, la distribucin presenta un pico en x = ( 1) ( + 2) . Finalmente, la distribucin beta es simtrica cuando = . En la siguiente figura observe los
perfiles de esta distribucin.

p1

FIGURA 2.10 Grfica de la funcin de densidad beta para distintos valores de

.73

En este captulo se estudiaron las principales distribuciones de probabilidad y se discutieron algunas reas de aplicacin de cada modelo, sin embargo el lector debe de considerar que para un experimento aleatorio siempre se elegir la distribucin de probabilidad que mejor se ajuste a este, para tal eleccin en el siguiente captulo se muestran algunas pruebas de bondad de ajuste as como algunos mtodos de inferencia estadstica.

73

CANAVOS op. cit. p. 148.

39

CAPTULO 3 ESTIMACIN DE DISTRIBUCIONES DE PROBABILIDAD PARA DATOS EMPRICOS Y LA DETERMINACIN DEL TAMAO DE MUESTRA
En numerosas ocasiones la informacin con que se cuenta para analizar el comportamiento de cierto experimento, o para intentar hacer un pronstico, es tan poca, que resulta insuficiente si se intenta utilizar las tcnicas clsicas. Sin embargo, ante la cotidianeidad con que se presenta esta problemtica se han desarrollado otras tcnicas que permiten librar la situacin. Por esta razn, el objetivo de este captulo es el de estudiar los mtodos de estimacin de la distribucin de probabilidad para datos empricos, entre los que se destaca el mtodo del rango mediano que sirve para tal fin cuando se cuenta con una muestra pequea o insuficiente; as como los mtodos de determinacin del tamao de muestra, ya que sta debe de ser lo suficientemente grande para que las inferencias elaboradas en una poblacin o estudio, como lo es el de simulacin se apeguen a la realidad.

3.1 Estimacin Empricos74

de

la

Distribucin

de

Probabilidad

para

Datos

Datos Empricos Representacin Grfica de la Distribucin de Probabilidad de los Datos Empricos Seleccin de la Distribucin de Probabilidad Terica Estimacin de Parmetros de la Distribucin de Probabilidad Torica Prueba de Bondad de Ajuste Distribucin de Probabilidad Seleccionada

FIGURA 3.1 Algoritmo para la Estimacin de la Distribucin de Probabilidad para Datos Empricos.75 El algoritmo anterior muestra los pasos a seguir para estimar la distribucin de probabilidad de los datos empricos obtenidos. Es necesario hacer nfasis en que el trmino experimento abarca un gran nmero de actividades cuyo objetivo es generar y coleccionar datos (pruebas de laboratorio, datos de campo, reportes de usuario; y otros similares).
74 75

KNEZEVIC, Jezdimir, Reliability, Maintainability and Supportability a Probabilistic Approach p. 150 - 151. Ibid. p. 151.

40

A continuacin se explican los pasos del algoritmo anterior.

3.1.1 Representacin de la Distribucin de Probabilidad de los Datos Empricos


Existen dos mtodos para representar o aproximar la distribucin de probabilidad de los datos empricos dependiendo del nmero total de resultados disponibles y son los siguientes: Mtodo del Rango Mediano. Mtodo de Frecuencias Relevantes. El primero es aplicable en casos donde el nmero de datos es menor a 50, mientras que el segundo se recomienda en el caso contrario. Ambos mtodos son descritos para una variable aleatoria X .

3.1.1.1 Mtodo del Rango Mediano para la Estimacin Distribucin de Probabilidad para Muestras Pequeas76

de

la

De acuerdo con el teorema de Bernoulli, la probabilidad de ocurrencia de un evento se define por la razn de su frecuencia entre el nmero total de resultados, n, cuando sta se aproxima a infinito, pero cuando el nmero de casos es insuficiente los datos no pueden ser agrupados y consecuentemente no se puede determinar de esta manera su distribucin de probabilidad. Ante este problema se han desarrollado algunos mtodos para estimar la distribucin de probabilidad; entre stos destaca el mtodo del rango mediano el cual es el ms utilizado y se presenta a continuacin. El rango mediano (RM) representa la proporcin acumulada de los datos correspondientes al rango bajo consideracin, la funcin de distribucin acumulada de datos empricos F' () puede determinarse para la variable aleatoria X, como sigue:

n + 0.4 y la funcin de densidad de los datos empricos f ' () : 1 f' (x i ) = (n + 0.4 ) (x i+1 x i )

F' (x i ) = RM(x i ) =

(i 0.3 )

(3.1)

(3.2)

Es necesario mencionar que para aplicar estas expresiones a los datos empricos, estos deben de ser ordenados en forma ascendente, i.e. i = 1 corresponde al resultado con el valor numrico ms bajo.77 Para aclarar este mtodo y hacer los clculos de manera fcil se presenta el siguiente ejemplo.

76

En este caso se considera muestra pequea a aquella que consta de menos de 50 datos, esto porque existen unas tablas que proporcionan las probabilidades acumuladas de los datos (en orden ascendente) correspondientes al rango bajo consideracin; estas probabilidades son calculadas mediante el mtodo del rango mediano RM aqu explicado cuya aproximacin es correcta al valor en tablas con 1% de error para 4 datos y de 0.1% para ms de 50. 77 Ibid. p. 151 -156.

41

Ejemplo 1.3.1.1 El tiempo de falla de nueve dispositivos probados se lista a continuacin: 85, 35, 38, 100, 52, 70, 27, 49 y 104. Calcule y trace la grfica de la distribucin de probabilidad. Solucin: El primer paso es ordenar en forma ascendente los datos: i 1 2 3 4 5 6 7 8 9

xi 27 35 38 49 52 70 85 100 104 Una vez ordenados los datos se calculan F' (x i ) y f' (x i ) con las ecuaciones 3.1 y 3.2 respectivamente, considerando que el tamao de muestra es n = 9 . i 1 2 3 4 5 6 7 8 9 xi

F' (x i )

f ' (x i )

27 0.0745 0.013298 35 0.1809 0.035461 38 0.2872 0.009671 49 0.3936 0.035461 52 0.5000 0.005910 70 0.6064 0.007092 85 0.7128 0.007092 100 0.8191 0.026596 104 0.9255

Finalmente, con los resultados de la tabla anterior se traza la grfica de la distribucin de probabilidad para los datos de este ejemplo.

DISTRIBUCIN DE PROBABILIDAD
0.040000 0.030000

f '(xi) 0.020000
0.010000 0.000000 0 20 40 60 80 100 120

xi

3.1.1.2 Mtodo de Frecuencias Relevantes para la Estimacin de la Distribucin de Probabilidad


Este mtodo es el que se explic en los subcaptulos 1.4 a 1.6.

42

Un ejemplo detallado de esta metodologa se encuentra en el subcaptulo 1.7. En el ejemplo mencionado los datos son el nmero de das que cada uno de 55 clientes asisti a un gimnasio durante los 4 primeros meses del ao. A partir de los datos, se obtuvo una tabla de distribucin de frecuencias y un histograma de frecuencias, mismos que se muestran a continuacin:
TABLA DE DISTRIBUCIN DE FRECUENCIAS Frecuencia Marcas Frecuencia Frecuencia Relativa de Clase Frecuencia Acumulada Relativa Acumulada Fi* fi Fi xi fi* 9.5 6 6 0.10909 0.10909 23.5 6 12 0.10909 0.21818 37.5 6 18 0.10909 0.32727 51.5 9 27 0.16364 0.49091 65.5 4 31 0.07273 0.56364 79.5 10 41 0.18182 0.74545 93.5 14 55 0.25455 1.00000 55 1.00000

Intervalos de Clase Lmites Fronteras 3 16 2.5 16.5 17 30 16.5 30.5 31 44 30.5 44.5 45 58 44.5 58.5 59 72 58.5 72.5 73 86 72.5 86.5 87 100 86.5 100.5

HISTOGRAM A DE FRECUENCIAS 14

Clientes

9 6 6 6 4

10

9.5

23.5

37.5

51.5

65.5

79.5

93.5

Das de Asiste ncia al Gim nasio

De igual modo se calcularon las medidas numricas descriptivas de los datos, algunas de stas son las siguientes: Media Aritmtica: x =

x
i=1

n
2

= 58.04

Varianza: s =
2

(x
i=1

x)

n -1

= 898.11

43

3.1.2 Seleccin de la Distribucin de Probabilidad Terica78


En esta fase, se debe seleccionar una distribucin de probabilidad que represente tan cerca como sea posible a los datos empricos. Utilizando lenguaje estadstico este proceso se conoce como planteamiento de la hiptesis. Es difcil seleccionar una distribucin de probabilidad terica en particular que est asociada a los datos empricos, especialmente cuando la muestra es pequea. El principal indicador ser la grfica de estos datos obtenida en el paso anterior, la cual puede compararse con las distribuciones de probabilidad que se estudiaron de manera breve en el captulo 2. Algunas recomendaciones para asistir el proceso de seleccin de la distribucin de probabilidad terica asociada a los datos empricos son las siguientes: Si los valores de la desviacin estndar y la media son relativamente cercanos, es un buen indicador de que la variable aleatoria obedece una distribucin exponencial. Como la distribucin normal es simtrica, i. e. la media, la mediana y la moda tienen el mismo valor, en los casos en que ests medidas centrales posean valores razonablemente cercanos, la distribucin recomendada es la normal. Si las primeras condiciones no se cumplen, y la grfica de la distribucin de probabilidad emprica no es simtrica posiblemente se tenga una distribucin de Weibull. Si ninguna de las condiciones anteriores se satisface posiblemente los datos no pertenece al mismo experimento o proceso, i. e. posiblemente se est tratando con una distribucin mezclada. En este caso los datos empricos debern ser nuevamente examinados y si existen evidencias de una mezcla de datos ser necesario separarlos; y repetir el procedimiento para cada conjunto de datos.

Una vez hecha la hiptesis sobre la distribucin de probabilidad que siguen los datos, ser necesario determinar los parmetros de sta. El mtodo que en el siguiente subcaptulo se presenta servir para tal objetivo. Ejemplo 3.1.2 Mediante la comparacin del histograma del subcaptulo 1.7 (mismo que se muestra nuevamente en el subcaptulo 3.1.1.2) con las distribuciones de probabilidad continuas estudiadas en el subcaptulo 2.7.2 se formula la hiptesis de que tal conjunto de datos obedece una distribucin gama.

3.1.3 Mtodo de los Momentos para la Estimacin de Parmetros de una Distribucin de Probabilidad
Quiz este mtodo sea el ms antiguo para la estimacin de parmetros. ste consiste en igualar los momentos apropiados de la poblacin con los correspondientes momentos muestrales para estimar un parmetro desconocido de la distribucin. Definicin 3.1.3 Sea X 1 , X 2 , ... X n una muestra aleatoria de una distribucin con funcin

(masa) de probabilidad f ( x; ). El rsimo momento alrededor del cero se define como

78

Ibid. p. 166 184.

44

M r' =

1 n r Xi n i =1

Ejemplo 3.1.3 Con la media aritmtica y la varianza calculadas en 1.7 (mismos que se muestra nuevamente en el subcaptulo 3.1.1.2) obtenga los parmetros79 de una distribucin gama, utilizando el mtodo de los momentos. Solucin: media = Varianza = 58.04 = 898.11 =
2

= =

15.4749 3.7503

3.1.4 Introduccin a las Pruebas de Hiptesis Estadsticas80


Una hiptesis estadstica es una afirmacin con respecto a alguna caracterstica desconocida de una poblacin de inters. La esencia de probar una hiptesis estadstica es el decidir si la afirmacin se encuentra apoyada por la evidencia experimental que se obtiene a travs de una variable aleatoria. En forma general, la afirmacin involucra ya sea algn parmetro o a alguna forma funcional no conocida de la distribucin de inters a partir de la cual se obtiene una muestra aleatoria. La decisin acerca de si los datos muestrales apoyan estadsticamente la afirmacin se toma con base a la probabilidad, y, si esta es mnima, entonces ser rechazada.81 Se han desarrollado tres procedimientos distintos para la prueba de hiptesis, todos los cuales conducen a las mismas decisiones cuando se emplean los mismos estndares de probabilidad (y riesgo). El mtodo del valor crtico para la prueba de hiptesis, de acuerdo con este procedimiento, se determinan los as llamados valores crticos de la estadstica de prueba que dictaran el rechazo de una hiptesis, tras de lo cual la estadstica de prueba observada se compara con los valores crticos. ste fue el primer mtodo en desarrollarse, motivo por el cual buena parte de la terminologa de las pruebas de hiptesis se deriva de l. Ms recientemente, el mtodo del valor P ha cobrado popularidad a causa de ser el ms fcilmente aplicable a software de cmputo. Este mtodo se basa en la determinacin de la probabilidad condicional de que el valor observado de una estadstica muestral pueda ocurrir al azar, dado que un supuesto particular sobre el valor del parmetro poblacional asociado sea en efecto correcto. Finalmente, el mtodo de intervalos de confianza se basa en la observacin de si el valor supuesto de un parmetro poblacional est incluido en el rango de valores que define a un intervalo de confianza para ese parmetro. Pero ms all del mtodo de prueba de hiptesis que se use, debe hacerse notar que si un valor hipottico no se rechaza, y por lo tanto se acepta, ello no constituye una "prueba" de que sea correcto. La aceptacin de un valor supuesto de un parmetro indica simplemente que se trata de un valor verosmil, con base en el valor observado de la estadstica muestral.

79 80 81

Cuando un parmetro es estimado, a ste se le coloca el smbolo . KAZMIER, Leonard J., Estadstica Aplicada a la Administracin y a la Economa, p. 164 - 165. CANAVOS C. George, Probabilidad y Estadstica Aplicaciones y Mtodos, p. 303.

45

En este subcaptulo se describir nicamente el mtodo del valor crtico para la prueba de hiptesis, porque las pruebas de bondad de ajuste que se estudiaran en el siguiente utilizan esta metodologa. Los pasos bsicos de la prueba de hiptesis con el Mtodo del Valor Crtico son los siguientes:

Paso 1. Formular la hiptesis nula y la hiptesis alternativa. La hiptesis nula ( H0 ) es el valor


paramtrico hipottico que se compara con el resultado muestral. Se le rechaza slo si es poco probable que el resultado muestral haya ocurrido dado lo correcto de la hiptesis. La hiptesis alternativa ( H1 ) se acepta slo si la hiptesis nula es rechazada. En muchos libros de texto la hiptesis alternativa tambin se designa como

Ha .

Paso 2. Especificar el nivel de significancia por aplicar. El nivel de significancia es el estndar

estadstico que se especifica para rechazar la hiptesis nula. Si se especifica un nivel de significancia de 5%, la hiptesis nula se rechaza slo si el resultado muestral es tan diferente del valor hipottico que una diferencia por ese monto o un monto superior ocurrira al azar con una probabilidad de 0.05 o menos. Ntese que si se usa el nivel de significancia de 5%, hay una probabilidad de 0.05 de rechazar la hiptesis nula aun siendo efectivamente cierta. Esto se llama error tipo I. La probabilidad del error tipo I siempre es igual al nivel de significancia empleado como estndar para rechazar la hiptesis nula; se le designa con la letra griega minscula (alfa), de modo que designa tambin al nivel de significancia. Los niveles de significancia de uso ms frecuente en la prueba de hiptesis son los de 5% y 1%. Ocurre un error tipo II si la hiptesis nula no se rechaza, y es por lo tanto aceptada, cuando en realidad es falsa. En la siguiente tabla se resumen los tipos de decisiones y las posibles consecuencias de las decisiones tomadas en pruebas de hiptesis. Estados Posibles Hiptesis nula Hiptesis nula cierta falsa Aceptacin correcta Error tipo II Error tipo I Rechazo correcto

Decisin posible No rechazo de la hiptesis nula Rechazo de la hiptesis nula

TABLA 3.1 Consecuencias de decisiones en pruebas de hiptesis.82

Paso 3. Seleccin de la estadstica de prueba. La estadstica de prueba ser ya sea la estadstica


muestral (el estimador insesgado del parmetro a prueba) o una versin estandarizada de la estadstica muestral. Por ejemplo, para probar un valor hipottico de la media poblacional, la media de una muestra aleatoria tomada de esa poblacin podra servir como la estadstica de prueba. Sin embargo, si la distribucin de muestreo de la media es normal, el valor de la media muestral se convierte usualmente en un valor z, el cual funge entonces como la estadstica de prueba.

Paso 4. Establecer el valor o valores crticos de la estadstica de prueba. Habiendo especificado la

hiptesis nula, el nivel de significancia y la estadstica de prueba por usar, se establece(n)

82

KAZMIER, op. cit. p. 164.

46

entonces el(los) valor(es) crtico(s) de la estadstica de prueba.83 En cualquier caso, un valor crtico identifica el valor de la estadstica de prueba requerido para rechazar la hiptesis nula.

Paso 5. Determinar el valor de la estadstica de prueba. Por ejemplo, al probar un valor hipottico

de la media poblacional, se recolecta una muestra aleatoria y se determina el valor de la media muestral. Si el valor crtico fue establecido como un valor z, la media muestral se convierte a un valor z. de la estadstica de prueba. Se rechaza o no entonces la hiptesis nula. Si la hiptesis nula es rechazada, no se rechazar la hiptesis alternativa.

Paso 6. Tomar la decisin. El valor observado de la estadstica muestral se compara con el valor crtico

3.1.4.1

Pruebas de Bondad de Ajuste

Las pruebas de bondad de ajuste84 se emplean para decidir cundo un conjunto de datos se apega a una distribucin de probabilidad dada.85

3.1.4.1.1 Prueba de Bondad de Ajuste ChiCuadrado


Entre la distribucin real y la que se ha supuesto existen siempre diferencias. Para que la sustitucin de la primera por la segunda sea legtima, hay que averiguar si estas diferencias pueden ser debidas al azar. Para ello se tomar en cuenta el hecho de que la variable suma de cuadrados de la diferencia de efectivos frecuencia observada (fi) divididos por los efectivos tericos frecuencia terica calculada (ft) es decir

R=
i=1

i =k

(fi f t )2
ft

est distribuida segn una ley de aleatorias.


2

(ley chicuadrado) cuando estas diferencias son

Para emplear las tablas , se fija previamente el error o umbral de probabilidad, de acuerdo con las necesidades del problema. Si el perjuicio que ocasiona tomar como malo un ajuste, no sindolo, es pequeo, convendr tomar un nivel de significancia (probabilidad de rechazar un ajuste bueno) grande, 5%. Solamente si el perjuicio es grande, se tomar = 1% = 0.1% .

83

84

Estos valores pueden ser uno o dos, dependiendo de si estn implicadas las as llamadas pruebas unilaterales o bilaterales. La calidad del ajuste de una curva se basa principalmente en el criterio del error cuadrtico, el cual se define como la suma de

{fi * f t }2

sobre todos los intervalos del histograma. El ajuste que tenga menor error cuadrtico ser el

85

que se elija. CANAVOS, op. cit. p. 363.

47

Como grados de libertad v (para manejar las tablas parmetros estimados, todo esto menos 1, es decir

2)

se toma el nmero de pares de

valores efectivos k (despus de agrupar para que f t > 5 ), disminuido en el nmero m de

v = k m 1.
2

Si el valor resultante R es inferior al valor de correspondiente a y a los grados de libertad v , no se rechaza la hiptesis. Si es superior se rechaza la hiptesis y por consiguiente habr de buscar otra distribucin.86 Ejemplo 3.1.4.1.1 Con la tabla de distribucin de frecuencias obtenida en 1.7 (misma que se muestra nuevamente en el subcaptulo 3.1.1.2); y por medio de la prueba de chicuadrado con = 0.5% demuestre que el ajuste obedece a una distribucin gama con los parmetros estimados en el ejemplo anterior. Solucin: A partir de lo anterior se plantea la siguiente hiptesis: H0: Los datos se distribuyen Gama con: H1: Los datos no se distribuyen Gama con: vs

15.4749 3.7503

15.4749 3.7503

Despus, se construy la siguiente tabla:


Probabilidad Acumulada Probabilidad Frecuencia Terica Terica Terica ft F(x) f(x) 0.0336 0.0336 1.85 0.1724 0.1388 7.63 0.3760 0.2036 11.20 0.5747 0.1987 10.93 0.7315 0.1568 8.62 0.8401 0.1086 5.97 0.9090 0.0689 3.79 0.9501 0.0411 2.26 0.9734 0.0233 1.28 0.9862 0.0128 0.70 0.9930 0.0068 0.37 0.9965 0.0035 0.19 0.9983 0.0018 0.10 0.9992 0.0009 0.05 0.9996 0.0004 0.02 0.9998 0.0002 0.01 0.9999 0.0001 0.01 1.0000 0.0000 0.00 55.00

Intervalos de Clase Lmites Fronteras 3 16 2.5 16.5 17 30 16.5 30.5 31 44 30.5 44.5 45 58 44.5 58.5 59 72 58.5 72.5 73 86 72.5 86.5 87 100 86.5 100.5 101 114 100.5 114.5 115 128 114.5 128.5 129 142 128.5 142.5 143 156 142.5 156.5 157 170 156.5 170.5 171 184 170.5 184.5 185 198 184.5 198.5 199 212 198.5 212.5 213 226 212.5 226.5 227 240 226.5 240.5 241 254 240.5 254.5

Marcas Frecuencia de Clase Frecuencia Acumulada xi fi Fi 9.5 6 6 23.5 6 12 37.5 6 18 51.5 9 27 65.5 4 31 79.5 10 41 93.5 14 55 107.5 0 55 121.5 0 55 135.5 0 55 149.5 0 55 163.5 0 55 177.5 0 55 191.5 0 55 205.5 0 55 219.5 0 55 233.5 0 55 247.5 0 55 55

86

ENCICLOPEDIA CIENTFICA CULTURAL VOLUMEN ESTADSTICA p. 133.

48

y a partir de sta se construy la siguiente:


Frecuencia fi 6 6 12 6 6 9 9 4 4 10 10 14 0 0 0 0 0 0 0 0 0 0 0 14 55 Frecuencia (fi - ft)2 Terica ft ft>5 ft 1.85 7.63 9.48 0.6679 11.20 11.20 2.4126 10.93 10.93 0.3404 8.62 8.62 2.4786 5.97 5.97 2.7135 3.79 2.26 1.28 0.70 0.37 0.19 0.10 0.05 0.02 0.01 0.01 0.00 8.79 3.0865 R = 11.6995 55.00

Fronteras 2.5 16.5 16.5 30.5 30.5 44.5 44.5 58.5 58.5 72.5 72.5 86.5 86.5 100.5 100.5 114.5 114.5 128.5 128.5 142.5 142.5 156.5 156.5 170.5 170.5 184.5 184.5 198.5 198.5 212.5 212.5 226.5 226.5 240.5 240.5 254.5

Considerando que, v = k m 1 = 6 - 2 - 1 = 3 se obtiene que Como R <

2 (3, 0.005 ) = 12.8381 .

2 (3, 0.005 )

la hiptesis nula H0 no se rechaza.

Por lo tanto, se puede tomar este ajuste como bueno.

3.1.4.1.2 Prueba de Bondad de Ajuste de Kolmogorov


La prueba de

para la verificacin de la legitimidad de un ajuste tiene el inconveniente ya

mencionado de exigir frecuencias tericas de cierto tamao ( f t > 5 ), por lo que no siempre puede utilizarse por insuficiencia de los mismos. A partir de la ley de Kolmogorov, que estudia las diferencias entre las frecuencias acumuladas para los valores de la muestra con respecto a las probabilidades acumuladas correspondientes a la funcin de distribucin acumulativa de la variable terica, se ha ideado una prueba que permite verificar la bondad de un ajuste independientemente del nmero de efectivos frecuencia observada (fi) que se disponga. La prueba consta de las siguientes fases: Fase 1. Se calcula el valor D n

D n = m ax Fi * - F ( x )

49

muestra y F ( x ) 87 son las probabilidades tericas acumuladas correspondientes a los mismos valores. Fase 2.

en donde Fi * son las frecuencias relativas acumuladas para cada uno de los n valores de la

D n (1 ) lmite proporcionado en las tablas de la prueba de Kolmogorov para un determinado nivel de confianza 1 - .
Fase 3. Si D n encontrado < D n (1 ) en tablas H0, no se rechaza con un nivel de confianza 1 . Si D n encontrado > D n (1 ) en tablas H0, se rechaza con un margen de error ( , generalmente es igual a 5% 1%).88 Ejemplo 3.1.4.2 Con la tabla de distribucin de frecuencias obtenida en 1.7 (misma que se muestra nuevamente en el subcaptulo 3.1.1.2); y por medio de la prueba de Kolmogorov con = 5% demuestre que el ajuste obedece a una distribucin gama con los parmetros estimados en el ejemplo 3.1.3. Solucin: A partir de lo anterior se plantea la siguiente hiptesis: H0: Los datos se distribuyen Gama con: H1: Los datos no se distribuyen Gama con: VS

Se compara el valor de D n encontrado en la fase anterior con el valor de

15.4749 3.7503

15.4749 3.7503

Despus, se construy la siguiente tabla:

87

88

Funcin de Distribucin Acumulativa. Vid: Subcaptulos 2.4 y 2.5. Ibid. p. 129.

50

Intervalos de Clase Lmites Fronteras 3 16 2.5 16.5 17 30 16.5 30.5 31 44 30.5 44.5 45 58 44.5 58.5 59 72 58.5 72.5 73 86 72.5 86.5 87 100 86.5 100.5 101 114 100.5 114.5 115 128 114.5 128.5 129 142 128.5 142.5 143 156 142.5 156.5 157 170 156.5 170.5 171 184 170.5 184.5 185 198 184.5 198.5 199 212 198.5 212.5 213 226 212.5 226.5 227 240 226.5 240.5 241 254 240.5 254.5

Frecuencia Probabilidad Marcas Frecuencia Relativa Acumulada de Clase Frecuencia Acumulada Acumulada Terica fi Fi Fi* xi max Fi*- F(x) F(x) 9.5 6 6 0.1091 0.0336 0.075 23.5 6 12 0.2182 0.1724 0.046 37.5 6 18 0.3273 0.3760 0.049 51.5 9 27 0.4909 0.5747 0.084 0.168 65.5 4 31 0.5636 0.7315 79.5 10 41 0.7455 0.8401 0.095 93.5 14 55 1.0000 0.9090 0.091 107.5 0 55 1.0000 0.9501 0.050 121.5 0 55 1.0000 0.9734 0.027 135.5 0 55 1.0000 0.9862 0.014 149.5 0 55 1.0000 0.9930 0.007 163.5 0 55 1.0000 0.9965 0.004 177.5 0 55 1.0000 0.9983 0.002 191.5 0 55 1.0000 0.9992 0.001 205.5 0 55 1.0000 0.9996 0.000 219.5 0 55 1.0000 0.9998 0.000 233.5 0 55 1.0000 0.9999 0.000 247.5 0 55 1.0000 1.0000 0.000 Dn= 0.168 55

Considerando que, n = 18 se obtiene que D18 (0.95 ) = 0.318 . Como D18 < D18 (0.95 ) la hiptesis nula H0 no se rechaza. Por lo tanto, se puede tomar este ajuste como bueno. Tanto la prueba chicuadrado como la de Kolmogorov calificaron este ajuste como bueno, sin embargo posiblemente existan otras distribuciones de probabilidad que satisfagan las pruebas de bondad de ajuste, por lo que se elegir a la distribucin que tenga el menor error cuadrtico, como se mencion en 3.1.4.1.

3.2 Determinacin del Tamao de Muestra89


Un estimador puntual es el valor numrico de una estadstica muestral empleada para estimar (o aproximar) el valor de un parmetro de la poblacin o proceso. Una de las caractersticas ms importantes de un estimador es que sea insesgado. Un estimador insesgado es una estadstica muestral cuyo valor esperado es igual al parmetro por estimar. Un valor esperado es el promedio a largo plazo de la estadstica muestral. La eliminacin de todo sesgo sistemtico est asegurada cuando la estadstica muestral corresponde a una muestra aleatoria tomada de una poblacin o a un subgrupo racional tomado de un proceso. Ambos mtodos de muestreo garantizan que la muestra sea insesgada, aunque no eliminan la variabilidad del muestreo, o error de muestreo. En la tabla siguiente se presentan algunos de los estimadores puntuales de parmetros de la poblacin de uso ms frecuente.

89

KAZMIER, op. cit. p. 133.

51

Estimadores Puntuales de Uso ms frecuente Parmetros de la Poblacin Estimador Media, X Proporcin,

Varianza, Desviacin estndar, TABLA 3.1 Estimadores puntuales de uso ms frecuente.90

p s2 s

3.2.1 Determinacin del Tamao Estimacin de la Media91

de

Muestra

Requerido

para

la

Supongamos que se especifican el tamao deseado de un intervalo de confianza y el nivel de confianza asociado con l. Si es conocida o puede estimarse a partir de los estudios similares por ejemplo, el tamao de muestra requerido con base en el uso de la distribucin normal es Cuando lo que se busca determinar es el tamao de la muestra, todo resultado fraccionario se redondea siempre al valor inmediato superior. Adicionalmente, todo tamao de muestra calculado por debajo de 30 debe ser incrementado a 30 porque la frmula se basa en la distribucin normal.

z n= E
Donde:

z= =
E=

Es el valor utilizado para el nivel de confianza especificado. Es la desviacin estndar de la poblacin (o su estimacin). Es el error de muestreo de ms o de menos permitido en el intervalo.

Adems, considrese lo siguiente:

z (nmero de unidades de desviacin estndar respecto a la media) 1.645 1.96 2.58

Proporcin de rea en el intervalo z 0.90 0.95 0.99

Cuando el error de muestreo no se conoce este puede ser estimado con la frmula que a continuacin se presenta:

E X =

90 91

Idem. Ibid. p. 133 139.

52

En este caso n se refiere al nmero de elementos en la muestra preliminar al muestreo que se va realizar. Ejemplo 3.2.1 Un administrador de recursos humanos desea estimar el nmero medio de horas de capacitacin al ao para los supervisores con un margen de error inferior a 2 horas (de ms o de menos) y confianza de 90%. Con base en datos de aos previos el administrador estima que la desviacin estndar es = 20 horas. El tamao de muestra requerido es:

32.9 (1.645 )(20 ) z n= = 173.18 174 = = 2.5 2.5 E


2

3.2.2 Determinacin del Tamao Estimacin de la Proporcin92

de

Muestra

Requerido

para

la

El tamao de muestra mnimo requerido puede determinarse especificando el nivel de confianza requerido y el error de muestreo aceptable y haciendo una estimacin inicial (subjetiva) de , la proporcin poblacional desconocida:

n=

z (1 ) E2
2

Cuando lo que se busca determinar es el tamao de la muestra, todo resultado fraccionario se redondea siempre al valor inmediato superior. Adicionalmente, todo tamao de muestra calculado por debajo de 100 se debe de incrementar a 100 porque la formula se basa en la distribucin normal.

Donde:

= E=

z=

Es el valor utilizado para el nivel de confianza especificado. Es la estimacin inicial de la proporcin poblacional Es el error de muestreo de ms o de menos permitido en el intervalo (siempre la mitad del intervalo de confianza completo).

Si no es posible determinar un estimado inicial de , se le deber estimar en 0.50. Esta estimacin es conservadora en tanto que representa el valor para el que se requerira el tamao de muestra mayor. Cuando el error de muestreo no se conoce este puede ser estimado con la frmula del error estndar que a continuacin se presenta:

E sp =

p(1 p ) n

En este caso n se refiere al nmero de elementos en la muestra preliminar al muestreo que se va realizar. Ejemplo 3.2.2 El director administrativo de una universidad desea estimar, con un margen de error inferior a 0.05 y confianza del 90%, la proporcin de estudiantes inscritos en programas de maestra en ingeniera de sistemas hayan cursado la carrera de actuara. Cul sera el tamao de muestra mnimo si los datos e informacin previos indican que la proporcin no ser mayor a 0.30?
92

Ibid, p. 152 153.

53

Solucin:

z 2 (1 ) (1.645) (0.30 )(0.70 ) n= = = 227.31 228 E2 (0.05)2


2

Con este ejemplo, se concluye la teora necesaria para efectuar el anlisis de datos de un fenmeno o de varios; y con el cual se obtienen conjeturas y/o caractersticas de stos, mismas que pueden ser representadas con un modelo del sistema; y con el uso de otra metodologa conduce a la elaboracin de inferencias del sistema, la metodologa que esta tesis presenta es la de simulacin y se expone en el siguiente captulo.

54

CAPTULO 4 SIMULACIN
El modelado de simulaciones se basa principalmente en la computacin, la probabilidad y la estadstica, las bases necesarias de stas dos ltimas fueron presentadas en los captulos previos, por esta razn en este captulo se complementa a estos elementos, con el modelado de sistemas, esto para poder realizar experimentos de muestreo sobre un modelo del sistema, es decir realizar simulacin.

4.1

Teora General de Sistemas

La teora General de Sistemas (TGS) se presenta como una forma sistemtica y cientfica de aproximacin y representacin de la realidad y, al mismo tiempo, como una orientacin hacia una prctica estimulante para formas de trabajo multidisciplinarias. En la TGS lo importante son las relaciones y los conjuntos que a partir de ellas emergen; ofreciendo un ambiente adecuado para la interrelacin y comunicacin entre especialistas y especialidades. Los objetivos originales de la Teora General de Sistemas son los siguientes: Impulsar el desarrollo de una terminologa general que permita describir las caractersticas, funciones y comportamientos sistmicos. Desarrollar un conjunto de leyes aplicables a todos estos comportamientos. Promover una formalizacin (matemtica) de estas leyes.93

4.2 El Sistema y Otros Conceptos Relacionados con ste94


En este subcaptulo se expondrn de manera conceptual las relaciones y los conjuntos importantes de un sistema. Sistema: Conjunto de entidades caracterizadas por algunos atributos que tienen relaciones entre s y que estn localizadas en un ambiente de acuerdo con un cierto objetivo. Objeto concreto o abstracto de inters en el sistema sobre el que se recoge informacin que se representa en el sistema. Caractersticas necesarias para describir completamente a cada tipo de entidad. Asociacin natural entre dos o ms entidades o entre sus atributos. Condiciones o circunstancias que favorecen o no al sistema.

Entidad:

Atributos:

Relacin: Ambiente:
93

RINCON, Juana, Cooperacin del Personal Acadmico: Mecanismo para la Integracin del Sistema Universitario Nacional. http://members.tripod.com/~gepsea/sistema.htm 94 Cfr. Ibid.

55

Objetivo:

Actividad proyectada o planeada que se ha seleccionado antes de su ejecucin y est basada tanto en apreciaciones subjetivas como en razonamientos tcnicos de acuerdo con las caractersticas que posee el sistema. Son aquellos que importan y procesan elementos de sus ambientes.95

Sistemas Abiertos: Sistemas Cerrados:

Son aquellos en los cuales ningn elemento de afuera entra y ninguno sale del sistema.96

Subsistemas:

Se entiende por stos a un conjunto de elementos y relaciones que responden a estructuras y funciones especializadas dentro de un sistema mayor. En trminos generales, los subsistemas tienen las mismas propiedades que los sistemas. Es una representacin del sistema o de una parte de ste.

Modelo del Sistema:

A B S T R A C C I N

MODELO

REALIDAD

A P L I C A C I N

FIGURA 4.1 Rompimiento entre la Realidad y el Modelo.97 La figura anterior ilustra la relacin entre el modelo y la realidad donde se aprecia un rompimiento entre ellos, este rompimiento se da en el proceso de abstraccin al seleccionar los elementos ms importantes, y en la determinacin de las reglas o leyes de relacin entre dichos elementos, de ah el sumo cuidado que el investigador debe procurar para la construccin del modelo.98

95

sta es una caracterstica propia de todos los seres vivos. Que un sistema sea abierto significa que establece intercambios permanentes con su ambiente, intercambios que determinan su equilibrio, capacidad reproductiva o continuidad, es decir su viabilidad o permanencia en el entorno. 96 stos alcanzan su estado de mximo equilibrio al igualarse con el medio. En ocasiones el trmino sistema cerrado es tambin aplicado a sistemas que se comportan de una manera fija, rtmica o sin variaciones. 97 SAUTTO Vallejo, Jos Maclovio, La tcnica de la Simulacin Digital en la Investigacin de Operaciones. p. 10. 98 Idem.

56

4.3

Simulacin

Desde el punto de vista de la investigacin de operaciones, la simulacin es una tcnica de muestreo estadstico controlada para estimar el desempeo de sistemas estocsticos complejos cuando los modelos analticos no son suficientes. Ms que describir el comportamiento global de un sistema directamente, el modelo de simulacin describe la operacin del mismo en trminos de los eventos individuales de cada una de las componentes del sistema. En particular, el sistema se divide en elementos cuyo comportamiento se puede predecir, al menos en trminos de distribuciones de probabilidad para cada uno de los diferentes estados posibles del sistema y sus insumos. Tambin se construyen dentro del modelo las interrelaciones entre esos elementos. Entonces, la simulacin proporciona un medio para dividir el trabajo de construir un modelo en componentes ms pequeas que se pueden formular con mayor facilidad (por ejemplo, una componente puede ser un sistema de lneas de espera sencillo) y despus combina estas componentes en su orden natural. Una vez construido el modelo se activa usando nmeros aleatorios para generar los eventos simulados a travs del tiempo, de acuerdo con las distribuciones de probabilidad apropiadas. El resultado es una simulacin de la operacin del sistema real a travs del tiempo en la que se puede registrar su comportamiento agregado. Si este proceso se repite para las diferentes configuraciones del diseo y las polticas de operacin del sistema y se compara su desempeo, se pueden identificar las configuraciones que ms prometen. Debido al error estadstico, es imposible garantizar que la configuracin que produzca el mejor comportamiento simulado sea la ptima pero al menos debe ser cercana a la ptima si el experimento de simulacin estuvo bien diseado. As, la simulacin, en general, no es otra cosa que la tcnica de realizar experimentos de muestreo sobre el modelo del sistema. Los experimentos se llevan a cabo en el modelo en lugar de hacerlo en el propio sistema real ya que esto ltimo resultara inconveniente, muy caro y muy tardado. Por lo dems, los experimentos simulados deben considerarse en esencia iguales a los experimentos estadsticos comunes, por lo que tambin debern tener como fundamento la teora estadstica formal.99

4.4

Etapas de un Estudio de Simulacin100

Resultara limitante o redundante dar una serie de pasos a seguir al resolver problemas de simulacin, sin embargo algunos autores que escriben al respecto proponen ciertos pasos de acuerdo a su experiencia personal, a continuacin se compilan algunos de estos no como una secuencia a seguir, sino como una referencia de la cual partir: 1. Definicin del Sistema. Para tener una definicin exacta del sistema, se debe de hacer un anlisis en el que se determine, cules son las entidades del mismo, consecuentemente sus atributos, relaciones y el ambiente. 2. Coleccin y Anlisis de Datos. Una vez definido lo anterior, se deben recolectar datos sobre cada uno de los componentes del sistema; despus proceder a un anlisis estadstico de stos; ya que los resultados de ste facilitaran el siguiente paso. 3. Formulacin del Modelo. Definir y construir el modelo con el cual se espera obtener los resultados deseados.

99

100

HILLER, Frederick S. y Gerald J. LIEBERMAN, Introduccin a la Investigacin de Operaciones, p. 900902. Cfr. COSS Bu, Ral, Simulacin un Enfoque Prctico, p. 1214. SAUTTO op. cit. 1214.

57

4. Implementar el Modelo en la Computadora. En este paso el modelo del sistema se lleva a la computadora, ya sea que ste se programe en algn lenguaje de computacin o utilizando un paquete. 5. Validacin y Calibracin. En este paso el modelo se alimenta con ciertas condiciones conocidas del sistema, se comparan los resultados obtenidos con los esperados, en caso de que estos difieran, se mueven los parmetros de calibracin del sistema hasta obtener los resultados esperados. Este proceso conduce con frecuencia a un ciclo que puede conducir al paso 3. 6. Experimentacin. Consiste en generar los datos deseados. En esta etapa se contestan las siguientes preguntas: Qu grado de precisin requiere? y consecuentemente Tamao de Muestra? 7. Interpretacin. En esta etapa se interpretan los resultados que arroja la simulacin y se elaboran las sugerencias. 8. Implementacin de la Solucin. Una vez aprobadas las sugerencias se procede a su implementacin.

4.5

Ejemplo de Simulacin

Considere el modelo M/M/1 de teora de colas (entradas Poisson, tiempo de servicio exponencial y un solo servidor). En particular, suponga que los valores de la tasa de llegadas

y la tasa de servicio

son:

= 3 por hora

= 5 por hora

Para resumir la operacin fsica del sistema, los clientes que llegan se unen a una cola, eventualmente son servidos y despus se van. Es necesario que el modelo de simulacin describa y sincronice la llegada de los clientes y el servicio de los mismos. Comenzando en el tiempo 0, el reloj simulador registra el tiempo (simulado) t que ha transcurrido hasta ahora durante la corrida de simulacin. La informacin sobre el sistema de colas que define el estado actual, es decir, el estado del sistema es

N (t ) = Nmero de clientes en el sistema en el tiempo t.


Los eventos que cambian el estado del sistema son la llegada de un cliente o la terminacin del servicio del cliente que se est atendiendo en este momento (si lo hay). El mecanismo generador de eventos se describir un poco ms adelante. El mecanismo de transicin de estados es Restablecer N (t ) =

N (t ) + 1, N (t ) 1,

Si ocurre una llegada en el tiempo t. Si termina un servicio en el tiempo t.

Existen mtodos para hacer que avance el reloj simulador y registrar la operacin del sistema. Ahora se describir e ilustrarn de incrementos de tiempo fijo que sirve para avanzar el tiempo. En el mecanismo de incrementos de tiempo fijo se usa repetidamente el siguiente procedimiento de dos pasos:

58

Resumen de Incrementos de Tiempo Fijo 1. Se avanza el tiempo una cantidad fija pequea. 2. Se actualiza el sistema determinando los eventos que ocurrieron durante este lapso y el estado del sistema que resulta. Tambin se registra la informacin deseada sobre el comportamiento del sistema. En el caso del modelo de lneas de espera que se analiza ahora, slo pueden ocurrir dos tipos de eventos durante cada uno de estos intervalos, a saber, una o ms llegadas y una o ms terminaciones de servicio. Es ms, la probabilidad de que ocurran dos o ms llegadas o dos o ms terminaciones de servicio durante una unidad de tiempo es despreciable para este modelo si la unidad de tiempo es relativamente pequea. Entonces, los nicos dos eventos posibles en esa unidad de tiempo, que se tienen que investigar son la llegada de un cliente y la terminacin de servicio de un cliente. Cada uno de estos eventos tiene una probabilidad conocida. A manera de ejemplo se usar 0.1 horas (6 minutos) como la cantidad fija pequea en que se avanza el reloj cada vez. (Normalmente se usara un intervalo mucho ms chico para que en realidad sea despreciable la probabilidad de llegadas o terminaciones de servicio mltiples, pero esta eleccin crear ms movimientos con el fin de ejemplificar). Debido a que tanto los tiempos entre llegadas como los de servicio tienen una distribucin exponencial, la probabilidad PLl de que un intervalo de 0.1 horas incluya una llegada es

PLl = 1 e 3 / 10 = 0.259 ,
y la probabilidad PS de que incluya una salida (terminacin de servicio), dado que se estaba sirviendo un cliente al inicio del intervalo es

PLl = 1 e 5 / 10 = 0.393 .
Para generar aleatoriamente cualquiera de los dos eventos de acuerdo a estas probabilidades. La computadora se usa para generar un nmero aleatorio uniforme en el intervalo (0,1), es decir, se tiene una observacin aleatoria a partir de una distribucin uniforme entre 0 y 1. Si este nmero aleatorio se denota por rLl ,

rLl < 0.259 rLl 0.259

ocurre una llegada no ocurre una llegada,

De igual manera, con otro nmero aleatorio uniforme rS ,

rS < 0.393 rS 0.393

ocurre una salida no ocurre una salida,

dado que haba un cliente en servicio al principio del intervalo. Sin clientes en servicio (es decir, sin clientes en el sistema) se supone que no pueden ocurrir salidas durante el intervalo aunque haya ocurrido una llegada.

59

La siguiente tabla, muestra los resultados al usar este enfoque para 10 iteraciones del procedimiento de incrementos de tiempo fijo comenzando sin clientes en el sistema y usando minutos como unidad de tiempo.
t tiempo (min) 0 6 12 18 24 30 36 42 48 54 60 Llegada en el intervalo? No No Si No No No Si Si No Si Salida en el intervalo? Si No Si Si No

r Ll 0.722 0.577 0.138 0.410 0.845 0.931 0.014 0.026 0.557 0.228

rS 0.389 0.768 0.097 0.210 0.689

N(t) 0= 0+0-0= 0+0-0= 0+1-1= 0+0-0= 0+0-1= 0+0-0= 0+1-0= 1+1-1= 1+0-1= 0+1-0=

0 0 0 0 0 0 0 1 1 0 0

Como se observ en la tabla, el siguiente paso del procedimiento (actualizar el sistema) incluye el registro de las medidas de desempeo deseadas sobre el comportamiento agregado al sistema durante este intervalo.101 En el ejemplo anterior se apreci que en simulacin es necesario tener conocimiento de lo siguiente: 1. Generacin de nmeros aleatorios uniformes en el intervalo (0,1). 2. Generacin de variables aleatorias nouniformes. 3. Conocer la notacin empleada en teora de colas. Por esta razn, en los siguientes subcaptulos se desarrollan estos temas.

4.6 Mtodo Congruencial Mixto para la Generacin de Nmeros Aleatorios con Distribucin Uniforme en el Intervalo (0,1)
Los generadores congrueneciales lineales generan una secuencia de nmeros pseudoaleatorios en la cual el prximo nmero pseudoaleatorio es determinado a partir del ltimo nmero generado, es decir el nmero pseudoaleatorio X n +1 es derivado a partir del nmero pseudoaleatorio X n . Para el caso particular del generador congruencial mixto, la relacin de recurrencia es la siguiente:

X n +1 = (aX n + c ) mod m

101

HILLER, op. cit. p. 904-906.

60

donde:

X0 = a= c= m=

el multiplicador (a > 0 )

la semilla (X 0 > 0 )

constante aditiva (c > 0 )

El mdulo (m > X 0 , m > a y m > c )

Esta relacin de recurrencia dice que X n +1 es el residuo de dividir aX n + c entre el mdulo. Lo anterior significa que los valores posibles de X n +1 son 0, 1, 2, , m 1 , es decir m representa el nmero posible de valores diferentes que pueden ser generados. Con el propsito de ilustrar la generacin de nmeros pseudoaleatorios a travs de este mtodo, suponga que se tiene un generador en el cual los valores de los parmetros son: a = 5 , c = 7 , X0 = 4 y m = 8 . Para estos valores, la secuencia de nmeros pseudoaleatorios y nmeros uniformes (X n +1 / m ) son mostrados en la siguiente tabla, el perodo del generador es 8.102
Nmeros n Xn (5Xn +7)/8 Xn +1 Uniformes 0 4 3 + 3/8 3 3/8 1 3 2 + 6/8 6 6/8 2 6 4 + 5/8 5 5/8 3 5 4 + 0/8 0 0 4 0 0 + 7/8 7 7/8 5 7 5 + 2/8 2 2/8 6 2 2 + 1/8 1 1/8 7 1 1 + 4/8 4 4/8

4.7 Mtodo de la Transformada Inversa Variables Aleatorias NoUniformes103


F(x)

para

la

Generacin

de

1 R

x = F (R )

-1

102 103

COSS, op. cit. p. 19 29. Ibid. p. 49 53.

61

que se va a simular. Puesto que F ( x ) est definida en el intervalo (0,1), se puede generar un numero aleatorio uniforme R y tratar de determinar el valor de la variable aleatoria para la cual su distribucin acumulada es igual a R , es decir, el valor simulado de la variable aleatoria que sigue una distribucin de probabilidad f ( x ) , se determina al resolver la siguiente ecuacin:

El mtodo de la transformada inversa utiliza la distribucin acumulada F ( x ) de la distribucin

F ( x ) = R x = F 1 ( R )

La dificultad principal de este mtodo descansa en el hecho de que en algunas ocasiones es difcil encontrar la transformada inversa. Ejemplo 4.7 Distribucin exponencial

Se desea generar nmeros al azar que sigan la siguiente distribucin de probabilidad:

e x si x 0 f (x ) = si x < 0 0
La distribucin acumulada de esta distribucin es:

F ( x ) = e x dt = 1 e x
0

y utilizando el mtodo de la transformada inversa, es decir, igualando la distribucin acumulada con el nmero uniforme R, se obtiene:

Pero si R sigue una distribucin uniforme, entonces 1 R tambin sigue esta distribucin. Por consiguiente:

1 e x = R e x = 1 R 1

x=

Ln R .

4.8 Notacin Utilizada en Teora de Colas


Debido a que la simulacin es una tcnica que se aplica frecuentemente en teora de colas, se proporciona la notacin empleada en esta rea: Caracterstica Distribucin de tiempo entre llegadas (A) Distribucin de tiempo de servicio (B) Nmero de estaciones paralelas (X) Restricciones de capacidad Smbolo M D Ek G1 M D Ek G 1, 2, , X 1, 2, , X Explicacin Exponencial o Poisson Determinstica Erlang General independiente Exponencial o Poisson Determinstica Erlang General

62

del sistema (Y) Disciplina de espera (Z)

FIFO LIFO SIRO PRI GD

Primero en entrar Primero en salir ltimo en entrar ltimo en salir Servicio en forma aleatoria Prioridad Disciplina General

La representacin de una cola es de la siguiente forma A/B/X/Y/Z. Normalmente se utilizan los primeros tres smbolos, omitindose los smbolos Y y Z. As M/D/2 representa un sistema de espera con tiempo entre llegadas exponencial, servicio determinstico, dos estaciones de servicio, ningn limite en la capacidad del servicio y como disciplina primero en llegar primero en servicio.104 En los captulos previos as como en este, se han desarrollado y analizado los conceptos y herramientas requeridas para el uso de la estimacin de la distribucin de probabilidad y de la simulacin; por consiguiente en el captulo precedente se avanzar con una aplicacin en el que se conjunten stas tcnicas.

104

SAUTTO, op. cit. p. 143.

63

CAPTULO 5 CASO PRCTICO: DETERMINACIN DE LAS CUOTAS DE TARIFA PARA EL SEGURO DE RESPONSABILIDAD CIVIL AGENTES DE SEGUROS (PERSONAS FSICAS)
En el presente captulo se conjunta a los elementos de la Matemtica del Seguro con los que se presentaron en las pginas previas, para determinar sobre bases tcnicas, las primas netas de riesgo a fin de garantizar con un elevado grado de certidumbre, el cumplimiento de las obligaciones que contraigan con sus asegurados las instituciones de seguros, estas bases deben de ser presentadas en una nota tcnica, como lo mencionan los artculos 36 y 36-A entre otros de la Ley General de Instituciones y Sociedades Mutualistas de Seguros105. Se entiende por nota tcnica a la documentacin que integra el conjunto de procedimientos tcnicos esenciales en el diseo de un seguro para efectos de su registro; ya sea que se trate de un seguro nuevo o de la sustitucin de uno previamente registrado.106 En nuestro pas es la Comisin Nacional de Seguros y Fianzas (C.N.S.F.) el organismo encargado de conocer y resolver sobre los registros, control, revisin, supervisin, etctera de cualquier actividad aseguradora; entre stos el procedimiento para el registro de un seguro o nota tcnica. La CNSF hace del conocimiento de los sectores supervisados, los consumidores y el pblico en general, las disposiciones especificas que emite con base en un marco jurdico aplicable, a travs de circulares que se publican en el Diario Oficial de la Federacin (DOF) y dentro de stas, se encuentran las que regulan el registro de Tarifas y Documentacin Contractual, entre las que se destaca a la circular S8.1107; en la que se seala la forma y trminos para el registro de productos de seguros, la disposicin dcima segunda menciona los datos que stas debern contener segn apliquen para la operacin, ramo y seguro que se trate. Atendiendo sas disposiciones se elabor el presente captulo el cual corresponde a una nota tcnica para el Seguro de Responsabilidad Civil Agentes de Seguros (Personas Fsicas), misma que a continuacin se presenta.

105 106 107

Ley General de Instituciones y Sociedades Mutualistas de Seguros. VARGAS Aguilar, Juan Carlos, Fundamentos para el Desarrollo de Productos en Daos, p. 96. Diario Oficial de la Federacin, 20 de Febrero de 2004.

64

NOTA TCNICA DE LA TARIFA PARA EL SEGURO DE RESPONSABILIDAD CIVIL AGENTES DE SEGUROS (PERSONAS FSICAS)
NDICE108 i. CARACTERSTICAS GENERALES DEL PLAN i.1 i.2 i.3 i.4 Nombre Comercial del Plan Descripcin de la Cobertura Bsica Temporalidad del Plan Operacin y Ramo en el que se Registrar Pgina 67 ... .. . . 67 67 68 68 68 68 69 69 69 69 69 69 69 70 70 70 72 75 75 76 76 76 77 78 79 80

ii. HIPTESIS ESTADSTICAS Y FINANCIERAS ii.1 Hiptesis Estadsticas ii.2 Hiptesis Financieras ii.2.1 Utilidad Tcnica iii. PROCEDIMIENTOS TCNICOS iii.1 iii.2 iii.3 iii.4

. . . ..

iii.5

Gastos de Administracin Gastos de Adquisicin . Gastos Totales .. Procedimientos para la Generacin de Datos Mediante Simulacin Estocstica iii.4.1 Definicin del Sistema iii.4.2 Anlisis de Datos iii.4.2.1 Estimar la Distribucin de Probabilidad del Volumen de Prima Intermediada por Agente iii.4.2.2 Estimar la Distribucin de Probabilidad Emprica de los Siniestros Utilizando el Mtodo del Rango Mediano para Muestras Pequeas iii.4.2.3 Determinar las Probabilidades de Siniestro para Diferentes Montos de Prima Intermediada iii.4.3 Formulacin del Modelo .. iii.4.4 Implementar el Modelo en la Computadora iii.4.5 Experimentacin ... iii.4.5.1 Determinar el Tamao iii.4.5.1 de Muestra iii.4.5.2 Generacin de Carteras del Seguro de Responsabilidad Civil Agentes de Seguros (Personas Fsicas) Utilizando Simulacin Estocstica ... iii.4.6 Interpretacin de los Resultados .. Procedimientos para el Clculo de Cuotas . iii.5.1 Clculo de Cuotas sin Deducible .

108

En este captulo la numeracin cambia para no confundir al lector con la de la nota tcnica.

65

ANEXO 1 DE NOTA TCNICA ANEXO 2 DE NOTA TCNICA ANEXO ELECTRNICO

85 89 92

66

i i.1

CARACTERISTICAS GENERALES DEL PLAN Nombre Comercial del Plan

El plan que se enva a ustedes para efectos de registro y vigilancia se denomina SEGURO DE RESPONSABILIDAD CIVIL PARA AGENTES DE SEGUROS (Personas Fsicas).

i.2

Descripcin de la Cobertura Bsica

La Compaa se obliga a reparar o, a su eleccin, indemnizar los daos y perjuicios que el Asegurado cause al pblico, conforme a la legislacin en materia de responsabilidad civil vigente en los Estados Unidos Mexicanos, por actos negligentes o imperitos (acciones u omisiones); resultantes de su actividad de agente de seguros, ocurridos y reclamados al Asegurado durante la vigencia de esta pliza, amparndose las siguientes responsabilidades: 1. La responsabilidad por daos directos al patrimonio: Se entendern bajo este concepto. Los daos en sentido estricto (prdidas o menoscabos sufridos en el patrimonio), as como los perjuicios (privaciones de ganancia lcita que necesariamente se hubiese obtenido de no haberse presentado los daos) que se causen a los clientes del Asegurado, sin incluir daos corporales o daos materiales a sus propiedades o un perjuicio consecuencial a ambos. La responsabilidad de la Compaa empieza despus de la aplicacin del deducible a cargo del Asegurado. 2. La responsabilidad por prdida o destruccin de documentos: La responsabilidad civil legal por daos y perjuicios que sufran los clientes del Asegurado por daos materiales destruccin o prdidas de documentos que los clientes le hayan entregado para el desarrollo de las actividades encomendadas. No se incluyen bajo el concepto de documentos, dinero, moneda extranjera, otros signos pecuniarios, metales amonedados, ttulos de crdito, valores, cualquier otro ttulo representativo de dinero, mercancas, valores o promesas, por ltimo, archivos o almacenamientos para el procesamiento electrnico de datos. Las reclamaciones contra este concepto procedern de acuerdo con el orden siguiente: Primero En el caso de prdida de documentos, el Asegurado proceder a una bsqueda diligente y de ella levantar una constancia circunstanciada. Segundo En los dems casos la Compaa determinar si procede efectuar gestiones extrajudiciales, judiciales o tcnicas para obtener la restauracin o la reposicin de documentos; los gastos

67

y costos sern por cuenta de la Compaa, despus de aplicar el deducible a cargo del Asegurado. Tercero Despus de agotar las posibilidades de encuentro, restauracin o reposicin, la Compaa determinar la procedencia y extremos de la responsabilidad civil legal, para proceder a indemnizar al cliente del Asegurado; despus de la aplicacin del deducible a cargo de ste. 3. La responsabilidad civil legal personal de los empleados y trabajadores del Asegurado frente al pblico (quienes se consideraran Asegurados), derivada del ejercicio de la actividad materia de este seguro.

i.3

Temporalidad del Plan

La vigencia de este plan puede ser menor o igual a un ao.109

i.4

Operacin y Ramo en el que se Registrar


DAOS, en el ramo de

Este plan se utilizar dentro de las operaciones de RESPONSABILIDAD CIVIL Y RIESGOS PROFESIONALES.

ii

HIPTESIS ESTADSTICAS Y FINANCIERAS

La Compaa cuenta con una cartera escasa para este tipo de seguros, ya que tiempo antes no era obligatorio para los agentes de seguros contratar una pliza por errores u omisiones, por este motivo cuando se han suscrito negocios de este tipo se ha hecho siguiendo las medidas recomendadas por nuestro reasegurador (reaseguro facultativo) en el ramo de responsabilidad civil.

ii.1

Hiptesis Estadsticas

La informacin de nuestra cartera para los aos 1998, 1999 y 2000 misma que se muestra en el anexo 1; aunque escasa permite hacer inferencias con impacto positivo, con el uso de los mtodos que se detallan en procedimientos tcnicos.

109

Generalmente en los seguros para operaciones en daos se otorga la cobertura menor o igual a un ao.

68

ii.2

Hiptesis Financieras

ii.2.1 Utilidad Tcnica


La utilidad tcnica mnima esperada es del 5%.110

iii iii.1

PROCEDIMIENTOS TCNICOS Gastos de Administracin

Los Gastos de Administracin considerados sern del 15%.

iii.2

Gastos de Adquisicin

Los Gastos de Adquisicin considerados sern del 9%.

iii.3

Gastos Totales

Gastos Totales = Gastos de Administracin + Gastos de Adquisicin + Utilidad Tcnica.

iii.4

Procedimientos para Simulacin Estocstica

la

Generacin

de

Datos

Mediante

Debido a que los datos de la cartera no constituyen una muestra suficientemente grande, estos sern utilizados como referencia para generar ms datos con el supuesto de provenir de la misma funcin de distribucin, para tal objetivo los procedimientos utilizados sern: Definicin del Sistema. Anlisis de Datos: Estimar la Distribucin de Probabilidad del Volumen de Prima Intermediada por Agente. Estimar la Distribucin de Probabilidad Emprica de los Siniestros utilizando el Mtodo del Rango Mediano para Muestras Pequeas. Determinar las Probabilidades de Siniestro para Diferentes Montos de Prima Intermediada. Formulacin del Modelo. Implementar el Modelo en la Computadora. Experimentacin. Determinar el Tamao de Muestra Requerido. Generacin de Carteras del Seguro de Responsabilidad Civil Agentes de Seguros (Personas Fsicas) Utilizando Simulacin Estocstica. Interpretacin de los Resultados.

110

Es la utilidad que espera (planea y desea) obtener el asegurador despus del pago de los siniestros y de los gastos de administracin y de adquisicin.

69

iii.4.1 Definicin del Sistema111


MODELO DEL SISTEMA

Agente de Seguros Contrato Compaa de Seguros Pago Indemnizacin Tercero Afectado Dao

En la figura anterior se muestra un modelo del sistema, en este mismo se aprecia que el contrato de seguro cubrir al asegurado por errores u omisiones que ste cause a terceros en su actividad de agente de seguros.112 Para entender mejor el sistema observe la siguiente tabla: RELACIONES EN EL SISTEMA Atributo Entidad Financiera que asegura al Agente de seguros mediante el pago de una prima y consecuentemente pagar los daos que ste cause a un tercero hasta el lmite de responsabilidad contratado. Intermediario (para asesora y venta de seguros) entre la Compaa y el pblico en general. Persona a quien le causa un dao el asegurado (agente de seguros) y que se conoce al momento del siniestro.

Entidad Compaa de Seguros

Relaciones con: Agente de Seguros Tercero Afectado

Agente de Seguros Tercero Afectado

Compaa de Seguros Tercero Afectado Agente de Seguros Compaa de Seguros

iii.4.2 Anlisis de Datos iii.4.2.1 Estimar la Distribucin de Probabilidad del Volumen de Prima Intermediada por Agente113
Se utiliz el software Arena para estimar la Distribucin de Probabilidad que mejor se ajusta a los datos del Anexo 2 obtenindose los siguientes resultados:

111 112 113

Vid: 4.2 El Sistema y Otros Conceptos Relacionados con ste. Vid: i.2 Descripcin de la Cobertura Bsica. Vid: Captulo 1 Estadstica Descriptiva.

70

Distribution Summary Distribution: Exponential114 Expression: 0.999 + EXPO(1.32e+006) Square Error: 0.011007 Chi Square Test115 Number of intervals =4 Degrees of freedom =2 Test Statistic = 8.07 Corresponding p-value = 0.0193 Kolmogorov-Smirnov Test116 Test Statistic = 0.499 Corresponding p-value < 0.01 Data Summary Number of Data Points Min Data Value = Max Data Value = Sample Mean = Sample Std Dev = = 168 1 1.42e+007 1.32e+006 2.38e+006

Function Erlang Exponential Beta Weibull Gamma Normal Lognormal Triangular Uniform

Sq Error 0.011 0.011 0.0152 0.0442 0.159 0.237 0.278 0.329 0.388

Histogram Summary Histogram Range = 0.999 to 1.42e+007 Number of Intervals = 12 Es decir que la Distribucin de Probabilidad que mejor aproxima el Volumen de Prima Intermediada por Agente es:

114 115 116

Vid: 2.2.7.5 Distribucin Exponencial Negativa. Vid: 3.1.4.1.1 Prueba de Bondad de Ajuste ChiCuadrado. Vid: 3.1.4.1.2 Prueba de Bondad de Ajuste de Kolmogorov.

71

x 1 e f (x; ) = 0.999 + 0

xf0 para cualquier otro caso

donde: = 1'320,000

iii.4.2.2 Estimar la Distribucin de Probabilidad Emprica de los Siniestros Utilizando el Mtodo del Rango Mediano para Muestras Pequeas117
En la siguiente tabla se muestran los siniestros presentados en los aos de 1998 al 2000 y cuyas cifras estn en moneda nacional: SINIESTRO AO EN QUE SE PRESENTO MONTO 1998 2,000.00 1998 10,250.40 1999 427,845.73 2000 238,501.00 2000 30,404.61 A estos datos se les aplic el mtodo del rango mediano para muestras pequeas obtenindose lo siguiente: SINIESTRO NDICE MONTO 1 2,000.00 2 10,250.40 3 30,404.61 4 238,501.00 5 427,845.73 F(xi) 0.1796 0.3648 0.5500 0.7352 0.9204 f(xi) 0.00002245 0.00000919 0.00000089 0.00000098

117

Vid: 3.1.1.1 Mtodo del Rango Mediano para la Estimacin de la Distribucin de Probabilidad para Muestras Pequeas.

72

DISTRIBUCIN EMPRICA DE SINIESTROS


0,00002500 0,00002000

f '(xi)

0,00001500 0,00001000 0,00000500 0,00000000 0 50.000 100.000 150.000 200.000 250.000 300.000

MONTO DE SINIESTROS

Una vez que a los datos se les aplic la metodologa para muestras pequeas y se obtuvo el grfico arriba mostrado, despus se utiliz el software Arena para determinar qu funcin de distribucin se aproximaba ms; el resultado fue una distribucin gama, sin embargo esto se tiene que probar. Distribution Summary Distribution: Gamma118 Expression: -0.001+GAMM(8.29e+003, 0.121) Square Error: 0.291965 Kolmogorov-Smirnov Test119 Test Statistic = 1.23e+003 Corresponding p-value < 0.01 Data Summary Number of Data Points Min Data Value = Max Data Value = Sample Mean = Sample Std Dev = =2 0 2e+003 1e+003 1.41e+003 Function Gamma Exponential Erlang Uniform Weibull Lognormal Normal Triangular Beta Sq Error 0.292 0.298 0.298 0.3 0.306 0.345 0.364 0.416 -1.#J

Histogram Summary Histogram Range = -0.001 to 2e+003 Number of Intervals = 5 A partir de lo anterior se plantea la siguiente hiptesis: H0: Los siniestros se distribuyen Gama
118 119

vs

H1: Los siniestros no se distribuyen Gama

Vid: 2.7.2.3 Distribucin Gama. Vid: 3.1.4.1.2 Prueba de Bondad de Ajuste de Kolmogorov.

73

Para probar lo anterior debemos estimar los parmetros de esta distribucin, recordemos lo siguiente: Se dice que la variable aleatoria X tiene una distribucin gama si su funcin de densidad de probabilidad est dada por: Funcin de Densidad de Probabilidad

f (x; ; ) =

()
Media

x 1e

( )
x

Parmetros f0 f0 xf0 Varianza 2

Utilizando el mtodo de los momentos120 se estimaron los parmetros que a continuacin se presentan: media = Varianza =

x=

141,800.35 =

s 2 = 35,107878,306 = 2

= 247,586.69
= 0.5727301

Con los parmetros anteriores se obtienen las Probabilidades Tericas Acumuladas F(xi), y aplicando la prueba de Kolmogorov Smirnov121 se llega a la siguiente tabla:
PRUEBA DE HIPTESIS Siniestro 2.000,00 10.250,40 30.404,61 238.501,00 427.845,73 F'(xi) 0,17962963 0,36481481 0,55000000 0,73518519 0,92037037 F(xi) 0,07086374 0,17850845 0,32321123 0,80490556 0,92327200 Dn 0,10876589 0,18630636 0,22678877 0,06972038 0,00290163

De la tabla anterior, se tiene que: Dn encontrado Dn( ) de Kolmogorov Smirnov =5% (1- =95%) 0.227 0.565

Como Dn encontrado < Dn( ) de Kolmogorov Smirnov, no se rechaza la hiptesis nula. Por lo tanto, la Distribucin de Probabilidad estimada de los siniestros para este seguro es:

120 121

Vid: 3.1.3 Mtodo de los Momentos para la Estimacin de Parmetros de una Distribucin de Probabilidad. Vid: 3.1.4.1.2 Prueba de Bondad de Ajuste de Kolmogorov.

74

x 1 x 1e () f (x; , ) = 0

xf0
donde:

= 0.5727301 = 247,586.69

para cualquier otro caso

iii.4.2.3 Determinar las Probabilidades de Siniestro para Diferentes Montos de Prima Intermediada
Se ordenaron los datos de las tres carteras de mayor a menor con el supuesto de que el Monto de Suma Asegurada es igual (o muy semejante) al Monto de Prima Intermediada, se calcul la frecuencia de siniestros y se considero sta como probabilidad. Obtenindose los siguientes resultados.

Monto Promedio de Prima Intermediada Hasta $1'500,000.00 Mayor a $1'500,000.00

Probabilidad de Siniestro 0.0217 0.0732

iii.4.3 Formulacin del Modelo122


Con los datos obtenidos en el subcaptulo iii.4.2 Anlisis de Datos se cre el modelo de las carteras de la siguiente forma: 1. Se generarn tres nmeros aleatorios a, b, y c; mismos que siguen una Distribucin de Probabilidad Uniforme, y su uso es el siguiente: a. Determinar el Volumen de Prima Promedio Intermediada por Agente. b. Determinar si se present o no un siniestro. c. Determinar el Monto del Siniestro. 2. El Lmite de Responsabilidad que se otorgar ser de $100,000.00 por esta razn se har constante para todos los elementos en la cartera. 3. El Volumen de Prima Promedio Intermediada por Agente se obtendr a partir del nmero aleatorio a, el cual se asume como probabilidad y por medio de la funcin inversa de la siguiente distribucin de probabilidad:
x 1 e f (x; ) = 0.999 + 0

xf0
donde:

= 1'320,000 .

para cualquier otro caso

4. La existencia o no de siniestro se determinar utilizando la siguiente regla:

122

Vid: 4.4 Etapas de un Estudio de Simulacin 3. 4.5 Ejemplo de Simulacin.

75

1 si b 0.0217 y el Volumen Promedio de Prima Intermedia da $1'500,000 .00 Siniestro = 1 si b 0.0732 y el Volumen Promedio de Prima Intermedia da > $1'500,000 .00 0 e. o. c.
5. El Monto del Siniestro se obtiene a partir del nmero aleatorio c, el cual se asume como probabilidad y por medio de la de la funcin inversa de la siguiente distribucin de probabilidad:
x 1 1 x e () f (x; , ) = 0

xf0
donde:

= 0.5727301 = 247,586.69

para cualquier otro caso

iii.4.4 Implementar el Modelo en la Computadora123


En este caso el modelo se ejecutar en hoja de clculo, atendiendo que entre sus funciones se encuentran las necesarias para implementar el modelo y permite almacenar los datos en un archivo electrnico.

iii.4.5 Experimentacin124 iii.4.5.1 Determinar el Tamao de Muestra125

Para determinar el tamao de muestra, se toma como base la siguiente informacin:126


Ao 1998 1999 2000 Siniestros 1 2 2 Elementos en la cartera 37 39 57 Frecuencia 0,02703 0,05128 0,03509 Frecuencia ms Probable 0,03780

2/53

Con la siguiente formula calcularemos el error estndar estimado de la proporcin es,

E = Sp =
p = 0.03780 n = 53

p(1 p ) n

123 124 125 126

Vid: 4.4 Etapas de un Estudio de Simulacin 4. Vid: 4.4 Etapas de un Estudio de Simulacin 6. Vid: 3.2.2 Determinacin del Tamao de Muestra Requerido para la Estimacin de la Proporcin. En la matemtica del seguro, la frecuencia ms probable es el promedio de las frecuencias.

76

Sustituyendo estos valores se obtiene lo siguiente: E = 0.02617498 Para determinar el tamao de muestra se utilizar la siguiente frmula:

n=

z 2 (1 ) E2

Donde, z es el valor usado para el intervalo de confianza especificado, es la estimacin inicial de la proporcin poblacional y E es el error de muestreo de ms o de menos permitido en el intervalo. z = 1.96 (para un intervalo del 95% de confianza)

= 0.03780

E = 0.02617498 Sustituyendo estos valores se obtiene lo siguiente: n = 203.6048 204 Es decir que, empleando la frecuencia ms probable como proporcin se determin el tamao de muestra requerido para un intervalo de confianza del 95%, el cual fue de 204 carteras con 53 elementos cada una y el nmero esperado de siniestros (de las 204 carteras) ser de 2.

iii.4.5.2 Generacin de Carteras del Seguro de Responsabilidad Civil Agentes de Seguros (Personas Fsicas) Utilizando Simulacin Estocstica
Las 204 carteras (muestras) fueron generadas y una parte de una de stas se presenta como ejemplo:127

127

El lector podr ver las 204 carteras en el anexo electrnico.

77

Corrida :

10 Dato 1 2 3 4 5 . . . 13 14 15 16 17 18 19 20 21 22 . . . 47 48 49 50 51 52 53 TOTAL Volumen de Prima Lmite de Nmero Aleatorio Siniestro a b c Responsabilidad Promedio Intermediada Si=1; No=0 Monto 0.60701 0.28362 0.87833 $100,000.00 $1,232,846.78 0 $0.00 0.01593 0.49260 0.67002 $100,000.00 $21,202.37 0 $0.00 0.61458 0.74905 0.69245 $100,000.00 $1,258,500.62 0 $0.00 0.87556 0.36999 0.95287 $100,000.00 $2,750,841.19 0 $0.00 0.22355 0.93993 0.13336 $100,000.00 $333,984.90 0 $0.00 . . . . . . . . . . . . . . . . . . . . . 0.32089 0.90674 0.24424 $100,000.00 $510,812.80 0 $0.00 0.83043 0.85914 0.71354 $100,000.00 $2,342,363.40 0 $0.00 0.68382 0.42638 0.90787 $100,000.00 $1,519,921.82 0 $0.00 0.74583 0.09648 0.04296 $100,000.00 $1,808,095.98 0 $0.00 0.70071 0.66475 0.04963 $100,000.00 $1,592,365.31 0 $0.00 0.60689 0.00075 0.86659 $100,000.00 $1,232,427.17 1 $313,740.97 0.07316 0.63342 0.44348 $100,000.00 $100,284.62 0 $0.00 0.65819 0.79660 0.69581 $100,000.00 $1,417,032.29 0 $0.00 0.23762 0.31606 0.32421 $100,000.00 $358,123.59 0 $0.00 0.14671 0.77476 0.84020 $100,000.00 $209,419.53 0 $0.00 . . . . . . . . . . . . . . . . . . . . . 0.81860 0.91850 0.50501 $100,000.00 $2,253,323.60 0 $0.00 0.28000 0.56115 0.70373 $100,000.00 $433,622.41 0 $0.00 0.98254 0.71406 0.07092 $100,000.00 $5,342,789.70 0 $0.00 0.00521 0.67292 0.68969 $100,000.00 $6,891.30 0 $0.00 0.80741 0.84845 0.34504 $100,000.00 $2,174,278.30 0 $0.00 0.65123 0.01114 0.76253 $100,000.00 $1,390,398.55 1 $200,926.36 0.33116 0.98586 0.90498 $100,000.00 $530,911.49 0 $0.00 $5,300,000.00 2 $514,667.33

iii.4.6 Interpretacin de los Resultados128


Siguiendo los pasos anteriores se simularon 204 carteras tal y como se determin en el subcaptulo iii.4.5.1; cada cartera consta de 53 elementos (plizas) y con base a los datos generados se cre la siguiente tabla que proporciona un resumen de stos: Clase Nmero de Siniestros Acumulado Efectivos $0 $10.000 399 71 $10.000 $20.000 328 36 $20.000 $30.000 292 24 $30.000 $40.000 268 20 $40.000 $50.000 248 24 $50.000 $60.000 224 17 $60.000 $70.000 207 12 $70.000 $80.000 195 9 $80.000 $90.000 186 9 $90.000 $100.000 177 7 $100.000 $200.000 170 62 $200.000 $300.000 108 43 $300.000 $400.000 65 29 $400.000 $500.000 36 11
128

Monto Efectivos Acumulado $286.092,73 $57.401.254,00 $547.608,06 $57.115.161,27 $593.402,98 $56.567.553,21 $721.006,39 $55.974.150,23 $1.100.897,71 $55.253.143,83 $936.760,75 $54.152.246,12 $766.512,16 $53.215.485,36 $674.462,47 $52.448.973,21 $764.009,36 $51.774.510,74 $662.161,26 $51.010.501,38 $8.765.547,13 $50.348.340,12 $10.515.121,22 $41.582.793,00 $10.013.586,28 $31.067.671,78 $4.909.816,98 $21.054.085,49

Vid: 4.4 Etapas de un Estudio de Simulacin 7.

78

$500.000 $600.000 $600.000 $700.000 $700.000 $800.000 $800.000 $900.000 $900.000 $1.000.000 $1.000.000 $1.100.000 $1.100.000 $1.200.000

25 11 6 3 2 2 1

14 5 3 1 0 1 1

$7.559.375,76 $16.144.268,51 $3.244.993,69 $8.584.892,75 $2.263.908,39 $5.339.899,06 $855.760,57 $3.075.990,68 $0,00 $2.220.230,10 $1.053.123,47 $2.220.230,10 $1.167.106,63 $1.167.106,63

Estos resultados sern utilizados para el clculo de cuotas mismo que se explica en el siguiente punto.

iii.5

Procedimientos para Clculo de Cuotas

Para el clculo de cuotas se utilizarn las formulas que a continuacin se presentan. Monto en Primas Puras = Suma de Siniestros = De donde, P

s
i =1

P=

s
i =1

(1)

Por otro lado, la Probabilidad de Siniestro q se calcular con la siguiente formula:

q=

i =1

(2)

Donde, Grado Dao129= del


i

La Desviacin Estndar del Gasto Total por Siniestros es:

129

Una gran parte de los objetos asegurados afectados por siniestros sufre slo una prdida parcial, es decir no se destruye v (lmite de responsabilidad o suma asegurada, dependiendo del seguro) en su totalidad, sino slo una parte de v, la cual suele ser expresada, v, en donde es la fraccin destruida de v; y es llamada grado del dao. v = s es la fraccin de la prdida econmica causada por un siniestro, tendremos casos donde s = v y la relacin

Si

entre el dao y el valor del objeto ser s = 0 y tambin

s =0. v

En los

s = 1 , quedando as definida la prdida total. En la mayora de los casos ser v s casos intermedios, s < v, por lo que ser una expresin decimal entre 0 y 1, v

quedando as definida la prdida parcial.

79

= v nq

i =1 q n i i =1
n

i2

(3)

Las Primas de Riesgo Pt se calculan de la siguiente forma: Pt = P + En nuestro caso = 1. La Cuota de Riesgo se obtiene como sigue: P = nt
i =1

(4)

(5)

Mientras que la Cuota de Tarifa

se calcula de la siguiente forma:

=
Donde, Gastos de Administracin 1 = Gastos de Adquisicin 2 = Otros Gastos 3 = Utilidad 4 =

1 ( 1 + 2 + 3 + 4 )

(6)

iii.5.1

Clculo de Cuotas sin Deducible


considerando que el valor total
130

Con base a la siguiente estadstica se calculan P, Pt, y


n

del riesgo es de

v = 1,081200,000.00, donde v =100,000 y n = 10,812.


i i =1

130

Para elaborar sta tabla, se consider que en el caso de los siniestros mayores a $100,000.00 slo se paga sta cantidad ya que el exceso queda a cargo del asegurado; en el caso de tener un siniestro menor a esta cantidad se paga el valor del siniestro. Lo anterior porque en el Ramo de Responsabilidad Civil los seguros se otorgan a primer riesgo. El seguro a primer riesgo es una modalidad que consiste en asegurar un bien por un valor determinado hasta el cual queda cubierto el riesgo. Vid: VARGAS, op. cit. p. 140.

80

Clase $0 $10.00 0 $20.00 0 $30.00 0 $40.00 0 $50.00 0 $60.00 0 $70.00 0 $80.00 0 $90.00 0 $10.000 $20.000 $30.000 $40.000 $50.000 $60.000 $70.000 $80.000 $90.000 $100.00 0

i =1

mi

mi

s
i =1

Acumulados

i =1

si

im
2,8609 5,4761 5,9340 6,9118 11,0090 9,3676 7,6651 6,7446 7,6401 176,621 6 240,230 9

i2m
0,1886 0,8703 1,4914 2,4025 5,0675 5,1779 4,9032 5,0643 6,4921 176,268 6 207,92 62

399 328 292 268 248 224 207 195 186 177

71 36 24 20 24 17 12 9 9 17 7

$286.092,73 $547.608,06 $593.402,98 $691.181,12 $1.100.897,7 1 $936.760,75 $766.512,16 $674.462,47 $764.009,36 $17.662.161, 26

$24.023.088,6 1 $23.736.995,8 8 $23.189.387,8 1 $22.595.984,8 3 $21.904.803,7 1 $20.803.905,9 9 $19.867.145,2 4 $19.100.633,0 8 $18.426.170,6 2 $17.662.161,2 6

De la tabla anterior y de las ecuaciones presentadas en iii.5 se obtiene:

P=

i =1

si =24023.088.61

q=

i =1

240.2309 = 0.0222 10,812

i =1 n i =1

2 i

= v nq

207.9262 = 0.8655 240.2309


i =1 i =1 n

i2

q = 100,000 (10,812 )(0.0222 )(0.8655 0.0222 ) = 1'423,336.15 i

81

Pt = P + = 24'023,088.61 + 1'423,336.15 = 25'446,424.76

Pt

v
i =1

=
i

25'446,424.76 = 23.54 1,081'200,000.00

Con base a la siguiente tabla se calcula la cuota de tarifa: Gastos de Administracin = = Gastos de Adquisicin = Utilidad Mnima Esperada = = =
1

15% 9% 5%

23 .54 = = 33 .15 1 ( 1 + 2 + 4 ) 1 (0.15 + 0.09 + 0.05 )

Finalmente, se construy una escala de peligrosidad haciendo uso de las probabilidades encontradas en iii.4.2.3, obtenindose la Tarifa siguiente: Cuota Aplicable al Lmite de Responsabilidad $100,000.00 M. N. 19.23 64.64

Monto Promedio de Prima Intermediada Hasta Mayor a $1500,000.00 $1500,000.00

Prima en Pesos M. N. $1,923.00 $6,464.00

Las cuotas obtenidas, se aplicaron a las carteras que previamente se simularon, los resultados de dicha aplicacin causaron impacto positivo; y se concluye que permiten la sana operacin de ste seguro.

iii.5.2 Clculo de Cuotas con Deducible


Con base a la siguiente estadstica en la que se maneja un deducible de $7,500.00 se calculan P, Pt, y considerando que el valor total del riesgo es de

v = 1,081200,000.00,
i i =1

donde v =100,000 y n = 10,812. Clase Despus de Aplicar Deducible $0 $2.500 $12.500 $2.500 $12.500 $22.500
m

m
i =1

mi

s
i =1

Acumulados

s
i =1

im
0,1836 3,0012 4,4692

i2m
0,0034 0,2938 0,8605

341 328 292

13 36 24

$16.985,62 $277.608,06 $413.402,98

$21.293.981,50 $21.276.995,88 $20.999.387,81

82

$22.500 $32.500 $42.500 $52.500 $62.500 $72.500 $82.500

$32.500 $42.500 $52.500 $62.500 $72.500 $82.500 $92.500

268 248 224 207 195 186 177

20 24 17 12 9 9 177

$541.181,12 $920.897,71 $809.260,75 $676.512,16 $606.962,47 $696.509,36 $16.334.661,26

$20.585.984,83 $20.044.803,71 $19.123.905,99 $18.314.645,24 $17.638.133,08 $17.031.170,62 $16.334.661,26

5,8506 9,9557 8,7488 7,3136 6,5618 7,5298 176,5909 230,2052

1,7276 4,1503 4,5211 4,4657 4,7955 6,3074 176,2116 203,3368

De la tabla anterior y de las ecuaciones presentadas en iii.5 se obtiene:

P=

i =1

si =21293,981.50

q=

i =1

230.2052 = 0.0213 10,812

i =1 n i =1

2 i

= v nq

203.3368 = 0.8833 230.2052


i =1 i =1 n

i2

q = 100,000 (10,812 )(0.0213 )(0.8833 0.0213 ) = 1'408,670.92 i

Pt = P + = 21'293,981.50 + 1'408,670.92 = 22'702,652.42

Pt

v
i =1

=
i

22'702,652.42 = 21.00 1,081'200,000.00

Con base a la siguiente tabla se calcula la cuota de tarifa: Gastos de Administracin = Gastos de Adquisicin = = Utilidad Mnima Esperada = = =
1

15% 9% 5%

21 .00 = = 29 .57 1 ( 1 + 2 + 4 ) 1 (0.15 + 0.09 + 0.05 )

Finalmente, se construy una escala de peligrosidad haciendo uso de las probabilidades encontradas en iii.4.2.3, obtenindose la Tarifa siguiente:

83

Monto Promedio de Prima Intermediada Hasta Mayor a $1500,000.00 $1500,000.00

Cuota Aplicable al Lmite de Responsabilidad $100,000.00 M. N. 17.10 57.56

Prima en Pesos M. N. $1,710.00 $5,756.00

Las cuotas obtenidas, se aplicaron a las carteras que previamente se simularon, los resultados de dicha aplicacin causaron impacto positivo; y se concluye que permiten la sana operacin de ste seguro. La aplicacin del deducible propuesto permite que exista un descuento de casi el 11% respecto a las cuotas manejadas sin deducible. Los resultados de la metodologa propuesta en este trabajo, resultaron ser satisfactorios para la problemtica de este seguro, ya que permitirn a la compaa tener una tarifa justa y no tener problemas de insuficiencia de primas para el pago de siniestros; as como hacer frente a los gastos de administracin y de adquisicin; adems la institucin tendr la posibilidad de obtener utilidad. Con esta nota tcnica se ejemplific, en un caso real las ventajas del uso de la Estimacin de la Distribucin de Probabilidad para Muestras Pequeas y de la Simulacin en la Inferencia de Carteras de Seguros. Aportando as, un mtodo que permite hacer inferencias de la cartera a pesar de que los datos de sta no cumplan el supuesto de provenir de una muestra lo suficientemente grande. Finalmente, en las siguientes pginas se proceder a exponer las conclusiones de la presente tesis.

84

ANEXO 1 DE NOTA TCNICA


CARTERA 1998 RESPONSABILIDAD CIVIL AGENTES DE SEGUROS CIFRAS EN MONEDA NACIONAL LMITE DE RESPONSABILIDAD 29,998,500 25,392,900 8,816,400 3,000,000 8,068,100 175,000 100,000 16,136,200 1,000,000 5,000,000 4,244,900 100,000 902,000 150,000 12,000,000 1,019,330 162,000 19,999,000 1,000,000 250,000 2,000,000 75,000 75,000 100,000 300,000 75,000 1,000,000 250,000 1,150,000 250,000 500,000 75,000 75,000 75,000 SINIESTROS NMERO MONTO 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 2,000 0 0 0 0 0

PLIZA 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34

85

35 36 37 TOTAL

1,000,000 592,000 500,000 145,606,330

0 0 0 1

0 0 0 2,000

CARTERA 1999 RESPONSABILIDAD CIVIL AGENTES DE SEGUROS CIFRAS EN MONEDA NACIONAL LMITE DE RESPONSABILIDAD 28,296,000 28,332,300 9,432,000 9,687,200 100,000 418,000 420,000 100,000 5,000,000 4,622,350 2,000,000 1,366,292 1,000,000 150,000 11,000,000 9,385,000 934,830 1,000,000 162,000 19,250,000 420,000 2,000,000 1,000,000 175,000 75,000 200,000 1,000,000 1,000,000 3,000,000 SINIESTROS NMERO MONTO 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 427,846 0 0 0 0 0 0 0 0 0

PLIZA 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29

86

30 31 32 33 34 35 36 37 38 39 TOTAL

75,000 3,000,000 1,150,000 250,000 75,000 1,000,000 125,000 1,000,000 1,481,246 500,000 150,182,218

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 10,250 0 0 2 438,096

CARTERA 2000 RESPONSABILIDAD CIVIL AGENTES DE SEGUROS CIFRAS EN MONEDA NACIONAL LMITE DE RESPONSABILIDAD 100,000 9,498,600 28,246,500 9,415,500 9,511,000 3,000,000 9,511,000 49,121,500 3,000,000 100,000 100,000 100,000 500,000 5,000,000 1,000,000 500,000 4,706,350 2,500,000 500,000 1,000,000 SINIESTROS NMERO MONTO 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 30,405 0 0

PLIZA 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

87

21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 TOTAL

150,000 5,000,000 2,000,000 200,000 944,590 500,000 19,128,400 162,000 500,000 420,000 175,000 1,000,000 2,000,000 500,000 300,000 500,000 1,000,000 75,000 500,000 500,000 250,000 1,370,000 75,000 100,000 1,150,000 75,000 5,000,000 1,000,000 200,000 200,000 200,000 125,000 1,000,000 1,766,586 500,000 250,000 500,000 186,727,026

0 0 0 0 1 238,501 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 2 268,906

88

ANEXO 2 DE NOTA TCNICA


ESTADSTICA 1999 - 2002 Cifras en Moneda Nacional Volumen de Prima Promedio Nmero de Intermediada Agentes 40,781 1,253 85,088 842 116,947 681 164,614 493 212,054 417 260,076 356 305,364 250 334,692 215 406,709 182 424,805 153 444,697 144 538,323 110 618,191 104 628,205 76 623,741 80 829,021 39 784,463 47 791,900 56 716,144 40 1,004,473 42 965,833 30 929,940 27 1,102,811 31 1,280,641 30 962,514 27 1,125,519 20 1,070,391 19 1,411,220 20 1,229,467 16 1,170,140 12 1,715,853 10 1,346,394 11 1,284,556 9 1,651,606 10 1,778,352 8 1,191,824 5 1,461,960 11 1,636,713 6 1,657,805 7

89

1,877,224 2,573,612 2,188,574 2,768,045

7 5 5 5

ESTADSTICA 1999 - 2002 Cifras en Moneda Nacional Volumen de Prima Promedio Nmero de Intermediada Agentes 2,152,758 9 3,211,147 3 2,743,185 5 2,748,725 3 1,806,382 3 1,922,538 3 2,131,275 1 1,803,425 1 2,336,643 4 2,265,370 2 1,214,540 1 1,732,305 1 2,994,966 5 3,458,190 2 4,101,368 3 3,152,309 5 6,719,605 1 2,269,985 3 4,023,990 1 5,321,472 3 2,548,482 3 3,803,252 3 1,454,335 1 3,384,760 1 7,333,795 1 3,574,620 1 2,012,715 1 3,013,220 1 10,868,885 1

90

Total

1,465,768 14,245,380 1,624,933 6,149,430 3,236,355 3,102,965 5,378,095 8,836,350 6,981,670 7,949,690 12,755,430 9,510,265 221,051,850

2 1 2 1 1 1 1 1 1 1 1 1 5,997

91

ANEXO ELECTRNICO

92

CONCLUSIONES Y RECOMENDACIONES
En el presente trabajo se estudi de manera previa el tema de estadstica descriptiva ya que el paso inicial de toda investigacin es coleccionar, agrupar y analizar los datos con los que se desea trabajar o simplemente con los que se trabajar. Una vez hecho lo anterior, el siguiente paso consiste en hacer inferencias sobre el comportamiento de los datos; motivo por el cual esta tesis dedic el segundo captulo al tema de distribuciones de probabilidad, ya que a travs de estas se pueden hacer conjeturas sobre los datos cuando stos forman un conjunto suficientemente grande. Ante el problema de trabajar con pocos datos, situacin comn en el campo del seguro, en este trabajo se explic el mtodo del rango mediano ya que este permite estimar una distribucin de probabilidad a pesar de que los datos no sean de una muestra suficientemente grande; adems se mostraron dos pruebas tiles para acreditar que los datos se ajustan a la distribucin estimada. As mismo, para calcular el nmero de veces que se trabajar con el modelo simulado se mostr como determinar el tamao de muestra. Tambin, se habl de la simulacin y para entenderla mejor se estudi el modelado de sistemas porque con esta tcnica se simula realmente un modelo del sistema. Finalmente, la metodologa expuesta por esta tesis se ejemplifico con una nota tcnica en la que se calculan las cuotas base para el seguro de responsabilidad civil agentes de seguros, producto que careca de homogeneidad respecto a los precios calculados por diferentes compaas aseguradoras y consecuentemente se observaba la carencia de tcnica para extraer el mayor provecho como sea posible a pocos datos. Como dato adicional, cuando se calcularon las cuotas para seguro del que se habla en el captulo cinco, se contaba con la tarifa que el reasegurador entreg a la compaa que proporcion los datos, los costos para diferentes lmites de responsabilidad publicados por otra compaa de seguros (informacin de dominio pblico) y con los pocos datos de la cartera proporcionada por la compaa. Mediante el uso de la metodologa aqu propuesta, se observ que la tarifa entregada por el reasegurador y la publicada por la otra compaa llevan a nmeros rojos, mientras que la que se desarrolla en este trabajo con el uso de las tcnicas propuestas proporciona las consecuencias positivas implcitas de un buen clculo, hacer frente a los siniestros, utilidad para la empresa y el pago de los gastos de administracin y adquisicin, observndose que la construccin del modelo y los supuestos del mismo son buenos. Se recomienda a las personas que deseen emplear esta tcnica tomen en cuenta lo siguiente: 1. La construccin del modelo juega un papel importante en los resultados que se obtengan por el uso de stas tcnicas. 2. Esta metodologa slo puede emplearse por cada riesgo del que se tenga informacin, aunque sta sea escasa. 3. Est metodologa slo puede aplicarse a cada grupo o clase de riesgos de los que se tenga informacin.

93

4. Siempre ser mejor trabajar con una muestra lo suficientemente grande, claro que ante la carencia de datos esta metodologa es una buena opcin. 5. Independientemente de la aplicacin final de los datos obtenidos con estas tcnicas, tal aplicacin debe de ser supervisada una vez puesta en prctica para evitar desvos respecto a lo planeado y en caso contrario nuevamente estudiar el riesgo para disear programas correctivos; esta recomendacin constituye un paso obligado independientemente de las tcnicas utilizadas. La realidad, es que el uso de nuevas tcnicas en campos especializados y con innovadoras exigencias, como lo es el del seguro permite la consolidacin de vnculos entre estos, cultivando lazos fructferos en este manantial inextinguible de siempre nuevos conocimientos por aprender.

94

NOTA FINAL
La compaa de seguros que proporcion su informacin para el clculo de la tarifa del Seguro de Responsabilidad Civil Agentes de Seguros (Persona Fsicas), determinaba las primas para este riesgo con una tarifa proporcionada por el resaegurador, el mtodo de cotizacin que ste propone se conoce como pay back adems de un descuento en el caso de deducible, el pay back se da en un intervalo permisible que indica el nmero de plizas que se deben de vender para hacer frente a un siniestro. A los elementos de las carteras simuladas se les aplic esta metodologa para hacer comparacin con el propuesto por esta tesis, el resultado fue que el pay back debera de ser menor; lo que implica que las primas deberan de ser mayores; adems de que haciendo uso del deducible no se poda dar el descuento propuesto, por lo tanto hacer uso de la tarifa propuesta por el reasegurador para este riesgo llevar a nmeros rojos a la compaa de seguros. La tarifa publicada por una empresa competidora es ms baja que la propuesta por esta tesis, lo que implica que no permite pagar los siniestros que se presenten, adems tampoco permite hacer frente a los gastos de administracin, los de adquisicin y la compaa de seguros no obtendr utilidad, por lo tanto las primas de la competencia llevaran a nmeros rojos a la empresa competidora. Finalmente, la tarifa calculada con la metodologa propuesta por esta tesis garantiza la solvencia del asegurador, ya que el uso de sta permite hacer frente a todos los compromisos que se adquieren con la venta de seguros para este riesgo.

95

BIBLIOGRAFA
AGUILAR Jurez, Isabel Patricia y Leonardo BAUELOS Saucedo Notas del Curso Propedutico de Probabilidad y Estadstica. Mxico. Trabajo No publicado. 2002. 97 p. BILLINTON, Roy y Ronald N. ALLAN Reliability Evaluation of Engineering Systems Concepts and Techniques. 2nd Edition. United States of America. Plenum Publishing Corporation. 1992. 453 p. CANAVOS C. George Probabilidad y Estadstica Aplicaciones y Mtodos. 1a. Edicin. [Tr: Edmundo Gerardo Urbina Medal] [R. T. Gustavo Javier Valencia Ramrez] Mxico. Mc Graw Hill. 1988. 651 p. COMISIN NACIONAL DE SEGUROS Y FIANZAS (CNSF) Circular S 8.1 Mxico. Diario Oficial de la Federacin. Febrero 20, 2004. COSS Bu, Ral Simulacin un Enfoque Prctico. 1a Edicin. Mxico. Editorial Limusa. 1988. 158 p. ENCICLOPEDIA CIENTFICA CULTURAL Volumen estadstica. [Tx: Juan Luis Gutirrez Duchos] Espaa. Cultural S. A. de Ediciones. 1980. 243 p.

96

HILLER, Frederick S. y Gerald J. LIEBERMAN Introduccin a la Investigacin de Operaciones. 4a. Edicin [Tr. Marcia A. Gonzlez Osuna] [R. T. Jos Humberto Cant Delgado Perla J. Fernndez Reyna Marco A. Montufar Bentez] Mxico. Mc Graw Hill Interamericana Editores. 1999. 998 p. KAZMIER, Leonard J. Estadstica Aplicada a la Administracin y a la Economa. 3a. Edicin. [R. T. Alejandro Alegra Hernndez] Mxico. Mc Graw Hill. 1998. 416 p. KNEZEVIC, Jezdimir Reliability, Maintainability and Supportability a Probabilistic Approach United Kingdom. Mc. Graw Hill Book Company Europe. 1993. 291 p. KREYSZIG, Erwin Introduccin a la Estadstica Aplicada Principios y Mtodos. 1a. Edicin. [Versin espaola: Arturo Galn Martnez] [R. Octavio A. Rascon Chvez] Mxico. Editorial Limusa. 1979. 505 p. MARN Diazaraque, Juan Miguel Apuntes de Estadstica Estadstica Descriptiva, p. 333 Espaa. Universidad Carlos III de Madrid. 2004. http://halweb.uc3m.es/ MILLER, Irwin, John E. FREUD y Richard A. JOHNSON Probabilidad y Estadstica para Ingenieros. 4a. Edicin. [Tr: Virgilio Gonzlez Pozo] [R. T. Graciela Rojas de Finck] Mxico. Prentice Hall Hispanoamericana. 1992. 624 p. RINCON, Juana Cooperacin del Personal Acadmico: Mecanismo para la Integracin del Sistema Universitario Nacional. San Fernando de Apure, Venezuela. Universidad Simn Rodrguez. 1998. http://members.tripod.com/~gepsea/sistema.htm

97

SAUTTO Vallejo, Jos Maclovio La tcnica de la Simulacin Digital en la Investigacin de Operaciones. Mxico. Tesis UNAM. 1991. 146 p. SECRETARA DE HACIENDA Y CRDITO PBLICO Reglas que Establecen las Orientaciones de Poltica General Aplicables a los Agentes y Apoderados de Seguros y Fianzas. Mxico. Diario Oficial de la Federacin. Febrero 27, 2004. VARGAS Aguilar, Juan Carlos Fundamentos para el Desarrollo de Productos en Daos Mxico. Tesis UNAM. 2003. 164 p. Ley General de Instituciones y Sociedades Mutualistas de Seguros. Archivo de la CNSF 2001. Mxico. Diario Oficial de la Federacin. Enero 16, 2002.

98

Você também pode gostar