Planes de Beneficios

UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MÉXICO
FACULTAD DE ECONOMÍA
LICENCIATURA EN ACTUARÍA
Primer Parcial
MODELOS DE EVALUACIÓN DE GASTOS EN PRESTACONES PARA LOS

TRABAJADORES DE UNA EMPRESA
Presenta:
María Fernanda González García
Leslie Jiménez Calderón
Fernando Trujillo Arévalo
Profesor de la asignatura: Oscar Javier Albarrán Trujillo
Mayo 2017
Introducción
El presente trabajo tiene como objetivo hacer un análisis estadístico de las

condiciones laborales en una empresa aseguradora, así como describir el impacto
que involucran las prestaciones que ofrecen hacia sus trabajadores en la utilidad
de la misma.
El siguiente análisis está basado en datos obtenidos de la Encuesta Nacional de

Ocupación y Empleo (ENOE) realizada por el Instituto Nacional de Estadística y
Geografía (INEGI).
Detalles de la base de datos
Para este estudio solamente se contemplaron:
*Personas ocupadas
*Población con acceso a seguridad social
*Trabajadores subordinados y remunerables
*Pertenecientes a grandes establecimientos
*Con una edad mayor o igual a 15 años (edad legal para poder laborar)
*Se descartaron personas pertenecientes al sector público
*Empleados formales
Factor de expansión (FAC): El factor de expansión le concede a la muestra el

peso proporcional al tamaño del universo objeto de investigación, mediante el
cálculo que considera las unidades de muestreo y las probabilidades de selección
de la muestra.
Análisis de componentes principales

Introducción
Una de las características en la actualidad es que gracias a la gran cantidad de

datos que se pueden recaudar podemos tener acceso a una inmensidad de
variables, sin embargo, son diversas situaciones por las cuales debido a su
enorme cantidad de las mismas no se tiene un tratamiento adecuado, lo que
complica la interpretación de la información. La estadística es una gran
herramienta en estos casos debido a que proporciona metodologías que reducen
la dimensión y permiten un mejor manejo e interpretación de los datos.
¿En qué consiste el análisis por componentes principales?
Es un método que busca interrelaciones entre n variables numéricas, en este caso

es posible que con solamente algunas de estas variables se obtenga un resumen
de la información que describa en su mayoría a toda la información (disminución
de dimensiones) obteniendo patrones de asociación entre las variables originales
o simplemente con la obtención de nuevas variables que sirvan para analizar las
posteriores.
El análisis de componentes principales puede utilizarse para obtener conceptos

que no son medibles a partir de variables que si son medibles. Estos resultan de
combinaciones lineales de las variables originales, el primer componente es el
que más resume la información que define una nueva dirección a lo largo de la
cual las proyecciones de los datos tienen la mayor dispersión, el segundo
componente principal es una nueva combinación lineal no correlacionada con el
primero que recoge la mayor cantidad de información que no recogió el primero y
así sucesivamente hasta recoger igual número de componentes principales como
variables originales se tengan.
Conceptos fundamentales para la construcción de componentes principales
𝑆𝑒𝑎𝑛 𝑥1 , 𝑥2 , 𝑥3 , … , 𝑥𝑛 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠 𝑛𝑢𝑚é𝑟𝑖𝑐𝑎𝑠

𝑆𝑒 𝑞𝑢𝑖𝑒𝑟𝑒 𝑐𝑜𝑛𝑡𝑟𝑢í𝑟 𝑦1 , 𝑦2 , 𝑦3 , … , 𝑦𝑛 𝑐𝑜𝑚𝑏𝑖𝑛𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑙𝑖𝑛𝑒𝑎𝑙𝑒𝑠 𝑛𝑜 𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑑𝑎𝑠 𝑒𝑛𝑡𝑟𝑒 𝑠í
𝑆𝑒𝑔ú𝑛 𝑒𝑙𝑙𝑜 𝑒𝑙 𝑝𝑟𝑖𝑚𝑒𝑟 𝑐𝑜𝑚𝑝𝑜𝑛𝑒𝑛𝑡𝑒 𝑝𝑟𝑖𝑛𝑐𝑖𝑝𝑎𝑙 𝑦1 𝑠𝑒 𝑒𝑥𝑝𝑟𝑒𝑠𝑎 𝑐𝑜𝑚𝑜:
𝑦1 = 𝑢11 𝑥1 + 𝑢12 𝑥2 + ⋯ + 𝑢1𝑛 𝑥𝑛
Para que Y1 capte la mayor variabilidad de los datos los coeficientes de

combinación lineal que la forman deben ser coordenadas del eigenvector u1 de
la matriz de covarianzas de las variables originales, que corresponde al mayor
eigenvalor λ1 y así sucesivamente para los posteriores componentes principales
hasta llegar al n-ésimo eigenvector y eigenvalor.
Las combinaciones lineales:
𝑦1 = 𝑢11 𝑥1 + 𝑢12 𝑥2 + ⋯ + 𝑢1𝑛 𝑥𝑛
𝑦2 = 𝑢21 𝑥1 + 𝑢22 𝑥2 + ⋯ + 𝑢2𝑛 𝑥𝑛
𝑦𝑛 = 𝑢𝑛1 𝑥1 + 𝑢𝑛2 𝑥2 + ⋯ + 𝑢𝑛𝑛 𝑥𝑛
Matricialmente:
𝑦1 = 𝑈 𝑡 𝑋
𝑋 = 𝑈𝑌
La varianza de cada componente principal Y es igual al eigenvalor λ𝑛
La suma de los elementos de la diagonal de la matriz de covarianzas de las

variables originales es igual a la suma de los eigenvalores de los componentes
principales.
Estandarizando, la suma de los eigenvalores es igual al número de variables
originales, si la información que contienen las variables está medida por la suma
de sus varianzas, se tendrá que también se puede obtener la información con la
suma de los eigenvalores, donde los primeros serán los que obtienen mayor
información (la gran parte de la suma de las varianzas) con lo que no
necesariamente se necesitan los n variables originales para tener gran parte de
la información, de esta manera se logra la reducción de dimensión.
La correlación entre la variable Xk con el componente principal Yi es:
𝑢𝑖𝑘 √𝜆𝑖
𝜌(𝑌𝑖, 𝑋𝑘) = =
𝜎𝑘
Elección del número de componentes principales
En la práctica se sugiere considerar el número de componentes principales que

retenga entre el 70% y 90% de la variación total.
Interpretación de los componentes principales
Se consideran las variables originales con las cuales el componente tiene mayor
correlación, el significado de estas variables es transferido a los componentes
principales.
Observaciones respecto a los resultados
Es posible utilizar las covarianzas y correlaciones muestrales, sin embargo, se

debe proceder con cuidado pues la muestra debe ser lo suficientemente
representativa.
Análisis de conglomerados
Introducción
También conocido como taxonomía numérica tiene como objetivo el
agrupamiento de individuos u objetos en clases a partir de mediciones realizadas
entre ellos de tal manera que dentro de los grupos se reúnan los elementos más
homogéneos.
Técnica jerárquica aglomerativa
1.-Se parte de tantos conglomerados como elementos existan
2.-Se calculan las distancias entre los conglomerados iniciales
3.-Con los dos conglomerados más próximos se forma un nuevo grupo
4.-Con los nuevos elementos se procede como en los pasos 2 y 3 hasta obtener
un solo grupo con todos los elementos
5.-Mediante un diagrama llamado dendograma se lleva a cabo la partición de los

elementos
Límites a los métodos no jerárquicos
Las soluciones varían significativamente cuando se quitan algunos atributos
Los datos atípicos influyen sensiblemente en los resultados
El método de las K medias
Técnica no jerárquica forman conglomerados cuyo número K es previamente

fijado
Suponiendo que se tiene una muestra de N elementos definidas por P variables

numéricas se forman al azar k grupos y para cada uno se calculan los centroides
o coordenadas donde que son las medias aritméticas de las P variables
Usando la distancia euclidiana se calcula la distancia de cada elemento al
centroide respectivo, reasignándolos al grupo cuyo centroide es más cercano, los
nuevos centroides de los nuevos grupos formados se recalculan
Si la distancia entre los centroides iniciales y los nuevos es pequeña el proceso

termina
Número de conglomerados
La recomendación es iniciar el agrupamiento con el método jerárquico y utilizar

un número k de conglomerados que sean interpretables, posteriormente utilizar
un método no jerárquico usando el número de conglomerados obtenido
anteriormente.
Es recomendable a lo más tener ocho grupos.
Variables estandarizadas y categóricas
Las medidas de distancia pueden ser altamente influenciadas por las unidades
de medida de cada variable lo que significa que las variables con mayores
unidades tienen mayor influencia en la distancia, por lo cual acostumbra
estandarizar previamente las variables.
Validación de los conglomerados
La técnica de agrupamiento deberá producir conglomerados que internamente

sean homogéneos pero heterogéneos entre ellos.
Producir aglomeraciones que aporten información para los fines propuestos por
el investigador
Interpretación de resultados
Además de interpretar los conglomerados formados de acuerdo a las
características dependientes de las variables, podemos apoyarnos de variables
categóricas que aunadas con los resultados numéricos permitirán asociaciones
que arrojen conclusiones más concretas.
Análisis discriminante
Introducción
Se dispone de dos o más grupos de elementos para los cuales se conocen los
valores de diversas variables numéricas y la tarea es reconocer a la o las variables
que mejor discriminan a los elementos.
A su vez se permite clasificar nuevos elementos en uno de los grupos disponibles.
Análisis discriminante lineal
En este análisis la variable dependiente es una variable categórica.
El objetivo de del análisis discriminante es crear nuevas variables que separen a

los elementos en categorías de la variable dependiente, si la variable dependiente
tiene k categorías el número de nuevas variables discriminantes deberá ser de k
menos 1
Discriminante lineal de Fisher para dos grupos
Supongamos que se tienen dos grupos con características numéricas X1…Xn, y

la categoría Y a la que pertenecen, la idea es encontrar una combinación lineal
de las variables numéricas originales, que mejor separe a los elementos el primer
grupo de los elementos del segundo grupo.
𝑍 = 𝑎1 𝑥1 + 𝑎2 𝑥2 + ⋯ + 𝑎𝑛 𝑥𝑛
Este procedimiento en el sentido de que la distancia entre las medias de los
valores de Z que le corresponden a cada grupo sea máxima, supuesto que se
satisface con:
𝑍 = (𝜇1 − 𝜇2 )𝑡 ∗ Σ −1 ∗ 𝜒
Donde M1 y M2 son los vectores de las medias de las variables X1, X2, …, Xn
en los grupos respectivos
Esta combinación lineal es conocida como el discriminante lineal de Fisher
Regla de clasificación y la DLdF
1.- Se estiman los centroides (vector de medias de las variables)
2.-Se proyecta cada centroide a la discriminante lineal de Fisher, las proyecciones

respectivas Zn se obtienen reemplazando las coordenadas de los centroides en
la discriminante lineal.
3.-A partir de las proyecciones se calcula un punto medio M
4.- Si para un nuevo vector de variables Xo, el elemento se ubica en el grupo 1 si

al reemplazar los componentes de Xo en el discriminante lineal de Fisher resulta
un valor menor o igual a M, de otra manera se ubica en el otro grupo.
𝑥0 = 𝑥01, 𝑥02, , … , 𝑥0𝑛
𝑎1 𝑥01 + 𝑎2 𝑥02 + ⋯ + 𝑎𝑛 𝑥0𝑛 ≤ 𝑀

Planes de Beneficios

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Planes de Beneficios

Enviado por

Direitos autorais:

Formatos disponíveis

UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MÉXICO

MODELOS DE EVALUACIÓN DE GASTOS EN PRESTACONES PARA LOS

María Fernanda González García

Leslie Jiménez Calderón

Fernando Trujillo Arévalo

Profesor de la asignatura: Oscar Javier Albarrán Trujillo

El presente trabajo tiene como objetivo hacer un análisis estadístico de las

El siguiente análisis está basado en datos obtenidos de la Encuesta Nacional de

Detalles de la base de datos

Para este estudio solamente se contemplaron:

*Población con acceso a seguridad social

*Trabajadores subordinados y remunerables

*Pertenecientes a grandes establecimientos

*Se descartaron personas pertenecientes al sector público

Factor de expansión (FAC): El factor de expansión le concede a la muestra el

Análisis de componentes principales

Una de las características en la actualidad es que gracias a la gran cantidad de

¿En qué consiste el análisis por componentes principales?

Es un método que busca interrelaciones entre n variables numéricas, en este caso

El análisis de componentes principales puede utilizarse para obtener conceptos

Conceptos fundamentales para la construcción de componentes principales

𝑆𝑒𝑎𝑛 𝑥1 , 𝑥2 , 𝑥3 , … , 𝑥𝑛 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠 𝑛𝑢𝑚é𝑟𝑖𝑐𝑎𝑠

𝑆𝑒𝑔ú𝑛 𝑒𝑙𝑙𝑜 𝑒𝑙 𝑝𝑟𝑖𝑚𝑒𝑟 𝑐𝑜𝑚𝑝𝑜𝑛𝑒𝑛𝑡𝑒 𝑝𝑟𝑖𝑛𝑐𝑖𝑝𝑎𝑙 𝑦1 𝑠𝑒 𝑒𝑥𝑝𝑟𝑒𝑠𝑎 𝑐𝑜𝑚𝑜:

𝑦1 = 𝑢11 𝑥1 + 𝑢12 𝑥2 + ⋯ + 𝑢1𝑛 𝑥𝑛

Para que Y1 capte la mayor variabilidad de los datos los coeficientes de

Las combinaciones lineales:

𝑦1 = 𝑢11 𝑥1 + 𝑢12 𝑥2 + ⋯ + 𝑢1𝑛 𝑥𝑛

𝑦2 = 𝑢21 𝑥1 + 𝑢22 𝑥2 + ⋯ + 𝑢2𝑛 𝑥𝑛

𝑦𝑛 = 𝑢𝑛1 𝑥1 + 𝑢𝑛2 𝑥2 + ⋯ + 𝑢𝑛𝑛 𝑥𝑛

La varianza de cada componente principal Y es igual al eigenvalor λ𝑛

La suma de los elementos de la diagonal de la matriz de covarianzas de las

La correlación entre la variable Xk con el componente principal Yi es:

Elección del número de componentes principales

En la práctica se sugiere considerar el número de componentes principales que

Interpretación de los componentes principales

Observaciones respecto a los resultados

Es posible utilizar las covarianzas y correlaciones muestrales, sin embargo, se

Técnica jerárquica aglomerativa

1.-Se parte de tantos conglomerados como elementos existan

2.-Se calculan las distancias entre los conglomerados iniciales

3.-Con los dos conglomerados más próximos se forma un nuevo grupo

5.-Mediante un diagrama llamado dendograma se lleva a cabo la partición de los

Límites a los métodos no jerárquicos

Las soluciones varían significativamente cuando se quitan algunos atributos

Los datos atípicos influyen sensiblemente en los resultados

El método de las K medias

Técnica no jerárquica forman conglomerados cuyo número K es previamente

Suponiendo que se tiene una muestra de N elementos definidas por P variables

Si la distancia entre los centroides iniciales y los nuevos es pequeña el proceso

La recomendación es iniciar el agrupamiento con el método jerárquico y utilizar

Es recomendable a lo más tener ocho grupos.

Variables estandarizadas y categóricas

Validación de los conglomerados

La técnica de agrupamiento deberá producir conglomerados que internamente

A su vez se permite clasificar nuevos elementos en uno de los grupos disponibles.

Análisis discriminante lineal

En este análisis la variable dependiente es una variable categórica.

El objetivo de del análisis discriminante es crear nuevas variables que separen a

Discriminante lineal de Fisher para dos grupos

Supongamos que se tienen dos grupos con características numéricas X1…Xn, y

Esta combinación lineal es conocida como el discriminante lineal de Fisher

Regla de clasificación y la DLdF

1.- Se estiman los centroides (vector de medias de las variables)

2.-Se proyecta cada centroide a la discriminante lineal de Fisher, las proyecciones