Você está na página 1de 9

UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MÉXICO

FACULTAD DE ECONOMÍA

LICENCIATURA EN ACTUARÍA

Primer Parcial

MODELOS DE EVALUACIÓN DE GASTOS EN PRESTACONES PARA LOS


TRABAJADORES DE UNA EMPRESA

Presenta:

María Fernanda González García

Leslie Jiménez Calderón

Fernando Trujillo Arévalo

Profesor de la asignatura: Oscar Javier Albarrán Trujillo

Mayo 2017
Introducción

El presente trabajo tiene como objetivo hacer un análisis estadístico de las


condiciones laborales en una empresa aseguradora, así como describir el impacto
que involucran las prestaciones que ofrecen hacia sus trabajadores en la utilidad
de la misma.

El siguiente análisis está basado en datos obtenidos de la Encuesta Nacional de


Ocupación y Empleo (ENOE) realizada por el Instituto Nacional de Estadística y
Geografía (INEGI).

Detalles de la base de datos

Para este estudio solamente se contemplaron:

*Personas ocupadas

*Población con acceso a seguridad social

*Trabajadores subordinados y remunerables

*Pertenecientes a grandes establecimientos

*Con una edad mayor o igual a 15 años (edad legal para poder laborar)

*Se descartaron personas pertenecientes al sector público

*Empleados formales

Factor de expansión (FAC): El factor de expansión le concede a la muestra el


peso proporcional al tamaño del universo objeto de investigación, mediante el
cálculo que considera las unidades de muestreo y las probabilidades de selección
de la muestra.

Análisis de componentes principales


Introducción

Una de las características en la actualidad es que gracias a la gran cantidad de


datos que se pueden recaudar podemos tener acceso a una inmensidad de
variables, sin embargo, son diversas situaciones por las cuales debido a su
enorme cantidad de las mismas no se tiene un tratamiento adecuado, lo que
complica la interpretación de la información. La estadística es una gran
herramienta en estos casos debido a que proporciona metodologías que reducen
la dimensión y permiten un mejor manejo e interpretación de los datos.

¿En qué consiste el análisis por componentes principales?

Es un método que busca interrelaciones entre n variables numéricas, en este caso


es posible que con solamente algunas de estas variables se obtenga un resumen
de la información que describa en su mayoría a toda la información (disminución
de dimensiones) obteniendo patrones de asociación entre las variables originales
o simplemente con la obtención de nuevas variables que sirvan para analizar las
posteriores.

El análisis de componentes principales puede utilizarse para obtener conceptos


que no son medibles a partir de variables que si son medibles. Estos resultan de
combinaciones lineales de las variables originales, el primer componente es el
que más resume la información que define una nueva dirección a lo largo de la
cual las proyecciones de los datos tienen la mayor dispersión, el segundo
componente principal es una nueva combinación lineal no correlacionada con el
primero que recoge la mayor cantidad de información que no recogió el primero y
así sucesivamente hasta recoger igual número de componentes principales como
variables originales se tengan.

Conceptos fundamentales para la construcción de componentes principales

𝑆𝑒𝑎𝑛 𝑥1 , 𝑥2 , 𝑥3 , … , 𝑥𝑛 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠 𝑛𝑢𝑚é𝑟𝑖𝑐𝑎𝑠


𝑆𝑒 𝑞𝑢𝑖𝑒𝑟𝑒 𝑐𝑜𝑛𝑡𝑟𝑢í𝑟 𝑦1 , 𝑦2 , 𝑦3 , … , 𝑦𝑛 𝑐𝑜𝑚𝑏𝑖𝑛𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑙𝑖𝑛𝑒𝑎𝑙𝑒𝑠 𝑛𝑜 𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑑𝑎𝑠 𝑒𝑛𝑡𝑟𝑒 𝑠í

𝑆𝑒𝑔ú𝑛 𝑒𝑙𝑙𝑜 𝑒𝑙 𝑝𝑟𝑖𝑚𝑒𝑟 𝑐𝑜𝑚𝑝𝑜𝑛𝑒𝑛𝑡𝑒 𝑝𝑟𝑖𝑛𝑐𝑖𝑝𝑎𝑙 𝑦1 𝑠𝑒 𝑒𝑥𝑝𝑟𝑒𝑠𝑎 𝑐𝑜𝑚𝑜:

𝑦1 = 𝑢11 𝑥1 + 𝑢12 𝑥2 + ⋯ + 𝑢1𝑛 𝑥𝑛

Para que Y1 capte la mayor variabilidad de los datos los coeficientes de


combinación lineal que la forman deben ser coordenadas del eigenvector u1 de
la matriz de covarianzas de las variables originales, que corresponde al mayor
eigenvalor λ1 y así sucesivamente para los posteriores componentes principales
hasta llegar al n-ésimo eigenvector y eigenvalor.

Las combinaciones lineales:

𝑦1 = 𝑢11 𝑥1 + 𝑢12 𝑥2 + ⋯ + 𝑢1𝑛 𝑥𝑛

𝑦2 = 𝑢21 𝑥1 + 𝑢22 𝑥2 + ⋯ + 𝑢2𝑛 𝑥𝑛

𝑦𝑛 = 𝑢𝑛1 𝑥1 + 𝑢𝑛2 𝑥2 + ⋯ + 𝑢𝑛𝑛 𝑥𝑛

Matricialmente:

𝑦1 = 𝑈 𝑡 𝑋

𝑋 = 𝑈𝑌

La varianza de cada componente principal Y es igual al eigenvalor λ𝑛

La suma de los elementos de la diagonal de la matriz de covarianzas de las


variables originales es igual a la suma de los eigenvalores de los componentes
principales.
Estandarizando, la suma de los eigenvalores es igual al número de variables
originales, si la información que contienen las variables está medida por la suma
de sus varianzas, se tendrá que también se puede obtener la información con la
suma de los eigenvalores, donde los primeros serán los que obtienen mayor
información (la gran parte de la suma de las varianzas) con lo que no
necesariamente se necesitan los n variables originales para tener gran parte de
la información, de esta manera se logra la reducción de dimensión.

La correlación entre la variable Xk con el componente principal Yi es:

𝑢𝑖𝑘 √𝜆𝑖
𝜌(𝑌𝑖, 𝑋𝑘) = =
𝜎𝑘

Elección del número de componentes principales

En la práctica se sugiere considerar el número de componentes principales que


retenga entre el 70% y 90% de la variación total.

Interpretación de los componentes principales

Se consideran las variables originales con las cuales el componente tiene mayor
correlación, el significado de estas variables es transferido a los componentes
principales.

Observaciones respecto a los resultados

Es posible utilizar las covarianzas y correlaciones muestrales, sin embargo, se


debe proceder con cuidado pues la muestra debe ser lo suficientemente
representativa.

Análisis de conglomerados

Introducción
También conocido como taxonomía numérica tiene como objetivo el
agrupamiento de individuos u objetos en clases a partir de mediciones realizadas
entre ellos de tal manera que dentro de los grupos se reúnan los elementos más
homogéneos.

Técnica jerárquica aglomerativa

1.-Se parte de tantos conglomerados como elementos existan

2.-Se calculan las distancias entre los conglomerados iniciales

3.-Con los dos conglomerados más próximos se forma un nuevo grupo

4.-Con los nuevos elementos se procede como en los pasos 2 y 3 hasta obtener
un solo grupo con todos los elementos

5.-Mediante un diagrama llamado dendograma se lleva a cabo la partición de los


elementos

Límites a los métodos no jerárquicos

Las soluciones varían significativamente cuando se quitan algunos atributos

Los datos atípicos influyen sensiblemente en los resultados

El método de las K medias

Técnica no jerárquica forman conglomerados cuyo número K es previamente


fijado

Suponiendo que se tiene una muestra de N elementos definidas por P variables


numéricas se forman al azar k grupos y para cada uno se calculan los centroides
o coordenadas donde que son las medias aritméticas de las P variables
Usando la distancia euclidiana se calcula la distancia de cada elemento al
centroide respectivo, reasignándolos al grupo cuyo centroide es más cercano, los
nuevos centroides de los nuevos grupos formados se recalculan

Si la distancia entre los centroides iniciales y los nuevos es pequeña el proceso


termina

Número de conglomerados

La recomendación es iniciar el agrupamiento con el método jerárquico y utilizar


un número k de conglomerados que sean interpretables, posteriormente utilizar
un método no jerárquico usando el número de conglomerados obtenido
anteriormente.

Es recomendable a lo más tener ocho grupos.

Variables estandarizadas y categóricas

Las medidas de distancia pueden ser altamente influenciadas por las unidades
de medida de cada variable lo que significa que las variables con mayores
unidades tienen mayor influencia en la distancia, por lo cual acostumbra
estandarizar previamente las variables.

Validación de los conglomerados

La técnica de agrupamiento deberá producir conglomerados que internamente


sean homogéneos pero heterogéneos entre ellos.

Producir aglomeraciones que aporten información para los fines propuestos por
el investigador

Interpretación de resultados
Además de interpretar los conglomerados formados de acuerdo a las
características dependientes de las variables, podemos apoyarnos de variables
categóricas que aunadas con los resultados numéricos permitirán asociaciones
que arrojen conclusiones más concretas.

Análisis discriminante

Introducción

Se dispone de dos o más grupos de elementos para los cuales se conocen los
valores de diversas variables numéricas y la tarea es reconocer a la o las variables
que mejor discriminan a los elementos.

A su vez se permite clasificar nuevos elementos en uno de los grupos disponibles.

Análisis discriminante lineal

En este análisis la variable dependiente es una variable categórica.

El objetivo de del análisis discriminante es crear nuevas variables que separen a


los elementos en categorías de la variable dependiente, si la variable dependiente
tiene k categorías el número de nuevas variables discriminantes deberá ser de k
menos 1

Discriminante lineal de Fisher para dos grupos

Supongamos que se tienen dos grupos con características numéricas X1…Xn, y


la categoría Y a la que pertenecen, la idea es encontrar una combinación lineal
de las variables numéricas originales, que mejor separe a los elementos el primer
grupo de los elementos del segundo grupo.

𝑍 = 𝑎1 𝑥1 + 𝑎2 𝑥2 + ⋯ + 𝑎𝑛 𝑥𝑛
Este procedimiento en el sentido de que la distancia entre las medias de los
valores de Z que le corresponden a cada grupo sea máxima, supuesto que se
satisface con:

𝑍 = (𝜇1 − 𝜇2 )𝑡 ∗ Σ −1 ∗ 𝜒

Donde M1 y M2 son los vectores de las medias de las variables X1, X2, …, Xn
en los grupos respectivos

Esta combinación lineal es conocida como el discriminante lineal de Fisher

Regla de clasificación y la DLdF

1.- Se estiman los centroides (vector de medias de las variables)

2.-Se proyecta cada centroide a la discriminante lineal de Fisher, las proyecciones


respectivas Zn se obtienen reemplazando las coordenadas de los centroides en
la discriminante lineal.

3.-A partir de las proyecciones se calcula un punto medio M

4.- Si para un nuevo vector de variables Xo, el elemento se ubica en el grupo 1 si


al reemplazar los componentes de Xo en el discriminante lineal de Fisher resulta
un valor menor o igual a M, de otra manera se ubica en el otro grupo.

𝑥0 = 𝑥01, 𝑥02, , … , 𝑥0𝑛

𝑎1 𝑥01 + 𝑎2 𝑥02 + ⋯ + 𝑎𝑛 𝑥0𝑛 ≤ 𝑀

Você também pode gostar