Você está na página 1de 19

1

VI Escuela de Verano
CEAES-Universidad del Valle
Santiago de Cali, Noviembre 7-9 de 2013

Consumo de bebidas energizantes en estudiantes de la Universidad
Nacional de Colombia-Sede Medelln: Modelacin usando muestreo y
modelos lineales generalizados







RESUMEN

Con el fin de conocer los hbitos de los estudiantes y dar informacin clara y concisa acerca del riesgo de abusar de
las bebidas energizantes, se realiza un diseo de muestreo en dos etapas, estratificando primero por facultades y
luego por carreras, y usando la asignacin del tamao muestral proporcional a la cantidad de estudiantes en el
marco muestral considerado, estudiantes matriculados del semestre 01-2013, tanto por las cinco facultades como
por carrera. Luego se escoge de manera completamente aleatoria una muestra de 340 estudiantes de cada una de
las 26 carreras y se encuestan telefnicamente. Con los datos recolectados se hace un anlisis descriptivo del
porcentaje de estudiantes que consumen bebidas energizantes, entre otras variables, por ejemplo la frecuencia de
consumo, el semestre, el nmero de materias, la edad. Adicionalmente se estiman, usando el diseo de muestreo,
diferentes proporciones, entre ellas, la proporcin de estudiantes que ingieren bebidas energizantes y el respectivo
intervalo de confianza. Despus se procede a modelar la proporcin de inters a partir de algunas de las variables
registradas en la encuesta aplicada, teniendo en cuenta el muestreo hecho previamente y con ayuda de los
paquetes survey y la funcin svyglm del software estadstico R. Se utilizan las opciones del modelo lineal
generalizado; familia quasibinomial. Se evalan tres diferentes modelos: el logstico, el log--logstico y el probit y se
escoge el mejor modelo a partir de la significancia de los parmetros aplicando seleccin backward y se realizan las
pruebas respectivas para la seleccin del mejor modelo.

1. INTRODUCCIN

Conocer la proporcin de personas en el entorno acadmico que consumen bebidas energizantes puede ser de gran
inters para la Universidad, ya que la mayora de personas ven esto como algo normal, pero no se detienen a pensar
si estas bebidas a largo plazo pueden afectar la salud mental y fsica de los estudiantes.
Se ha dicho que las bebidas energizantes causan dependencia en las personas, sobre todo aquellas que son ms
propensas a pasar largas horas haciendo trabajos acadmicos o laborales, sin embargo no existe un estudio
concreto que determine cules son las razones o los factores principales que llevan a que un estudiante universitario
convierta esto en una dependencia o adiccin.
Estudios previos acerca del consumo de bebidas energizantes han registrado que trastornan las funciones
cardacas, provocan hipertensin, hiperactividad, dilatacin de pupila y cambios de humor inesperados.
Todo esto es importante tomarlo en cuenta para que la Universidad piense en tomar medidas o hacer campaas de
prevencin para controlar su consumo y concientizar a los estudiantes sobre todas las consecuencias que puede
llevar el consumo descontrolado de ellas.
Este trabajo se ha dividido en cinco secciones. En la primera seccin se describe el diseo de muestreo empleado
para la recoleccin de los datos de inters. Luego, en la seccin 2, se hace un breve anlisis descriptivo donde se
hace nfasis en la informacin ms relevante para la comunidad universitaria como identificar las facultades ms
propensas para el consumo de bebidas energizantes y determinar las marcas de mayor preferencia. En la tercera
seccin se procede a calcular las respectivas estimaciones de las proporcionales de inters para el estudio con sus
respectivos intervalos de confianza y frmulas para la estimacin de ellos. En la cuarta seccin se presentar la
2

modelacin mediante el modelo lineal generalizado para encontrar el mejor modelo que describa la probabilidad de
que un estudiante de la Universidad Nacional de Colombia Sede Medelln consuma bebidas energizantes. Entre los
modelos usados estn el Logstico, el Loglogstico y el Probit, pero aplicando el diseo de muestreo empleado en el
estudio. Para la eleccin del mejor modelo, se aplicar el procedimiento backward para la eleccin de las variables
explicativas del modelo e identificacin de los datos outliers por medio de la distancia de Cook; adems, entre los
tres modelos propuestos se escoger el mejor, es decir, el que presente el menor deviance.

2. MUESTREO

2.1. Planteamiento del problema

Con base en la encuesta realizada a los estudiantes de pregrado de la Universidad Nacional de Colombia Sede
Medelln, se busca dar respuesta a una serie de preguntas planteadas por los estudiantes del curso de Muestreo
Estadstico, las cuales sern indispensables para determinar la frecuencia con la que se consumen bebidas
energizantes en la Universidad. Adems, este trabajo se espera pueda servir como referencia para la realizacin de
estudios futuros para la implementacin de campaas para el control del consumo de bebidas energizantes, o
informar a la comunidad universitaria sobre sus contraindicaciones, efectos o dependencias.

2.2. Elementos del diseo de muestreo

Poblacin objetivo: Todos los estudiantes de pregrado de la Universidad Nacional de Colombia Sede Medelln que
se matricularon durante el semestre 2013-1.
Poblacin susceptible de ser muestreada: Los estudiantes de pregrado de la Universidad Nacional de Colombia
Sede Medelln que se matricularon durante el semestre 2013-1 y que viven en el rea Metropolitana, es decir, los
que se encuentran en el marco muestral.
Unidades de Muestreo: Cada uno de los estudiantes matriculados en el semestre 2013-1, pertenecientes al marco
de muestreo, construido a continuacin.

2.3. Elaboracin del marco de Muestreo

El marco muestral se construy a partir de la lista de estudiantes de pregrado con sus respectivos nmeros de
telfono
1
. Se procede a depurar la base de datos eliminando aquellos registros de telfonos correspondientes a larga
distancia asociados con el lugar de residencia habitual del estudiante a su ingreso a la Universidad ya que era
altamente probable que el estudiante no se localizara all. Se realizaron las llamadas telefnicas a una muestra
aleatoria de estudiantes de la lista de nmeros telefnicos.

2.4. Diseo de muestro utilizado

El diseo de muestreo utilizado consisti en realizar estratificacin por facultades, teniendo en cuenta todas las
facultades que conforman a la Universidad Nacional de Colombia Sede Medelln (Arquitectura, Ciencias, Ciencias
Agrarias, Ciencias Humanas y Minas), y en cada una de las facultades se hizo estratificacin por carrera teniendo en
cuenta todas las carreras pertenecientes a cada facultad, donde posteriormente, de cada carrera se tom una
Muestra Aleatoria Simple de estudiantes.
En la Tabla 1 se muestra el listado de las facultades y las carreras adscritas a cada facultad, adems el nmero de
estudiantes por carrera que estaban considerados en el marco muestral y el tamao de muestra obtenido en la
muestra piloto.



1
Base de datos suministrada por la Universidad con propsitos acadmicos.

3


Facultad Carrera
Tamao de muestra Total de
Estudiantes
Arquitectura (39)
Arquitectura
21 446
Artes Plsticas
7 135
Construccin
11 103
Ciencias (38)
Estadstica
8 180
Ingeniera Biolgica
15 282
Ingeniera Fsica
8 188
Matemticas
7 107
Ciencias Agrarias (42)
Ingeniera Agrcola
8 167
Ingeniera Agronmica
10 201
Ingeniera Forestal
11 228
Zootecnia
13 265
Ciencias Humanas (35)
Ciencia Poltica
14 223
Economa
11 201
Historia
10 182
Minas (186)
Ingeniera Administrativa
29 574
Ingeniera Ambiental
6 115
Ingeniera Civil
26 532
Ingeniera de Control
11 209
Ingeniera De Minas y Metalurgia
6 108
Ingeniera de Petrleos
8 149
Ingeniera de Sistemas e Informtica
22 396
Ingeniera Elctrica
10 197
Ingeniera Geolgica
9 171
Ingeniera Industrial
21 434
Ingeniera Mecnica
21 398
Ingeniera Qumica
17 338
Tabla 1. Listado de Facultades (nmero de estudiantes en la muestral), carreras, tamao de muestra y nmero total
de estudiantes, Universidad Nacional de Colombia Sede Medelln.

2.5. Metodologa para la obtencin de la informacin

La obtencin de la informacin se realiz por medio de llamadas telefnicas, las cuales fueron avisadas previamente
a toda la comunidad universitaria a travs del correo Institucional, esto con el fin de facilitar y garantizar el xito de
las encuestas.
Este muestreo se pudo llevar a cabo gracias a la colaboracin del personal del rea de Planeacin de la Universidad
Nacional de Colombia Sede Medelln, quienes le facilitaron la informacin al profesor encargado del curso de
Muestreo Estadstico, para que l generara muestras aleatorias y los estudiantes del curso de muestreo estadstico
del semestre 2013-1 hicieran efectivas las encuestas a los estudiantes, el formato de la encuesta se encuentra en el
Anexo 1. Se indag entre otras variables por: el gnero, la edad, el estrato socioeconmico, el semestre, las
materias, la carrera, la actividad deportiva, y se hicieron varias preguntas para saber si se consume algn tipo de
bebida energizante, la frecuencia con la cual se consume y el tipo de marca de bebida energizante que ms han
consumido durante el semestre donde se realiz la encuesta.
4

Para poder hacer las estimaciones correspondientes, se determin el nmero de estudiantes a encuestar por
carrera, para ello se realiz un muestreo piloto tomando una muestra inicial de 170 estudiantes, asignada de manera
proporcional al nmero de estudiantes matriculados por carrera, a partir de este estudio piloto se hall el tamao
muestral para llevar a cabo la muestra real.

Se procedi de la siguiente manera para la obtencin, va telefnica de la informacin: Para cada una de las carreras
de cada una de las facultades, se realizan las llamadas telefnicas a la muestra aleatoria de estudiantes, y se les
realiza la respectiva encuesta. Aquellos nmeros equivocados o no asignados, o donde no contestaron (despus de
realizar al menos dos llamadas en horarios distintos) se reemplazan por otros nmeros seleccionados aleatoriamente
del marco muestral considerado.
En la realizacin de las encuestas se presentaron diversos problemas, el mayor de ellos fue la falta de disposicin de
los estudiantes por responder la encuesta.
Al final se unific la informacin recolectada por cada estudiante (17 estudiantes del curso de muestreo), y se hizo el
clculo del tamao de muestra arrojando un valor de 340 encuestas efectivas. Se procede a completar la muestra y
con los datos obtenidos por los encuestadores se tabulan para crear la base de datos definitiva a partir de la cual se
realizan las respectivas estimaciones.
A continuacin se realiza un breve anlisis descriptivo de la informacin recolectada en las encuestadas, haciendo
nfasis especial en el consumo de bebidas energizantes.

3. ANLISIS DESCRIPTIVO

En la Figura 1 se observa que la mayor cantidad de estudiantes que consumen bebidas energizantes se encuentran
matriculados entre el cuarto y el sexto semestre, pero no se ven diferencias evidentes entre los otros semestres.
Esto se corrobora en la Tabla 2.


Figura 1. Proporcin de estudiantes que consumen bebidas energizantes por semestre en el que se encuentra matriculado.






1 2 3 4 5 6 7 8 9 10
Proporcin de consumo de
energizantes por semestre
0
.
0
0
.
1
0
.
2
0
.
3
0
.
4
0
.
5
0
.
6
0
.
7
5

Consumo de Bebidas Energizantes
Semestre Proporcin
1 36,76%
2 36,36%
3 41,94%
4 59,26%
5 54,55%
6 57,58%
7 51,43%
8 46,43%
9 45,83%
10 46,67%

Tabla 2. Porcentaje de estudiantes que consumen bebidas energizantes por semestre en el cual se encuentra matriculado.

Ahora, se presentan algunos grficos para analizar cmo se comporta determinada variable teniendo en cuenta la
frecuencia con la que se presenta el consumo de bebidas energizantes de los estudiantes encuestados de la
Universidad Nacional de Colombia Sede Medelln.

En la Figura 2 se muestra que los estudiantes hombres que fueron encuestados consumen bebidas energizantes con
mayor frecuencia que las mujeres, sin importar si lo hacen diariamente, semanalmente, espordicamente o si slo
fue por curiosidad, adems se aprecia que la mayora de la poblacin consume bebidas muy espordicamente sin
importar el gnero.


Figura 2. Porcentaje de la frecuencia de consumo de bebidas energizantes por gnero.

En la Figura 3 se observa que la mayora de estudiantes encuestados consume bebidas energizantes de manera
espordica, pero se percibe que para todas las frecuencias de consumo, aquellos que tienen ms de 21 aos de
edad son quienes, en su mayora, consumen bebidas energizantes.


Todos los dias 1Xsemana Esporadicamente 1XCuriosidad Otra
Mujer
Hombre
Porcentaje de frecuencia
de consumo por genero
0
.
0
0
.
1
0
.
2
0
.
3
0
.
4
0
.
5
6


Figura 3. Porcentaje de frecuencia de consumo de bebidas energizantes por edad, estudiantes encuestados Universidad
Nacional de Colombia Sede Medelln.

En la Figura 4 se observa que los estudiantes que son de estrato tres son los que ms consumen bebidas
energizantes, pero tambin se aprecia que la mayor parte de la comunidad universitaria consume bebidas
energizantes espordicamente.

Figura 4. Porcentaje de frecuencia de consumo de bebidas energizantes de los estudiantes encuestados por estrato
socioeconmico, estudiantes encuestados Universidad Nacional de Colombia Sede Medelln.

En la Figura 5 se observa que la mayor cantidad de estudiantes encuestados que consumen bebidas energizantes
pertenecen a la facultad de Ciencias Agrarias, y, similar a la Figura 4, la mayor parte de los estudiantes consumen
bebidas energizantes espordicamente, aunque se nota que hay una cantidad considerable de estudiantes que han
consumido bebidas energizantes durante el semestre 2013-1 simplemente por curiosidad.


7


Figura 5. Porcentaje de frecuencia de consumo de bebidas energizantes de los estudiantes encuestados por facultad,
estudiantes encuestados Universidad Nacional de Colombia Sede Medelln.

Adicionalmente se observa que el 39.38% de los estudiantes encuestados matriculados en el primer semestre
consumen bebidas energizantes de manera espordica o por curiosidad. En los estudiantes de semestres
intermedios (4-7) se nota que alrededor del 65% de ellos consumen bebidas energizantes con una frecuencia
semanal, ver Tabla 3.

Frecuencia
Semestre 1XSemana Espordicamente 1XCuriosidad
1 11,76% 15,24% 24,14%
2 NA 12,38% 10,34%
3 5,88% 8,57% 10,34%
4 11,76% 6,67% 20,69%
5 23,53% 11,43% 3,45%
6 11,76% 11,43% 13,79%
7 17,65% 12,38% 6,90%
8 5,88% 9,52% 3,45%
9 5,88% 7,62% 3,45%
10 NA 4,76% 3,45%

Tabla 3. Porcentaje de la frecuencia de estudiantes que consumen bebidas energizantes dependiendo del semestre, estudiantes
encuestados Universidad Nacional de Colombia Sede Medelln.

A continuacin se presentan algunos grficos para analizar cmo se comporta determinada variable teniendo en
cuenta la marca de bebidas energizantes que consumen los estudiantes de la Universidad Nacional de Colombia
Sede Medelln.

En la Figura 6, se observa que los estudiantes hombres encuestados son quienes consumen bebidas energizantes
en mayor porcentaje que las mujeres, sin importar el tipo de bebida, adems se aprecia que la mayora de la
8

poblacin consume bebidas de la marca Vive 100 y Red Bull y que hay un caso en el que las mujeres consumen
ms bebidas energizantes que los hombres respecto a la marca StarBien.

Figura 6. Proporcin de marca ms consumida por gnero, estudiantes encuestados Universidad Nacional de Colombia Sede
Medelln.

Tambin, es de observar que la mayor cantidad de los estudiantes encuestados que consumen bebidas energizantes
son de la Facultad de Minas independiente de la marca de bebida energizante que consuman (ver Figura 7).
Igualmente, como en la Figura 6, se tiene la misma tendencia de consumo de la bebida energizante Vive 100 y Red
Bull.

Figura 7. Proporcin de estudiantes que consumen determinada marca discriminados por facultad, estudiantes encuestados
Universidad Nacional de Colombia Sede Medelln.

4. ESTIMACIONES

En esta seccin se muestra la estimacin puntual y por intervalos de las siguientes tres proporciones de inters,
entre otras, teniendo en cuenta el diseo de muestreo utilizado:
9

Proporcin de Estudiantes de la Universidad que durante el semestre 2013-1 han ingerido Bebidas
Energizantes.

Proporcin de Estudiantes que han ingerido Bebidas Energizantes todos los das o una vez a la
semana.

Proporcin de Estudiantes que han ingerido Bebidas Energizantes espordicamente o una sola
vez por curiosidad.

Para la estimacin puntual, se utilizan las siguientes expresiones, ver Scheaffer y Mendenhall (2007).

Denote por:



Donde es el total estimado de estudiantes que cumplen con el atributo de inters y

el total estimado de
estudiantes de la carrera i-sima que cumplen con el atributo.

( )


Donde

es el nmero total de estudiantes en la carrera i-sima,

es el nmero de estudiantes muestreados en


la carrera i-sima y

es el valor del atributo de inters del j-simo estudiante de la carrera i-sima.



Y el respectivo intervalo de confianza est dado por:

)

Donde


y en este caso

denota la estimacin del total de estudiantes que cumplen con el atributo j=1, 2, 3, asociados a
las probabilidades de inters dadas inicialmente.

En la tabla 4 se presenta las estimaciones de los totales, las proporciones, las varianzas estimadas y los intervalos
de confianza respectivos.

Proporcin

()

) I.C.

( )

()

()

Tabla 4. Estimaciones puntuales y por intervalo de las tres proporciones de inters.

10

Con base en la muestra de estudiantes encuestados se estima que el 46.55 % de los estudiantes de la Universidad
Nacional de Colombia, matriculados en el semestre 2013-1 han ingerido bebidas energizantes, y con una confianza
del 95% dicho porcentaje se encuentra entre el 41.4% y 51.7%. Adicionalmente se estima que el 13.28 % de los
estudiantes de la Universidad Nacional de Colombia, matriculados en el semestre 2013-1 han ingerido bebidas
energizantes todos los das o una vez a la semana, y con una confianza del 95% dicho porcentaje se encuentra entre
el 7.98% y 18.57%. Se estima que el 86.45 % de los estudiantes de la Universidad Nacional de Colombia,
matriculados en el semestre 2013-1 han ingerido bebidas espordicamente o una sola vez por curiosidad, y con una
confianza del 95% dicho porcentaje se encuentra entre el 79.97% y 90.95%.

MODELOS LINEALES GENERALIZADOS

En la seccin anterior se estimaron las proporciones de inters. Ahora se har una aplicacin de los modelos lineales
generalizados con el fin de determinar de qu factores o variables depende la probabilidad de que una persona
ingiera o no bebidas energizantes. Para ello inicialmente se deducir la expresin para los estimadores de los
parmetros y de la varianza estimada de cada uno de ellos, teniendo en cuenta los pesos del diseo de muestreo
utilizado.

Denote por:

para indicar que el i-simo estudiante consume o no bebidas energizantes, respectivamente,


denotar el vector de variables incluidas en el modelo para el i-simo estudiante donde es el vector de parmetros
del modelo de tamao .

Adems, denote por:

: Conjunto de ndices de la poblacin * | +
Espacio muestral * | +

es el subconjunto de la poblacin correspondiente a los estudiantes que no ingieren bebidas energizantes, es


decir:

* |

+,

es el subconjunto de la poblacin correspondiente a los estudiantes que ingieren bebidas energizantes, es decir:

* |

es el subconjunto del espacio muestral correspondiente a los estudiantes que no ingieren bebidas energizantes,
es decir:

*|

es el subconjunto del espacio muestral correspondiente a los estudiantes que ingieren bebidas energizantes, es
decir:

*|

+.

En general, se cuenta para cada estudiante de la muestra, con valores (

)

En general, se modela la probabilidad de que un estudiante elegido aleatoriamente consuma o no consuma bebidas
energizantes mediante la siguiente expresin:
11


(

) (

) ()

es el nmero total de estudiantes en la muestra (340), (

) es alguna de las transformaciones Logit, LogLogit


o Probit. Ver Tabla 5.

Logit LogLogit Probit
(

) (

)

Tabla 5. Funciones Logit, Log logit y Probit.

Utilizando el estimador de mxima verosimilitud para se tiene que

() (

) ( (

)

El estimador mximo verosmil de se halla al resolver la siguiente ecuacin:

()

.

De donde:
,

)-


siendo:

,(

)( (

))-

.

Ahora, incluyendo los pesos del diseo de muestreo para cada estudiante, se tiene que

,

)-

.

Donde

es la probabilidad de seleccin del estudiante i-simo dependiendo de la carrera, bajo el diseo de


muestreo utilizado, este valor es:

()

()
es el nmero de estudiantes de la carrera a la que pertenece el i-simo estudiante, ver Tabla 1 y


es la cantidad total de estudiantes en el marco muestral utilizado de la Universidad Nacional de Colombia Sede
Medelln.

Sea
() ,

)-



12

() ,

)-

) donde es la solucin de la ecuacin

() y se asume que existe una nica solucin


que es

tal que

) .

Ahora, para encontrar la aproximacin de la varianza de los estimadores utilizando la expansin por series de Taylor
para

) alrededor del punto

donde es desconocido, se tiene que

()

()

.

Lo cual da como resultado una matriz donde los elementos ( ) son

()



Utilizando

) y la expansin de series de Taylor de orden 1 se tiene que



()

()(

)

Y despejando

se tiene que



()

() y se asume que

() es la inversa de la matriz

().

Aplicando varianza al resultado anterior

(

) (

()

())

(

) [

()][

()][

()]

[

()]()[

()]

(2)

Donde () es la matriz que contiene los elementos , denotados como

()

()/ (,

)-

) ,

)-

)

Sea

, y utilizando el estimador de Horwitz-Thompson se tiene:


)

Como es desconocido, se estima ()

) (3)

Asumiendo consistencia y estimando

), se obtiene de reemplazar () en () lo siguiente


13

) [

(

)]

)[

(

)]




Imputacin de datos

Durante el estudio descriptivo se observ que haba un dato faltante para una observacin en la cantidad de
materias matriculadas, por lo tanto se procedi a estimarlo por el mtodo de imputacin Hot Deck, es decir que se
reemplaz con el dato ms similar respecto a la carrera, el sexo y el semestre. Despus de realizar la imputacin de
este dato faltante, la observacin fue tomada como una observacin regular dentro del modelo.

Datos extremos

Para determinar los datos extremos se utiliz la agrupacin por cluster (Vecino ms cercano).


Figura 8. Agrupacin por Materias



14


Figura 9. Agrupacin por Semestre

Figura 10. Cluster por Materias y Semestre

Luego, se tiene que los datos ms extremos son el 71, 115, 181, 24 y 254.

Backward

Con este mtodo para la depuracin de variables, se tom el modelo completo (con las variables edad, materias,
deporte, estrato, gnero y semestre) y se eliminaron de manera consecutiva las variables edad, materias, deporte y
estrato socioeconmico, para los tres modelos Logit, LogLogit y Probit. Los modelos que quedaron dependen de las
variables gnero y semestre. Luego, dependiendo de los nuevos modelos, se realiz para determinar los outliers el
mtodo de la Distancia de Cook.






15

Logit


Figura 11. Distancia de Cook para el modelo Logit.

LogLogit


Figura 12. Distancia de Cooks para el modelo LogLogit.







16

Probit

Figura 13. Distancia de Cook para el modelo Probit.

Con este mtodo se determina que las observaciones 23, 181, 249 y 269 son outliers, por lo tanto se procede a
eliminarlas de la muestra y no se tienen en cuenta para las estimaciones de los parmetros de los modelos. Los
modelos resultantes fueron los siguientes:




Modelo Lineal Generalizado Logit estimado:
(

) (




Estimate Std. Error t-value Pr(>|t|)


Intercept -0,93804 0,27506 -3,41 0,000736


Sexo 0,49301 0,23562 2,092 0,037219


Semestre 0,09316 0,0374 2,491 0,013272

Tabla 6. Estimadores del Modelo Logit.

Modelo Lineal Generalizado LogLogit estimado:

(

) ( (

))




Estimate Std. Error t-value Pr(>|t|)


Intercept -1,04529 0,21307 -4,906 1,51E-06


Sexo 0,35904 0,17984 1,996 0,0468


Semestre 0,06497 0,02735 2,376 0,0181

Tabla 7. Estimadores del Modelo LogLogit.

17

Modelo Lineal Generalizado Probit

(




Estimate Std. Error t-value Pr(>|t|)


Intercept -0,58829 0,16911 -3,479 5,76E-04


Sexo 0,30868 0,14579 2,117 0,035035


Semestre 0,05848 0,02321 2,519 0,012269

Tabla 8. Estimadores del Modelo Probit.

Clculo de los Deviance

Para elegir el mejor modelo se utiliz el criterio del Deviance:
[

) (

) (

)]



Donde

para cada modelo lineal generalizado es:



Logit LogLogit Probit

)


Tabla 9. Modelos para el Deviance


Luego
Deviance
Logit
LogLogit Probit
454,7588 455,1456 454,7089

Tabla 10. Resultados para los Modelos del Deviance.

As, el modelo que se escoge es el Probit ya que es el que presenta el menor Deviance, aunque se observa que los
tres modelos presentan valores del Deviance muy cercanos. Entonces, el mejor modelo para determinar la
probabilidad de que un estudiante consuma bebidas energizantes es

(



Donde

es el sexo del i-simo estudiante y

es el semestre en el que se encuentra el i-simo estudiante.









18

5. CONCLUSIONES

Al tener en cuenta todas las variables aplicadas en la encuesta, en el anlisis descriptivo se observ que los
estudiantes encuestados que consumen en mayor proporcin bebidas energizantes se encuentran cursando
alrededor del sexto semestre y lo hacen con una frecuencia semanal o espordica.

A partir de los tres diferentes modelos lineales generalizados (Logit, LogLogit y Probit) se tiene que el consumo de
bebidas energizantes en los estudiantes de la Universidad Nacional de Colombia Sede Medelln depende o se ve
afectado principalmente por el semestre y el gnero.

El consumo de bebidas energizantes en los estudiantes de la Universidad es independiente de la edad del estudiante
y de la prctica de algn deporte, ya que estas variables son las que presentan menor significancia dentro del
modelo.

Al emplear el mtodo de identificacin y eliminacin de datos outliers por la distancia de Cook, se aprecia que estas
observaciones pueden influir en la significancia del modelo.

Entre las dos variables explicativas del modelo, se aprecia que la variable que ms influye a la probabilidad de
consumir bebidas energizantes es el semestre, esto por un rechazo con ms fuerza de su valor-p para los tres
modelos lineales utilizados; luego la carga acadmica por semestre influye para que aumente o disminuya la
probabilidad de que los estudiantes consuman bebidas energizantes.

El mejor modelo lineal generalizado es el Probit ya que por un buen ajuste del criterio del deviance se obtuvo la
menor desviacin para determinar la probabilidad de que los estudiantes de la Universidad Nacional de Colombia
sede Medelln consuman bebidas energizantes.

AGRADECIMIENTOS

Los autores de este trabajo agradecen al funcionario, Daro Rico, Director de Planeacin de la Universidad Nacional
de Colombia Sede Medelln y a los encuestadores del curso de muestreo estadstico, semestre 01-2013: Ricardo
Bautista, Ana Mara Cardona, Milena Correa, Estefana Jimnez, Daniela Marn, Andrea Meja, Zaret Ortegn,
Adriano Polo, Andrea Restrepo, Gloria Ra, Esteban Ruiz, Isaac Snchez, Giovanny Soto, Estefana Uribe,
Alejandra Vanegas.

BIBLIOGRAFA

Falissard, Bruno (2012), Analysis of Questionnaire data with R, EdiCRC Press, 2012, p. 51-54, 89-97. ISBN 978-1-
4398-1766-7.

Sarndal, Carl; Swensson, Bengt; Wretman, Jan (1992), Model assisted survey sampling, Springer, 1992. Pgs 494-
500. ISBN 0-387-97528-4

Scheaffer, Richard; Mendenhall, William; Ott, Lyman (2007), Elementos de Muestreo, sexta edicin. Editorial
Thomson. 2007 ISBN 84-9732-493-5

19


Anexo 1

Você também pode gostar