Você está na página 1de 2

UNIVERSIDAD NACIONAL DE COLOMBIA SEDE MEDELLN ESCUELA DE ESTADSTICA - SEMESTRE 2010-02 TRABAJO DE ESTADSTICA II (20%) FECHA DE ENTREGA: OCTUBRE

E 25 DE 2010 HASTA LAS 5PM EN LA SECRETARA DE LA ESCUELA DE ESTADSTICA (43-107)

Objetivos: 1. Usar de manera eficiente las herramientas del anlisis de regresin para resolver un problema prctico. 2. Aprender a usar el SAS para hacer el anlisis de regresin. Presentacin del Problema. En un estudio a gran escala realizado en EE.UU sobre la eficacia en el control de infecciones hospitalarias se recogi informacin en 113 hospitales. A su equipo de trabajo le corresponde analizar una muestra de tamao 80 tomada aleatoriamente de esa base. Los datos estn etiquetados en la forma Equipo##, donde ## es el nmero de equipo dado por su profesor. Cada base de datos (en formato SAS) contiene las siguientes columnas:
Abr. y Nombre de la variable ID: Nmero de Identificacin Y: Riesgo de Infeccin X1: Duracin de la estada X2: Edad X3: Rutina de Cultivos X4: Rutina de rayos X X5: Nmero de Camas X6: Censo promedio diario X7: Nmero de Enfermeras X8: Facilidades disponibles y servicios W1: Afiliacin a Escuela de Medicina W2: Regin Descripcin Nmero de Identificacin de cada observacin (hospital) Probabilidad promedio estimada de adquirir infeccin en el hospital (en porcentaje) Duracin promedio de la estada de todos los pacientes en el hospital (en das) Edad promedio de los pacientes (en aos) Razn del nmero de cultivos realizados en pacientes sin sntomas de Infeccin hospitalaria, por cada 100 Razn del nmero de rayos-X realizados en pacientes sin sntomas de Neumona, por cada 100 Nmero promedio de camas en el hospital durante el periodo del estudio Nmero promedio de pacientes en el hospital por da durante el periodo del estudio Nmero promedio de enfermeras, equivalentes a tiempo completo, durante el periodo del estudio. Porcentaje de 35 potenciales facilidades y servicios que son proporcionados por el hospital. 1= Si 2= No Regin Geogrfica, donde 1=NE, 2=NC, 3=S 4=O

Preguntas a resolver. 1. Estime un modelo de regresin mltiple que explique el Riesgo de Infeccin en trminos de todas las variables predictoras de tipo numrico cuantitativas. Escriba la ecuacin ajustada e interprete el coeficiente de determinacin. Escriba las hiptesis y los estadsticos de prueba de la significancia del modelo y de cada uno de los parmetros. Para cada prueba establezca el criterio de decisin y concluya en terminos del problema original. 2. A partir de las cuatro variables predictoras cuantitativas con los valores p ms pequeos (o con los valores t ms grandes), consideradas ahora como constitutivas de un modelo completo, use el mtodo de todas las regresiones posibles, para seleccionar el mejor submodelo segn los criterios R2p, R2Aju,p ( MSEp) y Cp. Si hay diferencia entre ellos, exponga razones acerca del contexto en el cual usara cada submodelo resultante.

3. A partir del modelo completo usado en 2., aplique la tcnica de seleccin paso a paso (stepwise) registrando cada paso en forma manual. Escriba la ecuacin del modelo final y el R2. Existe diferencia entre este modelo y los obtenidos en el punto anterior? Comente. Nota: Utilice la salida de SAS de todas las regresiones posibles. 4. Determine si existe o no, algn problema de multicolinealidad en el modelo seleccionado en el punto anterior. En el caso de existir tal problema, diga si ste es moderado o grave. 5. Examine los problemas de valores atpicos, de balanceo e influenciales, en el mismo modelo del punto anterior. En el caso de que existan, investigue y explique brevemente qu tratamientos se pueden utilizar para resolver dichos problemas. 6. De los cuatro modelos seleccionados anteriormente (puntos 2 y 3), seleccione el que considere mejor predictor y realice para l un anlisis de residuales para validar los supuestos sobre los errores del modelo. Use ahora variables indicadoras para adicionar las variables cualitativas: W1: Afiliacin a Escuela de Medicina, y W2: Regin, al modelo por ustedes escogido (para ello utilice el modelo sin interacciones). Ajuste dicho modelo, escriba la ecuacin de regresin ajustada, el R2, y en forma resumida el anlisis de significancia del modelo y de los coeficientes. Escriba las distintas ecuaciones que se pueden estudiar e interprete sus parmetros estimados. 7. Use el modelo ajustado en 6. para estimar dos intervalos (uno de confianza y el otro de prediccin) del 90% para el riesgo de infeccin (promedio y futuro, respectivamente) en dos hospitales con las caractersticas consignadas a continuacin.
Equipo Hospital X1 114 10.68 1 115 12.18 X2 56.8 44.7 X3 16.7 60.5 X4 79 85.8 X5 186 640 X6 151 399 X7 129 360 X8 40 60 W1 2 1 W2 3 2

Você também pode gostar