Você está na página 1de 6

Guía Seminario Estadística Aplicada Nº 3

CORRELACION Y REGRESION

1. El editor en jefe de un importante periódico metropolitano ha intentado convencer al


dueño del periódico para que mejore las condiciones de trabajo en el taller de
prensas. Está convencido de que, cuando trabajan las prensas, el grado de ruido
crea niveles no saludables de tensión y ansiedad. Recientemente hizo que un
psicólogo realizara una prueba durante la cual los prensistas se situaron en cuartos
con niveles variables de ruido y luego se le hizo otra prueba para medir niveles de
humor y ansiedad. La siguiente tabla muestra el índice de su grado de ansiedad o
nerviosismo y el nivel de ruido al que se vieron expuestos. (1,0 es bajo y 10,0 es
alto).

Nivel de ruido 4 3 1 2 6 7 5 8
Grado de ansiedad 39 38 16 18 41 45 40 48

a) Represente gráficamente estos datos.

b) Desarrolle una ecuación de estimación que describa los datos.


y=4.393x+15.857
c) Pronostique el grado de ansiedad que podríamos esperar cuando el nivel de
ruido es 9.
y=4.393(9)+15.857
y=55.394
d) Calcule e interprete el coeficiente de correlación

R=0.899
El coeficiente de correlación puede adoptar valores desde -1 hasta 1. Si R es
+/- 1 o próximo a estos valores, decimos que el modelo lineal es adecuado
para describir los datos experimentales. Cuando R es cercano a 0 decimos que
una expresión lineal no es una buena descripción de los datos. Para este
caso el valor obtenido de R=0,899, entonces podemos decir que la
ecuación lineal de estimación es una buena representación de la
relación que existe entre el nivel de ruido y el grado de ansiedad.
e) Calcule e interprete el coeficiente de determinación

A diferencia del coeficiente de correlación este solo adopta valores de 0 hasta


1, no puede ser negativo. Mientras más cercano a 1 decimos que el modelo
lineal es adecuado para describir los datos y mientras más cercano a 0
decimos que una expresión lineal no es una buena descripción de los datos. En
nuestro caso R=0,809, entonces podemos decir que la ecuación lineal de
estimación es una buena representación de la relación que existe entre el nivel
de ruido y el grado de ansiedad

2. El Gerente de una Clínica dispone de la siguiente información:

Año 2011 2012 2013 2014 2015 2016


Cirugías 120 143 150 170 162 158

a) Grafique y determine la ecuación de la tendencia.

b) Proyecte las cirugías al corazón para el año 2017

y=144.7

3. Se ha medido la variación de creatinina en pacientes tratados con Captopril (droga


antihipertensión) tras la suspensión del tratamiento con diálisis, resultando la
siguiente tabla:

Días tras la diálisis: X 1 5 10 15 20 25 35


5. 5. 4. 4. 4. 3.
Creatinina (mg/dl): Y 4
7 2 8 5 2 8

a) Calcule el modelo de regresión lineal


y=-0.0552x+5.475
b) Interprete la variación de creatinina, en función de los días transcurridos tras la
diálisis.
De acuerdo a la ecuación de estimación calculada anteriormente se puede
decir que la creatina en un paciente tras la suspensión de la diálisis disminuye
en 0,0552 por cada día que trasncurre. Y que además en el día del diálisis
(x=0) la persona presentará un nivel de creatinina de 5,475 mg/dl.
c) Si un individuo presenta 8 días tras la suspensión del tratamiento con diálisis,
que sucede con la creatinina (mg/dl).
y=-0.0552(8)+5.475
y=5.0334
El nivel de creatinina tras 8 dias de suspensión del tratamiento con diálisis es
5.0334 mg/dl.
PRUEBA DE INDEPENDENCIA

4. Quinientos empleados de una empresa que fabrica cierto producto, sospechoso de estar
asociado con alteraciones respiratorias, se clasificaron en forma cruzada con base de grado
de exposición al producto y si tenían o no los síntomas de tales alteraciones respiratorias.
Los resultados se muestran en la siguiente tabla:

Nivel de Exposición
Síntomas presentes Alto Limitado Sin exposición conocida Total
Si 185 33 17 235
No 120 73 72 265
Total 305 106 89 500

¿Proporcionan estos datos la evidencia suficiente para indicar que, en un nivel de significación
de 0.05, existe una relación entre el grado de exposición y la presencia de los síntomas de las
alteraciones respiratorias?
Hipótesis
Ho: No hay relacion entre variables
H1: Si existe relacion entre variables

Nivel de Significancia: 5%

Estadístico:

DECISION:
X2t= 5.991 Se rechaza la Hipótesis nula por estar en la zona de rechazo

CONCLUSION: Hay evidencia estadísticamente suficiente para concluir que las personas con
alteraciones respiratorias se deprimen.

5. A un grupo de 350 adultos que participaron en una encuesta de salud, se les preguntó si
llevaban a no una dieta. Las respuestas (por sexos) son las siguientes

Sexo
Masculino Femenino Total
A dieta 14 25 39
Sin dieta 159 152 311
Total 173 177 350

¿Sugieren estos datos que al estar a dieta depende del sexo? Sea  = 0.05.
Hipótesis
Ho: No hay relacion entre variables
H1: Existe relacion entre variables

Nivel de Significancia: 5%

Estadístico:
Decisión:
X2f= 3.841 No se rechaza la hipótesis alternativa

Conclusión: No hay evidencia estadísticamente suficiente para concluir que el estar a dieta
depende del sexo.

PRUEBA DE HOMOGENEIDAD

6. En un estudio acerca de la contaminación atmosférica a realizado en dos comunidades, se


seleccionó una muestra aleatoria de 200 familias de cada una de dichas comunidades. Se le
preguntó a uno de los miembros de cada familia si algún miembro de la misma se sentía
afectado por la contaminación atmosférica. Las respuestas son las siguientes:

¿ Algún miembro de la familia ha sido afectado por la contaminación?


Comunidad Si No Total
I 43 157 200
II 81 119 200
Total 124 276 400

¿Pueden concluir los investigadores que las dos comunidades difieren con respecto a la
variable de interés? Sea  = 0.05
Hipótesis
Ho: Existe homogeneidad
H1: No existe homogeneidad

Nivel de significancia: 5%

Estadistico:

Decisión:
X2f= 3.841 Se rechaza la Hipótesis nula.

Conclusión: Hay evidencia estadística para concluir que las muestras no provienen de
poblaciones homogeneidad según si algún miembro de la familia ha sido afectado por la
contaminación.

7. A cada uno de los varones de una muestra de tamaño 250, extraída de una población que se
sospechaba sufría de alguna enfermedad de las articulaciones se les preguntó cuál de tres
síntomas lo molestaba mayormente. La misma pregunta se le hizo a una muestra de 300
mujeres que se sospechaba padecían la misma enfermedad. Los resultados fueron los
siguientes:

-------------------------------------------------------------------------------------
Síntoma más molesto Hombres Mujeres
------------------------------------------------------------------------------------
Rigidez matutina 111 102
Dolor por la noche 59 73
Hinchazón de las articulaciones 80 125
-------------------------------------------------------------------------------------
TOTAL 250 300
--------------------------------------------------------------------------------------
Proporcionan estos datos la suficiente evidencia para indicar que las dos poblaciones no son
homogéneas con respecto a los síntomas principales?. Sea  = 0.05
Hipótesis
Ho: Existe homogeneidad
H1: No existe homogeneidad

Nivel de significancia: 5%

Estadistico:

Decisión:
X2f= 3.841 Se rechaza hipótesis nula, no existe homogeneidad entre las variables.

Conclusión: Existe evidencia estadísticamente suficiente para concluir que ambas


comunidades no son homogéneas con respecto a los síntomas principales.

ODDS RATIO, RIESGO RELATIVO

8. Se tiene interés en evaluar si el uso de anticonceptivos orales es un factor de riesgo del


infarto miocárdico en mujeres casadas menores de 45 años de edad. Para tal efecto se
realiza un estudio comparativo tipo caso control y se obtienen los siguientes resultados:

Uso de anticonceptivos Pacientes con infarto Sin infarto


orales Miocárdico Miocárdico
(Casos) (Controles)
_________________________________________________________________
Si 23 34
Nunca 35 132
_________________________________________________________________
Total 58 166

Se pide calcular e interpretar el odds ratio (OR)

Conclusión: El uso de anticonceptivos orales es un Factor de Riesgo del infarto miocárdio en


mujeres casadas menores de 45 años de edad.
Si el resultado de ODDS ratio es mayor a 1 la asociación es positiva, es decir que la presencia
del factor se asocia a la mayor ocurrencia del evento. Se le considera un Factor de Riesgo.
Por lo tanto, en nuestro caso OR=2.551 es mayor a 1, entonces podemos decir que el uso de
anticonceptivos orales es un factor de riesgo frente a padecer infarto miocárdico.

9. Evaluar si niveles altos de colesterol sérico (>250) se considera factor de riesgo de un infarto
del miocárdio. Por consiguiente se realiza un estudio comparativo de cohortes y se obtiene los
siguientes resultados:

Niveles de colesterol Desarrolla IM No desarrolló IM Total


Sérico (mg%)
_________________________________________________________
>250 10 125 135
250 21 449 470
_________________________________________________________

Se pide calcular e interpretar el riesgo relativo

Conclusión: Niveles altos de colesterol sérico (>250) se considera Factor de Riesgo de un infarto
del miocárdio.
El riesgo de infarto del miocardio en el grupo con niveles de colesterol sérico mayores a
250 es 0,0741, mientras que el riesgo de infarto del miocardio en el grupo con niveles de
colesterol sérico menor o igual a 250 es 0,0447.
Por tanto el RR es 1,658 siendo este mayor a 1, entonces podemos decir que, cuánto más
probable es que ocurra un infarto de miocardio en las personas que presentan un nivel alto de
colesterol sérico frente a las que no.

10. Se realizó un estudio caso- control para encontrar si la vasectomía es un factor de riesgo del
cáncer de próstata. Los datos obtenidos se muestran en la tabla cruzada de abajo.
VASECTOMIA Casos Controles TOTAL

Si 70 80 154
No 105 178 279
TOTAL 175 258 433
Calcular el odss ratio. Interpretar los resultados

Conclusión: La vasectomía es un Factor de Riesgo del cáncer de próstata.


Por lo tanto, en nuestro caso OR=14.83 es mayor a 1, entonces podemos decir que realizarse
la vasectomía es un factor de riesgo frente a padecer cáncer de próstata.

Você também pode gostar