Escolar Documentos
Profissional Documentos
Cultura Documentos
1. DEFINICIÓN DE TÉRMINOS
ESTADÍSTICOS
Objetivos
Lectura sugeridas
Daniel W. Bioestadística. Base para el análisis de las ciencias de la salud. 4ª ed. México.
Limusa Wiley; 2009
.Dawson B, Trapp R. Bioestadística médica. 4ª ed. México: manual moderno;2005
PRACTICAS
Porcentaje o tasa de
prevalencia de niños que no
asistieron a la cita medica
Nota: Para el estudio II, diga cuál es la variable independiente y cuales las dependientes.
Variable independiente: “Eficacia de los 2 tratamientos para la cura del asma crónica”
2. De la lista que sigue, tipificar cada variable (si es cuantitativa diga si es discreta o continua y
si es cualitativa diga si es dicotómica o politomica) y además escribir la escala de medición
utilizada.
Escala de medición de la
Variable Tipo
variable
Sexo cualitativa nominal Nominal, Dicotomica
Edad Cuantitativa continua Razón,
N°hijos/fam Cuantitativa discreta Razón
Talla Cuantitativa continua Razon
Tipo de diagnostico
Síntomas
N° emergencias/día Cuantitativa discreta Razon
Tipo de familia (nuclear, no Cualitativa Nominal Nominal,Dicotomica
nuclear)
Estados de conservación de Cualitativa nominal Nominal,politomica
la vivienda (bueno, reglar,
malo)
Nivel de instrucción Cualitativa ordinal Ordinal
Frecuencia cardiaca Cuantitativa discreta Intervalo
Puntaje de ansiedad
Valores de plomo en sangre Cuantitativa discreta intervalo
Estado nutricional de un Cualitativa nominal Nominal, politomica
niño (normal, desnutrido)
Score apgar del recién Cuantitativa discreta
nacido*
Grupo sanguíneo Cualitativa nominal Nominal
*La puntuación va de 0 a 10. A mayor puntuación, mejor estado de salud del bebe. La
evaluación se realiza al minuto y a los cincos minutos de nacimiento
Entre las características de interés están: sexo, talla, peso y otras como número de hermanos,
orden de nacimiento y presencia o ausencia de malformaciones congénitas
Indicar lo siguiente
Situación A. Un estudio en 300 hogares de un pequeño pueblo de la sierra del Perú revelo
que el 60% tiene al menos un hijo en edad escolar.
5. Señalar con una C o con una N, si las siguientes variables son cualitativas (categóricas)o
cuantitativas (numéricas), respectivamente:
• Malformaciones congénitas...................................................................................... ( C )
6. Señalar, asimismo, la escala de medición de cada una de las variables del ejercicio anterior.
• Malformaciones congénitas(nominal)
— pH.
Cuantitativa continua
Cualitativa Nominal
Cuantitativa Discreta
Escala de medición. Ordinal
Intervalo
Nominal
Razon
10. Para los estudios siguientes, indicar cuáles de las variables son dependientes (VD) y cuales
independientes (VI), o ni una cosa ni la otra.
a. Se compara AAS (acido acetilsalicilico) con un placebo para ver si reduce las
enfermedades coronarias.
La VI es hipocolesterolemia
La VD es cáncer
La VINTER es relación
c. Sabemos que los miembros de algunas órdenes religiosas que tienen prohibidas las drogas,
el alcohol, el tabaco, la carne y el sexo (más que nada, por su perniciosa inclinación al baile)
viven más que el resto de los pobres mortales, pero ¿merece la pena? ¿Como los
compararíamos con nosotros en un test de calidad de vida?
La VD es viven más
d. Un estudio (esta vez, real) prueba que los conductores de autobús tienen mayor tendencia
a las enfermedades coronarias que el resto de conductores.
La VI es conductores de autobús
La VD es enfermedades coronarias
11. Establecer cuáles de las variables cuantitativas son discretas (D) y cuales continuas (C).
12. Indicar si las variables siguientes han sido medidas en escala nominal (N), ordinal (O),de intervalo
(I) o de razón (R).
13. Los insecticidas aplicados en cultivos grandes pueden ocasionar inadvertidamente contaminación
del aire. El Centro Nacional de Salud Ocupacional y Protección del Ambiente para la Salud
(CENSOPAS) del Instituto Nacional de Salud (INS), informo sobre residuos tiónicos del insecticida
chlorpyrifos utilizado en huertos cercanos del Valle de Majes, Arequipa. Se recolectaron diariamente
especímenes (muestras) de aire en un huerto durante un periodo de rociado (un total de 13 días) y se
midió el nivel de residuos tiónicos (ng/m3) en los especímenes diarios.
Residuos tiónicos del insecticida chlorpyrifos utilizado en huertos cercanos del Valle de Majes,
Arequipa
b. Identificar la muestra.
14. Los examinadores de tomografía computarizada (CT) son sistemas de cómputo visuales altamente
sensibles diseñados para apoyar los diagnósticos médicos mediante la generación de imágenes tipo
radiografía de órganos internos y funciones fisiológicas. Suponer que se desea estimar el tiempo de
barrido medio, es decir, el tiempo medio que tarda un examinador CT en proyectar una imagen.
a. Describir como se podría recoger los datos de muestra necesarios para hacer la inferencia
estadística deseada.
15. Se realizo un estudio preliminar para obtener información sobre los niveles de fondo del
compuesto tóxico bifenilo per clorado (PCB) en muestras de suelos de un país determinado. Para cada
muestra de suelo que tomaron los investigadores anotaron el área (rural o urbana) y el nivel de PCB
(gramos por kilogramo de suelo). Tipificar las variables de estudio.
b. ¿Cuál es la muestra?
d. ¿Cómo podría utilizarse la información de la muestra para estimar la confiabilidad del sistema
de cómputo?
MISCELÁNEAS
( ) Método estadístico
( X) Método científico
( ) Método inductivo
( ) Método deductivo
(X) Planificación
( ) Ejecución
( ) Evaluación
( ) Peso
( ) Velocidad
( ) Edad
( ) Nominal
( ) Ordinal
( ) De intervalo `
( X ) De razón
( ) Totalmente verdadera
( ) Parcialmente verdadera
( ) Parcialmente falsa
( ) Totalmente falsa
( ) Totalmente verdadera
( ) Parcialmente verdadera ’
( ) Parcialmente falsa
( ) Totalmente falsa
( X ) Totalmente verdadera
( ) Parcialmente verdadera
( ) Parcialmente falsa
( ) Totalmente falsa
8. El Índice de masa corporal (IMC) se obtiene como: IMC = masa (kg) / (estatura2 (m). El IMC se
mide en escala:
( ) Nominal
( X ) Ordinal
( ) De intervalo
( ) De razón
( ) Nominal
( ) Ordinal
( ) De intervalo
( ) De razón
( ) Nominal
( ) Ordinal
( ) De intervalo
( X ) De razón.
13. La siguiente afirmación "la escala de razón comienza desde el cero y aumenta en números
sucesivos iguales a cantidades del atributo que está siendo medido", es:
( X ) Totalmente verdadera
( ) Parcialmente verdadera
( ) Parcialmente falsa
( ) Totalmente falsa
14. Supongamos que en la población de pacientes que pertenecen al programa de diabetes del Hospital
Nacional Arzobispo Loayza se obtuvo la varianza de los pesos, resultando 100 kg2, este resultado es:
( ) La unidad de análisis
( X ) Un parámetro
( ) Un estadístico
15. Con referencia a la pregunta anterior, supongamos que de la población se selecciona una muestra
de n= 120 pacientes y se determina que el 20% de la muestra fuma cigarrillos, este resultado es:
( ) La unidad de análisis
( ) Un parámetro
( X ) Un estadístico
16. Se dice que el parámetro es fijo para la población de estudio, mientras que el estadístico es variable
de muestra a muestra. Esta afirmación es:
( ) Totalmente verdadera
( X ) Parcialmente verdadera
( ) Parcialmente falsa
( ) Totalmente.
17. Indicar si con la siguiente proposición: "La existencia de un cero en la escala Celsius (grados
centígrados) no supone la ausencia de temperatura, puesto que el cero grados centígrados está situado
por arbitrio de los creadores de la escala. Por el contrario, la escala Kelvin si tiene un cero absoluto,
precisamente allí donde las moléculas cesan su actividad y no se produce por lo tanto roce entre los
componentes moleculares. El cero absoluto de la escala Kelvin se sitúa a unos -273 grados
centígrados", esta:
( ) Totalmente en descuerdo
( ) En desacuerdo
( ) Indeciso
( ) De acuerdo
( X) Totalmente de acuerdo
18. Indicar si con la siguiente proposición: "Una de las características de las escalas de medición de
orden superior es que se las puede transformar fácilmente en escalas de orden más bajo. Sin embargo,
no es posible efectuar la transformación inversa”, esta:
( ) Totalmente en descuerdo
( ) En desacuerdo
( ) Indeciso
( ) De acuerdo
( ) Totalmente de acuerdo
19. El nivel de medición de la dureza de los minerales según la Escala de Mohs (La escala de Mohs
es una relación de diez materiales ordenados en función de su dureza, de menor a mayor), es:
( ) Nominal
( X ) Ordinal
( ) De intervalo
( ) De razón
20. El tipo de variable y escala de medición de los puntajes de la escala de Glasgow*, son:
( ) Cualitativa y nominal
( X ) Cuantitativa y ordinal
( ) Cuantitativa y de intervalo
( ) Cuantitativa y de razón
*La “Escala de Coma de Glasgow” es una escala neurológica diseñada para evaluar el nivel de
consciencia de los pacientes que han sufrido un traumatismo craneoencefálico (TCE) durante las
primeras 24 horas pos trauma, al valorar tres parámetros: apertura ocular, respuesta motora y
respuesta verbal. Actualmente es empleada en varios campos de la medicina.
Descripción de la escala
La escala está compuesta por tres parámetros: respuesta ocular, verbal y motora. A cada uno se le
asigna un valor dependiendo de la respuesta del paciente, los resultados se suman al final para realizar
la interpretación. El valor más bajo que puede obtenerse es de 3 (1 +1 +1), y el más alto de 15 (4 +5
+6).
• Espontanea:’4 ‘
• No responde:’1 ‘
• Orientado:’5 ‘
• Confuso:’4 ‘
• Palabras inapropiadas:’3 ‘
• Sonidos incomprensibles:’2 ‘
• No responde:’1 ‘
• No responde:’1 ‘
Interpretación
• TCE moderado: 9 - 13
21. En un estudio se desea evaluar ciertas características en una población de neonatos. ¿Cuáles de
las siguientes variables ejemplifican adecuadamente el nivel 0 escala de medición? (Llenar cada
espacio en blanco con su respuesta. Usar cada letra tantas veces como sea necesario)
A. Discreta
B. De razón
C. Ordinal
D. Nominal
E. Dicotómica
2. CLASIFICACION Y PRESENTACION DE
DATOS
Objetivos
Lectura sugeridas
Daniel W. Bioestadística. Base para el análisis de las ciencias de la salud. 4ª ed. México.
Limusa Wiley; 2009
.Dawson B, Trapp R. Bioestadística médica. 4ª ed. México: manual moderno;2005
Pagano M, Gauvreau Ke. Fundamentos de Bioestadística. 2a ed. México: Thomson
Learning 2001.
PRACTICAS
1. En una muestra de 100 escolares, los investigadores encontraron 25 desnutridos y 75 normal es así
mismo, de los 55 escolares de sexo masculino, 10 estaban desnutridos.
Tabla1.....................................................................................................................................................
...............................................................................................................................................................
3. Para el informe de una investigación realizada en pacientes con cáncer gástrico del Hospital Dos
de mayo en el año 2012, se elaboré la siguiente tabla:
Tabla2.....................................................................................................................................................
...............................................................................................................................................................
GRADO DEPRESIÓN
HISTOLÓGICO Total
Leve Moderado Severa
DEL CÁNCER
I 362 317 60 739
II 29 11 15 55
III 9 15 20 44
Total 400 343 95 838
b. La escala de medición para medir depresión y grado histológico del cáncer es:
_____________________________________________________________________
c. Calcular los porcentajes a fin de "visualizar" una posible asociación entre ambas variables
e. Los valores de colesterol total en una muestra de 200 pacientes se encuentran entre 119 y 310.
g. Obtener los límites reales y los puntos medios de los intervalos de clase.
4. Los pesos (Kg) de una muestra de 50 pacientes del servicio de cardiología de un hospital
nacional, fueron:
80 79 69 80 77 69 80 76 90 72
75 76 79 74 71 78 77 80 76 79
70 73 78 72 68 70 91 66 79 75
89 88 91 86 83 81 68 79 80 85
83 82 81 80 78 73 79 84 68 66
a. Construir la tabla de frecuencias (obtenga todas las frecuencias, puntos medios o marcas de
clase y los límites reales.)
b. Graficar el polígono de frecuencias relativas acumuladas (ojiva porcentual). ¿Puede decir que
la distribución de la variable tiende a la simetría? ¿Qué utilidad, además tiene este grafico?
c. Usando este grafico, ¿cuánto es aproximadamente, el percentil 50?
d. Elaborar un grafico de tallo y hojas
30 34 32 23 31 30 23 21 20 30
23 25 31 30 35 29 27 28 26 32
25 27 24 22 29 29 27 32 33 26
27 28 26 25 40 43 34 29 32 24
22 41 38 37 24 29 28 27 36 39
6. A continuación se presentan las edades (años) de una muestra de 58 pacientes con síndrome de
Down:
23 10 24 18 12 8 10 20 21 29 4 30 25 20 8
14 7 15 8 4 10 11 9 22 29 30 31 38 7 15
18 22 40 19 2 25 22 4 18 10 19 29 21 23 28
17 16 15 25 13 41 26 11 9 7 6 26 23
7 5 8 6 7 9 8 10 3 4 5 7 6 12 11 3 1 4 5 8
2 4 3 14 6 7 9 5 8 11 13 4 5 6 7 4 6 1 10 11
f. Si tener Pb en sangre ≥10 µg/ dl indica intoxicación, ¿qué proporción de escolares se encuentra
en esta condición?
8. Se tienen las concentraciones de calcio en 45 hojas de nabo (porcentaje de peso seco por hoja).
3.2 3.0 3.3 3.5 3.5 3.4 2.8 3.0 3.2 2.7 2.9 2.6 3.3 3.1 3.2
3.4 3.2 3.1 3.0 2.9 2.4 2.8 3.3 2.6 2.5 2.7 2.8 3.2 3.3 3.0
3.1 3.7 3.5 3.5 2.9 3.6 3.2 3.3 2.7 3.5 2.8 3.5 3.4 3.5 3.1
d. Decir por lo menos dos motivos por los que se construye una tabla de frecuencias.
9. Supongamos que los pesos (kg) de una muestra de 40 escolares de 8 y 9 años, son:
30 32 28 27 30 32 26 27 28 25
26 30 28 31 26 23 24 25 27 31
27 26 29 30 31 27 24 30 28 29
31 27 25 24 23 22 31 28 30 26
- 28 6
28 - 0,2 31,5
- 18 0,3
-
- 0,1 0,9
-
Total
Completar la tabla anterior sabiendo que n = 60 y los intervalos tienen la misma amplitud.
Sobre los mismos ejes con forma porcentual (hi%) elaborar los polígonos de los niveles de
fenacetina en fumadores y no fumadores. Comentar los resultados.
12. Con referencia al estudio sobre los insecticidas empleados en huertos laterales en el valle de
Majes - Arequipa (Ejercicio 13, de la Practica 1). Sc tomaron y analizaron diariamente
b. Resumir las razones oxor1/ tión diarias con un gratico de tallo y hojas y describir dicho grafico
c. Comentar la afirmación "La razón oxon/ tión para el insecticida chlorpyrifos es mayor en el
13. En la siguiente tabla se presentan las tasas de mortalidad infantil (TMI) por mil nacidos vivos
(NV) del Perú para diferentes periodos, publicadas por el INEI.
1991 - 2 57
1996 43
2000 33
2004 – 5 24
2004 – 6 21
2007 – 8 19
2010 17
Fuente: INEI Encuesta Demográfica y de Salud Familiar {ENDES. 1991- 2008-2010)
a. Elaborar el grafico adecuado para apreciar la tendencia de las TMI. (Suponiendo que en todo el
periodo se uso la misma metodología para la obtención de datos)
b. Describir el grafico y comentar sobre los factores que estarían explicando la tendencia
observada.
14. Muchos veteranos de Vietnam tienen niveles peligrosamente altos de dioxina 2, 3, 7,8 — TCDD
en sangre y er1 tejidos grasos a consecuencia de su exposición al de foliador Agente Naranja. Un
estudio publicado en Chemosphere informo sobre niveles de TCD en 20 veteranos de Vietnam de
Massachusetts que posiblemente estuvieron expuestos al Agente Naranja. Las concentraciones de
TCDD (en partes por billón) en plasma sanguíneo y tejido graso extraído de cada veterano se muestran
en la tabla que sigue.
Utilizar una técnica gráfica para comparar las distribuciones de los niveles de TCDD en plasma y
tejido graso.
6,9 1,1
3,3 2,5
1,6 2,3
7,2 5,9
20,0 11,0
2,0 2,5
4,1 7,0
2,1 1,4
1,8 5,5
36,0 7,0
MISCELÁNEAS
1. Cierta variable de estudio se expresa hasta con tres decimales, la unidad de medida para la
clasificación de estos valores cuando se elabora la tabla de frecuencias, es:
( )1
( ) 0,005
( ) 0,1
( ) 0,001
( ) 0,01
( ) Cuerpo
( ) Indistintamente, matriz/cuerpo
( ) Matriz
( ) Notas aclaratorias
3. En una tabla de doble entrada (bivariada) o tabla de contingencia, que se elabora con la finalidad
de determinar la posible asociación entre dos variables. Si en filas se presenta la variable
independiente y en columnas la dependiente, los porcentajes se obtienen tomando como 100%:
( ) El total general
( ) Totales de tilas
( ) Totales de columnas
( ) Cualquiera
( ) N.A.
( ) Tipo de variable
( ) Tipo de tabla
( ) Tipo de frecuencia
( ) Escala de medición
( ) Titulo
( ) Matriz
( ) Cuerpo
( ) Escala
( ) Fuente
6. El gráfico que tiene la forma de una "ese" alargada para indicar tendencia a la simetría de un
conjunto de datos cuantitativos es:
( ) Ojiva porcentual
7. E1 gráfico que debe tener la forma de una "campana" 0 "j0r0ba" para indicar tendenciaa la simetría
de un conjunto de datos cuantitativos es:
( ) Ojiva porcentual
( ) Barras superpuestas
( ) N.A.
8. Para representar gráficamente la tabla bivariada en la que se presenta las variables practicar
deporte (No, a veces y siempre) y fumar cigarrillos (Si, No), se usaría el gráfico:
( ) De barras simples
( ) De sectores circulares
( ) De barras superpuestas
( ) La unidad de medida
( ) E1 numero de datos
10. Supongamos que se dispone de las edades de una muestra de n = 120 pacientes y se desea clasificar
estos datos. E1 numero recomendable de intervalos de clase que tendría la tabla de frecuencias, es:
( )5
( ) 6
( )7
( )8
( ) 9
3. MEDIDAS DE RESUMEN
Objetivos
Lectura sugeridas
PRACTICAS
1. Calcular la media aritmética, la mediana y la moda para el siguiente conjunto de datos muestrales:
4, 3, 10, 8, 5.
Media aritmética:_____________________________
Mediana: ___________________________________
Moda:______________________________________
2. Solo para que practiques un poco, calcula las siguientes medidas estadísticas de la muestra de datos
que sigue (damos números sencillos de forma deliberada, de modo que no necesitas calculadora): 4 8
634
La media_____________________________________________
La mediana___________________________________________
La moda_______________________________________________
La varianza____________________________________________
La desviación estándar____________________________________
E1 coeficiente de variación__________________________________
Los datos que siguen corresponden a días de hospitalización de una muestra de ocho pacientes: 3, 6,
14, 4, 4, 2, 5, 6. Para estos datos:(Preguntas 3 a 7)
3. La moda es:
( ) 4 días
( ) 6 días
( ) 4 y 6 días
( ) 5 días
4. La mediana es: A
( ) 4 días
( ) 6 días
( ) 5,5 días
( ) 5 días
( ) 4 días
( ) 6 días
( ) 5,5 días
( ) 5 días
( ) 10 días
( ) 3,16 días
( ) 5 días
( ) N .A.
( ) 10 días
( ) 3,16 días
( ) 5 días
( ) N .A.
8. Calcular e interpretar la media, mediana y moda para el conjunto de datos de la razón oxon/tion
del Ejercicio 12 de la Practica 2. ¿Cuál es la medida de tendencia central adecuada y por qué?
9. Un investigador dispone de una muestra de 12 animales experimentales y asigna al azar cada animal
a una de dos dietas (A y B) al final del estudio se obtuvieron los siguientes datos que son los pesos
(gramos) de los ratones antes y después de recibir las dietas:
DIETA
A B
Antes Después di Antes Después di
19 20 24 24
20 21 23 22
18 22 23 24
22 23 24 22
20 24 21 24
23 25 20 20
a. Calcular la variación, di, (restar después menos antes) de los pesos de cada animal para cada tipo
de dieta.
b. Calcular e interpretar la moda, mediana, media aritmética, amplitud, desviación estándar, varianza,
coeficiente de variación de las diferencias (di) para cada tipo de dieta.
c. Realizar un comentario sobre el efecto de cada dieta. ¿Qué dieta produjo mayor incremento de
peso?
10. Se tienen las edades de una muestra de 10 mujeres que utilizan anticonceptivos orales: 20, 21, 21,
19,17, 22, 23, 24, 21, 22
11. En una investigación se desea comparar dos tipos de dietas para la disminución de peso en
pacientes obesos. Después de su aplicación, las disminuciones de los pesos (Kg) fueron:
Dieta 1: 3, 4, 5, 6, 9
Dieta 2: 1, 4, 5, 6, 7
c. A la luz de las medias aritméticas, ¿cuál de las dietas produce mayor disminución de peso? ¿Con
estos resultados se puede obtener conclusiones respecto a la eficacia de las dietas?
12. Tres investigadores médicos del Instituto Nacional del Nino (2010) estudiaron un grupo de 76
lactantes que habían padecido un inexplicable episodio de apnea durante el sueño (Tabla 1). Del total,
25 de los lactantes tuvieron episodios repetidos de apnea en el sueño y siete de estos murieron. Entre
los 51 lactantes cuyo episodio de apnea no se repitió, tres murieron.
c. Determinar el riesgo de muerte en lactantes que habían tenido episodios repetidos de apnea
respecto a los que no los padecieron.
13. Un investigador tiene los siguientes datos sobre tiempos de atención médica de una muestra de
50 pacientes.
Tiempo (minutos) fi
5-7 3
8 - 10 8
11 - 13 16
14 - 16 15
17 - 19 6
20 - 22 2
Total 50
d. Calcular los Valores (Q1 — 1,5*RIC) y (Q3 + 1,5*RIC). ¿Cuál es la utilidad de estos
valores?¿Hay algún valor fuera de estos límites?¿Qué nombre tienen estos valores?
14. Los datos de la Tabla 2 son cambios de diámetros vasculares de una muestra de 10 pacientes.
Tabla 2. Cambio típico en el diámetro vascular (Xi) en pacientes sin crecimiento de la lesión.
Paciente Xi
1 0,15
2 0
3 -0,18
4 -0,15
5 0,21
6 0,45
7 0,42
8 -0,12
9 0,16
10 0,06
a. Calcular la media aritmética de estos dates.
b. Calcular la suma de las desviaciones (Xi -𝑋̅ ) y demostrar que la suma es cero.
15. Para ilustrar· que solo (n-1) desviaciones de la media (Xi —𝑋̅) tienen la libertad de
variar,considerar la edad de cinco pacientes. De la edad de cada paciente se resté el promedioy se
obtuvieron las desviaciones que se observan a continuación:
1 10
2 -7
3 -5
4 3
5
̅̅̅̅= 0
∑(𝐗𝐢 − 𝑿)
a. ¿Cuánto es (X5 —𝑋̅ )
b. Si la media de edad de los pacientes es 40, ¿cuáles son las edades de los cinco pacientes?
16. Usar los datos del Tabla 3 para comparar el número total de pacientes con infección por
gramnegativos que reciben vacuna J5 versus placebo.
c. ¿Qué conclusión se extrae si se determina el riesgo relativo de infección cuando los pacientes
reciben placebo respecto a los que reciben la vacuna J5?
17. En un estudio prospectivo no aleatorio, publicado por Stone y col. (2005) donde se determino si
la vagotomía truncal con gastrectomía Bilroth II podría prevenir la pancreatitis recurrente inducida
por alcohol, se encontró que de los 125 pacientes, que reunieron los criterios de inclusión, 61
rehusaron participar, 33 se les motivo para abstenerse de consumir alcohol y 31 fueron intervenidos
quirúrgicamente. Los resultados se dan en la siguiente tabla:
b. Igualmente volver a calcular las recurrencias por paciente e interpretar los resultados.
18. En un laboratorio clínico se hicieron pruebas en tres instrumentos nuevos que se usaron 5para
llevar a cabo cierta medición en la química sanguínea. Las soluciones de prueba se prepararon
conteniendo una concentración conocida (10 mg/ ml) de la sustancia que se iba a determinar, a
continuación se dan los resultados que se obtuvieron con los tres instrumentos experimentales:
INSTRUMENTOS
I II III
5 10 10
10 9 11
7 10 9
15 9 10
16 11 10
12 9 9
14 10 11
8 8 8
10 10 8
13 9 10
1. Determinar la media, mediana, moda, desviación estándar y coeficiente de variación de los tres
instrumentos.
2. En mediciones clínicas se tienen tres términos que se emplean con frecuencia, la precisión,
ausencia de desviaciones y exactitud. La precisión, se relaciona con la extensión o la dispersión
de un conjunto de observaciones y se mide a través de la desviación estándar. La ausencia de
desviaciones se asocia con la tendencia de un conjunto de mediciones, para ser iguales a un valor
"real o verdadero". Para que un instrumento sea exacto, es preciso que sus lecturas sean al mismo
tiempo precisas y carentes de desviaciones. Describir los tres instrumentos en función de V las
definiciones antes citadas.
19. Se evalúa la eficacia de un producto antihipertensivo mediante un diseño antes — después 1 (es
decir, antes y después de aplicar el producto se determina la presión arterial de cada paciente), los
datos que siguen son diferencias obtenidas restando (antes — después): 5, 3, 4, O, 6, -2, 3, 5, -3, 3.
Se pide, calcular e interpretar la media aritmética y desviación estándar de estos datos.
REGLA EMPIRICA
Si un conjunto de datos tiene una distribución con forma aproximada de una “campana", distribución
con tendencia a la simetría) podemos utilizar las siguientes reglas prácticas para describir el conjunto
de datos.
1. Aproximadamente el 68% de los datos quedan a 1 desviación estándar de su media (esto es,
dentro del intervalo (𝑋̅ ± S) para muestras y (𝜇 ± 𝜎) para poblaciones).
2. Aproximadamente el 95% de los datos quedan a 2 desviaciones estándar de su media (esto
es, dentro del intervalo (𝑋̅ ± 2S) para muestras y (𝜇 ± 2𝜎) para poblaciones).
3. Casi todas la observaciones quedan a 3 desviaciones estándar de su media (esto es, dentro del
intervalo (𝑋̅ ± 3S) para muestras y (𝜇 ± 3𝜎) para poblaciones).
Los siguientes datos son controles prenatales (CPN) de una muestra de 40 gestantes adolescentes.
Luego, se presenta un listado de resultados que proporciona la calculadora Excel en el que se pueden
observar los estadísticos descriptivos.
3 4 3 3 1 4 1 3 2 3
1 1 4 2 3 3 2 6 1 1
3 3 2 2 2 2 1 3 2 1
6 3 1 2 2 3 2 2 4 2
Descriptive statistics
Mean 2,475
Trimmed mean 2,42105263
Median 2
Midhinge 2,5
Mode 2
Midpoint 3,5
Standbard deviation 1,24008891
Standard error 0,19607527
Sample variance 1,53782051
Range 5
skewness 1,03670103
Coefficient of variation 0,50104603
Number of observations 40
First quartile 2
Third quartile 3
Interquartile range 1
Minimum 1
maximum 6
Preguntas 20 a 24:
𝑋̅ =________________Interpretación: ___________________________________
21. Del listado., identificar e interpretar Las siguientes medidas estadísticas descriptivas:
22. Usando la Regla empírica, construir los intervalos (𝑋̅ ± S), (𝑋̅ ± 2S) y (𝑋̅ ± 3S). (Escribir los
resultados faltantes en la tabla que sigue)
23. Contar el número de observaciones que cae dentro de cada intervalo y comparar sus resultados
con los esperados según la Regla empírica. (Escribir las proporciones esperadas y reales faltantes en
la tabla que sigue)
Comentario:______________________________________________________________________
__________________________________________________________________________
Periódicamente, la Federal Trade Commission (FTC, Comisión Federal de Comercio Estados Unidos
califica las marcas de cigarrillos nacionales según el contenido de alquitrán, nicotina y monóxido de
carbono. Los resultados de los ensayos se obtienen mediante una maquina fumadora secuencial que
"fuma" los cigarrillos hasta reducirlos a una colilla de 23 mm de largo. Luego se mide la
La media y desviación estándar de alquitrán(𝑋̅ ± S) obtenidas en una muestra de 372 cigarrillos son
(11,60 ± 4,97) mg respectivamente. Con esta informacion. (Preguntas 25 a 28):
25. Suponiendo que los datos se distribuyen con tendencia a la simetría ("campana"), establecer un
intervalo de una desviación estándar alrededor de 1a media. ¿Qué proporción de cigarrillos se espera
tengan concentraciones de alquitrán superiores a16,57 mg?
Proporción:_______________________________________________________
26. Suponiendoque los datos se distribuyen con tendencia a la simetría ("campana"),el 95% de
cigarrillos tendrán concentraciones de alquitrán comprendidas entre:
______________ y _______________mg.
27.¿Esperaría usted encontrar algún cigarrillo con una concentración de alquitrán de 30mg?
28. Se sabe que: P25 = 6,25 mg y Q = 4,925 mg. Con esta información, obtener RIC y P75.
b. P75 _______________________
29. Respecto al Ejercicio 14 de la Practica 2, la medida de tendencia central adecuada para resumir
los Niveles de TCDD en tejido graso (partes/billón) es:
Respuesta: _______________________________________________________________
(Recordar que para decidir sobre la medida de tendencia central adecuada, es necesario considerar
principalmente, la escala de medición y la forma de la distribución de la variable).
30. Con los datos de la Ejercicio 4 de la Practica 2 (pesos, en kilogramos, de una muestra de 50
pacientes de un servicio de cardiología), elaborar el gráfico de caja y bigotes y describir dicho gráfico.
MISCELÁNEAS
( ) Media aritmética
( ) Mediana
( ) Rango total
( ) Desviación estándar
( ) Percentil 50
( ) Rango Intercuartilico
4. En un estudie con 250 pacientes con daño renal se encentre niveles alterados de urea, al calcular
Q3 se obtuvo 69,8 mg/ dl, este significa que:
( ) N.A.
( ) Mediana
( ) Media aritmética
( ) Moda
( ) Desviación estándar
( ) Coeficiente de variación
( ) Prevalencia
( ) Mortalidad infantil
( ) Mortalidad materna
7. En cierto país para cada 500 personas hay un médico, este indicador es:
( ) Tasa
( ) Razón
( ) Proporción
( ) P50
( ) N.A.
( ) Razón
( ) Proporción
( ) Mediana
( ) Media aritmética
( ) T.A.
( ) 𝑋̅ = 0
( ) ∑ 𝑋1 = 0
( ) Moda
( ) Mediana
( ) Media aritmética
11. La desviación cuartil (Rango intercuattilico/ 2), es una medida de dispersión de los datos respecto
a:
( ) Moda
( ) Mediana
( ) Media aritmética
3(𝑋̅− 𝑀𝑒)
A= 𝑆
; cuando:
( ) Media aritmética, 𝑋̅ = 0
( ) Desviación estándar, S = 0
( ) Mediana, Me = 0
( ) S = 𝑋̅
l3.Existen dos tipos importantes de medidas de incidencia de una enfermedad: incidencia acumulada
(IA) y la tasa de incidencia (I). La IA relaciona el número de casos nuevos con el tamaño poblacional
al comienzo de un periodo de tiempo (∆t):
𝑛°𝑑𝑒𝑐𝑎𝑠𝑜𝑠𝑛𝑢𝑒𝑣𝑜𝑠𝑒𝑛∆𝑡
IA = n° de personas al inicio del estudio (t
0)
Mientras que I se define como el número de casos nuevos por cada unidad persona-tiempo de
observación y tiene como ecuación:
𝑛°𝑑𝑒𝑐𝑎𝑠𝑜𝑠𝑛𝑢𝑒𝑣𝑜𝑠
I = n° de personas—tiempo en observación
La medida que viene a ser una proporción y cuya interpretación puede realizarse en términos de
probabilidad, es:
( ) IA
()I
( ) IA e I
( ) N. A.
( ) Falta información
14. Existe una medida importante que se utiliza en la determinación de factores de riesgo de una
enfermedad que se denomina ODDS y expresa cuánto más probable es la ocurrencia de un fenómeno
en relación con la no ocurrencia. La fórmula para calcular ODDS a favor de la ocurrencia de un
fenómeno; es: Odds = p/ (1-p); donde: p = probabilidad de que ocurra el fenómeno y (1—p)=
probabilidad de que no ocurra el fenómeno. Odds, entonces es: I
( ) Tasa
( ) Razón
( ) Proporción
( ) Promedio
( ) Moda
4. PROBABILIDADES
Objetivos
Lectura sugeridas
Daniel W. Bioestadsitica. Base para el análisis de las ciencias de la salud. 4ª ed. Mexico.
Limusa Wiley; 2009
Mendenhall W, Beaver B, Beaver R. Introducción a la probabilidad y estadística.12ª ed.
México: Thomson; 2008.
Mendenhall W, Sincich T.Probabilidad y estadística para ingeniería y ciencias.4ª ed.
México: Prentice - Halll; 1997.
PRACTICAS
Relaciones de eventos
Si P(A/B) ≠ P(A), decimos que los eventos A y B____________ (son, no son) independientes.
Leyes de probabilidad
P () = ________________________
1. Las probabilidades asociadas con un espacio muestral deben satisfacer dos requerimientos. ¿Estos
son?:
a. __________________________
b.___________________________
a. Se define el evento A que consiste en que el so1icitante A esta ordenado primero, ¿cuáles son
los puntos muestrales?
b. Se define e1 evento B que consiste en que el solicitante B este ordenado en tercer lugar, ¿Qué
puntos muestrales comprende?
e. S1 se asigna igual probabilidad a los puritos muestrales pruebe si los eventos A y B sn o no son
independientes
Para cierta población se define los siguientes eventos con respecto a los niveles de lipoproteína de
plasma (mg/d1):A = (10 -15); B = (≥30); C = (≤ 20). (Preguntas 3 a 5)
3. ¿Son los eventos A y B mutuamente excluyentes? ¿A y C?, ¿B y C? Explicar la respuesta para cada
pregunta.
a. 𝐴̅b.𝐵̅c.𝐶̅
6 En una bolsa se echan 12 bolitas numeradas correlativamente del 1 al 12. Calcular la probabilidad
de obtener un número menor que 5 o múltiplo de 5 al sacar una de ellas.
7. A1 lanzar dos monedas, ¿qué probabilidad hay de obtener una cara y un sello?
a. 4 b. 2 c. 1 d. 1/2 e.1/4
8. En un curso de 60 alumnos, 1/3 de 10s a1umnos habla inglés, 1 /4 habla francés y 1/ 10 hab1a los
dos idiomas, ¿cuál es la probabilidad de que un alumno elegido al azar hable solo un idioma?
9. Si se lanza un dado dos veces, ¿cuál es la probabilidad de que en el primer lanzamiento se obtenga
un 5 o un 6, y en e1 segundo cualquier numero excepto 3?
10. Realizamos el experimento aleatorio de lanzar dos dados anotar los resultados de sus caras
superiores. Calcular la probabilidad del suceso "la suma obtenida sea 7".
11. Dos personas piensan cada una de ellas un número del 0 al 9. Calcular la probabilidad de que las
dos personas no piensan el mismo número.
a. 0,4070
b. 0,3010
c. 0,3100
d. 0,1300
e. N.A.
a. P(A)P(B)
b. P(A)/ P(B)
c. P(A/B)
d. P(B) - P(A)
e. (PA) - P(B)
a. P(A)-P(A∩B)
b. P(B)- P(A∩B)
c. (PA)-P(/B)
d. P(𝐴̅ - B)
e. N.A.
Se realizó un estudio de daño de órgano terminal en hipertensos atendidos en una clínica privada
de Lima. La siguiente tabla presenta la distribución de 306 casos de hipertensos recién
identificados según daño de órgano terminal por gravedad de la hipertensión.
Gravedad de la hipertensión
Leve - Severa Total
Moderada
Antecedentes de + 18 7 25
angina - 243 38 281
Total 261 45 306
Antecedentes de + 4 1 5
enfermedad - 257 44 301
cerebro vascular Total 261 45 306
Anormalidad + 56 22 78
electrocardiografía - 205 23 228
261 45 306
(Preguntas 15 a 27)
15. Dado que el paciente presenta hipertensión severa, ¿cuál es la probabilidad de que tenga
antecedentes de angina?
17. Dado que el enfermo nuevo con hipertensión tiene electrocardiograma normal, ¿cuál es la
probabilidad de que la hipertensión sea severa?
20. Dos pacientes acuden a la clínica el mismo día. ¿Cua1 es la probabilidad de que ambos tengan
electrocardiograma anormal?
21. ¿Cuál es la probabilidad de que al menos uno de los dos tenga antecedentes de angina?
24. Se selecciona un paciente al azar, ¿cuál es la probabilidad de que tenga hipertensión leve—
moderada y electrocardiograma normal?
25. Si del total se selecciona un paciente al azar, ¿cuál es la probabilidad de que tenga
antecedentes de enfermedad cerebro vascular o tenga una hipertensión severa?
26. Si un paciente tiene hipertensión severa, ¿cuál es la probabilidad de que tenga antecedente de
enfermedad cerebro vascular?
27. Supongamos que P(A) = 1 /2 y P (B) = 1/4. Encontrar P(A 0 B), si:
a. A y B son independientes.
b. A y B son mutuamente excluyentes.
28. Supongamos que P(A) = 1/3, P (B) = 1/4 y P(A/B) = 1/2. Encontrar P(A ∪ B).
29. En cierto hospital del Ministerio de Salud, la probabilidad de que un paciente seleccionado
aleatoriamente entre los hospitalizados sea de sexo masculino es de 0,6. La probabilidad A
de que el paciente sea de sexo masculino y haya sido internado para cirugía es de 0,2.
Un paciente seleccionado aleatoriamente entre los hospitalizados es de sexo masculino, ¿cuál
es la probabilidad de que este internado para cirugía?
30. A un consultorio de pediatría, el año pasado, acudieron niños con EDA y con IRA. El 50%
de los niños que acudieron tenia EDA y el 30% IRA. Un 20% tenía ambas enfermedades.
Si se presenta un niño. Calcular la probabilidad de que dicho niño:
a. Tenga alguna enfermedad (Tenga al menos una de las dos enfermedades)
b. Tenga solo EDA
c. No tenga enfermedad alguna (Ni EDA ni IRA)
d. Tenga solo una de las enfermedades
31. El 40% de los pacientes que acuden a un consultorio de cardiología de un hospital son
fumadores; el 70% tiene más de 50 años y el 30% no son fumadores y tienen más de 50 años.
Supongamos que llega un paciente al consultorio, calcular:
a. La probabilidad de que sea fumador y mayor de 50 años.
b. La probabilidad de que ni sea fumador ni mayor de 50 años.
32. Al tratar a recién nacidos prematuros, la cantidad de O2 recibida puede afectar su visión. Se
puede clasificar a cada niño como de visión normal, visión defectuosa .o ciego. Un estudio
muestra que la probabilidad de que ocurra cada uno de estos sucesos es de: 0,80; 0,18 y 0,02,
respectivamente. Determinar la probabilidad de que un niño nazca con:
a. Visión normal o ciego. .
b. Visión defectuosa o normal
c. Visión defectuosa y ciego
33. Entre las embarazadas diabéticas, hay un 25% que presentan toxemias, hidramnios en un 21%
y deterioro fetal en un 15%, en un 6% de los casos se dan otras complicaciones. Suponiendo
que en un embarazo no se pueden presentar dos complicaciones simultáneamente,
a. ¿cuál es la probabilidad que al seleccionar al azar una embarazada diabética, esta tenga un
parto normal?
b. ¿cuál es la probabilidad de que tenga algún tipo de complicación?
34. Se estima que el 30% de los habitantes son obesos, que el 3% sufre de diabetes y el 2% es
obeso y sufre de diabetes, ¿cuál es la probabilidad de que una persona elegida al azar presente
por lo menos una de las dos enfermedades?
35. Los datos recogidos de un banco de sangre, indican que entre todos los donantes, el0,1% da
positivo en el test para VIH y el 1% da positivo en el test del herpes. Si el 0,05%de donantes
da positivo para ambos problemas. Se elige un donante al azar. Calcular la probabilidad de
que dicho donante:
36. Un estudio indica que el 10% de la población de un país tiene 65 años o más y que el1% de
la población padece insuficiencia cardiaca moderada. Además, el 10,4% de la población tiene
65 años o más o padece insuficiencia cardiaca moderada.
37. Ciertos estudios demuestran que un 12% de las personas tratadas por médicos, seatiende en
un hospital. De ellos, el 1% sufre alguna alergia a algún medicamento. Se sabetambién que
el 12,4% recibe atención en un hospital o es alérgico a algún medicamento.
c. ¿Cuál es la probabilidad que un paciente elegido al azar sea alérgico a algún medicamento
pero no se atienda en un hospital?
39. Una persona posee una casa en la ciudad y una cabaña en las montanas. En un año cualquiera, la
probabilidad de que entren a robar a la casa es 0,01 y de que roben en la cabaña es 0,05. Para un año
cualquiera, ¿cuál es la probabilidad de que:
c. No roben en ninguna?
40. Se desea determinar si el fumar está asociado con la ocurrencia de una enfermedad. Para ello se
diseño un estudio con una muestra de 180 sujetos. Los resultados son los que aparecen en la tabla:
(Preguntas a hasta m)
Tabla 1. Asociación entre el habito tabáquico y el desarrollo de una enfermedad. Datos de una
muestra de 180 sujetos.
Enfermos (E) ̅)
No enfermos ( 𝑬 Total
Fumador (F) 60 10 70
̅)
No fumador ( 𝑭 20 90 110
Total 80 100 180
g. Si del total se selecciona un sujeto al azar y resulta que está enfermo, ¿cuál es la probabilidad de
que sea fumador?
h. ¿Cuál es la probabilidad de que el sujeto seleccionado no esté enfermo dado que no fuma?
i. Calcular P (𝐹̅ )
j. Calcular P (F ∪ E)
k. Calcular P (E/F)
1. Calcular P (E/𝐹̅ )
41. Para el caso de los varones nacidos en cierto país la probabilidad de que el periodo de gestación
sea menor de 37 semanas es 0,142 y la probabilidad de que su peso al nacer sea menor de 2500 gramos
es 0,051. Además, la probabilidad de que estos dos eventos ocurran simultáneamente es 0,031.
b. En el caso de un varón recién nacido en este país elegido al azar, ¿cuál es la probabilidad de
que ocurran A o B?
c. ¿Cuál es la probabilidad de que ocurra el evento A en caso de que se lleve a cabo el evento B?
e. ¿Qué tanto por ciento (%) de los que tuvieron un periodo gestacional menor de 37 semanas
nacieron con memos de 2500 gramos?
42. Sabiendo que P(A ∩ B) = 0,2, P (𝐵̅) = 0,7 y P(A ∩ 𝐵̅) = 0,5. Calcular:
a. P (A)
b. P (A ∪ B)
43. La probabilidad de que un densitómetro (equipo médico que determina la densidad mineral ósea)
nuevo falle la primera vez que se use es 0,10. Si no falla de inmediato, la probabilidad de que dure
un año es 0,99. ¿Qué probabilidad hay de que un densitómetro nuevo dure un año?
MISCELÁNEAS
Se denominan experimentos deterministas aquellos que realizados de una misma forma y con las
mismas condiciones iníciales, ofrecen siempre el mismo resultado. Como ejemplo, tenemos que un
objeto de cualquier masa partiendo de un estado inicial de reposo, y dejado caer al vacío desde una
torre, llega siempre al suelo con la misma velocidad: v = √(2𝑔ℎ)
• Es posible conocer previamente todos los posibles resultados (el espacio muestral, constituido por
diferentes sucesos) asociados al experimento.
1- A1 lanzar una tachuela (0 un "chinche") sobre una mesa de madera, pueden concebirse como
resultados posibles: de cabeza (c) y de lado (1). Si admitimos que la tachuela, puede arrojarse
repetidamente, esencialmente bajo las mismas condiciones, entonces el lanzamiento de una tachuela
es un ejemplo de:
( ) Experimento determinista
( ) Experimento científico
( ) N .A.
2. E1 tiempo (día lluvioso y día no lluvioso), que se tendrá durante tres días consecutivos, es un
ejemplo de:
( ) Experimento determinista
( ) Experimento científico
( ) N .A
3. En varios ensayos clínicos realizados en Lima sobre la eficacia de dos tratamientos (A y B) para el
insomnio se determino que el tratamiento B tuvo mayor eficacia. El ensayo se va a repetir, bajo las
mismas condiciones, en la ciudad de Ica, entonces la realización de este ensayo clínico es un ejemplo
de:
( ) Experimento determinista
( ) Experimento científico
( ) N.A.
( ) En una historia clínica seleccionada al azar para un estudio, averiguar e1 género del paciente
5. Si lanzamos al aire un dado, con resultados 1, 2, 3, 4, 5 y 6 y una moneda, con resultados cara (c)
y sello (s), e1 espacio muestral será:
( ) Ω= {(1c), (2c), (3c), (4c), (5c), (6c), (1s), (2s), (3s), (4s), (5s), (6s)}
( ) N.A.
6. Se tiene interés en estudiar si una gestante es primigesta (P) o no (𝑃̅) y si es adolescente (A) o no
(𝐴̅). A1 seleccionar una historia clínica al azar, 1os posibles resultados (espacio muestral) son:
7. E1 espacio muestral as0ciad0 a1 lanzamiento de dos dados y anotar la suma de los puntos obtenidos
es:
( ) Ω= {2,3,4,5,6,7,8,9,10,11,12}
( ) N .A.
( ) 27
( )9
()8
()3
9. Si P(A/B) = 0,4 y P (B) = 0,2, entonces, la probabilidad de que ocurran tanto A como B, es
( ) 0,8000
( ) 0,5000
( ) 0,0800
( ) N .A.
( ) P (B) = 0, 12
( ) P (B) = 0, 80
( ) P (B) = 0, 24
( ) N.A.
( ) P (A ∪B) =P (B ∪ A)
( ) P (A ∩B) =P (B ∩ A)
( ) P (A) + P (𝐴̅) = 1
( ) P (A/B) =P (B/A)
12. Si se lanza al aire una moneda, la probabilidad de obtener cara y sello, es:
( ) 1/2
( ) 1/4
( )0
( )1
13. Si se lanza al aire una moneda, la probabilidad de obtener cara o sello, es:
( ) 1/2
( ) 1/4
( )0
( )1
14. La probabilidad de que ocurra un evento depende de la verosimilitud con la que puede ocurrir
dicho evento y se puede cuantificar mediante un número comprendido entre:
( ) -1 y 1
( ) -∞ e ∞
( )0y1
( ) 0 y 0,999
15. Si un 10% de los alumnos de primaria consume alcohol. La probabilidad de que tres alumnos de
primaria tomados al azar consuman alcohol es:
( ) 0,030
( ) 0,010
( ) 0,001
( ) 0,300
16. En una caja se tienen 5 esperas rojas y 5 azules, se extraen dos esferas, una a una, sin reposición,
la probabilidad de que ambas sean rojas, es:
( ) 0,500
( ) 0,222
( ) 0,250
( ) 1,000
( ) 0,120
( ) 0,288
( ) 0,480
( ) 0,800
18. Ciento cincuenta y ocho personas asistieron a una boda y a1 día siguiente 100 de ellas presentaban
gastroenteritis aguda (GEA). De las 158 personas que asistieron, 110 comieron langostinos y de ellas
70 estaban enfermas a1 día siguiente, la probabilidad de no enfermar para los asistentes que no
comieron langostinos, es:
( ) 0,375
( ) 0,443
( ) 0,633
( ) 0,636
19. En una determinada población e1 30% tiene el hábito de fumar, 50% el de consumir café y 20%
tiene ambos hábitos, 1a probabilidad de que un sujeto elegido al azar tenga el hábito de fumar o de
tomar café, pero no ambos hábitos, es:
( ) 0,80
( ) 0,60
( ) 0,40
( ) 0,20
( ) Son dependientes.
( ) NA
Objetivos
Lectura sugeridas
Daniel W. Bioestadística. Base para el análisis de las ciencias de la salud. 4ª ed. México.
Limusa Wiley; 2009
• Pagano M, Gauvreau Ke. Fundamentos de Bioestadística. 2a ed. México: Thomson
Learning2001.
Royo MA, Moreno JD. Método epidemiológico. 1a ed. Madrid España: ENS- Instituto
de Salud Carlos III· Ministerio de Ciencia e Innovación; Octubre de 2009.
Wonnacott T, Wonnacott R. Fundamentos de Estadística para Administración
yEconomía. 1a ed. México: Editorial Limusa; 1993
PRACTICAS
Diagnostico Total
E= enfermo, 𝐸̅ = no enfermo
1. P (E) = __________________________________
En la tabla 1 se muestran los resultados obtenidos en una prueba de detección de diabetes en una
población de 10000 personas. El punto de corte empleado fue el valor de glucosa sanguínea de 180
mg/ dl; es decir, las personas de 180 o más de glucosa fueron consideradas como positivas en la
prueba.
Resultado de la Si No
prueba de estudio
+ 34 20 54
- 116 9830 9946
Total 150 9850 10000
(Preguntas 9 a 15):
10. Cundo el punto de corte de la prueba de detección se disminuyo a un valor de glucosa sanguínea
de 130 mg/ dl, 164 personas dieron un resultado positivo en la prueba; de estos 98 no eran diabéticos.
(Naturalmente, tanto el número total de diabéticos y no diabéticos permanecen igual).
Construir una tabla con estos datos y calcular la sensibilidad, especificidad y el valor predictivo
positivo de la prueba con este punto de corte.
11. ¿Cuál es el efecto sobre los falsos positivos y sobre los falsos negativos así como sobre el valor
predictivo positivo al disminuir el punto de corte de la prueba de detección?
14. Supongamos (Tabla 1), que la prevalencia de diabetes se eleva de 1,5 a 2,0%. Dada la misma
sensibilidad y especificidad, calcular el valor predictivo positivo de la prueba. Sugerencia: primero,
elaborar la tabla correspondiente).
15. Su servicio de detección puede examinar a 1000 personas por semana (Asumir como muestra
probabilística). Se supone que usted está intentando detectar una enfermedad con una prevalencia de
2,0%, y su prueba tiene una sensibilidad de 95% y especificidad de 90%. (Sugerencia: elaborar
primeramente la tabla respectiva).
Enfermedad
Resultado
Presente Ausente
+ 490 70
- 160 1130
Total 650 1200
En una población grande, de la cual se estima que el 0,1% padece de tuberculosis, supongamos que
la validez de una máquina de rayos X, para la tuberculosis se establece como:
• Entre la gente que padece tuberculosis, la maquina detecta como positivos a un 90%de casos y
como negativos a un 10%.
• Entre la gente que no padece la enfermedad, la maquina reporta un 99% de casos negativos y
un 1% de positivos. (Preguntas 18 a 20)
20. Una persona elegida al azar es sometida a rayos X y resulta positivo ¿cuál es la probabilidad de
que la persona tenga realmente la enfermedad?
d. 0,9090 e. 0,8264
21. La probabilidad de que una persona elegida al azar de una población presente el síntoma
característico de una enfermedad es 0,2 y la probabilidad de que una persona elegida aleatoriamente
presente esa enfermedad es 0,23. La probabilidad de elegir a una persona que tenga el síntoma y
también la enfermedad es O, 18. Si una persona elegida al azar de esa población no presenta el
síntoma, ¿cuál es la probabilidad de que tenga la enfermedad?
22. Los siguientes datos se recogieron de un estudio sobre el uso de una técnica denominada
ventriculografía de radioisótopos como prueba para detectar alguna patología coronaria.
ventriculografía de Enfermedad
Total
radioisótopos Presente Ausente
Positivo 302 80 382
b. Para el caso de una población en la que el predominio de la patología coronaria es0, 10,
calcular la probabilidad de que un individuo padezca la enfermedad er1 case de obtener
resultados positivos en la prueba de ventriculografía de radioisótopos.
23. Se tiene un caso clínico en el que una gestante se somete a la prueba de sobre carga oral con 50
gramos de glucosa para explorar la presencia de diabetes gestacional, obteniéndose un resultado
positivo. Es sabido que dicho test presenta unos valores, aproximados de sensibilidad y especificidad
en torno al 80% y al 87%, respectivamente. Si se conoce además que la prevalencia de diabetes
gestacional en la población de procedencia es un 3%, la probabilidad de que el diagnóstico sea
correcto; es decir, el valor predictivo positivo,
es:________________________________________________________________________
Supongamos que además dicha paciente tiene más de 40 años de edad. Se sabe que en grupos de edad
más avanzada la prevalencia de diabetes gestacional entre las gestantes llega a aumentar hasta
aproximadamente un 8%, en este case el valor predictivo positivo de la prueba
es:_______________________________________________________________________
24. La larga experiencia de una clínica en el diagnostico de pacientes que acuden a ella es que 1/ 10
tiene la enfermedad A, 2/ 10 la enfermedad B y 7/ 10 goza de buena salud. De los enfermes de A, 9/
10 padece de dolores de cabeza; % de los enfermos de B sufren de dichos dolores y ocurre lo mismo
con 1 /20 de quienes están sanos. Si usted debe diagnosticar un paciente en esta clínica y este tiene
dolor de cabeza, cual es la probabilidad de que tenga
a. La enfermedad A
b. La enfermedad B
c. Buena salud
25. La tabla siguiente muestra una serie de dates temados de un estudie en el que se compara la
condición de fumaderos informada por ellos con las mediciones del nivel de nicotina en la sangre.
Como parte de un estudie, el nivel de nicotina se utilizo como herramienta de diagnostico para
predecir la condición de fumadores; la condición informada por ellos se considero como autentica.
Para diferentes puntos de corte, las sensibilidades y especificidades observadas se muestran a
continuación.
b. Utilice estos datos para construir una curva característica de operación (curva ROC-Receiver
Operating Characteristic).Sugerencia: Graficar en el eje X, la proporción de falsos positivos; es
decir, (1- Especificidad) y en el eje Y la sensibilidad.
c. Con base a esta gráfica, ¿qué valor del nivel de nicotina en sangre elegiría como punto de corte
optimo para predecir la condición de fumador? (¿Por qué?
26. En la siguiente tabla se presentan los resultados de un estudio de casos y controles acerca de la
asociación entre fumar tabaco y cáncer pulmonar.
c. Calcular e interpretar el Odds Ratio (OR), razón de odds o razón de ventajas (índice de
disparidad o razón de momios).
Cáncer pulmonar
Fumar tabaco Presente Ausente Total
(casos) (controles)
Si 23 34 57
No 35 132 167
Total 58 166 224
27. Los siguientes datos se tomaron de un estudio realizado para determinar si la utilización del
Monitoreo Fetal Electrónico (EFM) durante el trabajo de parto influye en la frecuencia de nacimientos
por cesárea. Consideremos el parto por cesárea como la "enfermedad"(efecto), y el monitoreo
electrónico como la "exposición" (causa).Los resultados fueron los siguientes:
28. Se llevo a cabo un estudio para analizar los factores potenciales de riesgo de embarazo ectópico.
De las 279 mujeres que tuvieron un embarazo ectópico, 28 habían padecido una enfermedad
inflamatoria pélvica. De las 279 que no la tuvieron, 6 habían padecido una enfermedad inflamatoria
pélvica.
29. en la valoración del electrocardiograma (ECG) inicial como predictor de infarte agudo del
miocardio (IM), los investigadores identificaron a 200 varones que tuvieron IM y 200 sin IM previo.
De los 200 varones con IM, 170 habían tenido ECG positive; de los 200 sin IM, 90 habían mostrado
un ECG positivo.
b. ¿Por qué debe calcularse esta medida de asociación y no el riesgo relativo (RR)?
30. Datos siguientes se obtuvieren de un estudio sobre la relación entre abortos espontáneos y diversos
factores de riesgo.
Consumo de
Cantidad de Abortos
alcohol (bebida Probabilidad OR
embarazos espontáneos
por semana)
0 33164 6793 0,2048 Referencia
1–2 9099 2068
3–6 3069 776
7 – 20 1527 456
> 20 287 98
a. Para cada nivel de consume de alcohol, calcule la probabilidad de que una mujer que se embarace
sufra un aborto espontaneo (Respuestas en la tabla).
b. Para cada categoría de consume de alcohol, calcule el índice de disparidad (OR) de sufrir un aborto
espontaneo en el case de una mujer que consume cierta cantidad de alcohol respecto a las que no la
consumen en absoluto (categoría de referencia), escriba sus respuestas en la tabla.
31. Se desea estudiar la posible asociación entre el habito de fumar tabaco y la aparición de una
cardiopatía coronaria. Se observaron 80 fumadores, de los cuales 35 sufrieren tal cardiopatía durante
un cierto periodo de tiempo; de los 70 no fumadores observados, aparecieron 16 cardiopatías.
a. Elaborar una tabla de 2x2, e indique cual es la variable independiente y la dependiente en esta
tabla.
32. En un estudie sobre asfixia perinatal en lactantes que pesan más de 2,5 kg al nacerse definió como
cohorte expuesta al grupo de niños con un Apgar de 0 a 3 a los cinco minutes del nacimiento y como
cohorte no expuesta al grupo de niños con un Apgar de 4 a 6 a los cinco minutes. Ambas cohortes
fueran seguidas para determinar mortalidad infantil (fallecimiento durante el primer año de vida) y
se elabore la siguiente tabla:
Mortalidad infantil
Puntuación Apgar Total
Si No
De 0 a 3 42 80 122
De 4 a 6 43 302 345
Total 85 382 467
Enfermedad coronaria*
Al inicio del estudio Total
Presente Ausente
Fumadores sanos 65 1935 2000
No fumadores sanos 20 3980 4000
Total 85 5915 6000
*Resultado luego de 10 años
34. En la siguiente tabla se presenta la información sobre mortalidad perinatal y numero de controles
prenatales. (Considerar el estudio como de cohorte retrospectivo)
Mortalidad prenatal
Controles prenatales Total
Si No
0 2056 25891 27947
≥1 776 22387 23163
Total 2893 48278 51110
b. ¿Cuál es la tasa de mortalidad perinatal correspondiente a las madres con cero controles?
c. ¿Cuál es el riesgo de mortalidad perinatal para los niños con cero controles respecto a los de
1 o más controles?
35. En un estudio de cohortes, 500 pacientes con hipertensión 500 personas sin hipertensión son
vigiladas por un periodo de 10 anos para detectar accidentes cerebro vasculares. Durante el estudio,
80 de los hipertensos sufrieron un infarto recién diagnosticado mientras que 30 personas de presión
normal presentan tal situación. Asumiendo que no hay pérdidas en el seguimiento ni muertes debidas
a otras causas, responder a las siguientes preguntas
MISCELÁNEAS
1. P|+/ E) expresa:
( ) El valor predictivo positivo de una prueba
( ) La sensibilidad de la prueba en estudio
( ) La especificidad de la prueba en evaluación
( ) De cada 100 que la prueba detecta como positivos, 10 realmente tienen la enfermedad
( ) De cada 100 que la prueba detecta como positivos, 90 realmente tienen la enfermedad
( ) De cada 100 que la prueba detecta como positivos, 10 realmente no tienen la enfermedad
( ) Que, los expuestos al posible factor causal tienen un riesgo de cuatro veces mayor de no
presentar la enfermedad que los no expuestos
( ) Que, los expuestos al posible factor causal tienen un riesgo de cuatro veces mayor de
presentar la enfermedad que los no expuestos.
( ) Que, de cada cuatro expuestos al posible factor causal, uno se enferma
( ) De cases y controles.
( ) Cohortes retrospectivos
( ) Cohortes prospectivos
8. Un estudio informo que la sensibilidad de la mamografía como prueba de preselección para detectar
cáncer de mama es 0,85, mientras que la especificidad es 0,80. La proporción de falsos positivos que
detecta la prueba, es:
( ) 0,20
( ) 0,05
( ) 0,15
( ) 0,20
( ) 0,34
( ) 0,66
10. La probabilidad de que la endoscopia muestre un resultado positive en un sujeto que realmente
tiene cáncer gástrico, es:
( ) 0,20
( ) 0,34
( ) 0,66
( ) 1,94
( ) 0,26
( ) 0,66
( ) 1,94
( ) 0,13
( ) 7,76
( ) 0,9996
( ) 0,7674
( ) 0,0033
( ) 0,9996
( ) 0,7674
( ) 0,0033
6. DISTRIBUCION BINOMIAL
Objetivos
Lectura sugeridas
Daniel W. Bioestadística. Base para el análisis de las ciencias de la salud. 4ª ed. México.
Limusa Wiley; 2009
.Dawson B, Trapp R. Bioestadística médica. 4ª ed. México: manual moderno;2005
Mendenhall W, Beaver B, Beaver R. Introducción a la probabilidad y estadística.12ª ed.
México: Thomson; 2008.
PRACTICAS
1. Se sabe que el 50% de pacientes que acude a una Clínica Psiquiátrica tiene algún desorden
Mental (DM). Se toma una muestra aleatoria de cuatro historias clínicas:
a. Calcular la probabilidad de que ninguno de la muestra tenga desorden mental, esto es,
P(X= 0).
b. De la misma manera, calcular la P(X=l), P(X=2), P(X=3) y P(X=4), escribir los resultados
en la Tabla 1.
X
(Número de pacientes con P(X=x) P(X≤ x)
DM en la muestra
0 0,0625 0,0625
1
2
3
4
ΣP(X=x) ______________
________________________________________________________________________________
__________________________________________________________________________
2. Un 1aboratorio afirma que una droga causa efectos secundarios en una proporci6n de 3de cada 100
pacientes. Para contrastar esta afirmación, otro laboratorio elige al azar a 5pacientes a 1os que aplica
la droga. ¿Cuál es la probabilidad de los siguientes sucesos?
c. ¿Cuál es el número de pacientes que espera e1 laboratorio que sufran efectos secundarios
si elige 100 pacientes al azar?
b. Determine la probabilidad de que a1 menos uno de los conductores controlados haya cometido
alguna de las dos infracciones.
4. Una clínica odontológica universitaria informé que 1 de cada 100 pacientes atendidos presenta
alguna malformación congénita bucal.
d. La probabilidad de que, cuando mas, uno de ellos tenga alguna malformación congénita
bucal.
a. Calcular la probabilidad de que exactamente uno de los siguientes cinco pacientes que sufran
de esa enfermedad se recupere.
b. Encontrar la probabilidad de que cuando menos uno de los siguientes cinco pacientes
afectados por la enfermedad se recupere.
6 Por muchos años se ha observado que el 80% de los alumnos matriculados en el curso de
Bioestadística aprueba el primer examen. En una muestra de cinco alumnos:
b. ¿Cuál es la probabilidad de que cuando menos tres de los cinco alumnos aprueben el primer
examen?
7. Suponer que en cierta población el 40% de los habitantes tiene algún tipo de alergia. Si, de esta
población se selecciona aleatoriamente seis habitantes:
a. ¿Cuál es la probabilidad de que ninguno de los habitantes tenga algún tipo de alergia?
9. Se sabe que el 30% de los alumnos de cierta universidad practica algún tipo de deporte. En una
muestra aleatoria de cinco alumnos de esta universidad. Calcular la probabilidad de que:
b. Solo los tres primeros alumnos entrevistados practiquen algún tipo de deporte
10. La tasa de mortalidad para cierta enfermedad es de 0, 15 y suponga que la contraen 10personas
de la comunidad (considerar como muestra aleatoria). Calcular la probabilidad de que:
a. Ninguna sobreviva
11. La probabilidad de que llueva es % para cada uno de los cinco días siguientes. Para el propósito
de este problema, suponer que los cinco días comprenden pruebas independientes.
a. ¿Cuál es la probabilidad de que no haya lluvia durante los cinco días siguientes?
c. ¿Cuál es la probabilidad de lluvia en cuando menos dos de los cinco días siguientes?
12. En cierta población, la prevalencia de caries es 95%. Se selecciona una muestra al azar de 20
pobladores.
c. Si solo 10 de los 20 pobladores tienen caries, ¿qué se puede inferir acerca del verdadero
valor de la prevalencia?
13. Sea X una variable con distribución Binomial de media aritmética igual a 6 y varianza igual a 2,4.
14. La Facultad de Odontología de cierta universidad limeña, observando muchos años, ha encontrado
que mas 0 menos el 90% de los alumnos matriculados en el curso de Estadística I, asiste a la clase
inaugural (primera clase). En el 2012 se matricularon100 alumnos en el curso de Estadística I.
¿Dentro de que limites esperaría encontrar el profesor, el número de alumnos en su primera clase del
curso mencionado?
Sugerencia: calcular (𝜇𝑥 ± 2𝜎𝑥 ), donde: 𝜇𝑥 = media aritmética o numero esperado y 𝜎𝑥 =desviación
estándar de la distribución Binomial.
15. Una prueba de Estadística I de selección múltiple ofrece cinco respuestas alternativas a cada una
de 20 preguntas. En cada caso hay solo una respuesta correcta. Diego, que (últimamente ha tenido
muchos problemas, se presenta a la prueba sin haber estudiado nada y decide marcar sus respuestas
al azar:
e. En cambio Erika, que es muy estudiosa, responde correctamente a cada una de las primeras
15 preguntas, cuando nota que le quedan justamente 30 segundos para la finalización de la
prueba. Rápidamente contesta las cinco preguntas restantes marcando al azar, sin leerlas.
¿Qué nota espera tener Erika?
16. La tabla 2 ha sido obtenida por Lancaster (1996), a partir de los datos publicados por Roberts et
al (1956). Estos autores estudiaron 551 cruces entre ratas, con un progenitor y heterocigoto para cada
uno de cinco factores, y el otro progenitor homocigoto recesivo para cada uno de ellos. La distribución
refleja el número de genes dominantes sobre cinco para cada progenie. La distribución teórica es la
Binomial, con n = 5 y p = 1 /2.
a. Calcular y escribir en la Tabla, el número de hijos esperado para cada número de genes
dominantes que falta, suponiendo distribución Binomial.
MISCELÁNEAS
( )0
( )1
( ) 12
( ) 24
( ) N.A.
( ) ΣP(X) = 1
( ) ΣP(X) ≠ 1
( ) Σ P(X) > 1
( ) Σ P(X) < 1
( ) N.A.
3. La prevalencia de parasitosis en cierta población es 20%, se selecciona una muestra de5 personas,
la probabilidad de que 3 no presenten parasitosis, es:
( ) 0,2048
( ) 0,0512
( ) 0,5120
( ) 0,6360
( ) N.A.
( )4
( )1
( ) 1,5
( )2
() N.A.
( ) 0,50
( ) 0,90
( )1 0,10
( ) 0,45
( ) N.A.
( )5
( )4
( )6
( )8
( ) N .A.
( ) 0,5905
( ) 0,0590
( ) 0,5000
( ) 0,4500
( ) N.A.
( )nyq
( )pyq
( )𝜇y𝜎
( )nyp
( ) N .A.
( ) Vida o muerte
( ) Sano o enfermo
( ) Positivo o negativo
( ) Aprobado o desaprobado
10. Una secuencia de ensayos de Bernoulli forma un proceso de Bernoulli, si se cumplen tres
condiciones, una de las siguientes, no conforma este conjunto de condiciones, señalar:
( ) Uno de los posibles resultados se denota (arbitrariamente) como éxito y e1 otro como
fracaso.
7. DISTRIBUCION DE POISSON
Objetivos
Lectura sugeridas
Daniel W. Bioestadística. Base para el análisis de las ciencias de la salud. 4ª ed. México.
Limusa Wiley; 2009
.Dawson B, Trapp R. Bioestadística médica. 4ª ed. México: manual moderno;2005
Mendenhall W, Beaver B, Beaver R. Introducción a la probabilidad y estadística.12ª ed.
México: Thomson; 2008.
PRACTICAS
1. Supongamos que la central telefónica de una institución educativa en cada minuto, en promedio
recibe dos llamadas. En los próximos cinco minutos:
b. ¿Qué probabilidad hay de que la central telefónica reciba exactamente cinco llamadas?
2. Se sabe que en la carretera de Lima a Chosica se produce, en promedio 0,2 accidentes de tránsito
por kilometro. Calcular la probabilidad de que en dos kilómetros cualesquiera de esta carretera:
3. Durante mucho tiempo se ha observado que en un centímetro cubico (cm3) de agua de mar existe,
en promedio una bacteria coliforme. Se toma, del mar, una muestra de cincocm3 de agua:
c. ¿Qué probabilidad existe que la muestra contenga cuando mas una bacteria coliforme?
5. El número de pacientes que llega a un hospital sigue una distribución de Poisson. Si el número
promedio es de 120 por hora, ¿cuál es la probabilidad de que en un minuto lleguen por lo memos tres
pacientes?
7. Se sabe que solo el 3% de recién nacidos tiene alguna malformación congénita. En una muestra de
100 recién nacidos.
8. Cierto tipo de equipo electro médico trae asociada una probabilidad de defecto de 0,02.Se adquiere
un lote (muestra) de 85 equipos.
b. ¿Cuáles la probabilidad de que por 10 menos dos pacientes presenten el evento adverso?
10. Suponer que X es una variable aleatoria para la cual un distribución de probabilidad de Poisson
con 𝜆 = 5,5 constituye una buena caracterización.
a. Calcular 𝜇 y 𝜎
11. Supongamos que X es una variable aleatoria para la cual una distribución de probabilidad de
Poisson constituye una buena caracterización. Calcular lo siguiente:
a. Encontrar la probabilidad de que ocurran 12 partículas en el área del disco bajo estudio.
b. La probabilidad de que ocurran cero partículas en el área del disco bajo estudio.
c. Determinar la probabilidad de que 12 0 menos partículas ocurran en el área del disco bajo
estudio.
14. Una prisión de máxima seguridad reporta que el número de intentos de escape por mes sigue
una distribución aproximadamente de Poisson con una media de 1,5 intentos/mes. Calcular:
15. Las últimas estadísticas de salud, afirman que en la sierra del sur del Perú se presenta una alta
incidencia de cáncer de estomago (120 casos por cada 100,000 habitantes). Suponga que se realizan
exámenes a 1000 habitantes del distrito de San Jerónimo (Cusco) y se asume que para estas la tasa de
incidencia es la misma que para toda la sierra del sur peruano.
MISCELÁNEAS
( )0
( )1
( )∞
( ) 2,7183...
( ) N.A.
( )0
( )1
( ) -0,9
( ) 0,9
( ) 0,4066
3. La media (𝜇x) y la varianza (𝜎𝑥2 ) de una variable aleatoria de Poisson son, respectivamente:
( )𝜇x=λ y 𝜎𝑥2 =λ
4. Se sabe que de cada 100 partos, dos corresponden a partos gemelares. Se selecciona una muestra
de 150 historias clínicas de recién nacidos, la probabilidad de que se encuentre menos de dos partos
gemelares, es:
( ) 0,049
( ) 0,050
( ) 0,199
( )0
( ) N.A.
( )𝜇x→ 0 y 𝜎x→ ∞
( ) p→ 0 y q→ ∞
( )n→ ∞ y q→0
( ) n→ ∞ y p→0
( ) N.A.
6. Un cátodo caliente emite electrones a una razón promedio de v = 1013 electrones por segundo. La
probabilidad de que no se emita ningún electrón durante un intervalo de T segundos, si las emisiones
son eventos independientes que ocurren aleatoriamente en e1 tiempo (características de la
distribución de Poisson), es:
( ) eT
( ) e-T
( )e(-vT)
( )0
( ) N.A.
( )e
( ) e-1=0,3679
( )0
( )1
( ) N.A.
8. Respecto a las emisiones de electrones de un cátodo caliente, calcular P(X =0), si T = 2/v
( ) e2
( ) e-1=0,1353
( )0
( )1
( ) N.A.
( ) 3e-3 =0,1494
( ) e-3=0,0498
( ) e-3v
( ) e3v
( ) N.A.
10. Con base en la pregunta anterior, 1a probabilidad de que ocurran memos de tres llamadas en un
intervalo de 1/v segundos, es:
( ) e-1
( ) e-2
( )2,5e-1=0,9197
( ) e-1/v
( ) 2,5e
11. La aproximación de la distribución Binomial a la de Poisson resulta mejor si λ<5 (λ=np). En este
caso:
( )𝜇x =𝜎x
( )𝜇x = 𝜎𝑥2
( )𝜇x =√𝜎𝑥
( )𝜇x> 𝜎𝑥2
( ) N.A.
8. DISTRIBUCION NORMAL
Objetivos
Lectura sugeridas
Daniel W. Bioestadística. Base para el análisis de las ciencias de la salud. 4ª ed. México.
Limusa Wiley; 2009
.Dawson B, Trapp R. Bioestadística médica. 4ª ed. México: manual moderno;2005
Pagano M, Gauvreau K. Fundamentos. de Bioestadística. 2a ed. México: Thomson
PRACTICAS
1. Utilizar la tabla de áreas de la curva normal (Ver Anexos) estándar para calcular las siguientes
probabilidades, donde Z es la variable aleatoria normal estándar:
a. P (0, 5≤Z≤1, 5)
b. P (-1, 75 ≤ Z ≤ -0,28)
d. P (Z > 0, 27)
e. P (Z i≤-1, 33)
f. P (Z ≤ 1,71)
a. P (Z ≤ zo) = 0,8079
d. P (Z ≤ zo) = 0,1500
3. Supongamos que el tiempo de estancia hospitalaria por una enfermedad crónica para cierto tipo de
pacientes, se distribuye normalmente, con una media de 60 días y desviación estándar de 15 días.
Calcular la probabilidad de que un paciente elegido al azar de esta población, tenga una
hospitalización:
b. Entre 30 y 60 días
4. Se sabe que los pesos de recién nacidos en el Instituto Materno Perinatal de Lima se distribuyen
normalmente, con una media aritmética de 2850g y desviación estándar de 500g .Si en este momento
se produce un nacimiento, calcular la probabilidad de que este niño:
6. Las puntuaciones de un examen del curso de Bioestadística se distribuyen normalmente con una
media de 14,5 y desviación estándar de 3,0
b. ¿Cuál es la probabilidad de que un alumno elegido al azar no tenga una nota mayor de 10?
8. Los Valores de colesterol total en cierta población de trabajadores, tiene distribución normal. Por
otro lado se sabe que el 5% superior de los trabajadores tiene el colesterol por encima de 280 y que
el 10% inferior de los trabajadores tiene colesterol igual o menor de 170.
9. La presión arterial diastólica de la población de mayores de 65 anos tiene distribución normal con
una media de 95 y una desviación estándar de 9. Si de esta población seleccionamos un sujeto al azar,
¿Cuál es la probabilidad de que:
c. Si la población tiene 1000 sujetos, ¿Cuantos se espera que tengan la presión arterial mayor a
120?
d. ¿A qué valor de presión arterial diastólica se localiza el 25% inferior de los sujetos mayores
de 65 años?
10. Se quiere estudiar la calidad de una prueba de análisis de sangre para medir la cantidad de alcohol
ingerida. El nivel de alcohol en sangre de los individuos que han consumido dos cervezas en las
últimas dos horas sigue una distribución normal con media 0,4 y desviación estándar de 0,05 mientras
que para aquellos individuos que han consumido tres cervezas la distribución es normal con media
0,6 y desviación estándar de 0,1.
a. ¿Qué porcentaje de los individuos que han bebido tres cervezas se libraría de la infracción?
b. ¿Qué porcentaje de los individuos que han bebido dos cervezas sería sancionado?
11. En una distribución normal que tiene una desviación estándar de dos, la probabilidad de que el
valor de una variable elegida al azar sea mayor de 28, es 0,03.
12. En una distribución normal con media 15,00 y desviación estándar 3,50, se sabe que 647
observaciones son mayores que 16,25. ¿Cuál es el número total de observaciones?
13. En un examen la nota media fue de 70,0 y la desviación estándar 10,0. El profesor dio a todos los
estudiantes con notas de 61,0 a 79,0 la calificación C. hubo 24 alumnos con C. Si se supone que las
calificaciones siguen una distribución normal, ¿Cuántos alumnos se examinaron?
14. En una distribución normal, con media 120,0 y desviación estándar 30,0 existen 300
observaciones entre 130 y 150. ¿Cuántas observaciones existen entre 130 y 145?
15. Los resultados de una prueba objetiva aplicada a 200 personas indicaron que la distribución de
puntuaciones era normal, con media de 80 puntos y desviación estándar de 10 puntos. Calcular
cuántos de los examinados han obtenido:
d. Si deseamos seleccionar al 10% de las mejores pruebas, da partir de qué puntuación hemos de
escoger?
16. Se sabe que la talla media de una población en edad escolar es 1 65cm con una desviación estándar
de 12cm. Un centro tiene 1400 alumnos matriculados, se pide:
c. Determinar la probabilidad de que un alumno tomado al azar mida entre 170 y 186cm.
d. ¿Qué talla permite asegurar que, elegido un alumno al azar, el 67% de sus compañeros sean
más bajos que él?
17. Se supone que en cierta población humana el índice cefálico I (ancho del cráneo expresado como
porcentaje de su longitud) se distribuye normalmente. Si el 58% de la población es dolicocefálico (I
S 75), el 38% es mesocefálico (75 < I i 80) y el 4% braquicefálico (I > 80). Hallar la media y la
desviación estándar de la distribución de I.
18. La media de una variable X con distribución normal es 5 veces la desviación estándar. Además
se verifica que P(X ≤ 6) = 0,8413. Calcular la media y desviación estándar de la distribución de la
variable aleatoria X.
19. Sea X una variable aleatoria normal con media igual a 24 y varianza igual a 9. Hallar para que
P(X ≤ c) = 0,0630.
20. La supervisora de enfermería encontró que el personal de enfermería, en promedio, termina cierta
tarea en 10 minutos. Si el tiempo requerido para completar la tarea sigue una distribución
aproximadamente normal con una desviación estándar de 3 minutos, calcular:
a. La cantidad proporcional (%) de enfermeras que terminan esa tarea en menos de 4 minutos.
b. La cantidad proporcional (%) de enfermaras que necesitan más de 5 minutos para terminar
dicha tarea.
21. En el estudio de Framingham, se evaluaron los niveles de colesterol total en una población grande
de varones saludables. La población se estudio durante 16 años. Al final de este periodo, los varones
fueron divididos en dos grupos: los que habían contraído una enfermedad coronaria y los que no la
habían contraído. Se encontró que las distribuciones de los niveles iníciales de colesterol en sangre
en cada grupo eran más o menos normales. En los sujetos que finalmente contrajeron una enfermedad
coronaria, el nivel promedio de colesterol en sangre fue de 𝜇E = 244mg/ 100ml y desviación estándar
de 𝜎E = 51mg/100ml. En el caso de los que no desarrollaron la enfermedad, el nivel promedio de
colesterol en sangre fue de 𝜇NE = 219mg/100ml y desviación estándar de 𝜎NE = 41mg/ 100ml.
Supongamos que un nivel inicial de colesterol en sangre de 260 mg/100ml o mas alto se utiliza para
predecir una enfermedad coronaria.
d. ¿Qué sucedería con las proporciones de falsos positivos y negativos si el punto de separación
para predecir una enfermedad coronaria se redujera a 250mg/ 100ml
e. En esta población, ¿parece útil el nivel inicial de colesterol total en sangre para predecir una
enfermedad coronaria? ¿Por qué?
MISCELÁNEAS
1. En la curva normal estándar, N (0, 1), la altura máxima (Y), se produce cuando:
( ) Z= -1
( ) Z = -2
( )Z=0
( )Z=2
( )Z=∞
2. La curva normal estándar, a lo largo del eje horizontal (Z), abarca aproximadamente:
3. Las frecuencias cardiacas (lat/ min) en una población de 400 varones adultos, se distribuyen
normalmente con 𝜇 = 70 y 𝜎 = 5. La probabilidacl de que un sujeto seleccionado al azar tenga una
frecuencia cardiaca de 68 lat/ min, es:
( )0
( ) 0,5000
( ) 0,6800
( ) 0,9500
( ) N .A.
( ) 200
( ) 128
( ) 64
( ) 32
( ) 16
( ) 50
( ) 40
( ) 20
( ) 10
( ) 15
6. Una de las siguientes no corresponde a una característica de la curva normal, señale cual es:
( ) 𝜇 = np
()nyp
( ) Z = (X - 𝜇) /𝜎
( ) N .A.
9. La probabilidad de que un sujeto seleccionado al azar sea atendido 25 minutos o más, es:
( ) 0,8413
( ) 0,1587
( ) 0,9500
( ) 0,6800
( ) N.A.
10. Si el estándar para tiempo de espera para la atención médica es 1 5 minutos. E1 porcentaje de
pacientes en los que el tiempo de atención es inferior al tiempo estándar, es:
( ) 0,8413%
( ) 0,1587%
( ) 0,9500%
( ) 0,6800%
( ) N.A.
11. Si en todo el año fueron atendidos 2500 pacientes, el número de pacientes atendidos menos de 10
minutos, es:
( ) 0,0228
( ) 2,28
( ) 57
( ) 2443
( ) N.A
( ) 57 minutos
( ) 20 minutos
( ) 25 minutos
( ) 15 minutos
( ) Faltan datos
( ) 10 y 30 minutos, aproximadamente
( ) 5 y 20 minutos, aproximadamente
( ) 15 y 25 minutos, aproximadamente
( ) 15 minutos, aproximadamente
14. Los niveles de plomo en sangre en la población de escolares de Callao se distribuyen normalmente
con media 5,7 y desviación estándar 3,5. Se selecciona un escolar al azar, la probabilidad de que tenga
plomo en sangre de 10 o menos, es:
( ) 0,8907
( ) 0,1093
( ) 0,0891
( ) 0,5000
( ) N.A.
15. Respecto a la pregunta anterior, la probabilidad de que el escolar seleccionado al azar tenga plomo
en sangre entre 11 y 15 inclusive, es.
( ) 0,9961
( ) 0,9345
( ) 0,0080
( ) 0,0616
( ) N.A.
16. En una distribución normal con 𝜇 = 72 y 𝜎 = 12, dcuél es el valor correspondiente al percentil 25?
( ) 50.00
( ) 60,00
( ) 63,96
( ) 80,04
( ) 84,96
17. Los pesos (kg) de estudiantes universitarios varones tiene distribución normal con media igual a
78 y varianza de 36. Se selecciona un estudiante al azar y pesa más de 72kg, ¿Cuál es la probabilidad
de que su peso sea, de hecho, superior a 84kg?
( ) 0,1587
( ) 0,1886
( ) 0,4364
( ) 0,5636
( ) 0,7740
18. En una distribución normal de u = 4 y o = 2, calcular el valor de a para que: P (4-a ≤ X ≤ 4 +a)
= 0,5934
( ) 0,66 ·
( ) -1,66
( ) 1,66
( ) 2,66
( ) N .A.
19. Los puntajes en una prueba de inteligencia se distribuyen normalmente. Supóngannos que x1 es
el puntaje que supera el 84,13% de la distribución y X2 el puntaje que es superado por el 84, 13% de
la distribución. Sabiendo que (x1 — x2) = 20, la desviación estándar de la distribución es:
( )2
( )5
( ) 10
( ) 20
( ) N .A.
20. Respecto a la pregunta anterior, la desviación cuartil o rango semi-intercuartil (Q), es:
( ) 26,8
( ) 13,4
( ) 6,70
( ) 3,25
( ) N .A.
Objetivos
Lectura sugeridas
Daniel W. Bioestadística. Base para el análisis de las ciencias de la salud. 4ª ed. México.
Limusa Wiley; 2009
Pagano M, Gauvreau K. Fundamentos. de Bioestadística. 2a ed. México: Thomson
PRACTICAS
A. Tamaño de muestra
1. En cierta población de 1200 escolares de 6-10 anos de edad se desea estimar el nivel promedio de
hierro sérico. Con este fin se va a seleccionar una muestra aleatoria simple. Si en un estudio similar
se obtuvo una media aritmética de 60,6 µg/dl y S = 22,4 µg/dl.
Calcular el número mínimo de historias clínicas para realizar le estimación con 95% de confianza, el
error absoluto de muestreo asumido es ± 2 mg/100ml y una muestra piloto presento una varianza de
64.
5. Utilizando el mismo valor de p y el mismo nivel de confianza del ejercicio anterior, calcular n para
los siguientes errores muéstrales: 2%, 6%, 8%. ¿Cómo se relaciona el error muestral con el tamaño
de la muestra?
6. Supongamos que en el ejercicio 4 no se pudo estimar el valor de p. ¿Con que valor de p calcularía
el tamaño de la muestra? Calcular n usando este valor, y con un E = ± 5%. Comente el resultado.
b. Asuma un error relativo de 1 0,05 y con una desviación estándar estimada de 1,0 y media
turbinen estimada en un estudio piloto en 6,8, calcular n.
8. Se selecciona una muestra de una población cuya desviación estándar se sabe que es 18. ¿Qué
tamaño mínimo de muestra tendría que tomarse para asegurar un recorrido máximo de 7,74 entre los
límites cuando se estime la media poblacional con un 95% de confianza?
9. Hallar el incremento en el tamaño muestral necesario para aumentar el nivel de confianza de una
variable distribuida normalmente, desde 90% hasta 98%.
10. Las ecuaciones que para calcular el tamaño de la muestra utilice en los ejercicios 1 y 2,¿en que
tipos de muestreo deben aplicarse?, y, en ¿qué tipo de estudio?
11. Desde su punto de vista, ¿cuáles son los elementos o términos que afectan más el tamaño de la
muestra?
Técnica de muestreo: Durante una semana se detiene a toda persona que pase por la esquina de
una calle comercial.
Técnica de muestreo: Elegir los 75 primeros alumnos que van a la escuela un lunes por la
mañana.
Técnica de muestreo: Con los ojos tapados, extraer una planta de cada metro cuadrado.
e. Describir una situación distinta de las anteriores que pueda dar como resultado:
2. Utilizando como marco muestral la relación de 150 individuos aparentemente normales con sus
concentraciones de azúcar: (Ver Anexos)
a. Seleccionar una muestra aleatoria simple de tamaño 15. Si va a utilizar la tabla de números
aleatorios, (ver anexos) señale las columnas de inicio.
b. Con los datos de la muestra calcule la media aritmética y desviación estándar de las
concentraciones (estimadores). ¿Cuánto difiere la media de la muestra de la poblacional? ¿Qué
nombre recibe esta diferencia? ¿Para qué sirven los estimadores?
3. Utilizando como marco muestral la relación de 500 escolares y la información sobre parasitosis:
(Ver Anexos)
Seleccionar una muestra sistemática de tamaño 25. Señale las columnas de inicio de la tabla de
números aleatorios.
MISCELÁNEAS
( ) Sistemático
( ) Estratificado
( ) De casos
( ) Aleatorio simple
2. ¿En cuál de los métodos de muestreo, que siguen, no estamos obligados a usar una fórmula para
calcular el tamaño de muestra?
( ) Sistemático
( ) Estratificado
( ) De casos
( ) Aleatorio simple
3. Un requisito básico para aplicar el Muestreo Aleatorio Simple (MAS) es que la población de
estudio:
( ) Sea grande
( ) Sea pequeña
( ) Sea heterogénea
( ) Sea homogénea
( ) 100
( ) 45
( ) 10
( )5
( ) 0,1
( ) 0,2
( ) 0,3
( ) 074
( ) Los elementos de la muestra tienen las mismas características que los de la población.
8. Para estimar el nivel promedio de proteína en cierta población de pacientes con cáncer, se calculo
̅ e = 7,80; se = 1,39; z = 1,96; E = ± 0,5. Si los
una n = 30 usando las siguientes especificaciones: 𝑋
investigadores deciden aumentar el valor de E (error muestral), el tamaño de la muestra:
( ) Disminuye
( ) Aumenta
( ) Sigue igual
( ) N .A.
9. Un investigador utilizando el Muestreo Sistemático (MS) selecciono una muestra de n = 136 para
estimar la proporción de escolares con alergia. Para calcular n utilizo un Pe = 0,15. Si el tamaño N
no es conocido, ¿cual habría sido el error relativo?
( ) 0,6
( ) 0,5
( ) 0,4
( ) 0,06
11. Se desea estimar, con 95% de confianza, el nivel promedio de plomo sanguíneo en policías que
dirigen el transito er1 el centro de Lima. La población es de 800. E1 método de muestreo que se
aplicara es el MS, al realizar el estudio piloto se obtuvo una desviación estándar s = 7 si se asume un
error absoluto de 1,5, el tamaño mínimo de muestra es:
( ) 76
( ) 58
( ) 40
( ) 28
12. Un investigador cardiólogo tiene 100 historias clínicas de pacientes con pericarditis purulenta, las
historias tienen una numeración correlativa de 1 hasta 100 y está interesado en seleccionar una
muestra sistemática de 10 casos, si el numero aleatorio de inicio resulto 5, ¿Los archivos cuyos
números son los siguientes conformaran la muestra para el estudio:
( ) 10, 15, 20, 30, 40, 50, 60, 70, 80, 90.
( ) 150
( ) 80
( ) 78
( ) 196
14. E1 número mínimo de individuos de una muestra a través de la cual deseamos estimar la
prevalencia de obesidad er1 una comunidad, considerando un nivel de confianza del 95% y error
absoluto de 0.05, es:
( ) 146
( ) 246
( ) 285
( ) 385
15. Se desea estimar el nivel promedio de colesterol total en la población de vendedores de comida
en el mercado de un distrito limeño. E1 estudio se realizara mediante el MAS y se requiere calcular
e1 tamaño de muestra considerando un nivel de confianza del 95%.
( ) 60
( ) 59
( ) 58
( ) 57
16. Se desea estimar la proporción de pacientes con infección intra- hospitalaria mediante el estudio
de una muestra. Para calcular 11 se considera un nivel de confianza del 95%, E = 0,05 y un estudio
piloto reporta que pe = 25% y además durante un mes en dicho hospital, en promedio, 200 pacientes
son hospitalizados (considerar para el cálculo, la población anual). E1 tamaño de la muestra, es:
( ) 258
( ) 100
( ) 289
( ) 1 17
17. Con el muestreo aleatorio simple se selecciono una muestra de n = 385 para estimar la proporción
de escolares con algún tipo de alergia. Para calcular n utilizo un pe = 50%, si, el tamaño N no es
conocido, ¿Cual habría sido el error absoluto?
( ) ± 0,04
( ) ± 0,05
( ) ± 0,06
( ) ± 0,08
18. Se desea estimar la prevalencia de osteoporosis en una población de 1000 mujeres, En la revisión
bibliográfica se encontró una prevalencia de 38%, si se asume un error absoluto de 1 6%, el tamaño
de la muestra será:
( ) 251,4
( ) 252
( ) 200,9
( ) 201
20. De la población de alumnos de secundaria (de las secciones A, B, C y D de cuarto año) del Colegio
Nuestra Señora de Guadalupe se desea seleccionar una muestra para estimar la prevalencia de
consumo de alcohol. La muestra se seleccionaría:
( ) Se tomaría a los alumnos de la sección D, puesto que la probabilidad de que ellos consuman alcohol
es alta
Se tiene una población conformada por 25 madres de familia. Se presenta la variable número de hijos.
POBLACIÓN MUESTRA
NUMERO NÚMERO DE HIJOS NUMERO NÚMERO DE HIJOS
1 3
2 2
3 1
4 3
5 4
6 2
7 1
8 5
9 4
10 3
11 2
12 2
13 3
14 1
15 4
16 2
17 3
18 4
19 5
20 3
21 2
22 1
23 2
24 3
25 2
(Preguntas 21-24):
21. Seleccionar la muestra aleatoria simple de tamaño 5 para estimar el número promedio poblacional
de hijos. Indicar las columnas seleccionadas de la tabla de números aleatorios:
24. Los resultados de las preguntas 22 y 23, ¿serán utilizados en?: _________________________
Objetivos
Lectura sugeridas
Daniel W. Bioestadística. Base para el análisis de las ciencias de la salud. 4ª ed. México.
Limusa Wiley; 2009
Mendenhall W, Sincich T.Probabilidad y estadística para ingeniería y ciencias.4ª ed.
México: Prentice - Halll; 1997.
Pagano M, Gauvreau K. Fundamentos. de Bioestadística. 2a ed. México: Thomson
Learning; 2001.
PRACTICAS
1. Se tiene valores de Presión inspiratoria por la boca (Pimax) en una muestra de pacientes con
cifoescoliosis:
d. Calcular el intervalo de confianza de 95% para la media verdadera de Pimax en pacientes con
cifoescoliosis.
i. A juicio del lector, ¿por qué los investigadores no usaron más pacientes?
2. Una encuesta, que incluyo una muestra aleatoria de 150 familias en cierta comunidad urbana, revelo
que, en el 37% de los casos, al menos un miembro de la familia tenía alguna forma de afección a las
vías respiratorias.
Construir los intervalos de confianza del 95 y 99% para la proporción verdadera de familias en la
comunidad con la característica de interés.
3. Se va a estimar el tiempo promedio de espera para la atención médica en una población de pacientes
de un hospital del seguro social, con este fin se selecciono una muestra de 61 pacientes los que
manifestaron haber esperado, en promedio, 32 minutos con una desviación estándar de 5,7 minutos.
¿Cuáles son los límites del intervalo de confianza del 95%? para estimar la media poblacional?
Interpretar los resultados.
4. En una población de amas de casa que cocinan con lefia se desea estimar la prevalencia de pterigion
(carnosidad en ojos). Para esto, se selecciona una muestra de 80 amas de casa y se encontró que 12
de ellas, presentaban pterigion. Estimar, con un nivel de confianza del 95%, la prevalencia
poblacional. Interpretar los resultados.
5. Dos tesistas de una Facultad de Ciencias informaron los siguientes datos acerca del peso de la
glándula pituitaria er1 una muestra de cuatro ratas: media = 9,0mg, error estándar de la media: 0,3.
b. Construya un intervalo de confianza del 95% para el peso medio de la glándula pituitaria para una
población similar de ratas.
c. ¿Qué supuestos se necesitan para que sea valido el intervalo de confianza calculado?
6. En una muestra aleatoria simple de 125 varones desempleados, quienes habían abandonado la
secundaria entre las edades de 13 y 16 anos inclusive, 88 declararon que eran consumidores regulares
MISCELÁNEAS
1. Inferencia estadística está conformada por un conjunto de técnicas utilizadas para realizar
afirmaciones de naturaleza probabilística respecto a
( ) Muestra probabilística.
( ) Población de estudio.
( ) Muestra no probabilística.
( ) No contenga el parámetro.
( ) Contenga el parámetro.
( ) N .A.
6. Para estimar una media aritmética poblacional, mediante un intervalo de confianza, para usar como
coeficiente de confianza el valor "t" de la distribución de Student:
( ) (5,76; 9,24)
( ) (5,82; 9,18)
( ) (6,41; 7,59)
( )α
( )β
( ) (1 -β)
10. Específicamente en las investigaciones biomédicas el nivel de significación (α) fijado es 0,05.
Sabiendo que existe la siguiente igualdad β = 4 α, que permite determinar, aproximadamente la
potencia de la prueba (1- β), entonces, la potencia que habitualmente se usa, es:
( ) 0,95
( ) 0,20
( ) 0,80
11. Al estimar er1 cierta población de pacientes con cáncer al paladar el tiempo de supervivencia er1
meses, se encontró: I.C. 95% (38,4; 55,4), si la desviación estándar poblacional es 43,3 meses, n
habría sido:
( ) 25
( ) 100
( ) 424
12. Los días de permanencia de una muestra de cinco pacientes en la Unidad de Cuidados Intensivos
(UCI), fueron: 3, 4, 2, 6, 5. La estimación puntual de la media poblacional es:
( )2
( )5
( )4
( ) 1,00
( ) 2,50
( ) 1,58
14. Si, a partir de una población distribuida normalmente con media µ y varianza σ2, se seleccionan
M muestras del mismo tamaño (n), entonces las medias de estas muestras se distribuirán normalmente
con media y varianza iguales a:
( ) 𝑥̅ y s2
( ) µ̅ y σ2
( ) µ y σ2/n
( )2
( )3
( )9
16. Si el muestreo se realiza con reemplazo, el número de muestras que se puede seleccionar, es:
( )2
( )3
( )9
17. La media aritmética de las medias muéstrales de todas las posibles muestras de tamaño 2, sea el
muestreo con o sin reemplazo, es:
( )3
( )4
( )5
18. La varianza de las medias muéstrales de todas las muestras de tamaño 2, si el muestreo es sin
reemplazo, es: (Sugerencia: cuando el muestreo es sin reemplazo, es necesario usar la corrección por
población infinita (N -n)/(N-1) para calcular la varianza de la distribución de las medias muéstrales,
mas aun sabiendo que er1 este caso n/N > 0,05)
( ) 2/3
( ) 1/3
( ) 1/ 6
19. La varianza de las medias muéstrales de todas las muestras de tamaño 2, si el muestreo es con
reemplazo, es: (Sugerencia: cuando el muestreo es con reemplazo, o cuando se hace a partir de una
población infinita, no es necesario usar la corrección por población finita (N -n)/(N-1) para calcular
la varianza de la distribución de las medias muéstrales)
( ) 2/3
( ) 1/3
( ) 1/ 6
( ) Error tipo II
( ) Error tipo I
( ) Error de muestreo
21. Al estimar en cierta población de pacientes anoréxicos e1 peso promedio en kg., se encontró: I.C.
95% (38,4; 46,9), si la varianza de la población es 169, n habría sido:
( ) 10
( ) 35
( ) 36
22. Se va a estimar la frecuencia cardiaca promedio en una población de pacientes. Se toma (una n =
31 y se obtuvo una 𝑥̅ = 78 y s = 8. Los límites del intervalo de confianza del 95%, son:
( ) (75,1; 80,9)
( ) (75,2; 80,8)
( ) (75,3; 80,7)
23. Si en e1 problema anterior, los investigadores deciden aumentar la muestra a 62, la estimación de
la media poblacional se realizara con:
( ) Mayor confianza
( ) Mayor precisión
24. Al estimar una media poblacional mediante un intervalo de confianza, 1os datos deben satisfacer
dos supuestos básicos, estos son:
( ) Aleatoriedad y normalidad
25. A1 estimar e1 nivel promedio de p1omo en sangre de una población de obreros de una mina se
obtuvo. IC 95% (3,9; 9,9) µg/ml, utilizando una muestra de 81 (t80 = 1,99). La desviación estándar de
la muestra fue:
( ) 1, 5 𝑋g/m1
( ) 3, 0 𝑋g/m1
( ) 13, 6 𝑋g/ml
26. Para estimar la prevalencia de epilepsia en cierta población se tomo una muestra de 100 sujetos
en la que se encontró una prevalencia muestral de 10%. Con este estimador, los límites del intervalo
de confianza del 95%, son:
( ) (4,1 y 15,9%)
( ) (4,0 y 15,8%)
( ) (3,0 y 15,0%)
( ) 0,050
( ) 0,059
( ) 0,061
28. Al estimar el nivel promedio de plomo en sangre de una población de obreros de una mina se
obtuvo. IC 95% (3,9; 9,9) µg/ml, utilizando una muestra de 81(t80 = 1,99). El error estándar de la
media muestral, fue
( ) 1, 5 µg/ml
( ) 3, 0 µg/ml
( ) 13, 6 µg/ml
( ) 3, 0 µg/ml
( ) 4, 0 µg/ml
( ) 5, 0 µg/ml
( ) Deducción
( ) Inducción
( ) Síntesis
Considerar el problema con el que se enfrenta un operador de radar cuya tarea es detectar aviones
enemigos. Cuando aparece algo irregular en la pantalla debe decidir entre:
Ho: todo está en orden; solo hay una pequeña interferencia en la pantalla.
H1: habrá un ataque. En este caso, el error de tipo______________ es una "falsa alarma" y error
de tipo_______________ es "una alarma omitida". A fin de reducir tanto α como β, el equipo
electrónico se construyo lo más sensible y digno de confianza que fuera posible.
Objetivos
1. Conocer los supuestos que los datos deben satisfacer para llevar a cabo una prueba de
hipótesis sobre una media y una proporción.
2. Contrastar H0: µ = µo, obtener e interpretar el valor de p.
3. Contrastar H0: π = π0, obtener e interpretar el valor de p.
Lectura sugeridas
Daniel W. Bioestadística. Base para el análisis de las ciencias de la salud. 4ª ed. México.
Limusa Wiley; 2009
Mendenhall W, Sincich T.Probabilidad y estadística para ingeniería y ciencias.4ª ed.
México: Prentice - Halll; 1997.
Pagano M, Gauvreau K. Fundamentos. de Bioestadística. 2a ed. México: Thomson
Learning; 2001.
PRACTICAS
1. Los siguientes datos son consumos de oxigeno (en ml) durante la incubación de una muestra
aleatoria de 15 suspensiones celulares:
¿Puede concluirse, a un nivel de significación de 0,05, que esta muestra fue extraída de una población
cuya media difiere de 12ml? ¿Qué supuestos deben cumplir los datos muéstrales? (Usar la tabla de la
distribución "t" de Anexos)
4. Nueve animales de laboratorio fueron infectados con cierta bacteria y luego inmunosuprimidos. El
número medio de organismos aislados posteriormente de los tejidos de dichos animales fue de 6,5
(datos codificados) con una varianza de 0,36. ¿Es posible concluir que la media de la población es
mayor que 6,0?
5. La distribución de presiones arteriales diastólicas para la población de mujeres diabéticas entre las
edades de 30 y 34 anos, tiene distribución normal. Puede resultar útil conocer si la media de esta
población difiere de la presión arterial diastólica media de la población general de mujeres de este
grupo de edades, 74,4 mm Hg
c. Se elige una muestra de diez mujeres diabéticas, cuya presión arterial diastólica media y
desviación estándar, son respectivamente, 84,0 y 9,1 mm Hg Con esta información, lleve a
cabo una prueba bilateral en el nivel de significación α = 0,05. ¿Cuál es el valor p de la prueba?
6. Un nuevo método para producir una “mayor duración" en un medicamento para el dolor de cabeza
consistente en variar el tipo de revestimiento usado en la píldora, de tal manera que produzca una
descarga continua de la droga en el sistema de las personas. Si el tiempo medio para que la píldora se
disuelva es mayor que 12 horas, el nuevo método será nuevamente investigado. En una muestra de n
= 16 personas, la media aritmética y la desviación estándar, respectivamente, son 13,2 y 1,5.
¿Concluiría usted que esta "nueva" píldora debe ser investigada nuevamente?
El siguiente cuestionario fue respondido por una muestra aleatoria simple de 250 odontólogos, en un
estudio realizado por el Colegio de Odontólogos del Perú. A continuación aparece el número de
odontólogos que eligió la respuesta correspondiente a tres preguntas formuladas: (Preguntas 7 a 9)
a. Si: 175
b. No: 75
a. Si: 25
b. No: 225
¿Acostumbra como rutina poner al tanto a sus pacientes que fumar es un factor de riesgo de cáncer
del paladar?
a. Si: 238
b. No: 12
7. ¿Es posible concluir que, en la población muestreada, más de 60% tiene alguna especialidad? Sea
α = 0.01
8. ¿Es posible concluir que, de la población muestreada, menos de 15% de los odontólogos atendieron
el ano pasado por lo menos una paciente embarazada?
9. ¿Es posible concluir que más de 90% de los odontólogos pone a1 tanto de sus pacientes que, fumar
es un factor de riesgo de cáncer de paladar?
10. Investigadores de un hospital del Ministerio de Salud, encontraron que 66% de los niños en una
muestra de 670 completaron toda la serie de vacunas contra la hepatitis B. ¿Es posible concluir que,
en la población muestreada, mas de 60% tiene la serie completa de vacunas contra la hepatitis B?
11. Científicos del Instituto Nacional de Enfermedades Neoplásicas (INEN) han citado al benceno,
un disolvente químico de uso común en la síntesis de plásticos, como un posible agente causante de
cáncer. Ciertos estudios han demostrado que las personas que trabajan con benceno durante más de
cinco anos tienen una incidencia de leucemia.20 veces mayor que la de la población en general. `En
consecuencia, el gobierno ha bajado el nivel máximo permisible de benceno en el aire del lugar de
trabajo de 10 partes por millón (ppm) a l ppm. Suponer que una fábrica de artículos de acero, que
expone diariamente a sus trabajadores a benceno, está siendo investigado. Se examinan 20 muestras
de aire, tomadas durante un periodo de un mes, para determinar el contenido de benceno. Los análisis
produjeron las siguientes estadísticas resumidas:
¿La fábrica de artículos de acero está violando las nuevas normas del gobierno?
12. Si una persona permanece demasiado tiempo en una piscina de aguas termales puede
sobrecalentarse, lo que en el caso de mujeres embarazadas puede causar malformaciones del feto.
Pero, ¿qué tanto es demasiado tiempo? Con base en sus trabajos en esta área varios investigadores
proponen la hipótesis de que 75% de las mujeres, sumergidas en una piscina termal con temperatura
del agua de 40°C, sienten un calor incomodo cuando la temperatura de su canal auditivo (temperatura
central) llega a 40°C. En consecuencia, se sugiere que la incomodidad subjetiva puede ser una
protección contra el sobrecalentamiento. Este resultado fue aparentemente contradicho por un estudio
realizado recientemente en el que participaron 36 mujeres saludables, no embarazadas. Solo 17 de las
36 mujeres (47%) sintieron un calor incomodo cuando su temperatura central llego a 40°C. Contrastar
la hipótesis de que el verdadero porcentaje de mujeres saludables, no embarazadas, que sienten un
calor incomodo cuando su temperatura central llega a 40°C es menor que 75%.
MISCELÁNEAS
2. Un mecánico dental, fabricante de brackets, quiere demostrar que la resistencia media a la ruptura
del bracket de 22 libras de un competidor es en realidad menor que 22 libras.
( ) H0:µ = 22 ( ) H1:µ ≠ 22
3. La Dirección General de Salud Ambiental (DIGESA) del Perú desea probar si la concentración
promedio de plomo en sangre en los escolares de La Oroya excede la concentración máxima
permisible, 10 µg/dl.
4. El tiempo de espera promedio para la atención médica, establecido en los consultorios, externos de
un hospital del Ministerio de Salud es 15 minutos. Un médico residente sospecha que en promedio,
los pacientes están esperando mas del promedio establecido.
( ) H0:µ = 10 ( ) H1:µ ≠ 10
5. En una conferencia, un especialista manifestó que aproximadamente de cada 100 limeños, 40 tienen
algún tipo de alergia. Un investigador sobre el tema, cree que la proporción es diferente a la indicada
por el especialista.
6. En los ejercicios 1 y 5, ¿qué estadístico de prueba será apropiado y que características deben poseer
los datos para una aplicación correcta de dicho estadístico?
7. En los ejercicios 2, 3 y 4, ¿qué estadístico de prueba será apropiado y qué supuestos básicos deben
cumplir los datos para una aplicación correcta de dicho estadístico?
( ) p = 0,0488; no rechazar la H0
( ) p = 0, 0244; rechazar la H0
( ) p = 0,9756; no rechazar la H0
( ) p = 0,01; rechazar la H0
( ) p = 0,02; rechazar la H0
11. Respecto a la pregunta 4, relacionada con el tiempo promedio de espera para la atención médica,
supongamos que n = 250 y el valor del estadístico t= 3,212, el valor de p y la decisión estadística,
son: .
( ) p = 0,001; rechazar la H0
12. Respecto a la pregunta 5, relacionada con la prevalencia de todo tipo de alergias en Lima,
supongamos que al realizar la prueba de hipótesis se obtuvo un valor de z = 1,33, el valor de p y la
decisión estadística, son:
( ) p = 0,9082; no rechazar la H0
( ) p = 0,1835; no rechazar la H0
( ) p = 0,0918; no rechazar la H0
13. Cuando se contrasta la H0: µ = µ0, se puede utilizar el contraste z (o prueba z), siempre y cuando:
(Se supone que la variable de interés, en la población, se distribuye normalmente)
14. En el procedimiento para someter a prueba la H0: π = π0, no se utiliza el contraste t de Student,
¿porque?:
( ) La variable de interés en la población sigue la distribución normal es por eso que se usa la prueba
z (normal estándar) y no la t de Student.
( ) No, se puede usar la prueba t de Student, siempre y cuando la muestra sea grande, mayor que 30 y
exista normalidad de los datos de la muestra.
15. Una muestra de ocho estudiantes obtuvo las siguientes calificaciones: 3, 9, 6, 6, 8, 7, 8, 9. Suponer
que la población de calificaciones es normal. ,¿Cuál de las siguientes hipótesis acerca de la
calificación promedio (µ) rechazaría usted al nivel de significación del 1%?
( ) µ0= 6,3 ·
( ) µ0= 4,0
( ) µ0= 9,0
( ) Hipótesis nula
( ) Hipótesis alterna
( ) Hipótesis científica.
OBJETIVOS
1. Conocer los supuestos que los datos deben satisfacer para llevar a cabo una prueba de
hipótesis para la diferencia de dos medias de poblaciones independientes
2. Conocer los supuestos que los datos deben satisfacer para llevar a cabo una prueba de
hipótesis para la media de la diferencia de dos muestras relacionadas
3. Contrastar H0: µ1 = µ2, obtener e interpretar el valor de p.
4. Contrastar H0: µd = 0, obtener e interpretar el valor de p.
LECTURA SUGERIDAS
Daniel W. Bioestadística. Base para el análisis de las ciencias de la salud. 4ª ed. México.
Limusa Wiley; 2009
Mendenhall W, Sincich T.Probabilidad y estadística para ingeniería y ciencias.4ª ed.
México: Prentice - Halll; 1997.
Pagano M, Gauvreau K. Fundamentos. de Bioestadística. 2a ed. México: Thomson
Learning; 2001.
PRACTICAS
2. Se desea determinar si varones y mujeres hipertensos difieren en cuanto a 1a función renal, con
este fin se analizaron 1os Valores de creatinina sérica obteniéndose los siguientes resultados:
Varones Mujeres
n1=24 n2=26
𝑥̅ 1=1,6mg/dl 𝑥̅ 2=1,2mg/dl
S1=0,55mg/dl S2=0,53mg/dl
3. Se tiene información de que niños expuestos a valores altos de plomo (Pb) tienen niveles menores
de hemoglobina (Hb). Un investigador desea confirmar esta proposición y realiza un estudio
comparativo tomando una muestra de 31 niños expuestos a valores altos de Pb y otra de 31 niños no
expuestos a Pb y obtiene los siguientes resultados:
Varones Mujeres
n1=31 n2=31
𝑥̅ 1=11,7g/100ml 𝑥̅ 2=12,3g/100ml
S1=0,9g/100ml S2=1,1g/100ml
¿Tiene los niños expuestos a Pb niveles significativamente menores de Hb que los no expuestos?
Ayacucho Lima
Tamaño de muestra 21 21
Media aritmética 13,2g/100 11,8g/100
Desviación estándar 1,1g/100 1,8g/100
GRUPO
Hiperadrenérgico Normoadrenérgico
Número de pacientes 13 9
Catecolamina sérica (mg/ml) 0,484 ± 0,133 0,206 ± 0,060
Frecuencia cardiaca (lat/min) 90,7 ± 11,5 77,8 ± 13,2
PA. Sistólica (mm Hg) 71,3 ± 13,7 147,4 ± 9,9
PA. Diastólica (mm Hg) 103,0 ± 8,3 95,6 ± 12,9
a. ¿Qué contraste estadístico piensa utilizar para comparar las medias aritméticas de las dos
poblaciones de pacientes en cada una de las variables?
b. ¿Cuáles son los supuestos básicos que los datos deben satisfacer para una aplicación correcta
del contraste? ¿Se cumplirá el supuesto de homogeneidad de varianzas para la variable
catecolamina sérica?
5 44 74 76 59
6 58 77 62 54
7 64 68 49 47
8 43 59 53 50
Para determinar la significación estadística de los cambios de tensión en cada una de las variables,
mediante la prueba "t pareada":
c. Para realizar las pruebas de hipótesis, tanto para tensión de oxigeno arterial como para la
tensión de bióxido de carbono, qué tipo de hipótesis alterna se debería plantear.
f. Podría sugerir alguna técnica estadística para el análisis de las dos variables (las dos
tensiones) en forma conjunta?
8. En un estudio con escolares anémicos se encontraron los siguientes valores de hemoglobina (Hb)
antes y después de una intervención alimentaria con un fuerte contenido de hierro.
Antes: 9, 8, 7, 9, 8, 9, 8, 10 ̅ = 2,75
Donde: 𝑋 sd = 2,05
¿La intervención tuvo eficacia? (Considere que los cambios de las Hb. solo se deben a la
intervención).
a. Hipótesis
b. Prueba estadística
c. Valor de p
d. Decisión
e. Conclusión
MISCELÁNEAS
( ) Normalidad
( ) Homogeneidad de varianzas.
2. En el uso de t pareada, para analizar dos muestras relacionadas (diseño antes -después o pareado),
un supuesto básico para aplicar el contraste "t", es:
3. La distribución "t" de Student está conformada por una familia de curvas simétricas donde una se
diferencia de otra en base a los grados de libertad. Cuando aumentan los grados de libertad, la
distribución t se aproxima a.
( ) La distribución normal.
( ) La distribución binomial.
( ) La distribución chi-cuadrado
( ) 0,025
( ) 0,050
( ) 0,100
5. Al comparar dos poblaciones independientes respecto a las medias aritméticas mediante la prueba
"t" de Student, donde cada muestra tenía un tamaño de 2 1, se obtuvo una t= 1,96, para un contraste
unilateral.
( ) El valor de p = 0,05.
( ) H0: µ1= µ2
( ) H0:µ1 ≤ µ2
( ) H0:𝑥̅ 1 ≤ 𝑥̅ 2
7. A1 contrastar la siguiente hipótesis H0: 𝑋1≤ 𝑋2con la prueba t se obtuvo (con computadora) un
valor de p = 0,0344, la decisión estadística es:
( ) Rechazar la H0
( ) Aceptar la H1
( ) Prueba “t" para comparar dos poblaciones independientes (si no se conoce las varianzas
poblacionales y se cumple los supuestos).
( ) Prueba z para comparar dos poblaciones independientes (si no conoce las varianzas poblacionales
y se cumplen los supuestos).
( ) p < 0,001
( ) p < 0,0005
11. En una prueba de diferencia de dos medias de poblaciones independientes usando "t" de Student,
donde cada muestra tenía 41 sujetos, se encontró un valor de 0,02 < p < 0,05.Con este valor de p
(bilateral) se concluye que:
( ) Se rechaza la HO
12. Al finalizar toda prueba de hipótesis, se obtiene el valor de p. Este valor mide la probabilidad de:
Dos muestras de ratas hembras fueron sometidas a dietas con alto (grupo 1) y bajo (grupo 2)
contenido proteico y se determinó el aumento de peso de cada rata. A 7 ratas se administró la dieta
con alto contenido proteico y a 12 con bajo contenido proteico. Al efectuar el análisis estadístico
correspondiente se obtuvo un valor de t igual a 1,891 en la prueba de comparación de dos medias de
poblaciones independientes. (Preguntas 13 a 15)
( ) µ1≤ µ2
( ) µ1≥ µ2
() 𝑥̅1 ≤ 𝑥̅2
( ) p > 0,10
( ) El incremento del peso promedio de los de bajo contenido proteico es menor quede los de alto
contenido proteico.
16. En un estudio se formaron 15 pares de escolares, en base a edad, ano de estudios, etc. para
comparar dos métodos de enseñanza de matemáticas (A y B). Un niño de cada par fue instruido
mediante el método A y el otro con el B, al término del periodo, de enseñanza se obtuvieron los
puntajes en la misma prueba de matemáticas. Para determinar si existe diferencia entre ambos
métodos en cuanto al efecto se usara:
( ) 30 grados de libertad.
( ) 28 grados de libertad.
( ) 14 grados de libertad
18. Supongamos que en el análisis estadístico de datos en e1 estudio anterior se obtuvo t= 1, 751, el
valor de p y la conclusión, son:
( ) 0,05 < p < 0,10, ambos métodos de enseñanza no difieren en cuanto a su efecto.
( ) 0,10 < p< 0,20, ambos métodos de enseñanza no difieren en cuanto a su efecto.
19. Inferencia estadística tiene dos ramas: Estimación de parámetros y prueba de hipótesis. El
"producto" final de 1a estimación de un parámetro desconocido mediante el cálculo de un intervalo
de confianza, es: IC 95% (LI; LS). E1 "producto" final de una prueba de hipótesis, es:
( ) Valor de alfa
( ) Valor de p
20. Al usar dos muestras del mismo tamaño (n), los grados de libertad para el valor de t desciende de
(2n - 2) para el diseño no pareado a (n- 1) para el diseño pareado, perdiéndose:
( ) n grados de libertad
OBJETIVOS
LECTURA SUGERIDAS
PRACTICAS
Consideremos un experimento diseñado para estimar el incremento del peso promedio de ratas sujetas
a tres dietas específicas, digamos A, B y C, por un tiempo dado. Quince ratas se han dividido
aleatoriamente en tres grupos de cinco cada uno, donde cada grupo va a recibir una de las dietas. Una
rata es la ___________________________. Cada unidad (en cierto sentido) es "tratada" o sujeta a
una de las dietas. De aquí que, en terminología estadística, las dietas son llamadas
_______________________. La asignación aleatoria de las 15 unidades experimentales (ratas) a los
tres tratamientos (dietas) es equivalente a una asignación aleatoria de los tratamientos a las unidades
experimentales. Esto se llama un diseño experimental
__________________________________________________________________ (DCA).
El DCA implica una variable independiente, que en este caso son las ______________________ que
es de naturaleza _______________________ y la variable dependiente es
____________________________la que es de naturaleza _______________________________.
El modelo del DCA para un factor, es: xij = _____________ + _______________ + ____________
Entre 154,92 4
Tratamientos
Dentro de
tratamientos
Total 200,48 39
Diseño: ________________________________________________________________________
Entre 5,06 2
Dentro 65,42 27
(error)
Total
Entre 4 131,19
Total
c. ¿Es posible concluir que, por menos dos medias de tratamientos difieren?
_____________________________ ¿Por qué? ________________________________________
Se compara la edad promedio de tres grupos de pacientes. Cada grupo está constituido por cinco
pacientes. De la tabla de análisis de varianza se logra recuperar alguna, información que se presenta
a continuación:
Fuente de
SC g.l. CM R.V (FC)
variación
Entre 4
Dentro
Total 100
(Preguntas 5 a 9).
( ) H1: µ1 ≠ µ2 ≠ µ3
( ) N.A.
( ) 6,5
( ) 1,083
( ) 13,0
( ) O, 1538
( ) N .A.
( ) 3 y 15
( ) 15 y 3
( ) 12 y 2
( ) 2 y 12
( ) N .A.
( ) Rechazar Ho, las edades promedio no difieren entre los grupos. p > 0.05
( ) No rechazar Ho, las edades promedio no difieren entre los grupos. p > 0.05
( ) Rechazar Ho, al menos una edad promedio difiere de los demás edades promedio de los otros
grupos. P < 0.05
( ) N.A.
( ) Concluir que al menos dos tratamientos difieren y dar por finalizado el análisis estadístico.
( ) Concluir que las medias poblacionales no difieren significativamente con el valor de p obtenido.
( ) Concluir que al menos dos tratamientos difieren, escribiendo el valor de p y luego aplicar una
prueba de comparaciones múltiples (post hoc) para identificar las diferencias entre pares de medias.
( ) Concluir que al menos dos tratamientos difieren, escribiendo el valor de p y luego aplicar la prueba
t de Student para comparar cada par de medias.
10. Algunos epidemiólogos han propuesto la teoría de que el riesgo de padecer enfermedades
cardiacas de la coronaria se puede reducir incrementando el consumo de pescado. Un estudio, vigiló
la dieta y la salud de una muestra aleatoria de varones de mediana edad.
Los sujetos se dividieron en cinco grupos de acuerdo con los gramos de pescado que consumían al
día: 0 gramos / día, 1-14 gramos / día, 15-29 gramos / día, 30-44 gramos/día y 45 o más gramos / día.
Una de las muchas variables que se midió en cada sujeto fue la ingestión de polisacáridos (sustancia
ligada con las enfermedades cardiacas de la coronaria). Un análisis de varianza de los niveles de
polisacáridos (medidos como y porcentaje de la energía) en los cinco grupos de sujetos produjo la
tabla ANOVA parcial que se presenta a continuación.
Fuente de
SC g.l. CM R.V (FC)
variación
Error 23659,45
11. Una tela grande de algodón de fábrica se corto en 12 pedazos los cuales fueron distribuidos y
aleatoriamente en tres grupos de cuatro. Tres sustancias químicas diferentes A, B y C diseñadas para
producir resistencia al color fueron aplicadas a las unidades, una sustancia para cada grupo. Se aplico
una solución colorante (tan uniformemente cómo fue posible) sobre todos las n = 12 unidades. La
variable de interés fue la intensidad de la solución medida en términos de resistencia a la reflexión de
la luz.
SUSTANCIA QUIMICA
A B C
12 14 9
8 9 7
9 11 9
6 10 5
b. Escribir el modelo del diseño utilizado y diga que representa cada termino.
Modelo:_________________________________________________________________________
________________________________________________________________________________
d. Efectuar la prueba de comparaciones múltiples o prueba post hoc (test de Scheffé), para sustancias
A y C.
12. Los efectos de tres drogas con respecto al tiempo de reacción a cierto estimulo fueron estudiados
en cuatro grupos de animales experimentales. El cuarto grupo sirvió de grupo control, mientras que a
los grupos 1, 2 y 3 fueron aplicadas las drogas A, B y C respectivamente, con anterioridad a la
aplicación del estimulo:
A B C Control
12 8 3 2
10 5 5 5
13 9 2 4
10 8 3 3
11
13. La duración requerida por niños de edad de un Centro de Educación Inicial para armar un
"rompecabezas" fue comparada para cuatro periodos de tiempo pre-experimental.
Cuatro estudiantes fueron asignados aleatoriamente a cada grupo peri dos fueron eliminados durante
el experimento debido a enfermedad. Los datos (duración de tiempo para armar en minutos) se
muestran en seguida:
8 9 4 4
14 7 6 7
9 5 7 5
12 8
Total 43 21 25 16
d. ¿Presentan los datos evidencia para indicar una diferencia en el tiempo medio para armar el
"rompecabezas" en al menos dos duraciones de instrucción pre - experimental? (Lleve a cabo el
ANOVA correspondiente).
MISCELÁNEAS
En las siguientes proposiciones señalar verdadero (V) o falso (F):
7. ( ) La hipótesis alterna en un ANOVA es: H1: Existe diferencia entre todas las medias
poblacionales.
9. ( ) RV (FC) = CMD/CMT
16. ( ) En la hipótesis nula anterior, j puede asumir valores desde 1hasta k, siendo k el número de
tratamientos.
19. ( ) En el diseño anterior, puede aplicarse también la prueba "t" de Student para dos muestras
independientes.
OBJETIVOS
1. Conocer los supuestos que los datos deben satisfacer para llevar a cabo una prueba de hipótesis
para la diferencia de dos proporciones de poblaciones independientes
LECTURAS SUGERIDAS
Daniel W. Bioestadística. Base para el análisis de las ciencias de la Salud. 4a ed. México:
Limusa Wiley; 2009.
PRACTICAS
1. Se tiene información que una mayor proporción de niños expuestos a valores altos de plomo (Pb)
atmosférico (> 10 µg/dl). Tienen problemas de aprendizaje. Un investigador desea confirmar o
desconfirmar esta proposición y realiza un estudio comparativo y tomando una muestra de 50 niños
expuestos a valores altos de Pb y otra de 50 niños no expuestos a Pb y obtiene los siguientes
resultados:
NIÑOS
Expuestos a Pb No expuestos a Pb
n1= 50 n2= 50
2. Investigadores del Hospital Nacional Arzobispo Loayza firman que el antígeno especifico
prostático (PSA), encontrado en las células ductales epiteliales, es específico para el tejido prostático
y es detectable en el suero de hombres con próstata normal y en hombres con enfermedades benignas
o malignas de esta glándula. En una muestra de 80 hombres con concentraciones elevadas de PSA (>
4 ng/ml), a 48 se les diagnostico cáncer mediante biopsia de la próstata. En otra muestra de 60
hombres con valores de PSA i 4 ng/ml, 12 tenían cáncer. ¿Es posible concluir que, en general, los
hombres con valores elevados de PSA tienen mayor probabilidad de tener cáncer de próstata?
4. La tabla 1, presenta algunos hallazgos de un estudio aleatorio doble ciego, controlado por placebo,
del uso de penicilina parenteral en pacientes con artritis de Lyme (Steere y otros, 2005).
Número de pacientes 60 60
Antecedentes de EMC* 18 9
Identificar y aplicar el método estadístico apropiado para determinar si existe diferencia entre
sensibles y no sensibles en cuanto a la proporción de pacientes con antecedentes de eritema migrans
cronico (EMC).
5. Usar los datos de la tabla 2 siguiente para comparar el número total de pacientes con una infección
por gran negativos que reciben vacuna J5 y placebo.
Tabla 2. Episodios de infección por gran negativos en pacientes quirúrgicos tratados con
vacuna J5 frente a los que recibieron un placebo.
J5 Placebo J5 Placebo
Episodio
Shock 2 13 6 15
Shock irreversible 1 9 2 9
N° de infectados 8 15 16 23
d. ¿Qué conclusión se extrae si se determina el riesgo relativo (RR) de infección cuando los pacientes
reciben un placebo respecto a los que reciben la vacuna J5?
Diabetes
Obesidad Total
No Si
Si 8 42 50
No 20 30 50
Total 28 72 100
Analizar los datos con la prueba z para comparar dos poblaciones independientes.
7. Los bloqueadores de calcio pertenecen a una de varias clases de medicamentos que comúnmente
se recetan para aliviar la hipertensión arterial. Un estudio realizado en Dinamarca revelo que los
bloqueadores de calcio también podrían ser efectivos para reducir el riesgo de ataques cardiacos
(Tampa Trubune, 23 de marzo de 1990). Un total de 897 pacientes daneses, todos recuperándose de
un ataque cardiaco, recibieron una dosis diaria del medicamento Verapamil, un bloqueador de calcio.
Después de 18 meses de seguimiento, 146 de estos pacientes habían vuelto a sufrir un ataque cardiaco.
En un grupo de control de 878 personas, los cuales tomaron un placebo, 180 sufrieron un ataque
cardiaco. ¿Se puede inferir que los bloqueadores de calcio son efectivos para reducir el riesgo de
ataques cardiacos? (Sugerencia: trabajar con cuatro decimales)
8. Seldane - D, producido por Marion Merrell Dow, Inc., es un medicamento que se vende sin receta
y fue diseñado para aliviar los estornudos, la congestión nasal y otros síntomas de rinitis alérgica. Se
investigaron los efectos adversos generales de Seldane - D en un estudio doble ciego, controlado, de
más de 500 pacientes que padecían rinitis alérgica. A una muestra de 374 pacientes se les administro
Seldane - D, en tanto que a una segunda muestra de 193 pacientes se les administro un placebo. En
la tabla se presenta el número de pacientes que dijeron sufrir insomnio en cada uno de los dos grupos.
Realizar una prueba estadística para determinar si la proporción de pacientes que tomaron Seldane -
D y experimentaron insomnio difiere de la proporción correspondiente de los pacientes que recibieron
el placebo.
tratamiento
Pacientes Total
Seldane - D Placebo
MISCELANEAS
En las siguientes proposiciones señalar la alternativa correcta:
( ) π1 ≤ π2
( ) π1 = π2
( ) π1 ≥ π2
( ) 0,0688 No rechazar H0
( ) 0,0344 Rechazar H0
( ) 0,9656 No rechazar H0
3. Para contrastar la H0 de la pregunta anterior se usa la prueba z que es una variable de la distribución
normal; sin embargo, la variable de interés en la población tiene una distribución binomial. Entonces,
se está usando la distribución normal como:
( ) Prueba exacta.
4. Para contrastar la H0: π1 = π2 se utiliza la prueba o test de significación z cuando las dos muestras
son probabilísticas y, siempre y cuando:
( ) Las proporciones poblacionales π1 y π2, sean conocidas para calcular el error estándar de las
diferencias de las proporciones muéstrales.
( )p=0
( ) p = 1,000
( ) p = 0,000 1
( ) Aceptar H0
( ) Aceptar H1
( ) Rechazar H0
( ) La primera población tiene una proporción significativamente mayor que la segunda población.
( ) La primera población tiene una proporción significativamente menor que la segunda población.
( ) Rechazar H0
8. Cuando se realiza la prueba de hipótesis para H0: π1 = π2 (también para hipótesis unilaterales), se
supone que las proporciones de las dos poblaciones no difieren; entonces, el error estándar de las
diferencias de la proporciones muéstrales se obtiene calculando previamente:
( ) La probabilidad de éxito
( ) La probabilidad de fracaso.
9. En un estudio de casos y controles no pareado sobre factores de riesgo de bajo peso al nacer. Se
selecciono una muestra de 120 casos (niños de bajo peso) y una muestra de 120 controles (niños de
peso normal). Se planteó, como un posible factor de riesgo, que Ia madre fume durante el embarazo.
Se encontró, en 1a muestra de casos y controles que 45 y 30 madres, respectivamente, habían fumado
durante el embarazo. La proporción común o ponderada, es:
( ) 0,3750
( ) 0,3125
( ) 0,2500
( ) 0,0500
( ) 0,0036
( ) 0.0598
OBJETIVOS
LECTURA SUGERIDAS
PRACTICAS
1. En la siguiente tabla:
Obesidad
Hipertensión arterial Total
Si No
Si 42 8 50
No 32 18 50
TOTAL 74 26 100
2. La siguiente tabla muestra el resultado de 275 entrevistas realizadas por una encuestadora para
conocer la opinión de la población adulta limeña acerca de la "Píldora del día siguiente". Los datos
están clasificados por sector de la ciudad en donde se aplico la encuesta:
A 50 ( ) 10 ( ) 2( ) 62 ( )
B 55 ( ) 3( ) 2( ) 60 ( )
D 30 ( ) 35 ( ) 8( ) 73 ( )
E 30 ( ) 30 ( ) 20 ( ) 80 ( )
Determinar si los cuatro sectores poblacionales son homogéneos respecto a la opinión sobre el uso de
la píldora del día siguiente. (Escribir entre paréntesis las frecuencias esperadas)
3. Se desea determinar si las variables sexo (masculino, femenino) y presencia de anemia (si, no)
están asociadas. Se toma una muestra de 200 sujetos y 80 fueron de sexo masculino de los cuales 10
presentaron anemia. Del total, 160 no presentaron anemia. Realizar el análisis estadístico de los datos
y obtener la conclusión apropiada.
5. Para evaluar si colesterol total elevado (2 200) es factor de riesgo de infarto del miocardio (IM) se
realiza un estudio comparativo de cohortes y se obtiene los siguientes resultados:
¿Expuestos y no expuestos difieren en cuanto a la proporción de los que desarrollaron infarto del
miocardio?
6. Se desea evaluar si el consumo del tabaco es un factor de riesgo del cáncer de pulmón. Para tal
efecto se registraron 550 fumadores de los 649 casos con cáncer de pulmón, comparados con 300 no
fumadores de los 640 controles
1. Se desea comparar dos técnicas A y B de detección de cierto tipo de parasito en heces humanas.
En la tabla siguiente se muestran los resultados
B
Técnicas
+ -
+ 80 30
A
- 15 40
+ -
+ 20 12 32
- 2 16 18
Total 22 28 50
Medio B
Medio A Total
+ -
+ 20 12 32
- 2 16 18
Total 22 28 50
¿Difieren significativamente las proporciones de los que cambiaron sus respuestas del antes a después
de Si a No de los que cambiaron de No a Si?
1. En un estudio de casos y controles se tomo una muestra de 10 pacientes (Casos) con tuberculosis
pulmonar multidrogoresistente— TBP (MDR)- y otra de 10 pacientes (Controles) que haberlo tenido
TBP habían sido dados de alta (curados). Se averiguo si antes de tener TBP habían consumido droga.
Se elaboro la siguiente tabla con los datos obtenidos.
TBP (MDR)
Consumo de droga Total
Si No
Si 4 0 4
No 6 10 16
Total 10 10 20
¿Puede concluirse que una mayor proporción de pacientes que ahora tienen TBP (MDR) había
consumido droga antes de tener TBP?
2. En un ensayo clínico con los tratamientos A y B para cierto tipo de desorden mental se obtuvo la
siguiente información sobre los eventos adversos manifestados por los pacientes.
Eventos adversos
Tratamiento Total
Si No
A 1 14 15
B 4 11 15
Total 5 25 30
¿Con el tratamiento A se obtuvo una menor proporción, que con el tratamiento B, de pacientes con
eventos adversos?
MISCELÁNEAS
2. Al finalizar toda prueba de hipótesis, se obtiene el valor de p. Este valor mide la probabilidad de:
3. Cuando se comparan proporciones en dos muestras relacionadas, para facilitar los cálculos, se suele
elaborar una tabla de 2 X 2 y para aplicar la prueba chi cuadrado de Mc Nemar es necesario calcular
la frecuencia esperada en las celdas "discrepantes" de la tabla. Si la frecuencia esperada fuese 5 o
menos, para determinar la significación estadística de la diferencia de las dos proporciones, se debe
utilizar:
( ) Prueba binomial.
4. Para determinar si las variables fumar tabaco (si, no) y sexo (masculino, femenino) son
independientes, se aplicara:
( ) El tratamiento no es útil.
( ) Deberíamos ir añadiendo casos al experimento hasta que el test llegue a ser o significativo.
7. Para determinar si las variables higiene oral (Bueno, regular, malo) y nivel socioeconómico
8. Chi—cuadrado como prueba de independencia se utiliza, para relacionar dos variables cualitativas,
en estudios con:
( ) Una población.
( ) Dos poblaciones.
10. Se desea determinar si la variable sexo (masculino, femenino) y presencia de halitosis (si, no)
están asociadas. Se toma una muestra de 300 sujetos y 120 fueron de sexo masculino de los cuales 40
presentaron halitosis. Del total, 1 60 no presentaron halitosis.
( ) 204,08
( ) 3,78 1
( ) 14,29
11. Supongamos que el valor correcto de chi—cuadrado es 14,29, el valor de p correspondiente es:
( ) p < 0,05
( ) p < 0,01
( ) p < 0,005
12. En una prueba de homogeneidad de poblaciones con chi-cuadrado se encontré un valor de p >
0,10, con este valor de p se concluye que:
13. La prueba exacta de Fisher es aplicable cuando, en una tabla de 2x2 se va a aplicar chi cuadrado
de independencia 0 de homogeneidad de poblaciones, y:
( ) Tres variables.
( ) Dos variables.
( ) Una variable.
Se tomaron muestras de orina y sangre de cada uno de 50 pacientes (muestra), para determinar la
presencia (+) o ausencia (—) de cierto tipo de bacteria. Del total, 30 pacientes presentaron la bacteria
en orina; asimismo del total, 10 pacientes no presentaron la bacteria en sangre y del total 20 pacientes
presentaron la bacteria tanto en sangre como en orina. (Preguntas 15 a 19):
16. Supongamos que se decide usar la prueba chi cuadrado de Mc Nemar, en el ejercicio anterior. El
valor de chi cuadrado calculado, es:
()0
( ) 2,70
( ) 4,03
( ) p < 0, 10
( ) p > 0, 10
( ) p = 0,05
20. La distribución chi cuadrado esté conformada por una familia de curvas:
( ) Simétricas
( ) Asimétricas
( ) Normales
OBJETIVOS
LECTURA SUGERIDAS
Daniel W. Bioestadística. Base para el análisis de las ciencias de la salud. 4ª ed. México.
Limusa Wiley; 2009
Mendenhall W, Beaver B, Beaver R. Introducción a la probabilidad y estadística. 12a
ed. México: Thomson; 2008.
Norman G, Streiner D. Bioestadística. 1a ed. Madrid España: Mosby/Doyma Libros,
S.A.; 1996.
Pagano M, Gauvreau K. Fundamentos. de Bioestadística. 2a ed. México: Thomson
Learning; 2001.
PRACTICAS
1. Asignar rangos (transformar las observaciones en rangos) a las observaciones en la siguiente tabla.
2. En un estudio con escolares anémicos se encontraron los siguientes valores de hemoglobina antes
y después de una intervención nutricional con un fuerte contenido de hierro.
Antes: 9 8 7 9 8 9 8 10
Después: 10 11 12 9 13 14 10 11
4. Analizando el efecto de una intervención farmacológica, con la prueba signo rango de Wilcoxon o
T de Wilcoxon, se encontré en la suma de rangos positivos un valor de 45,5 y en la suma de rangos
negativos un valor de 9,5. Se trabajo finalmente con n = 10, nivel de significación del 5% dos colas.
Indicar la decisión estadística.
5. Se formaron doce parejas de niños con enfermedades en el cerebro para un experimento, con el fin
de determinar si existía diferencia estadísticamente significativa entre las dos formas de terapia física.
Se eligió un niño al azar de cada par y se trato por un periodo, de varios meses usando la terapia A,
mientras que el otro niño fue tratado durante el mismo periodo usando la terapia B. Los resultados se
resumen en la siguiente tabla. Llevar a cabo la prueba de hipótesis correspondiente.
5 A 1,5
6 * *
7 A 7
8 A 8
9 * *
10 A 10
11 A 6
12 A 3
* Diferencia igual a cero
A B
17,9 15,3
22,5 14,4
21,0 17,9
15,3
8. Supónganos que tenemos dos poblaciones independientes y deseamos utilizar la prueba suma de
rangos de Wilcoxon para evaluar la hipótesis nula de que las medianas poblacionales no difieren
significativamente. Se selecciona una muestra de tamaño 4 de la primera población y una muestra de
tamaño 5 de la segunda.
9. Se diseño un experimento para determinar si el fumar cigarros tiene un efecto sobre la duración de
la vida de perros pequeños. Se usaron 20 perros de la misma edad en el experimento. Los animales
fueren asignados al azar a uno de dos grupos. A diez de los perros se les enseño a fumar hasta 12
cigarros al día. Los otros perros no fumaron. A continuación se tienen los tiempos de vida hasta la
muerte, en días, para los perros de ambos grupos. Puesto que el experimente concluye cuando murió
el ultime de los perros fumadores, se registra una L per cada une de les perros que aun están con vida.
¿Los perros fumadores tienen una vida más corta que los perros no fumadores?
Fumadores No fumadores
45 315
112 474
251 727
340 894
412 L
533 L
712 L
790 L
845 L
974 L
10. El colágeno tipo II es un posible remedio para suprimir los síntomas de la artritis reumatoide.
Investigadores médicos de la Universidad de Harvard realizaron un estudio clínico a fin de probar la
capacidad del colágeno para reducir la hinchazón en las articulaciones de pacientes con artritis
reumatoide. A cada uno de 59 pacientes con artritis reumatoide severa activa se le administro una
dosis diaria de colágeno o bien de un placebo idéntico, durante un peri0d0 de 30 días, (28 recibieron
colágeno, recibieron placebo.) La variable de interés fue el número de articulaciones hinchadas
(después del tratamiento menos antes del tratamiento) en cada paciente. Presentamos aquí las medias
y desviaciones estándar para las dos muestras.
Colágeno Placebo
Tamaño de muestra 28 31
Media -2,7 2,0
Desviación estándar 0,5 1,4
c. Se informé que el nivel de significación observado en la prueba fue menor que 0,05. Obtener la
conclusión adecuada.
11. Con referencia al estudio sobre los insecticidas empleados en huertos laterales en el valle de Majes
-Arequipa (Practica 1, Ejercicio 13). Se tomaron y analizaron diariamente muestras de aire en un
huerto durante el periodo de fumigación. En la tabla se presentan los niveles de residuos tiónicos y
oxónicos (en ηg/m3) en las muestras de aire.
Comparar la mediana de las razones oxón/tión en los días de niebla con la mediana de las razones en
los días despejados/nublados en los huertos.
MISCELÁNEAS
( ) Independientes
( ) De tamaños diferentes.
( ) Relacionadas
( ) Independientes.
( ) Relacionadas
( ) µ1= µ2
( ) Me1 = Me2
( ) π1 = π2
5. Supongamos que los investigadores, para la hipótesis nula de la pregunta 4, utilizaron la prueba
suma de rangos de Wilcoxon y al calcular el valor de z obtuvieron, z = 1,74, para este resultado, el
valor de p es:
( ) 0,9591
( ) 0,0409
( ) 0,0818
6. Se desea comparar la eficacia de dos tratamientos (A y B) para el dolor medida en una escala de
puntuaciones de 0 (nada de dolor) hasta 10 (todo el dolor posible). Para este fin se parearon pacientes
según edad, sexo, etc. Un miembro de cada par se asigno al azar a uno de los dos tratamientos. Al
término del seguimiento se evaluó el dolor de cada paciente. Suponiendo que el nivel de dolor antes
de la asignación del tratamiento para todos los pacientes era el mismo, los investigadores deseaban
averiguar si entre los dos tratamientos había diferencia estadísticamente significativa en cuanto al
dolor. La hipótesis nula se puede enunciar como:
( ) La mediana de dolor de los que recibieron el tratamiento A es igual que de los que recibieron el B.
7. En una muestra de 12 pacientes con mucha sensibilidad en las encías se desea determinar la
efectividad de un enjuague dental para inflamación de encías. Para lo cual se obtienen índices
gingivales antes y después del enjuague. Se desea averiguar si después de los enjuagues los índices
(escala ordinal) habían disminuido significativamente. Para este fin se utilizara:
( ) Prueba t pareada.
( ) Proporciones
( ) Medianas
( ) Medias
( ) Chi-cuadrado de Mc Nemar
11. Son afirmaciones correctas sobre las pruebas no paramétricas cuando se analizan datos
cuantitativos, excepto:
12. Un equivalente paramétrico de la prueba suma de rangos de Wilcoxon (U de Mann Whitney), es:
13. ¿Cuál de los siguientes supuestos es común, tanto para la prueba paramétrica "t" de Student para
dos poblaciones independientes como para la prueba no paramétrica suma de rangos de Wilcoxon?
( ) Aleatoriedad
( ) Normalidad
( ) Homogeneidad de varianzas
14. Una prueba estadística no paramétrica que es equivalente a la prueba suma de rangos de Wilcoxon,
es: I
( ) U de Mann-Whitney
15. Para aplicar las pruebas no paramétricas de Wilcoxon, así como la prueba U de Mann-Whitney,
se requiere que la variable para el análisis se mida al menos en:
( ) Escala ordinal
( ) Escala de intervalo
( ) Escala de razón.
16. Se utilizaron 30 pares de niños asmáticos, pareados en base a edad, sexo, tiempo de enfermedad,
etc. Un niño de cada par recibió al azar el tratamiento A y el otro el tratamiento B. No hay estudios
similares publicados. Al comparar las frecuencias respiratorias entre ambas muestras (las diferencias
no tuvieron distribución normal), se obtuvo un valor de z = 2,33.
Prueba: ________________________________________________________________________
Porque: _______________________________________________________________________
H0: ___________________________________________________________________________
Valor de p: _____________________________________________________________________
Conclusión: _____________________________________________________________________
17. Señalar si es falso (F) o verdadero (V), en los siete siguientes enunciados:
( ) Se tomo una muestra de 50 recién nacidos de Cerro de Pasco y otra del mismo tamaño de Callao.
Para comparar los pesos al nacer, habiéndose verificado que la variable de estudio no tiene
distribución normal en Callao, se decide utilizar la prueba U de Mann-Whitney o suma de rangos de
Wilcoxon.
( ) Se tomo una muestra de 30 recién nacidos de Cerro de Pasco y otra del mismo tamaño de Ica. Para
comparar los puntajes Apgar (escala ordinal) al minuto de nacimiento entre las dos poblaciones, se
decide utilizar la prueba suma de rangos de Wilcoxon.
OBJETIVOS
LECTURA SUGERIDAS
Daniel W. Bioestadística. Base para el análisis de las ciencias de la salud. 4ª ed. México.
Limusa Wiley; 2009
Mendenhall W, Beaver B, Beaver R. Introducción a la probabilidad y estadística. 12a
ed. México: Thomson; 2008.
Pagano M, Gauvreau K. Fundamentos. de Bioestadística. 2a ed. México: Thomson
Learning; 2001.
PRACTICAS
a. (0, 2) y (2. 6)
b. (0, 4) Y (2, 6)
Y=a+bX
Si la línea pasa por el punto (O, 1), entonces x = 0, y = 1 debe satisfacer la ecuación. Es decir,
1 = a + b (0)
De forma similar, si una línea pasa por el punto (2, 3), entonces x = 2, y = 3 debe satisfacer la ecuación:
3 = a + b (2)
Utilizar estas dos ecuaciones para obtener los Valores de a y b, y con ellos la ecuación de la línea que
pasa por los puritos (0, 1) y (2, 3)
3. Encontrar las ecuaciones de las líneas que pasan por los puritos del ejercicio 1.
4. E1 electroencefalograma (EEG) es un dispositivo empleado para medir las ondas cerebrales. Los
neurólogos han observado que la frecuencia máxima de EEG en niños normales aumenta con la edad.
En un estudio, se pidió a 287 niños normales con edades entre 2 y 16 años sostener un peso de 65
gramos en la palma de su mano estirada durante un tiempo breve pero no especificado. Se registro la
frecuencia máxima de EEG (medida er1 Hertz) para cada niño. Los datos se agruparon según la edad
de los niños y se calculo la frecuencia máxima promedio para cada grupo de edades. Los datos
aparecen en la siguiente tabla.
4 5,80 12 7,60
5 5,60 13 7,45
6 6,00 14 8,23
7 5,78 15 8,50
8 5,90 16 9,38
9 6,23
a. Elaborar un diagrama de dispersión con los datos. Después de examinar el diagrama, ¿cree que X
e Y están correlacionadas linealmente? Si hay correlación, ¿es positiva o negativa?
a. Para las 18 niñas, el coeficiente de correlación fue: r= -0,50. Interpretar este resultado.
c. Para los 25 niños, el coeficiente de correlación se informo como r = -0,12. Interpretar este resultado.
6. Una muestra de 10 estudiantes de los cursos de Matemáticas y Estadística obtuvieron los siguientes
puntajes:
Matemáticas (x) 11 15 12 14 12 13 11 13 16 14
Estadística (y) 11 16 12 12 13 11 12 14 15 15
d. Grafiqué la ecuación sobre los puntos y verifiqué el ajuste de la línea a los puntos.
Tiempo de servicio
(años) ( ) 8 12 10 15 7 9 11 16 10 15 16 8
(µg/dl) ( ) 10 14 8 12 6 9 8 14 9 13 12 8
e. Estimar, por punto, plomo en sangre para un trabajador con 13 años de servicio.
h. El coeficiente de correlación obtenido, ¿estaría indicando que entre estas dos variables existe una
correlación lineal estadísticamente significativa?
8. Un estudio sobre la relación entre la concentración del monóxido de carbono, en partes por millón
(Y) y la concentración del benzopireno, en microgramos por mil metros cúbicos de aire (X) en la
ciudad de Lima, arrojo los siguientes resultados:
c. ¿Qué porcentaje de la variabilidad total de Y queda explicada por la relación lineal existente entre
ambas variables?
e. Estimar la concentración del monóxido de carbono, para una concentración de benzopireno de 550.
d. Interpretar el valor de r.
10. Las siguientes son 15 lecturas sobre el volumen de tráfico y la concentración de monóxido de
carbono en un punto de muestreo de calidad de aire en una ciudad.
100 110 125 150 175 190 200 225 250 275 300 325 350 375 400
CO (ppm)
8,8 9,0 9,5 10,0 10,5 10,5 10,5 10,6 11,0 12,1 12,1 12,5 13,0 13,2 14,5
Cálculos auxiliares:
ΣXY=41945 n= 15
a. Elaborar el diagrama de puntos y mencionar a que figura geométrica se ajustarían los puntos.
MISCELÁNEAS
( ) La variable Y es independiente de X.
3. Al obtener la ecuación de regresión lineal simple para las variables dosis de una anestesia en mM/kg
(X) y horas de duración de la anestesia (Y), resulto:
( ) Cuando la dosis aumenta en un mM/kg, las horas de duración aumentan en 4,8 horas.
( ) Cuando la dosis aumenta en un mM/kg, las horas de duración aumentan en 0,2 horas.
( ) Cuando la dosis aumenta en 0,2 mM/kg, las horas de duración aumentan en una hora.
4. Con relación a la pregunta anterior, si la media aritmética de las dosis administradas es 10 mm/kg,
la media aritmética de la duración de la anestesia es:
( ) 6,8 horas.
( ) 4,8 horas.
( ) 2,0 horas.
( ) Se expresa en horas.
( ) Se expresa en mM /kg.
( ) No tiene unidades.
( ) Se expresa en horas.
( ) Se expresa en horas/mM/kg.
( ) Se expresa en mM/kg
( ) r de Pearson.
( ) 0,0005 < p < 0,005. Las dos variables no están lineal y estadísticamente correlacionadas.
( ) 0,001 < p < 0,01. Las dos variables están lineal y estadísticamente correlacionadas.
( ) La variabilidad total de X queda explicada en un 80% por la relación lineal existente entre ambas
variables.
( ) La variabilidad total de Y queda explicada en un 80% por la relación lineal existente entre ambas
variables.
( ) La variabilidad total de Y queda explicada en un 20% por la relación lineal existente entre ambas
variables.
16. Para cada una de las siguientes ecuaciones, identificar la ordenada en el origen o intercepto (a) y
el coeficiente de regresión o pendiente (b):
Y = -2 + 3X a = ________________ b =___________________
2Y = 4X a = ________________ b = __________________
( ) Un coeficiente de correlación de Pearson igual a -1 indica que los puntos no se ajustan a la recta
de regresión.
( ) Si r es mayor que 1, la recta ajustada explica más que suficientemente la relación existente entre
X e Y.
( ) El coeficiente r = -0,44, significa que por cada incremento en una unidad de X, Y disminuye en
0,44 unidades.
( ) Si el coeficiente de regresión lineal es igual a uno, significa que existe una correlación lineal
perfecta y positiva entre X e Y.
( ) En el clásico modelo de regresión puede realizarse también con sentido el análisis de correlación.
OBJETIVOS
LECTURA SUGERIDAS
Dawson B, Trapp R. Bioestadística médica. 4ta. ed. México: Manual Moderno; 2005
Hernández M. Epidemiologia. Diseño y análisis de estudios. 1a ed. México: Editorial
Medica Panamericana; 2009
Pagano M, Gauvreau K. Fundamentos. de Bioestadística. 2a ed. México: Thomson
Learning; 2001.
Silva LC. Excursión a la regresión logística en ciencias de la salud. 1a ed. España:
Ediciones Díaz de Santos; 1995.
PRACTICAS
1. En dos estudios de casos y controles realizados en una ciudad norteamericana sobre factores de
riesgo de cáncer ovárico epitelial, los investigadores consideraron el no tener un embarazo concluido
como un posible factor de riesgo. Se elaboraron las siguientes tablas de contingencia de 2X2, donde:
Casos = pacientes con cáncer y controles = pacientes sin cáncer.
Estudio 1 Estudio 2
Embarazos Grupo Embarazos Grupo
Total Total
concluidos Casos Controles concluidos Casos Controles
a. Analizar estadísticamente la tabla del Estudio 1, ¿Qué conclusión obtiene sobre la posible relación
entre embarazo y cáncer ovárico epitelial? Calcule e intérprete, además, el valor de OR y el intervalo
de confianza para OR.
b. Analizar estadísticamente la tabla del Estudio 2, ¿Qué conclusión obtiene sobre la posible relación
entre embarazo y cáncer ovárico epitelial? Calcule e intérprete, además, el valor de OR y el intervalo
de confianza para OR.
c. ¿Es conveniente obtener una sola tabla de ambos estudios (sumando las tablas individuales) y sobre
esta base llegar a una conclusión definitiva acerca de la posible relación entre las dos variables
calculando un chi-cuadrado y el OR? Diga, porque si y porque no.
2. Un grupo de niños de cinco años de edad y menores sin problemas respiratorios se incluyeron en
un estudio de grupo para analizar la relación entre el habito de fumar de sus madres (se uso como
indicador el numero de cigarrillos fumados por día) y el consecuente desarrollo de asma. Se
examinaron por separado en niños y niñas la relación entre la clasificación del habito de fumar de la
madre y el diagnostico de asma antes de los doce años de edad.
Niños Niñas
Numero de Diagnostico de asma Numero Diagnostico de asma
cigarrillos Total de Total
Si No Si No
cigarrillos
≥½ 17 63 80 ≥½ 8 55 63
cajetilla cajetilla
/día /día
a. Calcule el índice de disparidad (OR) de desarrollar asma en niños cuyas madres fuman por lo menos
media cajetilla de cigarrillos diaria en función de los niños cuyas madres fuman menos.
c. Lleve a cabo una prueba de homogeneidad para determinar si es apropiado combinar la información
en las tablas de 2x2 con el método de Mantel—Haenszel. ¿Cuál es su conclusión?
d. Si es conveniente, determine una estimación puntual para el índice de disparidad de resumen (OR
ajustado) y construya un intervalo de confianza de 95%.
e. ¿Qué haría usted si los resultados de la prueba de homogeneidad lo llevan a rechazar la hipótesis
nula de que el índice de disparidad es idéntico en niños y niñas?
3. Se tiene interés en evaluar si el uso de anticonceptivos orales es un factor de riesgo del infarto
miocardio en mujeres casadas menores de 45 años de edad. Para tal efecto se realiza un estudio
analítico de casos y controles y se obtienen los siguientes resultados:
Pacientes
USO DE Con infarto miocardico Sin infarto miocardico
ANTICONCEPTIVOS (Casos) (Controles)
ORALES
Si 23 34
Nunca 35 132
TOTAL 58 166
Usando los resultados obtenidos con el paquete estadístico SPSS, que se presentan en la tabla
siguiente, se pide:
b. Al contrastar la hipótesis H0: β1 = 0 mediante la prueba de Wald, ¿qué valor de p se obtuvo? ¿Cua1
es la conclusión?
4. Se realizo un estudio para determinar, mediante el modelo de regresión logística múltiple, los
factores asociados a la enfermedad cardiovascular (ECV) en pacientes hipertensos en un consultorio
de Cardiología. Como parte del estudio se recolectaron datos relacionados con edad, sexo, obesidad
y colesterol, se reunieron los datos a partir de una muestra aleatoria simple de 240 pacientes.
En base a los resultados que proporciona el paquete estadístico SPSS, que se muestran a continuación,
se pide:
MISCELÁNEAS
a. Una mezcla entre muchas variables, todas ellas interactuando entre si.
b. Una superposición del efecto de un factor de riesgo, extraño ("confusor"), sobre la estimada
relación existente entre la exposición que se estudia y la enfermedad que resulta.
c. Una distorsión que el factor de confusión ejerce, en una relación exposición enfermedad, sobre la
exposición pero no sobre la enfermedad.
d. Una distorsión que el factor de confusión ejerce, en una relación exposición enfermedad, sobre la
enfermedad pero no se relaciona con la exposición.
8. ( ) Un criterio practico importante que indica la presencia de confusión en una cierta medida de
asociación es la existencia de una diferencia entre una medida ajustada y la medida cruda.
9. ( ) Los sesgos de confusión se deben controlar mediante un diseño adecuado del estudio y si no
es así ya no se pueden controlar.
10. ( ) El método de Mantel y Haenszel es una estrategia para la obtención de una medida de
asociación libre de confusión o ajustada.
12. ( ) Se puede crear un modelo de regresión lineal simple, cuando la variable de respuesta (VD)
de interés es binaria utilizando la probabilidad de éxito como resultado.
𝑒 𝛼+𝛽𝑥
13. ( ) La función logística simple es:
1+𝑒 𝛼+𝛽𝑥
14. ( ) Se puede suponer que la relación entre ln (p/1 - p) y la variable X, en una relación bivariada,
es lineal.
15. ( ) Podemos aplicar el método de los mínimos cuadrados para obtener los parámetros α y β del
modelo logístico simple.
16. ( ) En un diseño de casos y controles para identificar factores de riesgo, se usara regresión
logística múltiple.
Supongamos que nos interesa la identificación de factores que influyen en la probabilidad de que un
niño con bajo peso al nacer sufra una hemorragia cerebral. La hemorragia es una variable aleatoria
binaria que toma el valor 1 si el evento ocurre y O si no ocurre. Utilizamos una muestra de 100 niños
con bajo peso al nacer del Instituto Materno Prenatal (IMP), para determinar la probabilidad de una
hemorragia.
Los valores de α y β1 fueron obtenidos, con los que se obtuvo la ecuación de regresión logística simple
siguiente:
20. ( ) Al calcular los límites del intervalo de confianza para OR de la pregunta 18, se encontró: IC
95% (0,71; 1,12), esto implica que, se rechaza la H0: βl = 0 y que la probabilidad de sufrir de
hemorragia cerebral varia según la circunferencia de la cabeza de un niño.
En los siguientes casos, señalar entre paréntesis si (S) e1 factor que se menciona es de confusión o no
(N) entre la exposición y la enfermedad:
RESPUESTAS