Você está na página 1de 239

1

1. DEFINICIÓN DE TÉRMINOS
ESTADÍSTICOS

Objetivos

1. Definir estadística descriptiva e Inferencial


2. Definir variable y escalas de medición
3. Definir población y muestra
4. Diferenciar entre un parámetro y un estadístico

Lectura sugeridas

 Daniel W. Bioestadística. Base para el análisis de las ciencias de la salud. 4ª ed. México.
Limusa Wiley; 2009
 .Dawson B, Trapp R. Bioestadística médica. 4ª ed. México: manual moderno;2005

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


2

PRACTICAS

1. A continuación se presenta en forma resumida la descripción de dos estudios. Analizar cada


caso y completar los espacios en blanco que más adelante se muestran:

I. En un estudio descriptivo cuyo objetivo fue determinar las complicaciones que


produce el uso de píldoras anticonceptivas, se tomo una muestra de 150 historias
clínicas de una población de 1800 usuarios atendidas en el 2012 en un hospital del
Ministerio de Salud. Algunas variables de interés fueron: tipo de complicaciones mas
frecuentes, tiempo de uso de la píldora antes que se produzca la complicaciones.
II. En el servicio de pediatría de un hospital del seguro social en el 2012, se compararon,
mediante un ensayo clínico, dos tratamientos para el asma crónica en niños. Se utilizo
una muestra de 60 niños con características similares y se asigno al azar cada niño a
uno de los dos tratamientos. Las principales variables de estudio fueron: frecuencia
respiratoria, evento adverso, tiempo de recuperación.

TÉRMINOS ESTUDIO I ESTUDIO II


Unidad de análisis Mujeres(usuarios) niños
Población Mujeres atendidas en el 2012 Niños tratados en 2012
Muestra 150 H.Cl 60 niños
Complicaciones más Frecuencia respiratoria
frecuentes
Variables
Tiempo de uso de píldora Evento adverso
Tiempo de recuperación
Cualitativa Nominal Cuantitativa discreta
Tipo de variable Cuantitativa Discreta Cualitativa nominal
Cuantitativa continua
Nominal intervalo
Escala de medición de la
intervalo Nominal
variable
intervalo
150 H.Cl atendidas en el Promedio de 60 niños
Parámetros
2012 hospitalizados en el 2012

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


3

Porcentaje o tasa de
prevalencia de niños que no
asistieron a la cita medica

Porcentaje de 60 niños que


Estadísticos
no asistieron

Nota: Para el estudio II, diga cuál es la variable independiente y cuales las dependientes.

Variable independiente: “Eficacia de los 2 tratamientos para la cura del asma crónica”

Variable dependiente: “Recuperación de los niños”

III. Un investigador neumólogo desea estimar la prevalencia de Infecciones Respiratorias


Agudas (IRA) en la población de escolares de primaria del distrito de Bellavista, Callao.
Toma una muestra de 350 alumnos a quienes examina clínicamente y obtiene una
prevalencia de 10%.

Usando estos resultados muéstrales realiza la estimación de la prevalencia poblacional.


Escribir entre paréntesis V o F, según corresponda:

( F ) Variable de estudio, edad


( V ) Se usara la estadística Inferencial
( F ) Unidad de análisis, infección respiratoria aguda
( V ) Población de estudio, todos los alumnos de primario del distrito.
( F ) Muestra de estudio, un alumno
( V ) Parámetro, prevalencia de IRAs de la población de alumnos
( F ) Los datos usados son secundarios
( V) Se utilizo la observación para obtener datos
( F) Parámetro, 10% de escolares con Iras en la muestra
( V) Escala de medición de años de estudio (primero, segundo…), ordinal.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


4

2. De la lista que sigue, tipificar cada variable (si es cuantitativa diga si es discreta o continua y
si es cualitativa diga si es dicotómica o politomica) y además escribir la escala de medición
utilizada.

Escala de medición de la
Variable Tipo
variable
Sexo cualitativa nominal Nominal, Dicotomica
Edad Cuantitativa continua Razón,
N°hijos/fam Cuantitativa discreta Razón
Talla Cuantitativa continua Razon
Tipo de diagnostico
Síntomas
N° emergencias/día Cuantitativa discreta Razon
Tipo de familia (nuclear, no Cualitativa Nominal Nominal,Dicotomica
nuclear)
Estados de conservación de Cualitativa nominal Nominal,politomica
la vivienda (bueno, reglar,
malo)
Nivel de instrucción Cualitativa ordinal Ordinal
Frecuencia cardiaca Cuantitativa discreta Intervalo
Puntaje de ansiedad
Valores de plomo en sangre Cuantitativa discreta intervalo
Estado nutricional de un Cualitativa nominal Nominal, politomica
niño (normal, desnutrido)
Score apgar del recién Cuantitativa discreta
nacido*
Grupo sanguíneo Cualitativa nominal Nominal
*La puntuación va de 0 a 10. A mayor puntuación, mejor estado de salud del bebe. La
evaluación se realiza al minuto y a los cincos minutos de nacimiento

3. Se desea determinar el estado nutricional de una población de estudiantes de ambos sexos


de primaria de 6 a 9 años de edad del Colegio El saber" en el 2012 La población a estudiar
está conformada por 680 niños Para el estudio se decide tomar una muestra de tamaño 100.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


5

Entre las características de interés están: sexo, talla, peso y otras como número de hermanos,
orden de nacimiento y presencia o ausencia de malformaciones congénitas

Indicar lo siguiente

a. Población de estudio: La población a estudiar está conformada por 680 niños


b. Muestra: La muestra a estudiar está conformada por 100 niños
c. Unidad de análisis: Niños
d. Variables. (Tipificar cada una e indicar la escala de medición utilizada.):
VARIABLES TIPO ESCALA DE MEDICION
Sexo Cualitativa nominal nominal
talla Cuantitativa continua Razón
Peso Cuantitativa continua Razón
número de hermanos Cuantitativa discreta Razon
orden de nacimiento Cualitativa Ordinal ordinal
presencia o ausencia de Cualitativa nominal nominal
malformaciones congénitas

e. ¿Qué parámetros y estadísticos calcularla para cada variable?:


Sexo: Porcentaje de 680 niños de 6 a 9 años de edad del Colegio El saber" en el 2012
Porcentaje de 100 niños de 6 a 9 años de edad del Colegio El saber" en el 2012
4. Para cada una de las siguientes situaciones A, B y C, responder a las preguntas:

Situación A. Un estudio en 300 hogares de un pequeño pueblo de la sierra del Perú revelo
que el 60% tiene al menos un hijo en edad escolar.

a. ¿Cuál es la unidad de análisis?


Hogares

b. ¿Cuál es la población de estudio?


Hogares de un pequeño pueblo del Perú

c. ¿Cuál es la muestra del estudio?


300 hogares

d. ¿Cua1 es la variable de interés?


Cuantos hijos tienen en edad escolar

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


6

e. ¿Qué tipo de variable es?


Cuantitativa discreta

f. ¿Qué escala de medición se utilizó?


Razón

g. ¿Cuántas mediciones se hicieron para calcular los resultados informados?

Situación B. Un estudio en 250 pacientes admitidos en un hospital limeño durante el año


pasado revelo que, en promedio, los pacientes viven en Lima 22,5 años.

a. ¿Cuál es la unidad de análisis?


Pacientes

b. ¿Cuál es la población de estudio?


Pacientes admitidos en un hospital limeño durante el año pasado

c. ¿Cuál es la muestra del estudio?


250 pacientes

d. ¿Cua1 es la variable de interés?


Promedio de tiempo que viven en lima

e. ¿Qué tipo de variable es?


Cuantitativa continua

f. ¿Qué escala de medición se utilizó?


Intervalo

g. ¿Cuántas mediciones se hicieron para calcular los resultados informados?

Situación C. En un estudio en 50 conductores de unidades de transporte público (Combis)


en Lima Metropolitana se determino que el nivel promedio de plomo en sangre fue de 8,6
ug/dl.

a. ¿Cuál es la unidad de análisis?


conductores

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


7

b. ¿Cuál es la población de estudio?


Conductores de unidades de transporte público (Combis) en Lima Metropolitana

c. ¿Cuál es la muestra del estudio?


50 conductores

d. ¿Cua1 es la variable de interés?


nivel promedio de plomo en sangre

e. ¿Qué tipo de variable es?


Cuantitativa continua

f. ¿Qué escala de medición se utilizo?


intervalo

g. ¿Cuántas mediciones se hicieron para calcular los resultados informados?

5. Señalar con una C o con una N, si las siguientes variables son cualitativas (categóricas)o
cuantitativas (numéricas), respectivamente:

• Tiempo para llegar a la universidad........................................................................ ( N )

• Distrito de residencia............................................................................................... (C)

• Raza de una población de animales experimentales............................................... ( C )

• Frecuencia cardiaca de ranas................................................................................... ( N )

• Depresión (puntajes) de una población de estudiantes............................................ ( N )

• Edad al morir de pacientes con síndrome de Down................................................. ( N )

• Nivel de instrucción de una muestra de estudio....................................................... ( C )

• Peso de una muestra de ratones................................................................................ ( N )

• Estadios de cáncer gástrico........................................................................................ ( C )

• Malformaciones congénitas...................................................................................... ( C )

• Anormalidades genéticas en recién nacidos,.............................................................. ( C )

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


8

• Valores de hemoglobina de pacientes con hemofilia................................................. ( N )

6. Señalar, asimismo, la escala de medición de cada una de las variables del ejercicio anterior.

• Tiempo para llegar a la universidad ( Intervalo)

• Distrito de residencia (Nominal)

• Raza de una población de animales experimentales (Nominal)

• Frecuencia cardiaca de ranas( Intervalo)

• Depresión (puntajes) de una población de estudiantes( Razon)

• Edad al morir de pacientes con síndrome de Down( intervalo)

• Nivel de instrucción de una muestra de estudio( ordinal)

• Peso de una muestra de ratones(razon)

• Estadios de cáncer gástrico(nominal)

• Malformaciones congénitas(nominal)

• Anormalidades genéticas en recién nacidos(nominal)

• Valores de hemoglobina de pacientes con hemofilia (intervalo)

7. Mencionar tres ejemplos de población de estudio.


8. Diga que variables (por lo menos tres) estudiaría en cada población de la pregunta anterior.

9. Se tienen los siguientes casos a y b:


a. Un estudiante de la especialidad de Ciencias del Ambiente tomo 20 muestras de agua
de 10 ml cada una a lo largo del rio Rímac para estudiar:

— Turbidez (grado 1, grado 2, etc.),

— Concentración de sales (ppm).

— pH.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


9

— Presencia de microorganismos (si, no).

— Numero de bacterias por muestra

b. Un investigador dispone de una población de N = 100 ratones, selecciona una muestra de


n = 12 y asigna al azar cada animal experimental a una de dos dietas (A y B) al final evalúa
el incremento del peso de cada animal con cada dieta.

• Para los casos a y b, señalar:

Población: agua de 10 ml cada una del rio Rímac


muestra 20 muestras
unidad de análisis agua
Turbidez (grado 1, grado 2, etc
Concentración de sales (ppm).
variables PH
Presencia de microorganismos (si, no).
Numero de bacterias por muestra
tipo de variable Cualitativa Ordinal

Cuantitativa continua
Cualitativa Nominal
Cuantitativa Discreta
Escala de medición. Ordinal

Intervalo
Nominal
Razon

Población: 100 ratones


muestra 12 ratones
unidad de análisis Ratones
variables incremento del peso de cada animal
tipo de variable Cuantitativa continua
Escala de medición. Razon

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


10

10. Para los estudios siguientes, indicar cuáles de las variables son dependientes (VD) y cuales
independientes (VI), o ni una cosa ni la otra.

a. Se compara AAS (acido acetilsalicilico) con un placebo para ver si reduce las
enfermedades coronarias.

La VI es: AAS (acido acetilsalicilico) (X)

La VD es: Enfermedades coronarias (Y)

La VINTER es: Placebo

b. La relación entre hipocolesterolemia y cáncer.

La VI es hipocolesterolemia

La VD es cáncer

La VINTER es relación

c. Sabemos que los miembros de algunas órdenes religiosas que tienen prohibidas las drogas,
el alcohol, el tabaco, la carne y el sexo (más que nada, por su perniciosa inclinación al baile)
viven más que el resto de los pobres mortales, pero ¿merece la pena? ¿Como los
compararíamos con nosotros en un test de calidad de vida?

La VI es las drogas, el alcohol, el tabaco, la carne y el sexo

La VD es viven más

La VINTER es test de calidad de vida

d. Un estudio (esta vez, real) prueba que los conductores de autobús tienen mayor tendencia
a las enfermedades coronarias que el resto de conductores.

La VI es conductores de autobús

La VD es enfermedades coronarias

La VINTER es estudio (esta vez, real)

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


11

11. Establecer cuáles de las variables cuantitativas son discretas (D) y cuales continuas (C).

a. El número de recidivas de un paciente con infección hasta su alta definitiva........... ( D )

b. E1 tiempo transcurrido desde que un paciente se mostro agradecido por lo que


hiciste........................................................................................................................... ( C)

c. El aumento de peso que has experimentado durante el último año............................. ( C


)

d. El numero de cabellos que se te han caído durante el mismo año...................……..... ( D


)

e. La edad de los estudiantes del salón............................................................................. ( C


)

f. El peso de una muestra de señoras bajo un régimen de dieta....................................... ( C


)

12. Indicar si las variables siguientes han sido medidas en escala nominal (N), ordinal (O),de intervalo
(I) o de razón (R).

a. Los ingresos de las familias limeñas.................................................................................... ( R )

b. Una lista de las diferentes especialidades en tu profesión................................................. ( N)

c. Edad de los médicos que laboran en tu hospital................................................................. ( R )

d. Número de puntos dolorosos en un sujeto que acude a un consultorio de reumatología…( R )

e. Etapas del cáncer de mama como tipos I, II, III, o IV......................................................... ( O )

f. Presión sanguínea diastólica, en mm de Hg......................................................................... ( I)

g. Medida de dolor en una escala de siete puntos.................................................................. ( O )

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


12

13. Los insecticidas aplicados en cultivos grandes pueden ocasionar inadvertidamente contaminación
del aire. El Centro Nacional de Salud Ocupacional y Protección del Ambiente para la Salud
(CENSOPAS) del Instituto Nacional de Salud (INS), informo sobre residuos tiónicos del insecticida
chlorpyrifos utilizado en huertos cercanos del Valle de Majes, Arequipa. Se recolectaron diariamente
especímenes (muestras) de aire en un huerto durante un periodo de rociado (un total de 13 días) y se
midió el nivel de residuos tiónicos (ng/m3) en los especímenes diarios.

a. Identificar la población de interés para los investigadores.

Residuos tiónicos del insecticida chlorpyrifos utilizado en huertos cercanos del Valle de Majes,
Arequipa

b. Identificar la muestra.

Recolección diaria de especímenes (muestras) de aire en un huerto durante un periodo de rociado


(un total de 13 días)

14. Los examinadores de tomografía computarizada (CT) son sistemas de cómputo visuales altamente
sensibles diseñados para apoyar los diagnósticos médicos mediante la generación de imágenes tipo
radiografía de órganos internos y funciones fisiológicas. Suponer que se desea estimar el tiempo de
barrido medio, es decir, el tiempo medio que tarda un examinador CT en proyectar una imagen.

a. Describir como se podría recoger los datos de muestra necesarios para hacer la inferencia
estadística deseada.

b. ¿Cuál es la población de interés?

Los examinadores de tomografía computarizada (CT)

15. Se realizo un estudio preliminar para obtener información sobre los niveles de fondo del
compuesto tóxico bifenilo per clorado (PCB) en muestras de suelos de un país determinado. Para cada
muestra de suelo que tomaron los investigadores anotaron el área (rural o urbana) y el nivel de PCB
(gramos por kilogramo de suelo). Tipificar las variables de estudio.

Niveles de fondo: Cuantitativa Discreta

Área: Cuantitativa continua

Nivel de PCB (gramos por kilogramo de suelo): Cuantitativa continúa

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


13

16. La confiabilidad de un sistema de cómputo se mide en términos de la vida de un componente de


hardware específico (por ejemplo, la unidad de disco). Con objeto de estimar la confiabilidad de un
sistema en particular, se prueban 100 componentes de computadora hasta que fallan, y se registra su
vida.

a. ¿Cuál es la población de interés?

b. ¿Cuál es la muestra?

c. ¿Son cuantitativos o cualitativos los datos?

d. ¿Cómo podría utilizarse la información de la muestra para estimar la confiabilidad del sistema
de cómputo?

MISCELÁNEAS

En las siguientes proposiciones señalar con X la alternativa correcta:

1. El método principal utilizado en la investigación científica, es:

( ) Método estadístico

( X) Método científico

( ) Método inductivo

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


14

( ) Método deductivo

2. En el proceso de investigación se distinguen tres etapas, que son: Planificación, ejecución y


evaluación. La etapa en la que se debe incluir el uso de la estadística, (por primera vez), es:

(X) Planificación

( ) Ejecución

( ) Evaluación

( ) Solo en la etapa de ejecución.

3. Señalar, de la lista siguiente de variables, la discontinua:

( ) Peso

( ) Velocidad

( ) Edad

(X) Numero de caries por persona.

4. ¿Cuál de las siguientes escalas de medición de variables tiene un cero absoluto?

( ) Nominal

( ) Ordinal

( ) De intervalo `

( X ) De razón

5. La siguiente proposición: “4 metros es a 2 metros como 2 metros es a 1 metro", es:

( ) Totalmente verdadera

( ) Parcialmente verdadera

( ) Parcialmente falsa

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


15

( ) Totalmente falsa

6. La siguiente proposición: "40°C es a 20°C como 20°C es a 10°C", es:

( ) Totalmente verdadera

( ) Parcialmente verdadera ’

( ) Parcialmente falsa

( ) Totalmente falsa

7. La siguiente afirmación: "la medida de variables discretas (discontinuas) es siempre H exacta, la


medida de variables continuas es siempre aproximada", es:

( X ) Totalmente verdadera

( ) Parcialmente verdadera

( ) Parcialmente falsa

( ) Totalmente falsa

8. El Índice de masa corporal (IMC) se obtiene como: IMC = masa (kg) / (estatura2 (m). El IMC se
mide en escala:

( ) Nominal

( X ) Ordinal

( ) De intervalo

( ) De razón

9. El objetivo principal de la Estadística Descriptiva es:

( ) Describir conjuntes de dates numéricos.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


16

( ) Generalizar resultados obtenidos en una muestra a la población y correspondiente. Resultados


obtenidos en un estudie.

(X ) Obtener y clasificar datos obtenidos en un estudio.

10. El objetivo principal de la Estadística Inferencial es:

( ) Describir conjuntos de datos numérico sutilizando números absolutos y porcentajes.

( ) Generalizar resultados obtenidos en una muestra a la población correspondiente.

( X ) Presentar en forma adecuada (concisa, clara y comprensible) los datos o resultados


obtenidos en un estudio.

( ) Obtener y clasificar datos obtenidos en un estudie.

11. El número de seguro social es una variable medida en escala:

( ) Nominal

( ) Ordinal

( ) De intervalo

( ) De razón

12. Los puntajes obtenidos en una escala de actitudes, se mide en escala:

( ) Nominal

( ) Ordinal

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


17

( ) De intervalo

( X ) De razón.

13. La siguiente afirmación "la escala de razón comienza desde el cero y aumenta en números
sucesivos iguales a cantidades del atributo que está siendo medido", es:

( X ) Totalmente verdadera

( ) Parcialmente verdadera

( ) Parcialmente falsa

( ) Totalmente falsa

14. Supongamos que en la población de pacientes que pertenecen al programa de diabetes del Hospital
Nacional Arzobispo Loayza se obtuvo la varianza de los pesos, resultando 100 kg2, este resultado es:

( ) Un dato estadístico; es decir, un valor particular de la variable peso.

( ) La unidad de análisis

( X ) Un parámetro

( ) Un estadístico

15. Con referencia a la pregunta anterior, supongamos que de la población se selecciona una muestra
de n= 120 pacientes y se determina que el 20% de la muestra fuma cigarrillos, este resultado es:

( ) Un dato estadístico; es decir, un valor particular de la variable de estudio

( ) La unidad de análisis

( ) Un parámetro

( X ) Un estadístico

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


18

16. Se dice que el parámetro es fijo para la población de estudio, mientras que el estadístico es variable
de muestra a muestra. Esta afirmación es:

( ) Totalmente verdadera

( X ) Parcialmente verdadera

( ) Parcialmente falsa

( ) Totalmente.

17. Indicar si con la siguiente proposición: "La existencia de un cero en la escala Celsius (grados
centígrados) no supone la ausencia de temperatura, puesto que el cero grados centígrados está situado
por arbitrio de los creadores de la escala. Por el contrario, la escala Kelvin si tiene un cero absoluto,
precisamente allí donde las moléculas cesan su actividad y no se produce por lo tanto roce entre los
componentes moleculares. El cero absoluto de la escala Kelvin se sitúa a unos -273 grados
centígrados", esta:

( ) Totalmente en descuerdo

( ) En desacuerdo

( ) Indeciso

( ) De acuerdo

( X) Totalmente de acuerdo

18. Indicar si con la siguiente proposición: "Una de las características de las escalas de medición de
orden superior es que se las puede transformar fácilmente en escalas de orden más bajo. Sin embargo,
no es posible efectuar la transformación inversa”, esta:

( ) Totalmente en descuerdo

( ) En desacuerdo

( ) Indeciso

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


19

( ) De acuerdo

( ) Totalmente de acuerdo

19. El nivel de medición de la dureza de los minerales según la Escala de Mohs (La escala de Mohs
es una relación de diez materiales ordenados en función de su dureza, de menor a mayor), es:

( ) Nominal

( X ) Ordinal

( ) De intervalo

( ) De razón

20. El tipo de variable y escala de medición de los puntajes de la escala de Glasgow*, son:

( ) Cualitativa y nominal

( X ) Cuantitativa y ordinal

( ) Cuantitativa y de intervalo

( ) Cuantitativa y de razón

¿Propone otra combinación? Si X No____

¿Cuál?: Cualitativa y ordinal

*La “Escala de Coma de Glasgow” es una escala neurológica diseñada para evaluar el nivel de
consciencia de los pacientes que han sufrido un traumatismo craneoencefálico (TCE) durante las
primeras 24 horas pos trauma, al valorar tres parámetros: apertura ocular, respuesta motora y
respuesta verbal. Actualmente es empleada en varios campos de la medicina.

Descripción de la escala

La escala está compuesta por tres parámetros: respuesta ocular, verbal y motora. A cada uno se le
asigna un valor dependiendo de la respuesta del paciente, los resultados se suman al final para realizar
la interpretación. El valor más bajo que puede obtenerse es de 3 (1 +1 +1), y el más alto de 15 (4 +5
+6).

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


20

“Respuesta ocular” (E)

• Espontanea:’4 ‘

• Estimulo al verbal (al pedírselo):’3 ‘

• Al recibir un estimulo do1oroso:’2 ‘

• No responde:’1 ‘

“Respuesta verbal” (V)

• Orientado:’5 ‘

• Confuso:’4 ‘

• Palabras inapropiadas:’3 ‘

• Sonidos incomprensibles:’2 ‘

• No responde:’1 ‘

“Respuesta motora” (M)

• Cumple ordenes expresadas por voz:’6 ‘

• Localiza el estimulo doloroso:’5’

• Retira ante el estimulo doloroso:’4 ‘

• Respuesta en flexión (postura de decorticaci6n):’3 ‘

• Respuesta en extensión (postura de descerebraci6n):’2 ‘

• No responde:’1 ‘

Interpretación

La puntuación es el principal factor pronóstico en el TCE e indica la terapéutica a emplear; Puede


aplicarse en repetidas exploraciones para realizar un seguimiento de estado neurológico. De acuerdo
con la puntuación obtenida, a los pacientes se les clasifica como:

• TCE leve: 14 -15

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


21

• TCE moderado: 9 - 13

• TCE severo: <8 de mal pronóstico, requiere Intubación

21. En un estudio se desea evaluar ciertas características en una población de neonatos. ¿Cuáles de
las siguientes variables ejemplifican adecuadamente el nivel 0 escala de medición? (Llenar cada
espacio en blanco con su respuesta. Usar cada letra tantas veces como sea necesario)

A. Discreta

B. De razón

C. Ordinal

D. Nominal

E. Dicotómica

a. B peso del neonato en gramos

b. C peso del neonato clasificado como bajo, medio, alto.

c. D tipo de parto clasificado como cesárea, natural, inducido.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


22

2. CLASIFICACION Y PRESENTACION DE
DATOS

Objetivos

1. Clasificar datos categóricos.


2. Clasificar datos numéricos.
3. Elaborar y describir una tabla estadística con todos sus elementos.
4. Elaborar y describir gráficos estadísticos de acuerdo al tipo de variable.

Lectura sugeridas

 Daniel W. Bioestadística. Base para el análisis de las ciencias de la salud. 4ª ed. México.
Limusa Wiley; 2009
 .Dawson B, Trapp R. Bioestadística médica. 4ª ed. México: manual moderno;2005
 Pagano M, Gauvreau Ke. Fundamentos de Bioestadística. 2a ed. México: Thomson
Learning 2001.

PRACTICAS

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


23

1. En una muestra de 100 escolares, los investigadores encontraron 25 desnutridos y 75 normal es así
mismo, de los 55 escolares de sexo masculino, 10 estaban desnutridos.

a. Elaborar una tabla de 2x2 con todos sus elementos.

b. Realizar un breve comentario de la posible asociación entre sexo y estado nutricional.

Calcular los porcentajes necesarios para apreciar la posible asociación.

c. ¿Qué información falta para escribir el titulo de la tabla?

d. Representar gráficamente la tabla anterior.

2. La siguiente información fue obtenida en un estudio realizado en el 2012, en el Instituto Nacional


de Salud Mental "Hideyo Noguchi - Honorio Delgado" en pacientes mayores de 80 años.

Tabla1.....................................................................................................................................................
...............................................................................................................................................................

DIAGNOSTICO PSIQUIATRICO NUMERO DE PACIENTES


Normal 90
Enfermedad de Parkinson 10
Total 100

a. Escribir el titulo de la tabla (En el espacio de la parte superior)

b. La variable de interés se mide en escala:

c. Elaborar el grafico correspondiente.

3. Para el informe de una investigación realizada en pacientes con cáncer gástrico del Hospital Dos
de mayo en el año 2012, se elaboré la siguiente tabla:

Tabla2.....................................................................................................................................................
...............................................................................................................................................................

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


24

GRADO DEPRESIÓN
HISTOLÓGICO Total
Leve Moderado Severa
DEL CÁNCER
I 362 317 60 739
II 29 11 15 55
III 9 15 20 44
Total 400 343 95 838

a. Escribir el titulo de la tabla (En el espacio de la parte superior)

b. La escala de medición para medir depresión y grado histológico del cáncer es:

_____________________________________________________________________

c. Calcular los porcentajes a fin de "visualizar" una posible asociación entre ambas variables

y realizar una breve descripción de la tabla.

d. Elaborar el grafico correspondiente.

e. Los valores de colesterol total en una muestra de 200 pacientes se encuentran entre 119 y 310.

f. Calcular los límites de los intervalos de clase utilizados para la clasificación.

g. Obtener los límites reales y los puntos medios de los intervalos de clase.

4. Los pesos (Kg) de una muestra de 50 pacientes del servicio de cardiología de un hospital

nacional, fueron:

80 79 69 80 77 69 80 76 90 72
75 76 79 74 71 78 77 80 76 79
70 73 78 72 68 70 91 66 79 75
89 88 91 86 83 81 68 79 80 85

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


25

83 82 81 80 78 73 79 84 68 66

a. Construir la tabla de frecuencias (obtenga todas las frecuencias, puntos medios o marcas de
clase y los límites reales.)
b. Graficar el polígono de frecuencias relativas acumuladas (ojiva porcentual). ¿Puede decir que
la distribución de la variable tiende a la simetría? ¿Qué utilidad, además tiene este grafico?
c. Usando este grafico, ¿cuánto es aproximadamente, el percentil 50?
d. Elaborar un grafico de tallo y hojas

5. Se tiene los pesos (g) de una muestra de 50 arrímales de experimentación.

30 34 32 23 31 30 23 21 20 30
23 25 31 30 35 29 27 28 26 32
25 27 24 22 29 29 27 32 33 26
27 28 26 25 40 43 34 29 32 24
22 41 38 37 24 29 28 27 36 39

a. Obtener las tablas de distribuciones de frecuencias simples (Qi) y acumuladas (Fi).


b. Calcular los puntos medios y los límites verdaderos.
c. Obtener los gráficos correspondientes.
d. Obtener el gráfico de tallo y hojas.
e. Describir la forma de la distribución de la variable.

6. A continuación se presentan las edades (años) de una muestra de 58 pacientes con síndrome de
Down:

23 10 24 18 12 8 10 20 21 29 4 30 25 20 8
14 7 15 8 4 10 11 9 22 29 30 31 38 7 15
18 22 40 19 2 25 22 4 18 10 19 29 21 23 28
17 16 15 25 13 41 26 11 9 7 6 26 23

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


26

Contestar a todas las preguntas del ejercicio anterior.

7. Un químico ambientalista tomé una muestra de 40 escolares de un colegio de Callao y obtuvo


las siguientes concentraciones de plomo (Pb) en sangre en µg/ dl. (Datos redondeados al entero).
Los resultados fueron:

7 5 8 6 7 9 8 10 3 4 5 7 6 12 11 3 1 4 5 8
2 4 3 14 6 7 9 5 8 11 13 4 5 6 7 4 6 1 10 11

a. Elaborar una tabla de frecuencias absolutas simples.

b. Obtener y describir el histograma y polígono de la tabla anterior.

c. Elaborar una tabla de frecuencias relativas acumuladas. Graficar y describir.

d. ¿Qué información falta para una adecuada presentación de los datos?

e. La variable, ¿tiende a la simetría o asimetría?

f. Si tener Pb en sangre ≥10 µg/ dl indica intoxicación, ¿qué proporción de escolares se encuentra
en esta condición?

g. Obtener y describir el diagrama de tallo y hojas

8. Se tienen las concentraciones de calcio en 45 hojas de nabo (porcentaje de peso seco por hoja).

3.2 3.0 3.3 3.5 3.5 3.4 2.8 3.0 3.2 2.7 2.9 2.6 3.3 3.1 3.2
3.4 3.2 3.1 3.0 2.9 2.4 2.8 3.3 2.6 2.5 2.7 2.8 3.2 3.3 3.0
3.1 3.7 3.5 3.5 2.9 3.6 3.2 3.3 2.7 3.5 2.8 3.5 3.4 3.5 3.1

a. Obtener la tabla de distribución de frecuencias absolutas simples.

b. Representar gráficamente (histograma y polígono) la tabla anterior, describir brevemente.

c. Puede decirse que las concentraciones de calcio tienden a la simetría?

d. Decir por lo menos dos motivos por los que se construye una tabla de frecuencias.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


27

9. Supongamos que los pesos (kg) de una muestra de 40 escolares de 8 y 9 años, son:

30 32 28 27 30 32 26 27 28 25
26 30 28 31 26 23 24 25 27 31
27 26 29 30 31 27 24 30 28 29
31 27 25 24 23 22 31 28 30 26

a. Obtener las (4) tablas de distribuciones de frecuencias.

b. Asimismo, obtener los gráficos correspondientes.

c. ¿Puede considerarse, observando el histograma de frecuencias absolutas simples, a la


distribución de estos 40 datos con tendencia a la simetría?

d. ¿Qué información falta para una adecuada presentación de los datos? ·

e. Utilizando el polígono de frecuencias relativas acumuladas (%) u ojiva porcentual, decir si


la distribución de los datos tiende a la simetría o asimetría.

f. Mediante el gráfico anterior, determinar aproximadamente el percentil 75.

g. ¿Por qué es importante averiguar la simetría o asimetría de las distribuciones?

10. Se tiene la siguiente tabla de frecuencias incompleta:

Intervalo fi Fi hi Hi Puntos Limites


de clase medios (xi) reales

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


28

- 28 6
28 - 0,2 31,5
- 18 0,3
-
- 0,1 0,9
-
Total

Completar la tabla anterior sabiendo que n = 60 y los intervalos tienen la misma amplitud.

11. En un estudio para determinar el efecto de fumar cigarrillos en el metabolismo de la fenacetina*,


se midió el nivel de ésta en el plasma (mg/ml) dos horas después de la administración la droga a
100 fumadores y 120 personas que no fumaban. A continuación se dan los resultados:

FENACETINA (mg/ml) NO FUMADORES FUMADORES


fi fi
0.0 – 0.4 10 39
0.5 – 0.9 10 16
1.0 – 1.4 20 21
1.5 – 1.9 30 10
2.0 – 2.4 10 5
2.5 – 2.9 20 9
3.0 – 3.4 10 0
3.5 – 3.9 10 0
*fármacos para tratar el dolor muscular.

Sobre los mismos ejes con forma porcentual (hi%) elaborar los polígonos de los niveles de
fenacetina en fumadores y no fumadores. Comentar los resultados.

12. Con referencia al estudio sobre los insecticidas empleados en huertos laterales en el valle de
Majes - Arequipa (Ejercicio 13, de la Practica 1). Sc tomaron y analizaron diariamente

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


29

muestras de aire en un huerto durante el periodo de fumigación. En la tabla se presentan los


niveles de residuos tiónicos y oxonicos (en mg/m3) en las muestras de aire.

Fecha Condición tionicos oxonicos Razón oxon/tion


Ene. 15 Niebla 38.2 10.3 0.270
17 Niebla 28.6 6.9 0.241
18 Niebla 30.2 6.2 0.205
19 Niebla 23.7 12.4 0.523
20 Niebla 62.3 Muestra de aire ____
perdida
20 Despejado 74.1 45.8 0.618
21 Niebla 88.2 9.9 0.112
21 Despejado 46.4 27.4 0.591
22 Niebla 135.9 44.8 0.330
23 Niebla 102.9 27.8 0.270
23 Nublado 28.9 6.5 0.225
25 Nublado 46.9 11.2 0.239
25 Despejado 44.3 16.6 0.375

a. Verificar el cálculo de las razones oxon/ tión (redondeados a tres decimales).

b. Resumir las razones oxor1/ tión diarias con un gratico de tallo y hojas y describir dicho grafico

c. Comentar la afirmación "La razón oxon/ tión para el insecticida chlorpyrifos es mayor en el

aire despejado/nublado que en el aire con nieb1a"

13. En la siguiente tabla se presentan las tasas de mortalidad infantil (TMI) por mil nacidos vivos
(NV) del Perú para diferentes periodos, publicadas por el INEI.

Años TMI x 1000 NV

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


30

1991 - 2 57
1996 43
2000 33
2004 – 5 24
2004 – 6 21
2007 – 8 19
2010 17
Fuente: INEI Encuesta Demográfica y de Salud Familiar {ENDES. 1991- 2008-2010)

a. Elaborar el grafico adecuado para apreciar la tendencia de las TMI. (Suponiendo que en todo el
periodo se uso la misma metodología para la obtención de datos)

b. Describir el grafico y comentar sobre los factores que estarían explicando la tendencia
observada.

14. Muchos veteranos de Vietnam tienen niveles peligrosamente altos de dioxina 2, 3, 7,8 — TCDD
en sangre y er1 tejidos grasos a consecuencia de su exposición al de foliador Agente Naranja. Un
estudio publicado en Chemosphere informo sobre niveles de TCD en 20 veteranos de Vietnam de
Massachusetts que posiblemente estuvieron expuestos al Agente Naranja. Las concentraciones de
TCDD (en partes por billón) en plasma sanguíneo y tejido graso extraído de cada veterano se muestran
en la tabla que sigue.

Utilizar una técnica gráfica para comparar las distribuciones de los niveles de TCDD en plasma y
tejido graso.

Niveles de TCDD en plasma Niveles de TCDD en tejido graso


2,5 4,9
3,5 4,4
6,8 6,9
4,7 4,2
4,6 10,0
1,8 41,0
2,5 4,4
3,1 2,9
3,1 4,6
3,0 7,7

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


31

6,9 1,1
3,3 2,5
1,6 2,3
7,2 5,9
20,0 11,0
2,0 2,5
4,1 7,0
2,1 1,4
1,8 5,5
36,0 7,0

MISCELÁNEAS

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


32

En las siguientes proposiciones señalar con X la alternativa correcta:

1. Cierta variable de estudio se expresa hasta con tres decimales, la unidad de medida para la
clasificación de estos valores cuando se elabora la tabla de frecuencias, es:

( )1

( ) 0,005

( ) 0,1

( ) 0,001

( ) 0,01

2. En la presentación tabular de la información, las variables en estudio son ubicadas en:

( ) Cuerpo

( ) Indistintamente, matriz/cuerpo

( ) Depende de la variable en estudio

( ) Matriz

( ) Notas aclaratorias

3. En una tabla de doble entrada (bivariada) o tabla de contingencia, que se elabora con la finalidad
de determinar la posible asociación entre dos variables. Si en filas se presenta la variable
independiente y en columnas la dependiente, los porcentajes se obtienen tomando como 100%:

( ) El total general

( ) Totales de tilas

( ) Totales de columnas

( ) Cualquiera

( ) N.A.

4. El tipo de gráfico depende fundamentalmente de:

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


33

( ) Tipo de variable

( ) Tipo de tabla

( ) Tipo de frecuencia

( ) Escala de medición

( ) Si la variable es continua o discreta

5. Uno de los siguientes elementos es exclusivamente del gratico

( ) Titulo

( ) Matriz

( ) Cuerpo

( ) Escala

( ) Fuente

6. El gráfico que tiene la forma de una "ese" alargada para indicar tendencia a la simetría de un
conjunto de datos cuantitativos es:

( ) Polígono de frecuencias relativas simples ·

( ) Histograma de frecuencias relativas acumuladas

( ) Histograma de frecuencias relativas simples.

( ) Ojiva porcentual

7. E1 gráfico que debe tener la forma de una "campana" 0 "j0r0ba" para indicar tendenciaa la simetría
de un conjunto de datos cuantitativos es:

( ) Polígono de frecuencias relativas simples

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


34

( ) Histograma de frecuencias relativas acumuladas

( ) Ojiva porcentual

( ) Barras superpuestas

( ) N.A.

8. Para representar gráficamente la tabla bivariada en la que se presenta las variables practicar
deporte (No, a veces y siempre) y fumar cigarrillos (Si, No), se usaría el gráfico:

( ) De barras simples

( ) Histograma de frecuencias relativas simples (hi %) ‘

( ) Polígono de frecuencias relativas acumuladas (Hi%)

( ) De sectores circulares

( ) De barras superpuestas

9. En la clasificación de datos cuantitativos, el número de intervalos de clase o clases, está en


relación directa con:

( ) Tipo de variable (si es discreta o continua)

( ) La unidad de medida

( ) E1 numero de datos

( ) La dispersión o variabilidad de los datos (amplitud total)

( ) La dispersión y numero de datos

10. Supongamos que se dispone de las edades de una muestra de n = 120 pacientes y se desea clasificar
estos datos. E1 numero recomendable de intervalos de clase que tendría la tabla de frecuencias, es:

( )5

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


35

( ) 6

( )7

( )8

( ) 9

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


36

3. MEDIDAS DE RESUMEN

Objetivos

1. Usar adecuadamente las medidas de resumen para variables cualitativas


2. Usar adecuadamente las medidas de resumen para variables cuantitativas.
3. Calcular e interpretar 1a media aritmética y desviación estándar
4. Calcular e interpretar la mediana y 1a desviación cuartil
5. Calcular e interpretar un percentil en una tabla de frecuencias

Lectura sugeridas

 Norman G, Streiner D. Bioestadística. 1a ed. Madrid España: Mosby/Doyma Libros,


S.A.; 1996.
 Pagano M, Gauvreau K. Fundamentos de Bioestadística. 2a ed. México: Thomson
Learning; 2001
 Royo MA, Moreno JD. Método epidemiológico. 1a ed. Madrid España: ENS- Instituto
de Salud Carlos III- Ministerio de Ciencia e Innovación; Octubre de 2009.

PRACTICAS

1. Calcular la media aritmética, la mediana y la moda para el siguiente conjunto de datos muestrales:
4, 3, 10, 8, 5.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


37

Media aritmética:_____________________________

Mediana: ___________________________________

Moda:______________________________________

2. Solo para que practiques un poco, calcula las siguientes medidas estadísticas de la muestra de datos
que sigue (damos números sencillos de forma deliberada, de modo que no necesitas calculadora): 4 8
634

La media_____________________________________________

La mediana___________________________________________

La moda_______________________________________________

El recorrido o amplitud total_______________________________

La varianza____________________________________________

La desviación estándar____________________________________

E1 coeficiente de variación__________________________________

Los datos que siguen corresponden a días de hospitalización de una muestra de ocho pacientes: 3, 6,
14, 4, 4, 2, 5, 6. Para estos datos:(Preguntas 3 a 7)

3. La moda es:

( ) 4 días

( ) 6 días

( ) 4 y 6 días

( ) 5 días

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


38

4. La mediana es: A

( ) 4 días

( ) 6 días

( ) 5,5 días

( ) 5 días

5. La media aritmética es:

( ) 4 días

( ) 6 días

( ) 5,5 días

( ) 5 días

6. E1 rango total es:

( ) 10 días

( ) 3,16 días

( ) 5 días

( ) N .A.

7. La desviación estándar es:

( ) 10 días

( ) 3,16 días

( ) 5 días

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


39

( ) N .A.

8. Calcular e interpretar la media, mediana y moda para el conjunto de datos de la razón oxon/tion
del Ejercicio 12 de la Practica 2. ¿Cuál es la medida de tendencia central adecuada y por qué?

Media aritmética: ______________________ Interpretación: ________________________

Mediana: _____________________________ Interpretación: _______________________

Moda: _______________________________ Interpretación: _______________________

9. Un investigador dispone de una muestra de 12 animales experimentales y asigna al azar cada animal
a una de dos dietas (A y B) al final del estudio se obtuvieron los siguientes datos que son los pesos
(gramos) de los ratones antes y después de recibir las dietas:

DIETA
A B
Antes Después di Antes Después di
19 20 24 24
20 21 23 22
18 22 23 24
22 23 24 22
20 24 21 24
23 25 20 20

a. Calcular la variación, di, (restar después menos antes) de los pesos de cada animal para cada tipo
de dieta.

b. Calcular e interpretar la moda, mediana, media aritmética, amplitud, desviación estándar, varianza,
coeficiente de variación de las diferencias (di) para cada tipo de dieta.

c. Realizar un comentario sobre el efecto de cada dieta. ¿Qué dieta produjo mayor incremento de
peso?

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


40

10. Se tienen las edades de una muestra de 10 mujeres que utilizan anticonceptivos orales: 20, 21, 21,
19,17, 22, 23, 24, 21, 22

a. Calcular la media aritmética, mediana y moda

b. Explicar las eventuales diferencias.

11. En una investigación se desea comparar dos tipos de dietas para la disminución de peso en
pacientes obesos. Después de su aplicación, las disminuciones de los pesos (Kg) fueron:

Dieta 1: 3, 4, 5, 6, 9

Dieta 2: 1, 4, 5, 6, 7

a. Calcular la media aritmética y 1a desviación estándar para cada tipo de dieta.

b. Explicar las eventuales diferencias.

c. A la luz de las medias aritméticas, ¿cuál de las dietas produce mayor disminución de peso? ¿Con
estos resultados se puede obtener conclusiones respecto a la eficacia de las dietas?

12. Tres investigadores médicos del Instituto Nacional del Nino (2010) estudiaron un grupo de 76
lactantes que habían padecido un inexplicable episodio de apnea durante el sueño (Tabla 1). Del total,
25 de los lactantes tuvieron episodios repetidos de apnea en el sueño y siete de estos murieron. Entre
los 51 lactantes cuyo episodio de apnea no se repitió, tres murieron.

a. Calcular la proporción de fallecidos en el grupo de los que tuvieron episodios repetidos de


apnea.

b. Calcular la proporción de fallecidos en el grupo de los que no tuvieron episodios repetidos de


apnea.

c. Determinar el riesgo de muerte en lactantes que habían tenido episodios repetidos de apnea
respecto a los que no los padecieron.

d. ¿Cuántos lactantes, de los que requirieron estimulación vigorosa, fallecieron?

Tabla 1. Datos de lactantes con apnea durante el sueño.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


41

Numero de lactantes Índice de mortalidad


(%)
Todos los lactantes 76 13,2
Lactantes con Que requieren 12 25,0
episodios repetidos de estimulación vigorosa
apnea durante el Que requieren 13 30,0
sueño resucitación
Hermanos de victima de SMSI 8 25,0
Lactante con convulsiones y episodios 7 57,1
repetidos de panea que requieren estimulación
vigorosa y resucitación
SMSI: Síndrome de muerte infantil súbita.

13. Un investigador tiene los siguientes datos sobre tiempos de atención médica de una muestra de
50 pacientes.

Tiempo (minutos) fi
5-7 3
8 - 10 8
11 - 13 16
14 - 16 15
17 - 19 6
20 - 22 2
Total 50

a. Según la forma de la distribución, ¿cuál es la mejor medida de tendencia central?

b. (OPCIONAL) Calcular e interpretar la media aritmética, la desviación estándar y el y


coeficiente de variación del tiempo de atención médica.

c. Calcular e interpretar la mediana y el rango intercuartilico (RIC).

d. Calcular los Valores (Q1 — 1,5*RIC) y (Q3 + 1,5*RIC). ¿Cuál es la utilidad de estos
valores?¿Hay algún valor fuera de estos límites?¿Qué nombre tienen estos valores?

e. Elabora el diagrama de caja y bigotes.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


42

f. ¿Es la moda igual a 9 minutos?

g, ¿En qué intervalo se encuentra el percentil 75? Calcular e interpretar el resultado.

h. ¿En cuál el percentil 95? Calcular e interpretar el resultado.

14. Los datos de la Tabla 2 son cambios de diámetros vasculares de una muestra de 10 pacientes.

Tabla 2. Cambio típico en el diámetro vascular (Xi) en pacientes sin crecimiento de la lesión.

Paciente Xi
1 0,15
2 0
3 -0,18
4 -0,15
5 0,21
6 0,45
7 0,42
8 -0,12
9 0,16
10 0,06
a. Calcular la media aritmética de estos dates.

b. Calcular la suma de las desviaciones (Xi -𝑋̅ ) y demostrar que la suma es cero.

c. Calcular e interpretar la desviación estándar de los datos.

d. Asimismo, calcular e interpretar la moda y la mediana de los datos.

e. Calcular el coeficiente de variación.

15. Para ilustrar· que solo (n-1) desviaciones de la media (Xi —𝑋̅) tienen la libertad de
variar,considerar la edad de cinco pacientes. De la edad de cada paciente se resté el promedioy se
obtuvieron las desviaciones que se observan a continuación:

Paciente Edad en desviaciones a partir de la edad


̅ )
promedio (Xi - 𝑿

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


43

1 10
2 -7
3 -5
4 3
5
̅̅̅̅= 0
∑(𝐗𝐢 − 𝑿)
a. ¿Cuánto es (X5 —𝑋̅ )

b. Si la media de edad de los pacientes es 40, ¿cuáles son las edades de los cinco pacientes?

c. Calcular e interpretar la desviación estándar de las cinco edades.

16. Usar los datos del Tabla 3 para comparar el número total de pacientes con infección por
gramnegativos que reciben vacuna J5 versus placebo.

Tabla 3. Episodios de infección por gramnegativos en pacientes quirúrgicos tratados con J5


frente a controles.

Episodio Cirugía abdominal Total de pacientes


J5 Control J5 Control
Shock 2 13 6 15
Shock 1 9 2 9
irreversible
N° de infectados 8 15 16 23

Total de 71 83 126 136


pacientes
a. Calcular la proporción de infectados que recibieron la vacuna J5.

b. Calcular la proporción de infectados que recibieron placebo.

c. ¿Qué conclusión se extrae si se determina el riesgo relativo de infección cuando los pacientes
reciben placebo respecto a los que reciben la vacuna J5?

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


44

17. En un estudio prospectivo no aleatorio, publicado por Stone y col. (2005) donde se determino si
la vagotomía truncal con gastrectomía Bilroth II podría prevenir la pancreatitis recurrente inducida
por alcohol, se encontró que de los 125 pacientes, que reunieron los criterios de inclusión, 61
rehusaron participar, 33 se les motivo para abstenerse de consumir alcohol y 31 fueron intervenidos
quirúrgicamente. Los resultados se dan en la siguiente tabla:

Tabla 4. Recurrencia de pancreatitis aguda inducida por alcohol.

Total de Pacientes con Recurrencia por


pacientes recurrencias de paciente
pancreatitis
N° participaron 61 49 (80%) 1,9 (93)
Motivados a abstenerse 33 24 (73%) 1,7 (41)
Intervenidos quirúrgicamente 31 2 (6%) 1,0 (2)

a. Verificar e interpretar los porcentajes que aparecen entre paréntesis.

b. Igualmente volver a calcular las recurrencias por paciente e interpretar los resultados.

18. En un laboratorio clínico se hicieron pruebas en tres instrumentos nuevos que se usaron 5para
llevar a cabo cierta medición en la química sanguínea. Las soluciones de prueba se prepararon
conteniendo una concentración conocida (10 mg/ ml) de la sustancia que se iba a determinar, a
continuación se dan los resultados que se obtuvieron con los tres instrumentos experimentales:

INSTRUMENTOS
I II III
5 10 10
10 9 11
7 10 9
15 9 10
16 11 10
12 9 9
14 10 11
8 8 8

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


45

10 10 8
13 9 10

1. Determinar la media, mediana, moda, desviación estándar y coeficiente de variación de los tres
instrumentos.

2. En mediciones clínicas se tienen tres términos que se emplean con frecuencia, la precisión,
ausencia de desviaciones y exactitud. La precisión, se relaciona con la extensión o la dispersión
de un conjunto de observaciones y se mide a través de la desviación estándar. La ausencia de
desviaciones se asocia con la tendencia de un conjunto de mediciones, para ser iguales a un valor
"real o verdadero". Para que un instrumento sea exacto, es preciso que sus lecturas sean al mismo
tiempo precisas y carentes de desviaciones. Describir los tres instrumentos en función de V las
definiciones antes citadas.

19. Se evalúa la eficacia de un producto antihipertensivo mediante un diseño antes — después 1 (es
decir, antes y después de aplicar el producto se determina la presión arterial de cada paciente), los
datos que siguen son diferencias obtenidas restando (antes — después): 5, 3, 4, O, 6, -2, 3, 5, -3, 3.
Se pide, calcular e interpretar la media aritmética y desviación estándar de estos datos.

REGLA EMPIRICA

Si un conjunto de datos tiene una distribución con forma aproximada de una “campana", distribución
con tendencia a la simetría) podemos utilizar las siguientes reglas prácticas para describir el conjunto
de datos.

1. Aproximadamente el 68% de los datos quedan a 1 desviación estándar de su media (esto es,
dentro del intervalo (𝑋̅ ± S) para muestras y (𝜇 ± 𝜎) para poblaciones).
2. Aproximadamente el 95% de los datos quedan a 2 desviaciones estándar de su media (esto
es, dentro del intervalo (𝑋̅ ± 2S) para muestras y (𝜇 ± 2𝜎) para poblaciones).
3. Casi todas la observaciones quedan a 3 desviaciones estándar de su media (esto es, dentro del
intervalo (𝑋̅ ± 3S) para muestras y (𝜇 ± 3𝜎) para poblaciones).

Los siguientes datos son controles prenatales (CPN) de una muestra de 40 gestantes adolescentes.
Luego, se presenta un listado de resultados que proporciona la calculadora Excel en el que se pueden
observar los estadísticos descriptivos.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


46

3 4 3 3 1 4 1 3 2 3
1 1 4 2 3 3 2 6 1 1
3 3 2 2 2 2 1 3 2 1
6 3 1 2 2 3 2 2 4 2

Descriptive statistics
Mean 2,475
Trimmed mean 2,42105263
Median 2
Midhinge 2,5
Mode 2
Midpoint 3,5
Standbard deviation 1,24008891
Standard error 0,19607527
Sample variance 1,53782051
Range 5
skewness 1,03670103
Coefficient of variation 0,50104603
Number of observations 40
First quartile 2
Third quartile 3
Interquartile range 1
Minimum 1
maximum 6

Preguntas 20 a 24:

20.Del listado, identificar e interpretar 𝑋̅y S.

𝑋̅ =________________Interpretación: ___________________________________

S = _______________ Interpretación: ________________________________

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


47

21. Del listado., identificar e interpretar Las siguientes medidas estadísticas descriptivas:

Me: _________Interpretación: ________________________

Mo: __________ Interpretación:________________________

Rango total: ________ Interpretación: ________________________

CV: _______ Interpretación: ________________________

Q1: __________ Interpretación: _________________________

Q3: __________ Interpretación: ________________________

22. Usando la Regla empírica, construir los intervalos (𝑋̅ ± S), (𝑋̅ ± 2S) y (𝑋̅ ± 3S). (Escribir los
resultados faltantes en la tabla que sigue)

23. Contar el número de observaciones que cae dentro de cada intervalo y comparar sus resultados
con los esperados según la Regla empírica. (Escribir las proporciones esperadas y reales faltantes en
la tabla que sigue)

Proporción esperada Proporción real de


k (𝑋̅ ≠ 𝑘𝑠) de datos en el datos en el intervalo
intervalo
1 (1,235; 3,715) 0,680 25/40=0,625
2
3

24. .Comentar sobre 1a simetría o asimetría de la distribución.

Comentario:______________________________________________________________________
__________________________________________________________________________

Periódicamente, la Federal Trade Commission (FTC, Comisión Federal de Comercio Estados Unidos
califica las marcas de cigarrillos nacionales según el contenido de alquitrán, nicotina y monóxido de
carbono. Los resultados de los ensayos se obtienen mediante una maquina fumadora secuencial que
"fuma" los cigarrillos hasta reducirlos a una colilla de 23 mm de largo. Luego se mide la

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


48

concentración de alquitrán, nicotina y monóxido de carbono (redondeando al miligramo más cercano)


en el material particulado ‘seco" residual del humo.

La media y desviación estándar de alquitrán(𝑋̅ ± S) obtenidas en una muestra de 372 cigarrillos son
(11,60 ± 4,97) mg respectivamente. Con esta informacion. (Preguntas 25 a 28):

25. Suponiendo que los datos se distribuyen con tendencia a la simetría ("campana"), establecer un
intervalo de una desviación estándar alrededor de 1a media. ¿Qué proporción de cigarrillos se espera
tengan concentraciones de alquitrán superiores a16,57 mg?

Proporción:_______________________________________________________

26. Suponiendoque los datos se distribuyen con tendencia a la simetría ("campana"),el 95% de
cigarrillos tendrán concentraciones de alquitrán comprendidas entre:

______________ y _______________mg.

27.¿Esperaría usted encontrar algún cigarrillo con una concentración de alquitrán de 30mg?

Si: ___________ No: ____________

28. Se sabe que: P25 = 6,25 mg y Q = 4,925 mg. Con esta información, obtener RIC y P75.

a. RIC (range intercuartilico) = _____________________

b. P75 _______________________

29. Respecto al Ejercicio 14 de la Practica 2, la medida de tendencia central adecuada para resumir
los Niveles de TCDD en tejido graso (partes/billón) es:

Respuesta: _______________________________________________________________

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


49

(Recordar que para decidir sobre la medida de tendencia central adecuada, es necesario considerar
principalmente, la escala de medición y la forma de la distribución de la variable).

30. Con los datos de la Ejercicio 4 de la Practica 2 (pesos, en kilogramos, de una muestra de 50
pacientes de un servicio de cardiología), elaborar el gráfico de caja y bigotes y describir dicho gráfico.

MISCELÁNEAS

En las siguientes proposiciones señalar con X la alternativa correcta:

1. Los percentiles que tienen la misma interpretación, son:

( ) Q1, D1, P10

( ) Q2, D2, P20

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


50

( ) Q2, D5, P50

( ) Q3, D6, P12

( ) Q4, D10, P100

2. Las medidas de dispersión indican variabilidad de les datos respecte a:

( ) Media aritmética

( ) Mediana

( ) Media aritmética y mediana

( ) Rango total

( ) Range intercuartilico (RIC)

3. Si en un estudie se determina una asimetría negativa la mejor medida de dispersión es:

( ) Desviación estándar

( ) Percentil 50

( ) Rango Intercuartilico

( ) Desviación estándar y rango intercuartilico

( ) Percentil 50 y rango intercuartilico

4. En un estudie con 250 pacientes con daño renal se encentre niveles alterados de urea, al calcular
Q3 se obtuvo 69,8 mg/ dl, este significa que:

( ) El 25% de datos son inferiores de 69,8

( ) El 75% de dates son superiores de 69,8

( ) El 75% de dates son inferiores de 69,8 y el 25% restante superiores de 69,8

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


51

( ) El 25% de dates son inferiores de 69,8 y el 75% restante superiores de 69,8

( ) N.A.

5. Una de las siguientes medidas de resumen es para variable cualitativa:

( ) Mediana

( ) Media aritmética

( ) Moda

( ) Desviación estándar

( ) Coeficiente de variación

6. Un típico ejemplo de proporción es:

( ) Numero de habitantes/ cama hospitalaria

( ) Tasa de incidencia 0 densidad de incidencia

( ) Prevalencia

( ) Mortalidad infantil

( ) Mortalidad materna

7. En cierto país para cada 500 personas hay un médico, este indicador es:

( ) Tasa

( ) Razón

( ) Proporción

( ) P50

( ) N.A.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


52

8. El indicador más cercano a una tasa es:

( ) Razón

( ) Proporción

( ) Mediana

( ) Media aritmética

( ) T.A.

9. La desviación estándar de una muestra de datos resulta cero (S = O), cuando:

( ) 𝑋̅ = 0

( ) ∑ 𝑋1 = 0

( ) Nunca es igual a cero

( ) Todos los datos son iguales

( ) La mediana es igual a cero

10. La desviación estándar es una medida de dispersión de los datos respecto a:

( ) Moda

( ) Mediana

( ) Media aritmética

( ) Cualquiera de las anteriores

( ) Depende de la forma de la distribución de datos

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


53

11. La desviación cuartil (Rango intercuattilico/ 2), es una medida de dispersión de los datos respecto
a:

( ) Moda

( ) Mediana

( ) Media aritmética

( ) Cualquiera de las anteriores

( ) Depende de la forma de la distribución de datos

12. La asimetría resulta igual a cero (A = O), de acuerdo a la formula de Pearson:

3(𝑋̅− 𝑀𝑒)
A= 𝑆
; cuando:

( ) Media aritmética, 𝑋̅ = 0

( ) Desviación estándar, S = 0

( ) Mediana, Me = 0

( ) Media aritmética = mediana

( ) S = 𝑋̅

l3.Existen dos tipos importantes de medidas de incidencia de una enfermedad: incidencia acumulada
(IA) y la tasa de incidencia (I). La IA relaciona el número de casos nuevos con el tamaño poblacional
al comienzo de un periodo de tiempo (∆t):

𝑛°𝑑𝑒𝑐𝑎𝑠𝑜𝑠𝑛𝑢𝑒𝑣𝑜𝑠𝑒𝑛∆𝑡
IA = n° de personas al inicio del estudio (t
0)

Mientras que I se define como el número de casos nuevos por cada unidad persona-tiempo de
observación y tiene como ecuación:

𝑛°𝑑𝑒𝑐𝑎𝑠𝑜𝑠𝑛𝑢𝑒𝑣𝑜𝑠
I = n° de personas—tiempo en observación

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


54

La medida que viene a ser una proporción y cuya interpretación puede realizarse en términos de
probabilidad, es:

( ) IA

()I

( ) IA e I

( ) N. A.

( ) Falta información

14. Existe una medida importante que se utiliza en la determinación de factores de riesgo de una
enfermedad que se denomina ODDS y expresa cuánto más probable es la ocurrencia de un fenómeno
en relación con la no ocurrencia. La fórmula para calcular ODDS a favor de la ocurrencia de un
fenómeno; es: Odds = p/ (1-p); donde: p = probabilidad de que ocurra el fenómeno y (1—p)=
probabilidad de que no ocurra el fenómeno. Odds, entonces es: I

( ) Tasa

( ) Razón

( ) Proporción

( ) Promedio

( ) Moda

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


55

4. PROBABILIDADES

Objetivos

1. Definir y calcular la probabilidad de un evento


2. Calicular e interpretar la probabilidad de la suma de probabilidades de dos eventos
3. Calcular e interpretar la probabilidad condicional
4. Calcular e interpretar la probabilidad de la multiplicación de dos eventos
5. Determinar la independencia de dos eventos

Lectura sugeridas

 Daniel W. Bioestadsitica. Base para el análisis de las ciencias de la salud. 4ª ed. Mexico.
Limusa Wiley; 2009
 Mendenhall W, Beaver B, Beaver R. Introducción a la probabilidad y estadística.12ª ed.
México: Thomson; 2008.
 Mendenhall W, Sincich T.Probabilidad y estadística para ingeniería y ciencias.4ª ed.
México: Prentice - Halll; 1997.

PRACTICAS

Relaciones de eventos

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


56

Dos eventos A y B, pueden o no ser complementarios o mutuamente excluyentes, o independientes.


Debemos saber los significados de estos términos y como probar si A y B poseen una o más de estas
relaciones de eventos.

Completar los espacios en blanco:

a. Un evento 𝐴̅, se dice que es el ______________________del conjunto de todos los puntos


muestrales que no pertenecen a A. El símbolo es usado para denotar el complemento de A. Es siempre
cierto que P(A) + P (𝐴̅) =_________________. Por lo tanto, P(A)= 1____________. Esta última es
una fórmula extremadamente importante.

b. Eventos A y B los cuales no tienen puntos muestrales en común se dice que


son_________________________. Por lo tanto, si A y B son mutuamente excluyentes, entonces
P(A∩B) =_____________________. Los eventos A y 𝐴̅ (son, no son) mutuamente excluyentes.

c. Para introducir la noción de eventos independientes, se debe definir primero probabilidad


condicional. La probabilidad del evento A dado que el evento B ha ocurrido se simboliza
por_______________

Por definición, P(A/B) =_________________________

Si P(A/B) = P(A), decimos que los eventos A y B son ___________________________

Si P(A/B) ≠ P(A), decimos que los eventos A y B____________ (son, no son) independientes.

Leyes de probabilidad

Completar los espacios en blanco:

d. La ley aditiva de probabilidad está dada por la fórmula:

P ( ) = P(A) + P (B) - ____________

La ley multiplicativa de probabilidad está dada por la fórmula:

P () = ________________________

e. Si el evento A es un subconjunto del evento B entonces

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


57

P(A∪B) =_______________________ y P(A∩B) = _________________________

f. Si los eventos A y B son mutuamente excluyentes, entonces

P(A∪B) =_________________ mientras que P(A∩B) =___________________________

g. Si los eventos A y B son independientes, entonces

P(A∪B) =__________________________y P(A∩B) =____________________ , respectivamente.

Responder a las siguientes preguntas:

1. Las probabilidades asociadas con un espacio muestral deben satisfacer dos requerimientos. ¿Estos
son?:

a. __________________________

b.___________________________

2. Supongamos que un experimento requiere el 0rder1 de tres solicitarte, A, B y C, de acuerd0 con


sus habilidades para hacer un trabajo. Los puntos muestrales pueden simbolizarse entonces mediante
las ternas ordenadas, (ABC), (BAC), etc.

a. Se define el evento A que consiste en que el so1icitante A esta ordenado primero, ¿cuáles son
los puntos muestrales?

b. Se define e1 evento B que consiste en que el solicitante B este ordenado en tercer lugar, ¿Qué
puntos muestrales comprende?

c. Listar los puntos muestrales en A ∪ B

d. Listar los puntos muestrales en A ∩ B

e. S1 se asigna igual probabilidad a los puritos muestrales pruebe si los eventos A y B sn o no son
independientes

Para cierta población se define los siguientes eventos con respecto a los niveles de lipoproteína de
plasma (mg/d1):A = (10 -15); B = (≥30); C = (≤ 20). (Preguntas 3 a 5)

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


58

3. ¿Son los eventos A y B mutuamente excluyentes? ¿A y C?, ¿B y C? Explicar la respuesta para cada
pregunta.

4. Establecer con palabras el significado de los siguientes eventos:

a. A∪B b.A∩B c.A∩C d. A∪C

5. Establecer con palabras e1 significado de los siguientes eventos:

a. 𝐴̅b.𝐵̅c.𝐶̅

6 En una bolsa se echan 12 bolitas numeradas correlativamente del 1 al 12. Calcular la probabilidad
de obtener un número menor que 5 o múltiplo de 5 al sacar una de ellas.

a. 1/2 b. 1/3 c. 1/6 d. 1/18 e.0

7. A1 lanzar dos monedas, ¿qué probabilidad hay de obtener una cara y un sello?

a. 4 b. 2 c. 1 d. 1/2 e.1/4

8. En un curso de 60 alumnos, 1/3 de 10s a1umnos habla inglés, 1 /4 habla francés y 1/ 10 hab1a los
dos idiomas, ¿cuál es la probabilidad de que un alumno elegido al azar hable solo un idioma?

a. 1/3 b. 1/4 c. 23/60 d. 29/60 e.7/12

9. Si se lanza un dado dos veces, ¿cuál es la probabilidad de que en el primer lanzamiento se obtenga
un 5 o un 6, y en e1 segundo cualquier numero excepto 3?

a. 1/18 b. 5/18 c. 2/9 d. 1/36 e. N.A

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


59

10. Realizamos el experimento aleatorio de lanzar dos dados anotar los resultados de sus caras
superiores. Calcular la probabilidad del suceso "la suma obtenida sea 7".

a. 1/3 b. 1/4 c. 23/60 d. 29/60 e.7/12

11. Dos personas piensan cada una de ellas un número del 0 al 9. Calcular la probabilidad de que las
dos personas no piensan el mismo número.

a. 1/3 b. 1/4 c. 23/60 d. 29/60 e.7/12

12. En cierta población de pacientes hospitalizados la probabilidad de que un paciente, seleccionado


al azar este enfermo del corazón es de 0,35. La probabilidad de que un paciente enfermo del corazón
sea fumador es de 0,86. ¿Cuál es la probabilidad de que un paciente seleccionado aleatoriamente, de
esa población, sea fumador y este enfermo

a. 0,4070
b. 0,3010
c. 0,3100
d. 0,1300
e. N.A.

13. Si B está incluido en A, es decir, B⊂A, entonces P(A - B), es;

a. P(A)P(B)
b. P(A)/ P(B)
c. P(A/B)
d. P(B) - P(A)
e. (PA) - P(B)

14. Si A y B son dos eventos cualesquiera, entonces P(A - B) =:

a. P(A)-P(A∩B)
b. P(B)- P(A∩B)

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


60

c. (PA)-P(/B)
d. P(𝐴̅ - B)
e. N.A.

Se realizó un estudio de daño de órgano terminal en hipertensos atendidos en una clínica privada
de Lima. La siguiente tabla presenta la distribución de 306 casos de hipertensos recién
identificados según daño de órgano terminal por gravedad de la hipertensión.

Tabla.- Daño de órgano terminal en hipertenso

Gravedad de la hipertensión
Leve - Severa Total
Moderada
Antecedentes de + 18 7 25
angina - 243 38 281
Total 261 45 306
Antecedentes de + 4 1 5
enfermedad - 257 44 301
cerebro vascular Total 261 45 306
Anormalidad + 56 22 78
electrocardiografía - 205 23 228
261 45 306

(Preguntas 15 a 27)

Si del total de pacientes se selecciona uno al azar:

15. ¿Cuál es la probabilidad de que tenga antecedentes de angina?

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


61

15. Dado que el paciente presenta hipertensión severa, ¿cuál es la probabilidad de que tenga
antecedentes de angina?

16. ¿Cuál es la probabilidad de que el electrocardiograma resulte normal en un paciente que


acude a la clínica?

17. Dado que el enfermo nuevo con hipertensión tiene electrocardiograma normal, ¿cuál es la
probabilidad de que la hipertensión sea severa?

18. ¿Cuál es la probabilidad de que un paciente tenga antecedentes de angina y


electrocardiograma normal?

19. ¿Cuál es la probabilidad de que un paciente tenga antecedentes de angina o


electrocardiograma normal?

20. Dos pacientes acuden a la clínica el mismo día. ¿Cua1 es la probabilidad de que ambos tengan
electrocardiograma anormal?

21. ¿Cuál es la probabilidad de que al menos uno de los dos tenga antecedentes de angina?

22. ¿Cuál es la probabilidad de que un paciente tenga hipertensión severa y antecedente de


enfermedad cerebro vascular?

23. Se selecciona un paciente al azar, ¿cuál es la probabilidad de que no tenga antecedente de


angina o tenga hipertensión leve—moderada?

24. Se selecciona un paciente al azar, ¿cuál es la probabilidad de que tenga hipertensión leve—
moderada y electrocardiograma normal?

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


62

25. Si del total se selecciona un paciente al azar, ¿cuál es la probabilidad de que tenga
antecedentes de enfermedad cerebro vascular o tenga una hipertensión severa?

26. Si un paciente tiene hipertensión severa, ¿cuál es la probabilidad de que tenga antecedente de
enfermedad cerebro vascular?

27. Supongamos que P(A) = 1 /2 y P (B) = 1/4. Encontrar P(A 0 B), si:
a. A y B son independientes.
b. A y B son mutuamente excluyentes.

28. Supongamos que P(A) = 1/3, P (B) = 1/4 y P(A/B) = 1/2. Encontrar P(A ∪ B).

29. En cierto hospital del Ministerio de Salud, la probabilidad de que un paciente seleccionado
aleatoriamente entre los hospitalizados sea de sexo masculino es de 0,6. La probabilidad A
de que el paciente sea de sexo masculino y haya sido internado para cirugía es de 0,2.
Un paciente seleccionado aleatoriamente entre los hospitalizados es de sexo masculino, ¿cuál
es la probabilidad de que este internado para cirugía?

30. A un consultorio de pediatría, el año pasado, acudieron niños con EDA y con IRA. El 50%
de los niños que acudieron tenia EDA y el 30% IRA. Un 20% tenía ambas enfermedades.
Si se presenta un niño. Calcular la probabilidad de que dicho niño:
a. Tenga alguna enfermedad (Tenga al menos una de las dos enfermedades)
b. Tenga solo EDA
c. No tenga enfermedad alguna (Ni EDA ni IRA)
d. Tenga solo una de las enfermedades

31. El 40% de los pacientes que acuden a un consultorio de cardiología de un hospital son
fumadores; el 70% tiene más de 50 años y el 30% no son fumadores y tienen más de 50 años.
Supongamos que llega un paciente al consultorio, calcular:
a. La probabilidad de que sea fumador y mayor de 50 años.
b. La probabilidad de que ni sea fumador ni mayor de 50 años.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


63

32. Al tratar a recién nacidos prematuros, la cantidad de O2 recibida puede afectar su visión. Se
puede clasificar a cada niño como de visión normal, visión defectuosa .o ciego. Un estudio
muestra que la probabilidad de que ocurra cada uno de estos sucesos es de: 0,80; 0,18 y 0,02,
respectivamente. Determinar la probabilidad de que un niño nazca con:
a. Visión normal o ciego. .
b. Visión defectuosa o normal
c. Visión defectuosa y ciego

33. Entre las embarazadas diabéticas, hay un 25% que presentan toxemias, hidramnios en un 21%
y deterioro fetal en un 15%, en un 6% de los casos se dan otras complicaciones. Suponiendo
que en un embarazo no se pueden presentar dos complicaciones simultáneamente,
a. ¿cuál es la probabilidad que al seleccionar al azar una embarazada diabética, esta tenga un
parto normal?
b. ¿cuál es la probabilidad de que tenga algún tipo de complicación?

34. Se estima que el 30% de los habitantes son obesos, que el 3% sufre de diabetes y el 2% es
obeso y sufre de diabetes, ¿cuál es la probabilidad de que una persona elegida al azar presente
por lo menos una de las dos enfermedades?

35. Los datos recogidos de un banco de sangre, indican que entre todos los donantes, el0,1% da
positivo en el test para VIH y el 1% da positivo en el test del herpes. Si el 0,05%de donantes
da positivo para ambos problemas. Se elige un donante al azar. Calcular la probabilidad de
que dicho donante:

a. De un resultado positivo a cualquiera de los test (A por lo menos a uno de ellos)


b. Arroje positivo solo a VIH.
c. No presente simultáneamente las dos enfermedades
d. Presente solo una de las enfermedades

36. Un estudio indica que el 10% de la población de un país tiene 65 años o más y que el1% de
la población padece insuficiencia cardiaca moderada. Además, el 10,4% de la población tiene
65 años o más o padece insuficiencia cardiaca moderada.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


64

Se elige un individuo al azar del país:

a. Calcular la probabilidad que el individuo tenga 65 años o más y padezca insuficiencia


cardiaca moderada.
b. Si un individuo tieneI65 años o más, ¿cuál es la probabilidad de que padezca de
insuficiencia cardiaca moderada?
c. Si un individuo es menor de 65 años, ¿cuál es la probabilidad de que padezca de
insuficiencia cardiaca moderada?

37. Ciertos estudios demuestran que un 12% de las personas tratadas por médicos, seatiende en
un hospital. De ellos, el 1% sufre alguna alergia a algún medicamento. Se sabetambién que
el 12,4% recibe atención en un hospital o es alérgico a algún medicamento.

a. ¿Cuál es la probabilidad que un paciente elegido al azar se atienda en un hospital y sea


alérgico a algún medicamento?

b. ¿Cuál es la probabilidad que un paciente elegido al azar se atienda en un hospital y no sea


alérgico?

c. ¿Cuál es la probabilidad que un paciente elegido al azar sea alérgico a algún medicamento
pero no se atienda en un hospital?

39. Una persona posee una casa en la ciudad y una cabaña en las montanas. En un año cualquiera, la
probabilidad de que entren a robar a la casa es 0,01 y de que roben en la cabaña es 0,05. Para un año
cualquiera, ¿cuál es la probabilidad de que:

a. Entren a robar a ambas?

b. Roben en una u otra, pero no en ambas?

c. No roben en ninguna?

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


65

40. Se desea determinar si el fumar está asociado con la ocurrencia de una enfermedad. Para ello se
diseño un estudio con una muestra de 180 sujetos. Los resultados son los que aparecen en la tabla:
(Preguntas a hasta m)

Tabla 1. Asociación entre el habito tabáquico y el desarrollo de una enfermedad. Datos de una
muestra de 180 sujetos.

Enfermos (E) ̅)
No enfermos ( 𝑬 Total
Fumador (F) 60 10 70
̅)
No fumador ( 𝑭 20 90 110
Total 80 100 180

a. Para un sujeto tomado al azar, obtener la probabilidad que desarrolle la enfermedad.

b. Si del total se selecciona un sujeto al azar, ¿cuál es la probabilidad de que se fumador)?

c. ¿Cuál es la probabilidad de que el sujeto seleccionado no sea fumador y este enfermo?

d. ¿Cuál es la probabilidad de que sea fumador o no fumador?

e. ¿Cuál de que no sea fumador o no enfermo?

f. ¿Cuál de que no sea fumador y no enfermo?

g. Si del total se selecciona un sujeto al azar y resulta que está enfermo, ¿cuál es la probabilidad de
que sea fumador?

h. ¿Cuál es la probabilidad de que el sujeto seleccionado no esté enfermo dado que no fuma?

i. Calcular P (𝐹̅ )

j. Calcular P (F ∪ E)

k. Calcular P (E/F)

1. Calcular P (E/𝐹̅ )

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


66

m. Determinar si ser fumador y presentar la enfermedad son independientes.

41. Para el caso de los varones nacidos en cierto país la probabilidad de que el periodo de gestación
sea menor de 37 semanas es 0,142 y la probabilidad de que su peso al nacer sea menor de 2500 gramos
es 0,051. Además, la probabilidad de que estos dos eventos ocurran simultáneamente es 0,031.

a. Sea A el evento de que el periodo de gestación de un bebé sea menor de 37 semana y B el


evento de que su peso al nacer sea menor de 2500 gramos, ¿son A y B independientes?

b. En el caso de un varón recién nacido en este país elegido al azar, ¿cuál es la probabilidad de
que ocurran A o B?

c. ¿Cuál es la probabilidad de que ocurra el evento A en caso de que se lleve a cabo el evento B?

d. Interpretar, en términos porcentuales, el resultado anterior.

e. ¿Qué tanto por ciento (%) de los que tuvieron un periodo gestacional menor de 37 semanas
nacieron con memos de 2500 gramos?

42. Sabiendo que P(A ∩ B) = 0,2, P (𝐵̅) = 0,7 y P(A ∩ 𝐵̅) = 0,5. Calcular:

a. P (A)
b. P (A ∪ B)

43. La probabilidad de que un densitómetro (equipo médico que determina la densidad mineral ósea)
nuevo falle la primera vez que se use es 0,10. Si no falla de inmediato, la probabilidad de que dure
un año es 0,99. ¿Qué probabilidad hay de que un densitómetro nuevo dure un año?

MISCELÁNEAS

En las siguientes proposiciones señalar con X la alternativa correcta:

Se denominan experimentos deterministas aquellos que realizados de una misma forma y con las
mismas condiciones iníciales, ofrecen siempre el mismo resultado. Como ejemplo, tenemos que un

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


67

objeto de cualquier masa partiendo de un estado inicial de reposo, y dejado caer al vacío desde una
torre, llega siempre al suelo con la misma velocidad: v = √(2𝑔ℎ)

Cuando en un experimento no se puede predecir el resultado final, hablamos de experimento


aleatorio.

Un experimento se dice aleatorio si verifica las siguientes condiciones:

• Es posible conocer previamente todos los posibles resultados (el espacio muestral, constituido por
diferentes sucesos) asociados al experimento.

• Es imposible predecir el resultado exacto del mismo antes de realizarlo.

A cada realización de un experimento se le llama experiencia o prueba. (Preguntas 1 a 3).

1- A1 lanzar una tachuela (0 un "chinche") sobre una mesa de madera, pueden concebirse como
resultados posibles: de cabeza (c) y de lado (1). Si admitimos que la tachuela, puede arrojarse
repetidamente, esencialmente bajo las mismas condiciones, entonces el lanzamiento de una tachuela
es un ejemplo de:

( ) Experimento determinista

() Experimento casual 0 aleatorio

( ) Experimento científico

( ) N .A.

2. E1 tiempo (día lluvioso y día no lluvioso), que se tendrá durante tres días consecutivos, es un
ejemplo de:

( ) Experimento determinista

( ) Experimento casual 0 aleatorio

( ) Experimento científico

( ) N .A

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


68

3. En varios ensayos clínicos realizados en Lima sobre la eficacia de dos tratamientos (A y B) para el
insomnio se determino que el tratamiento B tuvo mayor eficacia. El ensayo se va a repetir, bajo las
mismas condiciones, en la ciudad de Ica, entonces la realización de este ensayo clínico es un ejemplo
de:

( ) Experimento determinista

( ) Experimento casual o aleatorio

( ) Experimento científico

( ) N.A.

4. ¿Cuál de las siguientes expresiones no corresponde a un suceso aleatorio?

( ) Jugar un juego de azar.

( ) Enfriar agua a 0°C.

( ) Preguntarle a un desconocido si fuma.

( ) En una historia clínica seleccionada al azar para un estudio, averiguar e1 género del paciente

5. Si lanzamos al aire un dado, con resultados 1, 2, 3, 4, 5 y 6 y una moneda, con resultados cara (c)
y sello (s), e1 espacio muestral será:

( ) Ω = {(1c), (2c), (3c), (4c), (5c), (6c)}

( ) Ω = {(1s), (2s), (3s), (4s), (5s), (6s)}

( ) Ω= {(1c), (2c), (3c), (4c), (5c), (6c), (1s), (2s), (3s), (4s), (5s), (6s)}

( ) N.A.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


69

6. Se tiene interés en estudiar si una gestante es primigesta (P) o no (𝑃̅) y si es adolescente (A) o no
(𝐴̅). A1 seleccionar una historia clínica al azar, 1os posibles resultados (espacio muestral) son:

( ) Ω = {(P, A), (P, 𝑃̅), (P, 𝐴̅)}

( ) Ω = {(P, 𝑃̅ ), (A, 𝐴̅)}

( ) Ω = {(P, A), (P, 𝐴̅), (𝑃̅, A), (𝑃̅, 𝐴̅)}

7. E1 espacio muestral as0ciad0 a1 lanzamiento de dos dados y anotar la suma de los puntos obtenidos
es:

( ) Ω= {2,3,4,5,6,7,8,9,10,11,12}

( ) Ω= {1,2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}

( ) Ω = {2, 3, 4, 5, 6, 7, 8, 9, 10, 11,12,13}

( ) N .A.

8. ¿Cuentos elementos tiene el espacio muestral que se obtiene al lanzar 3 monedas?

( ) 27

( )9

()8

()3

9. Si P(A/B) = 0,4 y P (B) = 0,2, entonces, la probabilidad de que ocurran tanto A como B, es

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


70

( ) 0,8000

( ) 0,5000

( ) 0,0800

( ) N .A.

10. Si P(A/B) = 0,3 P (B/A) = 0,4 y P(A) = 0,6, entonces:

( ) P (B) = 0, 12

( ) P (B) = 0, 80

( ) P (B) = 0, 24

( ) N.A.

11. Señale la expresión incorrecta:

( ) P (A ∪B) =P (B ∪ A)

( ) P (A ∩B) =P (B ∩ A)

( ) P (A) + P (𝐴̅) = 1

( ) P (A/B) =P (B/A)

12. Si se lanza al aire una moneda, la probabilidad de obtener cara y sello, es:

( ) 1/2

( ) 1/4

( )0

( )1

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


71

13. Si se lanza al aire una moneda, la probabilidad de obtener cara o sello, es:

( ) 1/2

( ) 1/4

( )0

( )1

14. La probabilidad de que ocurra un evento depende de la verosimilitud con la que puede ocurrir
dicho evento y se puede cuantificar mediante un número comprendido entre:

( ) -1 y 1

( ) -∞ e ∞

( )0y1

( ) 0 y 0,999

15. Si un 10% de los alumnos de primaria consume alcohol. La probabilidad de que tres alumnos de
primaria tomados al azar consuman alcohol es:

( ) 0,030

( ) 0,010

( ) 0,001

( ) 0,300

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


72

16. En una caja se tienen 5 esperas rojas y 5 azules, se extraen dos esferas, una a una, sin reposición,
la probabilidad de que ambas sean rojas, es:

( ) 0,500

( ) 0,222

( ) 0,250

( ) 1,000

17. El porcentaje de mujeres que sobreviven a 1a extirpación y tratamiento de un cáncer de ovario es


de 60% a los dos años y de un 48% a los seis. La probabilidad de que una mujer que ha sobrevivido
dos anos, sobreviva seis, es:

( ) 0,120

( ) 0,288

( ) 0,480

( ) 0,800

18. Ciento cincuenta y ocho personas asistieron a una boda y a1 día siguiente 100 de ellas presentaban
gastroenteritis aguda (GEA). De las 158 personas que asistieron, 110 comieron langostinos y de ellas
70 estaban enfermas a1 día siguiente, la probabilidad de no enfermar para los asistentes que no
comieron langostinos, es:

( ) 0,375

( ) 0,443

( ) 0,633

( ) 0,636

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


73

19. En una determinada población e1 30% tiene el hábito de fumar, 50% el de consumir café y 20%
tiene ambos hábitos, 1a probabilidad de que un sujeto elegido al azar tenga el hábito de fumar o de
tomar café, pero no ambos hábitos, es:

( ) 0,80

( ) 0,60

( ) 0,40

( ) 0,20

20. Los eventos A y 𝐴̅ dentro del mismo espacio muestral:

( ) Son dependientes.

( ) Son mutuamente excluyentes.

( ) No son mutuamente excluyentes.

( ) NA

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


74

5. PRUEBAS DE DETECCION, TEOREMA DE


BAYES Y MEDICION DE RIESGOS

Objetivos

1. Calcular e interpretar la sensibilidad, especificidad, valor predictivo positive y negativo de


una prueba de detección
2. Aplicar el teorema de Bayes para el cálculo del valor predictivo positivo y negativo
3. Calcular e interpretar Odds Ratio (OR)
4. Calcular e interpretar Riesgo Relativo (RR)

Lectura sugeridas

 Daniel W. Bioestadística. Base para el análisis de las ciencias de la salud. 4ª ed. México.
Limusa Wiley; 2009
 • Pagano M, Gauvreau Ke. Fundamentos de Bioestadística. 2a ed. México: Thomson
Learning2001.
 Royo MA, Moreno JD. Método epidemiológico. 1a ed. Madrid España: ENS- Instituto
de Salud Carlos III· Ministerio de Ciencia e Innovación; Octubre de 2009.
 Wonnacott T, Wonnacott R. Fundamentos de Estadística para Administración
yEconomía. 1a ed. México: Editorial Limusa; 1993

PRACTICAS

En la siguiente tabla n representa una muestra probabilística (Altamente representativa):

Diagnostico Total

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


75

Resultado de la (con prueba de oro)


prueba de estudio E ̅
𝑬
+ a b a+b
- c d c+d
Total a+c b+d 𝑛=a+b+c+d

E= enfermo, 𝐸̅ = no enfermo

Completar: (escribir las formulas). (Preguntas 1 a 8)

1. P (E) = __________________________________

2. ¿Sin no fuera la población o una muestra probabilística, podría estimar la P (E)?

Si:_________________ NO: ____________________

3. P (+/E) = _____________________ ¿Qué mide?________________________

4. P (-/𝐸̅ ) = _______________________ ¿Qué mide?___________________________

5. P (E / +) = ____________________ ¿Qué mide? ________________________

6. P (𝐸̅ / -) =_______________________ ¿Qué mide? __________________________

7. P (- / E) = _____________________ ¿Que mide? _______________________

8. P (+/𝐸̅ ) = _______________________ ¿Que mide?__________________________

En la tabla 1 se muestran los resultados obtenidos en una prueba de detección de diabetes en una
población de 10000 personas. El punto de corte empleado fue el valor de glucosa sanguínea de 180
mg/ dl; es decir, las personas de 180 o más de glucosa fueron consideradas como positivas en la
prueba.

Tabla 1. Resultados de la prueba de diagnóstico para diabéticos.

Diagnostico de diabetes Total

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


76

Resultado de la Si No
prueba de estudio
+ 34 20 54
- 116 9830 9946
Total 150 9850 10000

(Preguntas 9 a 15):

9. Calcular la sensibilidad, especificidad, valor predictivo positivo y valor predictivo negativo de la


prueba.

10. Cundo el punto de corte de la prueba de detección se disminuyo a un valor de glucosa sanguínea
de 130 mg/ dl, 164 personas dieron un resultado positivo en la prueba; de estos 98 no eran diabéticos.
(Naturalmente, tanto el número total de diabéticos y no diabéticos permanecen igual).

Construir una tabla con estos datos y calcular la sensibilidad, especificidad y el valor predictivo
positivo de la prueba con este punto de corte.

11. ¿Cuál es el efecto sobre los falsos positivos y sobre los falsos negativos así como sobre el valor
predictivo positivo al disminuir el punto de corte de la prueba de detección?

12. ¿Cómo se afecta la sensibilidad y la especificidad?

13. Si el punto de corte se establece arriba de 180 mg/ dl, entonces:

a. ¿Cómo esperaría que esto afecte la sensibilidad y la especificidad de la prueba?

b. ¿Qué efecto tendrá sobre la proporción de falsos positivos y falsos negativos?

14. Supongamos (Tabla 1), que la prevalencia de diabetes se eleva de 1,5 a 2,0%. Dada la misma
sensibilidad y especificidad, calcular el valor predictivo positivo de la prueba. Sugerencia: primero,
elaborar la tabla correspondiente).

15. Su servicio de detección puede examinar a 1000 personas por semana (Asumir como muestra
probabilística). Se supone que usted está intentando detectar una enfermedad con una prevalencia de
2,0%, y su prueba tiene una sensibilidad de 95% y especificidad de 90%. (Sugerencia: elaborar
primeramente la tabla respectiva).

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


77

a. ¿Cuántas personas examinadas en una semana resultaran positivas en la prueba?

b. De éstas, ¿Cuantas serán verdaderamente positivas y cuántas de ellas resultaran falsas


positivas?

c. ¿Cuáles el valor predictivo positivo de la prueba?

16. La Tabla 2, muestra los resultados de la evaluación de la prueba de detección en la que


participaron una muestra de 650 individuos con la enfermedad y una segunda muestra independiente
de 1200 individuos sin la enfermedad.

Tabla 2. Resultados de la evaluación de la prueba de detección en pacientes

Enfermedad
Resultado
Presente Ausente
+ 490 70
- 160 1130
Total 650 1200

a. Calcular la sensibilidad de la prueba.

b. Calcular la especificidad de la prueba.

c. Si la tasa de la enfermedad en la población en general es 0,002, ¿Cuál es el valor predictivo


positivo de la prueba?

d. ¿Es una estimación satisfactoria 650/1850 de la tasa de la enfermedad en la población general?


Explique su respuesta.

17. La sensibilidad de una prueba de detección es de 0,95 y su especificidad es 0,85. La tasa de la


enfermedad en la población para la que se utilizo la prueba es, 0,002. ¿Cuál es el valor predictivo
positivo de la prueba?

En una población grande, de la cual se estima que el 0,1% padece de tuberculosis, supongamos que
la validez de una máquina de rayos X, para la tuberculosis se establece como:

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


78

• Entre la gente que padece tuberculosis, la maquina detecta como positivos a un 90%de casos y
como negativos a un 10%.

• Entre la gente que no padece la enfermedad, la maquina reporta un 99% de casos negativos y
un 1% de positivos. (Preguntas 18 a 20)

18.¿Cuál es la proporción de falsos negativos?

a. 0,90 b. 0,99 c. 0,01 d. 0,10 e. 0,11

19.¿Cuál es la proporción de falsos positivos?

a. 0,90 b. 0,99 c. 0,01 d. 0,10 e. 0,11

20. Una persona elegida al azar es sometida a rayos X y resulta positivo ¿cuál es la probabilidad de
que la persona tenga realmente la enfermedad?

a. 0,1000 b. 0,0100 c. 0,0826

d. 0,9090 e. 0,8264

21. La probabilidad de que una persona elegida al azar de una población presente el síntoma
característico de una enfermedad es 0,2 y la probabilidad de que una persona elegida aleatoriamente
presente esa enfermedad es 0,23. La probabilidad de elegir a una persona que tenga el síntoma y
también la enfermedad es O, 18. Si una persona elegida al azar de esa población no presenta el
síntoma, ¿cuál es la probabilidad de que tenga la enfermedad?

22. Los siguientes datos se recogieron de un estudio sobre el uso de una técnica denominada
ventriculografía de radioisótopos como prueba para detectar alguna patología coronaria.

ventriculografía de Enfermedad
Total
radioisótopos Presente Ausente
Positivo 302 80 382

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


79

Negativo 179 372 551


Total 481 452 933

a. ¿Cuál es la sensibilidad de la ventriculografía de radioisótopos en este estudio? ¿Cuál y es su


especificidad?

b. Para el caso de una población en la que el predominio de la patología coronaria es0, 10,
calcular la probabilidad de que un individuo padezca la enfermedad er1 case de obtener
resultados positivos en la prueba de ventriculografía de radioisótopos.

c. ¿Cuál es el valor predictivo negativo de la prueba?

23. Se tiene un caso clínico en el que una gestante se somete a la prueba de sobre carga oral con 50
gramos de glucosa para explorar la presencia de diabetes gestacional, obteniéndose un resultado
positivo. Es sabido que dicho test presenta unos valores, aproximados de sensibilidad y especificidad
en torno al 80% y al 87%, respectivamente. Si se conoce además que la prevalencia de diabetes
gestacional en la población de procedencia es un 3%, la probabilidad de que el diagnóstico sea
correcto; es decir, el valor predictivo positivo,
es:________________________________________________________________________

Supongamos que además dicha paciente tiene más de 40 años de edad. Se sabe que en grupos de edad
más avanzada la prevalencia de diabetes gestacional entre las gestantes llega a aumentar hasta
aproximadamente un 8%, en este case el valor predictivo positivo de la prueba
es:_______________________________________________________________________

24. La larga experiencia de una clínica en el diagnostico de pacientes que acuden a ella es que 1/ 10
tiene la enfermedad A, 2/ 10 la enfermedad B y 7/ 10 goza de buena salud. De los enfermes de A, 9/
10 padece de dolores de cabeza; % de los enfermos de B sufren de dichos dolores y ocurre lo mismo
con 1 /20 de quienes están sanos. Si usted debe diagnosticar un paciente en esta clínica y este tiene
dolor de cabeza, cual es la probabilidad de que tenga

a. La enfermedad A

b. La enfermedad B

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


80

c. Buena salud

25. La tabla siguiente muestra una serie de dates temados de un estudie en el que se compara la
condición de fumaderos informada por ellos con las mediciones del nivel de nicotina en la sangre.
Como parte de un estudie, el nivel de nicotina se utilizo como herramienta de diagnostico para
predecir la condición de fumadores; la condición informada por ellos se considero como autentica.
Para diferentes puntos de corte, las sensibilidades y especificidades observadas se muestran a
continuación.

Nivel de nicotina Sensibilidad Especificidad (1 – Especificidad)


(ng/ml)
5 0,971 0,898
7 0,964 0,931
9 0,960 0,946
11 0,954 0,951
13 0,950 0,954
14 0,949 0,956
15 0,945 0,960
17 0,939 0,963
19 0,932 0,965

a. Conforme aumenta el punto de corte, ¿cómo cambia la proporción de falsos positivos?¿Cómo


cambia la proporción de falsos negativos?

b. Utilice estos datos para construir una curva característica de operación (curva ROC-Receiver
Operating Characteristic).Sugerencia: Graficar en el eje X, la proporción de falsos positivos; es
decir, (1- Especificidad) y en el eje Y la sensibilidad.

c. Con base a esta gráfica, ¿qué valor del nivel de nicotina en sangre elegiría como punto de corte
optimo para predecir la condición de fumador? (¿Por qué?

26. En la siguiente tabla se presentan los resultados de un estudio de casos y controles acerca de la
asociación entre fumar tabaco y cáncer pulmonar.

a. En los casos, ¿cuál es la odds a favor de haberse expuesto a tabaco?

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


81

b. En los controles, ¿cuál es la odds a favor de haberse expuesto a tabaco?

c. Calcular e interpretar el Odds Ratio (OR), razón de odds o razón de ventajas (índice de
disparidad o razón de momios).

Cáncer pulmonar
Fumar tabaco Presente Ausente Total
(casos) (controles)
Si 23 34 57
No 35 132 167
Total 58 166 224

27. Los siguientes datos se tomaron de un estudio realizado para determinar si la utilización del
Monitoreo Fetal Electrónico (EFM) durante el trabajo de parto influye en la frecuencia de nacimientos
por cesárea. Consideremos el parto por cesárea como la "enfermedad"(efecto), y el monitoreo
electrónico como la "exposición" (causa).Los resultados fueron los siguientes:

Parto por cesárea


Exposición de EFM Total
Si No
Si 358 2492 2850
No 229 2745 2974
Total 587 5237 5824

28. Se llevo a cabo un estudio para analizar los factores potenciales de riesgo de embarazo ectópico.
De las 279 mujeres que tuvieron un embarazo ectópico, 28 habían padecido una enfermedad
inflamatoria pélvica. De las 279 que no la tuvieron, 6 habían padecido una enfermedad inflamatoria
pélvica.

a. Construya una tabla de contingencia de 2 X 2 con estos datos.

b. Calcule e interprete el OR. .

29. en la valoración del electrocardiograma (ECG) inicial como predictor de infarte agudo del
miocardio (IM), los investigadores identificaron a 200 varones que tuvieron IM y 200 sin IM previo.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


82

De los 200 varones con IM, 170 habían tenido ECG positive; de los 200 sin IM, 90 habían mostrado
un ECG positivo.

a. Elaborar una tabla de 2x2 apropiada para calcular e interpretar el OR.

b. ¿Por qué debe calcularse esta medida de asociación y no el riesgo relativo (RR)?

c. Calcular e interpretar la razón de la probabilidad o razón de ventajas (OR).

30. Datos siguientes se obtuvieren de un estudio sobre la relación entre abortos espontáneos y diversos
factores de riesgo.

Consumo de
Cantidad de Abortos
alcohol (bebida Probabilidad OR
embarazos espontáneos
por semana)
0 33164 6793 0,2048 Referencia
1–2 9099 2068
3–6 3069 776
7 – 20 1527 456
> 20 287 98

a. Para cada nivel de consume de alcohol, calcule la probabilidad de que una mujer que se embarace
sufra un aborto espontaneo (Respuestas en la tabla).

b. Para cada categoría de consume de alcohol, calcule el índice de disparidad (OR) de sufrir un aborto
espontaneo en el case de una mujer que consume cierta cantidad de alcohol respecto a las que no la
consumen en absoluto (categoría de referencia), escriba sus respuestas en la tabla.

31. Se desea estudiar la posible asociación entre el habito de fumar tabaco y la aparición de una
cardiopatía coronaria. Se observaron 80 fumadores, de los cuales 35 sufrieren tal cardiopatía durante
un cierto periodo de tiempo; de los 70 no fumadores observados, aparecieron 16 cardiopatías.

a. Elaborar una tabla de 2x2, e indique cual es la variable independiente y la dependiente en esta
tabla.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


83

b. Calcular e interpretar el Riesgo Relativo (RR).

32. En un estudie sobre asfixia perinatal en lactantes que pesan más de 2,5 kg al nacerse definió como
cohorte expuesta al grupo de niños con un Apgar de 0 a 3 a los cinco minutes del nacimiento y como
cohorte no expuesta al grupo de niños con un Apgar de 4 a 6 a los cinco minutes. Ambas cohortes
fueran seguidas para determinar mortalidad infantil (fallecimiento durante el primer año de vida) y
se elabore la siguiente tabla:

Mortalidad infantil
Puntuación Apgar Total
Si No
De 0 a 3 42 80 122
De 4 a 6 43 302 345
Total 85 382 467

a. El riesgo de mortalidad entre los expuestos es: _________________________________

b. El riesgo de mortalidad entre los no expuestos es: ______________________________

c. El Riesgo relativo (RR) es: ________________________________________________

d. La interpretación del resultado anterior es: ___________________________________

33. Los resultados de un seguimiento de 10 años de observación estudiando el riesgo de enfermedad


cardiovascular por hábito de fumar dieron los siguientes resultados:

Enfermedad coronaria*
Al inicio del estudio Total
Presente Ausente
Fumadores sanos 65 1935 2000
No fumadores sanos 20 3980 4000
Total 85 5915 6000
*Resultado luego de 10 años

a. ¿Cuál es el riesgo relativo (RR) de la enfermedad coronaria por habito de fumar?

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


84

34. En la siguiente tabla se presenta la información sobre mortalidad perinatal y numero de controles
prenatales. (Considerar el estudio como de cohorte retrospectivo)

Mortalidad prenatal
Controles prenatales Total
Si No
0 2056 25891 27947
≥1 776 22387 23163
Total 2893 48278 51110

a. Calcular la tasa estimada de mortalidad perinatal con los datos de la tabla.

b. ¿Cuál es la tasa de mortalidad perinatal correspondiente a las madres con cero controles?

c. ¿Cuál es el riesgo de mortalidad perinatal para los niños con cero controles respecto a los de
1 o más controles?

d. Interpretar la medida de asociación obtenida en la pregunta anterior.

35. En un estudio de cohortes, 500 pacientes con hipertensión 500 personas sin hipertensión son
vigiladas por un periodo de 10 anos para detectar accidentes cerebro vasculares. Durante el estudio,
80 de los hipertensos sufrieron un infarto recién diagnosticado mientras que 30 personas de presión
normal presentan tal situación. Asumiendo que no hay pérdidas en el seguimiento ni muertes debidas
a otras causas, responder a las siguientes preguntas

a. ¿Cuál es la incidencia de infarto en las personas con hipertensión?


b. ¿la incidencia o riesgo de infarto en las personas no hipertensas, es?
c. Calcular e interpretar el riesgo relativo(RR) correspondiente

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


85

MISCELÁNEAS

En las siguientes proposiciones señalar con X la alternativa correcta:

1. P|+/ E) expresa:
( ) El valor predictivo positivo de una prueba
( ) La sensibilidad de la prueba en estudio
( ) La especificidad de la prueba en evaluación

2. Si la proporción de falsos negativos es 0,025, la sensibilidad de la prueba es:


( ) 0,957
( ) 0,975
( ) N.A.

3. Valor predictivo negativo de una prueba es la probabilidad de:

( ) Que arroje un resultado negativo en un sujeto que realmente no tiene la enfermedad

( ) Que arroje un resultado negativo en un sujeto que realmente tiene la enfermedad

( ) Que el sujeto realmente no tenga la enfermedad sabiendo que en la prueba en estudio

arrojo un resultado negativo

4. La especificidad de una prueba es la capacidad que tiene para:

( ) Detectar los casos negativos entre los sujetos no enfermos

( ) Detectar los casos positivos entre los sujetos enfermos

( ) Detectar los casos negativos entre los sujetos enfermos

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


86

5. Si el valor predictivo positivo de una prueba es 90%, significa que:

( ) De cada 100 que la prueba detecta como positivos, 10 realmente tienen la enfermedad

( ) De cada 100 que la prueba detecta como positivos, 90 realmente tienen la enfermedad

( ) De cada 100 que la prueba detecta como positivos, 10 realmente no tienen la enfermedad

6. Si el riesgo relativo (RR), en un estudio de cohortes, es 4,0; esto indica:

( ) Que, los expuestos al posible factor causal tienen un riesgo de cuatro veces mayor de no
presentar la enfermedad que los no expuestos
( ) Que, los expuestos al posible factor causal tienen un riesgo de cuatro veces mayor de
presentar la enfermedad que los no expuestos.
( ) Que, de cada cuatro expuestos al posible factor causal, uno se enferma

7. OR (odds ratio) es la medida de asociación utilizada en estudios:

( ) De cases y controles.

( ) Cohortes retrospectivos

( ) Cohortes prospectivos

8. Un estudio informo que la sensibilidad de la mamografía como prueba de preselección para detectar
cáncer de mama es 0,85, mientras que la especificidad es 0,80. La proporción de falsos positivos que
detecta la prueba, es:

( ) 0,20

( ) 0,05

( ) 0,15

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


87

Mediante un diseño de cases y controles se determine la validez de la endoscopia para


diagnosticar cáncer gástrico. Se tome una muestra de 50 casos de cáncer gástrico y 50 controles.
De los casos, se encontraron 17 negativos en la endoscopia y de los controles, 10 arrojaron un
resultado positivo en la endoscopia. (Preguntas 9 a 14)

9. La proporción de falsos positivos que arroja la endoscopia, es:

( ) 0,20

( ) 0,34

( ) 0,66

10. La probabilidad de que la endoscopia muestre un resultado positive en un sujeto que realmente
tiene cáncer gástrico, es:

( ) 0,20

( ) 0,34

( ) 0,66

11. El Odds a favor de la exposición en los cases, es:

( ) 1,94

( ) 0,26

( ) 0,66

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


88

12. El Odds Ratio o razón de ventajas es igual a:

( ) 1,94

( ) 0,13

( ) 7,76

13. Supongamos que la probabilidad de tener cáncer gástrico en la población es de 0,001.La


probabilidad de que un sujeto seleccionado de la población tenga cáncer gástrico si la
endoscopia dio un resultado positivo, es:

( ) 0,9996

( ) 0,7674

( ) 0,0033

14. Supongamos que la probabilidad de tener cáncer gástrico en la población es de 0,001. La


probabilidad de que el sujeto seleccionado no tenga cáncer gástrico si la endoscopia arrojo
un resultado negativo, es:

( ) 0,9996

( ) 0,7674

( ) 0,0033

15. Un OR = 1 en un estudio de casos y controles, indica:

( ) Que la exposición no influye en la probabilidad de enfermar; consecuentemente, no existe


ninguna relación entre la exposición y la enfermedad.

( ) Que el posible factor causal es de riesgo

( ) Que el posible factor causal es protector

16. Señalar la expresión correcta:

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


89

( ) P (E/+) = P (E ∩ +) / P (E), donde: P (E) > 0

( ) P (E/+) = P (E ∩ +) / P (+), donde: P (+) > 0

( ) P (E/+) = P (E ∪ +) / P (+), donde: P (+) > 0

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


90

6. DISTRIBUCION BINOMIAL

Objetivos

2. Calcular la probabilidad de un evento mediante la distribución Binomial


3. Calcular 1a probabilidad acumulada mediante la distribución Binomial
4. Aplicar la media y desviación estándar de la distribución Binomial

Lectura sugeridas

 Daniel W. Bioestadística. Base para el análisis de las ciencias de la salud. 4ª ed. México.
Limusa Wiley; 2009
 .Dawson B, Trapp R. Bioestadística médica. 4ª ed. México: manual moderno;2005
 Mendenhall W, Beaver B, Beaver R. Introducción a la probabilidad y estadística.12ª ed.
México: Thomson; 2008.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


91

PRACTICAS

1. Se sabe que el 50% de pacientes que acude a una Clínica Psiquiátrica tiene algún desorden
Mental (DM). Se toma una muestra aleatoria de cuatro historias clínicas:

a. Calcular la probabilidad de que ninguno de la muestra tenga desorden mental, esto es,
P(X= 0).

b. De la misma manera, calcular la P(X=l), P(X=2), P(X=3) y P(X=4), escribir los resultados
en la Tabla 1.

c. Decir qué expresa cada uno de estos resultados.

d. Asimismo, obtener e interpretar con los resultados de la preguntas a y b, las probabilidades


acumuladas, P(X ≤ x) y escribir en la Tabla 1.

Tabla 1 Distribución Binomial*

X
(Número de pacientes con P(X=x) P(X≤ x)
DM en la muestra
0 0,0625 0,0625
1
2
3
4

ΣP(X=x) ______________

*Distribuci6n de probabilidades individuales y acumuladas para p = 0,5 y x = 0, 1, 2, 3, y 4

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


92

e. Comprobar que ΣP(X=x)= 1

f. ¿Alguna P(X=x) es negativa?_________________________________________________

g. ¿Por qué entonces, la distribución Binomial es una distribución de probabilidades?

________________________________________________________________________________
__________________________________________________________________________

2. Un 1aboratorio afirma que una droga causa efectos secundarios en una proporci6n de 3de cada 100
pacientes. Para contrastar esta afirmación, otro laboratorio elige al azar a 5pacientes a 1os que aplica
la droga. ¿Cuál es la probabilidad de los siguientes sucesos?

a. Ningún paciente tenga efectos secundarios.

b. A1 menos dos tengan efectos secundarios.

c. ¿Cuál es el número de pacientes que espera e1 laboratorio que sufran efectos secundarios
si elige 100 pacientes al azar?

3. En unas pruebas de alcoholemia se ha observado que el 5% de 10s conductores controlados dan


positivo en la prueba y que el 10% de 10s conductores controlados no llevan abrochado el cinturón
de seguridad. También se ha observado que las dos infracciones son independientes. Un policía de
tránsito para a cinco conductores al azar. Si tenemos en cuenta que el número de conductores es
suficientemente grande como para estimar que la proporción de infractores no varía al hacer la
selección.

a. Determinar la probabilidad de que exactamente tres conductores hayan cometido alguna de


las dos infracciones.

b. Determine la probabilidad de que a1 menos uno de los conductores controlados haya cometido
alguna de las dos infracciones.

4. Una clínica odontológica universitaria informé que 1 de cada 100 pacientes atendidos presenta
alguna malformación congénita bucal.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


93

Si de esta población se selecciona un paciente al azar:

a. Calcular la probabilidad de que no tenga malformación congénita bucal.

Si de la población se selecciona una muestra aleatoria de 10 pacientes, calcular:

b. La probabilidad de que ninguno de la muestra tenga alguna malformación congénita bucal.

c. La probabilidad de que un paciente de la muestra tenga alguna malformación congénita


bucal.

d. La probabilidad de que, cuando mas, uno de ellos tenga alguna malformación congénita
bucal.

5. En la historia de luna enfermedad seria se ha encontrado que cerca de % de sus víctimas se


recuperan.

a. Calcular la probabilidad de que exactamente uno de los siguientes cinco pacientes que sufran
de esa enfermedad se recupere.

b. Encontrar la probabilidad de que cuando menos uno de los siguientes cinco pacientes
afectados por la enfermedad se recupere.

6 Por muchos años se ha observado que el 80% de los alumnos matriculados en el curso de
Bioestadística aprueba el primer examen. En una muestra de cinco alumnos:

a. Calcular la probabilidad de que todos aprueben el primer examen

b. ¿Cuál es la probabilidad de que cuando menos tres de los cinco alumnos aprueben el primer
examen?

7. Suponer que en cierta población el 40% de los habitantes tiene algún tipo de alergia. Si, de esta
población se selecciona aleatoriamente seis habitantes:

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


94

a. ¿Cuál es la probabilidad de que ninguno de los habitantes tenga algún tipo de alergia?

b. ¿Cua1 de que todos tengan algún tipo de alergia?

8. La proporción de fumadores en una ciudad es de cuatro de cada 10 personas. Si de esta ciudad se


selecciona aleatoriamente 10 personas, se pide:

a. La probabilidad de que tres o menos personas sean fumadores

b. Determinar el número esperado de fumadores en la muestra.

9. Se sabe que el 30% de los alumnos de cierta universidad practica algún tipo de deporte. En una
muestra aleatoria de cinco alumnos de esta universidad. Calcular la probabilidad de que:

a. Exactamente tres practiquen algún tipo de deporte

b. Solo los tres primeros alumnos entrevistados practiquen algún tipo de deporte

10. La tasa de mortalidad para cierta enfermedad es de 0, 15 y suponga que la contraen 10personas
de la comunidad (considerar como muestra aleatoria). Calcular la probabilidad de que:

a. Ninguna sobreviva

b. Al menos tres mueran

c. Calcular la media y desviación estándar de la distribución.

11. La probabilidad de que llueva es % para cada uno de los cinco días siguientes. Para el propósito
de este problema, suponer que los cinco días comprenden pruebas independientes.

a. ¿Cuál es la probabilidad de que no haya lluvia durante los cinco días siguientes?

b. ¿Cuáles la probabilidad de llueva los cinco días siguientes?

c. ¿Cuál es la probabilidad de lluvia en cuando menos dos de los cinco días siguientes?

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


95

12. En cierta población, la prevalencia de caries es 95%. Se selecciona una muestra al azar de 20
pobladores.

a. ¿Cuál es la probabilidad de que exactamente 18 de la muestra tengan caries?

b. ¿Cuál es la probabilidad de que cuando más 10 tengan caries?

c. Si solo 10 de los 20 pobladores tienen caries, ¿qué se puede inferir acerca del verdadero
valor de la prevalencia?

13. Sea X una variable con distribución Binomial de media aritmética igual a 6 y varianza igual a 2,4.

a. Obtener el valor de parámetro p.

b. Asimismo, obtener el valor de n.

c. Calcular la P(X >1).

d. Determinar P (2≤ X ≤3).

e. Calcular P(X ≤ 9).

14. La Facultad de Odontología de cierta universidad limeña, observando muchos años, ha encontrado
que mas 0 menos el 90% de los alumnos matriculados en el curso de Estadística I, asiste a la clase
inaugural (primera clase). En el 2012 se matricularon100 alumnos en el curso de Estadística I.
¿Dentro de que limites esperaría encontrar el profesor, el número de alumnos en su primera clase del
curso mencionado?

Sugerencia: calcular (𝜇𝑥 ± 2𝜎𝑥 ), donde: 𝜇𝑥 = media aritmética o numero esperado y 𝜎𝑥 =desviación
estándar de la distribución Binomial.

15. Una prueba de Estadística I de selección múltiple ofrece cinco respuestas alternativas a cada una
de 20 preguntas. En cada caso hay solo una respuesta correcta. Diego, que (últimamente ha tenido
muchos problemas, se presenta a la prueba sin haber estudiado nada y decide marcar sus respuestas
al azar:

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


96

a. ¿Qué probabilidad tiene de obtener 20?

b. ¿Qué probabilidad tiene Diego de obtener cero de nota?

c. ¿Qué nota espera tener Diego en esta prueba?

d. ¿Qué probabilidad tiene Diego de tener la nota esperada?

e. En cambio Erika, que es muy estudiosa, responde correctamente a cada una de las primeras
15 preguntas, cuando nota que le quedan justamente 30 segundos para la finalización de la
prueba. Rápidamente contesta las cinco preguntas restantes marcando al azar, sin leerlas.
¿Qué nota espera tener Erika?

16. La tabla 2 ha sido obtenida por Lancaster (1996), a partir de los datos publicados por Roberts et
al (1956). Estos autores estudiaron 551 cruces entre ratas, con un progenitor y heterocigoto para cada
uno de cinco factores, y el otro progenitor homocigoto recesivo para cada uno de ellos. La distribución
refleja el número de genes dominantes sobre cinco para cada progenie. La distribución teórica es la
Binomial, con n = 5 y p = 1 /2.

Tabla 2. Distribución del número de genes dominantes

Número de genes Número de hijos


dominantes Observado Esperado
0 17 17,2
1 81
2 152 172,2
3 180
4 104 86,1
5 17
Total 551 551

a. Calcular y escribir en la Tabla, el número de hijos esperado para cada número de genes
dominantes que falta, suponiendo distribución Binomial.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


97

Sugerencia: Las frecuencias esperadas 0 numero esperado se obtienen multiplicando las


probabilidades Binomial por 551.

b. ¿Cómo describe la concordancia entre las frecuencias observadas y las esperadas


obtenidas según la Binomial?

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


98

MISCELÁNEAS

En las siguientes proposiciones señalar con X la alternativa correcta:

1. E1 resultado de: 4! 0!, es:

( )0

( )1

( ) 12

( ) 24

( ) N.A.

2- Una característica de la distribución Binomial es:

( ) ΣP(X) = 1

( ) ΣP(X) ≠ 1

( ) Σ P(X) > 1

( ) Σ P(X) < 1

( ) N.A.

3. La prevalencia de parasitosis en cierta población es 20%, se selecciona una muestra de5 personas,
la probabilidad de que 3 no presenten parasitosis, es:

( ) 0,2048

( ) 0,0512

( ) 0,5120

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


99

( ) 0,6360

( ) N.A.

4. Respecto a la pregunta anterior, el número esperado de no parasitados en la muestra es:

( )4

( )1

( ) 1,5

( )2

() N.A.

5. La media aritmética y la desviación estándar de una distribución Binomial son respectivamente,


1/2 y √0, 45. La probabilidad de fracaso, q, es:

( ) 0,50

( ) 0,90

( )1 0,10

( ) 0,45

( ) N.A.

6. Respecto a la pregunta anterior, e1 tamaño de la muestra, n, es.

( )5

( )4

( )6

( )8

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


100

( ) N .A.

7. Usando los resultados anteriores, la p(X=0), es.

( ) 0,5905

( ) 0,0590

( ) 0,5000

( ) 0,4500

( ) N.A.

8. Los parámetros de la distribución Binomial son:

( )nyq

( )pyq

( )𝜇y𝜎

( )nyp

( ) N .A.

9. Uno de los siguientes ensayos no corresponde a un ensayo de Bernoulli, señalar:

( ) Vida o muerte

( ) Sano o enfermo

( ) Positivo o negativo

( ) Costa, sierra o selva

( ) Aprobado o desaprobado

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


101

10. Una secuencia de ensayos de Bernoulli forma un proceso de Bernoulli, si se cumplen tres
condiciones, una de las siguientes, no conforma este conjunto de condiciones, señalar:

( ) En cada ensayo ocurre uno de dos resultados, mutuamente excluyentes

( ) Uno de los posibles resultados se denota (arbitrariamente) como éxito y e1 otro como
fracaso.

( ) La probabilidad de éxito, denotado por p, permanece constante de un ensayo a otro.

( ) La probabilidad de fracaso, (1 —p) = q, puede variar de un ensayo a otro.

( ) Los ensayos son independientes

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


102

7. DISTRIBUCION DE POISSON

Objetivos

1. Calcular la probabilidad de un evento mediante la distribución de Poisson


2. Calcular la probabilidad acumulada mediante la distribución de Poisson
3. Aplicar la media y desviación estándar de la distribución de Poisson

Lectura sugeridas

 Daniel W. Bioestadística. Base para el análisis de las ciencias de la salud. 4ª ed. México.
Limusa Wiley; 2009
 .Dawson B, Trapp R. Bioestadística médica. 4ª ed. México: manual moderno;2005
 Mendenhall W, Beaver B, Beaver R. Introducción a la probabilidad y estadística.12ª ed.
México: Thomson; 2008.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


103

PRACTICAS

1. Supongamos que la central telefónica de una institución educativa en cada minuto, en promedio
recibe dos llamadas. En los próximos cinco minutos:

a. ¿Cuál es la probabilidad de que la central telefónica reciba exactamente dos llamadas?

b. ¿Qué probabilidad hay de que la central telefónica reciba exactamente cinco llamadas?

c. ¿Qué probabilidad existe de que reciba por lo menos una llamada?

d. ¿Qué probabilidad hay de que no reciba ninguna llamada?

2. Se sabe que en la carretera de Lima a Chosica se produce, en promedio 0,2 accidentes de tránsito
por kilometro. Calcular la probabilidad de que en dos kilómetros cualesquiera de esta carretera:

a. Se produzca exactamente un accidente

b. No se produzca ningún accidente

c. Se produzca a los más dos accidentes

3. Durante mucho tiempo se ha observado que en un centímetro cubico (cm3) de agua de mar existe,
en promedio una bacteria coliforme. Se toma, del mar, una muestra de cincocm3 de agua:

a. ¿Qué probabilidad hay de que no exista ninguna bacteria coliforme?

b. ¿Cuál es la probabilidad de la muestra contenga más de dos bacterias coliformes?

c. ¿Qué probabilidad existe que la muestra contenga cuando mas una bacteria coliforme?

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


104

4. El número promedio de pacientes admitidos por día en la sala de emergencias de un hospital


pequeño es 2,5. Si solo hay cuatro camas disponibles en dicha sala (¿cuál es la probabilidad de que
un día cualquiera el hospital no tenga camas suficientes para acomodar los pacientes que lleguen?

5. El número de pacientes que llega a un hospital sigue una distribución de Poisson. Si el número
promedio es de 120 por hora, ¿cuál es la probabilidad de que en un minuto lleguen por lo memos tres
pacientes?

6. Un supervisor de seguridad en un hospital afirma que el número esperado de accidentes laborales


por mes es de 3,4.

a. ¿Cuáles la probabilidad de que el próximo mes ocurran exactamente dos accidentes?

b. ¿Cuál es la probabilidad de que el próximo mes ocurran tres o más accidentes?

7. Se sabe que solo el 3% de recién nacidos tiene alguna malformación congénita. En una muestra de
100 recién nacidos.

a. Calcular la probabilidad de que exactamente cinco de ellos tenga alguna malformación


congénita.

b. ¿Cuál es la probabilidad de que ninguno tenga alguna malformación congénita?

c. ¿Cuáles el número esperado de recién nacidos con alguna malformación congénita en la


muestra?

d. ¿Cuál es la desviación estándar?

8. Cierto tipo de equipo electro médico trae asociada una probabilidad de defecto de 0,02.Se adquiere
un lote (muestra) de 85 equipos.

a. Calcular la probabilidad de que la muestra no contenga ningún equipo defectuoso.

b. ¿Cuál es la probabilidad de uno de los 85 tenga algún defecto?

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


105

c. Calcular la probabilidad de que existan cuatro equipos con defectos.

d. Calcular la probabilidad de que memos de dos equipos tengan defectos.

e. ¿Cual, de que a lo mas dos sean defectuosos?

9. Se sabe que al aplicar un antibiótico de última generación, la probabilidad de que se produzca un


evento adverso es 0,005. Se va aplicar el antibiótico a una muestra de 100pacientes.

a. Calcular la probabilidad de que exactamente tres presenten el evento adverso.

b. ¿Cuáles la probabilidad de que por 10 menos dos pacientes presenten el evento adverso?

10. Suponer que X es una variable aleatoria para la cual un distribución de probabilidad de Poisson
con 𝜆 = 5,5 constituye una buena caracterización.

a. Calcular 𝜇 y 𝜎

b. Calcular el intervalo (𝜇x± 2 𝜎x)

11. Supongamos que X es una variable aleatoria para la cual una distribución de probabilidad de
Poisson constituye una buena caracterización. Calcular lo siguiente:

a. P(X ≥ 1), cuando λ = 3

b. P(X = 1), cuando λ = 5

c. P(X = 0), cuando λ = 9

12. Supongamos que el número de imperfecciones en un alambre delgado de cobre sigue la


distribución de Poisson con una media de 2,3 imperfecciones por milímetro.

a. Determinar la probabilidad de 2 imperfecciones en un milímetro de alambre.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


106

b. Determinar la probabilidad de 10 imperfecciones en 5 milímetros de alambre.

c. Determinar la probabilidad de al menos una imperfección en 2mm de alambre.

13. La contaminación constituye un problema en la fabricación de discos de almacenamiento óptico.


El número de partículas de contaminación que ocurre en un disco óptico tiene una distribución de
Poisson y el número promedio de partículas por centímetro cuadrado de superficie del disco es 0,1.
El área de un disco bajo estudio es 100 centímetros cuadrados.

a. Encontrar la probabilidad de que ocurran 12 partículas en el área del disco bajo estudio.

b. La probabilidad de que ocurran cero partículas en el área del disco bajo estudio.

c. Determinar la probabilidad de que 12 0 menos partículas ocurran en el área del disco bajo
estudio.

14. Una prisión de máxima seguridad reporta que el número de intentos de escape por mes sigue
una distribución aproximadamente de Poisson con una media de 1,5 intentos/mes. Calcular:

a. Probabilidad de tres intentos de escape durante el próximo mes.

b. Probabilidad de al menos un intento de escape el próximo mes.

15. Las últimas estadísticas de salud, afirman que en la sierra del sur del Perú se presenta una alta
incidencia de cáncer de estomago (120 casos por cada 100,000 habitantes). Suponga que se realizan
exámenes a 1000 habitantes del distrito de San Jerónimo (Cusco) y se asume que para estas la tasa de
incidencia es la misma que para toda la sierra del sur peruano.

a. ¿Cuál es la probabilidad de que ninguna de las personas examinadas tenga cáncer?

b. ¿Cua1 es la probabilidad de que al menos 3 personas tengan cáncer?

c. ¿Cua1 es la probabilidad de que a1 menos 8 personas tengan cáncer?

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


107

MISCELÁNEAS

En las siguientes proposiciones señalar con X la alternativa correcta:

1. El resultado de e°, es:

( )0

( )1

( )∞

( ) 2,7183...

( ) N.A.

2. El resultado de e(-0,9) es:

( )0

( )1

( ) -0,9

( ) 0,9

( ) 0,4066

3. La media (𝜇x) y la varianza (𝜎𝑥2 ) de una variable aleatoria de Poisson son, respectivamente:

. ( ) 𝜇x=np y 𝜎𝑥2 =pq

( ) 𝜇x=np y 𝜎𝑥2 =npq

( )𝜇x=λ y 𝜎𝑥2 =λ

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


108

( ) 𝜇x=λ y 𝜎𝑥2 =√𝜆

( ) 𝜇x=λ y 𝜎𝑥2 =λ2

4. Se sabe que de cada 100 partos, dos corresponden a partos gemelares. Se selecciona una muestra
de 150 historias clínicas de recién nacidos, la probabilidad de que se encuentre menos de dos partos
gemelares, es:

( ) 0,049

( ) 0,050

( ) 0,199

( )0

( ) N.A.

5. La aproximación de la distribución Binomial a la de Poisson resulta mejor si.

( )𝜇x→ 0 y 𝜎x→ ∞

( ) p→ 0 y q→ ∞

( )n→ ∞ y q→0

( ) n→ ∞ y p→0

( ) N.A.

6. Un cátodo caliente emite electrones a una razón promedio de v = 1013 electrones por segundo. La
probabilidad de que no se emita ningún electrón durante un intervalo de T segundos, si las emisiones
son eventos independientes que ocurren aleatoriamente en e1 tiempo (características de la
distribución de Poisson), es:

( ) eT

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


109

( ) e-T

( )e(-vT)

( )0

( ) N.A.

7. Respecto 2.1 ejercicio anterior. Calcular P(X =0), si T = 1/v

( )e

( ) e-1=0,3679

( )0

( )1

( ) N.A.

8. Respecto a las emisiones de electrones de un cátodo caliente, calcular P(X =0), si T = 2/v

( ) e2

( ) e-1=0,1353

( )0

( )1

( ) N.A.

9. Supongamos que las llamadas telefónicas se colocan aleatoria e independientemente en el tiempo


con una frecuencia promedio de v llamadas por segundo. La probabilidad de que se ocurra
exactamente una llamada en un intervalo de 3/v segundos, es:

( ) 3e-3 =0,1494

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


110

( ) e-3=0,0498

( ) e-3v

( ) e3v

( ) N.A.

10. Con base en la pregunta anterior, 1a probabilidad de que ocurran memos de tres llamadas en un
intervalo de 1/v segundos, es:

( ) e-1

( ) e-2

( )2,5e-1=0,9197

( ) e-1/v

( ) 2,5e

11. La aproximación de la distribución Binomial a la de Poisson resulta mejor si λ<5 (λ=np). En este
caso:

( )𝜇x =𝜎x

( )𝜇x = 𝜎𝑥2

( )𝜇x =√𝜎𝑥

( )𝜇x> 𝜎𝑥2

( ) N.A.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


111

8. DISTRIBUCION NORMAL

Objetivos

1. Utilizar la tabla de áreas de la curva normal estándar


2. Calcular la probabilidad o área debajo de una curva normal cualquiera.
3. Aplicar las propiedades de la distribución normal en la determinación de limites
referenciales. .

Lectura sugeridas

 Daniel W. Bioestadística. Base para el análisis de las ciencias de la salud. 4ª ed. México.
Limusa Wiley; 2009
 .Dawson B, Trapp R. Bioestadística médica. 4ª ed. México: manual moderno;2005
 Pagano M, Gauvreau K. Fundamentos. de Bioestadística. 2a ed. México: Thomson

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


112

PRACTICAS

1. Utilizar la tabla de áreas de la curva normal (Ver Anexos) estándar para calcular las siguientes
probabilidades, donde Z es la variable aleatoria normal estándar:

a. P (0, 5≤Z≤1, 5)

b. P (-1, 75 ≤ Z ≤ -0,28)

c. P (-2, 32≤Z≤0, 11)

d. P (Z > 0, 27)

e. P (Z i≤-1, 33)

f. P (Z ≤ 1,71)

2. Mediante la tabla de la distribución normal estándar, calcular zo, si:

a. P (Z ≤ zo) = 0,8079

b. P (Z > zo) = 0,0028

c. P (Z > zo) = 0,0250

d. P (Z ≤ zo) = 0,1500

e. P (-Z0 ≤ Z ≤ zo) = 0,8000

f. P (-Z0 ≤ Z ≤ Zo) = 0, 9500

3. Supongamos que el tiempo de estancia hospitalaria por una enfermedad crónica para cierto tipo de
pacientes, se distribuye normalmente, con una media de 60 días y desviación estándar de 15 días.
Calcular la probabilidad de que un paciente elegido al azar de esta población, tenga una
hospitalización:

a. Mayor que 50 días

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


113

b. Entre 30 y 60 días

c. Menor que 30 días

d. Mayor que 90 días

4. Se sabe que los pesos de recién nacidos en el Instituto Materno Perinatal de Lima se distribuyen
normalmente, con una media aritmética de 2850g y desviación estándar de 500g .Si en este momento
se produce un nacimiento, calcular la probabilidad de que este niño:

a. Tenga más de 4000g de peso.

b. Presente un peso entre 1500 y 2500g

c. Pese entre 2350 y 3350g

d. Sea de bajo peso al nacer (Es decir, tenga menos de 2500g)

5. Supongamos que los niveles de glucosa en sangre de diabéticos en ayuna se distribuyen


normalmente con 𝜇 = 105 y 𝜎 = 9.

a. ¿Qué proporción de diabéticos presentan niveles de glucosa entre 90 y 125?

b. ¿Qué niveles de glucosa tendrá el 95% (central) de los diabéticos?

6. Las puntuaciones de un examen del curso de Bioestadística se distribuyen normalmente con una
media de 14,5 y desviación estándar de 3,0

a. ¿Qué porcentaje de estudiantes tendrán notas entre 11 y 15?

b. ¿Cuál es la probabilidad de que un alumno elegido al azar no tenga una nota mayor de 10?

c. Se acuerda desaprobar al 1 1,7% de alumnos, ¿Cuál es la mínima nota aprobatoria?

(Expresar la respuesta con dos decimales)

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


114

7. Los puntajes de Coeficientes de Inteligencia tomados a un grupo de personas adultas, en un


proceso de selección de personal están distribuidos normalmente con una media de 105 y una
desviación estándar de 12.

a. Si el puntaje mínimo para aprobar es 90, ¿Cuál es el porcentaje de no aprobados?

b. Si ha aprobado el 75% de las personas, ¿Cual es el puntaje mínimo aprobatorio?

8. Los Valores de colesterol total en cierta población de trabajadores, tiene distribución normal. Por
otro lado se sabe que el 5% superior de los trabajadores tiene el colesterol por encima de 280 y que
el 10% inferior de los trabajadores tiene colesterol igual o menor de 170.

a. Se pide determinar los Valores de la media y Varianza de la distribución normal.

b. Si de esta población seleccionamos un trabajador al azar, ¿Cuál es la probabilidad de que


tenga colesterol mayor a 250?

9. La presión arterial diastólica de la población de mayores de 65 anos tiene distribución normal con
una media de 95 y una desviación estándar de 9. Si de esta población seleccionamos un sujeto al azar,
¿Cuál es la probabilidad de que:

a. Su presión arterial diastólica sea igual o menor a 7 5?

b. Su presión arterial sistólica este comprendida entre 75 y 120?

c. Si la población tiene 1000 sujetos, ¿Cuantos se espera que tengan la presión arterial mayor a
120?

d. ¿A qué valor de presión arterial diastólica se localiza el 25% inferior de los sujetos mayores
de 65 años?

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


115

10. Se quiere estudiar la calidad de una prueba de análisis de sangre para medir la cantidad de alcohol
ingerida. El nivel de alcohol en sangre de los individuos que han consumido dos cervezas en las
últimas dos horas sigue una distribución normal con media 0,4 y desviación estándar de 0,05 mientras
que para aquellos individuos que han consumido tres cervezas la distribución es normal con media
0,6 y desviación estándar de 0,1.

Teniendo en cuenta que actualmente el valor máximo permitido es de 0,5.

a. ¿Qué porcentaje de los individuos que han bebido tres cervezas se libraría de la infracción?

b. ¿Qué porcentaje de los individuos que han bebido dos cervezas sería sancionado?

11. En una distribución normal que tiene una desviación estándar de dos, la probabilidad de que el
valor de una variable elegida al azar sea mayor de 28, es 0,03.

a. Calcular la media de la distribución.

b. Obtener el Valor de la Variable que supera el 95% de los Valores

12. En una distribución normal con media 15,00 y desviación estándar 3,50, se sabe que 647
observaciones son mayores que 16,25. ¿Cuál es el número total de observaciones?

13. En un examen la nota media fue de 70,0 y la desviación estándar 10,0. El profesor dio a todos los
estudiantes con notas de 61,0 a 79,0 la calificación C. hubo 24 alumnos con C. Si se supone que las
calificaciones siguen una distribución normal, ¿Cuántos alumnos se examinaron?

14. En una distribución normal, con media 120,0 y desviación estándar 30,0 existen 300
observaciones entre 130 y 150. ¿Cuántas observaciones existen entre 130 y 145?

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


116

15. Los resultados de una prueba objetiva aplicada a 200 personas indicaron que la distribución de
puntuaciones era normal, con media de 80 puntos y desviación estándar de 10 puntos. Calcular
cuántos de los examinados han obtenido:

a. Puntuación superior a 100 puntos

b. Puntuación inferior a 55 puntos

c. Puntuación comprendida entre 65 y 95 puntos

d. Si deseamos seleccionar al 10% de las mejores pruebas, da partir de qué puntuación hemos de
escoger?

16. Se sabe que la talla media de una población en edad escolar es 1 65cm con una desviación estándar
de 12cm. Un centro tiene 1400 alumnos matriculados, se pide:

a. ¿Cuántos alumnos se espera que midan más de 155cm?

b. ¿Qué proporción (%) de alumnos mide entre 150 y 17 8cm?

c. Determinar la probabilidad de que un alumno tomado al azar mida entre 170 y 186cm.

d. ¿Qué talla permite asegurar que, elegido un alumno al azar, el 67% de sus compañeros sean
más bajos que él?

17. Se supone que en cierta población humana el índice cefálico I (ancho del cráneo expresado como
porcentaje de su longitud) se distribuye normalmente. Si el 58% de la población es dolicocefálico (I
S 75), el 38% es mesocefálico (75 < I i 80) y el 4% braquicefálico (I > 80). Hallar la media y la
desviación estándar de la distribución de I.

18. La media de una variable X con distribución normal es 5 veces la desviación estándar. Además
se verifica que P(X ≤ 6) = 0,8413. Calcular la media y desviación estándar de la distribución de la
variable aleatoria X.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


117

19. Sea X una variable aleatoria normal con media igual a 24 y varianza igual a 9. Hallar para que
P(X ≤ c) = 0,0630.

20. La supervisora de enfermería encontró que el personal de enfermería, en promedio, termina cierta
tarea en 10 minutos. Si el tiempo requerido para completar la tarea sigue una distribución
aproximadamente normal con una desviación estándar de 3 minutos, calcular:

a. La cantidad proporcional (%) de enfermeras que terminan esa tarea en menos de 4 minutos.

b. La cantidad proporcional (%) de enfermaras que necesitan más de 5 minutos para terminar
dicha tarea.

c. La probabilidad de que una enfermera a la que recientemente se le asigno la tarea, termine en


exactamente 3 minutos.

21. En el estudio de Framingham, se evaluaron los niveles de colesterol total en una población grande
de varones saludables. La población se estudio durante 16 años. Al final de este periodo, los varones
fueron divididos en dos grupos: los que habían contraído una enfermedad coronaria y los que no la
habían contraído. Se encontró que las distribuciones de los niveles iníciales de colesterol en sangre
en cada grupo eran más o menos normales. En los sujetos que finalmente contrajeron una enfermedad
coronaria, el nivel promedio de colesterol en sangre fue de 𝜇E = 244mg/ 100ml y desviación estándar
de 𝜎E = 51mg/100ml. En el caso de los que no desarrollaron la enfermedad, el nivel promedio de
colesterol en sangre fue de 𝜇NE = 219mg/100ml y desviación estándar de 𝜎NE = 41mg/ 100ml.
Supongamos que un nivel inicial de colesterol en sangre de 260 mg/100ml o mas alto se utiliza para
predecir una enfermedad coronaria.

a. ¿Cuál es la probabilidad de predecir correctamente que un varón contraerá una enfermedad


coronaria? (proporción de verdaderos positivos)

b. ¿Cuál es la probabilidad de predecir que un varón (verdaderamente) no contraerá una


enfermedad coronaria? (proporción de verdaderos negativos)

c. ¿Cuál es la probabilidad de fallar en la predicción de que un hombre desarrolle una enfermedad


coronaria? (proporción de falsos positivos)

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


118

d. ¿Qué sucedería con las proporciones de falsos positivos y negativos si el punto de separación
para predecir una enfermedad coronaria se redujera a 250mg/ 100ml

e. En esta población, ¿parece útil el nivel inicial de colesterol total en sangre para predecir una
enfermedad coronaria? ¿Por qué?

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


119

MISCELÁNEAS

En las siguientes proposiciones señalar con X la alternativa correcta:

1. En la curva normal estándar, N (0, 1), la altura máxima (Y), se produce cuando:

( ) Z= -1

( ) Z = -2

( )Z=0

( )Z=2

( )Z=∞

2. La curva normal estándar, a lo largo del eje horizontal (Z), abarca aproximadamente:

( ) Dos desviaciones estándar

( ) Tres desviaciones estándar

( ) Cuatro desviaciones estándar

( ) Cinco desviaciones estándar

( ) Seis desviaciones estándar

3. Las frecuencias cardiacas (lat/ min) en una población de 400 varones adultos, se distribuyen
normalmente con 𝜇 = 70 y 𝜎 = 5. La probabilidacl de que un sujeto seleccionado al azar tenga una
frecuencia cardiaca de 68 lat/ min, es:

( )0

( ) 0,5000

( ) 0,6800

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


120

( ) 0,9500

( ) N .A.

4. Respecto a la pregunta anterior aproximadamente, ¿cuántos sujetos tendrán frecuencias cardiacas


iguales 0 menores que 65? (Responda a la pregunta, usando solo las características de la distribución
normal)

( ) 200

( ) 128

( ) 64

( ) 32

( ) 16

5. Respecto a la pregunta 3, aproximadamente, ¿cuántos sujetos tendrán frecuencias cardiacas


mayores que 80? (Responda a la pregunta, aplicando solo las características de la distribución normal)

( ) 50

( ) 40

( ) 20

( ) 10

( ) 15

6. Una de las siguientes no corresponde a una característica de la curva normal, señale cual es:

( ) Es una curva asintótica.

( ) La probabilidad de éxito permanece constante de ensayo a ensayo.

( ) Es simétrica respecto a la perpendicular trazada en el punto donde está la media.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


121

( ) La media, percentil 50 y moda son iguales. A

( ) Entre (𝜇 ± 𝜎) se define aproximadamente el 0,68 del area total.

7. La curva de la distribución normal estándar o unitaria se caracteriza por:

( ) Es más elevada que una curva normal cualquiera

( ) Tiene 𝜇=1 y 𝜎=0

( ) A1 lado izquierdo tiene áreas negativas y a la derecha tiene áreas positivas.

( ) Tiene: 𝜇=0 y 𝜎=1

( ) 𝜇 = np

8. Los parámetros de la distribución normal, son:

( ) Media, mediana y moda.

( ) Probabilidad de éxito y probabilidad de fracaso.

()nyp

( ) Z = (X - 𝜇) /𝜎

( ) N .A.

Los tiempos de atención médica en cierto hospital se distribuyen normalmente con 𝜇 = 20 y 𝜎 = 5


minutos. (Preguntas 9 a 13).

9. La probabilidad de que un sujeto seleccionado al azar sea atendido 25 minutos o más, es:

( ) 0,8413

( ) 0,1587

( ) 0,9500

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


122

( ) 0,6800

( ) N.A.

10. Si el estándar para tiempo de espera para la atención médica es 1 5 minutos. E1 porcentaje de
pacientes en los que el tiempo de atención es inferior al tiempo estándar, es:

( ) 0,8413%

( ) 0,1587%

( ) 0,9500%

( ) 0,6800%

( ) N.A.

11. Si en todo el año fueron atendidos 2500 pacientes, el número de pacientes atendidos menos de 10
minutos, es:

( ) 0,0228

( ) 2,28

( ) 57

( ) 2443

( ) N.A

12. La moda de la distribución de los tiempos de atención médica, es:

( ) 57 minutos

( ) 20 minutos

( ) 25 minutos

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


123

( ) 15 minutos

( ) Faltan datos

13. El 95% de los pacientes fueron atendidos entre

( ) 10 y 30 minutos, aproximadamente

( ) 5 y 20 minutos, aproximadamente

( ) 15 y 25 minutos, aproximadamente

( ) 15 minutos, aproximadamente

14. Los niveles de plomo en sangre en la población de escolares de Callao se distribuyen normalmente
con media 5,7 y desviación estándar 3,5. Se selecciona un escolar al azar, la probabilidad de que tenga
plomo en sangre de 10 o menos, es:

( ) 0,8907

( ) 0,1093

( ) 0,0891

( ) 0,5000

( ) N.A.

15. Respecto a la pregunta anterior, la probabilidad de que el escolar seleccionado al azar tenga plomo
en sangre entre 11 y 15 inclusive, es.

( ) 0,9961

( ) 0,9345

( ) 0,0080

( ) 0,0616

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


124

( ) N.A.

16. En una distribución normal con 𝜇 = 72 y 𝜎 = 12, dcuél es el valor correspondiente al percentil 25?

( ) 50.00

( ) 60,00

( ) 63,96

( ) 80,04

( ) 84,96

17. Los pesos (kg) de estudiantes universitarios varones tiene distribución normal con media igual a
78 y varianza de 36. Se selecciona un estudiante al azar y pesa más de 72kg, ¿Cuál es la probabilidad
de que su peso sea, de hecho, superior a 84kg?

( ) 0,1587

( ) 0,1886

( ) 0,4364

( ) 0,5636

( ) 0,7740

18. En una distribución normal de u = 4 y o = 2, calcular el valor de a para que: P (4-a ≤ X ≤ 4 +a)
= 0,5934

( ) 0,66 ·

( ) -1,66

( ) 1,66

( ) 2,66

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


125

( ) N .A.

19. Los puntajes en una prueba de inteligencia se distribuyen normalmente. Supóngannos que x1 es
el puntaje que supera el 84,13% de la distribución y X2 el puntaje que es superado por el 84, 13% de
la distribución. Sabiendo que (x1 — x2) = 20, la desviación estándar de la distribución es:

( )2

( )5

( ) 10

( ) 20

( ) N .A.

20. Respecto a la pregunta anterior, la desviación cuartil o rango semi-intercuartil (Q), es:

( ) 26,8

( ) 13,4

( ) 6,70

( ) 3,25

( ) N .A.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


126

9.TAMAÑO DE MUESTRA PARA ESTIMAR


PARAMETROS POBLACIONALES (MEDIA Y
PROPORCION) Y SELECCIÓN DE MUESTRA
ALEATORIA SIMPLE Y SISTEMATICA

Objetivos

1. Calcular el tamaño de muestra para la estimación de una media poblacional en el muestreo


aleatorio simple y sistemático
2. Calcular el tamaño de muestra para la estimación de una proporción poblacional
3. Seleccionar una muestra aleatoria simple utilizando la tabla de números aleatorios
4. Seleccionar una muestra sistemática.

Lectura sugeridas

 Daniel W. Bioestadística. Base para el análisis de las ciencias de la salud. 4ª ed. México.
Limusa Wiley; 2009
 Pagano M, Gauvreau K. Fundamentos. de Bioestadística. 2a ed. México: Thomson

PRACTICAS

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


127

A. Tamaño de muestra

1. En cierta población de 1200 escolares de 6-10 anos de edad se desea estimar el nivel promedio de
hierro sérico. Con este fin se va a seleccionar una muestra aleatoria simple. Si en un estudio similar
se obtuvo una media aritmética de 60,6 µg/dl y S = 22,4 µg/dl.

Calcular el tamaño mínimo de la muestra si la estimación del parámetro se va a realizar con 95 % de


confianza y se asume un error absoluto de muestreo de ± 5 µg/dl.

2. En la población de pacientes diabéticos de un hospital, atendidos en los últimos 10 años, se desea


estimar el nivel promedio de glucosa en sangre en ayunas (mg/ 100ml).

Calcular el número mínimo de historias clínicas para realizar le estimación con 95% de confianza, el
error absoluto de muestreo asumido es ± 2 mg/100ml y una muestra piloto presento una varianza de
64.

3. El administrador de un hospital desea estimar la proporción de pacientes insatisfechos con la


atención recibida durante su hospitalización. Si E = ± 0,05, el nivel de confianza de 95% y no se
dispone de ninguna otra información, ¿qué tan grande debe ser el tamaño de la muestra? ¿Qué tamaño
debe tener si la proporción esperada (p) en la población, es aproximadamente 0,25?

4. En la población de niños menores de 10 arios de una comunidad se desea estimar la prevalencia de


infecciones respiratorias agudas (IRA) En el 2012, en la comunidad existían 3200 niños menores de
10 arios. El estudio se realizara en el 2013 y para este periodo se seleccionara una muestra. El tamaño
de muestra se calculara asumiendo un E = ± 5% y utilizando una proporción (p) estimada en un
estudio piloto de 0,4, además si la estimación del parámetro se va a realizar con un 95% de confianza;
calcular n.

5. Utilizando el mismo valor de p y el mismo nivel de confianza del ejercicio anterior, calcular n para
los siguientes errores muéstrales: 2%, 6%, 8%. ¿Cómo se relaciona el error muestral con el tamaño
de la muestra?

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


128

6. Supongamos que en el ejercicio 4 no se pudo estimar el valor de p. ¿Con que valor de p calcularía
el tamaño de la muestra? Calcular n usando este valor, y con un E = ± 5%. Comente el resultado.

7. Se desea estimar la concentración promedio de PSA en muestras de sangre de una población de


pacientes con cáncer de próstata.

a. ¿qué datos necesita para calcular n?

b. Asuma un error relativo de 1 0,05 y con una desviación estándar estimada de 1,0 y media
turbinen estimada en un estudio piloto en 6,8, calcular n.

8. Se selecciona una muestra de una población cuya desviación estándar se sabe que es 18. ¿Qué
tamaño mínimo de muestra tendría que tomarse para asegurar un recorrido máximo de 7,74 entre los
límites cuando se estime la media poblacional con un 95% de confianza?

9. Hallar el incremento en el tamaño muestral necesario para aumentar el nivel de confianza de una
variable distribuida normalmente, desde 90% hasta 98%.

10. Las ecuaciones que para calcular el tamaño de la muestra utilice en los ejercicios 1 y 2,¿en que
tipos de muestreo deben aplicarse?, y, en ¿qué tipo de estudio?

11. Desde su punto de vista, ¿cuáles son los elementos o términos que afectan más el tamaño de la
muestra?

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


129

Sugerencia: ver la respuesta de la pregunta 5.

B. Selección de muestras aleatorias simples y sistemáticas.

1. Determinar que técnicas de selección proporcionan muestras probabilísticas:

a. Población: Residentes en una determinada ciudad.

Técnica de muestreo: Durante una semana se detiene a toda persona que pase por la esquina de
una calle comercial.

b. Población: Alumnos de una gran escuela primaria.

Técnica de muestreo: Elegir los 75 primeros alumnos que van a la escuela un lunes por la
mañana.

c. Población: Plantas de tomates de una huerta.

Técnica de muestreo: Con los ojos tapados, extraer una planta de cada metro cuadrado.

d. Población: Pacientes que acuden al consultorio externo de ginecología de un hospital.

Técnica de muestreo: Incluir todas las pacientes de una semana.

e. Describir una situación distinta de las anteriores que pueda dar como resultado:

a) Una muestra probabilística, b) una muestra no probabilística.

2. Utilizando como marco muestral la relación de 150 individuos aparentemente normales con sus
concentraciones de azúcar: (Ver Anexos)

a. Seleccionar una muestra aleatoria simple de tamaño 15. Si va a utilizar la tabla de números
aleatorios, (ver anexos) señale las columnas de inicio.

b. Con los datos de la muestra calcule la media aritmética y desviación estándar de las
concentraciones (estimadores). ¿Cuánto difiere la media de la muestra de la poblacional? ¿Qué
nombre recibe esta diferencia? ¿Para qué sirven los estimadores?

Calcule el error estándar del estimador, ¿que mide este valor?

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


130

3. Utilizando como marco muestral la relación de 500 escolares y la información sobre parasitosis:
(Ver Anexos)

Seleccionar una muestra sistemática de tamaño 25. Señale las columnas de inicio de la tabla de
números aleatorios.

a. Calcule el estimador de la proporción de parasitados. ¿Cuánto difiere este estimador del


parámetro? ¿Para qué sirve el estimador? Calcule e interprete el error estándar del estimador,

b. ¿Cuando se aplica el muestreo aleatorio simple?

c. Haga un comentario acerca de las ventajas y desventajas de los métodos probabilísticos de


muestreo.

MISCELÁNEAS

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


131

En las siguientes proposiciones señalar con X la alternativa correcta:

1. Uno de los siguientes métodos de selección de una muestra no es probabilístico, señalar:

( ) Sistemático

( ) Estratificado

( ) De casos

( ) Aleatorio simple

2. ¿En cuál de los métodos de muestreo, que siguen, no estamos obligados a usar una fórmula para
calcular el tamaño de muestra?

( ) Sistemático

( ) Estratificado

( ) De casos

( ) Aleatorio simple

3. Un requisito básico para aplicar el Muestreo Aleatorio Simple (MAS) es que la población de
estudio:

( ) Sea grande

( ) Sea pequeña

( ) Sea heterogénea

( ) Sea homogénea

4. La muestra probabilística le permite al investigador:

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


132

( ) Efectuar el estudio en un tiempo menor

( ) Ahorrar recursos económicos

( ) Con los datos obtenidos realizar generalizaciones validas a la población respectiva

( ) Trabajar con pocos casos

5. De una población de N = 10, ¿cuántas muestras de tamaño n = 2 se puede seleccionar si se va a


aplicar el MAS?

( ) 100

( ) 45

( ) 10

( )5

6. Respecto a la pregunta anterior, ¿cuál es la probabilidad de que un elemento de la población sea


seleccionado? (N0 olvidar que el MAS implica la selección de los elementos poblacionales sin
sustitución)

( ) 0,1

( ) 0,2

( ) 0,3

( ) 074

7. Se dice que una muestra es representativa de una población cuando:

( ) El tamaño de la muestra es grande (mayor de 30)

( ) Se puede calcular la precisión de las estimaciones

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


133

( ) Cada elemento de la población tiene una probabilidad conocida, diferente de cero, de


conformar la muestra

( ) Los elementos de la muestra tienen las mismas características que los de la población.

8. Para estimar el nivel promedio de proteína en cierta población de pacientes con cáncer, se calculo
̅ e = 7,80; se = 1,39; z = 1,96; E = ± 0,5. Si los
una n = 30 usando las siguientes especificaciones: 𝑋
investigadores deciden aumentar el valor de E (error muestral), el tamaño de la muestra:

( ) Disminuye

( ) Aumenta

( ) Sigue igual

( ) N .A.

9. Un investigador utilizando el Muestreo Sistemático (MS) selecciono una muestra de n = 136 para
estimar la proporción de escolares con alergia. Para calcular n utilizo un Pe = 0,15. Si el tamaño N
no es conocido, ¿cual habría sido el error relativo?

( ) 0,6

( ) 0,5

( ) 0,4

( ) 0,06

10. En términos generales, el error absoluto de muestreo, representa:

( ) La diferencia entre la medida de resumen poblacional y 1a medida de resumen que se espera


obtener en la muestra.

( ) Equivocaciones al anotar los datos

( ) E1 sesgo que se produce al usar, en la medición de variables, instrumentos no validados

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


134

( ) El error estándar del estimador

11. Se desea estimar, con 95% de confianza, el nivel promedio de plomo sanguíneo en policías que
dirigen el transito er1 el centro de Lima. La población es de 800. E1 método de muestreo que se
aplicara es el MS, al realizar el estudio piloto se obtuvo una desviación estándar s = 7 si se asume un
error absoluto de 1,5, el tamaño mínimo de muestra es:

( ) 76

( ) 58

( ) 40

( ) 28

12. Un investigador cardiólogo tiene 100 historias clínicas de pacientes con pericarditis purulenta, las
historias tienen una numeración correlativa de 1 hasta 100 y está interesado en seleccionar una
muestra sistemática de 10 casos, si el numero aleatorio de inicio resulto 5, ¿Los archivos cuyos
números son los siguientes conformaran la muestra para el estudio:

( ) 5, 15, 20, 25, 30, 35, 40, 45. 50, 55.

( ) 5, 10, 20, 30, 40, 50, 60, 70, 80, 90.

( ) 5, 15, 25, 35, 45, 55, 65, 75, 85, 95.

( ) 10, 15, 20, 30, 40, 50, 60, 70, 80, 90.

13. En la población de conductores de unidades de transporte público de la Línea 73 que circula en


la ciudad de Lima (N = 1000), estamos interesados er1 estudiar consumo de tabaco y frecuencia
cardiaca. El estudio se realizara mediante una muestra. Algunos resultados del estudio piloto son:
Frecuencia cardiaca promedio: 82 lat/min. Desviación estándar = 10 lat/min. Proporción de
fumadores = 0.35. E1 tamaño de muestra, para estimar la proporción de fumadores, considerando un
nivel de confianza del 95% y error absoluto de 16%, es:

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


135

( ) 150

( ) 80

( ) 78

( ) 196

14. E1 número mínimo de individuos de una muestra a través de la cual deseamos estimar la
prevalencia de obesidad er1 una comunidad, considerando un nivel de confianza del 95% y error
absoluto de 0.05, es:

( ) 146

( ) 246

( ) 285

( ) 385

15. Se desea estimar el nivel promedio de colesterol total en la población de vendedores de comida
en el mercado de un distrito limeño. E1 estudio se realizara mediante el MAS y se requiere calcular
e1 tamaño de muestra considerando un nivel de confianza del 95%.

̅ ±s) de (190 ± 30), si el


En un estudio piloto se obtuvieron la media y desviación estándar (𝑋
investigador asume un error relativo de 0,04, el tamaño de muestra es:

( ) 60

( ) 59

( ) 58

( ) 57

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


136

16. Se desea estimar la proporción de pacientes con infección intra- hospitalaria mediante el estudio
de una muestra. Para calcular 11 se considera un nivel de confianza del 95%, E = 0,05 y un estudio
piloto reporta que pe = 25% y además durante un mes en dicho hospital, en promedio, 200 pacientes
son hospitalizados (considerar para el cálculo, la población anual). E1 tamaño de la muestra, es:

( ) 258

( ) 100

( ) 289

( ) 1 17

17. Con el muestreo aleatorio simple se selecciono una muestra de n = 385 para estimar la proporción
de escolares con algún tipo de alergia. Para calcular n utilizo un pe = 50%, si, el tamaño N no es
conocido, ¿Cual habría sido el error absoluto?

( ) ± 0,04

( ) ± 0,05

( ) ± 0,06

( ) ± 0,08

18. Se desea estimar la prevalencia de osteoporosis en una población de 1000 mujeres, En la revisión
bibliográfica se encontró una prevalencia de 38%, si se asume un error absoluto de 1 6%, el tamaño
de la muestra será:

( ) 251,4

( ) 252

( ) 200,9

( ) 201

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


137

19. El método de muestreo estadístico denominado aleatorio simple:

( ) Le permite al investigador estimar un parámetro poblacional

( ) Le faculta al investigador contrastar hipótesis estadísticas

( ) Le permite al investigador calcular la precisión de la estimación

( ) T odas las anteriores

20. De la población de alumnos de secundaria (de las secciones A, B, C y D de cuarto año) del Colegio
Nuestra Señora de Guadalupe se desea seleccionar una muestra para estimar la prevalencia de
consumo de alcohol. La muestra se seleccionaría:

( ) Usando el muestreo aleatorio simple

( ) Tomando a los alumnos de la sección A de cuarto año

( ) Se tomaría a los alumnos de la sección D, puesto que la probabilidad de que ellos consuman alcohol
es alta

( ) Se tomaría a todos los que consumieron alcohol en el último mes.

Se tiene una población conformada por 25 madres de familia. Se presenta la variable número de hijos.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


138

POBLACIÓN MUESTRA
NUMERO NÚMERO DE HIJOS NUMERO NÚMERO DE HIJOS
1 3
2 2
3 1
4 3
5 4
6 2
7 1
8 5
9 4
10 3
11 2
12 2
13 3
14 1
15 4
16 2
17 3
18 4
19 5
20 3
21 2
22 1
23 2
24 3
25 2

(Preguntas 21-24):

21. Seleccionar la muestra aleatoria simple de tamaño 5 para estimar el número promedio poblacional
de hijos. Indicar las columnas seleccionadas de la tabla de números aleatorios:

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


139

Columnas:_____________ (Presentar la muestra seleccionada es decir, los números aleatorios y el


número de hijos, en las dos columnas de la derecha)

22. Calcular los estimadores x̅ y s.

23. Calcular e interpretar el error estándar del estimador media muestral

24. Los resultados de las preguntas 22 y 23, ¿serán utilizados en?: _________________________

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


140

10. INFERENCIA ESTADTSTICA: ESTIMACION


DE UNA MEDIA Y PROPORCION
POBLACIONAL

Objetivos

1. Definir la probabilidad de cometer el error tipo I en una prueba de hipótesis


2. Definir la probabilidad de cometer el error tipo II en una prueba de hipótesis
3. Construir e interpretar un intervalo de confianza para estimar una media poblacional.
4. Construir e interpretar un intervalo de confianza para la estimación de una proporción
poblacional.

Lectura sugeridas

 Daniel W. Bioestadística. Base para el análisis de las ciencias de la salud. 4ª ed. México.
Limusa Wiley; 2009
 Mendenhall W, Sincich T.Probabilidad y estadística para ingeniería y ciencias.4ª ed.
México: Prentice - Halll; 1997.
 Pagano M, Gauvreau K. Fundamentos. de Bioestadística. 2a ed. México: Thomson
Learning; 2001.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


141

PRACTICAS

1. Se tiene valores de Presión inspiratoria por la boca (Pimax) en una muestra de pacientes con
cifoescoliosis:

Paciente Pimax (cm H2O)


1 54,8
2 62,0
3 63,3
4 44,2
5 40,3
6 36,3
7 19,3
8 24,6
9 26,6

a. Calcular la media aritmética y desviación estándar de los datos.

b. ¿Cuál es la estimación puntual de la media de la población?

c. ¿Cuál es la estimación del error estándar para la media de la muestra?

d. Calcular el intervalo de confianza de 95% para la media verdadera de Pimax en pacientes con
cifoescoliosis.

e. ¿Cuál es la precisión de la estimación?

f. Realizar la interpretación probabilística para el intervalo de confianza calculado. (Usar la tabla de


la distribución "t" de Anexos)

g. Efectuar la interpretación practica para el intervalo de confianza calculado

h. ¿Qué efecto se observa en el intervalo de confianza si n aumenta a 36 pacientes?

i. A juicio del lector, ¿por qué los investigadores no usaron más pacientes?

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


142

2. Una encuesta, que incluyo una muestra aleatoria de 150 familias en cierta comunidad urbana, revelo
que, en el 37% de los casos, al menos un miembro de la familia tenía alguna forma de afección a las
vías respiratorias.

Construir los intervalos de confianza del 95 y 99% para la proporción verdadera de familias en la
comunidad con la característica de interés.

3. Se va a estimar el tiempo promedio de espera para la atención médica en una población de pacientes
de un hospital del seguro social, con este fin se selecciono una muestra de 61 pacientes los que
manifestaron haber esperado, en promedio, 32 minutos con una desviación estándar de 5,7 minutos.

¿Cuáles son los límites del intervalo de confianza del 95%? para estimar la media poblacional?
Interpretar los resultados.

4. En una población de amas de casa que cocinan con lefia se desea estimar la prevalencia de pterigion
(carnosidad en ojos). Para esto, se selecciona una muestra de 80 amas de casa y se encontró que 12
de ellas, presentaban pterigion. Estimar, con un nivel de confianza del 95%, la prevalencia
poblacional. Interpretar los resultados.

5. Dos tesistas de una Facultad de Ciencias informaron los siguientes datos acerca del peso de la
glándula pituitaria er1 una muestra de cuatro ratas: media = 9,0mg, error estándar de la media: 0,3.

a. ¿cuál es la desviación estándar de la muestra?

b. Construya un intervalo de confianza del 95% para el peso medio de la glándula pituitaria para una
población similar de ratas.

c. ¿Qué supuestos se necesitan para que sea valido el intervalo de confianza calculado?

6. En una muestra aleatoria simple de 125 varones desempleados, quienes habían abandonado la
secundaria entre las edades de 13 y 16 anos inclusive, 88 declararon que eran consumidores regulares

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


143

de bebidas alcohólicas. Construya un intervalo de confianza del 95% para la proporción de la


población.

Interpretar el intervalo construido desde el punto de vista probabilístico y práctico.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


144

MISCELÁNEAS

En las siguientes proposiciones señalar con X la alternativa correcta:

1. Inferencia estadística está conformada por un conjunto de técnicas utilizadas para realizar
afirmaciones de naturaleza probabilística respecto a

( ) Muestra probabilística.

( ) Población de estudio.

( ) Muestra no probabilística.

2. Las ramas o áreas de la inferencia estadística son:

( ) Estadística descriptiva y prueba de hipótesis.

( ) Estimación de parámetros por punto y por intervalo.

( ) Estimación de parámetros y prueba de hipótesis

3. El error tipo I se comete cuando:

( ) No se rechaza una hipótesis nula siendo falsa.

( ) Se rechaza una hipótesis nula siendo falsa.

( ) Se rechaza una hipótesis nula siendo verdadera.

4. Nivel de confianza es la probabilidad de que el intervalo construido:

( ) No contenga el parámetro.

( ) Contenga el parámetro.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


145

( ) N .A.

5. La potencia de una prueba es la probabilidad de:

( ) No rechazar una hipótesis nula siendo falsa.

( ) Rechazar una hipótesis nula siendo falsa.

( ) Rechazar una hipótesis nula siendo verdadera.

6. Para estimar una media aritmética poblacional, mediante un intervalo de confianza, para usar como
coeficiente de confianza el valor "t" de la distribución de Student:

( ) Se debe conocer la desviación estándar de la población.

( ) La muestra debe ser grande (n > 30).

( ) Se debe utilizar la desviación estándar de la muestra.

7. El administrador de un hospital desea estimar el tiempo de estancia hospitalaria promedio de los


pacientes post quirúrgicos. En una muestra de n = 41 encontró una media de 7,5 días con una
desviación estándar de 5,5 días. Los límites del intervalo de confianza del 95%, son:

( ) (5,76; 9,24)

( ) (5,82; 9,18)

( ) (6,41; 7,59)

8. Al estimar la prevalencia (en %) de una enfermedad en cierta población, mediante un intervalo de


confianza, se encontré IC 95% (16; 21). Esto estaría indicando que:

( ) La probabilidad de que e1 intervalo contenga la prevalencia poblacional es 0,95

( ) La probabilidad de que el intervalo contenga la prevalencia poblacional es 0,05

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


146

( ) La probabilidad de que la prevalencia muestral sea igual a la prevalencia de la población es


0,95.

9. La probabilidad de rechazar una hipótesis nula siendo falsa es:

( )α

( )β

( ) (1 -β)

10. Específicamente en las investigaciones biomédicas el nivel de significación (α) fijado es 0,05.
Sabiendo que existe la siguiente igualdad β = 4 α, que permite determinar, aproximadamente la
potencia de la prueba (1- β), entonces, la potencia que habitualmente se usa, es:

( ) 0,95

( ) 0,20

( ) 0,80

11. Al estimar er1 cierta población de pacientes con cáncer al paladar el tiempo de supervivencia er1
meses, se encontró: I.C. 95% (38,4; 55,4), si la desviación estándar poblacional es 43,3 meses, n
habría sido:

( ) 25

( ) 100

( ) 424

12. Los días de permanencia de una muestra de cinco pacientes en la Unidad de Cuidados Intensivos
(UCI), fueron: 3, 4, 2, 6, 5. La estimación puntual de la media poblacional es:

( )2

( )5

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


147

( )4

13. Respecto a la pregunta anterior, la estimación puntual de la varianza poblacional, es:

( ) 1,00

( ) 2,50

( ) 1,58

14. Si, a partir de una población distribuida normalmente con media µ y varianza σ2, se seleccionan
M muestras del mismo tamaño (n), entonces las medias de estas muestras se distribuirán normalmente
con media y varianza iguales a:

( ) 𝑥̅ y s2

( ) µ̅ y σ2

( ) µ y σ2/n

Supongamos que se tiene una población de tres pacientes, (N = 3) de un consultorio de pediatría


cuyas edades son: 3, 4, 5 af10s. Si a partir de esta p0b1aci0r1 se selecciona muestras de tamaño 2(n
=2). (Preguntas 15 a 19):

15. El número de muestras que se puede seleccionar sin reemplazo; es:

( )2

( )3

( )9

16. Si el muestreo se realiza con reemplazo, el número de muestras que se puede seleccionar, es:

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


148

( )2

( )3

( )9

17. La media aritmética de las medias muéstrales de todas las posibles muestras de tamaño 2, sea el
muestreo con o sin reemplazo, es:

( )3

( )4

( )5

18. La varianza de las medias muéstrales de todas las muestras de tamaño 2, si el muestreo es sin
reemplazo, es: (Sugerencia: cuando el muestreo es sin reemplazo, es necesario usar la corrección por
población infinita (N -n)/(N-1) para calcular la varianza de la distribución de las medias muéstrales,
mas aun sabiendo que er1 este caso n/N > 0,05)

( ) 2/3

( ) 1/3

( ) 1/ 6

19. La varianza de las medias muéstrales de todas las muestras de tamaño 2, si el muestreo es con
reemplazo, es: (Sugerencia: cuando el muestreo es con reemplazo, o cuando se hace a partir de una
población infinita, no es necesario usar la corrección por población finita (N -n)/(N-1) para calcular
la varianza de la distribución de las medias muéstrales)

( ) 2/3

( ) 1/3

( ) 1/ 6

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


149

20. Al afirmar que la diferencia entre dos medias de poblaciones independientes no es


estadísticamente significativa cuando en realidad tal diferencia si existe, se comete:

( ) Error tipo II

( ) Error tipo I

( ) Error de muestreo

21. Al estimar en cierta población de pacientes anoréxicos e1 peso promedio en kg., se encontró: I.C.
95% (38,4; 46,9), si la varianza de la población es 169, n habría sido:

( ) 10

( ) 35

( ) 36

22. Se va a estimar la frecuencia cardiaca promedio en una población de pacientes. Se toma (una n =
31 y se obtuvo una 𝑥̅ = 78 y s = 8. Los límites del intervalo de confianza del 95%, son:

( ) (75,1; 80,9)

( ) (75,2; 80,8)

( ) (75,3; 80,7)

23. Si en e1 problema anterior, los investigadores deciden aumentar la muestra a 62, la estimación de
la media poblacional se realizara con:

( ) Mayor confianza

( ) Mayor precisión

( ) Mayor significación porque el tamaño de la muestra se ha duplicado

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


150

24. Al estimar una media poblacional mediante un intervalo de confianza, 1os datos deben satisfacer
dos supuestos básicos, estos son:

( ) Desviación estándar poblacional conocida y normalidad de los datos

( ) Muestra probabilística y desviación estándar muestral conocida

( ) Aleatoriedad y normalidad

25. A1 estimar e1 nivel promedio de p1omo en sangre de una población de obreros de una mina se
obtuvo. IC 95% (3,9; 9,9) µg/ml, utilizando una muestra de 81 (t80 = 1,99). La desviación estándar de
la muestra fue:

( ) 1, 5 𝑋g/m1

( ) 3, 0 𝑋g/m1

( ) 13, 6 𝑋g/ml

26. Para estimar la prevalencia de epilepsia en cierta población se tomo una muestra de 100 sujetos
en la que se encontró una prevalencia muestral de 10%. Con este estimador, los límites del intervalo
de confianza del 95%, son:

( ) (4,1 y 15,9%)

( ) (4,0 y 15,8%)

( ) (3,0 y 15,0%)

27. Respecto a la pregunta anterior, la precisión de la estimación, es:

( ) 0,050

( ) 0,059

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


151

( ) 0,061

28. Al estimar el nivel promedio de plomo en sangre de una población de obreros de una mina se
obtuvo. IC 95% (3,9; 9,9) µg/ml, utilizando una muestra de 81(t80 = 1,99). El error estándar de la
media muestral, fue

( ) 1, 5 µg/ml

( ) 3, 0 µg/ml

( ) 13, 6 µg/ml

29. Respecto a la pregunta anterior, la precisión de la estimación, es:

( ) 3, 0 µg/ml

( ) 4, 0 µg/ml

( ) 5, 0 µg/ml

30. Inferencia Estadística es un proceso de:

( ) Deducción

( ) Inducción

( ) Síntesis

31. Completar los espacios en blanco.

Considerar el problema con el que se enfrenta un operador de radar cuya tarea es detectar aviones
enemigos. Cuando aparece algo irregular en la pantalla debe decidir entre:

Ho: todo está en orden; solo hay una pequeña interferencia en la pantalla.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


152

H1: habrá un ataque. En este caso, el error de tipo______________ es una "falsa alarma" y error
de tipo_______________ es "una alarma omitida". A fin de reducir tanto α como β, el equipo
electrónico se construyo lo más sensible y digno de confianza que fuera posible.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


153

11. PRUEBA DE HIPOTESIS: UNA MEDIA Y

UNA PROPORCION POBLACIONAL

Objetivos

1. Conocer los supuestos que los datos deben satisfacer para llevar a cabo una prueba de
hipótesis sobre una media y una proporción.
2. Contrastar H0: µ = µo, obtener e interpretar el valor de p.
3. Contrastar H0: π = π0, obtener e interpretar el valor de p.

Lectura sugeridas

 Daniel W. Bioestadística. Base para el análisis de las ciencias de la salud. 4ª ed. México.
Limusa Wiley; 2009
 Mendenhall W, Sincich T.Probabilidad y estadística para ingeniería y ciencias.4ª ed.
México: Prentice - Halll; 1997.
 Pagano M, Gauvreau K. Fundamentos. de Bioestadística. 2a ed. México: Thomson
Learning; 2001.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


154

PRACTICAS

1. Los siguientes datos son consumos de oxigeno (en ml) durante la incubación de una muestra
aleatoria de 15 suspensiones celulares:

14,0; 14,1; 14,5; 13,2; 11,2; 14,0;

14,1; 12,2; 11,1; 13,7; 13,2; 16,0;

12,8; 14,4; 12,9.

¿Puede concluirse, a un nivel de significación de 0,05, que esta muestra fue extraída de una población
cuya media difiere de 12ml? ¿Qué supuestos deben cumplir los datos muéstrales? (Usar la tabla de la
distribución "t" de Anexos)

2. Se hizo un estudio de una muestra de 25 expedientes de enfermos crónicos atendidos como


pacientes externos. El número medio de consultas por paciente fue de 4,8 y la desviación estándar
de 2,0. ¿Es posible concluir, sobre la base de estos datos, que la media de la población es mayor que
cuatro visitas por paciente?

3. Una muestra de 36 estudiantes varones de Estomatología tuvo un peso promedio de 77,0kg. La


desviación estándar de la muestra fue de 10,0 ¿Puede concluirse que la media de la población es
menor que 80,0kg?

4. Nueve animales de laboratorio fueron infectados con cierta bacteria y luego inmunosuprimidos. El
número medio de organismos aislados posteriormente de los tejidos de dichos animales fue de 6,5
(datos codificados) con una varianza de 0,36. ¿Es posible concluir que la media de la población es
mayor que 6,0?

5. La distribución de presiones arteriales diastólicas para la población de mujeres diabéticas entre las
edades de 30 y 34 anos, tiene distribución normal. Puede resultar útil conocer si la media de esta

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


155

población difiere de la presión arterial diastólica media de la población general de mujeres de este
grupo de edades, 74,4 mm Hg

a. ¿Cuál es la hipótesis nula de la prueba estadística?

b. ¿Cuál es la hipótesis alterna?

c. Se elige una muestra de diez mujeres diabéticas, cuya presión arterial diastólica media y
desviación estándar, son respectivamente, 84,0 y 9,1 mm Hg Con esta información, lleve a
cabo una prueba bilateral en el nivel de significación α = 0,05. ¿Cuál es el valor p de la prueba?

d. ¿Qué concluye usted con los resultados de la prueba?

e. ¿Habría sido su conclusión diferente de haber elegido α = 0,01 en lugar de α = 0,05?

6. Un nuevo método para producir una “mayor duración" en un medicamento para el dolor de cabeza
consistente en variar el tipo de revestimiento usado en la píldora, de tal manera que produzca una
descarga continua de la droga en el sistema de las personas. Si el tiempo medio para que la píldora se
disuelva es mayor que 12 horas, el nuevo método será nuevamente investigado. En una muestra de n
= 16 personas, la media aritmética y la desviación estándar, respectivamente, son 13,2 y 1,5.
¿Concluiría usted que esta "nueva" píldora debe ser investigada nuevamente?

El siguiente cuestionario fue respondido por una muestra aleatoria simple de 250 odontólogos, en un
estudio realizado por el Colegio de Odontólogos del Perú. A continuación aparece el número de
odontólogos que eligió la respuesta correspondiente a tres preguntas formuladas: (Preguntas 7 a 9)

¿Es usted especialista?

a. Si: 175

b. No: 75

¿Atendió el año pasado por lo menos una paciente embarazada?

a. Si: 25

b. No: 225

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


156

¿Acostumbra como rutina poner al tanto a sus pacientes que fumar es un factor de riesgo de cáncer
del paladar?

a. Si: 238

b. No: 12

7. ¿Es posible concluir que, en la población muestreada, más de 60% tiene alguna especialidad? Sea
α = 0.01

8. ¿Es posible concluir que, de la población muestreada, menos de 15% de los odontólogos atendieron
el ano pasado por lo menos una paciente embarazada?

9. ¿Es posible concluir que más de 90% de los odontólogos pone a1 tanto de sus pacientes que, fumar
es un factor de riesgo de cáncer de paladar?

10. Investigadores de un hospital del Ministerio de Salud, encontraron que 66% de los niños en una
muestra de 670 completaron toda la serie de vacunas contra la hepatitis B. ¿Es posible concluir que,
en la población muestreada, mas de 60% tiene la serie completa de vacunas contra la hepatitis B?

11. Científicos del Instituto Nacional de Enfermedades Neoplásicas (INEN) han citado al benceno,
un disolvente químico de uso común en la síntesis de plásticos, como un posible agente causante de
cáncer. Ciertos estudios han demostrado que las personas que trabajan con benceno durante más de
cinco anos tienen una incidencia de leucemia.20 veces mayor que la de la población en general. `En
consecuencia, el gobierno ha bajado el nivel máximo permisible de benceno en el aire del lugar de
trabajo de 10 partes por millón (ppm) a l ppm. Suponer que una fábrica de artículos de acero, que
expone diariamente a sus trabajadores a benceno, está siendo investigado. Se examinan 20 muestras
de aire, tomadas durante un periodo de un mes, para determinar el contenido de benceno. Los análisis
produjeron las siguientes estadísticas resumidas:

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


157

𝑥̅ =2, l ppm s=1,7ppm

¿La fábrica de artículos de acero está violando las nuevas normas del gobierno?

12. Si una persona permanece demasiado tiempo en una piscina de aguas termales puede
sobrecalentarse, lo que en el caso de mujeres embarazadas puede causar malformaciones del feto.
Pero, ¿qué tanto es demasiado tiempo? Con base en sus trabajos en esta área varios investigadores
proponen la hipótesis de que 75% de las mujeres, sumergidas en una piscina termal con temperatura
del agua de 40°C, sienten un calor incomodo cuando la temperatura de su canal auditivo (temperatura
central) llega a 40°C. En consecuencia, se sugiere que la incomodidad subjetiva puede ser una
protección contra el sobrecalentamiento. Este resultado fue aparentemente contradicho por un estudio
realizado recientemente en el que participaron 36 mujeres saludables, no embarazadas. Solo 17 de las
36 mujeres (47%) sintieron un calor incomodo cuando su temperatura central llego a 40°C. Contrastar
la hipótesis de que el verdadero porcentaje de mujeres saludables, no embarazadas, que sienten un
calor incomodo cuando su temperatura central llega a 40°C es menor que 75%.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


158

MISCELÁNEAS

En las siguientes proposiciones señalar con X la alternativa correcta:

Para los enunciados 1 a 5, formular la hipótesis nula y alterna, apropiadas.

1. Un herpetólogo quiere determinar si la proporción de eclosión de los huevos de cierta especie de


rana es mayor que 0,5 cuando los huevos se exponen a radiación ultravioleta.

( ) H0: π > 0, 5 Hl: π > 0, 5

( ) H0: π > 0, 5 H1: π > 0, 5

( ) H0: µ > 0, 5 H1:µ > 0, 5

2. Un mecánico dental, fabricante de brackets, quiere demostrar que la resistencia media a la ruptura
del bracket de 22 libras de un competidor es en realidad menor que 22 libras.

( ) H0:µ = 22 ( ) H1:µ ≠ 22

( ) H0:µ ≥ 22 ( ) H1:µ < 22

( ) H0: 𝑥̅ ≥ 22 ( ) H1: 𝑥̅ < 22

3. La Dirección General de Salud Ambiental (DIGESA) del Perú desea probar si la concentración
promedio de plomo en sangre en los escolares de La Oroya excede la concentración máxima
permisible, 10 µg/dl.

( ) H0: 𝑥̅ ≤ 10 ( ) H1: 𝑥̅ > 10

( ) H0:µ ≥ 10 ( ) H1:µ < 10

( ) H0:µ ≤ 10 ( ) H1:µ < 10

4. El tiempo de espera promedio para la atención médica, establecido en los consultorios, externos de
un hospital del Ministerio de Salud es 15 minutos. Un médico residente sospecha que en promedio,
los pacientes están esperando mas del promedio establecido.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


159

( ) H0:µ ≤ 10 ( ) H1:µ > 10

( ) H0:µ = 10 ( ) H1:µ > 10

( ) H0:µ = 10 ( ) H1:µ ≠ 10

5. En una conferencia, un especialista manifestó que aproximadamente de cada 100 limeños, 40 tienen
algún tipo de alergia. Un investigador sobre el tema, cree que la proporción es diferente a la indicada
por el especialista.

( ) H0: π ≤ 0,5 ( ) H1: π > 0,5

( ) H0: π = 0,4 ( ) H1: π ≠ 0,4

( ) H0: p = 0,4 ( ) H1: p ≠ 0,4

6. En los ejercicios 1 y 5, ¿qué estadístico de prueba será apropiado y que características deben poseer
los datos para una aplicación correcta de dicho estadístico?

( ) t; la muestra debe ser pequeña (≤ 30) y aleatoria

( ) z; la muestra debe ser grande (np ≥ 4 y nq ≥ 4) y aleatoria.

( ) t; la muestra debe ser grande (np ≥ 4 y nq ≥ 4) y varianza mínima.

7. En los ejercicios 2, 3 y 4, ¿qué estadístico de prueba será apropiado y qué supuestos básicos deben
cumplir los datos para una aplicación correcta de dicho estadístico?

( ) z; aleatoriedad de la muestra y normalidad de los datos.

( ) t, si se conoce la varianza poblacional; aleatoriedad de la muestra y normalidad de los datos.

( ) t, pues es difícil conocer la varianza poblacional; aleatoriedad de la muestra y normalidad de los


datos.

8. Respecto a la pregunta 1, relacionada con la proporción de eclosión de huevos de rana, supongamos


que al realizar la prueba de hipótesis se obtuvo un valor de z = 1,97, el valor de p y la decisión
estadística, son:

( ) p = 0,0488; no rechazar la H0

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


160

( ) p = 0, 0244; rechazar la H0

( ) p = 0,9756; no rechazar la H0

9. Respecto a la pregunta 2, relacionada con el fabricante de brackets, supongamos que n = 10 y el


valor del estadístico t= -1,452, el valor de p y la decisión estadística, son:

( ) 0,05 < p < 0,10; no rechazar la H0

( ) p > 0,05; no rechazar la H0

( ) 0,10 < p < 0,20; no rechazar la H0

10. Respecto a la pregunta 3, relacionada con concentraciones de plomo en sangre en escolares de La


Oroya, supongamos que n = 121 y el valor del estadístico t= 2,3578, el valor de p y la decisión
estadística, son:

( ) p = 0,01; rechazar la H0

( ) p = 0,02; rechazar la H0

( ) 0,005 < p < 0,025; rechazar la H0

11. Respecto a la pregunta 4, relacionada con el tiempo promedio de espera para la atención médica,
supongamos que n = 250 y el valor del estadístico t= 3,212, el valor de p y la decisión estadística,
son: .

( ) 0,001< p < 0,01; rechazar la H0

( ) p = 0,001; rechazar la H0

( ) 0,0005 < p < 0,001; rechazar la H0

12. Respecto a la pregunta 5, relacionada con la prevalencia de todo tipo de alergias en Lima,
supongamos que al realizar la prueba de hipótesis se obtuvo un valor de z = 1,33, el valor de p y la
decisión estadística, son:

( ) p = 0,9082; no rechazar la H0

( ) p = 0,1835; no rechazar la H0

( ) p = 0,0918; no rechazar la H0

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


161

13. Cuando se contrasta la H0: µ = µ0, se puede utilizar el contraste z (o prueba z), siempre y cuando:
(Se supone que la variable de interés, en la población, se distribuye normalmente)

( ) Se conozca la varianza de la muestra y la muestra sea mayor que 30.

( ) No se conozca la varianza de la población, el tamaño de la muestra no importa

( ) Se conozca la varianza de la población, el tamaño de la muestra, no importa.

14. En el procedimiento para someter a prueba la H0: π = π0, no se utiliza el contraste t de Student,
¿porque?:

( ) La variable de interés en la población original sigue la distribución binomial, entonces se usa z


(normal estándar) como aproximación de la binomial a la normal.

( ) La variable de interés en la población sigue la distribución normal es por eso que se usa la prueba
z (normal estándar) y no la t de Student.

( ) No, se puede usar la prueba t de Student, siempre y cuando la muestra sea grande, mayor que 30 y
exista normalidad de los datos de la muestra.

15. Una muestra de ocho estudiantes obtuvo las siguientes calificaciones: 3, 9, 6, 6, 8, 7, 8, 9. Suponer
que la población de calificaciones es normal. ,¿Cuál de las siguientes hipótesis acerca de la
calificación promedio (µ) rechazaría usted al nivel de significación del 1%?

( ) µ0= 6,3 ·

( ) µ0= 4,0

( ) µ0= 9,0

16. La hipótesis que se somete a un contraste estadístico, es:

( ) Hipótesis nula

( ) Hipótesis alterna

( ) Hipótesis científica.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


162

12. PRUEBA DE HIPOTESIS: COMPARACION


DE DOS MEDIAS DE POBLACIONES
INDEPENDIENTES Y RELACIONADAS

OBJETIVOS

1. Conocer los supuestos que los datos deben satisfacer para llevar a cabo una prueba de
hipótesis para la diferencia de dos medias de poblaciones independientes
2. Conocer los supuestos que los datos deben satisfacer para llevar a cabo una prueba de
hipótesis para la media de la diferencia de dos muestras relacionadas
3. Contrastar H0: µ1 = µ2, obtener e interpretar el valor de p.
4. Contrastar H0: µd = 0, obtener e interpretar el valor de p.

LECTURA SUGERIDAS

 Daniel W. Bioestadística. Base para el análisis de las ciencias de la salud. 4ª ed. México.
Limusa Wiley; 2009
 Mendenhall W, Sincich T.Probabilidad y estadística para ingeniería y ciencias.4ª ed.
México: Prentice - Halll; 1997.
 Pagano M, Gauvreau K. Fundamentos. de Bioestadística. 2a ed. México: Thomson
Learning; 2001.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


163

PRACTICAS

1. En diferentes publicaciones de investigaciones realizadas en niños con asma crónica en la ciudad


de Lima, se ha llegado a establecer la relación entre el número de crisis asmática y tenencia de
animales (mascotas) en casa. A continuación se tiene el número observado de crisis de asma en dos
muestras de niños en un periodo de seis meses. ¿Tienen los niños con asma crónica con mascotas en
casa, un número promedio de crisis significativamente mayor que los niños con asma crónica que no
tienen mascotas en casa?

Niños con asma crónica


Con mascota en casa Sin mascota en casa
3 1
4 2
2 0
1 1
3 2
Realizar la prueba estadística siguiendo todos los pasos.

2. Se desea determinar si varones y mujeres hipertensos difieren en cuanto a 1a función renal, con
este fin se analizaron 1os Valores de creatinina sérica obteniéndose los siguientes resultados:

Varones Mujeres
n1=24 n2=26
𝑥̅ 1=1,6mg/dl 𝑥̅ 2=1,2mg/dl
S1=0,55mg/dl S2=0,53mg/dl

¿Difieren varones y mujeres hipertensos respecto a 1as concentraciones promedio de creatinina


sérica? Realizar 1a prueba de hipótesis siguiendo todos los pasos.

3. Se tiene información de que niños expuestos a valores altos de plomo (Pb) tienen niveles menores
de hemoglobina (Hb). Un investigador desea confirmar esta proposición y realiza un estudio
comparativo tomando una muestra de 31 niños expuestos a valores altos de Pb y otra de 31 niños no
expuestos a Pb y obtiene los siguientes resultados:

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


164

Varones Mujeres
n1=31 n2=31
𝑥̅ 1=11,7g/100ml 𝑥̅ 2=12,3g/100ml
S1=0,9g/100ml S2=1,1g/100ml

¿Tiene los niños expuestos a Pb niveles significativamente menores de Hb que los no expuestos?

4. Se tienen los siguientes resultados de un estudio realizado en dos poblaciones independientes:


gestantes de Ayacucho y de Lima respecto a los niveles de hemoglobina.

Ayacucho Lima
Tamaño de muestra 21 21
Media aritmética 13,2g/100 11,8g/100
Desviación estándar 1,1g/100 1,8g/100

¿Tienen las gestantes de Ayacucho niveles de hemoglobina, en promedio, significativamente mayores


que las de Lima?

5. Usando la información de la tabla 1:

Tabla 1. Información de pacientes hipertensos: (media desviación estándar)

GRUPO
Hiperadrenérgico Normoadrenérgico
Número de pacientes 13 9
Catecolamina sérica (mg/ml) 0,484 ± 0,133 0,206 ± 0,060
Frecuencia cardiaca (lat/min) 90,7 ± 11,5 77,8 ± 13,2
PA. Sistólica (mm Hg) 71,3 ± 13,7 147,4 ± 9,9
PA. Diastólica (mm Hg) 103,0 ± 8,3 95,6 ± 12,9

a. ¿Qué contraste estadístico piensa utilizar para comparar las medias aritméticas de las dos
poblaciones de pacientes en cada una de las variables?

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


165

b. ¿Cuáles son los supuestos básicos que los datos deben satisfacer para una aplicación correcta
del contraste? ¿Se cumplirá el supuesto de homogeneidad de varianzas para la variable
catecolamina sérica?

c. Realice el contraste estadístico para la variable frecuencia cardiaca.

d. Compare estadísticamente, las dos poblaciones, respecto a la variable presión arterial


diastólica.

6. A fin de contrastar los resultados de un enfoque "convencional" contra un "nuevo" enfoque de


enseñanza de lectura, doce alumnos fueron seleccionados y pareados de acuerdo con su Coeficiente
Intelectual (CI), edad, habilidad presente de lectura, etc. Uno de cada uno de los pares se asigné al
programa de lectura "convencional" y el otro al "nuevo" programa de lectura. Al final de seis semanas,
se midieron los progresos mediante una prueba de lectura. ¿El "nuevo" método es mejor que el método
"convencional" en el aprendizaje de lectura?

Par Convencional Nuevo


1 78 83
2 65 69
3 88 87
4 91 93
5 72 78
6 59 59

7. Se tiene la siguiente información:

Tabla 2. Pacientes con insuficiencia respiratoria hipercapneica crónica antes y después de la


ingestión de dieta baja en calorías en fisiología pulmonar

Tensión bióxido de carbono


Tensión oxigeno arterial (mm Hg)
Paciente arterial (mm Hg)
Antes Después Antes Después
1 70 82 49 45
2 59 66 68 54
3 53 65 65 60
4 54 62 57 60

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


166

5 44 74 76 59
6 58 77 62 54
7 64 68 49 47
8 43 59 53 50

Para determinar la significación estadística de los cambios de tensión en cada una de las variables,
mediante la prueba "t pareada":

a. ¿Qué supuestos básicos deben satisfacer los datos?

b. Si no se cumple el supuesto de normalidad, ¿qué prueba estadística si aplicaría? (Sólo


mencione).

c. Para realizar las pruebas de hipótesis, tanto para tensión de oxigeno arterial como para la
tensión de bióxido de carbono, qué tipo de hipótesis alterna se debería plantear.

d. Determinar si después de la dieta la tensión de oxigeno arterial ha aumentado


significativamente.

e. Realizar el mismo análisis para la tensión de bióxido de carbono.

f. Podría sugerir alguna técnica estadística para el análisis de las dos variables (las dos
tensiones) en forma conjunta?

8. En un estudio con escolares anémicos se encontraron los siguientes valores de hemoglobina (Hb)
antes y después de una intervención alimentaria con un fuerte contenido de hierro.

Antes: 9, 8, 7, 9, 8, 9, 8, 10 ̅ = 2,75
Donde: 𝑋 sd = 2,05

Después: 10, 11, 12, 9, 13, 14, 10, 11

¿La intervención tuvo eficacia? (Considere que los cambios de las Hb. solo se deben a la
intervención).

a. Hipótesis

b. Prueba estadística

c. Valor de p

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


167

d. Decisión

e. Conclusión

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


168

MISCELÁNEAS

En las siguientes proposiciones señalar con X la alternativa correcta:

1. Para la comparación de dos medias de poblaciones independientes se utiliza la prueba ‘t’ de


Student, pero los datos deben satisfacer tres supuestos básicos. Uno de los que a continuación se
menciona no conforma este conjunto de supuestos, señalar:

( ) Normalidad

( ) Tamaño de las muestras 30

( ) Homogeneidad de varianzas.

2. En el uso de t pareada, para analizar dos muestras relacionadas (diseño antes -después o pareado),
un supuesto básico para aplicar el contraste "t", es:

( ) Las diferencias (di) se distribuyen normalmente.

( ) Los datos obtenidos después se distribuyen normalmente

( ) Los datos obtenidos antes se distribuyen normalmente

3. La distribución "t" de Student está conformada por una familia de curvas simétricas donde una se
diferencia de otra en base a los grados de libertad. Cuando aumentan los grados de libertad, la
distribución t se aproxima a.

( ) La distribución normal.

( ) La distribución binomial.

( ) La distribución chi-cuadrado

4. Al contrastar: Ho: µl = µ2 con n1= 2ln2= 21 se obtuvo t= 1,6839, el valor de p es:

( ) 0,025

( ) 0,050

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


169

( ) 0,100

5. Al comparar dos poblaciones independientes respecto a las medias aritméticas mediante la prueba
"t" de Student, donde cada muestra tenía un tamaño de 2 1, se obtuvo una t= 1,96, para un contraste
unilateral.

( ) El valor de p se expresa como 0,025 < p < 0,05.

( ) El valor de p se expresa como 0,05 < p < 0,10.

( ) El valor de p = 0,05.

6. En una comparación estadística de dos poblaciones independientes respecto a las medias


aritméticas, se planteó la siguiente hipótesis alterna: H1: µ1> µ2. La hipótesis nula adecuada es:

( ) H0: µ1= µ2

( ) H0:µ1 ≤ µ2

( ) H0:𝑥̅ 1 ≤ 𝑥̅ 2

7. A1 contrastar la siguiente hipótesis H0: 𝑋1≤ 𝑋2con la prueba t se obtuvo (con computadora) un
valor de p = 0,0344, la decisión estadística es:

( ) Rechazar la H0

( ) Aceptar la H1

( ) La media aritmética de la primera población es significativamente mayor que de la segunda.

8. Para determinar si fumadores y no fumadores difieren respecto a la presión arterial promedio, se


aplicaría:

( ) Prueba “t" para comparar dos poblaciones independientes (si no se conoce las varianzas
poblacionales y se cumple los supuestos).

( ) Prueba "t" para comparar dos muestras relacionadas (t pareada).

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


170

( ) Prueba z para comparar dos poblaciones independientes (si no conoce las varianzas poblacionales
y se cumplen los supuestos).

9. Se desea determinar si tres poblaciones independientes de escolares (A, B y C) difieren en cuanto


a los niveles de plomo en sangre, para lo cual se toma una muestra de 100escolares de cada población
y se determina en cada uno los valores de plomo en sangre, se comprueba que los supuestos básicos
se cumplen. La prueba estadística adecuada, para realizar la comparación, es:

( ) Prueba “t” para comparar poblaciones independientes.

( ) Prueba “t" para comparar poblaciones relacionadas.

( ) Ninguna de las anteriores.

10. Supongamos que en un estudio pre-experimental acerca de la eficacia de un producto


antihipertensivo con 30 pacientes, se obtuvieron datos antes y después del uso del producto. Al
determinar si las presiones obtenidas después fueron significativamente menores que las obtenidas
antes mediante la prueba t pareada, se obtuvo una t = 4,691, el valor de p correspondiente es:

( ) p < 0,001

( ) 0,01 < p < 0,001

( ) p < 0,0005

11. En una prueba de diferencia de dos medias de poblaciones independientes usando "t" de Student,
donde cada muestra tenía 41 sujetos, se encontró un valor de 0,02 < p < 0,05.Con este valor de p
(bilateral) se concluye que:

( ) Las poblaciones no difieren significativamente respecto a las medias aritméticas

( ) Las poblaciones difieren significativamente respecto a las medias aritméticas.

( ) Se rechaza la HO

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


171

12. Al finalizar toda prueba de hipótesis, se obtiene el valor de p. Este valor mide la probabilidad de:

( ) Cometer el error tipo II en un análisis especifico.

( ) Cometer el error tipo I en un análisis especifico.

( ) Nivel de confianza al tomar la decisión estadística.

Dos muestras de ratas hembras fueron sometidas a dietas con alto (grupo 1) y bajo (grupo 2)
contenido proteico y se determinó el aumento de peso de cada rata. A 7 ratas se administró la dieta
con alto contenido proteico y a 12 con bajo contenido proteico. Al efectuar el análisis estadístico
correspondiente se obtuvo un valor de t igual a 1,891 en la prueba de comparación de dos medias de
poblaciones independientes. (Preguntas 13 a 15)

13. La hipótesis nula adecuada para el contraste es:

( ) µ1≤ µ2

( ) µ1≥ µ2

() 𝑥̅1 ≤ 𝑥̅2

14. El valor de p obtenido de la tabla es:

( ) p > 0,10

( ) 0,05 < p <0,10

( ) 0,025 < p < 0,05

15. La conclusión de la prueba de hipótesis es:

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


172

( ) El incremento del peso promedio de los de bajo contenido proteico es menor quede los de alto
contenido proteico.

( ) Existe diferencia, estadísticamente significativa, en el incremento de peso promedio entre ambas


poblaciones.

( ) Se rechaza la hipótesis nula

16. En un estudio se formaron 15 pares de escolares, en base a edad, ano de estudios, etc. para
comparar dos métodos de enseñanza de matemáticas (A y B). Un niño de cada par fue instruido
mediante el método A y el otro con el B, al término del periodo, de enseñanza se obtuvieron los
puntajes en la misma prueba de matemáticas. Para determinar si existe diferencia entre ambos
métodos en cuanto al efecto se usara:

( ) Prueba "t" para dos muestras independientes

( ) Prueba z para dos muestras relacionadas

( ) Prueba “t" para dos muestras relacionadas

17. La prueba (test) t de Student utilizada en la pregunta 16, tiene:

( ) 30 grados de libertad.

( ) 28 grados de libertad.

( ) 14 grados de libertad

18. Supongamos que en el análisis estadístico de datos en e1 estudio anterior se obtuvo t= 1, 751, el
valor de p y la conclusión, son:

( ) 0,05 < p < 0,10, ambos métodos de enseñanza no difieren en cuanto a su efecto.

( ) 0,10 < p< 0,20, ambos métodos de enseñanza no difieren en cuanto a su efecto.

( ) 0,10 < p < 0,20, e1 método B no es mejor que el método A.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


173

19. Inferencia estadística tiene dos ramas: Estimación de parámetros y prueba de hipótesis. El
"producto" final de 1a estimación de un parámetro desconocido mediante el cálculo de un intervalo
de confianza, es: IC 95% (LI; LS). E1 "producto" final de una prueba de hipótesis, es:

( ) Valor de alfa

( ) Valor de p

( ) Valor de la prueba estadística o test estadístico.

20. Al usar dos muestras del mismo tamaño (n), los grados de libertad para el valor de t desciende de
(2n - 2) para el diseño no pareado a (n- 1) para el diseño pareado, perdiéndose:

( ) (n- 2) grados de libertad

( ) n grados de libertad

( ) (n -1) grados de libertad.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


174

13. ANALISIS DE VARIANZA (ANOVA) PARA UN


FACTOR EN UN DISEÑO COMPLETAMENTE
ALEATORIZADO (DCA)

OBJETIVOS

1. Describir el diseño completamente aleatorizado (DCA)


2. Conocer los supuestos que los datos deben satisfacer para llevar a cabo una prueba de
hipótesis para la comparación de más de dos medias aritméticas mediante la técnica de
ANOVA (Un factor)
3. Contrastar H0: µl = µ2 = µ3 =... µk, obtener e interpretar el valor de p.
4. Llevar a cabo una prueba de comparación es múltiples (prueba post hoc) mediante el contraste
dc Scheffé.

LECTURA SUGERIDAS

 Armitage P, Berry G. Estadística para la investigación biomédica. 3a ed. Madrid España:


Harcourt Brace; 1997.
 Daniel W. Bioestadística. Base para el análisis de las ciencias de la salud. 4ª ed. México.
Limusa Wiley; 2009
 Wonnacott T, Wonnacott R. Fundamentos de Estadística para Administración y
Economía. 1a ed. México: Editorial Limusa; 1993.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


175

PRACTICAS

1. Completar los espacios:

En el ANOVA, un factor, se comparan simultáneamente dos 6 más poblaciones independientes con


distribución______________________, con varianzas ___________________________y se supone,
además, que cada muestra es representativa de la población correspondiente.

Siendo así, entonces el ANOVA un factor, es una extensión de la prueba _____________________

Consideremos un experimento diseñado para estimar el incremento del peso promedio de ratas sujetas
a tres dietas específicas, digamos A, B y C, por un tiempo dado. Quince ratas se han dividido
aleatoriamente en tres grupos de cinco cada uno, donde cada grupo va a recibir una de las dietas. Una
rata es la ___________________________. Cada unidad (en cierto sentido) es "tratada" o sujeta a
una de las dietas. De aquí que, en terminología estadística, las dietas son llamadas
_______________________. La asignación aleatoria de las 15 unidades experimentales (ratas) a los
tres tratamientos (dietas) es equivalente a una asignación aleatoria de los tratamientos a las unidades
experimentales. Esto se llama un diseño experimental
__________________________________________________________________ (DCA).

El DCA implica una variable independiente, que en este caso son las ______________________ que
es de naturaleza _______________________ y la variable dependiente es
____________________________la que es de naturaleza _______________________________.

Si el experimento comprende tres tratamientos, decimos que la variable tratamientos, se realiza en


tres _________________en el experimento. Puesto que solo una variable. Independiente está
considerada en el experimento, la suma de cuadrados total (SCT) puede dividirse en dos partes o
componentes que son: ______________________y ___________________________.

El modelo del DCA para un factor, es: xij = _____________ + _______________ + ____________

2. Completar la siguiente tabla ANOVA y mencione el diseño empleado.

Fuente De SC g.l CM R.V. (FC) p


Variación

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


176

Entre 154,92 4
Tratamientos

Dentro de
tratamientos

Total 200,48 39

Diseño: ________________________________________________________________________

3. Considerar la siguiente tabla ANOVA

Fuente de SC g.l. CM R.V (FC)


variación

Entre 5,06 2

Dentro 65,42 27

(error)

Total

Nota: En Anexos se puede hallar la tabla de la distribución F)

a. ¿Qué diseño se utiliza?: ________________________________________________________

b. ¿Cuántos tratamientos se compararon?: ___________________________________________

c. ¿Cuántas observaciones se analizaron?: ______________________________________________

d. ¿Es posible concluir que, al menos dos medias difieren? ______________________________

4. Considerando e1 siguiente tabla ANOVA (completar):

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


177

Fuente de g.l. SC CM R.V. (FC)


variación

Entre 4 131,19

Dentro 708 9060,48

Total

a. ¿Cuántos tratamientos se compararon?: ___________________________________________

b. ¿Cuántas observaciones se ana1izaron?: ___________________________________________

c. ¿Es posible concluir que, por menos dos medias de tratamientos difieren?
_____________________________ ¿Por qué? ________________________________________

Se compara la edad promedio de tres grupos de pacientes. Cada grupo está constituido por cinco
pacientes. De la tabla de análisis de varianza se logra recuperar alguna, información que se presenta
a continuación:

Fuente de
SC g.l. CM R.V (FC)
variación

Entre 4

Dentro

Total 100

(Preguntas 5 a 9).

5. La hipótesis alterna, es:

( ) H1: Las medias muéstrales difieren significativamente

( ) H1: µ1 ≠ µ2 ≠ µ3

( ) H1: Al menos una media difiere de las demás.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


178

( ) H1: Al memos dos medias son diferentes.

( ) N.A.

6. La razón de varianzas (R.V.) o FC es:

( ) 6,5

( ) 1,083

( ) 13,0

( ) O, 1538

( ) N .A.

7. Los grados de libertad (numerador y denominador) de la distribución F, son:

( ) 3 y 15

( ) 15 y 3

( ) 12 y 2

( ) 2 y 12

( ) N .A.

8. La decisión estadística, conclusión respectiva y posible valor de p, son:

( ) Rechazar Ho, las edades promedio no difieren entre los grupos. p > 0.05

( ) No rechazar Ho, las edades promedio no difieren entre los grupos. p > 0.05

( ) Rechazar Ho, al menos dos edades promedio difieren. p < 0.05

( ) Rechazar Ho, al menos una edad promedio difiere de los demás edades promedio de los otros
grupos. P < 0.05

( ) N.A.

9. Si la decisión estadística hubiera sido, "rechazar la H0", el paso siguiente es:

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


179

( ) Concluir que al menos dos tratamientos difieren y dar por finalizado el análisis estadístico.

( ) No obtener ninguna conclusión y solo decir que las medias difieren.

( ) Concluir que las medias poblacionales no difieren significativamente con el valor de p obtenido.

( ) Concluir que al menos dos tratamientos difieren, escribiendo el valor de p y luego aplicar una
prueba de comparaciones múltiples (post hoc) para identificar las diferencias entre pares de medias.

( ) Concluir que al menos dos tratamientos difieren, escribiendo el valor de p y luego aplicar la prueba
t de Student para comparar cada par de medias.

10. Algunos epidemiólogos han propuesto la teoría de que el riesgo de padecer enfermedades
cardiacas de la coronaria se puede reducir incrementando el consumo de pescado. Un estudio, vigiló
la dieta y la salud de una muestra aleatoria de varones de mediana edad.

Los sujetos se dividieron en cinco grupos de acuerdo con los gramos de pescado que consumían al
día: 0 gramos / día, 1-14 gramos / día, 15-29 gramos / día, 30-44 gramos/día y 45 o más gramos / día.
Una de las muchas variables que se midió en cada sujeto fue la ingestión de polisacáridos (sustancia
ligada con las enfermedades cardiacas de la coronaria). Un análisis de varianza de los niveles de
polisacáridos (medidos como y porcentaje de la energía) en los cinco grupos de sujetos produjo la
tabla ANOVA parcial que se presenta a continuación.

Fuente de
SC g.l. CM R.V (FC)
variación

Entre grupos 534,97

Error 23659,45

Total 24194,42 851

a. Indicar el número total de varones incluidos en el estudio:


_______________________________________________________________________________

b. Completar la tabla ANOVA.

c. Escribir la conclusión: __________________________________________________________

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


180

11. Una tela grande de algodón de fábrica se corto en 12 pedazos los cuales fueron distribuidos y
aleatoriamente en tres grupos de cuatro. Tres sustancias químicas diferentes A, B y C diseñadas para
producir resistencia al color fueron aplicadas a las unidades, una sustancia para cada grupo. Se aplico
una solución colorante (tan uniformemente cómo fue posible) sobre todos las n = 12 unidades. La
variable de interés fue la intensidad de la solución medida en términos de resistencia a la reflexión de
la luz.

SUSTANCIA QUIMICA

A B C

12 14 9

8 9 7

9 11 9

6 10 5

a. ¿Qué tipo de diseño experimental se empleo?

b. Escribir el modelo del diseño utilizado y diga que representa cada termino.

Modelo:_________________________________________________________________________
________________________________________________________________________________

c. Efectuar el análisis de varianza y obtener la conclusión correspondiente.

d. Efectuar la prueba de comparaciones múltiples o prueba post hoc (test de Scheffé), para sustancias
A y C.

12. Los efectos de tres drogas con respecto al tiempo de reacción a cierto estimulo fueron estudiados
en cuatro grupos de animales experimentales. El cuarto grupo sirvió de grupo control, mientras que a
los grupos 1, 2 y 3 fueron aplicadas las drogas A, B y C respectivamente, con anterioridad a la
aplicación del estimulo:

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


181

A B C Control

12 8 3 2

10 5 5 5

13 9 2 4

10 8 3 3

11

¿Puede concluirse que, al menos dos medias de tratamientos difieren?

13. La duración requerida por niños de edad de un Centro de Educación Inicial para armar un
"rompecabezas" fue comparada para cuatro periodos de tiempo pre-experimental.

Cuatro estudiantes fueron asignados aleatoriamente a cada grupo peri dos fueron eliminados durante
el experimento debido a enfermedad. Los datos (duración de tiempo para armar en minutos) se
muestran en seguida:

Tiempo de instrucción preexperimental (horas)

0,5 1,0 1,5 2,0

8 9 4 4

14 7 6 7

9 5 7 5

12 8

Total 43 21 25 16

a. La variable independiente es:_____________________________________________________

b. La variable dependiente es: ______________________________________________________

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


182

c. El diseño experimental fue: ______________________________________________________

d. ¿Presentan los datos evidencia para indicar una diferencia en el tiempo medio para armar el
"rompecabezas" en al menos dos duraciones de instrucción pre - experimental? (Lleve a cabo el
ANOVA correspondiente).

e. Si corresponde, efectué el contraste de Scheffé para todos los pares de tratamientos.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


183

MISCELÁNEAS
En las siguientes proposiciones señalar verdadero (V) o falso (F):

1. ( ) El ANOVA es una prueba estadística paramétrica.

2. ( ) El símbolo tj representa la media de la población j

3. ( ) En un ANOVA, donde se comparan tres tratamientos compuestos cada uno de siete


observaciones, se tiene tres grados de libertad para la fuente de variación entre grupos.

4. ( ) En un ANOVA donde se comparan tres tratamientos compuestos cada uno de ocho


observaciones, se tiene 20 grados de libertad para la fuente de variación dentro de grupos.

5. ( ) Queremos comparar niveles de glucosa en sangre (mmol/L) en médicos de ambos sexos. La


variable dependiente en el análisis es sexo.

6. ( ) Queremos comparar niveles de glucosa en sangre (mmol/L) en médicos de ambos sexos. La


variable independiente, en el análisis, es el nivel de glucosa.

7. ( ) La hipótesis alterna en un ANOVA es: H1: Existe diferencia entre todas las medias
poblacionales.

8. ( ) SCD = SCT — SCE

9. ( ) RV (FC) = CMD/CMT

10. ( ) CMD = SCE/k-1

11. ( ) Grados de libertad para la fuente de variación, entre tratamientos = N- k

12. ( ) x32= tercera observación del segundo tratamiento.

13. ( ) Grados de libertad del total = número total de observaciones.

14. ( ) En el ANOVA la variable independiente puede ser cuantitativa 0 cualitativa, pero la


dependiente siempre será cuantitativa.

15. ( ) La hipótesis nula en el ANOVA puede plantearse también, H0: tj = 0

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


184

16. ( ) En la hipótesis nula anterior, j puede asumir valores desde 1hasta k, siendo k el número de
tratamientos.

17. ( ) El objeto al cual se aplica un tratamiento se denomina unidad experimental.

18. ( ) En un diseño experimental con dos tratamientos en el que la variable dependiente es


cuantitativa, no puede realizarse el ANOVA.

19. ( ) En el diseño anterior, puede aplicarse también la prueba "t" de Student para dos muestras
independientes.

20. ( ) Para el caso anterior se puede constatar que t2c = Fc

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


185

14. COMPARACION DE DOS PROPORCIONES


DE POBLACIONES INDEPENDIENTES

OBJETIVOS

1. Conocer los supuestos que los datos deben satisfacer para llevar a cabo una prueba de hipótesis
para la diferencia de dos proporciones de poblaciones independientes

2. Contrastar H0: π1 = π2, obtener e interpretar el valor de p

LECTURAS SUGERIDAS

 Daniel W. Bioestadística. Base para el análisis de las ciencias de la Salud. 4a ed. México:
Limusa Wiley; 2009.

 Mendenhall W, Sincich T. Probabilidad y Estadística para Ingeniería y Ciencias. 4a ed.


México: Prentice— Hall; 1997.

 Pagano M, Gauvreau K. Fundamentos de Bioestadística. 2a ed. México: Thomson Learning;


2001

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


186

PRACTICAS

1. Se tiene información que una mayor proporción de niños expuestos a valores altos de plomo (Pb)
atmosférico (> 10 µg/dl). Tienen problemas de aprendizaje. Un investigador desea confirmar o
desconfirmar esta proposición y realiza un estudio comparativo y tomando una muestra de 50 niños
expuestos a valores altos de Pb y otra de 50 niños no expuestos a Pb y obtiene los siguientes
resultados:

NIÑOS

Expuestos a Pb No expuestos a Pb

n1= 50 n2= 50

p1=30% p2= 15% con problemas de aprendizaje

Realizar la prueba de hipótesis correspondiente.

2. Investigadores del Hospital Nacional Arzobispo Loayza firman que el antígeno especifico
prostático (PSA), encontrado en las células ductales epiteliales, es específico para el tejido prostático
y es detectable en el suero de hombres con próstata normal y en hombres con enfermedades benignas
o malignas de esta glándula. En una muestra de 80 hombres con concentraciones elevadas de PSA (>
4 ng/ml), a 48 se les diagnostico cáncer mediante biopsia de la próstata. En otra muestra de 60
hombres con valores de PSA i 4 ng/ml, 12 tenían cáncer. ¿Es posible concluir que, en general, los
hombres con valores elevados de PSA tienen mayor probabilidad de tener cáncer de próstata?

3. Investigadores de la Sociedad Nacional de Neumología del Perú realizaron un estudio comparativo


para lo cual, tomaron una muestra de 125 amas de casa de la población de las que siempre cocinan
con leña y 80 de ellas presentaron fibrosis pulmonar y en otra muestra de 125 amas de casa de la
población de las que nunca cocinan con leña, encontraron que 50 presentaron fibrosis pulmonar.
¿Existe diferencia estadísticamente significativa en cuanto a la proporción de pacientes con fibrosis
pulmonar entre las dos poblaciones?

4. La tabla 1, presenta algunos hallazgos de un estudio aleatorio doble ciego, controlado por placebo,
del uso de penicilina parenteral en pacientes con artritis de Lyme (Steere y otros, 2005).

Tabla 1: Información de pacientes con artritis de Lyme.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


187

Características del paciente Sensibles No sensibles

Número de pacientes 60 60

Antecedentes de EMC* 18 9

Terapéutica con antibióticos para EMC 8 1

Terapéutica con antibióticos para artritis 4 2

* Eritema Migrans Cronico .

Identificar y aplicar el método estadístico apropiado para determinar si existe diferencia entre
sensibles y no sensibles en cuanto a la proporción de pacientes con antecedentes de eritema migrans
cronico (EMC).

5. Usar los datos de la tabla 2 siguiente para comparar el número total de pacientes con una infección
por gran negativos que reciben vacuna J5 y placebo.

Tabla 2. Episodios de infección por gran negativos en pacientes quirúrgicos tratados con
vacuna J5 frente a los que recibieron un placebo.

Cirugía abdominal Total de pacientes

J5 Placebo J5 Placebo

Episodio

Shock 2 13 6 15

Shock irreversible 1 9 2 9

N° de infectados 8 15 16 23

Total de pacientes 71 83 126 136

a. Calcule la proporción de infectados de los que recibieron la vacuna J5.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


188

b. Calcule la proporción de infectados de los que recibieron placebo.

c. ¿Qué conclusión se obtiene con la prueba z para la comparación de proporciones de infectados en


las dos poblaciones independientes?

d. ¿Qué conclusión se extrae si se determina el riesgo relativo (RR) de infección cuando los pacientes
reciben un placebo respecto a los que reciben la vacuna J5?

6. En un estudio de cohortes, con una muestra de 50 obesos y otra de 50 no obesos, se encontraron


los siguientes resultados mostrados en la siguiente tablea, sobre la aparición de la diabetes mellitus al
término del seguimiento.

Diabetes
Obesidad Total
No Si

Si 8 42 50

No 20 30 50

Total 28 72 100

Analizar los datos con la prueba z para comparar dos poblaciones independientes.

7. Los bloqueadores de calcio pertenecen a una de varias clases de medicamentos que comúnmente
se recetan para aliviar la hipertensión arterial. Un estudio realizado en Dinamarca revelo que los
bloqueadores de calcio también podrían ser efectivos para reducir el riesgo de ataques cardiacos
(Tampa Trubune, 23 de marzo de 1990). Un total de 897 pacientes daneses, todos recuperándose de
un ataque cardiaco, recibieron una dosis diaria del medicamento Verapamil, un bloqueador de calcio.
Después de 18 meses de seguimiento, 146 de estos pacientes habían vuelto a sufrir un ataque cardiaco.
En un grupo de control de 878 personas, los cuales tomaron un placebo, 180 sufrieron un ataque
cardiaco. ¿Se puede inferir que los bloqueadores de calcio son efectivos para reducir el riesgo de
ataques cardiacos? (Sugerencia: trabajar con cuatro decimales)

8. Seldane - D, producido por Marion Merrell Dow, Inc., es un medicamento que se vende sin receta
y fue diseñado para aliviar los estornudos, la congestión nasal y otros síntomas de rinitis alérgica. Se
investigaron los efectos adversos generales de Seldane - D en un estudio doble ciego, controlado, de
más de 500 pacientes que padecían rinitis alérgica. A una muestra de 374 pacientes se les administro
Seldane - D, en tanto que a una segunda muestra de 193 pacientes se les administro un placebo. En

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


189

la tabla se presenta el número de pacientes que dijeron sufrir insomnio en cada uno de los dos grupos.
Realizar una prueba estadística para determinar si la proporción de pacientes que tomaron Seldane -
D y experimentaron insomnio difiere de la proporción correspondiente de los pacientes que recibieron
el placebo.

tratamiento
Pacientes Total
Seldane - D Placebo

Con insomnio 97 12 109

Sin insomnio 277 181 458

Total 374 193 567

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


190

MISCELANEAS
En las siguientes proposiciones señalar la alternativa correcta:

1. En una comparación estadística de dos poblaciones independientes respecto a las proporciones, se


planteo la siguiente hipótesis alterna: H1: π1>π2. La hipótesis nula adecuada es:

( ) π1 ≤ π2

( ) π1 = π2

( ) π1 ≥ π2

2. Al contrastar la siguiente hipótesis H0 : π1 ≤ π2 con la prueba z se obtuvo un z = 1,82, el valor de p


y la decisión estadística, son:

( ) 0,0688 No rechazar H0

( ) 0,0344 Rechazar H0

( ) 0,9656 No rechazar H0

3. Para contrastar la H0 de la pregunta anterior se usa la prueba z que es una variable de la distribución
normal; sin embargo, la variable de interés en la población tiene una distribución binomial. Entonces,
se está usando la distribución normal como:

( ) Aproximación de la distribución de Poisson.

( ) Aproximación de la distribución binomial.

( ) Prueba exacta.

4. Para contrastar la H0: π1 = π2 se utiliza la prueba o test de significación z cuando las dos muestras
son probabilísticas y, siempre y cuando:

( ) Las dos muestras sean grandes (n1 p1 ≥ 5, n1 q1 ≥ 5 y n2 p2 ≥ 5, n2 q2 ≥ 5)

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


191

( ) Las proporciones muéstrales p1 y p2, sean iguales.

( ) Las proporciones poblacionales π1 y π2, sean conocidas para calcular el error estándar de las
diferencias de las proporciones muéstrales.

5. Al contrastar la H0: π1 ≥ π2, mediante el estadístico z se obtuvo un valor de -4,45, el valor de p


correspondiente, es:

( )p=0

( ) p = 1,000

( ) p = 0,000 1

6. Con el valor de p obtenido en la pregunta anterior, la decisión estadística es:

( ) Aceptar H0

( ) Aceptar H1

( ) Rechazar H0

7. Según el valor de p señalado en la pregunta 5 y la decisión formulada en la pregunta 6 la conclusión,


es:

( ) La primera población tiene una proporción significativamente mayor que la segunda población.

( ) La primera población tiene una proporción significativamente menor que la segunda población.

( ) Rechazar H0

8. Cuando se realiza la prueba de hipótesis para H0: π1 = π2 (también para hipótesis unilaterales), se
supone que las proporciones de las dos poblaciones no difieren; entonces, el error estándar de las
diferencias de la proporciones muéstrales se obtiene calculando previamente:

( ) La proporción común o ponderada

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


192

( ) La probabilidad de éxito

( ) La probabilidad de fracaso.

9. En un estudio de casos y controles no pareado sobre factores de riesgo de bajo peso al nacer. Se
selecciono una muestra de 120 casos (niños de bajo peso) y una muestra de 120 controles (niños de
peso normal). Se planteó, como un posible factor de riesgo, que Ia madre fume durante el embarazo.
Se encontró, en 1a muestra de casos y controles que 45 y 30 madres, respectivamente, habían fumado
durante el embarazo. La proporción común o ponderada, es:

( ) 0,3750

( ) 0,3125

( ) 0,2500

10. El error estándar de las diferencias de las proporciones muéstrales, es:

( ) 0,0500

( ) 0,0036

( ) 0.0598

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


193

15. APLICACIONES DE LA DISTRIBUCION CHI


CUADRADO

OBJETIVOS

1. Aplicar chi cuadrado como prueba de independencia.


2. Aplicar chi cuadrado como prueba de homogeneidad de poblaciones
3. Llevar a cabo la prueba chi cuadrado de Mc Nemar (contraste bilateral)
4. Realizar las prueba exacta de Fisher en tablas de 2 x2 (contraste unilateral)

LECTURA SUGERIDAS

 Armitage P, Berry G. Estadística para la investigación biomédica. 3a ed. Madrid


España: Harcourt Brace; 1997
 Pagano M, Gauvreau K. Fundamentos. de Bioestadística. 2a ed. México: Thomson
Learning; 2001.
 Royo MA, Moreno JD. Método epidemiológico. la ed. Madrid España: ENS- Instituto de
Salud Carlos III- Ministerio de Ciencia e Innovación; Octubre de 2009

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


194

PRACTICAS

A. Chi-cuadrado como prueba de independencia y de homogeneidad de poblaciones.

1. En la siguiente tabla:

Obesidad
Hipertensión arterial Total
Si No

Si 42 8 50

No 32 18 50

TOTAL 74 26 100

Nota: En Anexos se puede hallar la tabla de la distribución chi cuadrado.

¿Existe asociación, estadísticamente significativa, entre las dos variables?

2. La siguiente tabla muestra el resultado de 275 entrevistas realizadas por una encuestadora para
conocer la opinión de la población adulta limeña acerca de la "Píldora del día siguiente". Los datos
están clasificados por sector de la ciudad en donde se aplico la encuesta:

Opinión sobre el uso de la píldora del día siguiente

Sector de la A favor En contra No sabe/ no Total


ciudad opina

A 50 ( ) 10 ( ) 2( ) 62 ( )

B 55 ( ) 3( ) 2( ) 60 ( )

D 30 ( ) 35 ( ) 8( ) 73 ( )

E 30 ( ) 30 ( ) 20 ( ) 80 ( )

Total 165 78 32 275

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


195

Determinar si los cuatro sectores poblacionales son homogéneos respecto a la opinión sobre el uso de
la píldora del día siguiente. (Escribir entre paréntesis las frecuencias esperadas)

3. Se desea determinar si las variables sexo (masculino, femenino) y presencia de anemia (si, no)
están asociadas. Se toma una muestra de 200 sujetos y 80 fueron de sexo masculino de los cuales 10
presentaron anemia. Del total, 160 no presentaron anemia. Realizar el análisis estadístico de los datos
y obtener la conclusión apropiada.

4. Se tiene interés en evaluar si el uso de anticonceptivos orales es un factor de riesgo de cáncer de


cuello uterino en mujeres casadas menores de 45 años de edad. Para tal efecto se realiza un estudio
comparativo tipo caso control y se obtiene los siguientes resultados:

Con cáncer del cuello Sin cáncer del cuello


Uso de anticonceptivos
uterino uterino
orales
(Casos ) (Controles)
Si 23 34
No 35 132
Total 58 166

¿Casos y controles difieren significativamente en cuanto a la proporción de usuarias de


anticonceptivos orales?

5. Para evaluar si colesterol total elevado (2 200) es factor de riesgo de infarto del miocardio (IM) se
realiza un estudio comparativo de cohortes y se obtiene los siguientes resultados:

Colesterol Desarrollo IM No desarrollo IM Total

≥ 200 (Expuestos) 10 125 135

< 200 (No expuestos) 21 449 470

¿Expuestos y no expuestos difieren en cuanto a la proporción de los que desarrollaron infarto del
miocardio?

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


196

6. Se desea evaluar si el consumo del tabaco es un factor de riesgo del cáncer de pulmón. Para tal
efecto se registraron 550 fumadores de los 649 casos con cáncer de pulmón, comparados con 300 no
fumadores de los 640 controles

a. Mostrar una tabla 2x2 con los datos obtenidos.

b. ¿Casos y controles difieren en cuanto a la proporción de expuestos a tabaco?

B. Chi- cuadrado de Mc Nemar: dos muestras relacionadas

1. Se desea comparar dos técnicas A y B de detección de cierto tipo de parasito en heces humanas.
En la tabla siguiente se muestran los resultados

B
Técnicas
+ -

+ 80 30
A
- 15 40

¿Existe diferencia estadísticamente significativa entre ambas técnicas en cuanto a la capacidad de


detección de casos positivos? Es decir, ¿La proporción de positivos detectada con la técnica A difiere
significativamente de la detectada con la técnica B?

4. Se cultivan 50 muestras de esputo en dos medios distintos, A y B, con el objeto de comparar


la capacidad de los dos medios para detectar la presencia de bacilos de la tuberculosis. Los
resultados se muestran en la siguiente tabla. ¿Difieren los dos medios en cuanto a su
capacidad para detectar la presencia de bacilos?

Medio A Medio B Total

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


197

+ -

+ 20 12 32

- 2 16 18

Total 22 28 50

3. Antes y después de escuchar el discurso de un candidato político fueron interrogadas 25 electores.


A la pregunta si (Si) iban a apoyar o no (No), con sus votos, a dicho candidato en las elecciones,
respondieron de la siguiente manera:

Medio B
Medio A Total
+ -

+ 20 12 32

- 2 16 18

Total 22 28 50

¿Difieren significativamente las proporciones de los que cambiaron sus respuestas del antes a después
de Si a No de los que cambiaron de No a Si?

C. Prueba exacta de Fisher.

1. En un estudio de casos y controles se tomo una muestra de 10 pacientes (Casos) con tuberculosis
pulmonar multidrogoresistente— TBP (MDR)- y otra de 10 pacientes (Controles) que haberlo tenido
TBP habían sido dados de alta (curados). Se averiguo si antes de tener TBP habían consumido droga.
Se elaboro la siguiente tabla con los datos obtenidos.

TBP (MDR)
Consumo de droga Total
Si No

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


198

Si 4 0 4

No 6 10 16

Total 10 10 20

¿Puede concluirse que una mayor proporción de pacientes que ahora tienen TBP (MDR) había
consumido droga antes de tener TBP?

2. En un ensayo clínico con los tratamientos A y B para cierto tipo de desorden mental se obtuvo la
siguiente información sobre los eventos adversos manifestados por los pacientes.

Eventos adversos
Tratamiento Total
Si No

A 1 14 15

B 4 11 15

Total 5 25 30

¿Con el tratamiento A se obtuvo una menor proporción, que con el tratamiento B, de pacientes con
eventos adversos?

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


199

MISCELÁNEAS

En las siguientes proposiciones señalar con X la alternativa correcta:

1. En una prueba de homogeneidad de poblaciones con chi—cuadrado se encontró un valor de 0,02


< p < 0,05, con este valor de p se concluye que:

( ) Las poblaciones son independientes.

( ) Las poblaciones son homogéneas.

( ) Las poblaciones no son homogéneas.

2. Al finalizar toda prueba de hipótesis, se obtiene el valor de p. Este valor mide la probabilidad de:

( ) Cometer el error tipo II en un análisis especifico.

( ) Cometer el error tipo I en un análisis especifico.

( ) Nivel de confianza al tomar la decisión estadística.

3. Cuando se comparan proporciones en dos muestras relacionadas, para facilitar los cálculos, se suele
elaborar una tabla de 2 X 2 y para aplicar la prueba chi cuadrado de Mc Nemar es necesario calcular
la frecuencia esperada en las celdas "discrepantes" de la tabla. Si la frecuencia esperada fuese 5 o
menos, para determinar la significación estadística de la diferencia de las dos proporciones, se debe
utilizar:

( ) Prueba exacta de Fisher

( ) Prueba chi cuadrado de homogeneidad de poblaciones

( ) Prueba binomial.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


200

4. Para determinar si las variables fumar tabaco (si, no) y sexo (masculino, femenino) son
independientes, se aplicara:

( ) Prueba t para comparar dos poblaciones independientes.

( ) Chi—cuadrado como prueba de independencia.

( ) Chi—cuadrado como prueba de homogeneidad.

5. Se desea determinar si tres poblaciones independientes de escolares (A, B y C) difieren en cuanto


a la prevalencia de asma (presente, ausente) para lo cual se toma una muestra de 100 escolares de
cada población y se determina en cada uno la presencia o ausencia de asma. La prueba estadística
adecuada para realizar la comparación, es:

( ) Prueba z para la comparación de dos proporciones de poblaciones independientes

( ) Chi-cuadrado como prueba de independencia.

( ) Chi—cuadrado como prueba de homogeneidad de poblaciones.

6. En un pequeño experimento aleatorio realizado completamente a ciegas acerca del bálsamo de


berenjena para el tratamiento del acné, la PE (término médico para designar la "proporci6n de
eficacia") en el grupo de tratamiento fue la mitad que la del grupo de control. Sin embargo, el contraste
de chi—cuadrado de homogeneidad (comparación de dos poblaciones independientes) mostro que la
diferencia no era significativa. Podemos concluir que:

( ) El tratamiento no es útil.

( ) Deberíamos ir añadiendo casos al experimento hasta que el test llegue a ser o significativo.

( ) Deberíamos llevar a cabo un nuevo experimento con mas individuos.

7. Para determinar si las variables higiene oral (Bueno, regular, malo) y nivel socioeconómico

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


201

(Alto, medio, bajo) son independientes, se aplicara:

( ) Chi—cuadrado como prueba de homogeneidad de poblaciones.

( ) Chi—cuadrado como prueba de independencia.

( ) Prueba exacta de Fisher.

8. Chi—cuadrado como prueba de independencia se utiliza, para relacionar dos variables cualitativas,
en estudios con:

( ) Una población.

( ) Dos poblaciones.

( ) Tres o más poblaciones.

9. Se desea determinar si dos poblaciones independientes de escolares difieren en cuanto a la


presencia de parásitos, para lo cual se toma una muestra de 50 escolares de cada población y se
determina la presencia o ausencia de parásitos. La prueba estadística adecuada para realizar la
comparación, es:

( ) Prueba "t" de Student.

( ) Chi—cuadrado como prueba de independencia.

( ) Chi—cuadrado como prueba de homogeneidad de poblaciones.

10. Se desea determinar si la variable sexo (masculino, femenino) y presencia de halitosis (si, no)
están asociadas. Se toma una muestra de 300 sujetos y 120 fueron de sexo masculino de los cuales 40
presentaron halitosis. Del total, 1 60 no presentaron halitosis.

El valor de chi—cuadrado calculado es: (calcular)

( ) 204,08

( ) 3,78 1

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


202

( ) 14,29

11. Supongamos que el valor correcto de chi—cuadrado es 14,29, el valor de p correspondiente es:

( ) p < 0,05

( ) p < 0,01

( ) p < 0,005

12. En una prueba de homogeneidad de poblaciones con chi-cuadrado se encontré un valor de p >
0,10, con este valor de p se concluye que:

( ) Las poblaciones no son homogéneas.

( ) Las poblaciones son homogéneas.

( ) No se rechaza la hipótesis nula.

13. La prueba exacta de Fisher es aplicable cuando, en una tabla de 2x2 se va a aplicar chi cuadrado
de independencia 0 de homogeneidad de poblaciones, y:

( ) Al menos una Oij es menor 0 igual que 5

( ) Al menos una Eij es menor 0 igual que 5.

( ) Al menos una Eij es mayor 0 igual que 5.

14. En una prueba de bondad de ajuste con chi cuadrado, se analiza:

( ) Tres variables.

( ) Dos variables.

( ) Una variable.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


203

Se tomaron muestras de orina y sangre de cada uno de 50 pacientes (muestra), para determinar la
presencia (+) o ausencia (—) de cierto tipo de bacteria. Del total, 30 pacientes presentaron la bacteria
en orina; asimismo del total, 10 pacientes no presentaron la bacteria en sangre y del total 20 pacientes
presentaron la bacteria tanto en sangre como en orina. (Preguntas 15 a 19):

15. Para determinar si la proporción de positivos en muestras de sangre es diferente de la proporción


de positivos en muestras de orina, se utilizara:

( ) La prueba exacta de Fisher

( ) Chi cuadrado de homogeneidad de poblaciones

( ) Chi cuadrado de Mc Nemar

16. Supongamos que se decide usar la prueba chi cuadrado de Mc Nemar, en el ejercicio anterior. El
valor de chi cuadrado calculado, es:

()0

( ) 2,70

( ) 4,03

17. El valor de p. con el resultado de chi—cuadrado obtenido en la pregunta anterior, es:

( ) p < 0, 10

( ) p > 0, 10

( ) p = 0,05

18. La decisión estadística respecto a la hipótesis nula de la pregunta anterior, es:

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


204

( ) Rechazar la hipótesis nula.

( ) No rechazar la hipótesis nula

( ) No existe diferencia, estadísticamente significativa, entre la proporción de positivos en muestras


de sangre y la proporción de positivos en muestras de orina.

19. La conclusión del análisis, es:

( ) Rechazar la hipótesis nula.

( ) No rechazar la hipótesis nula

( ) No existe diferencia, estadísticamente significativa, entre la proporción de positivos en muestras


de sangre y la proporción de positivos en muestras de orina.

20. La distribución chi cuadrado esté conformada por una familia de curvas:

( ) Simétricas

( ) Asimétricas

( ) Normales

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


205

16. PRUEBAS NO PARAMETRICAS PARA DOS


A MUESTRAS RELACIONADAS E
INDEPENDIENTES

OBJETIVOS

1. Conocer el uso de las pruebas no paramétricas para variables cuantitativas


2. Aplicar la prueba signo rango de, Wilcoxon, obtener e interpretar el valor de p
3. Aplicar la prueba suma de rangos de Wilcoxon, obtener e interpretar el valor de p

LECTURA SUGERIDAS

 Daniel W. Bioestadística. Base para el análisis de las ciencias de la salud. 4ª ed. México.
Limusa Wiley; 2009
 Mendenhall W, Beaver B, Beaver R. Introducción a la probabilidad y estadística. 12a
ed. México: Thomson; 2008.
 Norman G, Streiner D. Bioestadística. 1a ed. Madrid España: Mosby/Doyma Libros,
S.A.; 1996.
 Pagano M, Gauvreau K. Fundamentos. de Bioestadística. 2a ed. México: Thomson
Learning; 2001.

PRACTICAS

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


206

1. Asignar rangos (transformar las observaciones en rangos) a las observaciones en la siguiente tabla.

Observación Rango asignado


2 1
3
4
5
6
7
8

2. En un estudio con escolares anémicos se encontraron los siguientes valores de hemoglobina antes
y después de una intervención nutricional con un fuerte contenido de hierro.

Antes: 9 8 7 9 8 9 8 10

Después: 10 11 12 9 13 14 10 11

Al realizar la prueba de normalidad de las diferencias, se concluyo que éstas no se ajustaban a la


distribución normal ¿La intervención fue efectiva?

3. Respecto a niveles de TCDD en 20 veteranos de guerra de Vietnam residentes en Massachusetts


(Practica 2, Ejercicio 14) que pudieron haber estado expuestos al Agente Naranja. En la tabla se
muestran las cantidades de T CDD (medidas en partes por billón) en el plasma sanguíneo y tejido
graso extraído de cada veterano. (¿Hay evidencia suficiente de que haya diferencia entre los niveles
de TCDD en el plasma y en el tejido graso de los veteranos expuestos al Agente Naranja?

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


207

Niveles de Niveles de Niveles de Niveles de


Veterano TCDD en TCDD en Veterano TCDD en TCDD en
plasma tejido graso plasma tejido graso
1 2,5 4,9 11 6,9 7,0
2 3,1 5,9 12 3,3 2,9
3 2,1 4,4 13 4,6 4,6
4 3,5 6,9 14 1,6 1,4
5 3,1 7,0 15 7,2 7,7
6 1,8 4,2 16 1,8 1,1
7 6,0 10,0 17 20,0 11,0
8 3,0 5,5 18 2,0 2,5
9 36,0 41,0 19 2,5 2,3
10 4,7 4,4 20 4,1 2,5

4. Analizando el efecto de una intervención farmacológica, con la prueba signo rango de Wilcoxon o
T de Wilcoxon, se encontré en la suma de rangos positivos un valor de 45,5 y en la suma de rangos
negativos un valor de 9,5. Se trabajo finalmente con n = 10, nivel de significación del 5% dos colas.
Indicar la decisión estadística.

5. Se formaron doce parejas de niños con enfermedades en el cerebro para un experimento, con el fin
de determinar si existía diferencia estadísticamente significativa entre las dos formas de terapia física.
Se eligió un niño al azar de cada par y se trato por un periodo, de varios meses usando la terapia A,
mientras que el otro niño fue tratado durante el mismo periodo usando la terapia B. Los resultados se
resumen en la siguiente tabla. Llevar a cabo la prueba de hipótesis correspondiente.

Par Diferencia favorable al Rango del valor absoluto de la


tratamiento diferencia
1 A 9
2 A 5
3 B 1,5
4 A 4

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


208

5 A 1,5
6 * *
7 A 7
8 A 8
9 * *
10 A 10
11 A 6
12 A 3
* Diferencia igual a cero

6. Se realiza un análisis de diferencia de des medianas de grupos independientes, con n1 = 8 y n2 = 8,


obteniendo los valores ΣR1 = 56 y ΣR2 = 80, con un nivel de significación del 5%.

Indicar la decisión estadística.

7. Muestras aleatorias independientes de tamaños 3 y 4 fueron obtenidas de las poblaciones A y B,


respectivamente. Utilizar la prueba suma de rangos de Wilcoxon para determinar si las medianas
poblacionales difieren significativamente.

A B
17,9 15,3
22,5 14,4
21,0 17,9
15,3

8. Supónganos que tenemos dos poblaciones independientes y deseamos utilizar la prueba suma de
rangos de Wilcoxon para evaluar la hipótesis nula de que las medianas poblacionales no difieren
significativamente. Se selecciona una muestra de tamaño 4 de la primera población y una muestra de
tamaño 5 de la segunda.

a. Si W = 16, ¿cuál es el valor de p de la prueba bilateral?

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


209

b. Si la suma de rangos en la primera muestra es 12 y la suma de la segunda muestra es 33, (¿cuál es


el valor de p de la prueba bilateral?

9. Se diseño un experimento para determinar si el fumar cigarros tiene un efecto sobre la duración de
la vida de perros pequeños. Se usaron 20 perros de la misma edad en el experimento. Los animales
fueren asignados al azar a uno de dos grupos. A diez de los perros se les enseño a fumar hasta 12
cigarros al día. Los otros perros no fumaron. A continuación se tienen los tiempos de vida hasta la
muerte, en días, para los perros de ambos grupos. Puesto que el experimente concluye cuando murió
el ultime de los perros fumadores, se registra una L per cada une de les perros que aun están con vida.

¿Los perros fumadores tienen una vida más corta que los perros no fumadores?

Fumadores No fumadores
45 315
112 474
251 727
340 894
412 L
533 L
712 L
790 L
845 L
974 L

10. El colágeno tipo II es un posible remedio para suprimir los síntomas de la artritis reumatoide.
Investigadores médicos de la Universidad de Harvard realizaron un estudio clínico a fin de probar la
capacidad del colágeno para reducir la hinchazón en las articulaciones de pacientes con artritis
reumatoide. A cada uno de 59 pacientes con artritis reumatoide severa activa se le administro una
dosis diaria de colágeno o bien de un placebo idéntico, durante un peri0d0 de 30 días, (28 recibieron
colágeno, recibieron placebo.) La variable de interés fue el número de articulaciones hinchadas
(después del tratamiento menos antes del tratamiento) en cada paciente. Presentamos aquí las medias
y desviaciones estándar para las dos muestras.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


210

Colágeno Placebo
Tamaño de muestra 28 31
Media -2,7 2,0
Desviación estándar 0,5 1,4

a. Aunque en al artículo no se proporciono información acerca de la distribución de la variable de


interés para los dos grupos de pacientes, los investigadores utilizaron la prueba suma de rangos de
Wilcoxon en lugar de una prueba 1: para comparar los dos grupos. Cite dos razones por las que una
prueba no paramétrica podría ser más apropiada para analizar los datos del estudio descrito.

b. Enuncie la hipótesis nula contrastada con el procedimiento de suma de rangos de Wilcoxon en


dicho estudio. A

c. Se informé que el nivel de significación observado en la prueba fue menor que 0,05. Obtener la
conclusión adecuada.

11. Con referencia al estudio sobre los insecticidas empleados en huertos laterales en el valle de Majes
-Arequipa (Practica 1, Ejercicio 13). Se tomaron y analizaron diariamente muestras de aire en un
huerto durante el periodo de fumigación. En la tabla se presentan los niveles de residuos tiónicos y
oxónicos (en ηg/m3) en las muestras de aire.

Fecha condición Tión Oxón Razón oxón/tión


Ene. 15 Niebla 38,2 10,3 0,270
17 Niebla 28,6 6,9 0,241
18 Niebla 30,2 6,2 0,205
19 Niebla 23,7 12,4 0,523
20 Niebla 62,3 Muestra de aire ______
perdida
20 Despejado 74,1 45,8 0,618
21 Niebla 88,2 9,9 0,112
21 Despejado 46,4 27,4 0,591
22 Niebla 135,9 44,8 0,330
23 Niebla 102,9 27,8 0,270

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


211

23 Nublado 28,9 6,5 0,225


25 Nublado 46,9 11,2 0,239
25 Despejado 44,3 16,6 0,375

Comparar la mediana de las razones oxón/tión en los días de niebla con la mediana de las razones en
los días despejados/nublados en los huertos.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


212

MISCELÁNEAS

En las siguientes proposiciones señalar con X la alternativa correcta:

1. La prueba signo-rango de Wilcoxon se utiliza para comparar dos poblaciones:

( ) Independientes

( ) De tamaños diferentes.

( ) Relacionadas

2. La prueba suma de rangos de Wilcoxon (U de Mann-Whitney) se utiliza para comparar dos


poblaciones:

( ) Independientes.

( ) Que provienen de poblaciones normalmente distribuidas.

( ) Relacionadas

3. Se desea comparar la población de pacientes diabéticos (población 1) con otra población de


pacientes no diabéticos (población 2) respecto a la calidad de vida medida con un score (escala
ordinal) que va de 0 a 100 puntos (0 = pésima calidad de vida, 100 =excelente calidad de vida). Para
este fin se utilizara la prueba:

( ) Prueba chi—cuadrado de independencia.

( ) Prueba signo—rango de Wilcoxon.

( ) Prueba suma de rangos de Wilcoxon (U de Mann-Whitney).

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


213

4. La hipótesis nula planteada, es:

( ) µ1= µ2

( ) Me1 = Me2

( ) π1 = π2

5. Supongamos que los investigadores, para la hipótesis nula de la pregunta 4, utilizaron la prueba
suma de rangos de Wilcoxon y al calcular el valor de z obtuvieron, z = 1,74, para este resultado, el
valor de p es:

( ) 0,9591

( ) 0,0409

( ) 0,0818

6. Se desea comparar la eficacia de dos tratamientos (A y B) para el dolor medida en una escala de
puntuaciones de 0 (nada de dolor) hasta 10 (todo el dolor posible). Para este fin se parearon pacientes
según edad, sexo, etc. Un miembro de cada par se asigno al azar a uno de los dos tratamientos. Al
término del seguimiento se evaluó el dolor de cada paciente. Suponiendo que el nivel de dolor antes
de la asignación del tratamiento para todos los pacientes era el mismo, los investigadores deseaban
averiguar si entre los dos tratamientos había diferencia estadísticamente significativa en cuanto al
dolor. La hipótesis nula se puede enunciar como:

( ) Los pacientes no difieren respecto a los puntajes de dolor.

( ) La mediana de las diferencias de puntajes de dolor es igual a cero.

( ) La mediana de dolor de los que recibieron el tratamiento A es igual que de los que recibieron el B.

7. En una muestra de 12 pacientes con mucha sensibilidad en las encías se desea determinar la
efectividad de un enjuague dental para inflamación de encías. Para lo cual se obtienen índices

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


214

gingivales antes y después del enjuague. Se desea averiguar si después de los enjuagues los índices
(escala ordinal) habían disminuido significativamente. Para este fin se utilizara:

( ) Prueba t pareada.

( ) Prueba signo—rango de Wilcoxon.

( ) Prueba suma de rangos de Wilcoxon.

8. Las pruebas no-paramétricas son:

( ) Solo alternativas de las pruebas paramétricas.

( ) Usadas cuando las muestras no son probabilísticas.

( ) Denominadas también pruebas de distribución libre.

9. En la estadística no paramétrica, cuando se analizan datos cuantitativos, en las hipótesis, se


comparan:

( ) Proporciones

( ) Medianas

( ) Medias

10. Un equivalente no paramétrico de la prueba "t pareada", es:

( ) Signo rango de Wilcoxon

( ) Suma de rangos de Wilcoxon

( ) Chi-cuadrado de Mc Nemar

11. Son afirmaciones correctas sobre las pruebas no paramétricas cuando se analizan datos
cuantitativos, excepto:

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


215

( ) Se comparan medianas en las hipótesis

( ) Se trabaja con valores directos de la variable

( ) Los puntajes directos se trasforman en rangos

12. Un equivalente paramétrico de la prueba suma de rangos de Wilcoxon (U de Mann Whitney), es:

( ) Chi cuadrado de muestras independientes

( ) "t" para dos muestras independientes

( ) "t" para dos muestras pareadas

13. ¿Cuál de los siguientes supuestos es común, tanto para la prueba paramétrica "t" de Student para
dos poblaciones independientes como para la prueba no paramétrica suma de rangos de Wilcoxon?

( ) Aleatoriedad

( ) Normalidad

( ) Homogeneidad de varianzas

14. Una prueba estadística no paramétrica que es equivalente a la prueba suma de rangos de Wilcoxon,
es: I

( ) "t" de Student para comparar dos poblaciones independientes

( ) Chi—cuadrado, como prueba de homogeneidad de poblaciones

( ) U de Mann-Whitney

15. Para aplicar las pruebas no paramétricas de Wilcoxon, así como la prueba U de Mann-Whitney,
se requiere que la variable para el análisis se mida al menos en:

( ) Escala ordinal

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


216

( ) Escala de intervalo

( ) Escala de razón.

16. Se utilizaron 30 pares de niños asmáticos, pareados en base a edad, sexo, tiempo de enfermedad,
etc. Un niño de cada par recibió al azar el tratamiento A y el otro el tratamiento B. No hay estudios
similares publicados. Al comparar las frecuencias respiratorias entre ambas muestras (las diferencias
no tuvieron distribución normal), se obtuvo un valor de z = 2,33.

¿Qué prueba estadística no paramétrica se habría utilizado? ¿Por qué?

Prueba: ________________________________________________________________________

Porque: _______________________________________________________________________

H0: ___________________________________________________________________________

Valor de p: _____________________________________________________________________

Decisión estadística: _____________________________________________________________

Conclusión: _____________________________________________________________________

17. Señalar si es falso (F) o verdadero (V), en los siete siguientes enunciados:

( ) Antes y después de la administración de un medicamento una muestra de pacientes asmáticos fue


evaluada mediante la asignación de un puntaje (score medido en escala ordinal) clínico que va de 0 a
10. Para analizar los datos se usa, la prueba signo—rango de Wilcoxon.

( ) Se tomo una muestra de 50 recién nacidos de Cerro de Pasco y otra del mismo tamaño de Callao.
Para comparar los pesos al nacer, habiéndose verificado que la variable de estudio no tiene
distribución normal en Callao, se decide utilizar la prueba U de Mann-Whitney o suma de rangos de
Wilcoxon.

( ) Si en la prueba signo-rango de Wilcoxon, en una prueba unilateral, resulta z = 1,96, el valor de p


es 0,05.

( ) Las pruebas no paramétricas son solo alternativas de las pruebas paramétricas.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


217

( ) La prueba no paramétrica signo rango de Wilcoxon es una contraparte no paramétrica de la prueba


"t pareada".

( ) La siguiente hipótesis nula, HO: µ1 = µ2 (µ representa media aritmética poblacional), se contrasta


con la prueba suma de rangos de Wilcoxon.

( ) Se tomo una muestra de 30 recién nacidos de Cerro de Pasco y otra del mismo tamaño de Ica. Para
comparar los puntajes Apgar (escala ordinal) al minuto de nacimiento entre las dos poblaciones, se
decide utilizar la prueba suma de rangos de Wilcoxon.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


218

17. REGRESION Y CORRELACION LINEALES


SIMPLES

OBJETIVOS

1. Obtener, mediante el método de los mínimos cuadrados, la ecuación de la recta de mejor


ajuste.
2. Interpretar el coeficiente de regresión lineal.
3. Obtener e interpretar el coeficiente de correlación lineal de Pearson.
4. Llevar a cabo la prueba de hipótesis para el coeficiente de correlación lineal poblacional.
5. Interpretar el coeficiente de determinación.

LECTURA SUGERIDAS

 Daniel W. Bioestadística. Base para el análisis de las ciencias de la salud. 4ª ed. México.
Limusa Wiley; 2009
 Mendenhall W, Beaver B, Beaver R. Introducción a la probabilidad y estadística. 12a
ed. México: Thomson; 2008.
 Pagano M, Gauvreau K. Fundamentos. de Bioestadística. 2a ed. México: Thomson
Learning; 2001.

PRACTICAS

1. En cada caso graficar la recta que pasa por los puntos:

a. (0, 2) y (2. 6)

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


219

b. (0, 4) Y (2, 6)

c. (0. -2) y (-1, -6)

2. La ecuación de una línea recta es:

Y=a+bX

Si la línea pasa por el punto (O, 1), entonces x = 0, y = 1 debe satisfacer la ecuación. Es decir,

1 = a + b (0)

De forma similar, si una línea pasa por el punto (2, 3), entonces x = 2, y = 3 debe satisfacer la ecuación:

3 = a + b (2)

Utilizar estas dos ecuaciones para obtener los Valores de a y b, y con ellos la ecuación de la línea que
pasa por los puritos (0, 1) y (2, 3)

3. Encontrar las ecuaciones de las líneas que pasan por los puritos del ejercicio 1.

4. E1 electroencefalograma (EEG) es un dispositivo empleado para medir las ondas cerebrales. Los
neurólogos han observado que la frecuencia máxima de EEG en niños normales aumenta con la edad.
En un estudio, se pidió a 287 niños normales con edades entre 2 y 16 años sostener un peso de 65
gramos en la palma de su mano estirada durante un tiempo breve pero no especificado. Se registro la
frecuencia máxima de EEG (medida er1 Hertz) para cada niño. Los datos se agruparon según la edad
de los niños y se calculo la frecuencia máxima promedio para cada grupo de edades. Los datos
aparecen en la siguiente tabla.

Frecuencia máxima Frecuencia máxima


Edad en años promedio de EEG en Edad en años promedio de EEG en
Hertz (Y) Hertz (Y)
2 5,33 10 7,28
3 5,75 11 7,06

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


220

4 5,80 12 7,60
5 5,60 13 7,45
6 6,00 14 8,23
7 5,78 15 8,50
8 5,90 16 9,38
9 6,23

a. Elaborar un diagrama de dispersión con los datos. Después de examinar el diagrama, ¿cree que X
e Y están correlacionadas linealmente? Si hay correlación, ¿es positiva o negativa?

b. Calcular el coeficiente de correlación r e interpretar el resultado.

c. ¿X e Y están lineal y significativamente correlacionadas? Utilizar α = 0,05.

5. La exposición al humo de tabaco en el ambiente se ha asociado a la supresión del crecimiento y a


un incremento en la frecuencia de infecciones de las vías respiratorias en niños normales. ¿Esta
asociación es más pronunciada er1 niños que padecen fibrosis cística? Con el fin de contestar esta
pregunta, se estudiaron 43 niños (18 niñas y 25 niños) con fibrosis cística. Entre las variables que se
estudiaron estuvieron el percentil de peso del niño (Y) y el numero de cigarrillos fumados por día en
el hogar del niño (X).

a. Para las 18 niñas, el coeficiente de correlación fue: r= -0,50. Interpretar este resultado.

b. Respecto a la pregunta anterior. El valor de p para contrastar la H0: p = 0, se informo como p =


0,035. Interpretar este resultado.

c. Para los 25 niños, el coeficiente de correlación se informo como r = -0,12. Interpretar este resultado.

d. Respecto a la pregunta anterior. El valor de p para contrastar la H0: p = 0, se informo como p =


0,568. Interpretar este resultado.

6. Una muestra de 10 estudiantes de los cursos de Matemáticas y Estadística obtuvieron los siguientes
puntajes:

Matemáticas (x) 11 15 12 14 12 13 11 13 16 14

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


221

Estadística (y) 11 16 12 12 13 11 12 14 15 15

a. Obtener el diagrama de puntos. ¿Puede asociarse una recta a estos puntos?

b. Obtener la ecuación de regresión e interpretar la pendiente o coeficiente de regresión.

c. ¿Qué utilidad tiene esta ecuación de regresión?

d. Grafiqué la ecuación sobre los puntos y verifiqué el ajuste de la línea a los puntos.

e. Calcular e interpretar el coeficiente de correlación lineal de Pearson.

f. Obtener e interpretar el coeficiente de determinación.

g. E1 coeficiente de correlación lineal obtenido, ¿es estadísticamente significativo?

7. En una muestra de 12 trabajadores de una planta de fundición de plomo se encontraron los


siguientes datos:

Tiempo de servicio

(años) ( ) 8 12 10 15 7 9 11 16 10 15 16 8

Plomo den sangre

(µg/dl) ( ) 10 14 8 12 6 9 8 14 9 13 12 8

a. identificar y escribir entre paréntesis las variables X e Y.

b. Elaborar el diagrama de puntos. Describa el gráfico.

c. Obtener la ecuación de regresión lineal e interpretar la pendiente.

d. Graficar la recta de regresión sobre el diagrama de puntos.

e. Estimar, por punto, plomo en sangre para un trabajador con 13 años de servicio.

f. Calcular e interpretar el coeficiente de correlación de Pearson.

g. Obtener e interpretar el coeficiente de determinación.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


222

h. El coeficiente de correlación obtenido, ¿estaría indicando que entre estas dos variables existe una
correlación lineal estadísticamente significativa?

8. Un estudio sobre la relación entre la concentración del monóxido de carbono, en partes por millón
(Y) y la concentración del benzopireno, en microgramos por mil metros cúbicos de aire (X) en la
ciudad de Lima, arrojo los siguientes resultados:

b=0,1 ΣY= 1424,8 ΣX= 14300 n=26 r=0,52

a. Tomando en cuenta estos resultados, escribir la ecuación de regresión lineal.

b. Interpretar el coeficiente de regresión en términos de las variables de estudio.

c. ¿Qué porcentaje de la variabilidad total de Y queda explicada por la relación lineal existente entre
ambas variables?

d. ¿Están X e Y significativa y linealmente correlacionadas?

e. Estimar la concentración del monóxido de carbono, para una concentración de benzopireno de 550.

9. En un análisis de regresión y correlación lineales simples entre e1 número de cigarrillos fumados


por día (X) y frecuencia cardiaca en latidos por minuto (Y) en varones mayores de 40 anos, se
obtuvieron los siguientes resultados:

ΣX=3l ΣY=500 ΣX2=191 ΣY2=35936 ΣXY=23l6 n=7

a. Obtener la ecuación de regresión.

b. Interpretar el valor del coeficiente de regresión lineal.

c. Calcular el coeficiente de correlación de Pearson.

d. Interpretar el valor de r.

e. Determinar la significación estadística de r calculado.

f. Calcular e interpretar el coeficiente de determinación.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


223

10. Las siguientes son 15 lecturas sobre el volumen de tráfico y la concentración de monóxido de
carbono en un punto de muestreo de calidad de aire en una ciudad.

Volumen de tráfico (Autos/ h)

100 110 125 150 175 190 200 225 250 275 300 325 350 375 400

CO (ppm)

8,8 9,0 9,5 10,0 10,5 10,5 10,5 10,6 11,0 12,1 12,1 12,5 13,0 13,2 14,5

Cálculos auxiliares:

ΣX = 3550 ΣY = 167,8 ΣX2 = 974450 ΣY2 = 1915,36

ΣXY=41945 n= 15

a. Elaborar el diagrama de puntos y mencionar a que figura geométrica se ajustarían los puntos.

b. Obtener la ecuación de regresión correspondiente y graficarla sobre el diagrama.

c. Interpretar el coeficiente de regresión obtenido.

d. Estimar, puntualmente, la concentración de CO cuando transitan 235 automóviles por hora.

c. Calcular c interpretar el coeficiente de correlación correspondiente.

f. Calcular c interpretar el coeficiente de determinación.

g. Determinar si el coeficiente de correlación calculado es estadísticamente significativo.

MISCELÁNEAS

En las siguientes proposiciones señalar con X la alternativa correcta:

1. En la ecuación de regresión lineal si el valor de a (ordenada en el origen) es igual a cero, significa


que:

( ) La variable Y es independiente de X.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


224

( ) La recta es paralela al eje X.

( ) La recta pasa por el origen de las coordenadas.

2. En la ecuación de regresión lineal si el valor de b (pendiente de la recta) es igual a cero, significa


que:

( ) Conocer X no ayuda a predecir Y.

( ) El valor de a es cero también

( ) La recta pasa por el origen de las coordenadas.

3. Al obtener la ecuación de regresión lineal simple para las variables dosis de una anestesia en mM/kg
(X) y horas de duración de la anestesia (Y), resulto:

𝑌̂: 4,8 + 0,2X

El valor de b indica que:

( ) Cuando la dosis aumenta en un mM/kg, las horas de duración aumentan en 4,8 horas.

( ) Cuando la dosis aumenta en un mM/kg, las horas de duración aumentan en 0,2 horas.

( ) Cuando la dosis aumenta en 0,2 mM/kg, las horas de duración aumentan en una hora.

4. Con relación a la pregunta anterior, si la media aritmética de las dosis administradas es 10 mm/kg,
la media aritmética de la duración de la anestesia es:

( ) 6,8 horas.

( ) 4,8 horas.

( ) 2,0 horas.

5. Con relación a la pregunta 3, la ordenada en el origen (a):

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


225

( ) Se expresa en horas.

( ) Se expresa en mM /kg.

( ) No tiene unidades.

6. Con relación a la pregunta 3, el coeficiente de regresión (b) 0 pendiente de la recta:

( ) Se expresa en horas.

( ) Se expresa en horas/mM/kg.

( ) Se expresa en mM/kg

7. En el modelo típico de correlación, en el que ambas variables son aleatorias:

( ) Solo puede realizarse el análisis de correlación.

( ) Puede realizarse también el análisis de regresión.

( ) Para cada valor prefijado de X, existe uno o mas valores de Y.

8. Para determinar la fuerza o intensidad de la asociación entre niveles de plomo en sangre y


hemoglobina (linealmente relacionadas) en una muestra de escolares, se puede obtener:

( ) El valor de b (coeficiente de regresión).

( ) Chi—cuadrado como prueba de independencia.

( ) r de Pearson.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


226

9. Supongamos que en un análisis de correlación lineal con n = 26 se obtuvo un r = 0,52. Al determinar


la significación estadística de este coeficiente se obtuvo una t= 2,983, el valor de p y la conclusión
correspondientes, son:

( ) 0,0005 < p < 0,005. Las dos variables no están lineal y estadísticamente correlacionadas.

( ) 0,001 < p < 0,01. Las dos variables están lineal y estadísticamente correlacionadas.

( ) 0,001 < p < 0,01. Se rechaza la hipótesis nula.

10. Un coeficiente de regresión lineal igual a 1 indica que:

( ) Existe una función lineal positiva perfecta entre X e Y.

( ) La recta de regresión lineal es paralela al eje X.

( ) Cuando X se incrementa en una unidad, Y aumenta también en 1 unidad.

11. Un r2 = 80% indica que:

( ) La variabilidad total de X queda explicada en un 80% por la relación lineal existente entre ambas
variables.

( ) La variabilidad total de Y queda explicada en un 80% por la relación lineal existente entre ambas
variables.

( ) El 20% de los puntos se encuentra sobre la recta de regresión lineal.

12. El coeficiente de regresión lineal y el coeficiente de correlación de Pearson:

( ) Tienen signos diferentes.

( ) Tienen el mismo signo.

( ) E1 signo del coeficiente de correlación de Pearson siempre es positivo.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


227

13. Un r = 0,2 indica que:

( ) Existe una baja correlación entre ambas variables.

( ) La variabilidad total de Y queda explicada en un 20% por la relación lineal existente entre ambas
variables.

( ) Existe una baja correlación lineal y positiva entre ambas variables.

14. La técnica de regresión lineal simple (Modelo: Y = a + bX) permite:

( ) Determinar en cuanto varia Y cuando X aumenta en una unidad.

( ) Determinar la fuerza de la asociación entre dos variables cuantitativas.

( ) Determinar la forma o naturaleza de la asociación entre dos variables cualitativas.

15. El coeficiente de correlación lineal simple (r) expresa:

( ) La cantidad en la que varia Y cuando X se incrementa en una unidad.

( ) La cantidad en la que varia X cuando Y se incrementa en una unidad.

( ) La fuerza de la asociación entre dos variables cuantitativas linealmente relacionadas.

16. Para cada una de las siguientes ecuaciones, identificar la ordenada en el origen o intercepto (a) y
el coeficiente de regresión o pendiente (b):

Y = -2 + 3X a = ________________ b =___________________

2Y = 4X a = ________________ b = __________________

-Y = 0,5 + X a = ________________ b = __________________

3X+ 2Y = 5 a = ________________ b = _________________

Y=2 a = ________________ b = __________________

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


228

X=Y a = ________________ b = __________________

Marcar (V) verdadero 0 (F) falso para las 12 aseveraciones siguientes:

( ) Un grupo de investigadores está interesado en determinar la forma o naturaleza de la relación


entre concentraciones de plomo en sangre y niveles de hemoglobina en una población de niños. La
técnica estadística adecuada es el análisis de correlación.

( ) Un coeficiente de correlación de Pearson igual a -1 indica que los puntos no se ajustan a la recta
de regresión.

( ) Cuando el coeficiente de regresión se acerca a 1, el coeficiente de correlación se aproxima


también a 1.

( ) Si r es mayor que 1, la recta ajustada explica más que suficientemente la relación existente entre
X e Y.

( ) El coeficiente r = -0,44, significa que por cada incremento en una unidad de X, Y disminuye en
0,44 unidades.

( ) Si el coeficiente de regresión lineal es igual a uno, significa que existe una correlación lineal
perfecta y positiva entre X e Y.

( ) La ordenada en el origen (intercepto) tiene las mismas unidades que la variable Y.

( ) El signo de b siempre es igual al signo de a.

( ) El coeficiente de regresión lineal toma valores entre -1 y 1 inclusive.

( ) Bajo el modelo de correlación, se supone que X e Y varían conjuntamente en lo que se conoce


como distribución conjunta. Si la forma de la distribución conjunta sigue una distribución normal, se
conoce como distribución normal bivariada.

( ) En el modelo de correlación las dos variables son aleatorias.

( ) En el clásico modelo de regresión puede realizarse también con sentido el análisis de correlación.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


229

18. METODO DE MANTEL Y HAENSZEL Y


REGRESION LOGISTICA SIMPLE Y
MULTIPLE

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


230

OBJETIVOS

1. Expresar la utilidad del método de Mantel—Haenszel en el análisis de tablas de 2x2


2. Interpretar los coeficientes βi del modelo logístico simple y múltiple.
3. Identificar y expresar el concepto de un factor de confusión.
4. Interpretar el intervalo de confianza para OR

LECTURA SUGERIDAS

 Dawson B, Trapp R. Bioestadística médica. 4ta. ed. México: Manual Moderno; 2005
 Hernández M. Epidemiologia. Diseño y análisis de estudios. 1a ed. México: Editorial
Medica Panamericana; 2009
 Pagano M, Gauvreau K. Fundamentos. de Bioestadística. 2a ed. México: Thomson
Learning; 2001.
 Silva LC. Excursión a la regresión logística en ciencias de la salud. 1a ed. España:
Ediciones Díaz de Santos; 1995.

PRACTICAS

1. En dos estudios de casos y controles realizados en una ciudad norteamericana sobre factores de
riesgo de cáncer ovárico epitelial, los investigadores consideraron el no tener un embarazo concluido
como un posible factor de riesgo. Se elaboraron las siguientes tablas de contingencia de 2X2, donde:
Casos = pacientes con cáncer y controles = pacientes sin cáncer.

Estudio 1 Estudio 2
Embarazos Grupo Embarazos Grupo
Total Total
concluidos Casos Controles concluidos Casos Controles

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


231

Ninguno 31 93 124 Ninguno 39 74 113


Uno o mas 80 379 459 Uno o mas 149 465 614
Total 111 472 583 Total 188 539 727

a. Analizar estadísticamente la tabla del Estudio 1, ¿Qué conclusión obtiene sobre la posible relación
entre embarazo y cáncer ovárico epitelial? Calcule e intérprete, además, el valor de OR y el intervalo
de confianza para OR.

b. Analizar estadísticamente la tabla del Estudio 2, ¿Qué conclusión obtiene sobre la posible relación
entre embarazo y cáncer ovárico epitelial? Calcule e intérprete, además, el valor de OR y el intervalo
de confianza para OR.

c. ¿Es conveniente obtener una sola tabla de ambos estudios (sumando las tablas individuales) y sobre
esta base llegar a una conclusión definitiva acerca de la posible relación entre las dos variables
calculando un chi-cuadrado y el OR? Diga, porque si y porque no.

d. Si su respuesta en c) es no, ¿Cual es la mejor forma de determinar la relación entre embarazo y


cáncer ovárico epitelial considerando los resultados obtenidos en los dos estudios?

2. Un grupo de niños de cinco años de edad y menores sin problemas respiratorios se incluyeron en
un estudio de grupo para analizar la relación entre el habito de fumar de sus madres (se uso como
indicador el numero de cigarrillos fumados por día) y el consecuente desarrollo de asma. Se
examinaron por separado en niños y niñas la relación entre la clasificación del habito de fumar de la
madre y el diagnostico de asma antes de los doce años de edad.

Niños Niñas
Numero de Diagnostico de asma Numero Diagnostico de asma
cigarrillos Total de Total
Si No Si No
cigarrillos
≥½ 17 63 80 ≥½ 8 55 63
cajetilla cajetilla
/día /día

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


232

<½ 41 274 315 <½ 20 261 281


cajetilla cajetilla
/día /día
Total 58 337 395 Total 28 316 344

a. Calcule el índice de disparidad (OR) de desarrollar asma en niños cuyas madres fuman por lo menos
media cajetilla de cigarrillos diaria en función de los niños cuyas madres fuman menos.

b. Calcule el índice de disparidad (OR) correspondiente en las niñas.

c. Lleve a cabo una prueba de homogeneidad para determinar si es apropiado combinar la información
en las tablas de 2x2 con el método de Mantel—Haenszel. ¿Cuál es su conclusión?

d. Si es conveniente, determine una estimación puntual para el índice de disparidad de resumen (OR
ajustado) y construya un intervalo de confianza de 95%.

e. ¿Qué haría usted si los resultados de la prueba de homogeneidad lo llevan a rechazar la hipótesis
nula de que el índice de disparidad es idéntico en niños y niñas?

3. Se tiene interés en evaluar si el uso de anticonceptivos orales es un factor de riesgo del infarto
miocardio en mujeres casadas menores de 45 años de edad. Para tal efecto se realiza un estudio
analítico de casos y controles y se obtienen los siguientes resultados:

Pacientes
USO DE Con infarto miocardico Sin infarto miocardico
ANTICONCEPTIVOS (Casos) (Controles)
ORALES
Si 23 34
Nunca 35 132
TOTAL 58 166

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


233

Usando los resultados obtenidos con el paquete estadístico SPSS, que se presentan en la tabla
siguiente, se pide:

a. ¿Cuánto es el valor de OR? Interpretar el resultado.

b. Al contrastar la hipótesis H0: β1 = 0 mediante la prueba de Wald, ¿qué valor de p se obtuvo? ¿Cua1
es la conclusión?

c. Interpretar el intervalo de Confianza del 95% para OR

Variables in the Equation

95.0% C.I. for


Exp
B S.E. Wald df Sig. EXP(B)
(B)
Lower Upper
Step UsoAnt ,937 ,330 8,045 1 ,005 2,551 1,336 4,873
1° Constant -1,356 ,192 49,745 1 ,000 ,258

4. Se realizo un estudio para determinar, mediante el modelo de regresión logística múltiple, los
factores asociados a la enfermedad cardiovascular (ECV) en pacientes hipertensos en un consultorio
de Cardiología. Como parte del estudio se recolectaron datos relacionados con edad, sexo, obesidad
y colesterol, se reunieron los datos a partir de una muestra aleatoria simple de 240 pacientes.

En base a los resultados que proporciona el paquete estadístico SPSS, que se muestran a continuación,
se pide:

a. Identificar e interpretar los parámetros de la regresión logística múltiple y escribir la ecuación de


la regresión estimada.

b. Identificar e interpretar los valores de OR para cada variable independiente

c. Interpretar los intervalos de confianza del 95%, para los OR calculados.

Resultados obtenidos con el paquete SPSS.

Resumen del procesamiento de los casos

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


234

Casos no ponderados N Porcentaje


Casos seleccionados Incluidos en el análisis 240 100,0
Casos perdidos 0 ,0
Total 240 100,0
Casos no seleccionados 0 ,0
Total 240 100,0
a. Si esta activada la ponderación, consulte la tabla de clasificación para ver el número total de casos.

I.C. 95.0% para


Exp
B S.E. Wald df Sig. EXP(B)
(B)
Inferior Superior
edad ,116 ,023 26,468 1 ,000 1,123 1,075 1,174
colester 0,41 ,006 48,162 1 ,000 1,042 1,030 1,054
Paso Obesid 1,306 ,466 7,865 1 ,005 3,692 1,482 9,199
1° Sexo 1,288 ,487 6,984 1 ,008 3,624 1,395 9,417
-21,056 2,718 60,031 1 ,000 ,000
Constante

MISCELÁNEAS

Marcar la alternativa correcta en las siguientes aseveraciones

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


235

1. A su más simple nivel, la confusión (confounding) puede ser considerada:

a. Una mezcla de efectos.

b. Un fenómeno que solo se presenta en los estudios experimentales.

c. Un fenómeno que no puede ser controlado por el investigador.

d. Un fenómeno que solo se presenta en los estudios observacionales.

2. Una definición más refinada del fenómeno de confusión es:

a. Una mezcla entre muchas variables, todas ellas interactuando entre si.

b. Una superposición del efecto de un factor de riesgo, extraño ("confusor"), sobre la estimada
relación existente entre la exposición que se estudia y la enfermedad que resulta.

c. Una distorsión que el factor de confusión ejerce, en una relación exposición enfermedad, sobre la
exposición pero no sobre la enfermedad.

d. Una distorsión que el factor de confusión ejerce, en una relación exposición enfermedad, sobre la
enfermedad pero no se relaciona con la exposición.

3. La distorsión introducida por un factor de confusión puede llegar a ser grande y:

a. Puede conducir a la sobreestimación de un efecto.

b. Puede conducir a la subestimación de un efecto.

c. Puede cambiar la dirección aparente de la asociación. (Paradoja de Simpson)

d. Todas las anteriores.

4. Un factor para que sea considerado de confusión debe:

a. Ser un factor de riesgo de enfermedad entre los no-expuestos.

b. Estar asociado con la variable de exposición en la población de la cual proviene el caso

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


236

c. No ser un paso intermedio en el camino causal entre la exposición y la enfermedad.

d. Todas las anteriores.

5. Para que un factor extraño confunda, debe tener un efecto, es decir:

a. Debe ser predictivo de la ocurrencia de la enfermedad.

b. Es necesario que tal efecto sea causal.

c. Debe ocurrir después de la enfermedad.

d. Debe ocurrir al mismo tiempo que la enfermedad.

6. La prueba de Mantel y Haenszel se usa para:

a. Relacionar dos o más variables dicotómicas.

b. Relacionar dos variables dicotómicas controlando el efecto de otra variable.

c. Relacionar simultáneamente tres variables dicotómicas.

d. Ninguna de las anteriores.

Contestar si (S) o no (N) a las siguientes aseveraciones:

7. ( ) En esencia, el análisis estratificado mediante la prueba de Mantel y Haenszel consiste en la


clasificación de la información obtenida referente a la asociación estudiada entre exposición y
enfermedad (X → Y) por categorías o estratos de una tercera variable (Z), con el fin de ver si esta
modifica el valor de la asociación a medida que varía.

8. ( ) Un criterio practico importante que indica la presencia de confusión en una cierta medida de
asociación es la existencia de una diferencia entre una medida ajustada y la medida cruda.

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


237

9. ( ) Los sesgos de confusión se deben controlar mediante un diseño adecuado del estudio y si no
es así ya no se pueden controlar.

10. ( ) El método de Mantel y Haenszel es una estrategia para la obtención de una medida de
asociación libre de confusión o ajustada.

11. ( ) Si la variable respuesta de interés (VD) es binaria en lugar de continua y la independiente


(VI) es continua, entonces se podrá aplicar regresión lineal simple.

12. ( ) Se puede crear un modelo de regresión lineal simple, cuando la variable de respuesta (VD)
de interés es binaria utilizando la probabilidad de éxito como resultado.

𝑒 𝛼+𝛽𝑥
13. ( ) La función logística simple es:
1+𝑒 𝛼+𝛽𝑥

14. ( ) Se puede suponer que la relación entre ln (p/1 - p) y la variable X, en una relación bivariada,
es lineal.

15. ( ) Podemos aplicar el método de los mínimos cuadrados para obtener los parámetros α y β del
modelo logístico simple.

16. ( ) En un diseño de casos y controles para identificar factores de riesgo, se usara regresión
logística múltiple.

Supongamos que nos interesa la identificación de factores que influyen en la probabilidad de que un
niño con bajo peso al nacer sufra una hemorragia cerebral. La hemorragia es una variable aleatoria
binaria que toma el valor 1 si el evento ocurre y O si no ocurre. Utilizamos una muestra de 100 niños
con bajo peso al nacer del Instituto Materno Prenatal (IMP), para determinar la probabilidad de una
hemorragia.

Para comenzar, nos gustaría determinar si la circunferencia de la cabeza de un niño influye en la


probabilidad de que sufra una hemorragia cerebral. Como la respuesta es binaria, formulamos un
modelo de regresión logística simple de la forma:

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


238

ln [p/1 - p]=α + β1 X1,

Donde X1 representa la circunferencia de la cabeza.

Los valores de α y β1 fueron obtenidos, con los que se obtuvo la ecuación de regresión logística simple
siguiente:

ln [p/1 - p]=1,193 – 0,1117 X1,

Contestar preguntas 17 - 20:

17. ( ) El coeficiente B1 implica que por cada incremento de un centímetro en la circunferencia de


la cabeza, el OR de sufrir hemorragia cerebral disminuye 0,1117 en promedio.

18. ( ) El valor de OR de sufrir una hemorragia asociado a un incremento de un centímetro de la


circunferencia, es 0,89.

19. ( ) La probabilidad de que un niño de 28 centímetros de circunferencia de cabeza sufra una


hemorragia cerebral, es 0,126.

20. ( ) Al calcular los límites del intervalo de confianza para OR de la pregunta 18, se encontró: IC
95% (0,71; 1,12), esto implica que, se rechaza la H0: βl = 0 y que la probabilidad de sufrir de
hemorragia cerebral varia según la circunferencia de la cabeza de un niño.

En los siguientes casos, señalar entre paréntesis si (S) e1 factor que se menciona es de confusión o no
(N) entre la exposición y la enfermedad:

Caso Exposición Enfermedad Factor


A Consumo de licor Cáncer de esófago Consumo de tabaco ( )
B Asbesto Cáncer pulmonar Edad ( )
C Anticonceptivo orales Enfermedad coronaria Hipertensión ( )
D Consumo de café Cardiopatía isquémica Consumo de cigarrillos ( )
E Anticonceptivo orales Infarto de miocardio Edad ( )

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica


239

RESPUESTAS

Mg.José Antonio Boza Rosario Bioestadística Tecnología Medica

Você também pode gostar