Escolar Documentos
Profissional Documentos
Cultura Documentos
FACULTAD DE MEDICINA
ESCUELA DE BIOANLISIS
CATEDRA DE MATEMATICA Y BIOESTADSTICA
BIOESTADSTICA I
CARCTER: Terico-Prctico
CONDICIN: Obligatoria
CRDITOS: 4 (3 Tericos 1 Prctico)
UBICACIN: I Semestre
INDICE
CAPTULO I ______________________________________ 6
Qu es la Estadstica? __________________________________________________6
Concepto e importancia de la Bioestadstica __________________________________6
Partes de la Estadstica __________________________________________________6
CAPTULO II _____________________________________ 7
Estadstica Descriptiva ___________________________________________________7
Mtodos estadsticos _________________________________________________________ 7
La fuente de datos __________________________________________________________ 7
Caractersticas a las cuales se refieren los datos __________________________________ 8
Formas de medicin ________________________________________________________ 8
Formas de recoleccin de datos _______________________________________________ 9
Formas de representacin de los datos _________________________________________ 9
Distribucin de frecuencias _________________________________________________ 9
Grficas _______________________________________________________________ 14
Medidas de Tendencia Central _________________________________________________ 18
Media Aritmtica __________________________________________________________ 18
Propiedades de la Media Aritmtica _________________________________________ 19
Ventajas del uso de la Media Aritmtica ______________________________________ 21
Desventajas del uso de la Media Aritmtica ___________________________________ 21
La Mediana ______________________________________________________________ 22
Propiedades de la Mediana ________________________________________________ 24
Ventajas del uso de la Mediana _____________________________________________ 24
Desventajas del uso de la Mediana __________________________________________ 24
La Moda _________________________________________________________________ 27
Propiedades de la Moda __________________________________________________ 28
Relacin de las Medidas de Tendencia Central ________________________________ 29
Medidas de Posicin _________________________________________________________ 27
Percentiles _______________________________________________________________ 27
Deciles __________________________________________________________________ 28
Cuartiles_________________________________________________________________ 28
Propiedades. ___________________________________________________________ 29
Medidas de Dispersin _______________________________________________________ 33
Desviacin Tpica _________________________________________________________ 33
Caractersticas de la Desviacin Tpica_______________________________________ 34
Varianza_________________________________________________________________ 35
Desviacin Media _________________________________________________________ 36
Rango Cuartlico __________________________________________________________ 37
Caractersticas del Rango Cuartlico _________________________________________ 37
Coeficiente de Variacin ____________________________________________________ 38
Medidas de Forma __________________________________________________________ 42
Sesgo___________________________________________________________________ 42
Caractersticas del Sesgo _________________________________________________ 43
Curtosis _________________________________________________________________ 44
Aplicacin: Diagrama de Caja __________________________________________________ 48
Clsica___________________________________________________________________ 522
Estadstica ________________________________________________________________ 522
Particiones ___________________________________________________________60
Teorema de Bayes _____________________________________________________60
Sensibilidad, Especificidad y Valores que Predicen Positividad y Negatividad _______67
Sensibilidad ________________________________________________________________ 67
Especificidad _______________________________________________________________ 67
Valor predictivo positivo ______________________________________________________ 68
Valor predictivo negativo ______________________________________________________ 68
CAPTULO IV ____________________________________ 79
Inferencia Estadstica ___________________________________________________79
Muestreo Estadstico ___________________________________________________79
Ventajas del Muestreo __________________________________________________80
Limitaciones del Muestreo _______________________________________________80
Distribuciones muestrales _______________________________________________81
Teorema del Lmite Central____________________________________________________ 81
Distribucin de la Media Muestral _______________________________________________ 82
La poblacin tiene distribucin _______________________________________________ 82
La distribucin de la poblacin tiene media pero no se conoce la varianza _______ 83
Distribucin muestral de proporciones. (poblacin finita) ___________________________ 83
Distribucin muestral de las diferencias __________________________________________ 84
Distribucin muestral de la diferencia de medias _________________________________ 84
CAPTULO I
Qu es la Estadstica?
La palabra Estadstica proviene del latn status. En la antigedad chinos,
egipcios, hebreos, griegos y romanos la practicaban en recuentos de poblacin y
riquezas. Con el tiempo se perfeccion mediante mtodos matemticos y
probabilsticos hasta generalizar su estudio y uso a cualquier actividad cientfica.
La Estadstica es la ciencia o conjunto de mtodos cientficos que tienen por
objeto la recoleccin, agrupacin, presentacin, anlisis e interpretacin de los
datos obtenidos de una poblacin o muestra, como medio para hacer
estimaciones e inferencias para la toma de decisin ante diversas alternativas.
Partes de la Estadstica
La Estadstica se divide en dos partes:
E. Descriptiva
Estadstica
E. Inferencial
CAPTULO II
Estadstica Descriptiva
Como se expres anteriormente, esta parte de la Estadstica se caracteriza
por la recoleccin de datos, agrupacin, presentacin, anlisis e interpretacin de
datos obtenidos de una poblacin o muestra. Estudiaremos los siguientes
aspectos:
Mtodos Estadsticos.
Medidas de Tendencia Central.
Medidas de Posicin.
Medidas de Dispersin.
Medidas de Forma.
Analicemos cada uno de estos aspectos.
Mtodos estadsticos
Est constituido por los siguientes puntos:
La fuente de datos
Para estudiar un determinado comportamiento o caractersticas existentes
de un conjunto de elementos (datos) que integran una poblacin (conjunto
de individuos, objetos o acontecimientos definidos con relacin a algn
rasgo en comn que los identifique). Puede considerarse un censo, en el
que se investigan todos y cada uno de los elementos de la poblacin o bien
una muestra en el que se investiga un subconjunto de la poblacin y se
escogen al azar de modo tal que ellos sean representativos de la poblacin.
Estadsticamente hablando, el tamao de la poblacin se denota por N y el
tamao de la muestra por n.
Poblacin
Muestra
Estadstica descriptiva
Estadstica descriptiva
Estadstica Inferencial
Variable
Cualitativa
Nominal
Ordinal
Cuantitativa
Discreta
Continua
Formas de medicin
Depende de la naturaleza y comportamiento de la variable.
Escala nominal
Variable cualitativa
Escala ordinal
Variable cuantitativa
Escala numrica
Ttulo
Encabezado
Columna
Matriz
Total
Fuente de datos
Cuerpo
10
Datos sin agrupar: Cada uno de los datos aparece con sus
frecuencias.
11
S
1
L + LI
2 S1
2
Ejemplo:
Lmites aparentes
60 62
63 65
Lmites reales
[59.5 - 62.5)
[62.5 65.5)
Xi =
Li +Ls
2
12
82
92
85
88
92
92
88
90
90
92
85
88
95
90
90
90
86
96
fi
%fi
fa
%fa
1
1
2
3
6
4
2
1
20
5
5
10
15
30
21
10
5
100
1
2
4
7
13
17
19
20
5
10
20
35
65
85
95
100
13
A =
R
Nmero de int ervalos
82
84
96
90
90
104
95
96
123
101
102
89
112
114
93
121
121
99
132
138
140
87
Rango =140 75 = 65 mg / dl
14
65
= 11.52
5.6411608
Lri Lrs
(mg/dl)
74.5 86.5
86.5 98.5
98.5 110.5
110.5 122.5
122.5 134-5
134.5 146.5
fi
%fi
fa
%fa
Xi
3
10
4
4
2
2
25
12
40
16
16
8
8
100
3
16
17
21
23
25
12
52
66
84
92
100
80.5
92.5
104.5
116.5
128.5
140.5
Grficas
Representacin de datos numricos por medio de coordenadas o
dibujos que hacen visible la relacin o gradacin que esos datos
guardan entre s. Permiten visualizar mejor las variaciones de las
variables. Dividiremos los tipos de grficos dependiendo de la forma
como estn dados los datos.
Datos Cualitativos
15
Datos ordinales
fi
fi
cualidad
Nios
Jvenes
Adultos
fi
25
20
15
10
5
0
hembras
varones
Neumona
Paperas
Rubeola
Sarampin
Varicela
Enfermedades
ENF. CER-VAS
DIABETES
NEFRITIS
EPILEPSIA
16
Datos Cuantitativos
Datos sin agrupar
fi
X1
X2
X3
X4
Fi o Hi
X1
X2
X3
X4
17
Datos agrupados
fi
L1
L2
L3
L4
fi
L0
L1
L2
L3
L4
L5
Fi o Hi
L0
L1
L2
L3
L4
18
n
xi
x + x + L + xn
i =1
2
X=
= 1
n
n
donde x i corresponde al valor de la variable en el individuo i , para
y n es el nmero de datos.
i = 1,2,..., n
Ejemplo: Se desea calcular la media de los nmeros 2, 5, 6, 8 y 4.
X =
2 + 5 + 6 + 8 + 4 25
=
=5
5
5
Datos agrupados
En el caso de que los datos esten agrupados, la media aritmtica
viene expresada por la frmula
n
X=
f i xi
i =1
19
fi
Xi
fi Xi
2
7
4
3
12
9
4
4
2
3
50
1.465
1495
1.525
1.555
1.585
1.615
1.645
1.675
1.705
1.735
2.930
10.468
6.100
4.665
19.02
14.535
6.58
6.700
3.410
5.205
79.61
As:
x=
79.61
= 1.59 m
50
'
= X +k
20
X '= cX
n x + n x + n x +L + n x
2 2
3 3
k k
X= 1 1
n + n + n +L+ n
1
2
3
k
Ventajas del uso de la Media Aritmtica
21
La Mediana
La Mediana es el valor de la variable que equidista de ambos
extremos de la distribucin cuando est ordenada de manera creciente, es
decir, es el valor que deja por debajo de l el 50% de los datos,
consecuentemente por encima de la mediana se halla el 50% de los datos.
El valor de la mediana puede coincidir o no con un valor de la serie de
datos.
Md = X n +1
2
Md =
X n + X ( n + 2)
2
2,2,3,4,5,6,8
22
Datos agrupados
En este caso, la mediana se obtendr mediante la frmula siguiente:
Md = Li +
(n 2 ) F
( ant )
fi
.A
donde:
n = Nos da la posicin aproximada de la mediana en la distribucin,
2
de acuerdo al nmero de datos que se disponga.
fi
Xi
fa
2
7
4
3
12
9
4
4
2
3
50
1.465
1495
1.525
1.555
1.585
1.615
1.645
1.675
1.705
1.735
2
9
13
16
28
37
41
45
47
50
23
Md = 1.57 +
25 16
0.03 = 1.59m
12
Propiedades de la Mediana
24
La Moda
La Moda se define como el valor que tiene ms frecuencia en una
serie de datos. Puede que no exista o bien que existan varios valores
candidatos a ser moda.
Datos agrupados
Mo = L i +
1
.A
1 + 2
25
fi
Xi
fa
2
7
4
3
12
9
4
4
2
3
50
1.465
1495
1.525
1.555
1.585
1.615
1.645
1.675
1.705
1.735
2
9
13
16
28
37
41
45
47
50
Mo = 1.57 +
12 3
12 3 + 12 9
0.03 =1.59m
26
X = Mo = Md
Si
la
distribucin
es
asimtrica,
puede
Mo < Md < X
Mo Md
Md
Mo
ocurrir
que
27
Medidas de Posicin
Las medidas de posicin son medidas estadsticas que dividen la
distribucin de los datos en partes iguales y describen la posicin que tiene
un dato dentro de una distribucin, una vez que se ordena de forma
creciente. Estudiaremos los Percentiles, Deciles y Cuartiles.
Percentiles
Son valores que dividen la distribucin en 100 partes iguales y nos
dan la situacin de los datos segn el lugar que ocupan en tanto por
ciento. Son 99 y se denotan por P1 , P2 ,..., P99 . As Pk corresponde al
aquel valor que supera al k % de datos a lo ms y a la vez es superado
por el (100 k )% de los datos a lo mximo.
Datos agrupados.
El percentil ser hallado mediante la siguiente frmula:
Pk = Li +
k .n
F
100 ( ant ) A
fi
donde:
k .n
100
ubicado el percentil.
f i = frecuencia absoluta de la clase donde est ubicado el percentil.
A = amplitud real del intervalo.
28
Deciles
Son valores que dividen la distribucin en 10 partes iguales, son 9 y
se denotan por D1 , D2 ,..., D9 . As D2 por ejemplo, corresponde a
aquel valor que supera al 20% de datos a lo ms y a la vez es superado
por el 80% de los datos a lo mximo.
k .n
10
Datos agrupados
Dk = Li +
k .n
10
F( ant )
fi
donde:
k .n
10
ubicado el decil.
Cuartiles
Son valores que dividen la distribucin en 4 partes iguales, son 3 y se
denotan por Q1 , Q2 , Q3 . As Q1 por ejemplo, corresponde a aquel valor
29
que deja por debajo de l, el 25% de datos y a la vez deja por encima el
75% de los datos.
k .n
4
Datos agrupados
k .n F
4 ( ant ) A
Qk = Li +
fi
donde:
k .n = indica la posicin donde est ubicado el cuartil.
4
ubicado el cuartil.
f i = frecuencia absoluta de la clase donde est ubicado el cuartil.
A = amplitud real del intervalo.
Propiedades.
Se cumple que:
30
Q1 = P25
Q3 = P75
Q2 = Me = P50
P10 = D1
P20 = D 2
P90 = D9
fi
6
10
25
18
12
7
2
fa
6
16
41
59
71
78
80
o Calcule P60
La posicin de este percentil es F60 =
60 x 80
= 48 .
100
o Calcule Q3 .
La posicin de este cuartil es F3 =
3 x 80
= 60 .
4
9 x 80
= 72 .
10
31
fi
fa
2
7
4
3
12
9
4
4
2
3
50
2
9
13
16
28
37
41
45
47
50
o Calcular P66
En principio calculamos la posicin del percentil, F66 =
66 x 50
= 33
100
As tenemos que
P66 = 1.60 +
33 2
x0.03 = 1.62m
9
o Calcular Q1
En principio calculamos la posicin del cuartil, F1 =
1 x 50
= 12.5
4
32
As tenemos que
Q1 = 1.51 +
12.5 9
x0.03 = 1.54m
4
o Calcular D3
En principio calculamos la posicin del decil, D3 =
As tenemos que
D3 = 1.54 +
15 13
x0.03 = 1.56m
3
3 x 50
= 15
10
33
Medidas de Dispersin
Las Medidas de Tendencia Central o de Localizacin dan una visin
del grupo, pero la misma es incompleta. Ellas dan informacin acerca del
centro de los datos pero no qu tan dispersos son los mismos.
Para complementar las medidas de tendencia central se usan las
medidas de variabilidad, ellas miden la dispersin de los datos alrededor de
la medida de localizacin usada.
Las medidas de variabilidad indican qu tan diseminados son los
datos del grupo al cual se le calcula la medida. Si un grupo tiene una baja
variabilidad esto indica que est compuesto por individuos
aproximadamente iguales, los datos estn poco esparcidos, estn bastante
agrupados. La mayora de los puntajes estarn alrededor de la medida de
tendencia utilizada. En este caso se dice que los individuos poseen
caractersticas homogneas.
Pero si la variabilidad es alta, los puntajes estarn dispersos, los
individuos u objetos que conforman el grupo sern dismiles. En este caso
se dice que los individuos poseen caractersticas heterogneas.
Desviacin Tpica
La Desviacin Tpica es una medida que da una mejor idea de cmo
los datos se dispersan de la media. La Desviacin Tpica mide cmo los
datos difieren de la Media Aritmtica.
S=
( x i X )
i =1
(x X)
i
S = i =1
n
34
S=
( x i X )
i =1
n 1
Datos agrupados
La frmula a utilizar es:
(x X)
i
S = i =1
n
en donde
35
Varianza
S 2=
( x i X )
i =1
2
( x X ) fi
i
S 2 = i =1
n
( x i X )
S 2 = i =1
n 1
36
Datos agrupados
La frmula es:
2
( x X ) fi
i
S 2 = i =1
n
Desviacin Media
Es la desviacin que presenta los datos con respecto a la mediana o
a la media aritmtica. Se usa usualmente cuando las desviaciones
extremas influyen en la desviacin tpica.
n
i =1 x i X
D.M . =
n
D.M . = i = 1
x i X fi
n
37
Datos agrupados
Se calcula mediante la frmula:
D.M . = i = 1
en donde
x i X fi
n
Rango Cuartlico
Esta medida se basa en el cuartil 1 y cuartil 3, por lo que excluye el
25% inferior de los datos y el 25% superior de los mismos. Esto indica que
el rango cuartlico mide la concentracin de los datos en el 50% central de
los mismos. El Rango Cuartlico expresa la distancia entre Q1 y Q3 ,
RQ = Q3 Q1
En la medida que esa distancia sea menor, mayor ser la
concentracin del 50% central de los datos. Si la distancia entre Q1 y Q3 es
mayor, entonces hay una mayor dispersin del 50% central de los datos.
Caractersticas del Rango Cuartlico
38
Coeficiente de Variacin
Las medidas de variabilidad en general se expresan en las mismas
unidades de los datos. A menudo es deseable comparar la variabilidad
cuando las unidades de medicin son diferentes. As el Coeficiente de
Variacin es un ndice de variabilidad que permite comparar el grado de
dispersin entre distribuciones con respecto a la media aritmtica. Nos
permite expresar el grado de homogeneidad del grupo de datos
considerados en su conjunto. Su frmula es:
CV =
S
X
100%
fi
Fa
( X i X ) 2 fi
Xi X
X i X fi
100
105
115
120
123
135
220
TOTALES
6
10
25
18
12
7
2
80
6
16
41
59
71
78
80
2166
1960
400
18
192
1792
20402
26930
19.33
14.33
4.33
0.67
3.67
15.67
100.67
115.98
143.30
108.25
12.06
44.04
109.69
201.66
734.66
39
2
(x X) f
i
i
i
=
1
S=
n
26930
S=
= 336.62 = 18 Bs
80
o Varianza
2
2
Directamente se tiene que S = (18Bs ) = 324 Bs
2
o Desviacin media
Se tiene que
D.M . =
xi X f i
n
734.66
= 9 Bs.
80
o Rango Cuartlico.
Calculamos Q1 y Q3 . Para ello debemos hallar primero F1 y F3 .
F1 =
1 x 80
= 20 , esto implica que Q1 = 115 Bs.
4
F3 =
3 x 80
= 60 , esto implica que Q3 = 123 Bs.
4
Por lo tanto:
RC = Q3 Q1 =123 115 = 8 Bs
40
o Coeficiente de Variacin
Se obtiene que
C.V . =
18 Bs
x100% = 15%
119 Bs
fi
fa
Xi
Xi f i
( X I X ) 2 fi
X i X fi
2
7
4
3
12
9
4
4
2
3
50
2
9
13
16
28
37
41
45
47
50
1.465
1.495
1.525
1.555
1.585
1.615
1.645
1.675
1.705
1.735
2.93
10.46
6.10
4.66
19.02
14.53
6.58
6.70
3.41
5.20
79.59
0,031
0,063
0,017
0,004
0,000
0,006
0,012
0,029
0,026
0,063
7,876
0.250
0.665
0.260
0.105
0.060
0.225
0.220
0.340
0.230
0.435
2.790
79.59
= 1.59m
50
41
o Varianza
De forma directa se tiene que S = (0.40 ) = 0.16m
2
o Desviacin media
Se tiene que D.M . =
2.79
= 0.0558m
50
o Rango Cuartlico
Calculamos Q1 y Q3 . Para ello debemos hallar primero F1 y
F3 .
F1 =
y
F3 =
1x50
12.5 9
= 12.5 , por lo que Q1 = 1.51 +
x0.03 = 1.54m
4
4
3 x50
37.5 37
= 37.5 , por lo que Q3 = 1.63 +
x0.03 = 1.63m
4
4
o Coeficiente de Variacin
Se encontr que el C.V . =
0.40m
x100% = 25%
1.59m
42
Medidas de Forma
Una distribucin queda bien caracterizada mediante la tendencia
central y la variabilidad, pero quedar mejor si stas medidas son
acompaadas con medidas que describan la asimetra y apuntamiento de la
distribucin.
Sesgo
Las curvas que representan las observaciones de datos
pueden ser simtricas o asimtricas (sesgadas). El Sesgo es un
indicador que mide el grado de asimetra o falta de simetra de una
distribucin.
As, el sesgo viene dado por la frmula: Sesgo =
X Mo
S
Figura 1
X = Mo = Md
Si la acumulacin de datos se encuentra hacia los valores
bajos de la caracterstica estudiada, se dice que la asimetra es
positiva.
Figura 2
Mo Md
43
Figura 3
Md
Mo
Sesgo de Pearson:
Sesgo =
3 (X Me )
para n mayor que 50
S
Q3 2Q2 + Q1
Q3 Q1
Sesgo =
Sesgo Percentlico:
Sesgo =
Sesgo =
M3
S3
44
(x
Mk =
donde
X )k
n
es
la
frmula
de
los
Mk =
(x
i =1
X )k fi
n
K=
M4
S4
K3
K=
Q3 Q1
2(P90 P10 )
K 0.263
45
fi A
fi B
10
4
15
9
8
4
7
12
8
3
Determine:
a) El grado de variabilidad de cada muestra.
b) El grado de asimetra de cada muestra.
c) En funcin de los resultados anteriores, se podr afirmar que la cantidad de
ingesta de leche diaria influye en los contenidos de calcio en la sangre.
Calculamos cada uno de los estadgrafos para ambos grupos:
Cantidad de calcio (mg/dl) en sangre de nios escogidos aleatoriamente
del grupo A de la Escuela Bicentenaria
Nivel de calcio
(mg/dL)
Li Ls
Li Ls
7.1 7.6
7.7 8.2
8.3 8.8
8.9 9.4
9.5 10.0
Total
7.05 7.65
7.65 8.25
8.25 8.85
8.85 9.45
9.45 10.05
fi
Fa
Xi
10
4
15
9
8
46
10
14
29
38
46
7.35
7.95
8.55
9.15
9.75
( X I X ) 2 fi
15,625
1,69
0,0375
2,7225
10,58
30,655
46
El valor de la media es X =
393.90
= 8,6mg / dl
46
La desviacin tpica es S =
30.655
= 0.8mg / dl
46
De este modo,
0. 8
C.V . =
x100% = 9%
8.6
el
grado
de
variabilidad
obtenido
es
de
8.56 8.63
= 0.08
0.84
Li Ls
Li Ls
7.1 7.6
7.7 8.2
8.3 8.8
8.9 9.4
9.5 10.0
Total
7.05 7.65
7.65 8.25
8.25 8.85
8.85 9.45
9.45 10.05
fi
Fa
Xi
4
7
12
8
3
34
4
11
23
31
34
7.35
7.95
8.55
9.15
9.75
( X I X ) 2 fi
6,25
2,9575
0,03
2,42
3,9675
15,625
El valor de la media es X =
290.10
= 8.5mg / dl
34
La desviacin tpica es S =
15.625
= 0.5mg / dl
34
47
C.V . =
0.5
x100% = 6%
8. 5
8.53 8.58
= 0.07
0.70
48
49
P90
P10
< Q1 + 3RQ
Q! + 3RQ
50
1.56
1.64
1.65
1.68
1.69
1.56
1.64
1.65
1.68
1.69
1.62
1.65
1.65
1.68
1.69
1.62
1.65
1.67
1.68
1.70
1.63
1.65
1.67
1.68
1.70
1.63
1.65
1.67
1.69
1.70
1.64
1.65
1.68
1.69
1.70
1.64
1.65
1.68
1.69
1.71
1.64
1.65
1.68
1.69
1.90
1,9
1,8
1,7
1,6
7
8
25
1,5
N=
50
ESTATURA
51
52
CAPTULO III
Probabilidades
El problema central de la Estadstica es el manejo del azar y la
incertidumbre. Los eventos aleatorios siempre se han considerado como
misteriosos. Los avances cientficos de los siglos que siguieron al Renacimiento,
enfatizando la observacin y la experimentacin cuidadosa, dieron lugar a la
Teora de Probabilidad para estudiar las leyes de la naturaleza y los problemas de
la vida cotidiana.
Las estadsticas reemplazan las palabras imprecisas pudo ser, casi con
seguridad, por un nmero que va de 0 a 1; esto indica una forma ms precisa de
qu tan probable o improbable es un evento.
En el campo mdico los conceptos de probabilidad son tiles para
comprender e interpretar datos presentados en cuadros y grficas de informes
publicados, adems, permiten hacer enunciados acerca de cunta es la confianza
que se tiene en estimaciones de medias, proporciones y/o riesgos relativos.
Definicin de Probabilidad
Clsica
La probabilidad que se d un fenmeno determinado es igual al cociente
entre el nmero de casos favorables al fenmeno y el nmero total de
casos posibles.
Estadstica
La probabilidad estimada de un suceso se toma como la frecuencia relativa
de la aparicin del suceso, cuando n es muy grande.
Conceptos Bsicos
Experimentos aleatorios
Hay experimentos en los cuales los resultados no son esencialmente
los mismos a pesar de que las condiciones sean aproximadamente
idnticas; estos experimentos son denominados aleatorios. Para ello, es
necesario que se satisfagan las siguientes condiciones:
a)
b)
53
c)
Espacio
muestrales)
Muestral
Universo
(conjunto
de
puntos
Sucesos o Eventos
Es un subconjunto del espacio muestral. Los eventos son denotados
por (A, B, C,...). Si un suceso contiene un solo punto muestral, lo
llamaremos suceso simple, en cambio que si contiene 2 o ms puntos
muestrales, lo llamaremos suceso compuesto.
54
Luego:
S = { () , ( ) , ( ) , () }
Ejemplo 3: En el caso del lanzamiento
de un dado (experimento), encontramos
como espacio muestral a S = { 1,2,3,4,5,6 }
El caso de un evento
Si en un espacio muestral tenemos un nmero finito de puntos
muestrales, y cada uno tiene la misma probabilidad de darse; siendo
si un punto muestral (i = 1,2,...,m) y m es el nmero total de puntos
muestrales del espacio, la probabilidad de que se d el punto
muestral si es:
P( si ) =
1
m
P( A) =
ma
m
55
Se tiene que
P(obtener un nmero par) = P(obtener un nmero impar) = 3 / 6 = 1 / 2
Ejemplo 6: Cul es la probabilidad de sacar una carta de corazn en un
juego de cartas?
La respuesta es P(sacar un corazn en un juego de cartas) = 13 / 52.
Tipos de eventos
Eventos mutuamente excluyentes
Sean A y B dos subconjuntos de S. Decimos que A y B
son mutuamente excluyentes si A B = , es decir, la
aparicin de uno de ellos impide la ocurrencia simultanea del
otro. Para este caso, tenemos que:
P(A B) = P(A) + P(B) (Regla aditiva)
Ejemplo 7: Cul es la probabilidad de extraer un tres de un juego de carta
o de extraer un diez?
Tenemos que
P(A) =P( extraer un tres) = 4 / 52
P(B) = P(extraer un diez) = 4 / 52
As P(A B) = 4 / 52 + 4 / 52 =8 / 52
Ejemplo 8:Cul es la probabilidad de extraer un siete de un juego de
cartas o un dos?
Tenemos que
P(A) = P(extraer un siete) = 4 / 52
P(B) = P( extraer un dos) = 4 / 52
As P( A B ) = 4 / 52 + 4 / 52 = 8 / 52
Eventos no mutuamente excluyentes
56
Tenemos que:
P(A) = P (extraer un diamante) = 13 / 52
P (B) = P (extraer un as) = 4 / 52
P(A B) =P (un as de diamante)= 1/ 52
P (AUB) = P (A) +P (B) - P (A B)
4
ases
13
As de
Evento condicional
57
P( B / A) =
P( A B)
P ( A)
Regla multiplicativa
Ejemplo 11: Se sabe que el 50% de la poblacin fuma y que el 10% fuma y
es hipertensa. Cul es la probabilidad de que si se escoge una persona
fumadora, sta sea hipertensa?
Tenemos que:
P(F) =P(persona fumadora) = 0.50
P(H) = P(persona hipertensa)
P(F H) = P(fumador e hipertensa) = 0.10
As:
P( H / F ) =
0.10
= 0.20
0.50
A2 = sacar la 1 negra
B2 = sacar la 2 blanca
As:
P(extraer bola blanca y bola negra) = P(A1 B1) + P(A2 B2)
donde
58
A2 = sacar la 1 negra
B2 = sacar la 2 blanca
As:
P(extraer bola blanca y bola negra) = P(A1 B1) + P(A2 B2)
donde
P(A1 B1) = P(A1). P(B1 / A1) = 3 / 8. 5 / 8 = 15 / 64
P(A2 B2) = P(A2). P(B2 / A2) = 5 / 8. 3 / 8 = 15 / 64
As:
P(extraer bola blanca y bola negra) = 30 / 64
Evento independiente
Dos sucesos A y B son independientes cuando la ocurrencia
de uno no afecta la aparicin del otro. En este caso tenemos
que:
P ( A B ) = P ( A) P ( B )
59
Axiomas de Probabilidad
Sean A1 , A2 ,..., An subconjuntos del espacio muestral S. Se cumple que:
Axioma 1
Para todo Ai , se cumple que 0 P ( Ai ) 1
Axioma 2
La suma de probabilidades de los ensayos en un conjunto
mutuamente excluyentes es 1, es decir
n
P( A ) = 1
i =1
Axioma 3
Si A1 , A2 ,..., An son mutuamente excluyentes, entonces:
P( A1 A2 L An ) = P ( A1 ) + P ( A2 ) + L + P( An )
Teorema
Sea
Ac el suceso complemento de
A , entonces
P ( Ac ) = 1 P ( A)
60
Particiones
Supongamos que tenemos los eventos
mutuamente excluyentes ( Ai Aj = ).
S
A1
A2
B
A3
A4
B = ( A1 B) ( A2 B) ( A3 B) ( A4 B)
De esta forma
P( B ) = P( A1 B) + P ( A2 B) + P( A3 B ) + P( A4 B )
= P ( A1 ) P( B / A1 ) + P ( A2 ) P( B / A2 ) + P ( A3 ) P ( B / A3 ) + P( A4 ) P ( B / A4 )
Esto se denota por la probabilidad total del evento B.
Teorema de Bayes
Sea S un espacio muestral que contiene n eventos A1 , A2 ,..., An .Sea
B un evento de S tal que
P ( Ai / B ) =
P ( Ai B )
P ( Ai ) P ( B / Ai )
=
P( B)
P ( A1 ) P ( B / A1 ) + P( A2 ) P ( B / A2 ) + L + P ( An ) P ( B / An )
61
A
0.5
B
0.3
C
0.2
Def.
0.03
No def.
0.97
Def.
0.04
No def.
0.96
Def.
0.05
No def.
0.95
P ( H ) = P( A H ) + P( B H ) + P (C H )
= P( A) P( H / A) + P( B) P( H / B ) + P(C ) P( H / C )
= 0.5 x 0.03 + 0.3 x 0.04 + 0.2 x 0.05
= 0.037
b) El hecho de que un artculo sea no defectuoso, cae en el evento que es el
complemento de H, por lo que
P ( H c ) = 1 P( H ) = 1 0.037 = 0.963
c) En este caso tenemos
62
P( A) P( H / A)
P ( A) P( H / A) + P( B ) P ( H / B ) + P (C ) P ( H / C )
0.5 x 0.03
=
0.5 x 0.03 + 0.3 x 0.04 + 0.2 x 0.05
P( A / H ) =
= 0.4054
d) En este caso tenemos
P( B) P( No H / B)
P( A) P( No H / A) + P( B) P( No H / B ) + P(C ) P( No H / C )
0.3 x 0.96
=
0.5 x 0.97 + 0.3 x 0.96 + 0.2 x 0.95
P ( B No H ) =
= 0.299
Ejemplo 16: Los datos recopilados en The Nacional Health Interview Survey
de 1980-81. Los datos pertenecan a los daos al odo por lesiones sufridas
por individuos mayores de 17 aos. Las 163157 personas incluidas en el
estudio se subdividieron en tres categoras mutuamente excluyentes:
Condicin Laboral
Empleados
Desempleados
Fuera de la fuerza laboral
Total
Poblacin
98.917
7.462
56.778
163.157
Presentaron daos
552
27
368
947
63
P(individuo empleado) =
98917
= 0.6063
163157
7462
= 0.0457
163157
56778
= 0.3480
163157
552
= 0.0056
98917
27
= 0.0036
7462
368
= 0.0065
56778
P (empleado dao)
P(empleado dao) + P(desempleado dao) + P( fuera fuerz. dao)
0.0034
0.0059
= 0.5762
64
RESULTADO DE
LA PRUEBA
POSITIVO ( + )
NEGATIVO ( - )
TOTAL
TOTAL
a+b
c+d
N
Sensibilidad
La sensibilidad de una prueba o sntoma es la probabilidad de un resultado
positivo de la prueba (presencia del sntoma) dada la presencia de la enfermedad.
Sera calcular la estimacin de la probabilidad condicional:
P (+ / E ) =
a
a+c
Especificidad
La especificidad de una prueba o sntoma es la probabilidad de un resultado
negativo de la prueba (ausencia del sntoma) dada la ausencia de la enfermedad.
Sera calcular la estimacin de la probabilidad condicional:
P ( / E ) =
d
b+d
65
P (E )
P(+ / E )
PRUEBA POSITIVA
P( / E )
PRUEBA NEGATIVA
ENFERMO
NO ENFERMO
P(E )
P(+ / E )
P( / E )
PRUEBA POSITIVA
PRUEBA NEGATIVA
66
HIV
RESULTADO DE
LA PRUEBA
PRESENTE
(E)
436
14
450
POSITIVO ( + )
NEGATIVO ( - )
TOTAL
Sensibilidad =
436
= 0.97
450
TOTAL
AUSENTE
(E)
5
495
500
441
509
950
Especificidad =
495
= 0.99
500
P(+ / E ) = 0.91
PRUEBA POSITIVA
P( / E ) = 0.09
PRUEBA NEGATIVA
P( E ) = 0.20
Enfermo
(Con Colelietasis)
No Enfermo
(Sin Colelietasis)
P(+ / E ) = 0.02
PRUEBA POSITIVA
P ( / E ) = 0.98
PRUEBA NEGATIVA
P ( E ) = 0.80
0.20 x 0.91
= 0.92
0.20 x 0.91 + 0.80 x 0.02
Valor que Predice la Positividad: 92%
P( E / +) =
67
Distribucin de Probabilidades
Para referirse a las distribuciones probabilsticas existentes, es necesario y
obligatorio hablar primero de lo que significa una variable aleatoria, debido a que
en las distribuciones probabilsticas se trabajan generalmente con ste tipo de
variables.
68
f ( X = xi ) 0
n
f (X = x ) = 1
i
i =1
f ( X = xi ) 0
f (X = x ) = 1
i
pr qnr
n
y la forma de obtener r xitos y n r fracasos es igual a .
r
As:
n
P( X = r ) = p r q n r
r
donde p es la probabilidad de xito y q = 1 p es la
probabilidad de fracaso.
69
Media: = n. p
Varianza: 2 = n. p.q
Curtosis: Curtosis = 3 +
1 6. p.q
n. p.q
b) Se tiene que
P( X ) = 1 P(no sa lg a a lg uno)
( ) (2 3 )
7
=1 1
0 3
= 0.946
=1 0.054
70
a) Se tiene que:
P( X 4) = P ( X = 0) + P( X = 1) + P( X = 2) + P( X = 3) + P ( X = 4)
10
10
= (0.65)0 (0.35)10 + (0.65)1 (0.35)9
0
1
10
10
+ (0.65) 2 (0.35)8 + (0.65)3 (0.35)7
2
3
10
+ (0.65) 4 (0.35)6
4
= 0.0949017
b) Usando el teorema del complemento
P ( X 2) = 1 [P ( X = 0) + P( X = 1)]
10
10
=1 (0.65) 0 (0.35)10 + (0.65)1 (0.35)9
1
0
= 0.9994603
Distribucin Poisson
La Distribucin Terica de Poisson se debe al
matemtico francs Simen Poisson, es aplicable a
fenmenos aleatorios que se caracterizan por el nmero de
sucesos que ocurren en un determinado perodo de tiempo o
en un determinado espacio. La hiptesis bsica en este tipo
de fenmenos es que los sucesos son independientes. Puede
usarse para determinar la probabilidad de eventos poco
frecuente, es decir, proporciona la probabilidad de que un
resultado suceda un nmero especfico de veces cuando la
71
e r
P( X = r ) = f (r ) =
r!
Propiedades
Media: = = n. p
Varianza: 2 =
Desviacin Tpica: =
Sesgo: Sesgo = 1
Curtosis: Curtosis = 3 + 1
72
a)
P ( X = 2) =
b)
e 0.6 (0.6) 2
= 0.0988
2!
P ( X 2) = 1 [P( X = 0) + P( X = 1)]
e 0.6 (0.6)0 e 0.6 (0.6)1
= 1
+
0!
1!
= 0.122
P ( X 3) = P ( X = 0) + P ( X = 1) + P( X = 2) + P ( X = 3)
e 4 (4) 0 e 4 (4)1 e 4 (4) 2 e 4 (4)3
+
+
+
0!
1!
2!
3!
= 0.0183 + 0.0732 + 0.1465 + 0.1953 = 0.4333
=
73
y=
1
2
( x )
2 2
z=
y=
1
2
1 2
z
2
74
Propiedades
Para la curva normal tipificada, se tiene que la
media es igual a 0 y la desviacin tpica es 1.
Esta curva es simtrica con respecto a la media,
de modo que la media, la mediana y moda
coinciden.
El valor del sesgo es 0.
Es una curva mesocrtica.
El rea bajo la curva es igual a 1.
A=
Z
1
1
2
1 2
z
2
e
dz = P( Z Z Z )
1
2
Z1
Z2
75
Regla Emprica
Observacin:
Trabajaremos con las siguientes tablas:
1.- reas bajo la curva normal tipificada de 0 a z.
2.- Distribucin t de Student con grados de
libertad.
3.- Distribucin Chi-cuadrado con grados de
libertad.
76
a) Area entre
Z=1,80
Z=0
1.8
1.5
-1.3
1.85
1.28
2.15
77
-1.04
-1.92
-0.94
1.70
78
2.4
z=
62 50
= 2.4
5
Luego
79
CAPTULO IV
Inferencia Estadstica
Uno de los propsitos de la investigacin es el realizar inferencias
o generalizar de una muestra a una poblacin ms grande. Para
poder comprender los fundamentos del muestreo, resulta
imprescindible el conocer las definiciones de Universo, Poblacin y
Muestra.
Universo / Poblacin : El Universo en definitiva constituye una
poblacin terica sobre la cual los estadsticos han creado toda la
teora del muestreo; se suele asimilar a la poblacin ms amplia
que se quiere conocer con un estudio pero que por obvias razones
es imposible de alcanzar. La poblacin, es un conjunto o
coleccin grande de artculos que poseen algo en comn. Esta
definicin traducida al uso en medicina podra ser: el conjunto de
sujetos u organismos que poseen una caracterstica en comn,
susceptible de estudio, medicin u observacin. Para hacer ms
digerible esta definicin, supongamos que un investigador desea
establecer la prevalencia de uso de aretes en el ombligo, en
mujeres rubias menores de 20 aos de edad, de ojos verdes, cuya
estatura sea mayor de 1.75m y residan en la ciudad de Quito.
Aparentemente el investigador busca firmemente una candidata a
Miss, pero bueno en este caso estn claramente definidas las
caractersticas de la poblacin a investigar: rubias, ojos
verdes, estatura 1.75m, residentes en Quito en definitiva
se trata de un grupo de sujetos (en este caso mujeres) que deben
tener en comn necesariamente las caractersticas citadas.
La Inferencia Estadstica constituye una parte de la Estadstica en la que se
hacen estimaciones e inferencias para la toma de decisiones. Aqu utilizaremos
tcnicas de muestreo apropiadas a fin de estudiar determinadas caractersticas de
la poblacin que nos interesa analizar, tomando en cuenta que la muestra a
estudiar, debe ser representativa de la poblacin.
Muestreo Estadstico
El conjunto de tcnicas que nos permiten disear la muestra ms apropiada
para un experimento, garantizando que esta sea representativa de la poblacin de
origen y controlar los errores cometidos, es lo que se conoce como Muestreo
Estadstico. Dependiendo de la investigacin a realizar, utilizaremos el mtodo que
mejor se adecua al mismo (muestreo aleatorio simple, muestreo estratificado,
entre otros).
Se aconseja la utilizacin del muestreo cuando la poblacin es infinita,
cuando las muestras son homogneas, cuando el proceso de investigacin de la
caracterstica de un elemento resulte destructivo.
80
81
Distribuciones muestrales
Si tenemos una poblacin de tamao N , de ella es posible extraer con o
sin reemplazamiento una serie de muestras ( n ).
Poblacin( N )
n1
n2
n3
n4
82
y por varianza a X2 =
X =
y varianza
2
2
x=
n
Desviacin Tpica
x =
83
x N ( , 2 / n )
x t
n1
S
n
1 n
2
S 2=
( xi x )
n 1 i =1
Distribucin muestral de proporciones. (poblacin finita)
Se considera todas las posibles muestras de tamao n extrada de
una poblacin y para cada muestra se determina la proporcin p de xito.
Entonces se obtiene una distribucin muestral de proporciones cuya media
es p y desviacin tpica p y viene dada por una media de
=p
p
y desviacin tpica de
p.q
n
84
p =
x
n
N ( p,
p.q
)
n
= X 1 X 2 = 1 2
1X2
y la desviacin tpica es
X X =
1
2
X1
2
X2
21
n1
22
n2
85
2
X1 X 2
S12
S 22
=
+
n1 1 n2 1
S2
S2
X 1 X 2 N 1 2 , 1 + 2
n1 1 n2 1
Si
2 = 12 = 22
entonces
(X
X 2 ) (1 2 )
n1 + n2 n1 S + n2 S
n1 n2 n1 + n2 2
2
1
2
2
tn1 + n2 2
p p = p p = p 1 p 2 =
1
x1 x2
+
n1 n2
y la desviacin tpica es
p p =
1
p1q1 p2 q2
+
n1
n2
donde
p=
x1 + x2
n1 + n2
86
Intervalos de Confianza
Si queremos estimar un parmetro de una poblacin mediante una muestra
de tamao n , podemos obtener muchos valores distintos de ese parmetro
muestral. Lo ms recomendable es encontrar un intervalo alrededor del valor del
estimador, acompaado de alguna medida que nos diga la confianza que se
puede tener de que ese intervalo contenga el verdadero valor del parmetro.
Dada una muestra aleatoria de tamao n de una poblacin con funcin de
densidad f (x) , un intervalo de confianza del 100 (1 )% para un parmetro
desconocido ,
es
un
intervalo
determinado
por
dos
nmeros:
( 1 , 2 ) calculados con base en los datos de la muestra tales que
P ( + ) = 1
1
2
El valor 100 (1 )% es conocido como coeficiente de confianza.
Los lmites superiores e inferiores del intervalo de confianza que contiene
una proporcin 1 de las medidas, los cuales constituyen variables aleatorias,
se hallan por medio de la frmula:
x=
e= Z
1-
/2
/2
87
x Z c
x
donde Z c depende del nivel de confianza y x =
p Z c
p
donde p es la proporcin de xitos en la muestra de tamao n y
p.q
n
X X Zc
1
2
S2 S2
1 + 2
n
n
1
2
88
p 1 p 2 Z c
pq pq
+
n1 n2
donde
p=
x1 + x2
n1 + n2
Hiptesis Estadstica
Una hiptesis estadstica es una conjetura que se realiza respecto a
una poblacin, ms concretamente, respecto a un parmetro de la
poblacin el cual cuantifica una caracterstica de ella. Se formulan hiptesis
con el solo propsito de rechazarla o aceptarla. Trabajaremos con las
llamadas hiptesis nula y la hiptesis alternativa.
Hiptesis nula
Se denota por H 0 y es la hiptesis que se establece con el
propsito de ver su posible rechazo. Por ejemplo, se comienza por
afirmar que la media de la poblacin es igual a un valor dado 0 , y
se denota H o : = 0
Hiptesis alternativa
Se denota por H1 y es cualquier hiptesis que difiere de la
hiptesis nula, referida la misma medida estadstica, por lo tanto
contradice a H 0 . En una prueba hay generalmente una hiptesis
nula, pero puede haber muchas hiptesis alternativas, a saber,
H1 : 0 ; H 1 : > 0 ; H 1 : < 0
89
H 0 : verdadera
Aceptar H 0
Correcto
Rechazar H 0
Error tipo I
H1 : verdadera
Error tipo II
Correcto
90
Nivel de significacin
La probabilidad mxima con la que en el ensayo de una hiptesis se
puede cometer un error del tipo I, se llama nivel de significacin del ensayo.
El mismo es denotado por . Comnmente se usan los niveles 5% y 1%.
Por ejemplo si es del 5%, se tiene que se est con un 95% de confianza de
que se toma la decisin adecuada. En tal caso, se dice que la hiptesis ha
sido rechazada al nivel de significacin del 0.05, lo que significa que se
puede cometer error con una probabilidad de 0.05.
/2
/2
Zc
+ Zc
91
/2
/2
Zc
+ Zc
+ Zc
H1 : > 0
Zc
H1 : < 0
92
H :X =
0
H : X
1
H :X >
1
H :X <
1
R :
>
R :
>
R :
<
Z =
H : p = p
0
H : p P
1
H : p > p
1
H : p < p
1
R :
R :
R :
Z =
>
p P
p.q n
>
< Z
93
H : X =X 2
0
1
H
H
H
1
1
1
: X
: X
: X
1
1
1
X
>
2
X
< X 2
R :
>
R :
R :
Z
>
<
Z=
X1 X 2
12 22
+
n
n
1
2
H : p = p
0 1
2
R :
R :
R :
Z
>
<
Z
Z
94
H : p p
1 1
2
H : p > p
1 1
2
H : p < p
1 1
2
p 1 p 2
pq
pq
+
n1
n2
P =
donde
X1
X2
n1 + n2
Determinacin de H 0 y H1 .
Decisin sobre la prueba estadstica apropiada.
Seleccin del nivel de significacin para la prueba.
Determinacin del valor que la prueba debe alcanzar para declararse
significativa.
5. Clculos.
6. Obtencin de la conclusin.
95
H1 : 90 Kgs
Z =
X
89 90
=
= 1.09
n 10 120
Aceptacin Ho
0.95
Rechazo Ho
0.025
- Z/2
Rechazo Ho
0.025
/2
2 = 25 puls / min
n = 56
x = 98 puls / min
Normal
0.01
0.99
96
= 0.01
-z
H1 : x
= 2.09
A
0.92
R
0.04
97
-z
0.625 0.5
0.55 0.45
0.55 0.45
+
80
90
= 1.63
98
Y =
t2
1 +
+1 / 2
xtc
S
n 1
t =
x
S
n 1
99
xtc
S
n 1
t=
X1 X 2
1 1
+
n1 n2
donde = n1 + n2 2 y
n S2 + n S2
1 1
2 2
n +n 2
1 2
100
Datos:
= 2hr = 120 min
S =7
n = 25
x = 75 min
= 0.1
= 25 1 = 24
0.1
T de Student
0.9
A
R
-t
El valor
75 min 120 min
24
n 1 =
S
7 min
, 24
= 31.49
101
7.56 7.02
6 (0.24) 2 + 5 (0.32) 2
6+5 2
= 2.67
1
6
1
5
Distribucin Chi-Cuadrado
Es una distribucin probabilstica de tipo continua, con
positiva y su funcin viene dada por la expresin
asimetra
1 2
2 2
Y = Yo
e
siendo Y0 un valor constante tomado en funcin de los grados de libertad
y = n 1 es el nmero de grados de libertad.
Se puede obtener el intervalo de confianza para el estadstico 2,
establecidos para los diferentes niveles de confianza, intervalos para
estimar la desviacin tpica poblacional a partir del valor muestral S .
Entonces debemos calcular
2
( n 1) s 2
( n 1) s
= 1
P
2
2
2
2
1
102
s2
2
=n
2
el cual tiene asociados = n 1 grados de libertad.
Los valores del estadstico 2 vienen expresados en funcin
del nivel de confianza y de los grados de libertad.
Ejemplo 6: En el pasado, la desviacin tpica de los pesos de ciertos
paquetes de 40 onzas llenados por una mquina era de 0.25 onzas. Una
muestra al azar de 20 paquetes dio una desviacin tpica de 0.32 onzas.
Es significativo el incremento de variabilidad? Use un nivel del 5%
Datos:
S = 0.32 onzas
A
R
n = 20
0.95
0.05
= 0.25 onzas
= 0.05
2 =
20 (0.32)2
= 32.768
(0.25)2
2
0.95, 19 = 30.14
As, rechazamos el hecho de que las varianzas sean iguales con un nivel
del 5%, es decir, se acepta que fue significativo el incremento.
103
CAPTULO V
Regresin y Correlacin
En esta parte del curso, se analiza el concepto de relacin entre dos
variables y extiende esta idea para predecir el valor de una variable a partir de la
otra. Se describen pruebas estadsticas para determinar si una relacin entre dos
variable es significativa o no.
Anteriormente, las muestras consistan en mediciones de una sola variable
aleatoria Y. Ahora si queremos estudiar dos o ms variables de una misma
poblacin, entonces se deben aplicar las tcnicas de regresin y correlacin.
De una poblacin de tamao N se pueden estudiar dos variables X e Y ,
los cuales los tendremos por pares de observaciones ( xi yi ) los cuales los
disponemos en forma de tablas. Dichas tablas expresan cmo se distribuyen las
observaciones en funcin de los pares ( xi yi ) por lo que reciben el nombre de
distribucin bidimensional de frecuencias. En estos casos se pretende estudiar de
este conjunto, la relacin existente entre las variables.
Cada variable, separadamente, se estudia bsicamente a travs de su
media aritmtica y varianza. Por lo que encontramos X , Y , S X , SY respectivamente.
Este anlisis se realiza mediante el clculo de una medida llamada covarianza
cuya frmula es:
N
N
N
x
y
x
i i
i yi
S xy = i =1
i =1 i =1
N
N
N
Si S XY > 0 entonces decimos que X e Y siguen el mismo comportamiento.
Si S xy < 0 entonces decimos que X e Y se mueven en sentido contrario.
Si S XY = 0 entonces no existe relacin entre las variables.
Ms que la covarianza, existe otra magnitud que indica el grado de relacin
entre las dos variable, es llamada Coeficiente de correlacin r que viene dada por
la frmula:
104
r=
S xy
Sx S y
n xy x y
n x 2 ( x ) 2 n y 2 ( y ) 2
)(
De esta forma la Correlacin sirve para obtener una medida del grado de
fuerza o relacin que existe entre dos variables.
Diagrama de dispersin
El diagrama de dispersin da una visualizacin y un medio ms
simple para estudiar la relacin entre dos variables. En este diagrama, cada
uno de los n pares de observaciones ( xi yi ) se marca con un solo punto en
la grfica. Con la disposicin de los puntos en la grfica se detecta el
patrn indicativo de la naturaleza de la forma funcional bsica de los datos.
105
Dn
D1
106
Regresin
Consiste en obtener una ecuacin que se pueda usar para predecir o
calcular el valor de una variable correspondiente a un valor dado de la otra
variable. Existen muchos modelos de regresin, a saber, lineal, cuadrtico,
logartmico, logstico, exponencial, entre otros. En este curso, solo estudiaremos el
modelo de regresin lineal
Regresin Lineal
En este caso, el diagrama de dispersin sugiere la idea de intentar
expresar la relacin entre las dos variables mediante una lnea de regresin
que sea recta. Si tenemos dos variables X e Y , decimos que estn
relacionadas segn una lnea recta cuando sus valores satisfacen la
ecuacin
Y = aX + b
donde a y b son constantes. La constante a se refiere a la inclinacin de
la recta y b es el valor por donde la recta corta al eje vertical y vienen
expresados por las frmulas:
a=
n xy x y
n x 2 ( x ) 2
2
y x xy x
b=
n x 2 ( x ) 2
Para determinar matemticamente la ecuacin de esta recta de
regresin aplicando el proceso de mnimos cuadrados donde hay que lograr
que
( ( ))
2
2 sea mn ima.
Di = yi y est i
107
y y est
S =
58
69
75
67
71
59
72
78
77
70
68
65
80
76
Glucosa(mg%)
168
192
199
178
197
165
198
198
199
198
190
175
210
197
Se desea saber:
a) Qu tipo de relacin existe entre el peso y los niveles de
glucosa?Justifique su respuesta.
b) Estime el nivel de glucosa que puede tener un diabtico que peso 60 Kg.
Total
a) Construimos la tabla:
Peso( X )
Glucosa( Y )
58
168
69
192
75
199
67
178
71
197
59
165
72
198
78
198
77
199
70
198
68
190
62
175
80
210
76
197
985
2664
X2
3364
4761
5625
4489
5041
3481
5184
6084
5929
4900
4624
4225
6400
5776
69883
XY
9744
13248
14925
11926
13987
9735
14256
15444
15323
13860
12920
11375
16800
14972
188515
Y2
28224
36864
39601
31684
38809
27225
39204
39204
39601
39204
36100
30625
44100
38809
509254
108
r =
= 0.93
14(188515) 985(2664)
= 1.86
14(69883) (985) 2
b =
2664(69883) 188515(985)
= 59.11
14(69883) (985) 2
109
CAPITULO VI
Nro. de hogares
7
21
58
14
10%
Ajonjol
20%
Maz
52%
Girasol
Oliva
18%
110
% DE NIOS
30
25
20
15
10
5
0
Antipolio
Anti-Hep B
Antilfica
BCG
Doble
Triple
TIPO DE VACUNA
Hembr as
V ar ones
10
5
0
Neumo na
P apera
Rubeo la
Sarampi n
EN F ER M ED A D ES
Varicela
Observando
el
grfico:
a)Cules son las
variables y de qu
tipo son? b)Qu
enfermedad en ms
frecuente en las
hembras? y en los
varones? c)A qu
enfermedad
son
ms propensos los
varones?
111
5.- En la Escuela Juan Bimba de los Teques, se tomaron al azar 30 nios para
medirles la temperatura y los resultados fueron representados mediante el
siguiente grfico:
TEMPERATURA (C) DE 30 NIOS DE LA ESCUELA "JUAN BIMBA". LOS
TEQUES, MAYO 2001
35
30
25
Fi
20
15
10
5
0
35.95
36.65
37.35
38.05
38.75
39.45
40.15
TEMPERATURA (C)
Se pide:
a) Cul es la variable y de qu tipo es?
b) Cul es la poblacin y cul es la muestra?
c) Construya la tabla de frecuencias.
d) Si a la enfermera le quedan 5 aspirinas y decide darlas a los nios que
tienen las ms altas temperaturas, cul debe ser la temperatura mnima
que debe tener un nio para que se le suministre una pastilla?
6.- En Guanare, cada ao mueren 1000 habitantes por diferentes razones. Un
investigador desea estudiar las causas de estas muertes por sexo, por ello toma
una muestra al azar de 200 defunciones del mes de abril 2000 y presenta los
siguientes resultados:
N DE CASOS
Cancer
Enf. Cerebrales
CAUSAS DE MUERTE
Femenino
Masculino
Enf. Cardiovasculares
112
Quiz 3
Quiz 4
6
9
17
24
41
13
2
0
RESPUESTAS:
PREGUNTA
7. b)
7.c)
Quiz 4
Media=4.5ptos
Desviacin=2.3ptos
%CV=40.0%
K=96.1
20%
25%
30%
Joven
Adulto
50%
Anciano
30%
45%
113
9.9
11.8
11.6
15.3
12.6
12.6
12.4
12.2
10.9
16.7
15.2
10.2
13.4
9.0
7.7
12.3
11.3
9.9
11.0
10.9
11.7
9.4
9.8
8.6
10.1
12.3
11.4
10.2
12.5
8.7
fi
24
70
88
100
RESPUESTAS:
K(13DIAS)= 56.2%
K(17DIAS)=79.0%
%AMAS DE CASA QUE AFIRMAN QUE EL JABON DURA ENTRE 13 Y 17 DIAS=
20.5%
K(17DIAS) - K(13DIAS) = 79.0%- 58.5% =22.8%
CONCLUSIN: NO SE LANZA EL PRODUCTO AL MERCADO, ES DECIR SE
REVISARA SU FABRICACIN PARA MEJORARLA.
11.- La siguiente tabla se refiere a las estaturas de 50 estudiantes:
Li
1.45
1.48
1.51
1.54
1.57
1.60
1.63
1.66
1.69
1.72
Ls
1.48
1.51
1.54
1.57
1.60
1.63
1.66
1.69
1.72
1.75
fi
2
7
4
3
12
9
4
4
2
3
Calcule:
a) % de alumnos con estaturas igual o mayor a 1.60m,
pero menor que 1.69m
b) Cuntos alumnos miden menos de 1.52m?
c) Cuntos alumnos miden ms de 1.68m?
d) % de alumnos con estaturas comprendidas entre 1.67m
y 1.73m
e) Estatura mxima del 20% de menor estatura
f) Estatura mnima del 15% de mayor estatura
114
RESPUESTAS:
PREGUNTA
11.a)
11.b)
11.c)
11.d)
11.e)
11.f)
RESPUESTA
34 %
11 ALUMNOS
6 ALUMNOS
11%
1.52 m
1.67 m
1.65
1.46
1.52
1.51
2.03
1.55
1.38
1.71
1.46
1.71
1.66
1.57
1.89
1.22
1.26
1.49
1.52
1.33
1.75
1.25
1.80
1.86
1.59
1.45
Se pide:
a) Realice la tabla de frecuencias con datos agrupados.
b) Si se considera que los varones que tienen sus valores de creatinina
comprendidos entre 1.40mg% y 1.75mg% son normales, cuntos hay en
este grupo? RESPUESTA: 16 personas
c) Realice el polgono de frecuencia.
13.- Se quiere saber el tiempo (min) que emplea un estudiante ucevista, que
habita en Caracas, en trasladarse desde su casa hasta la Universidad. Se escoge
una muestra de 32 estudiantes de la Facultad de Medicina, que inician su horario
de clase a las 8:00 a.m.; stos fueron los resultados:
44
45
52
30
36
42
41
39
15
20
53
28
29
37
50
37
35
31
58
29
12
44
24
39
30
30
43
60
56
45
39
40
Se pide:
a) Cul es la poblacin y cul es la muestra?
b) La muestra escogida es representativa de la poblacin en estudio?
c) Elabore la tabla de datos agrupados con una amplitud igual a 8
d) Grafique el histograma de frecuencia
e) Si se desea saber las siguientes informaciones, cul mtodo de
representacin escogera?
- Qu intervalo de tiempo emplea con ms frecuencia los
estudiantes, para su traslado?
- Qu % de estudiantes tardan en el trayecto un tiempo menor o
igual a 36min?
115
235
215
230
200
181
175
190
245
265
120
150
210
145
195
250
175
200
210
170
230
215
290
240
190
220
200
270
95
95
82
80
60
92
70
94
68
75
62
85
76
58
88
85
84
88
76
67
92
95
91
85
74
Se pide:
a) Construya la distribucin de datos
agrupados
b) Grafique el polgono de frecuencia y la
ojiva
16.- Se realiz un estudio para evaluar las edades de pacientes con cncer
correctal en Venezuela. Se tomaron al azar 60 pacientes que asistieron al Hospital
Universitario de Caracas. Los resultados fueron presentados mediante el siguiente
grfico:
Frecuencia
40
50
60
Edades(aos)
70
80
90
116
Se pide:
a) Cul es la variable y de qu tipo es?
b) Cul es la poblacin y cul es la muestra?
c) Construya la tabla de distribucin de frecuencias
17.- En un experimento para determinar el efecto de una droga en particular en el
nivel de colesterol del suero (mg/dL) en adultos varones de 30 aos de edad. Se
registraron los siguientes valores en el grupo que se trat con droga:
230
120
210
235
145
250
200
220
210
175
225
215
170
215
190
289
195
270
181
200
250
245
230
158
150
165
270
190
265
268
a) Realizar una tabla distribucin de frecuencia para datos agrupados con una
amplitud de 20 para cada intervalo
b) Cuntos adultos presentaron un nivel de colesterol superior a 140mg/dL?
RESPUESTA: 29 Adultos
c) Qu % presenta un nivel de 210mg/dL o ms? RESPUESTA: 52%
d) Grafique el histograma y la ojiva porcentual correspondiente
RESPUESTA
13%
1.715 m
4.33%
117
fi EGRESOS
2
2000
4
3000
7
4000
5
5000
2
6000
RESPUESTAS:
PREGUNTA
20.a)
20.b)
20.c)
fi
3
5
6
5
1
21.- Una persona quiere saber el sueldo promedio de 500 empleados de cierta
compaa. Para ello decide encuestar a 15 trabajadores, escogidos al azar y
obtiene los siguientes resultados (en Bs.)
940.000
104.000
92.000
Conteste:
85.000
75.000
1.090.000 a) Cul es la poblacin y la muestra?
108.000
85.000
98.000
b) La muestra escogida,es representativa
1.200.000 85.000
85.000
de la poblacin?
90.000
1.000.000 999.000
c) Obtenga las tres medidas de tendencia
central (sin agrupar los datos), cul de
ellas representara ms el sueldo
promedio de los empleados de esta
compaa?
118
RESPUESTAS:
Media = Bs 409067
Mediana = Bs 98000
Moda = Bs 85000 (Distribucin Unimodal)
22.- Un grupo de individuos padecieron de una inexplicable intoxicacin con
vitamina D (lo cual requiri de su hospitalizacin); se pens que podra deberse a
una dieta con ingestin excesiva de productos lcteos. Para estudiar esto, se
tomaron dos grupos de personas: grupo A, constituido por 18 personas que
padecieron de dicha intoxicacin y el grupo B, por 20 individuos saludables. A los
mismos se les realiz una prueba de laboratorio con la intencin de determinar sus
niveles de calcio (mmol/l)
Calcio (mmol/L)
Li - Ls
1.40 1.80
1.80 2.20
2.20 2.60
2.60 3.00
3.00 3.40
Sanos
Enfermos
4
8
3
2
1
3
5
6
2
4
Si los valores de referencia en el nivel de calcio est entre 2.12 y 2.74 mmol/l:
a) Indique el nmero de individuos con calcio entre los valores de referencia
para el grupo de los sanos
b) Para un individuo con un nivel de calcio de 2.50mmmol/l, en cul de los
dos grupos se considera tiene un nivel ms alto? Use percentiles
c) Indique lmites del 50% central de los datos para el grupo de los enfermos
RESPUESTAS:
PREGUNTA
RESPUESTA
22.a)
5 INDIVIDUOS
22.b)
ES MAS ALTO EN EL GRUPO DE LOS SANOS
22.c)
LIMITE INFERIOR: 1.96 mmmol/l
LIMITE SUPERIOR: 2.80 mmmol/l
23.- Se llev a cabo un estudio en el que se compararon mujeres adolescentes
que padecan Bulimia y mujeres Sanas con las mismas caractersticas corporales
y niveles de actividad fsica. El siguiente cuadro muestra las medidas del consumo
diario de caloras en kilocaloras por kilogramo:
Consumo de Caloras diario (Kc/Kg)
Li - Ls
Mujeres
Bulmicas
Mujeres
Saludables
15 18
19 22
23 26
27 30
31 34
7
11
8
4
2
3
4
9
10
12
119
a) Calcule la media, moda y desviacin tpica para cada uno de los grupos
b) Calcule el nivel de asimetra y homogeneidad de cada grupo
c) Qu puede concluir?
RESPUESTAS:
PREGUNTA
RESPUESTAS
MUJERES BULIMICAS
MUJERES SALUDABLES
23.a)
MEDIA = 22 Kc/Kg
MEDIA = 27 Kc/Kg
MODA = 21 Kc/Kg
MODA = 31 Kc/Kg
S = 5 Kc/Kg
S = 5 Kc/Kg
23.b)
SESGO = 0.2
SESGO = -0.8
%CV = 23%
%CV = 19%
24.- Las siguientes distribuciones indican los sueldos diarios de 80 bioanalistas del
laboratorio A y 90 bioanalistas del laboratorio B:
Xi
20000
30000
40000
50000
60000
70000
80000
fi(A)
8
10
23
18
12
7
2
fi(B)
5
12
28
46
71
84
90
RESPUESTAS:
PREGUNTA
La distribucin
del Laboratorio A
(%CVA>%CVB)
Se considera peor pagado en el Laboratorio B
Media = Bs 49353
La distribucin de sueldo sen el Laboratorio A se acerca
ms a la distribucin Normal ( |Sesgo A|<|Sesgo B| )
24.a)
24.b)
24.c)
24.d)
Li
30
45
60
75
90
fiA
fiB
Ls
45 4
0
60 10 4
75 7
8
90 3 12
105 1
6
120
RESPUESTAS:
PREGUNTA
25.b)
25.c)
RESPUESTAS
GRUPO A
GRUPO B
MEDIA = 60 mg/dL
MEDIA = 78 mg/dL
MEDIANA = 58 mg/Dl
MEDIANA = 79 mg/dL
MODA = 55 mg/dL
MODA = 81 mg/dL
En el grupo de los Vegetarianos el valor de 70 mg/dL
se considera ms alto.
26.- Se desea comprobar la influencia del tabaquismo para producir Bajo Peso al
Nacer (BPN). Se escogieron dos muestras de neonatos. Una de ellas (A) cuyas
madres son fumadoras y la segunda (B) de madres no fumadoras. Para
comprobar el BPN se tom como indicador el peso (Kg) de los nios al nacer,
tericamente se considera un nio sano si su peso es superior a 2.50 Kgs y si su
peso es menor o igual a 2.50 Kgs se considera con BPN. Los resultados se
muestran en la tabla anexa.
Se pide:
Peso al
a) Construir la tabla de frecuencias para ambas
nacer (Kg)
muestras
fiA fiB
b) Obtener el % de nios con BPN en cada muestra
Li
Ls
c) Obtener el Coeficiente de Variacin, el sesgo y la
1.00 1.35 8
0
curtosis de cada muestra
1.36 1.71 14 0
d) Graficar el polgono de frecuencias, que refleje los
1.72 2.07 11 2
datos de las dos muestras
2.08 2.43 7
5
e) En funcin de los resultados anteriores, se podra
2.44 2.79 3
8
afirmar que existe relacin entre el tabaquismo y el
2.80 3.15 2 15
BPN? Justifique
3.16 3.51 1 10
3.52 3.87 0
9
RESPUESTAS:
PREGUNTA
26.b)
26.c)
RESPUESTAS
FUMADORAS
88.1%
CV = 27%
SESGO= 0.72
CURTOSIS= PLATICURTICA
NO FUMADORAS
17.2%
CV = 16.4%
SESGO= -0.04
CURTOSIS= PLATICURTICA
121
Se pide:
a) Determine la media aritmtica, la mediana y la
moda de las dos distribuciones
b) Interprete los resultados anteriores y compare las
dos distribuciones
c) Determinar la media aritmtica general del grupo
de 220 estudiantes
d) Un estudiante que haya tardado 40 minutos, en
qu grupo se considera ms rpido?
e) Cuntos estudiantes, tomando en cuenta las dos Facultades, tardaron
ms de 52 minutos?
Li
30
34
38
42
46
50
54
Ls
33
37
41
45
49
53
57
fiA
5
8
12
30
18
12
5
fiB
15
25
40
20
10
12
8
RESPUESTAS:
PREGUNTA
27.a)
27.c)
27.d)
27.e)
RESPUESTA
ESTUDIANTES
ESTUDIANTES
MEDICINA (A)
INGENIERIA (B)
MEDIA = 44 min
MEDIA = 41 min
MEDIANA = 44 min
MEDIANA = 40 min
MODA = 44 min
MODA = 39 min
MEDIA TOTAL= 42 min
EN EL GRUPO DE INGENIERIA.
22 ESTUDIANTES
FUMADORES
CV= 14.3%
SESGO= - 0.2
19 PERSONAS
RESPUESTA
NO FUMADORES
CV= 13.5%
SESGO= 0.875
122
29.- Se han recogido las notas de Bioestadstica I del primer semestre en las
secciones A y B y stos fueron los resultados:
Li
5
8
11
14
17
Ls
7
10
13
16
19
fiA
2
16
40
62
20
fiB
8
37
53
22
10
RESPUESTAS:
PREGUNTA
RESPUESTA
SECCION A
29.a)
CV= 21%
CURTOSIS= LEPTOCURTICA
EN LA SECCION B
29.b)
SECCION B
CV= 25%
CURTOSIS= PLATICURTICA
fi
Se pide:
3
10
15
20
25
20
15
10
3
RESPUESTAS:
PREGUNTA
30.a)
30.b)
30.c)
RESPUESTA
50%
(06-12) 106
DISTRIBUCIN SIMETRICA
123
ESTATURA
(m)
Li
Ls
1.45 1.50
1.50 1.55
1.55 1.60
1.60 1.65
1.68 1.70
1.70 1.75
1.75 1.80
fiA
fiB
2
6
9
10
5
2
1
2
1
0
3
1
2
1
RESPUESTAS:
PREGUNTA
Se pide:
a) Un adolescente que mide 1.69mts, en qu grupo
se considera de baja estatura?
b) Determine para ambos grupos la variabilidad y el
grado de asimetra
c) Dibuje el histograma de frecuencia para los dos
grupos
d) Interprete los resultados anteriores y diga si la
vitamina D influye en el crecimiento. Justifique
RESPUESTA
GRUPO A
31.a)
31.b)
CV= 4.4%
SESGO= -0.14
GRUPO B
En el grupo B.
CV= 6.8%
SESGO= 0
PESO (kg)
Li
Ls
50
54
55
59
60
64
65
69
70
74
75
79
80
84
fiA
fiB
0
3
3
8
19
25
12
3
6
12
20
15
9
5
Se pide:
a) Realice las tablas de distribucin
Si los mdicos consideran que, para este tipo de
mujer los valores que estn entre (62 9)
Kgs
son normales:
b) Obtenga el intervalo X S de cada muestra y
compare con el normal qu concluye?
c) Obtenga el % de mujeres que entran en el
intervalo normal, para cada muestra y comprelos
d) Compare las dos muestras en cuanto a
homogeneidad
RESPUESTAS:
PREGUNTA
32.b)
32.c)
32.d)
RESPUESTA
ANTES DE DIETA
DESPUS DE DIETA
74 6 Kg
68 7 Kg
28%
62%
CV=8.1%
CV=10.3%
124
Ls
100
120
140
160
180
200
220
240
fiA
2
1
3
4
7
10
8
5
fiB
4
8
11
7
3
2
0
0
Se pide:
a) Si los valores normales de los triglicridos estn
comprendidos en el intervalo (115 35) mg/100ml,
determine cuntas personas de cada grupo tienen
sus valores fuera de lo normal
b) Dibuje el histograma de frecuencia para los grupos
c) Obtenga el grado de asimetra de cada grupo
d) En funcin de los resultados anteriores, interprete
los datos y diga si el nivel de licor ingerido influye
en los valores de triglicridos
RESPUESTAS:
PREGUNTA
33.a)
33.c)
RESPUESTA
INGIEREN LICOR
NO INGIEREN LICOR
36 personas
9 personas
SESGO= -0.324
SESGO= 0.4
PESO (Kg)
Li
Ls
55
60
60
65
65
70
70
75
75
80
fiA
fiB
1
1
3
6
4
2
4
9
4
1
Hallar:
a) Media aritmtica del grupo de 35 personas
RESPUESTA: 69 Kg
b) Compare las dos distribuciones en cuanto a
simetra y picudez (interprete los resultados)
RESPUESTA: Distribucin del grupo A es asimtrica
negativa y platicrtica; la distribucin del grupo B
es asimtrica positiva y platicrtica.
215
220
180
190
150
300
125
126
127
350
300
250
200
150
100
50
0
N=
65
60
femenino
masculino
SEXO
333
283
419
511
Consulta
283
231
308
283
283
491
386
465
315
283
252
228
128
16
14
46
43
45
12
10
4
N=
25
25
ANTES
DESPUES
129
130
131
no est tan dispuesto a pagar tanto dinero, decide que por cada 50 cajas solo 2
tendrn el cupn, el fabricante de JABON B decide dar ms oportunidad
colocando el cupn a 5 cajas por cada 20 que produzca, el fabricante de JABON
C, quien desea aumentar su venta, le coloca 7 cajas del premio por cada 12. Una
ama de casa compr un detergente, y al abrirlo descubre el cupn, cul es la
probabilidad de que la marca del detergente sea JABON X?
RESPUESTA: P( JABON X / P )=0.046
12.- Un anlisis para descubrir una enfermedad venrea arroja un ndice del 6%
de resultados falsos positivos y un ndice del 20% de resultados falsos negativos.
En una poblacin, el 2% de las personas padecen dicha enfermedad. Cul es la
probabilidad de:
a) que una persona con resultados positivos padezca de esta enfermedad?
RESPUESTA: P(E/+)=0.214
b) una persona con resultados negativos padezca la enfermedad?
RESPUESTA: P(E/-)=0.004
13.- En un laboratorio hay tres cajas (A, B y C) con ampolletas de agua. La gaveta
A contiene 3 con agua destilada y 2 sin destilar. La B tiene 6 con agua destilada y
4 sin destilar. La C tiene 5 con agua destilada y 1 sin destilar. Si se tom una
ampolleta al azar y result con agua no destilada Cul es la probabilidad de que
provenga de la gaveta B?
RESPUESTA: P( B / D )=0.571
14.- Diversas enfermedades producen los mismos sntomas, por ejemplo, dolor de
cabeza. Suponiendo que en un grupo de personas, el 35% sufre miopa, el 20%
tiene resfriado y el 15% tuvo mala digestin. Imaginemos que el dolor de cabeza
se presenta a los miopes en un 90%, a los resfriados en un 67% y a los que tienen
mala digestin en un 65%. Cul es la probabilidad de que si se selecciona una
persona al azar con dolor de cabeza, tenga resfriado?
RESPUESTA: P(R/DC)=0.245
15.- Un cirujano desarrolla una tcnica quirrgica para una enfermedad en la cual
la mortalidad post-operatoria usual es de 20%. Si en este mes debe operar a 10
personas que tienen dicha enfermedad, calcular la probabilidad de que:
a) ninguna se muera despus de la operacin
RESPUESTA: P(x=0)=0.107
b) a lo sumo 2 personas se mueren
RESPUESTA: P( X 2 )=0.678
132
133
22.- En un sorteo especial de Lotera hay una emisin total de 10000 billetes,
desde el 0000 al 9999. Carlos compra los nmeros: 4641, 3828, 6828, 6840. El
sorteo se utilizar escogiendo dos nmeros al azar: el primero que salga ganar el
segundo premio y el segundo nmero que salga, ganar el primer premio. Carlos
desea saber:
a) Cul es la probabilidad de ganar el 1 y 2 premio?
RESPUESTA: P(12)=1,2.10-7
b) Cul es la probabilidad de ganar el 1 o 2 premio?
RESPUESTA: P(12)=8,0.10-4
23.- La evaluaciones de 150 trabajadores de una empresa se distribuyen
normalmente con una media de 12.0 puntos y una desviacin de 2.5 puntos. Al
observar los resultados el gerente toma las siguientes decisiones:
- las personas que tienen de 10.8 a 13.0 puntos permanecen en el mismo cargo
- de 14.0 a 16.0 se le subir el sueldo
- el 5% de mximo puntaje ascendern de cargo
- el 7% de mnimo puntaje ser despedido
Si se selecciona un trabajador al azar, hallar:
a) la probabilidad de permanecer en el mismo cargo
RESPUESTA: P(10.8<x<13.0)=0.3398
b) la mxima puntuacin que hay que tener para ser despedido
RESPUESTA: 8.3 PTOS
24.- Un anlisis para descubrir una enfermedad contagiosa arroja un ndice del 8%
de resultados positivos falsos y un ndice del 15% de resultados negativos falsos.
Si se escoge una muestra donde se sabe que el 5% posee dicha enfermedad,
cul es la probabilidad de que una persona con resultado negativo padezca de la
enfermedad?
RESPUESTA: P(E/-)=0.009 revisar redaccin
25.- Se lanzan dos dados una sola vez. Calcule la probabilidad de que:
a) Salgan los dos nmeros iguales
RESPUESTA: P(2#IGUALES)=1/6
b) salga en los dados, nmeros menores que 4
RESPUESTA: P(#<4)=1/4
c) Si salen, en los dos dados nmeros menores de 4, cul es la probabilidad de
que los dos sean impares?
RESPUESTA: P(IMPAR /#<4)=0.44
26.- Supongamos que en un cierto hospital cada nio que nace tiene una
probabilidad de 0.55 de ser varn. Encuentre la probabilidad de que si nacen 5
nios:
a) ms de 1 sea varn
134
RESPUESTA: P(X>1)=0.869
b) exactamente hayan 2 hembras
RESPUESTA: P(X=3)=0.337
27.- Un cardilogo estima que la distribucin del tiempo de duracin de un tipo de
marcapaso, desde su instalacin hasta que ste comienza a fallar, sigue una
distribucin normal con media 5.2 aos y una desviacin de 0.8 aos. Si se
ensaya este tipo de marcapaso en un grupo de 120 personas, calcular:
a) la probabilidad de escoger una persona al azar, cuyo marcapaso tiene un
tiempo de duracin entre 4.5 y 6.2 aos
RESPUESTA: P(4.5<X<6.2)=0.705
b) nmero esperado de personas cuyo tiempo de duracin del marcapaso sea
mayor a 7.0 aos
RESPUESTA: 2 PERSONAS
28.- Se quiere estudiar la incidencia del cigarro sobre el cncer pulmonar.
Despus de una serie de investigaciones se determinar que de 300 personas,
120 eran fumadores y el resto no fumadores; el 85% de los fumadores y el 20% de
los no fumadores presentaban cncer pulmonar. Si se escoge una persona al azar
y result con cncer. Cul es la probabilidad de que no sea fumador?
RESPUESTA: P( F / C )=0.261
29.- La probabilidad de que un nio nazca con una anomala congnita es de 0.02.
En la Maternidad Concepcin Palacios, nacen diariamente, un estimado de 125
neonatos. Se quiere saber la probabilidad de que en un da determinado:
a) ningn neonato tenga la anomala
RESPUESTA: P(X=0)=0.082
b) a lo sumo nazcan 3 neonatos con la anomala
RESPUESTA: P( X 3 )=0.758
30.- Un 15% de los pacientes atendidos en un hospital son hipertensos y un 10%
son obesos, y de estos grupos 3% son hipertensos y obesos. Qu probabilidad
hay de elegir un paciente al azar que sea obeso o hipertenso?
RESPUESTA: P(HO)=0.220
31.- La probabilidad de que una madre diabtica transmita su enfermedad a su
primer hijo es 0.65. Si el primer hijo es diabtico, la probabilidad de que el
segundo hijo tambin lo sea es 0.23; pero si el primer hijo no hered dicha
enfermedad, la probabilidad de que el segundo si la herede es 0.86. Hallar:
a) la probabilidad de que el segundo hijo herede la enfermedad
RESPUESTA: P(2 HIJO HEREDE)=0.451
b) Si el segundo hijo es diabtico, cul es la probabilidad de que el primer hijo
tambin posea dicha enfermedad?
RESPUESTA: P(1D/2D)=0.332
135
136
35.- En el Banco de Sangre del Hospital Clnico Universitario hay disponibles los
siguientes tipos de sangre, debidamente identificados:
28 bolsas tipo A
17 bolsas tipo B
20 bolsas tipo AB
35 bolsas tipo O (la sangre tipo O puede donar a cualquier otro tipo)
En cierto momento, acuden a emergencia 9 pacientes que requieren de sangre
tipo AB. Rpidamente y sin fijarse en la etiqueta, una enfermera toma las bolsas
necesarias (una por persona) para atender a los pacientes. Se desea saber:
a) Cul es la probabilidad de que a todos los pacientes se les d el tipo de
sangre correcto?
RESPUESTA: P( X = 9 )=0.005
b) Cul es la probabilidad de que por lo menos tres de los pacientes reciban
la correcta transfusin?
RESPUESTA: P( X 3 )=0.950
36.- La incidencia de pseudotrombocitopenias EDTA-dependientes (PCTP) es de
1 en 400 hematologas realizadas. En el Hospital Clnico de Caracas, el da 15 de
marzo de 2000, se hicieron un total de 150 hematologas, y se quiere conocer para
ese da la probabilidad de que:
a) ningn paciente presente en su hematologa una PCTP
RESPUESTA: P( X = 0 )=0.687
b) menos de dos pacientes tengan una PCTP
RESPUESTA: P( X < 2 )=0.945
37.- La hemofilia (trastorno de la coagulacin sangunea) es una enfermedad
hereditaria que slo padecen los hombres, mientras que las mujeres son
portadoras. La probabilidad de que una familia con antecedentes transmita la
enfermedad a su primer hijo es de 0.151. Si el primer hijo, hered la enfermedad,
la probabilidad de que el segundo la herede es de 0.025. Pero si el primer hijo no
hered la enfermedad, la probabilidad de que el segundo si la herede es de 0.432.
a) Realizar el diagrama de rbol correspondiente
b) Hallar la probabilidad de que el segundo hijo hembra herede la enfermedad
RESPUESTA: P(2H.H)=0.182
NOTA: Considerar que la probabilidad de ser varn es igual a 0.51 y el
complemento es la probabilidad de ser hembra
38.- En las competencias para cualquier deporte, las autoridades siempre hacen
un examen anti-doping. El 45% de los exmenes da positivo del cual el 8% da
errneo, es decir, da doping positivo, sin serlo. Suponiendo que el 10% de los
deportistas haya ingerido drogas de abuso, cul es la probabilidad de que un
deportista que result positivo, haya consumido drogas realmente?
RESPUESTA: P( D / + )=0.385
137
138
ENFERMEDAD
PRESENTE
490
160
AUSENTE
70
1130
139
140
141
142
143
144
145
146
147
RESPUESTA:
Acepto Ho, Rechazo Hi , con un nivel de significacin de 8%, quiere decir que no
existe diferencia significativa entre las dos muestras, por l oque el ayuno no influye
en los resultados de exmenes clnicos.
148
149
18
150
20
130
24
120
19
140
24
120
25
110
20
110
20
110
30
100
18
150
19
140
18
150
56
42
72
36
63
47
55
49
38
42
147
125
160
118
149
128
150
145
115
140
100
80
120
90
135
100
140
120
160
110
120
100
130
110
180
140
170
140
200
170
150
4.- La siguiente tabla muestra la edad (en aos) y el tiempo de reaccin (en seg)
a un estmulo observado a una muestra al azar de 20 nios.
Edad
6 3 6 4 7 7 3 4 6 4 6 4 4 3 4 4 4 6 6 6
Tiempo 9 10 9 10 8 9 10 9 9 10 10 9 10 10 10 9 9 8 10 9
a) Construir el diagrama de dispersin.
b) Qu tipo de interaccin existe entre estas dos variables? Explique su
respuesta
RESPUESTA: r = -0.69
c) Estimar el tiempo de reaccin de un nio de 5 aos
RESPUESTA: 9 seg
5.- Los datos de tensin arterial sistlica pre y post tratamiento, dados en cm.
de Hg, de una muestra, son respectivamente:
X
Y
16
13
16
14
17
14
17
15
18
14
18
15
19
15
19
15
19
16
20
16
43
8.0
65
7.5
78
6.9
73
6.1
71
7.0
69
6.6
67
7.2
45
7.7
69
6.8
60
8.2
65
4.9
59
6.2
151
Peso(kg) 58 69 75 67 71 59 72 78 77 70 68 65 80 76
Glucosa 160 192 199 178 197 165 198 198 199 195 190 175 210 197
Se desea saber:
a) Qu tipo de relacin existe entre el peso y los niveles de glucosa?
Justifique su respuesta
RESPUESTA: r = 0.94
b) Estime el nivel de glucosa que puede tener un diabtico que pesa 90kgs.
RESPUESTA: No se puede estimar el nivel de glucosa de un diabtico que pesa
90kgs con estos datos.
8.- Clnicamente se ha determinado que en casos de infarto al miocardio, existe
relacin entre las enzimas CK TOTAL y CKMB (fraccin de la CK TOTAL). Se
desea analizar qu tipo de relacin cumplen estas variables en una muestra de 20
individuos que sufrieron de infarto al miocardio, segn los siguientes resultados:
Ck
total
250 178 456 201 85 62 45 697 100 1120 278 456 200 156 159 62 124 32
Ckmb 38
12
48
20
12 14 8
59
15
110
16
29
20
16
17
RESPUESTA: r = 0.97
9.- Los siguientes datos corresponden al peso y estatura de recin nacidos del
Hospital J.M. de los Ros en el mes de Enero de este ao, los cuales se
caracterizan por nacer con peso extremadamente bajo:
Estatura(cms) 41
40
38
30
45
32
33
37
39
43
Peso (grs)
1360 1490 1450 1320 1390 1120 1413 1215 1720 1750
a) Qu tipo de relacin existe entre el Peso y la Estatura? Justifique su
respuesta
RESPUESTA: r = 0.52
b) Estime el peso de un recin nacido con estatura de 34 cms.
RESPUESTA: 1342 gms
10.- Clnicamente se ha determinado que en pacientes diabticos (personas con
niveles de glucosa por encima de 115mg/dl en sangre) existe relacin entre la
glucosa y la hemoglobina glucosilada (fraccin de hemoglobina que transporta
glucosa). Se desea analizar qu tipo de relacin cumplen estas variables, en una
muestra de individuos diabticos, segn los siguientes resultados:
Glucosa
38
152
(mg/dl)
250
175 460
Hb-gli
(%)
10.2 9.3
13.2 9.3
8.1
7.9
300
150 420
278
456
8.2
90
200 201
400
500
30
40
62
88
197 205
405
498
32
45
59
8.3
14.2
153
ANEXOS