Escolar Documentos
Profissional Documentos
Cultura Documentos
In troduccln
al
muestreo
SEGUNDA EDICION
Adela Abad
Luis A. Seruin
~M
EDITORIAL
MEXICO
ESPAIQA
COLOMBIA
NORIEGA Editores
LIMUSA
VENEZUELA
PUERTO RICO
ARGENTINA
PROLOGO
Prlogo
Mxico, D.F.
Adela Abad
Luis A. Servn
CONTENIDO
Prlogo
1. Generalidades
11
27
41
69
89
6. Muestreo estratificado
113
151
8. Submuestreo
187
Bibliografa
209
211
215
CAPITULO
GENERALIDADES
1.1 MOTIVACION
12
Generalidades
* En relacin a los
Motivacin
13
14
Generalidades
Enumeracin completa
Muestreo
"SON SOLO 300
CUESTIONARIOS"
Figura 1.1
que
Motivacin
15
eje algn parmetro poblacional se le denomina!_'.?_CUest- y sta puede ser probabilstica o no probabilstica.
16
Generalidades
Objetivo del
investigador
Objetivo de
la encuesta
1.2 POBLACIONES
Repetidamente estaremos tratando con colecciones de objetos o
de entes que se caracterizan por poseer ciertas propiedades especificas. Denominaremos conjuntos o ms especfficamente, poblaciones
a esas colecciones o agrupaciones y diremos 4ue cada una de ellas
est formada por elementos o unidades.
De esta manera podemos tener, por ejemplo, una poblacin de
personas, una poblacin de viviendas, una poblacin de expedientes
17
* Las
18
Generalidades
de una familia
de un predio
agrcola
nm. de miembros,
zona de la ciudad en que vive,
nm. de personas que trabajan,
nm. de personas que estudian,
grado mximo de escolaridad del jefe de
la familia, etc.~
.
de una industria
de un asegurado
de una
institucin de
seguridad social.
estado civil,
nm. de beneficiarios,
grupo de salario de cotizacin,
trayectoria que sigue para ir de su casa
al trabajo, etc.
de un
enfermo
sexo
edad
diagnstico mdico
nmero de das de hospitalizacin
tipo de seguro que posee
de un producto
terminado
Parmetros poblacionales
de un estudiante
universitario
19
estado civil,
cantidad de dinero empleado en la compra
de libros el semestre pasado.
trabaja o no.
ms
* Para transformar
io
Generalidades
en
21
1.6 VARIABILIDAD
En u.:ia poblacin 'sujeta a estudio ia magnitud de la- caracterstica que es de -inters, normalmente vara de unidad a unidad; as
en el caso "del ingreso f~miliar, i.Jna familia tiene 5 000 pesos al mes
y la vecina de 7 000. Existen varias maneras de referirse a la variacin de una caracterstica y stas se ilustran en seguida.
' Supongamos que en una calle ~ntrica observamos a cada no
de los vehculos que pasan (automviles particulares~ taxis, autobuses, etc.) y contamos y registramos su nmero de ocupantes. Despus '.de revisar decenas de vehculos encontramos que en el caso de
los autos, su nmero de ocupantes vara con los das de la semana
y con la hora del da, pero que tienen un intervalo de variacin,
diiamos, entre 1 y 6; y que ste es menor o ms pequeo que el
intervalo de variacin del nmero de pasajeros en autobuses, ya
que aunque tambin ste presenta variaciones en el tiempo, algunos
autobuses vienen casi vacos, otros medianamente llenos y otros muy
llenos. A esto nos referimos diciendo que es ms variable el
nmero de ocupantes en autobuses que en automviles, es decir,
que presenta una mayor variabilidad la caracterstica "nmero de
ocupantes" en autobuses que en autos; que presenta mayor dispersin, mayor variancia, o como tambin podemos decir, menor concentracin. El trmino estadstico consagrado para este concepto es el
de varianza y ser ampliamente usado en todo el libro a lo largo de
cada diseo de muestreo.
1.7 MARCO DE REFERENCIA MUESTRAL
L
22
Generalidades
l.
2.
3.
1 300.
Direccin
23
24
Generalidades
i)
ii) El salario medio es de: 175 + 300 +125 +100 +100 +275+
150 + 150 + 200 + 200 dividido entre 10, es decir, 1 ~b 5 =
177 .5 pesos al da.
1= -10-1
(175 2
=~
(l 775 l 2
10
= 4 645.83 pesos al
cuadrado.
1.8 EJERCICIOS
1.1. i. Describa dos ejemplos de poblaciones a estudiar. ii. Especifique sus
unidades o elementos. iii. Enuncie dos ejemplos de caractersticas de inters
en cada una de ellas. iv. cuntos elementos tiene cada una de sus
poblaciones? v. Puede definir algunas subpoblaciones en ellas? , cules?
1.2. El nmero de miembros y de beneficiarios asociados a un organismo p~
blico en cada una de las 20 familias de una manzana fueron los de la
tabla l. l.
Ejercicios
25
Tabla 1.1
Familia
1
2
3
4
5
6
7
8
9
10
No. de
miembros
No. de beneficiarios
2
5
3
6
9
7
5
5
6
4
o
5
1
o
o
o
o
1
3
Familia
No. de
miembros
11
12
13
14
15
16
17
18
19
20
11
6
6
3
7
6
6
4
9
8
No. de beneficiarios
o
o
1
o
o
o
o
2
Determine:
CAPITULO
ALGUNOS CONCEPTOS
DE ESTADISTICA Y DE MUESTREO
2.1 VARIABLE ALEATORIA Y
DISTRIBUCION DE PROBABILIDADES
28
Frecuencia
...
1
2400
2600
--
peso en gramos
Figura 2. l. Una manera de representar la distribucin de probabilidades de una variable aleatoria es mediante este diagrama denominado
Histograma de frecuencias.
En la figura 2.1 aparece una manera de representacin experimental de la distribucin de probabilidades de la variable aleatoria
X: peso de recin nacidos en un caso hipottico. El peso de recin
nacidos es una variable aleatoria porque hasta que ocurre el nacimiento se puede conocer el valor de X. En ella el rectngulo mayor
se puede obtener contando el nmero de nacimientos tales que su
peso se encuentra entre 2 400 y 2 600 gramos y dividindolo entre
el total de nacimientos en consideracin; con esta fraccin se
dibuja un rectngulo de rea equivalente a ella.
Con la moneda podemos generar dos nmeros aleatorios diferentes y con el dado podemos generar a seis de ellos. Como
29
x2 ,
i = n
l:
i
X p
2.1
= 1
= 1 (!) + 2(_!_) = ~
2
=a,
+
bX) = a
a constante.
+ bE{X), a
y b constantes.
2.2
* Para las definiciones en este apartado existen las anlogas en el caso continuo.
31
2.3
=1
{x - E(X}} 2 (p}
2.4
V(X} = E(X2 )
2.5
(E(X)} 2
. . , estan
'd ar es (1l1h
y su desv1ac1on
41 = 21
V(a)
2.7
32
- E{X))( Y - E( Y)))
2.8
2.9
Adems:
~=n y{X)
en la que X 1 , X 2 ,
COV{X, X)
2.10
FFi
i= 1
No.de
Figura 2.2
vehculos
Estimadores
33
2.4 ESTIMADORES
ha
-se
* Con
34
~--
q.
8
Figura 2.3
~
**
35
La concentracin o dispersin de una distribucin ser analizada a travs de la variancia o de su raz cuadrada, la desviacin
estndar. A menor variancia, menor dispersin, o sea mayor concentracin; y a mayor variancia, mayor dispersin o sea menor concentracin.
Supongamos que tenemos dos estimadores insesgados y consistentes
01 y 82 del parmetro poblacional O y que stos tienen variancias
diferentes tal como se observa en la figura 2.3. o2 est ms
concentrado alrededor del valor verdadero (}, significando que hay
gran probabilidad de que sea pequea la diferencia entre la estimacin 02 (X1 , X 2 , , Xn) y el valor verdadero O; en cambio, es
probable que las diferencias respectivas para ii 1 sean mayores, por
lo que preferimos a ii 2 , como estimador de O.
En este libro se vern diferentes mtodos de seleccin y de
estimacin. Muchas veces la eleccin de estos procedimientos se
hace en base a la variancia muestra( el estimador o a su error cuadrtico medio.
2.5 POBLACION A ESTUDIAR
Y POBLACION MUESTREADA
La poblacin a estudiar es aquella sobre la que se desea efectuar inferencias y queda definida antes de iniciar el trabajo de
campo. Generalmente sta va sufriendo transformaciones a medida
que se avanza hacia y sobre el trabajo de campo. Muchas veces esto
hace necesario redefinir la poblacin a estudiar, de manera que se
tenga una poblacin que sea alcanzable en trminos prcticos.
Sin embargo, aunque ocurran redefiniciones es usual que esas
poblaciones discrepen a la hora del trabajo de campo, y es necesario agregar las aclaraciones pertinentes cuando se emiten los resultados de la encuesta y sus conclusiones. Esos resultados y conclusiones slo sern vlidos para la poblacin muestreada; en este
sentido, el trabajo de campo se dirige a hacer coincidir las dos
poblaciones.
Como ejemplo, considrese una encuesta sobre las industrias
cuyo unico giro es la fabricacin de ropa en el Estado de Aguascalientes. Este tipo de industrias estn registradas en diferentes
organismos gubernamentales y en las cmaras industriales. Sin embargo, estos listados no son completos. Muchas de ellas, principalmente las de tipo familiar, no aparecen en los listados y son
difciles de localizar, por lo que es necesario redefinir la poblacin,
36
1.1 una encuesta referente a los empleados en los molinos productores de masa para tortillas. En l se identific a la poblacin
sujeta a estudio, a los elementos o unidades que la componen, a la
caracterstica a observar en cada unidad, al mtodo de medicin a
usar y al marco de referencia.
El grupo de economistas materializ de alguna manera una
muestra consistente de veinte molinos, a los cuales identific y
marc en el listado. Se fue a visitar a cada molino en la muestra y
se les hizo la pregunta correspondiente a los encargados de cada
establecimiento. Sin embargo, los entrevistadores encontraron una
dificultad. Los establecimientos visitados, adems de hacer la molienda del maz y as producir la masa, se dedicaban a la fabricaci.n de tortill.a en el - mismo local .'y, .los empleados - atendan
indistiramente al molino y a la fabricacin de tortilla-por lo que
ilO S pO<;i a hacer - la distinci. >.entre el nmero" de empleados
dedicados exclusivamente a la:aetiv~dad en cuestir.i ..
Los entr~vist.a,dores co~silt~ron al grupo de ....t:sonmistas y stos
decidieron que l.a pregunta se hiciera sobre tqd's: lo's r:npleados del
establecimiento. Los datos-obtenidos fueron-los siguientes:
.,,.
37
Molino
No. de empleados
10
1
Molino
No. de empleados
11
2
12
13
3
14
1
15
16
17
18
19
20
Para el procesamiento de la informacin se dieron las instrucciones siguientes: sume los empleados declarados en cada establecimiento en la muestra y divida la suma total entre 20; ste es el
estimador usado. Posteriormente se pudo comprobar que el nombre
del listado estaba equivocado, porque sus componentes eran molinos tortilleras.
Y as, como ya estaba desarrollado todo el trabajo, decidieron
usar los resultados con la indicacin de que la encuesta era vlida
para aquellos establecimientos en el listado los cuales hacan tanto
masa como tortillas. De manera que la media estimada fue de
37 /20 empleados por establecimiento "molino tortillera".
Es claro que la poblacin inicial sujeta a estudio difiere de 1a
poblacin muestreada.
Ejemplo 2.2 Supongamos una poblacin con 12 000 familias, de
las cuales, 5 000 tienen ingresos de 200 pesos diarios, 3 000 de 300,
2 000 de 400, 1 000 de 500, 500 de 600 y 500 de 700 pesos. Su distribucin es del tipo de la figura 2.4.
5/12
3/12
2/12
1/12
1/24
200
300
400
Pesos al da
500
600
Figura 2.4
700
38
1
320
330
340
350
360
370
380
-.
Figura 2.5
En otra etapa del experimento, el nmero de muestras se aument a 200, y con un tamao de muestra de 250, obtenindose como
resultado la figura 2.6. Este nuevo resultado, lmodifica o refuerza
en algo a sus conclusiones anteriores?
'
320
330
340
350
360
370
380
Figura 2.6
* El
--
Ejercicios
39
2.7 EJERCICIOS
2.1 Vase el ejercicido 2 del captulo 7. Marcamos una canica por familia con
el nmero de sta y de sus miembros; las ponemos en una urna, las
mezclamos y elegimos aleatoriamente a cinco de ellas, obteniendo los
resultados siguientes:
Canica
No. de miembros
4
6
3
3
2
5
5
7
(1 -
=s
(y --- y)2
2~) (i)-;=_1_ __
5- 1
= (
1 - -)(-) ( :r y2
20 5 5 - 1 i= 1 '
( L y)2
i =1
40
2.3 En una encuesta de opinin desarrollada sobre los obreros de una fbrica, se
encontr el porcentaje de obreros favorables a cierta regla. Este porcentaje
fu de 38%. Como hab(a informacin suficiente para obtener dos estimacio.nes, se hizo esto y se obtuvo, para la segunda, nuevamente 38%, aunque no
as para sus errores estndar. En el primer caso se encontr 0_07 y en el segundo 0.05. cul de las dos estimaciones es mejor?, d sus razones.
CAPITUL03
~)
muestras posibles se
Nde
( 1 300)
20
1 300!
1 300!
1 280!
20
es de 1 300.
La definicin anterior de muestreo aleatorio simple est en
trminos de muestras; su uso prctico requiere que previamente se
les liste, lo que resulta casi imposible en la mayora de los casos.
Se puede probar (ejercicio 3.6) que seleccionar una muestra b!!i~
estas condiciones, es equivalente a elegir n n.meros alea_torl9s
_?iferentes que estn comprendidos entre 7 y N; los nmeros. __as
elegidos forman la muestra.
-- El que las n unidade7 muestrales seleccionadas se elijan dife41
42
..
Y1.Y2 . . . Yn
..
Figura 3. 7.
43
y= Y1
+ Y2 + + YN =
1: .Y'i
i
=1
44
Tabla 3.1
Nmeros aleatorios
16 99 41
43 34 83
75 61 18
10 30 57
812833
99
23
80
40
05
56 31
42 99
72 61
79 30
75 61
28 76
06 39
42 89
65 93
21 33
26
84
22
49
19
73 19 15
31 61 29
99 28 05
42 75 51
36 05 37
57 44
39 99
07 47
19 54
30 84
94
99
07
93
80
78 53 31
72 15 95
12 45 96
32 47 05
15 43 91
66
21
72
82
52
07 92
55 17
44 26
59 05
51 78
02 98
89 53
82 09
62 75
58 99
59
16
42
24
04
71 79 85
56 69 09
12 61 62
36 84 19
03 75 71
3510
40 91
55 05
11 21
34 50
66
40
41
43
75
80 13 31
59 94 08
62 26 89
3618 06
83 55 66
30 09
38 68
09 89
0814
36 27
65
75
13
55
51
32 06 21
20 90 19
27 30 01
62 84 68
28 5548
28 93 23
78 48 34
314347
78 16 59
41 74 80
13
58
21
22
03
08
17
58
63
94
42
11
65
76
39
37 72
60 83
19 63
92 57
88 07
68 78 75
77 4813
54 88 95
116988
65 91 35
47 51 41
81 62 79
27 69 08
47 30 38
05 53 18
76
93
85
47
61
50
98
27
43
65
65 67
46 95
81 68
62 78
08 73
86
53
11
48
20
77
64
39
84
92
04
22
27
69
33
45
Persona
10
Sexo
Nombre
Mario
Juan
Ral
Gloria
Cosme
Carlos
Luz
Ernesto
Rosa
Norma
1
2
3
4
5
6
7
8
9
No. letras
Y1
Y2
=5
=4
Ya =4
=
Ys =
Y6 =
Y1 =
Ys =
Y9 =
Y4
Y1
6
5
6
3
7
4
M, X1 =o
M, X2 =o
M,x 3 =O
Z2
o= 5
y=
49;
i= 1
=4;
=3
=2
= 2
=2
W3 = 2
W4 = 3
W5 = 3
w6 = 4
W7 = 2
Wg = 4
W9 = 2
W
W2
=2
= 3
Z5 = 2
z6 = 2
Z7 = 1
Zg = 3
Z9 = 2
Z10 = 2
X4
Z4
Z3
= 1
M, X5 =o
M, x 6 =O
F, X7 = 1
M, Xg =o
F, X9 = 1
F, x 10 = 1
F,
No. consonantes
5;
4;
4;
6;
5;
6;
3;
7;
4;
5;
No.
vocales
22;
Wo
:E
= 3
27
i6 que es igual a
:E y-
~
i= 1 1
Y=y=-n~
3.1
Y"
46
2:: Y;
Y=NY=Nj~
3.2
1~ 100 = 403.
=p
-1003
n
3.3
' R
.
descamas estimar
una razon
= Xy
27
En general, si
.
de 1as
ut11izamos e1 cociente
, .. 1
*R=---=
n
:E
i"' l
3.4
2::
= l
};
X
f"' l
n
"' Debemos observar que con la notacin de la labia 3.2,
i"h
i= n
1=11
cociente de 2:: z a ~ w. En la ecuacin 3.4 hemos usado I: y a I: x notacin que
i=1
1=1
i=1
i=
i=n
3.5 CONSISTENCIA
DORES
3.1
E INSESGAMIENTO DE
47
LOS ESTIMA-
1 =N
Ni= 1
1 i=n
y= -
L y; al
n= i
i=n
i=1
y= -
i=n
n .::
=1
' - 1
=N
* En el ejercicio
-~ Yi
i=n ( i=N
.~
j=
i=n
= - .~
n '-
E (y)
probabilidad de que) (
n~ sea el~gida en las
primer~s- 1
extracciones
1- 1
1-1
i= i
Probabilidad de que
))
( la unidad sea elegida
en la j-sima extraccin
i~n ( i~N Y
n =1
i= i
N - j
N
))
probabilidad de que
lo sea en laj-sima
1) (N - 1. + 1)) *
J
1)
48
=i
=i
.1) = _l_n
iiN
nN
=
y.= y
i
E(Nj/) = N(E(j!)) = NY = Y
Entonces y y Ny son estimadores insesgados de Y y de Y
respectivamente. Para el caso de proporciones o de porcentajes, con
ayuda de la variable auxiliar se encuentra que el total de unidades
i =N
en la poblacin, con la caracterstica de inters es A = y;
j=
N =1
'
;=1
como
49
Ejemplo 3.1 Para una encuesta sobre la industria de la fabricacin de nieves y helados en la ciudad de San Luis Potos se
dispone de un listado de 342 empresas con el nombre y direccin
de cada una de ellas. Se tiene la idea de que la mayora de esas
empresas, las cuales son relativamente pequeas, adems de fabricar
el producto lo venden al menudeo. De manera que una primera
estimacin a hacer, se refiere al porcentaje de empresas que fabrican y venden su producto al menudeo. Otras estimaciones que se
desean obtener son las siguientes: nmero medio de empleados por
establecimiento y el total de ellos en las 342 empresas.
Se numera consecutivamente el listado de empresas empezando
con 1 y terminando con el 342 y posteriormente se elige a 15
nmeros aleatorios diferentes entre 1 y 342. Los establecimientos
en la muestra resultan ser aquellos con los nmeros 11, 129, 50,
85, 341, 320, 294, 7, 330, 329, 265, 237, 266, 71 y 280, los
cuales se marcan en el listado y se prepara una lista separada de
ellos con sus nombres y direcciones. Se hacen las visitas correspondientes y se obtienen los siguientes resultados para las empresas
que fabrican y venden el producto al menudeo:
011
Establecimiento
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
No. de empleados
3 1 5 2 7 2 2 1 2
50
~ y
36
y=~= 15 = 2.4 empleados por establecimiento
S1
guntas y para ello hay que calcular las variancias de los estimadores.
Obtengamos la variancia de la media muestra! aplicando la ecuacin
2.5 y recordando que la esperanza de la media muestra! y es la
media poblacional Y.
i) Variancia de la media muestra!:
= n2 E
~~
1-l
1 ( I:
n
= ~
n2
;=1
Yl +
; yy1 ) =/=
'
para obtener esta expresin se han usado los resultados 2.2 y 2.3.
N
Recordando que E(y;) = (1/N) .l: y:
J= 1
n1N
V(y) = n2 ( l: -N I: Y i
;=1
j=
I:.
1(nN
N E1
= n2
Y1
+ n (n -
1 N
n-1
I: y~+
nN ;=1 J
nN(N - 1)
l)~
1 -1-)-r
le =/=1 YkY1 N N - 1
N
= -
Pero: (I: y) 2 = I: yJ
1e
; Y1eY1 =/=1
Y2
52
V(y)
V(y) =
1
nN
~1
Y -
n-1
nN(N - 1)
~ 1
n-1
Yl
+ nN(N=-1)
N )2 -
(
1
~{1
n - 1 ) N 2 + n -- 1
(}.;
)2 _
( 1
nN - nN(N - 1) ~1 YJ
nN(N - 1)
Y
_
N-n
- nN(N - 1)
N- n 1
=---
N n
l::
i~1 y~ + }12
Y/ -
NY2
N-1
5
=n
Y2
y2
n-N
n (N - 1)
~ (y - Y)2
Nn
1
;=1
=
----N n N-1
5
1 -n- ) =-(1-f)
N
3.5
J) por lo
V(Ny) = N2 V{Y) = N2 52 (1 - f)
n
3.6
iii) Variancia de p:
En el caso de un porcentaje slo hay que expresar 5 2 en
trminos de P y Q, donde Q vale 7 - P, de la manera siguiente:
L Yi -
52
_ ;=1
( ~ y)2
.....t.=L
N
N-1
NP- (NNP)2
N...,-1
S3
NPQ
=N-1
de donde:
NPQ 1 - f
V(p) = N-1
n
3.7
iv) Variancia de R:
dor
V(R)
=nX
1 _:-- f
(y - Rx)2
__ __c_i_ _ _ _ __
3.8
N-1
Sin embargo, dada una muestra no podemos encontrar o calcular el valor particular de las variancias anteriores ya queS'i"s
requieren co~ocer earmetros eoblacionales gue slo se_.J?.~.~_ge.
obt~n~r IT)ecJJ<!D_te __ un. ceng. ~_olucin ~g~.-~!!..J?.!...C?E.C>.!:l~r.
~stima_dores _d~ __ e~os par~m.etros.1. basados en lo~~-~!!,~9..9.~ d_e la
muestra.
Por ejemplo, si sobre la tabla 3.2 deseamos calcular V(Y) la varianza del nmero medio de letras por nombre, entonces, de acuerdo a
la ecuacin 3.5: n vale 1O, N vale 100, ~ = 1100 = 110 , uno de cada
n
9
d ..
1ez. 1 -/V=l
1
. ; . ( 1 - f)
52
= -N-1
=N
~
(y. - Y)2
'
1 -9
= 10 10 =
1
( =N )2
(=N
= - - . ~y~
N-1
9
100
'
~ Y1
54
La solucin consiste en utilizar la misma muestra de que disponemos para estimar u obtener aproximadamente el valor de la varianza
verdadera. Y nos referimos a ella como un estimador de la varianza verdadera. En la situacin de una media o de un total estimamos aproximadamente a 5 2 , y en un porcentaje estimamos a P. En las lneas
siguientes se proponen estimadores para cada una de las varianzas
anteriores. Consecuentemente, las ecuaciones propuestas 3.9, 3.9.1,
3.1 O, 3.11.1 y 3.11.2 sern las que se usen en la prctica para obtener
varianzas, errores estndar e intervalos confidenciales. En tanto que
las ecuaciones 3.5, 3.6, 3.7 y 3.8 deben ser vistas como un paso
necesario para obtener al conjunto de estimadores de varianzas
(3.9, 3.9.1, 3.1 o, 3.11.1 y 3.11.2).
.~
s2
""''-
v";) = 1 n- r
\Y
~~ {":>\'-"-""-'
!.._\.~0.
(y - y
1
"'
~-1-
3.9
------
_1_ (~ ~ _ (~ ytl 2
n-1
y,
n
1 - f
i= n
=----
52
~f
=-(l-f}
n
1 (~
i~N
i=1
SS
Ny es obtenido mediante el
El estimador de variancia de
resultado de la expresin 3.9:
V(Ny)
N2 V(ji)
N2 52 (1 - f)
n
3.9.1
(1; y;)Z
n
este estimador de variancia es insesgado de V{Nji) por ser una
transformacin lineal de V{.Y).
V(p)
N-n
l)Npq, y a que:
=(n -
V(A) = N(N -
n) pq
n-1
V(R) = 1
=
f
i=n
1 -f
nX 2
"f1""=T
Rxi) 2
3.11.1
n-1
nX2
V(R)=
""
!: {y -
(1: Yt - 2R 1: YX;
R 2 1: xf)
Tabla 3.3
Estimadores Aplicables a Muestreo Aleatorio Simple
Parmetro
Media
Total
Estimador del
Parmetro
-
1 n
y=- L y1
=1
a
n
p =- 100
t.11
'
Porcentaje
a
n
V(y) = (1-f)
=NSPQ il:!J
Razones
n
~
i=1
1-f
V(R) = -.=-2
nX
X1
i=t
(y-RX) 2
N-1
Nv + t(V(Ny))1h
N-n
(n-1)N pq
1f
V(R) = _:_
A
nX2
+ tlV!pJJ1h
.A+ tlvt.AJJ h
1
n
L
i=1 (y-Rx) 2
A
n-1
* Para obtener
(1-f) N 2 s2
V(A) = N(N-n)
n-1
pq
V(p) =
n
A
i=1
R=-~-
V(Nji) =
N-1
v + t(V(vJl1h
V(Ny) = (l-f) N 2 S2
V(A)
A =N-
Intervalos de confianza*
s2
V(y) = (1-f) -
s2
=1
- N n
Ny=- k
Estimador de la
Variancia
ii + t(VtRll1h
51
- 1-=_f ..._~_.1_
V(R) -
_,,,{y'--''---R_AX_,'-!.-)2
3.11.2
n - 1
1-f
V(R)=
en la cual
nx2
nx2
x es
n-1
la media muestra!:
TABLA3.4
Frmulas para el clculo de varianzas estimadas (m. a. s.)
Parmetro
1-f
-
Media
_1_ &v~1
n-1
N 2 (1-f)
Total
1-f
nX2
Donde
-1-
n-1
11
(l:
vJ -
R= ~X
!!_
yi)2 )
i)
ii)
(~y
n
-1- (l:yfn-1
Razn
Proporcin
Se requiere
Estimador
)2 )
11
i)
i)
58
~~:) =
3.12
*Para un tamao de muestra pequeo, t debe ser buscado en las tablas de la distribucin
t con n-l grados de libertad, ya que la variancia es desconocida.
Intervalos de confianza 59
&
r
A
49
= y = --~.LJ = 10
= 4.9
-
v.
S2
s2
V(y) = (1 - f) - = (1 --- f) n
n
1o
11
= (l - 1b) 1
L (y; -- j/)2
--,-::::r---
60
o (~ Y~ -
= 1
(~ :
d)
_1 (253 - (49)~ )
100
10
0.129 (letras/nombre) 2
letras.
P= P
e.e.(p)
a
= "
100
10100 = 40%
N-n
tA
((n - 1)N pq) 2
100-10
))112
= ( 9 (100) 40(60
= 15.5%
d} Estime el nmero de vocales por consonante y encuentre el
error estndar de su estimacin.
Intervalos de confmza 61
A
~ Z;
R= ~
W;
22
.
27 = 0.81 vocales/consonante.
= (
= (
90
100
~
2
(10)(2.7)
2
Z;
)1Az
2R ~
ZW
+ R 2 ~ w~)~4
62
Intervalos de conf"lllllZa 63
porque la enfermedad evoluciona a travs del tiempo y se observaran razonablemente cosas diferentes entre personas diabticas que
han contrado la enfermedad recientemente y aquellas que la tienen desde hace varios aos.
Ejemplo 3.4. En una encuesta a varias etapas ha quedado seleccionada una oficina (conglomerado) con 475 empleados, y dentro de
ella es necesario seleccionar a 25 empleados para una muestra aleatoria simple. El responsable de la oficina nos proporciona un listado de
su personal en el cual slo figuran los nombes. Para efectuar el sorteo y asegurar la identificacin nica de cada empleado podemos
numerarla del 1 al 4 75. Usando la tabla 3.1 de nmeros aleatorios
y empezando en la esquina superior izquierda a partir del 169 {lpor
qu tres columnas?) la muestra sera la siguiente: 169, 433, 103, 124,
~g5
is
r=
'1
' 2 -
25 TO = 2so
64
1 001
1 002
9 811
9 813
9 910
1 317
1 318
1 319
9 912
9 913
2 040
9 918
9 911
cmo seleccionara una muestra aleatoria simple sin remplazo de tamao 10?
3.3 En una encuesta desarrollada sobre una poblacin de 1O 000 familias, se
tom una muestra aleatoria de 40 de ellas, de manera que la fraccin de
40 = 1 es d ec1r
. se entrevisto
. , a una f ami11a de
muestreo f ue d e 10 000
250
cada 250. El nmero de personas que trabajan y el nmero total de
miembros en cada familia de la muestra aparecen en la tabla 3.5.
Estime: a} El nmero medio de personas que trabajan por familia y
encuentre intervalos de confianza del 95%
b) El total de personas que trabajan y d una estimacin del error
estndar.
3.4
3.5
Ejercicios
65
3.6
3.7
3.8
3.9
Un grupo asesor de una escuela tcnica piensa que los planes de estudio
del plantel estn un poco desactualizados y, mediante- una encuesta sobre
los egresados de ella, piensa derivar resultados que le ayuden en su
reestructuracin. Las preguntas que se deben formular, van dirigidas para
aquellos egresados que estn trabajando como investigadores. El listado
muestra 638 nombres cada uno con su direccin, de ellos se elige una
muestra aleatoria de tamao 20. Al hacer el trabajo de campo, los
entrevistadores preguntan al egresado si es o no investigador. Si responde
afirmativamente le hacen la entrevista y en caso contrario no la hacen.
Al devolver los cuestionarios, el grupo asesor encuentra que 18 de los
egresados en la muestra se calificaron como investigadores. Y as, emite
instrucciones para que en el procesamiento de la informacin, en el
clculo de porcentajes y medias se use como tamao de muestra 20.
i) lCree usted que est bien definida la poblacin objetivo? Indique sus
razones.
ii) En el supuesto de que la poblacin estuviera bien definida, lsera
correcto usar el tamao de muestra de 20 que indica el grupo
asesor?
3.10 En cada cuestionario de un conjunto de 800 provenientes de una
encuesta agrcola existe un dato de un porcentaje referente a una
cual id ad de la parcela agrcola. Los cuestionarios no han sido procesados
an, y se desea tener alguna idea del valor de ese porcentaje en los
diferentes cuestionarios. Para ello, aprovechando su numeracin consecutiva se elige aleatoriamente a 60 de ellos y se estima el porcentaje
teniendo ste como valor 323. Otra persona dice que la muestra fue
muy pequea y decide aumentarla a 120, calcula el porcentaje y obtiene
como valor 33.43. Una tercera persona aumenta el tamao de muestra
hasta 250 y encuentra como valor estimado a 32.93.
lQu comentarios puede usted hacer respecto a los valores obtenidos
en las diferentes muestras?
Tabla 3.5
No. de familia
No. de personas
que trabajan y
1
2
3
4
5
6
7
20
21
22
23
24
25
26
27
28
7
5
1
9
8
8
5
7
3
4
4
8
11
4
7
3
3
3
2
5
4
9
6
6
7
6
6
1
1
1
2
3
1
1
1
29
5
5
9
8
1
3
1
7
1
1
37
38
39
40
1=1
30
31
32
33
34
35
36
40
1
3
1
1
1
2
1
2
3
1
1
1
1
1
4
1
3
2
1
2
2
2
9
10
11
12
13
14
15
16
17
18
19
E Y1
No. de miembros
4
6
1
7
3
3
6
9
6
3
= 73
l: y~= 207
E Y,X
= 413
i=40
l:
11
"' = 220
E~= 1436
66
Ejercicios
67
3.12 En la urna del ejercicio 3.11 la muestra aleatoria es extrada sin reposicin. lCul es la probabilidad de que b canicas (b ~ n ~ A + 8) sean
blancas? lCul es la distribucin del nmero b de canicas blancas en
cada muestra de tamao n? lCul es la media y la variancia de esta
distribucin?
3.13.En el apartado 3.5 se deriv la esperanza de la media muestra! y al
hacerlo se afirma que: "la probabilidad de que no sea elegida en las
- 1 extracCJones
" es N-j+
. ' uste d de acuer do.?
primeras
N 1 , testa
3.14 Una escuela tiene 20 salones en la planta baja numerados del 1 al 20 y
16 en la planta alta numerados del 1 al 16.
i) Indique brevemente cmo numerara o identificara a los salones
para seleccionar una muestra aleatoria simple de tamao 5.
ii) Utilizando los nmeros aleatorios siguientes y avanzando de arriba
hacia abajo, obtenga los 5 salones en la muestra.
Nmeros aleatorios
74
50
90
98
25
01
46
81
41
31
11
39
25
04
CAPITUL04
N) s:
* Aunque ya vimos en 1.5 que en ocasiones el mtodo de medicin aunado a otro tipo de
~ventualidades no permiten llegar al valor correcto.
69
70
y
E(yl=Y
Figura 4.1
~6
),
aunque no
2 ~.
P!ecisin estadstica
71
complemento a 100 de color verde,sin duda seguiramos apostando a que la canica extrada es verde, ya que en el peor de los casos
hay 90 verdes contra 10 rojas. Si la proporcin la movemos ahora
a 80 verdes y 20 rojas, posiblemente sigamos apostando a verde.
Pero si ahora ponemos 60 verdes y 40 rojas o 50 verdes y 50 rojas
ya no es fcil tomar la decisin para la apuesta. En el ltimo caso
tanto las verdes como las rojas tienen probabilidad de un medio
y se vuelve una lotera. Por ello decimos que las confianzas ms
empleadas sern del 80% en adelante, digamos.
Como la desviacin estndar del estimador est dada por el cociente entre el error estipulado y el valor de la abscisa t en la
distribucin normal que nos deja en la parte central de la curva
una rea lgual a la confianza especificada se verifica que
V= (~-)2
t
error d
Precisin
1~onfianza e
desviacin estndar
del estimador
variancia del estimador
recursos disponibles
72
dinero y deseo desarrollar una encuesta para estimar tal (es) parmetro (s). lPara qu precisin me alcanza?
J7 de la media poblacional
_
5 (
V{y)=--;
n) ~V= (d)
1-;
t 2
es decir,
S2 52
---~V
n
N
'
y despejando n tenemos:
52
52
= _ _v___
n;;;i. V+52
1 52
1+(-)N
N V
4.1
52
no=-=
52 t2
-2-
d.
no
n=---
} 4.2
1 + !?..Q.
N
Las expresiones 4.2 constituyen las ecuaciones necesarias para encontrar el tamao de la muestra cuando se desea estimar un valor
medio. Primero se determina n 0 y posteriormente se corrige este
valor con la ecuacin para la n. La n as determinada es el tamao
de la muestra necesario.
Ejemplo 4.1 En un archivero hay 60 expedientes, los cuales
contienen un nmero variable de hojas cada uno, un censo practicado en ellos muestra lo siguiente:
73
Tabla 4.1
Expediente No. hojas
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
1
1
1
21
22
23
24
25
26
27
28
1
3
5
5
4
2
3
3
'
6
9
3
5
7
1
1
..
5
5
6
3
4
2
2
1
41
42
43
44
45
46
47
48
49
50
51
52
53
3
5
4
6
1
3
3
3
2
1
2
2
54
3
5
3
3
3
2
29
30
31
32
33
34
35
36
37
38
39
2
2
2
3
2
8
9
5
1
1
fi9
40
60.
..
L Y;= 198.'
55
56
57
58
vr= 900
Y=
N1 LN
Y; =
198
60 = 3.3 ho1as/exped1ente -
~ poblacional 5 2 vale:
52 -'-L (y - Y) 2 = L y~- N
-
N--1
Y2
N-1
= 900 - 60(3.3) 2 =
60-1
4.18 (hojas) 2
Queremos encontrar el tamao de muestra necesario para estimar el nmero medio de hojas por expediente con un error no
superior al 20% del valor de Y y una confianza del 95% o sea:
74
= __
no"-+~
= 0.66
hojas y t
38.4
1-+-38___4_
60
= 1.96.
Por comodidad
= 38. 4
1-+0.64 =
23 4
';J
seri'a n
= 39
y la fraccin de muestreo f
=6 ~~O = 15~.
Por otra parte, si en lugar del error anterior del 20% pedimos
el 5% se tiene d = 5% {3.3) = 0.165 y para la misma confianza,
obtenemos n 0 = 614.l. y n = 55. Es natural el aumento necesario
en el tamao de muestra ya que se requiere mayor precisin.
_ Nz .
= (~ 2 , entonces:
V(N y) = - n 52
- (1-
no=
N2 52
V
(d)
n) ::;. V = t
:;
luego:
4.3
15
no
= (60)2
(4.18) = 15.72
(39~6)2
1.28
15 72
= 12.46
1 + 15.72
60
= 13.
!Y_~_!l_ ~ V =
V(p) = '!_ _Q
N- 1
(!!_t )
y usando N en vez de N - 1 :
PQ
n
PQ
-N
~V,
de donde:
n 0 = fv_.Q; n = __!!...-._
+ !!~
N
4.4
76
[ problema es
determinar el ta
mao de muestra
para estimar:
. 7
52
N2 52
-y
7
PQ
V
i~
no
(1.)2
2
,, =
400
52.17
+ (400)
60
* Las expresiones
no
cuando P, Q y d estn
expresados en porcentajes y cuando lo estn en por unidad, en este ltimo caso P y O
toman valores entre O y 1.
600
6 000
60 000
600 000
6 000 000
= 4%
t= 2
f =
240
375
398
400
400
!1.
240/600
375/6 000
398/60 000
400/600 000
400/6 000 000
En promedio una
unidad de cada:
2.5
16
151
1 500
15 000
P=50%
Figura 4.2
78
79
80
81
usted
82
83
37. En qu lugar catalogara usted a nuestra universidad comparndola con las de todo el mundo?
38. En qu lugar la catalogara usted dentro de las universidades latinoamericanas?
39. cuntas recmaras tiene su vivienda y cuntas camas hay
en cada una de ellas?
40. Para el diseo y manufactura de su material didctico, 1e
proporciona la universidad todo el material que necesita?
lCmo o dnde aprendi a disearlo?
lQuin se lo patrocin?
84
85
50 000
no = (50)2-
= 80
de donde:
n=
80
80
1 + 2000
= 77
11 =
400
---------400
1 + 2 000
- 334
86
Tamao de
muestra
77
98
334
300 200
200 370
lJ11r1'11'1111
HI
Tabla 4.3
----~-
------
1
2
3
"n
IS
7
6
4
2
3
2
Expt1rliot1t(I No.
"
10
'J_
11
1
'J
2
1
12
13
14
115
16
lro/11.~
rx11111llm1tr1 No.
lwj11s
-w--
1
1
1/
1B
19
20
21
22
23
24
3
6
2
1
5
3
5
3
88
CAPITUL05
R=
L y=
_y
LX
LX
n
*En el cual el denominador es una constante.
89
5.1
90
V(R)
=1 =f
nX2
(y - R
N- 1
X) 2
5.2
V(R) =1 -
nX2
V(R) =
~ (y - R
n- 1
X} 2
1 - f ~ y~ - 2 R ~ Yi X + R 2 ~
nX2
n- 1
An
xr*
5.3
Tabla 5.1
V
3
5
6
5
5
4
4
5
7
2
2
3
4
2
2
7
9
7
7
7
4
4
5
5
6
3
3
2
2
5
5
1
3
2
2
3
6
10
6
4
5
7
6
6
9
6
5
3
3
4
4
4
3
5
~ y ==
236;
~ y 2 ==
5
5
6
6
5
8
6
6
8
5
5
1
1
3
3
3
2
2
3
1
1
2
1494;
~
Yi
X ==
~ X ==
115
~ X~==
J
401
2
2
685
236
V(R) == .!..=l' ~ Y~
- 2
nx- 2
R ~ yX;
R.2 ~ x1 ==
n- 1
40
,l - ( 3 000) 1 494 - 2(2.05) (685) + (2.05) 2 (401)
==
==
40-1
40 (115 )2
40
0.028
==
0.167 miembros/auto.
92
{R -
t (V(R)) 112
R+ t
(V(R))Y2 }
5.4
2.05 + 2(0.167)} ,
{ 1. 716 , 2.384}
y = ;~
Una estimacin del peso total de las piedras en todos los sacos
la obtenemos mediante Ny:
Tabla 5.2
No. de
saco
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
2
2.5
1.5
1.5
2
47
46
46
48
47
50
50
51
49
49
48
50
49
48
45
47
46
49
50
48
48
48
46
50
50
2
2.5
2
2
2
2
2
2.5
3
2.5
2
3
2
1.5
1
2
2
2.5
2
53
21
22
23
24
25
Totales
~
Peso de la
semilla en
kilos
20
Y= 1 000(2.12)
Peso de las
piedras en
kilos
1 205
53
= T20s
= 0.044
5.7.
94
~
YR
Y;) <X-
L =(-
5.5
LX
95
yR
n
=~X
n
~X
5.6
V(Y8
)::
1-f ~ (Y;-Rx)2
N-1
V( Y' ) = 1 - r f
R
5.7
{y -- k x;) 2
n- 1
Y, y la expresin
5.8
96
V( YR)
=N2
X)2
N"-1
n
...
(1 - f) ~ (y - R
n
n-1
X)2
5.9
5.10
5.11
p.= .:=..i.100
'
100
5.12
97
-y"
d
YH
5.13
k__
=_1_ _
nd
v(Yd)= 1-fd
nd
k=1
nd
s2
5.15
98
ttDfta
''
.
.
.
.
.
.
.
.
............................ ~
a
nat
.
t
~lt ll ll +~a .... ~
j f ...... j H HH
Muestra aleatoria
5.16
99
nd
Yd = - ~
n k=l
V(Yd)
Ydk
} 5.18
n
N2 (1; ) (s,1)2
en la cual:
k =nd
(le
1
=nd
(s~ )2 == 1:_
Y~k n --1 1e-1
(~
k=,; ydk
)2
100
No. del
hotel
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
No. de
turistas
en la fecha
dada
80
50
60
45
15
20
25
20
15
10
14
20
25
33
80
No. total
de
cuartos
50
30
60
20
10
15
15
17
13
20
10
12
15
14
38
25
20
20
15
25
10
21
22
23
24
60
35
20
23
36.
18
44
40
39
. 25
90
30
50
26
27
28
-~
12
10
5
12
13
10
10
10
15
10
13
17
20
30
31
20
22
iEI hotel
cuenta con
telfono y
estacionamiento?
s
s
s
s
s
no
s
s
no
s
no
no
no
s
s
s
s
s
s
s
s
s
s
s
s
no
no
no
s
no
s
101
No. de
turistas
en la fecha
dada
N&del
hotel
32
33
34
35
36
37
38
39
No. total
de
cuartos
25
20
20
80
40
20
30
32
140
85
20
7
40
41
42
43
44
45
46
47
48
49
50
s
s
s
s
s
s
s
s
s
s
s
13
16
9
14
19
31
41
16
23
17
6
8
10
12
14
12
18
Totales
iEI hotel
cuenta con
telfono y
estacionamiento?
no
10
15
10
s
s
s
s
s
s
s
10
12
14
9
1 507
1 016
t:(~-,
Y= -'' :.
.': f)
~,d.
r. y2
= --
. ;. 52
.
.":'
..
(:'.' Y;)l
----,;1-
"""". -- --~-- --
. .; -- l
,
80 337 -
(1 5o7) 2
- 50
50-1
= 712.57
Entonces
la vada1u.::ta.
(!e Fes:
.
.
.
.
~
<
102
-"--
k~I
yd
Ydk
nd
1 367
40
=--
Yd
=r;
nd
k:i Ydk
900
50 (895)=16110 cuartos
(s~)2 = _1_
n - 1
_(~:
yd,.)2) == 50
1 (28 993 n
(28 993 - 16 020.5) == 12 ~ 2 5 = 264.7
n - 1
1
49
103
(~~5)2)
Entonces:
A (A ) (900) 2 (1 yd 50
9ii~ )(264.7)
L;
12 086 cuartos
Ls
16 11 O+ 2(2 012)
==
20 134 cuartos
104
105
=a +
(b - a)r
* Cuando es necesario muestrear sobre archivos magnticos en los cuales los registros
aparecen seriados, generalmente es factible el uso del muestreo aleatorio simple, ya que
slo es necesario generar los nmeros aleatorios con los cuales se conformar la muestra,
ordenarlos y posteriormente avanzar sobre el archivo contando y detectando a los
registros en la muestra.
106
107
Tabla 5.4
Ferre ter fa
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
Tiene el
artfculo
no
no
no
Est clausurada
s
no
s
no
no
s
Est cerrada
s
s
no
s
s
s
19
20
21
si
s
22
23
24
s
no
25
26
si
'}7
si
s
28
29
30
Observaciones
s(
Ya no existe
108
El nmero
n. Sea
=1
Yi
Y=,V=-'-n_ __
E(J7)
=-~Y;
E(ji)
= }?
;= 1
E(t;)
= -n
~Y;-
;= 1
Ejercicios
109
V(ji)
n2
=
N
n2
1
=-
n2
t y} =
V(~
L
;= 1
V(t)
N
2 n
L y. i=1
'
N - 1
;<
- 2
1 1 \ ' )
Cov Vu,,1
Y ~. y
1
N
~
;<i
n
Y; Y
N2
N - 1 52
=---
(y; - J712
v(.vi =
;=1
n- 1
5.1 O EJERCICIOS
5.1 En el apartado 5.2, la poblacin de nios a que se hace referencia es la
formada por aquellos nacidos en un sanatorio determinado y en el cual
se llevan estad lsticas de los recin nacidos. En una semana nacieron 2 000
nios y su talla o longitud media calculada para todos ellos fue de 46
centlmetros. A los siete meses de edad se elige aleatoriamente a 30 de
ellos, cada nio en la muestra es medido (y) y posteriormente se colectJ
su talla o longitud inicial (x;) a partir de sus fichas de nacimiento. Los
datos son los siguientes, (ver tabla 5.5).
Estime: a) la talla o longitud media de los nios a los 7 meses de
edad, b) el error estndar de su estimador y e) calcule intervalos de
confianza del 95% para la talla de los nios mediante i) la media muestra!,
y ii) el estimador de razn. lQu mtodo es ms preciso?
5.2 En el apartado 5. ?, sobre el ejemplo de las gavetas en los 6 estantes con
240 gavetas en total, se pide estimar el nmero total de tarjetas pertene
cientes a hijos, asi' como el error estndar y dar intervalos de confianza
del 95%. El tamao de la muestra fue de 20 gavetas y el peso total de las
tarjetas en ellas fue de 30 kilos*; la muestra arroj los resultados de la
tabla 5.6.
* 30 kilogramos son iguales a 30 000 gramos, que son las unidades de medida para x en
la tabla 5. 6.
110
Tabla 5.5
Y
Xi
Yi
52
62
73
57
68
38
43
39
42
41
46
44
40
72
38
46
48
74
63
53
53
50
40
47
47
44
48
49
46
52
56
57
45
45
42
70
71
55
59
71
58
50
54
53
51
63
70
60
58
74
48
52
57
70
40
50
37
39
44
48
Tabla 5.6
y:
X:
160 180 190 240 200 150 190 190 240 220
150 120 130 170 160 140 140 120 180 160
y:
X:
200 200 220 240 180 160 190 200 130 170
150 140 170 180 140 110 130 140 120 130
11
I: Y;
I:
5.3. Si y=
.::.._-,y, x = =i , demuestre
n
l: (Y;-Y) (x 1 -X)
1 - f i-= l
COV(x, y)= - - - - - - - - -
N-1
(X, Y}:
g (-x, Y_)
= g (x-,
Y)
+ (x
_X'
(.x,
", aga-
.Y~ -+,.,._Y)
aga-(x,~Y)
v
xxX
~=Y
y= V
(despreciable)
Entonces:
Var [ g(X, y)
= E [ g(X, y) - g(X,
Y)
IYx=X
Ejercicios
=[
0ga~X, Y~2
x
=:X
Var x
+[
Var y
!Y
-y(og~
a~_(x, ~-)
111
oy
;/=x
Y/= y
R,
demuestre que
n
A
V{R) =
1- f
n
""'-
~ (y - Rx)2
i=
N-1
112
Tabla 5.7
No. del
empleado
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
no
no
no
no
no
s
no
s
s
no
s
s
s
s
renunci
s
s
s
no
s
s
s
tiene permiso por 6 meses
renunci
no
no
s
no
s
s
s
no
no
no
s
no
no
no
no
no
Fuman
cigarri //os
s
no
s
s
no
no
no
no
no
no
no
no
no
no
no
s
no
s
s
s
no
s
no
no
no
no
no
no
no
no
s
s
no
no
no
no
no
CAPITULO
MUESTREO
ESTRATIFICADO
114
Muestreo estratificado
La poblacin original de tamao N es fragmentada en L estratos de los cuales el h-simo es de tamao Nh, h = 1, 2, ... L. Cada
unidad de la poblacin aparece en uno y slo en un estrato; y la
seleccin de nh, h = 1, 2, .. . L, unidades en el estrato h-simo se
efecta de manera independiente de las selecciones en el resto de
los estratos. La variancia de la caracterstica en estudio en la
poblacin total est definida mediante la expresin siguiente:
52
Nh
h =J
i =1
(yhi -
Y) 2
N-1
52h
donde Y y Yh simbolizan respectivamente a la media de toda la
poblacin o media general y la media del estrato h-simo:
i=Nh
~
i= 1
h =L
~
=h=1
Yhi
i=Nh
i~I Yhi
-------=
+ N2 + ... + Nh + ... + NL
Muestreo estratificado
llS
Figura 6.2.
116
Muestreo estratificado
1 1
No. Total t
de granjas 221 75 30 400 50
90 60
50
1O 11
63 77
42
12
25
1 183
Agrupando a las regiones _que se encuentran relativamente cercanas se obtiene la tabla 6.1:
Tabla 6.1
Regiones
1y 2
11
111
IV
V
3, 5 y 6
4 muy lejana
7 y 11
8, 9, 10 y 12
De manera ..:ue desde el punto de vista geogrfico una estratificacin posible estara definida por los grupos anteriores, los
diferentes estratos y sus tamaos en trminos del nmero de
granjas son los de la tabla 6.2.
Tabla 6.2
Total
Estrato h:
Regiones:
Tamao Nh:
1
1y2
296
2
3, 5 y 6
3
4
4
7 y 11
170
400
102
8,9, 10y 12
215
1183
1 183
La estratificacin anterior se ha hecho segn un criterio geogrfico, el cual no necesariamente toma en cuenta los diferentes
Estimacin de medias
117
}' = f' - - - - = - - N
y,.,,
6.1.
/V
Y,
118
Muestreo estratificado
V(- ) =V(
Yest
)
V (Ye.t = ~
N hYh)
N
N~ V(-)---:;p:Yh -
L N2
h
2h
(1-!!..!2..)5~
Nh nh
6.2
6.3
en donde:
nh
s~ =
En la expresin 6.1, ;
L (Yhi -
51h ) 2
nh -1
Y,
fh =
~:
Estimacin de medias
119
(~
) 2 de
y1
L
= i=i
Y1;
n1
(1 - fi)
la
n2
Y2
i~I
n2
estratos.
Ejemplo 6.2: En una industria que elabora tapas de plstico
existen 400 mquinas que fabrican ese producto. Las mquinas han
sido adquiridas por la empresa s~gn sus condiciones econmicas a
travs de varios aos y as, existen en el la 240 que son operadas
manualmente y por lo tanto de bajo rendimiento; 100 semiautomticas y 60 completamente automticas, de alto rendimiento.
Se desea estimar el nmero medio de tapas producidas por mquina en la primera semana de junio.
Aunque es factible practicar una muestra aleatoria simple sobre
las mquinas, ya que es relativamente fcil numerarlas y hacer la
seleccin, sabemos que este tipo de seleccin revolvera mquinas
de pequeo y alto rendimiento, por lo que es ms aconsejable
Muestreo estratificado
120
6g, gg
N3
ESTRATO 1
Nmero de tapas producidas
2 600,
1 700,
2
2 400,
1 800,
11
1 700,
2 100,
2 400,
2 300,
1 600,
1 800.
Entonces;
n
i = 1
Yu
= 23 500,
n 1
Y1
11
= 48 010 000, (
Y1
=1
ESTRATO 2
Nmero de tapas producidas
5 200,
8 300,
6 600
Entonces:
L Y2
30 100, L YL
17 900,
24
19 000.
Estimacin de medias
121
Entonces:
L y3
= 60 900,
yJ; = 1 257
.Y1
23 ;go
Y2 = 30
y3
= 60
1oo
5
1 958.33,
= 6 o20
i = 20 300,
V(Y1 ) = ( 1 --
f1 )
n1
12 1 1
(l - 240) 12 12-1 ( LY~ -
(~y 1 ;) 2
12
25 000 )
(1 - o .05} 12(11)
- 1- (48 010 000 - 552 12
132
52
V(y2)
y-,
(1 - f2) -2
n2
(1
- 100
)1
(1 - 0.05)
5-1
_!_.!. (191
5 4
( LY22, - (LY52Y )
122
Muestreo estratificado
3
V(j3) = {1 - f 3 ) -
n3
v(Y3)
o.~5
(1 257 410
- 3 708 8310 )
3 347 167
y el error estndar de ji 3 es 1 830.
=
Con los resultados anteriores podemos calcular la media estratificada y sta vale:
= 5 725 tapas/mquina.
5.725 tapas por mquina es la estimacin solicitada del nmero
medio de tapas producidas por mquina, su error estndar se
calcula de la manera siguiente:
V(.Yest)
= k { Nh ) 2
V(jih)
= ( 24 ) 2
400
111 01 o
Afijacin proporcional
123
n,,
(~"
)n,
= 7,
. n 1 __ N1 n n - N2 n n3 -_ -N3 n
Es dec1r,
N
' 2 ---:: '
N
'
2, ... , L
6.4.
' .; nL
240
100
60
Yest =
Ycst
= (-nl )
N
L L Yhi,
h
6.5.
6.6
donde f = ~ ~s la fraccin de muestreo general o global y el estimador de la variancia se reduce a:
6.7
Sin embargo, 6.1, 6.2 y 6.3 son expresiones generales vlidas
para cualquier afijacin que se use.
6.4 ESTIMACION DE TOTALES
Si se desea estimar el valor total de una caracterstica habiendo
usado muestreo estratificado, usamos la expresin siguiente:
6.8
es decir, para obtener al estimador estratificado del total poblacional, multiplicamos a la media estratificada por el total N de
unidades en la poblacin.
En el ejercicio 6.9 se pide que se demuestre que Yest es
consistente e insesgado del total poblacional. Su variancia es inmediata a partir de 6.2 y vale:
A
6.9
* Notar que este estimador slo es vlido si la muestra fue afijada proporcionalmente al
tamao relativo de los estratos.
Estimacin de porcentajes
125
6.10
Yest
= (-)
11
L ~ y,
h
6.11
sh
6.12
Consideremos que en el ejemplo 6.2 deseamos estimar el nmero total de tapas fabricadas, entonces segn la expresin 6.8:
A
1
pest = { -
h=L
) L
Nhph
h=,
} 6.13
N 2 (Nh -1) nh
6.14
615
126
Muestreo estratificado
Las expresiones 6.13 a 615 se derivan sin mayores complicaciones considerando que para porcentajes la variable aleatoria Yhi
toma los valores de uno o cero, por lo cual slo hay que copiar las
expresiones del apartado 3.6 en trminos de muestreo estratificado.
Si el tamao total n de la muestra se afija proporcionalmente al
tamao relativo de los estratos (afijacin proporcional) las ecuaciones 6.13 y 6.15se simplifican a la forma siguiente:
1
n
6.16
independientes.
Tabla 6.3
Estimadores aplicables a muestreo estratificado, con afijacin proporciona! y muestreo aleatorio simple en cada estrato.
ESTRATO
Media
Total
}'h = nh
s~
V(Vh) = (1 - fh)-
nh
l:
i=l
POBLACION
Yhi
nh
s~
V(NhYh) = N(N-n) nh
Nh"h
NhYh = - l: Yhi
nh =1
nh
_ 1 L
Yest - - ~
~ Yhi
n h=I i=I
"h
J:;
N L
NYest
=-
n h=I
,=t
1-fL
A-
V(Yestl =
nN
N(1 - f)
Yhi
~
Nh sh
h=I
V(NYestl =
n
L
1: Nhsh
h=
Porcentaje
...
......
ah
Ph =-100
nh
Nh -nh
V(ph) = N (
h nh -
1)
PhQ1i
Pest = 1
~n h=1
~ a~I
1- f L
V{pestl = - - 1 ;
A
100
N~
nNh - N
PhQ/1
h=
128
Muestreo estratificado
30 = 10.8'
= 1 45
250
= 30 -
n2
= 19
Estrato No.2
2
Mdico
Casos
10
11
Estrato No.3
Mdico
Casos
Mdico
Casos
2
11
10
3
12
13
3
14
15
16
17
18
19
Estimacin de porcentajes
20 + 17 + 142 + 450 (
~~)
+ 800 (
129
,3:)
= 2 632 nios.
+ (450)2 (1 -
94 - (26)
11
11
450)
+ (800) 2 ( 1 - --12.. )
800
11 ( 1 O)
97 - (33)2
19
19 (18)
= 58 445.35 + 72,499
=
130
Muestreo estratificado
3, 17, 27, 37, 47, 57 y 67. Esto es una seleccin sistemtica la cual
termina con un tamao de muestra de 7.
Ejemplo 6.4. Se desea hacer un estudio sobre el personal que
labora en una fbrica que cuenta con edificios en 15 estados del
pas. El estudio se refiere a opiniones y actitudes de los empleados
y obreros. En la muestra se decea tener representados a 1 de cada 30
empleados y existen en total 42 090 de ellos. Administrativamente,
el personal de cada estado es independiente de la oficina central en
cuanto o su nmina, de tal manera que, las listas de obreros y empleados se tienen para cada uno de ellos. La distribucin del personal
en cada entidad aparece en la tabla 6.5.
TABLA6.5
Entidad
1. Guanajuato
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
Hidalgo
Jalisco
Michoacn
More los
Nayarit
Nuevo Len
Oaxaca
Puebla
Ouertaro
Quintana Roo
S. Luis P.
Sinaloa
Sonora
Tabasco
No. de empleados
Nu. de hojas
19043
429
5 010
1 114
721
474
4415
450
2750
487
150
925
2800
2900
422
635
15
167
38
25
16
148
15
92
17
5
31
94
97
15
42090
1 410
Estimacin de porcent.ajes
131
19 043
42 090
1 403 - 635
429
42 090
1 403 - 14
5 010
42 090
1 403
167
n4
1 114
42 090
1 403 _ 37
ns
721
42 090
1 403 - 24
474
42 090
1 043
16
4 415
n, = 42 090 1 403 = 147
132
Muestreo estratificado
ns
450
42 090
1 043 = 15
n9 =
2 750
42 090
1 403 = 92
n10=
487
42 090
1 403 - 16
n11 =
150
42 090
1 403 = 5
n12=
925
42 090
1 403 = 31
n13=
2 800
42 090
1 403 - 93
n14=
2 900
42 090
1 403 - 97
nis=
422
42 090
1 403 = 14
Ejercicios
13 3
= 1 900,
si = 1 800 000,
Jl2 = 6 ooo,
j/3 = 20 000
Ciudad
No. de Estableci
mientas
48
127
390
Establecimientas mues
treados
5
10
10
Produccin
(kilos)
No.de
empleados
2, 2, 2, 2, 3
2, 2, 1, 1, 2
1, 2, 2, 2, 2
1, 1, 1, 2, 1
3, 2, 2, 1. 1
* Es aqulla que
134
Muestreo estratificado
6.5 En el ejercicio 6.4 indique cules seran los estimadores a usar i) a nivel
estrato, ii) a nivel global.
6.6 En tres ciudades de Mxico se llev a cabo una encuesta sobre la industria
de la fabricacin de tortilla, se estratificaron los establecimientos segn la
ciudad en la que operaban, y dentro de cada uno de los estratos se
tomaron las muestras aleatorias que se indican en la tabla 6.6, registrndose su produccin en kilos para un da particular y su nmero de empleados.
6.7 Estime la produccin total en kilos de tortilla para las tres ciudades del
ejercicio 6.6 y calcule intervalos de confianza del 95% para su estimacin.
6.8 En el ejercicio 6.6 estime el nmero medio de empleados por tortillera e
indique intervalos de confianza del 95%.
6.9 Demuestre que el estimador 6.8 es consistente e insesgado del total
poblacional.
El tamao de la muestra
( dt
)2
= V =
N~ s1 - ~
h N2
nh
Nh
N2
135
s1
y adems:
6.17
En ambas expresiones aparecen los tamaos de muestra correspondientes a cada estrato y deseamos resolverlas para el tamao
total n de la muestra; para ello supongamos que n se afija entre los
diferentes estratos de manera proporcional luego, segn esta afijacin:
Nh2
N2
V= ~ h
52
_h_
(
h
W )n
E
h
N
S~
N2
_h
Resolviendo para n y definiendo a n 0 como se indica, obtenemos las expresiones 6.18 para el clculo del tamao de la muestra
cuando se desea estimar una media poblacional y la muestra se afija
proporcionalmente.
6.18
n ___no_
- 1
+n
N
Nh
N
nh = ( - ) n, h =
1, 2, ... , L
6.19
136
Muestreo estratificado
no
n =---+ no
6.20
Tamao de la muestra para la estimacin de porcentajes. Las expresiones para calcular el tamao de la muestra para la estimacin de
un porcentaje bajo afijacin proporcional son las siguientes:
no
n
=
=
--
NV
NhPhQh
6.21
no
1 +no
N
(~) 2 ,
El tamao de la muestra
137
Entonces:
(240)(180 909) + (100)(2 572 000)
no - --------
---------
400 (500)
= 37.4
y al considerar la correccin por poblacin finita tenemos:
37.4
n "" - - - - - - = 34.2
1 + (37.4)
400
Tomamos n = 35
Los tamaos de muestra para cada estrato resultan ser de:
n1
240
= 400
35
= 21
100
n 2 = 400 35 = 8.75
n3
60
= 400
35
= 5.25
180 909
(_D_Q )l
2
y tambin:
= 2.89
138
Muestreo estratificado
2.89
= --2-.-89- = 2.86.
Tomamos n,
=3
+ 240
2 572 000
(500)2
2
41.15
1 + 41.15
100
n2
10 570 000
no 3
n3
(500)2
2
169.12
1 + 169.12
60
= 41.15
29.15.
Tomamos n 2
= 30
= 169.12
= 44.29.
Tomamos n 3
= 45
Afijacin ptima
139
minimizan la variancia.
Bajo afijacin ptima, las expresiones que se obtienen para el
tamao de la muestra resultan ser usualmente muy complicadas
para su aplicacin prctica. Y aunque se trata de la mejor afijacin, a
menudo se prefiere sacrificar precisin con el propsito de manejar
expresiones de afijacin ms simples y que, sin embargo, en la
mayora de los casos, no se alejan demasiado de la afijacin ptima.
Usando afijacin ptima, se puede demostrar (Cochran, teorema 5.8)
que si la fraccin de muestreo~: es ignorada para cada h, la variancia
de la media estratificada es menor, o a lo ms igual, a la variancia de
la media estratificada es menor, o a lo ms igual, a la variancia de la
misma bajo afijacin proporcional, y que sta a su vez es menor o
igual que la variancia de la media muestral bajo una seleccin
aleatoria. En las condiciones del teorema y si estratificamos esto
significa que lo peor que nos puede ocurrir es equivalente al caso en
el cual hubiramos seleccionado aleatoriamente a las unidades sin
estratificar (captulo 3}. En cualquier otra situacin, col'! afijacin
proporcional obtendremos resultados mejores que si hubiramos
practicado una seleccin aleatoria y, evidentemente, los mejores resultados se obtendrn mediante el uso de la afijacin ptima.
Como hemos visto en este captulo, la afijacin proporcional es
muy simple de aplicar y en ocasiones lleva a estimadore~ autoponderados, como ocurri en el apartado 6.3; adems, arroja precisiones que se encuentran entre aqulla correspondiente a la afijacin
ptima y la correspondiente a una seleccin aleatoria como muestra el teorema antes referido. Por ello, esta afijacin es ampliamente usada y recomendable.
Los conceptos que intervienen o que contribuyen al costo total
de una encuesta son muy variados. En algunos casos el proceso
para conseguir o para construir el marco muestra! resulta sustancialmente costoso; por ejemplo, es necesario contar con un listado que
contenga aquellas industrias de transformacin que interesan para
poder desarrollar una encuesta sobre ellas a nivel nacional. Parece
relativamente fcil acudir a tal organismo pblico, en el cual
140
Muestreo estratificado
sabemos que por ley deben estar registradas las empresas y solicitar
un listado de ellas. Si de esta manera pud !ramos conseguir un
listado y, adems, ocurriramos a otros organismos, los cuales
igualmente deben contar con los mismos listados, obtuviramos las
copias respectivas y procediramos a compararlos, encontrar(amos
una divergencia entre ellos; por ejemplo, varias industrias que
aparecen en un listado no estn en el otro, o si aparecen, estn
registradas en una actividad econmica diferente. Si sta fuera la
situacin, podramos tratar de construir un solo listado combinando los contenidos de cada uno de ellos, aunque en ocasiones son
miles o decenas de miles de nombres y es un problema complicado
el tratar de conciliarlos. De manera que obtener un marco muestra!
adecuado puede significar una tarea laboriosa que requiere mucho
tiempo, equipo y personal.
En otras ocasiones, conseguir el equipo necesario que demanda
el mtodo de medicin aprobado o entrenar adecuadamente al
personal que intervendr en las diferentes etapas, se torna una
actividad crtica en el desarrollo general de la encuesta. Tambin,
en ocasiones, el llegar a un acuerdo sobre el cuestionario que
deber ser usado en definitiva, requiere de una serie de reuniones
largas convocando a personal especializado y que derivan en un
retraso sustancial para todo el proceso.
Los comentarios anteriores los hacemos para hacer resaltar el
hecho de que en muchas ocasiones no vale la pena estar considerando refinamientos matemticos que llevan a la obtencin de
tamaos de muestra ptimos o a mtodos de estimacin complejos
y rebuscados que aunque tericamente producen estimaciones muy
precisas, las aplicaciones o usos prcticos no los requieren o que
son tan complejos que las personas que deben interpretarlos se
confunden_provocando que los clculos se vuelvan ms largos y que
todo el proceso quede ms sujeto a errores.
6.9 ESTIMACION DE MEDIAS Y DE TOTALES
EN SUBPOBLACIONES DE T AMAl\IO CONOCIDO
141
6.22
"hd Yhdi
= L NhdYhd
yd = L Nhd L
j=
h
h
nhd
6.23
s;
142
Muestreo estratificado
Yest
Xest
6.26
Como muestra la expresin 6.26 para la aplicacin del estimador de razn combinado se requiere conocer el valor total del
parmetro X el cual es usado como variable auxiliar, su conocimiento es necesario de manera global sin hacer distincin entre estratos,
y esto es deseable porque generalmente ese total es conocido o es
relativamente fcil obtenerlo, aunque no por estrato, sino para toda
la poblacin. Por otra parte, aunque el estimador en la expresin
6.26 est sujeto a sesgo, ste usualmente es despreciable y, generalmente, puede ser usado aun con muestras pequeas en cada estrato.
Se puede demostrar (ejercicio 6.12) que si el tamao de muestra n es grande, la variancia del estimador de razn combinado es
de la forma siguiente:
Nh
R(xh
1
-
Xh ))2
6.27
donde
Yest
R=Xest
143
yd
=~
yhd
=~
h
N
-!.
nh
nhd
~ y hdi
t=
6.29
144
Muestreo estratificado
s,,.s
N,,
nh
6.31
~ N~ (1 - fh}
1' nh (nh - 1)
145
6.33
v(Yd)
= n (1 -tl
( nhd) 2
h
Ejemplo 6.9 En los predios ejidales de un estado de la Repblica Mexicana se desea desarrollar un estudio sobre la utilizacin de
equipo de traccin mecnica. Para ello se dispone de una serie de
listados por municipio de ese tipo de predios, conteniendo los
nombres y alguna otra informacin de ellos sobre su localizacin.
El nmero total de predios ejidales por municipio y para todos
ellos aparece en la tabla 6.7,
Tabla 6.7
Municipio
No. de predios
400
175
3
1 320
4
4200
Municipio
10
11
No. de predios
40
392
5 190
1 730
5
150
6
3075
12
13
745
815
7
800
146
Muestreo estratificado
Municipios
Zona
Zona
Zona
Zona
1
2
3
4
7, 4, 9 y 13
5y6
1, 2, 3 y 10
Resto del
estado
Total de predios
6 207
3 225
7 085
2 515
19 032
cen en este ejemplo eran solicitadas a nivel de zona, la estratificacin inmediata fue aquella en la cual se define a cada e:strato como
una zona. Al desarrollar las entrevistas, se encontrar que algunos
predios ejidales no cuentan con el equipo buscado, otros tendrn
una o dos unidades y otros ms de dos. Si se tuviera previamente
alguna informacin sobre esto, sera adecuado formar nuevas agrupaciones de predios dentro de cada zona, para as, por ejemplo,
definir una nueva o nuevas estratificaciones que fueran ms acertadas y aun se pudiera proporcionar las estimaciones como se requieren. Si no tenemos esta informacin consideramos adecuada la
estratificacin anterior y los tamaos de muestra por estrato usando afijacin proporcional son como sigue:
ni
n2
n3
= 6 207
(200)
19 032
= 65.23
; tomemos ni
= 65*
= 3 225
(200) = 34
19 032
= 7 085
(200)
= 74.45 ; tomemos n 3
19 032
= 74*
n 4 = 300 - 65 - 34 - 74 = 127
*En el estudio concreto se usaron estos valores.
147
Zona 1. Tractores:
1
pp 3
o o
o o
2 1
o
o
o
o
1
pp
pp
1 2
1 1
o o
o o
o
o
o
o
o o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
3 1
Zona 1. Camiones:
oo
pp 1
o o
o
1 1
o
o
3
o
o
pp
o
o
o
o
o
pp
o
o
o
o
o 1
o o
o 1
o o
o
o
o
o
o
o
o
o
o
o
o
No. de tractores
100
No. de camiones
55
51+8+100+4
62 + 33 + 67 + 124
163
---= 0.57
286
148
Muestreo estratificado
Y<t
13 + 4 + 55 +o
62 + 33 + 6-7 + 124
=
0.25
72
286
--=
6.12 Obtenga la expresin 6.27, de la variancia del estimador de razn combinado en muestreo estratificado.
6.13 Usando una variable auxiliar que tome como valores uno o cero segn
que la unidad se encuentre o no en el dominio d-simo, muestre que la
ecuacin 6.31 es un cociente de medias estratificadas, y que, por lo
tanto, es de la forma del estimador de razn combinado en la ecuacin
6.26.
6.15 En el ejercicio anterior, 6.14, y usando el estimador de razn combinado, estime el nmero total de tarjetas asociadas a los hijos y calcule una
estimacin del error estndar. El peso total de las tarjetas en todos los
Ejercicios
149
Estado
2
3
4
5
6
7
Nh
nh
Yh
- *
Xh
ah
400
100
200
100
150
300
200
10
6
7
6
7
8
7
710
500
829
817
786
660
815
464
334
545
547
496
402
490
87 002
22 500
20 804
7 151
2 595
4 916
5 366
(~ Yhi) 2
5 390000
1680000
4920000
4 110 000
4490000
3 640000
4 770000
50 410000
9 000000
33 640000
24 010 000
30 250 OOQ.
27 040000
32 490 000
6.11.
Tabla 6.11
No. de establecimientos
Establecimientos
en la muestra
Molinos
Molinostortilleras
No. de empleados en
la muestra
Molinos
Molinostortil/eras
Estrato 1
48
Estrato 2
127
Estrato 3
390
si
150
Muestreo estratificado
6.18 Hace 10 aos se estim el nmero medio de familias por manzana en las
400 manzanas de un poblado. Se pens que este nmero dependa del
nivel socioeconmico de cada una de ellas y, as, las manzanas fueron
estratificadas en dos estratos de tamaos 60 y 340 respectivamente. Se
tom una muestra aleatoria de manzanas en cada estrato y se obtuvo
como resultado:
.Y1 = 25 , .Y2 = 55
s21
=50
'
s 22
= 170
CAPITULO
152
153
154
155
156
M= Mi,
i=J
- 1 n
y= y=- y,
7.1.1
en la cual y
Mi
1 - f (y - ji) 2
V~(-)
y=--,
n
n-1
7.1.2
i=n
Y= Ny =17 L
i=!
Y;
7.2.1
15 7
V(Nji) = N2 (1 - f) !: (y - .V)2
n
n- 1
7.2.2
!: y
ji=--
n
Ahora, sj tenemos en cuenta que el nmero total de elementos en
la poblacin es de M, el estimador de la media por elemento es el
respectivo del total (7.2.1) dividido por M:
. '.:__ _
Y
1 1 n
V= y= M = M ;:; !: y
7..3.1
j=Mi
Yi = !:
= 1
~ 1 - f
v,Y)
=-=-nvt2
~
V(y) =
1- f
M2
~ {y - y) 2
---n- 1
7.3.2
j=n
- - , (!:
n =1
Yt - -n
i=n
donde:
y=
i=N
y
n
!:
M=
!:
i=n
(!:
=1
y)2)
M
=N
" Esta_notacin de doble barra y barra simple hace la distincin entre la media
por elemento V y la media por unidad Y.
=N
y.
Mi= 1 '
l
Y= -
y=
i = N
L
i= 1
158
7.4
7.5
=
V(yR)
A
1 - f
=-nfif2
I:
y - YR
M )2
n- 1
159
Oficina
No. de hijos
menores de
4 aos
Oficina
...
~-
30
15
18
12
15
10
1
2
3
4
5
6
7
8
9
54
12
15
10
80
30
32
20
15
16
18
18
10
54
36
No. de
empleados
No. de hijos
menores de
4 aos
20
30
22
15
20
16
18
20
25
25
11
12
13
14
15
16
17
18
19
20
30
30
42
30
40
24
45
40
25
75
20
~ M =
i= 1
t= 20
20
yl= ~
i=20
20 M
~
y = ~ ~ Yii =
= 1
= 1 j=l
Mi
(~
=1 1=1
1=1
20
~
368,
Mr =
i=
y) 2 = 33 336; ~
734
20
My = 14 241
7 186
Y=
600
20 (lO 000)734 = 2 202 nios/empleado.
v _e
=
(ji) -
600 ) 2
1
10 000
(20)19
[ nk
0.0036 (
538 756 )
33 336 - - - 380
20
0.06 (nios/empleado) 2 ,
n ~ }2
Y;2 - (k
1- f
V(yR) =~
nM
=(
Yl -
-2
2yR ~ My + YR ~ M2
n - 1
600
) 2 - (1- ) (33 336 - 2 ( 1.99)( 14 241)
10 000
20 19
+ (1.99) 2 (7
Estimacin de porcentajes
161
La
PR
PR
= - -1-l 00
n
L M;
V (PR)
f L a; - 2pR L a;M; + PR L M2
=--------------'nM2
n - 1
7.6
(*)
=1
i=l
_,_
M
n
La precisin del esquema de muestreo por conglomerados depende del tamao de ellos y de su estructura interna. Es deseable
que internamente los conglomerados sean lo ms heterogneos
posible, es decir, que haya muchos valores por arriba de la media
general y otros muchos por abajo de ella. Si esto sucede, es muy
posible que el coeficiente de correlacin intraconglomerado (ejercicio 7.3) sea negativo o muy cercano a cero, y as, el esquema ser
ms preciso que una seleccin aleatoria de elementos o tan preciso
como ella. Sin embargo, en la prctica ocurre muchas veces que los
conglomerados ya estn formados, tienen una cierta estructura y
no se les reconstruye a la hora de la seleccin, como posiblemente
*En las ecuaciones 7.6, a representa el nmero de elementos en el conglomerado i-simo
que poseen \a caracterstica en estudio.
162
fuera deseable en un intento porque este diseo resulte ms eficiente. En estas condiciones la ventaja que uno tiene en la aplicacin
del esquema de muestreo por conglomerados es que no requerimos
de un marco de muestreo de elementos; sta es la principal razn
para su uso.
Figura 7.3 Una familia formada por nios y adultos es un conglomerado ms heterogneo que una familia formada por adultos, .respecto
a la caracterstica: peso por persona en kilogramos.
Cuando los conglomerados son de tamaos desiguales, es deseable asignar una mayor oportunidad de aparecer en 11a muestra a
aquellos conglomerados que son grandes, y menor oportunidad a
los que son pequeos. Al proceder de esta manera se est tomando
en consideracin el nmero de elementos que conforman a cada
uno de ellos y no se les pondera a todos por igual como ocurre en
los primeros apartados de este captulo cuando se les elige de una
manera aleatoria. A un tipo de seleccin que toma en cuenta el
"tamao relativo" de las unidades muestrales se le denomina selec-
163
* 1
2
*3
4
*5
No. de
empleados
No. acumulado
de empleados
Intervalo de
seleccin
20
10
15
25
20
20
30
45
70
90
1 a 20
21 a 30
31 a 45
46 a 70
71 a 90
Y supongamos que- debemos elegir a tres de ellas con probabilidad proporcional a su tamao. Con ayuda de la tabla del captulo
3 seleccionamos a un nmero aleatorio entre 1 y 90. Tomemos
164
~
=
1 n Yi 11
1
n Y.
Yppt=Yppt=-1: M V(yppt}= (
l) 1: (......!.. -ji'ppt} 2 7.7
n
1
nn M
A
* En este libro nos restringimos al caso de seleccin con remplazo, aunque existen tcnicas para muestrear con ppet. que no la permiten. (Cochran, W.G. seccin 9.14. 1963.
Sampling Techniques. J. Wiley & Sons. N.Y. segunda edicin.
Ejercicios
165
7.8
7.6 EJERCICIOS
7.1 Un archivo de nombres ordenado alfabticamente se encuentra en tarjetas
sin identificacin numrica y contienen cinco nombres cada una de ellas.
Las tarjetas se encuentran en 100 gavetas repartidas en 1O muebles. Cada
gaveta contiene entre 30 y 150 tarjetas y cada tarjeta es de medio
milmetro de espesor y su peso es de medio gramo. Se desea estimar el
nmero total de nombres en los 10 muebles f) Qu esquema de muestreo propone usted? , indique sus razones. ii) cules son sus instrucciones para que se tome la muestra fsicamente?
7.2 En referencia al ejercicio 7 .1, lde qu signo, y de qu valor cree usted
que sea la correlacin entre el nmero de tarjetas y el nmero de
nombres?
7.3 Si el coeficiente de correlacin intraconglomerado est dado por:
rho =
E(y -
Y)
(yk _
E(y- Y)
Y)
2};};
__!___ < k (y -
-::.
Y) (yk - Y)
(M -1) (NM -1 )52
1- f
166
Tabla 7.3
Oficina
No. de
empleados
No. de empleados
que respondieron
usl"
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
15
18
12
15
10
20
15
16
18
18
20
30
22
15
20
16
18
20
25
25
3
10
10
12
10
8
10
13
11
9
15
30
17
9
13
10
14
8
12
15
Estime: i) el porcentaje y el nmero total de empleados que respondieron afirmativamente; ii) calcule una estimacin de los errores estndar.
7.5 En el ejercicio 7.3 aparece una relacin que muestra la variancia del
estimador de la media muestra! por elemento en trminos del coeficiente
de correlacin intraconglomerado. cul es el valor mnimo que puede
tomar el coeficiente de correlacin intraconglomerado segn esta relacin?
7.6 Un comerciante que se dedica a la compra de jitomate recibe un lote de
5 000 cajas de ese producto agrcola. El comerciante est seguro de que el
fruto no est podrido, pero s est consciente de que la estibacin de las
cajas y su transportacin no fueron las adecuadas. Por lo anterior, decide
elegir aleatoriamente a 30 cajas dentro del lote completo y ordena que
para cada caja en la muestra se cuente el nmero total de jitomates y el
nmero parcial de ellos que estn reventados. Los resultados aparecen en
la tabla 7.4.
Estime el porcentaje de jitomates reventados en el lote completo y
obtenga intervalos de confianza del 95% para l.
Ejercicios
167
Tabla 7.4
Caja
No. total
de frutos
No. de frutos
reventados
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
200
232
210
305
244
290
185
227
261
298
250
273
209
260
240
210
190
229
255
232
288
240
227
239
248
225
220
220
229
240
o
o
3
1
25
3
100
11
o
o
1
43
17
3
1
55
40
7
2
10
4
14
11
1
3
1
1
98
168
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
No. de alumnos
con ms de
10 hermanos
No. de alumnos
que usan
piloncillo
48
50
50
50
27
35
9
39
17
17
11
13
9
30
21
14
19
15
9
23
11
11
7
11
12
19
3
7
50
10
20
29
3
19
1
3
3
9
14
No. de
alumnos
14
14
41
40
7
1
9
3
3
7
1
1
3
9
4
4
4
7
6
17 y 21.
Los mtodos alternativos para las situaciones cuando k es fraccionario son: intervalos fraccionarios y la muestra cclica. En intervalos
La muestra sistemtica
171
~i =8.75.
EntonceskNUEV0=875, toma-
2 1$1,D
3 O'P.$
3 9VJ(,D
4 71$
5 6$1,D
6 5-P.$
172
La muestra est formada por, 4, 12, 21, 30, 39, 47, 56 y 65.
Continuando con el ejemplo anterior en el cual k result ser de
8.75, y usando una muestra cclica; se elige a un nmero aleatorio
entre 1 y N, este es el arranque, luego se redondea k al entero inmediato superior o inferior y se le suma consecutivamente al arranque
hasta obtener un tamao de muestra exactamente n. Es necesario considerar que el archivo es c(cl ico en el sentido de que su parte final se une a su inicio para poder continuar la cuenta como
ilustra la figura 7 .4. Supongamos que 1 ~ r ~ N, y r, resulta ser
42. Considerando a k = 8 tenemos:
42
50
58
66
74
12
20
28
Seleccin sistemtica
...--------s
lDesea n fijo?
no----
s----r
Calcule k ==n
Calcule k
lResult entero k?
s
(3
==-
no
Result entero k?
(Puede usar cualquiera de
los dos mtodos si"1ientes)
a
La muestra est formada
por las unidades:
r
n
r+ k
r+2k
1ntervalos fraccionarios
Muestra cclica
Considere al nmero de
decimales en k (1 2 digamos) y suprima el punto decimal en k obteniendo un kNUEVO.
Elija 1,;;;;r,;;N
r +k NUEVO
r+2kNUEVO
Redonde a k al entero
inmediato superior o
inferior.
Su muestra es la siguiente:
(Considerando al archivo
cclico)
r+k
r +2k
Diagrama 7. 7
174
En estas condiciones, un estimador insesgado de la media poblacional es la denominada media sistemtica, la cual se define de
la manera siguiente:
i=n
Y sist == -nEn este esquema de muestreo al estimador de la media poblaciorial Y, se le denomina media sistemtica y la manera de calcularla es la misma que aqulla para la media muestra!, es decir, suma de
observaciones entre el tamao de la muestra.
La media sistemtica es insesgada de la media poblacional ya
que el nmero de muestras posibles es k, y la probabilidad de que
cada una de ellas sea elegida es!, entonces:
'"
k~
N (Yi
y*
+ y2 +
+ Y2 + Y3 + + YN)
7.10
*Ya que hay slo Ir muestras posibh's y cada una de ellas con elementos diferentes.
La muestra sistemtica
175
1.
2.
35.
Herrer(as:
1.
2.
70.
Fabricacin de calzado:
1.
2.
40.
~~~~~~~~~~
l.
2.
90.
Fabricacin de artculos para el hogar:
1.
2.
50.
Fabricacin de ropa:
l. - - - - - - - - - - -
2.
20.
Talleres automotrices:
1.
2.
190.
Etc.
Los grupos siguientes a talleres automotrices tienen un nmero
de empresas que exceden a los 20 establecimientos, por lo que el
intervalo de la muestra sistemtica es de 20. Un nmero aleatorio
elegido entre 1 y 20 resulta ser el 7. De manera que las empresas
que conforman a la muestra son: 7, 27, 47, 67, etc., hasta terminar
el listado. El tamao de muestra resulta ser den = N/k = 3 800/20
177
= 190
110
100
190
= -
57.89%
3 800 - 190
189(3 800) (57.89) (42.11) = 12.25
al extraer su raz cuadrada se obtiene el valor de 3.5% que es su
error estndar.
7.8 EQUIVALENCIAS DE LA MUESTRA SISTEMATICA
En este esquema de muestreo, slo el arranque resulta ser
aleatorio, es decir, la primera unidad elegida es seleccionada de
manera aleatoria y todas las dems unidades hasta completar n no
son seleccionadas por el azar, ya que una vez que se eligi el
arranque stas quedan plenamente determinadas. En estas condiciones, al hacer una comparacin de ella con la seleccin por conglomerados, se encuentra que la seleccin sistemtica equivale a elegir
o seleccionar un conglomerado aleatoriamente, el cual est formado
por n elementos: el que sirvi como arranque para la muestra (r
entre 1 y k) y el resto de unidades hasta completar n. Como a
partir de r, los saltos son de orden k, los diferentes conglomerados
que pueden ser formados y elegidos en el supuesto de que N = 42
y n = 7, son los que aparecen en la tabla 7.6.
Debido a esta equivalencia y al hecho de que el tamao de
muestra resulta ser de 1, desde el punto de vista de conglomerados
concluimos que la variancia de los estimadores no puede ser estimada formalmente,* ya que el denominador de las expresiones
correspOndientes se anula (ver las frmulas 7.1 a 7.5). Tambin, los
comentarios sobre la precisin de la muestra sistemtica son los
* Decimos que no puede ser estimada formalmente, porque bajo determinados supuestos
podemos enunciar un estimador de ella como se ver en el apartado 7.9.
178
Tabla 7.6*
e onglomerados
....~
1
7
13
19
25
6
31
n=7 1 37
2
8
14
20
26
32
38
!j
a3
2
53
-S!
1
2
.
3
9
15
21
27
33
39
4
10
16
22
28
34
40
6
5
11
17
23
29
35
41
N 42
k =- = -= 6
11
7
6
12
18
24
30
36
42
2
3
4
5
6
n=7
1
1
7
13
19
25
31
37
/2'\.
2 \
8
14
20
26
\ 32 J
\.38f
3
9
15
21
27
33
39
4
10
16
22
28
5
11
17
23
29
35
41
34
40
6
6
12
18
24
30
36
42
* Debemos notar que para una poblacin especfica (N = 42) y para un tamao dado de
muestra (n = 7) cada unidad de la poblacin slo puede aparecer en una sola muestra.
Su uso
7.9
179
su uso
Este esquema de muestreo es ampliamente usado, principalmente en los casos de archivos de tarjetas, expedientes y hojas, as
como en archivos magnticos. Su uso generalizado se debe a su
facilidad de aplicacin, ya que slo es necesario seleccionar el
arranque y de ah en adelante avanzar a brincos constantes, con
ayuda, por ejemplo, de una regla o usando el folio de los documentos. En muchas ocasiones, aunque k = N/n no resulte entero,
uno supone que lo fue con el fin de que el arranque quede
localizado al principio del archivo. Cuando k no resulta ser entero,
las muestras diferentes no reciben probabilidades iguales de seleccin y el estimador, la media sistemtica, pasa de insesgado a
sesgado. Sin embargo, generalmente su efecto es despreciable y puede
ser preferible suponer entero a k para evitar tomar de esta manera una
muestra cclica o intervalos fraccionarios como ya se indic en el
apartado 7 .7, la cual aunque restituye el insesgamiento, son relativamente ms complicados de practicar. Sin embargo, debe ser mencionado que en muchos esquemas de muestreo, la fraccin de muestreo
est fija, en cuyo caso, si k es fraccionario, pues, es necesario usar
intervalos fraccionarios por ejemplo.
Aunque la aplicacin del muestreo sistemtico es muy simple,
es necesario que el tcnico cuente con alguna informacin sobre la
poblacin en la que lo va a aplicar, para as evitar sorpresas:
cuando se introdujo el muestreo aleatorio simple, se dijo que la
muestra debe ser aleatoria y esto se logra mediante el uso de las
tablas de nmeros aleatorios, en otras palabras, el mecanismo de
aleatorizacin de la poblacin son las tablas. En contraposicin, en
muestreo sistemtico slo una unidad es elegida aleatoriamente y
las dems quedan forzadas a pertenecer a la muestra y an en
muchos casos se acostumbra fijar hasta el arranque. As, se dice,
por ejemplo: tmese una muestra sistemtica con arranque al
centro del intervalo. Si en estas condiciones de seleccin se quiere
usar el supuesto de aleatorizacin para estimar la variancia, como en
el captulo 3, la nica esperanza que uno tiene es que la pblacin
en s se encuentre aleatorizada u "ordenada" aleatoriamente respecto a la caracterstica buscada, como en el caso de la urna que se
agita y despus, por una perforacin, sale una canica. En esta
situacin el estimador de la variancia de la media sistemtica viene a
ser la expresin siguiente:
180
Figura 7.5.
*Sobre este tema, el lector puede consultar el libro de L. Kish.
Su uso
181
1 410
182
47
1 41 o
30
94
Si f 1 = 1410 y,{2 =
94
entonces,{= 1410
21 --
30 .
7.8
En rl ejercicio 7.1 sobre el archivo de nombres ordenado alfabticamente,.;) lse puede suponer un "orden" aleatorio sobre los primeros
apellidos?, ;;) por qu?, iii) y sobre las longitudes de los primeros
arcllido~?
7.9
N
/? =-
Ejercicios
183
Maz
100
Trigo
70
Azcar
60
Frijol
40
Naranja
30
Arroz
15
Papas
12
Garbanzo
6
Pescados
2
Meln
1
Otra persona sugiere que se numeren los alimentos y que se tome una
muestra aleatoria de tamao 1O; y una tercera persona indica que se
censen los cinco primeros alimentos y se muestre aleatoriamente el resto.
lTiene razn la primera persona que propuso la muestra sistemtica?
Comente cada propuesta. Un censo practicado en la lista tiene como
resultado 2 500 gramos.
1
2
3
4
5
6
Fecha de
ingreso
10/I
9/1
20/1
14/1
28/1
30/I
27/1
Fecha de
egreso
10/1/74
14/1/74
21/1/74
25/1/74
28/1/74
30/1/74
1/11/74
Tipo de
servicio
04
07
23
12
07
14
19
Diagnstico
de mayor
relevancia
1
3
7
2
3
1
3
Motivo del
egreso
s
s
s
T
s
s
184
Hoja No.
Fecha de
ingreso
3/11
9/11
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
4.:+
45
46
47
48
49
50
10/11
3/11
2/11
25/11
3/111
10/111
15/111
23/111
5/IV
19/111
12/IV
22/IV
30/IV
9/V
19/V
5/VI
1/VI
17/VI
1/Vll
7/Vll
10/Vll
20/Vll
7/Vlll
15/Vlll
19/Vll I
1/IX
5/IX
7/IX
30/Vlll
5/X
18/X
27/X
3/XI
10/XI
15/XI
23/XI
2/Xll
6/Xll
15/Xll
25/Xll
27/Xll
Fecha de
egreso
4/11
9/11
15/11
19/11
23/11
28/11
3/111
10/111
19/111
24/111
5/IV
11/IV
13/IV
22/IV
2/V
9/V
19/V
5/VI
13/VI
17/VI
1/Vll
9/Vll
14/Vll
25/Vll
7/Vlll
15/Vlll
20/VI 11
1/IX
5/IX
11/IX
17/IX 8/X
18/X
27/X
4/XI
10/XI
16/XI
23/XI
2/Xll
8/Xll
17/XII
25/Xll
27 /XII
Tipo de
servicio
33
22
07
11
19
14
25
07
36
22
04
07
03
14
35
29
18
06
20
36
14
04
10
18
04
04
35
19
08
04
07
30
19
13
08
24
13
04
04
04
14
01
22
Diagnstico
de mayor
relevancia
4
2
2
1
3
4
4
4
4
2
4
1
1
1
1
1
3
5
2
5
4
4
6
3
5
5
4
4
4
2
1
7
2
3
1
3
4
4
5
3
4
1
4
Motivo del
ingreso
s
T
T
s
M
M
M
s
s
s
s
s
T
T
M
s
s
s
s
s
s
s
T
s
T
s
s
s
s
s
s
s
s
s
s
s
s
M
M
M
M
Ejercicios
185
7.12 Sobre el ejercicio 7.11 y de entre las personas curadas (motivo de egreso
S), estime el porcentaje de ellas que fueron atendidas tanto en el servicio
04 como en el 07.
7.13. En una muestra sistemtica de tamao 200 viviendas y durante su trabajo
de campo se encontr que 1O de ellas no eran en realidad viviendas, sino
pequeas industrias. Sin embargo, todas las estimaciones a efectuarse se
refieren a viviendas. Para efectos de estimacin de medias y de totales,
lqu ecuaciones usara usted? Y, lqu valor (es) de tamao (s) de muestra
usara? lPor qu?
7.14. Una escuela tiene 20 salones en la planta baja numerados del 1 al 20 y 16
en la parte alta numerados del 1 al 16.
i) Indique brevemente, cmo numerara o identificara a los salones para
seleccionar sistemticamente a 5 de ellos.
ii) Utilizando los siguientes nmeros aleatorios y avanzando de arriba hacia
abajo, obtenga los cinco salones en la muestra (anote su arranque, el
intervalo de la muestra, la muestra y el mtodo usado).
Nmeros aleatorios
74
90
25
01
41
37
25
CAPITULO
SUBMUESTREO
188
Submuestreo
.El muestreo por conglomerados evita en buena medida la necesidad de contar con un listado de unidades o elementos, requiriendo nicamente un listado de conglomerados. Como usualmente
stos ya estn formados de manera natural, generalmente no se
espera que este esquema sea ms eficiente que una seleccin aleatoria. Y, como hemos visto, se requiere que aquellos conglomerados
que conforman a la muestra sean revisados completamente. Naturalmente la necesidad de la revisin exhaustiva va creando muchos
problemas cuando los conglomerados son relativamente grandes (un
gavetero, una manzana de viviendas), va haciendo el trabajo ms
tardado, ms difcil y ms costoso.
Por ltimo, el muestreo sistemtico, es un esquema cuya aplicacin es muy simple, a prueba de errores; aunque, por otro lado,
requiere de cuidados sobre la poblacin sujeta a estudio, por las
caracter(sticas que ella tiene y que influyen en el resultado final de
una muestra sistemtica. Tambin pueden elaborarse diseos muestrales que no usen un nico esquema, sino combinaciones de los
existentes; por ejemplo, se pueden estratificar edificios y definir a
cada uno de ellos como un estrato, entonces dentro de ellos elegir
oficinas o muebles mediante una muestra sistemtica. En cuanto a
los mtodos de estimacin, por ejemplo en el caso de conglomerados, ya hemos visto que se dispone de varias maneras de combinar los datos de la muestra para producir o derivar una estimacin. Estudiamos estimadores insesgados y estimadores de razn
y vimos que cada uno de ellos requiere de determinada informacin para su clculo, en algunos casos slo se puede aplicar
determinado estimador por carecer de informacin que requerir(an
otros que son ms precisos. Esta situacin prctica de contar con
un tipo de informacin y no con otra es realmente importante, se
dispone de .alguna informacin y se carece de otra; por lo cual, es
muy valioso el hecho de disponer de formas diversas para hacer las
estimaciones. En ocasiones, sin tener en cuenta sustancialmente el
que el estimador usado sea menos preciso que otro. Un criterio
muy usad0 en las situaciones prcticas es aquel bajo el cual, se
estructuran mtodos de seleccin y de estimacin que sean enteramente simples (diseos con igual probabilidad de seleccin para cada
elemento en la poblacin y con estimadores autoponderados, en cuyo
caso la media muestra! es el estimador de la media general), sacrificando as precisin estadstica a favor de la eliminacin o de la disminucin de errores y malos entendidos tanto durante la seleccin como
durante el procesamiento de la informacin.
Submuestreo
189
8.2. SUBMUESTREO
190
Submuestreo
glomerados M =
M
N
,
Notacin
191
Tomaremos una muestra de n conglomerados de entre los N existentes y dentro de la i-simo primario en la muestra eligiremos una
submuestra de m unidades secundarias o elementos y denotaremos
al valor de la caracterstica en estudio correspondiente al elemento
-simo en lo primario i-simo por Yii; en estas condiciones el valor
del total y el valor de la media muestrales en ella son como sigue:
m
Yi = ~ Yii
Conglomerado
No. 1; M1 gavetas
Conglomerado
No. 2; M2 gavetas
C0ng!ome1ado
Conglomerado
No. i; M gavetas
No. N; MN gavetas
G.. veta
No. 1
G<iveta
No. M
192
Submuestreo
N Mi
i=N
y= ~. Yu = ~_l' = Yi
N
M;
M;
Mi
Y= Yu
= y.
::_
= y = n fiiJ
M ;Y;
8.1
es decir, pitra estimar una media por elemento, habiendo hecho una
seleccin aleatoria en la primera y segunda etapas del submuestreo,
debemos calcular las medias muestrales de cada conglomerado en la
muestra ji 1 , y 2 , ., Y;, .. ., J7,.; multiplicar a cada una de ellas por
el tamao del conglomerado respectivo M 1 , M2 , . , M;, .. ,., M,.;
hacer la suma de estos productos y al resultado afectarlo por el
factor
nk'
el recproco de
ff".) -
Vv -
1 - f1
51 2
nM2
En esta expresin:
n
N
f1 = - ,
f2
m,.
n -- Mn
y adems:
i"n
52
1
:E.
(MS1 - Mj7) 2
n- 1
j=m
~!
2
52 1
i=
(y1 - ..V1 ) 2
m1 -1
j=m 2
5~ 2 =
i =
193
(y2 -
m2 -1
J72 ) 2
f 2; ) 21.!
m;
8.2
194 Submuestreo
j=mn
s1
I:
(y2
nj -
- )2
Yn
j= 1
2n
si
Y= My
V(Y)
= M2
V(.Y)
8.3
195
primarias o
de primera
etapa
Seleccin primaria
m 1 secundarias
m2 secundarias
mn secundarias
Figura 8.2
196
Submuestreo
Tabla 8.1
Primaria
No.de
comercios
400
200
No. de
comercios
sub muestreados
20
650
300
100
350
10
33
15
18
480
90
785
114
23
137
My
9600
1800
15462
2280
460
2663
f2
0.05
0.05
0.051
0.05
0.05
0.051
152000
38000
400952
85500
9500
116252
512
36
1329
62
77
61.93
50.83
58.52
72.76
132.94
72.59
m
Y;=~ Y
Mt(1-f2)
S~
(y -VR) 2
Calculemos
= 1
n -1
34 693 997
197
Entonces:
V{y)
6
1 - 30
21 031 830
6 {300) 2 (34 693 997) + 6 (30) (3 00) 2
95%:
L
17.92 - 2(7.26)
3.4 empleados/comercio,
8.4
En palabras, calclese las medias muestrales .Y1, Ji2, Y1, 5'2, ...
y,, de cada conglomerado primario, multiplquese a cada una
ji, ... ,
198
Submuestreo
= ) = 1-::-nr
- f1
V Yn
ni~A
Donde:
"
Si
1
+n NM2
l:
- )2
Yn
2(
n- 1
s~ = l: M; ji mi
M2 ( l
f } s~ 1
2i m;
8.5
'
... 2
l: (y-
IJ - Y)
1
S2 2i -
m1 - 1
Partiendo de las expresiones anteriores para la media por elemento, podemos formar de manera inmediata el estimador del valor
total de la caracterstica en estudio con slo multiplicar a 8.4 por el
nmero total de elementos:
8.6
Si se desea estimar un porcentaje, tanto en 8.1 como en 8.4 en
lugar de ji debe aparecer el estimador respectivo del porcentaje
poblacional en la primaria i-sima, digamosp.
Ejemplo 8.2 Usando los datos del ejemplo 8.1 anterior podemos
volver a calcular las estimaciones ah solicitadas, pero usando los
estimadores de razn propuestos en este apartado:
Segn la expresin 8.4
"
= -_2:::M;)i;
1613
.
Yn
-,,-- = 32265
.
emp 1eados / comercio.
2 OOO =
2:::
M;
5 ~ = ~ Mt
(ji; -
n-1
10 696 389;
199
6
30 (1o696 389 ) + 1.29 = 15.85
'
V(=
YR ) = 6(300)2
+ 1.29
1--
= 17.14 (empleados/comercio) 2
con un error estndar de 4.14. Habiendo encontrado el error estndar
podemos calcular un intervalo de confianza del 95%; los lmites
inferior y superior de l son como sigue:
16.13 - 2(4.14)
L.
16.13
7.85 empleados/comercio.
+ 2( 4.14) = 24.41
empleados/comercio.
[3.4, 32.44]
contra
[7.85, 24.41) ,
200
Submuestreo
Tabla 8.2
Conglomerado
primario
1000 400
2200
700
1400 500
10
Suma
M
Unidades primarias en la
muestra
de cada 100 unidades secundarias. Las observaciones correspondientes y otros clculos necesarios aparecen en la tabla 8.3.
y=
nM ~ 1 MJ!;
11
22 1 00 2 2 1 00
3{1 428) = 4 284
~ 3 (M;Y;
n-1
s~.
;=3
1
Mf(1-f
,
21)
m- =2771208
.,
i= 1
3
1 - 10
2 771 208
V(ji) =3(1 428)2 (19 523 336) + 3{10)(1428)2
A
= 2.23
+ 0.0453 = 2.28
201
Tabla 8.3
Primaria
1 000
400
2 000
0.01
0.01
0.01
10
6,2, 11,8,
6,7,6,5,
8, 10.
69
6.9
4
9,9, 10,
4.
32
i=a
L M = 3 400
=
20
1,3,3, 1,9, 14,
7, 10,4,5,7,7,
6,5,6,8,4,6,7,7.
120
3200
12 000
:V=
Y;
1
-
m;
6 900
? My =22100
i=t
My
(1 -
f21I
M{(1-f2;l
S~
(y -
YRl 2
0.99
0.99
990 000
158 400
3960 000
6.54
7.33
9.26
0.16
2.25
0.99
0.25
202
Subrnuestreo
= 5.16 +
2{ 1.51)
=
YR = Y= R =
i=n
~
M;)
i = 1
..;...i=-n~--
= 1
100 6 5 h'
= 22
3 400 = . IJOS
. 1tor.
por agncu
M;
st :
;=3
YR )
~ Ml (.Y; s = "'"---'----n---1- 2
t
-- (1 000)
= 1
---------r=
= 0.087
+ 0.0453 = 0.132
y su error estndar vale 0.364 hijos por agricultor; por lo cual los
intervalos del 95% de confianza para esta media son:
= 6.5 -
L.
9000
90
= f1
f2
= T8 5 = 90
Es de.::ir, entrar a la seleccin de primarias con fraccin de muestreo 1 ue cada 18, y dentro de ellas, seleccionar a personas con
fracci.1 1 de cada 5. Otra propuesta es f= f 1 f 2 = ~ 110
En ambos casos no se asegura el terminar con 100 personas
exactamente. Si deseamos 50 agricultores en la muestra y tenemos
1O primarias, las siguientes son dos maneras de seleccionarlos:
=do.
285.56
5
1
ii) f = 10 142.78 =
285.56
i)
10 28.556
204
Submuestreo
= ~ . Enton-
En la prctica es muy usual emplear algn criterio de estratificacin y as dividir a la poblacin en subpoblaciones independientes
al menos desde el punto de vista de la seleccin, esto permite adems
efectuar estimaciones por estrato, o por efectos de precisin es
deseable contar con estimadores cuando las unidades primarias se han
estratificado en L estratos. La notacin es tal que el h-simo contiene
i=N11
Mh
= . I:1 Mh;
1=
205
8.7
8.8
206
Submuestreo
Ejercicios
207
1 2
20 25
Saln
16 17
No. de pupitres 30 40
i)
3
20
4
27
5
26
6
25
7
48
8
30
9
25
18
43
19
48
20
40
21
21
22
21
23
25
24
27
10 11
40 21
12
20
13
27
14
35
15
38
25
29
27
40
28
42
29
42
30
45
26
35
39
48
30
07
ii)
208
Submuestreo
Mueble
1
2
3
4
5
i)
ii)
No. de tableros
en cada mueble
6
6
6
6
6
No. de tableros
en la muestra
2
2
2
2
2
Valor de la mercanca
en cada tablero
1000
2000,
1000,
3000,
3000,
1000
1000
2000
2000
1000
BIBLIOGRAFIA
209
2~
3.4
!~ 100 =
3.5
3. 7 l42.07, 91.33]
3.8 V(Y) = 0:189, [1.53, 3.27)
V(Ny) = 22 106.2, [523.44, 1 118.2)
4.3
3.66)
212
Submuestreo
= 58.148, l = 64.052
c.ii) L
= 62.122,
L8
= 64.758;
L. = 49 289.6
L.= 42 067
= 18
+ 58 + 20 =
187
213
= 2.168,
Ls
= 10.512
INDICE ALFABETICO
en la estimacin, 69
Esperanza matemtica, 30
definicin, 30
de la media muestra!, 47
propiedades, 30
Estimacin
de cocientes, 46
de medias, 45
de porcentajes y de proporciones,
46
de totales, 46
de varianzas, 54, 78
por intervalos, 50
puntual, 50
Estimador, 33
auto ponderado, 124, 206
consistente, 34, 47
definicin, 34
de razn,89,94
de razn combinado, 141
de ra;zn en el submuestreo, 197
insesgado, 34
sesgado, 34
Estratos, 11 3
Factor de correccin por poblacin
finita, 52
Finalidad del muestreo, 36
Fraccin
de muestreo,50,52
de muestreo en el submuestreo,
194
lnsesgamiento,47
Intervalos de confianza, 29, 33, 50,
58
Intervalos de variacin de una variable
aleatoria, 21
Afijacin
ptima, 138
proporcional, 123
Atributos de los elementos, 17
Azar, 27, 70
Caracterstica de los elementos, 17,
42
Caracterizacin de la distribucin normal, 32
Censo, 1 3, 19
Cociente poblacional, 19
Coeficiente de correlacin intraconglomerado, 161
Concentracin, 21, 35
Confianza, 33, 70
Conglomerados, 152 de primera etapa,
190
Consistencia, 47
Covarlancia, 32
Desviacin o error estndar, 29
en la distribucin normal, 33
Diseo de muestreo, 33, 36
Dispersin, 21, 35
Distribucin
de probabilidades, 27, 28
hipergeomtrica, 59
normal, 32
Dominios de estudio, 17, 97, 103
Elementos, 16
muestrales, 16
falsos, 22
Encuesta, 15
encuesta o prueba pilota, 79
Enumeracin completa, 19
Error
de medicin, 20
215
216
Indice