Você está na página 1de 11

475

DISEOS MUESTRALES






ALFREDO ALIAGA
CEPAL

476 Diseos muestrales

NDICE

Pgina

1. Diseo de la Muestra............................................................................................................ 477
1.1 Marco de la encuesta .................................................................................................. 477
1.2 Formacin de unidades de muestreo........................................................................... 477
1.3 Estratificacin............................................................................................................. 478
2. Esquema de Muestreo .......................................................................................................... 478
3. Tamao de la Muestra.......................................................................................................... 479
4. Afijacin de la Muestra........................................................................................................ 480
5. Seleccin de la Muestra ....................................................................................................... 480
5.1 Urbano alto (ciudades ENEU) .................................................................................... 480
5.2 Urbano alto (ciudades no ENEU) y complemento urbano ......................................... 481
5.3 Rural ........................................................................................................................... 482
6. Estimadores.......................................................................................................................... 483
7. Estimacin de las Precisiones .............................................................................................. 484

Diseos muestrales 477
1. Diseo de la Muestra
El Diseo Muestral se caracteriza por ser probabilstico, por lo cual los resultados obtenidos de la encuesta se
generalizan a toda la poblacin. A su vez es polietpico, estratificado y por conglomerados, donde la unidad ltima
de seleccin es la vivienda y la unidad de observacin es la persona.

1.1 Marco de la encuesta.
El Marco de muestreo de la ENE-2001 es el marco muestral de propsitos mltiples del INEGI, constituido a partir
de la informacin demogrfica y cartogrfica obtenida durante el Conteo de Poblacin y Vivienda de 1995.
Al interior de cada entidad federativa se tiene una primera estratificacin, conformando zonas que agrupan a las
localidades de la siguiente forma:

Zona Descripcin
Urbano Alto
Ciudades y reas metropolitanas objeto de estudio de la Encuesta Nacional de
Empleo Urbano (ENEU) del trimestre Julio-Septiembre del 2001.
Resto de las ciudades de 100,000 y ms habitantes y/o capitales de estado.
Complemento
Urbano de alta
densidad
Localidades de 20,000 a 99,999 habitantes.
Localidades de 15,000 a 19,999 habitantes.

Complemento Urbano de baja
densidad
Localidades de 2,500 a 14,999 habitantes.
Rural Localidades con menos de 2,500 habitantes.

1.2 Formacin de unidades de muestreo.
Al interior de cada zona la formacin de las unidades de muestreo se realiza como a continuacin se describe:

Unidad Primaria de Muestreo (UPM):
Las Unidades Primarias de Muestreo estn constituidas por una o parte de un rea Geoestadstica Bsica
(AGEB)
1
, o de varias AGEB colindantes cuando no se completa el mnimo de viviendas requeridas para
formar la UPM. Dependiendo de la zona de referencia su constitucin es la siguiente:

UPM en urbano alto.
Un AGEB con un mnimo de 480 viviendas.
La unin de 2 o ms AGEB contiguas y del mismo estrato, con un mnimo de 480 viviendas en
conjunto.

UPM en el resto de las zonas.
Un AGEB o la unin de dos o ms AGEB que contengan:
De 100 a 1,000 viviendas en Localidades Urbanas.
De 50 a 850 viviendas en Localidades Rurales.

Unidad Secundaria de Muestreo (USM):
USM en urbano alto
La formacin de la Unidad Secundaria de Muestreo (USM) o rea de Listado, se realiza slo en las
ciudades ENEU agrupando las viviendas bajo las siguientes condiciones:
478 Diseos muestrales
Puede formarse con una manzana que tenga un mnimo de 40 viviendas habitadas.
Puede estar formada por dos o ms manzanas contiguas con al menos 40 viviendas habitadas.

USM en el resto de las zonas.
La Unidad Secundaria de Muestreo (USM) est constituida por las viviendas particulares, habitadas
permanentemente o aptas para habitarse.

Unidades Terciarias de Muestreo (UTM):
Las Unidades Terciarias de Muestreo (UTM) se tienen solamente en la zona urbano alto ENEU y estn
constituidas por las viviendas particulares, habitadas permanentemente o aptas para habitarse en el
momento de la elaboracin de los listados.

1.3 Estratificacin.
Al interior de cada entidad y zona las UPM se sometieron a una estratificacin socioeconmica utilizando
las siguientes variables:
Porcentaje de poblacin de 6 a 14 aos que sabe leer y escribir.
Porcentaje de poblacin de 15 aos y ms alfabeta.
Porcentaje de viviendas con drenaje conectado a la red pblica.
Porcentaje de viviendas con agua entubada dentro de la vivienda.

2. Esquema de Muestreo.
La ENE-2001 fue diseada bajo un esquema de muestreo probabilstico, polietpico, estratificado y por
conglomerados:
a) Probabilstico.
Esto significa que las unidades de seleccin tienen una probabilidad conocida y distinta de cero de
entrar en la muestra para cada miembro de la poblacin, lo cual, permite conocer la precisin de los
resultados muestrales.
b) Estratificado.
Porque las unidades de seleccin son agrupadas por caractersticas similares de tipo geogrficas y
socioeconmicas.
c) Polietpico.
Porque la unidad ltima de seleccin (vivienda) es seleccionada despus de varias etapas.

d) Por conglomerados.
Porque previamente se conforman conjuntos de unidades muestrales de los cuales se obtiene la
muestra.
Diseos muestrales 479

3. Tamao de la Muestra.
El tamao de muestra est calculado para dar estimaciones a los siguientes niveles de desagregacin:
Nacional.
Entidad federativa.
Localidades de 100,000 y ms habitantes.
Localidades de 15,000 a 99,999 habitantes.
Localidades de 2,500 a 14,999 habitantes.
Localidades de menos de 2,500 habitantes.

El tamao de muestra para estos dominios se calcula para la tasa de desempleo abierta, considerada la
variable principal de la encuesta, y la que requiere los tamaos de muestra mayores. Esto garantiza que
las estimaciones del resto de las variables de inters queden cubiertas con ese tamao.
La expresin empleada para el clculo es la siguiente:

( )

PHV TNP TNR - 1 p r
DEFF q z
n
2
2


Donde:

n = Tamao de la muestra.
p = Estimacin de la proporcin.
q = (1-p).
r = Error relativo mximo aceptable.
z = Valor asentado en las tablas estadsticas que garantiza realizar las
estimaciones con una confianza prefijada.
DEFF = Cociente de la varianza del diseo utilizado entre la varianza del muestreo
aleatorio simple para un mismo tamao de muestra.
TNR = Tasa de no respuesta esperada.
TNP = Tasa neta de participacin.
PHV Promedio de habitantes de 12 aos y ms por vivienda.

Tomando como base un nivel de confianza de 90% y un efecto de diseo de 4.756 observado en las
experiencias anteriores, as como una tasa neta de participacin de 57%, un promedio de 3.59 habitantes
por vivienda y un error relativo mximo esperado de 4.49% para una TDA de 2.2%, y la tasa de no
respuesta es de 15%, se determin una muestra a nivel nacional de 163,160 viviendas.
480 Diseos muestrales
El cuadro siguiente detalla el tamao de la muestra por dominio.

Urbano alto
129,460
Complemento urbano de alta densidad
6,750
Complemento urbano de baja densidad
9,100
Rural
17,850
Total 163,160

4. Afijacin de la Muestra.
La afijacin de la muestra se realiza dentro de cada entidad entre los diferentes estratos de manera
proporcional a su tamao, para lo cual se emplea la siguiente expresin:

'
'
'
'
n
N
N
n
g
g
gh
gh

Donde:

'
n
gh
= Nmero de viviendas en muestra para el h-simo estrato en la g-sima entidad.
'
n
g
= Nmero total de viviendas en muestra para la g-sima entidad.
'
N
gh
= Nmero total de viviendas en el h-simo estrato en la g-sima entidad.
'
N
g
= Nmero total de viviendas en la g-sima entidad.

5. Seleccin de la Muestra.
La seleccin de la muestra de la ENE-2001, se realiz de manera independiente en cada entidad-estrato, el
procedimiento de seleccin vara dependiendo de la zona.

5.1 Urbano alto (ciudades ENEU)

1. Se seleccionaron n UPM, con probabilidad proporcional al nmero de viviendas en el estrato.
2. En cada UPM seleccionada, se seleccionaron k reas de listado de las 6 seleccionadas para el marco de
propsitos mltiples, utilizando muestreo sistemtico con arranque aleatorio.
3. En cada rea de listado seleccionada, se seleccionaron 6 viviendas con igual probabilidad.
Diseos muestrales 481
En consecuencia, la probabilidad de seleccionar una vivienda es:

{ }

6k
6
6
k
6

ghij gh
ghij gh
ghij ghi
ghij
gh
ghi gh
ghijk


m m
m n
m m
m
m
m n
V P
Donde:
gh
n

=
Nmero de UPM seleccionadas en el h-simo estrato en la g-sima entidad.

ghi
m

=
Nmero de viviendas de la i-sima UPM en el h-simo estrato de la g-sima
entidad.
gh
m

=
Nmero de viviendas en el h-simo estrato de la g-sima entidad.
ghij
m

=
Nmero total de viviendas en la j-sima USM de la i-sima UPM en el h-simo
estrato de la g-sima entidad.
k

=
Nmero total de USM seleccionadas para la ENE-2001.

*
m
ghij

=
Nmero total de viviendas en la j-sima USM de la i-sima UPM en el h-simo
estrato para la g-sima entidad al momento del levantamiento ENE-2001.

Su factor de expansin est dado por:

6


ghij gh
ghij gh
ghi

k m n
m m
F


5.2. Urbano alto (ciudades no ENEU) y complemento urbano.
1. Entre las n
gh
UPM que se seleccionaron en el marco con probabilidad proporcional a su tamao, se
seleccionaron
*
gh
n
UPM con igual probabilidad.
2. En cada UPM seleccionada, se seleccionaron 50 viviendas con igual probabilidad
utilizando muestreo sistemtico.

482 Diseos muestrales
Por lo tanto, la probabilidad de seleccionar una vivienda es:

{ }
*
ghi gh
*
gh
gh
ghi gh
ghij
50

m n
n
m
m n
V P

Donde:

gh
n

=
Nmero de UPM seleccionadas en el h-simo estrato en la g-sima entidad.

ghi
m

=
Nmero de viviendas de la i-sima UPM en el h-simo estrato de la g-
sima entidad.
gh
m

= Nmero de viviendas en el h-simo estrato de la g-sima entidad.
*
m
ghi

=
Nmero total de viviendas en la i-sima UPM en el h-simo estrato para la g-
sima entidad al momento del levantamiento ENE-2001.
*
n
gh

=
Nmero de UPM seleccionadas para la ENE-2001 en el h-simo estrato para la
g-sima entidad.

Su factor de expansin est dado por:

50

*
*
gi ghi
ghi gh
ghi
n m
m m
F


5.3. Rural.
1. Entre las n
gh
UPM que se seleccionaron en el marco con probabilidad proporcional a su tamao, se
seleccionaron
*
gh
n
UPM con igual probabilidad.
2. En cada UPM seleccionada se seleccionaron 5 segmentos de 10 viviendas aproximadamente, con igual
probabilidad.

Por lo tanto, la probabilidad de seleccionar una vivienda est dada por:

{ }
*
ghi gh
*
gh
gh
ghi gh
ghij

m
50
n
n
m
m n
V P
Donde:

gh
n

=
Nmero de UPM seleccionadas en el h-simo estrato en la g-sima entidad.

ghi
m

=
Nmero de viviendas de la i-sima UPM en el h-simo estrato de la g-
sima entidad.
gh
m

=
Nmero de viviendas en el h-simo estrato de la g-sima entidad.
Diseos muestrales 483
*
n
ghi

=
Nmero total de viviendas en la i-sima UPM en el h-simo estrato para la g-
sima entidad al momento del levantamiento ENE-2001.
*
n
gh

=
Nmero de UPM seleccionadas para la ENE-2001 en el h-simo estrato para la
g-sima entidad.
Su factor de expansin est dado por:

50 k m n
m m
F
*



ghi gh
ghi gh
ghi



6. Estimadores.
El estimador del total de la caracterstica X:
A nivel estatal es:

,
_

+
,
_


l
R
ghikl
k
R
ghik
i h l
u
ghijkl
u
ghijk
k j i h
X F X F X

Donde:
u
ghijk
F
= Factor de expansin de la k-sima vivienda en la j-sima USM de
la i-sima UPM en el h-simo estrato para la g-sima entidad en
la rea ms urbanizada.
u
ghijkl
X
= Valor observado de la caracterstica de inters X en la l-sima entrevista de
la k-sima vivienda en la j-sima USM de la i-sima UPM en el h-simo
estrato para la g-sima entidad en la rea mas urbanizada.
R
ghik
F
= Factor de expansin de la k-sima vivienda en la i-sima UPM del
h-simo estrato en la g-sima entidad del rea menos urbanizada.
R
ghijkl
X
= Valor observado de la caracterstica X en la l-sima entrevista de
la k-sima vivienda en la i-sima UPM del h-simo estrato en la
g-sima entidad para la rea menos urbanizada.

A nivel nacional:


g
g

32
1
X

NAL
V


484 Diseos muestrales
Para la estimacin de proporciones, tasas y promedios se utiliza al estimador de razn:


32
g
NAL
NAL


32
1 g
g
1 g
Y
Y
NAL



Donde, la variable
NAL
Y

es definida en forma anloga a


NAL
X

.

7. Estimacin de las Precisiones.
En la evaluacin de los errores de muestreo de las principales estimaciones nacionales proporcionadas por
la ENE-2001 se utiliz el mtodo de conglomerados ltimos. El trmino conglomerado ltimo se utiliza
para denotar el total de unidades en muestra de una Unidad Primaria de Muestreo
2
(UPM). En
consecuencia, la UPM de la primera etapa de muestreo, es una parte importante en el clculo de la
varianza de estimadores lineales (p.ej. Totales). As, el Mtodo de Conglomerados ltimos
conjuntamente con el de Series de Taylor, son aplicados a los estadsticos no lineales para estimar las
precisiones de estos ltimos.
La frmula empleada para calcular la precisin de
NAL
R

es la siguiente:


( )

'

1
1
]
1

,
_

,
_


2
32
Y

n
1
Y

1
R

gh
gh
ghi gh
gh
ghi
i gh
gh
L
h h
2
- -
1
-
1 -
NAL
gh g
NAL
NAL
X
n
n
n
V


Donde:

ghi
X


=
Total ponderado de la variable de estudio X para la i-sima UPM en el h-simo
estrato de la g-sima entidad.
gh
Y


=
Total ponderado de la variable de estudio X para el h-simo estrato en la g-sima
entidad.
gh
n
= Nmero de UPM en el h-simo estrato para la g-sima entidad.

Estas definiciones son anlogas para la variable de estudio Y.
La estimacin de la precisin del estimador del total, se calcula con la frmula siguiente:

( )
1
-
1 -
2
gh
gh
ghi
i gh
gh
L
h g
gh g
NAL

,
_

X

1 1
32
1
X
n
n
n
V


Diseos muestrales 485
Las estimaciones de la desviacin estndar (D. E.), coeficiente de variacin (C.V.) y DEFT
se calculan mediante las siguientes expresiones:

( )


& &
D.E.
( )

V
& &
C.V.


( )
( )



mas

& &
& &
DEFF


Donde:


=
Estimador del parmetro poblacional

.
( )
mas


V

= Estimador de la varianza de bajo muestreo aleatorio simple.


Finalmente, el Intervalo de Confianza al 90%, est construido de la siguiente forma:

( ) ( ) ( )

, 1.645 1.645 -
& & & &
+ I
- 1


donde el nivel de significancia es de = 0.10.

Você também pode gostar