Você está na página 1de 36

MUESTREO EN POBLACIONES FINITAS

Antonio Morillas

A.Morillas: Muestreo 1
MUESTREO EN POBLACIONES FINITAS

1. Conceptos estadísticos básicos


2. Etapas en el muestreo
3. Tipos de error
4. Métodos de muestreo
5. Tamaño de la muestra e inferencia
6. Muestreo en poblaciones finitas
6.1 Muestreo aleatorio simple
6.2 Muestreo aleatorio estratificado
A.Morillas: Muestreo 2
INTRODUCCIÓN

• Dos aspectos básicos de la inferencia estadística,


no vistos aún:
 Proceso de selección de la muestra:

Métodos de muestreo
 Tamaño adecuado en poblaciones finitas:

Fiabilidad y coste

A.Morillas: Muestreo 3
ETAPAS EN EL MUESTREO. ESQUEMA
1.Definir la
INFORMACIÓN
que se necesita

6. Conclusiones sobre la 2. Determinar la


POBLACIÓN POBLACIÓN y ver
LISTADO

5. Uso de la muestra 3. MÉTODO de muestreo y


para INFERENCIA TAMAÑO de la muestra

4. Cuestionario: NO
RESPUESTA y garantizar
FIABILIDAD (DISEÑO)

A.Morillas: Muestreo 4
TIPOS DE ERROR

• Debidos al muestreo  incertidumbre


• Ajenos al muestreo:
1. Definición incorrecta de la población
2. Respuestas falsas o imprecisas
3. Falta de respuesta  posible sesgo
4. Sesgo en la selección elementos muestrales
5. Errores de manipulación, tabulación y cálculo
• No hay un criterio general para evitarlos y/o
analizarlos  minimizarlos
A.Morillas: Muestreo 5
MÉTODOS DE MUESTREO

• Muestreo aleatorio:
• Unidad muestral elemental:
• a.1) muestreo aleatorio simple
• a.2) muestreo aleatorio sistemático
• a.3) muestreo aleatorio estratificado
• Unidad muestral grupo:
• b.1) muestreo por áreas y conglomerados
• b.2) muestreo por etapas
• Muestreo no aleatorio y semialeatorio:
• En general, no “científico”; no estudia precisión:
• c.1) por cuotas
• c.2) de juicio u opinión
A.Morillas: Muestreo 6
MUESTREO ALEATORIO SIMPLE

• Sirve de base a los demás métodos


• Es el más sencillo desde el punto de vista teórico
• Todos los elementos muestrales se tratan como
iguales
• La selección es sin reposición
• Todas las muestras posibles son igualmente
probables
• Cuando N es muy grande su coste es muy alto

A.Morillas: Muestreo 7
MUESTREO ALEATORIO SISTEMÁTICO

• Se necesita un listado ordenado de los elementos


• El orden no debe afectar a la aleatoriedad  sesgo
• Se selecciona al azar el primer elemento muestral (k)
menor que p=N/n  n grupos o clases de p elementos.
• Elegido éste, los demás se obtienen sumándole p al
anterior: k+p, k+2p,...
• El método garantiza que aparezcan elementos de todas
las clases, por lo que puede generar muestras más
representativas que el muestreo aleatorio simple
A.Morillas: Muestreo 8
MUESTREO ALEATORIO SISTEMÁTICO

N = tamaño población
Listado
n = tamaño muestra

k<p
1 k+p k+2p k+3p N
(N/n)=p

El orden no debe afectar a la aleatoriedad

A.Morillas: Muestreo 9
MUESTREO ESTRATIFICADO

En ocasiones es indispensable agrupar los elementos de


la población en clases o estratos, que han de ser:
• Homogéneos en sus elementos
• Heterogéneos entre sí

Mejor información. Reduce errores y costes

Dentro de cada estrato se aplicará un muestreo aleatorio


simple o sistemático

A.Morillas: Muestreo 10
MUESTREO POR CONGLOMERADOS

• Conglomerado: grupo de elementos de la población


• La unidad de muestreo es el conglomerado
• Se seleccionan aleatoriamente cierto número de
conglomerados y se investigan todos sus elementos
• Características: homogeneidad entre conglomerados;
heterogeneidad dentro de cada conglomerado
• Se reduce problema de listado (solo para unidades
seleccionadas), no es necesario saber tamaño población,
 menos
entrevistas dentro del grupo (conglomerado)
costoso
A.Morillas: Muestreo 11
MUESTREO POR ETAPAS

• Generalización del muestreo por conglomerados

• Suele hacerse descendiendo de conglomerados más


grandes a más pequeños:

Provincia  Municipio  Barrio  Edificio  Familia

• En cada etapa se aplica el muestreo aleatorio, sistemático


o estratificado

• Objetivo: Reducir al mínimo el coste del listado

A.Morillas: Muestreo 12
VENTAJAS E INCONVENIENTES
MUESTREO ALEATORIO SIMPLE

CARACTERISTICAS VENTAJAS INCONVENIENTES


• Se selecciona una Sencillo y de • Requiere que se
muestra de tamaño n de fácil posea de antemano un
una población de N comprensión. listado completo de
unidades. toda la población.
• Cada elemento tiene
• Coste.
una probabilidad de
inclusión igual y
conocida de n/N.
A.Morillas: Muestreo 13
VENTAJAS E INCONVENIENTES
MUESTREO SISTEMÁTICO

CARACTERISTICAS VENTAJAS INCONVENIENTES


• Conseguir un listado de • Fácil de aplicar. Si la constante de
los N elementos de la • Cuando la muestreo está asociada
población. población está con el fenómeno de
• Determinar p= N/n. ordenada, interés, las
• Elegir un número asegura una estimaciones obtenidas
aleatorio, k, entre 1 y p cobertura de a partir de la muestra
(k= arranque aleatorio). unidades de pueden contener sesgo
todos los tipos. de selección
• Seleccionar los
elementos de la lista.

A.Morillas: Muestreo 14
VENTAJAS E INCONVENIENTES
MUESTREO ESTRATIFICADO

CARACTERISTICAS VENTAJAS INCONVENIENTES


• Estratifica la muestra • Tiende a • Se ha de conocer la
según ciertas variables asegurar muestra distribución en la
de interés. adecuada a la población de las
• Para ello debemos población. variables utilizadas
conocer la composición • Estimaciones para la estratificación.
estratificada de la más precisas.
población objetivo. • Muestra más
• El tamaño muestral se semejante a la
reparte entre los distintos población
estratos definidos en la (variables
población, según ciertos estratificadoras).
criterios.
A.Morillas: Muestreo 15
VENTAJAS E INCONVENIENTES
MUESTREO CONGLOMERADOS-ETAPAS

CARACTERISTICAS VENTAJAS INCONVENIENTES


• Se seleccionan • Es muy • El error estándar es
aleatoriamente cierto eficiente mayor que en el
número de conglomerados. cuando la muestreo aleatorio
• Se investigan todos los población es simple o estratificado.
elementos de cada uno de muy grande y • El cálculo del error
ellos. dispersa. estándar es complejo.
• Se realizan varias fases de • No es preciso
muestreo sucesivas, de más tener un
grandes a más pequeños listado de toda
(embudo) la población.
• Menor coste.
A.Morillas: Muestreo 16
TAMAÑO MUESTRAL E INFERENCIA

La muestra debe reproducir las características de la


población.

Hay dos cuestiones básicas:

- Cantidad de elementos de la muestra


- Generalización de sus resultados a la población

Ambas cosas, tamaño muestral y métodos de inferencia,


están relacionadas con la precisión de las estimaciones.
A.Morillas: Muestreo 17
ERROR E INTERVALO DE CONFIANZA
CASO DE LA MEDIA
• Error: ε = µ−x

• Intervalo de confianza (1-α):


x − z1−α / 2σ x ≤ µ ≤ x + z1−α / 2σ x
N(0,1)

σ
(1−α)
µ − x ≤ z1−α / 2σ x → σ x =
α/2
n
−Z1−α / 2 Z1−α / 2

σ
x −µ ε = µ − x = z1−α / 2
Z= → N (0,1) n
σ/ n A.Morillas: Muestreo 18
TAMAÑO MUESTRAL PARA LA MEDIA
POBLACIONES INFINITAS

Despejando de la última expresión, para un


nivel de confianza (1-α) y un error máximo
permitido de tamaño ε, se obtiene:

z 2
σ 2 4σ 2
n= 1−α / 2
→n=
ε 2
ε 2
(para una confianza del 95,5% el percentil de Z vale 2)
A.Morillas: Muestreo 19
TAMAÑO MUESTRAL PROPORCIÓN
POBLACIONES INFINITAS
pq
Recordemos que: σ =
2

n
pq
Error: ε = p − pˆ = z1−α / 2
n
2
z pq 4 pq
Despejando: n= 1−α / 2
→n=
ε2 ε2
4 pq 4 × 0, 25 1
n máxima: nmax = = =
ε2 ε2 ε2
A.Morillas: Muestreo 20
ESTIMACIÓN POR INTERVALOS

Una vez fijado el tamaño de la muestra:


• La mejor estimación por puntos del gasto medio
será la media de la muestra.
• La de la proporción, la observada en la muestra.
• Con ellas, y obtenida la varianza del estimador,
podremos construir los correspondientes
intervalos de confianza, que nos dan una idea de
la horquilla en que se mueve el verdadero valor
del parámetro.
A.Morillas: Muestreo 21
ESTIMACIÓN POR INTERVALOS

Media :
( x − z1−α / 2σ x ≤ µ ≤ x + z1−α / 2σ x )

Proporción :
( pˆ − z1−α / 2σ pˆ ≤ p ≤ pˆ + z1−α / 2σ pˆ )

A.Morillas: Muestreo 22
MUESTREO POBLACIONES FINITAS

• POBLACIÓN FINITA: el número de


elementos de la muestra puede llegar a ser una
proporción apreciable de los de la población.
•La precisión de la estimación sería superior, al
estar mejor representada el conjunto de la
población.
•La varianza del estimador ha de corregirse por el
factor:  N -n 
 N -1 
  A.Morillas: Muestreo 23
MUESTREO ALEATORIO SIMPLE
TAMAÑO DE LA MUESTRA: MEDIA

• Error máximo permitido, al estimar µ por la media


muestral, para un nivel de confianza: µ∈(x ± ε )

ε= z σ σ = ε
1-α/2 x x z
1-α/2
• Luego fijar el error máximo permitido equivale a
predeterminar la varianza del estimador (función de n),
α)% -
para un nivel de confianza dado - 100(1-α
• El tamaño de la muestra puede calcularse a partir de
cualquiera de estas dos expresiones (ε , σ x )
A.Morillas: Muestreo 24
MUESTREO ALEATORIO SIMPLE
TAMAÑO DE LA MUESTRA: MEDIA (CÁLCULO A)

σ 2  N -n 
• A partir de la varianza del estimador: σ2 = 
x n  N -1 

• Operando: n(N -1)σ 2 = σ 2(N -n)= σ 2 N -σ 2n


x

n(N -1)σ 2 +σ 2n= σ 2 N


x

al hacer σ 2 = ε 2 / z 2
2 σ2 x 1-α/2
n= Nσ 2 Nz1-α/2
=  σ2 desconocida
(N - 1)σ x2 + σ 2 (N -1)ε 2 + z1-α/
2
2 σ 2
 encuesta piloto
A.Morillas: Muestreo 25
MUESTREO ALEATORIO SIMPLE
TAMAÑO DE LA MUESTRA: MEDIA (CÁLCULO B)

• Elevando el error al cuadrado: ε2 = z 2 σ2


1-α/2 x
σ 2 (N -n)
• Introduciendo la varianza del estimador: ε 2 = z 2
1-α/2 n (N -1)

• Operando: n(N -1)ε 2 = z 2 σ 2 (N -n)= z 2 σ 2 N - z2 σ 2n


1-α/2 1-α/2 1-α/2
n(N -1)ε 2 + z 2 σ 2n= z 2 σ2 N
1-α/2 1-α/2
al hacer ε 2 = z2 σ 2
2
Nz1-α/2 σ 2 2 1-α/2 x
= Nσ
n=  σ 2 desconocida
(N -1)ε 2 + z1-
2
α/2 σ 2 (N -1)σ 2 +σ 2
x  encuesta piloto
A.Morillas: Muestreo 26
MUESTREO ALEATORIO SIMPLE
INFERENCIA SOBRE LA MEDIA

1 n
Estimación por puntos: x = n ∑ xi
i=1
Estimación por intervalos:µ∈(x± z1-α/2σˆ x )  σ 2 desconocida
x
σ 2  N -n 
En poblaciones finitas: σ 2 =   factor de corrección
x n  N - 1 
N -1
Como σ es desconocida se estima mediante:
2 ˆ
s 2  insesgado
N
ˆ
s 2 (N -n)
Haciendo operaciones  σˆ 2 =
x n N
Para utilizar la normal, n será suficientemente grande.
Si n es pequeña y se supone normalidad  t de Student
A.Morillas: Muestreo 27
MUESTREO ALEATORIO SIMPLE
TAMAÑO DE LA MUESTRA: PROPORCIÓN

• Varianza del estimador:

  Nz 2 pq
2
σ = pq N

-n 
 n= Npq = 1-α /2
pˆ n N -1
 
(N -1)σ 2pˆ + pq (N -1)ε 2 + z1-α
2
/2 pq
 

ε 2
al hacer σ 2 =
pˆ z 2
• Como p no se conoce, o se estima o nmax : 1-α/2

0,25Nz 2
n = 0,25N = 1-α/2
max
(N - 1)σ 2pˆ +0,25 (N -1)ε 2 +0,25z1-α/2
2

A.Morillas: Muestreo 28
MUESTREO ALEATORIO SIMPLE
INFERENCIA SOBRE LA PROPORCIÓN

Estimación por puntos:

ˆ x
p= x = número de observaciones con la
n característica estudiada

Estimación por intervalos: ˆ ˆ (N -1)


pq
p∈(p±
 
ˆ z σˆ ) 2 pq
σ =   N -n 

(n-1) N
1-α/2 pˆ pˆ n  N -1 

ˆ 2
σ = ˆ
pq ˆ (N -n)
pˆ (n-1) N
A.Morillas: Muestreo 29
MUESTREO ALEATORIO ESTRATIFICADO

Población dividida en K estratos: N1+ N2 +.....+ NK = N


Tamaños muestrales de los estratos: n1+ n2 +.....+ nK = n
Medias poblacionales de los estratos: µ1 µ2 ......... µK
Medias muestrales de los estratos: x x ...... x
1 2 K
Proporciones muestrales en estratos: p̂ p̂ ….. p̂
1 2 K
En cada estrato se hace un muestreo aleatorio simple:
• Estimadores insesgados (µ µi, pi): x p̂
i i
• Estimadores insesgados de la variancia de x y p̂ :
i i
ˆ 2 (N -n )
s pˆ qˆ ( N - n )
σˆ 2 = i i i σˆ 2 = i i i i
xi n N pˆ (n -1) N
i i A.Morillas: Muestreo i i i 30
DISTRIBUCIÓN DE LA
MUESTRA ENTRE ESTRATOS-1

• No hay una respuesta única

• Criterios de asignación (afijación):

1. Uniforme: todos igual; poco sentido real.

2. Proporcional: La proporción de elementos de la


población en cada estrato se aplica a la muestra:

N i ni Ni
= n = n
N n i N

A.Morillas: Muestreo 31
DISTRIBUCIÓN DE LA
MUESTRA ENTRE ESTRATOS-2

3. Óptima: Pondera el criterio anterior con las varianzas de


los respectivos estratos, asignando más observaciones a
los estratos con mayor varianza poblacional. Es el más
deseable si el objetivo único es la precisión en la
estimación:
N i σi
n = n
Media y total: i K  σ , encuesta piloto
∑ N i σi
i=1
N i pi qi
Proporción: n = n
i K  n máxima
∑ N i pi qi
i=1
A.Morillas: Muestreo 32
MUESTREO ALEATORIO ESTRATIFICADO
TAMAÑO DE LA MUESTRA: MEDIA

Asignación proporcional:
K 2
∑ i i
N σ 2
n= i=1 ; con σ 2 = ε
1 K x 2
2 2 z1-α/2
Nσ x + ∑ N i σi
N i=1
Asignación óptima: 2
1 K  Denom. de ni
 ∑ N i σ i  2
N  i=1  ; con σ 2 = ε
n=
1 K x 2
2 2 z1-α/2
Nσ x + ∑ N i σi
N i=1
A.Morillas: Muestreo 33
MUESTREO ALEATORIO ESTRATIFICADO
TAMAÑO DE LA MUESTRA: PROPORCIÓN

Asignación proporcional:
K
∑ N i pi qi 2
n= i=1 ; con σ 2 = ε
1 K pˆ 2
2
Nσ pˆ + ∑ N i pi qi zα/2
N i=1
Asignación óptima: 2
1 K 
 ∑ N i pi qi  2
N  i=1  ; con σ 2 = ε
n=
1 K pˆ 2
Nσ 2pˆ + zα/2
∑ N i pi q
N i=1
A.Morillas: Muestreo 34
MUESTREO ALEATORIO ESTRATIFICADO
INFERENCIA SOBRE LA MEDIA

Estimación por puntos:

1 K 1 K
µ= ∑ N i µi x= ∑ N i xi
N i=1 N i=1

Estimación por intervalos:

1 K 2
µ∈(x ± z σˆ ) 2
σˆ = ∑ N i σˆ 2
1-α/2 x x xi
N 2 i=1

A.Morillas: Muestreo 35
MUESTREO ALEATORIO ESTRATIFICADO
INFERENCIA SOBRE LA PROPORCIÓN

Proporciones poblacionales de los estratos: p , p , .... p


1 2 K
Proporciones muestrales de los estratos: pˆ , pˆ , .... pˆ
1 2 K
Estimación por puntos:
1 K 1 K
p= ∑ N i pi ˆ
p= ∑ N i pˆ i
N i=1 N i=1
Estimación por intervalos:

K 2 pˆ i qˆi (N i -ni )
p∈(p±
ˆ z σˆ ) 2
σˆ = 1
∑ N i σˆ 2 2
σˆ =
1-α/2 pˆ pˆ 2
N i=1
pˆ i pˆ i (n -1) N
i i

A.Morillas: Muestreo 36

Você também pode gostar