Você está na página 1de 23

Recomposicin

Captulo7
Recomposicin
Recomposicin Recomposicin
1.Principiosyobjetivos
2.Informacinauxiliarcategrica.Casodiseosimple
2 1 Postestratificacin 2.1Postestratificacin
2.2MtododelRakingRatio
3.Informacinauxiliarcuantitativa.Casodiseosimple
3.1estimadordecociente(oderatio)
3.2estimadorderegresin
3 3 i d dif i 3.3estimadorpordiferencia
1. Principios
Recomposicin
Recomposicin
p
Una vez realizada la encuesta:
se han producido perturbaciones (no respuestas, cuestionarios perdidos, etc.);
diversas variables habrn sido recogidas: facilitan informacin sobre la muestra
Se utiliza entonces una informacin auxiliar exterior al muestreo y se busca calibrar
la muestra de manera que se respete dicha informacin (en general una distribucin)
conocida.
En general, informacin agregada bajo la forma de totales (o de medias/
proporciones). Se nota X el total de la variable auxiliar conocido sobre toda la poblacin. p p ) p
Se puede conocer el total de varias variables.
Recomposicin
Recomposicin
chantillon information auxilair muestra
Informacin auxiliar
estimador
estimateur estimateur
"brut" "redress"

estimador
bruto
estimador
recompuesto

Recomposicinypesos
Recomposicin
Recomposicin
La recomposicin modifica los pesos de las observaciones a posteriori
Los mtodos que veremos conducirn a estimadores que sern estimadores
lineales, es decir, que se expresan de la siguiente forma:
( ) ( )
i
i
i
y w w T

+ = s s
0
Mtodosclsicos
Recomposicin
Recomposicin
Informacin auxiliar categrica vs Informacin auxiliar cuantitativa:
Informacin auxiliar cualitativa: Recomposicin mediante post
estratificacin
Informacin auxiliar cuantitativa: Recomposicin por cociente y regresin
2 R i i ti d i f i t i
Recomposicin
Recomposicin
2.Recomposicinapartirdeinformacincategrica
2.1Postestratificacin
Procedimiento:
1. se descompone el universo en estratos pero a posteriori 1. se descompone el universo en estratos pero a posteriori
2. se conocen los efectivos poblacionales (las proporciones poblacionales) de
cada estrato, pero no la pertenencia de cada individuo a un estrato
t concreto
3. se efectan estimaciones por estratos antes de concatenarlas todas para
obtener una estimacin global g
Se observa UNA muestra (ASSR) que, A POSTERIORI, se divide en H submuestras
Recomposicin
Recomposicin
Muestra global
(ASSR)
Submuestra h
formada a posteriori
n n
h
(aleatorios)
Y

h
Y

h
T
T
2
h
s
2
s
Enlamuestra,seobservaelvalordey perotambinelvalordex(=estrato)
N 1
( )
H H H
N N

1
Recomposicin
Recomposicin
( )
h
h
i , h
n N
N
s w
1
=
( )

=
= e = e =
H
h
i , h
s i
i , h i , h
h
H
h s k
h
h
H
h
h
POST
y s w y
n N
N
y
N
N
Y
h h
1 1 1
1
Sesgo:sinsesgo,exceptocuandoestratosvacos
Varianzadelestimador
( )
(
(

|
.
|

\
|

~

h
S
N
N
n
f
S
N
N
n
f
Y

V
h
h
h
h
h
POST
2
2
2
1
1 1
Estimacindelavarianzadelestimador:
( )
(
(

|
|

=

s
N f
s
N f
Y

h h
2 2
1
1 1
( )
(
(

|
.

\
+ =

h
s
N
n
s
N n
Y V
h h
h
POST
2
1
Recomposicin
Recomposicin
Laprctica
El criterio elegido para estratificar a posteriori debe estar correlacionado con la
variable de inters (o las variables de inters) para que la tcnica sea eficaz.
E i l l f i d l (l N ) id d Es esencial que los efectivos de los estratos (los N
h
) sean conocidos de manera
precisa, y sobre todo reciente
Es preferible no hacer correcciones demasiado importantes de las p p
ponderaciones: una regla emprica sugiere evitar que la tasa de correccin ms
alta sea ms de cinco veces mayor que la ms baja. Se desaconseja tambin
estratificar a posteriori en estratos demasiado poco numerosos (evitar los
estratos tales que Nh/N < 10 %) estratos tales que Nh/N < 10 %).
Problema
En una regin agrcola se desea estimar el rea media (por empresa agrcola) que En una regin agrcola, se desea estimar el rea media (por empresa agrcola) que
corresponde a cultura de cereales (variable y: rea cultivada con cereales). Hay
N=2010 empresas agrcolas. Se observa una muestra ASSR de n=100 empresas
agrcolas.
Adems, se sabe que hay 1580 empresas de menos de 160 hectreas (postestrato
1) y 430 empresas con ms de 160 hectreas (postestrato 2).
As una vez observada la muestra se conoce: As, una vez observada la muestra se conoce:
- 30 70
2 1
= = n n
- 63 51 4 19
2 1
. y . y = =
922 312
2 2
Cul es el estimador postestratificado de la media de y? es diferente de la media
simple?
Den la expresin del estimador de la varianza del estimador postestratificado
- 922 312
2 2
2 1
= =
y y
s s
Den la expresin del estimador de la varianza del estimador post estratificado
Calculen una estimacin de la varianza del estimador postestratificado
Den un IC (95%) para la media
2.2Postestratificacinapartirdevarioscriterios
Recomposicin
Recomposicin
Elmtododelrakingratio
Este mtodo se emplea cuando se trata de ajustar la muestra a varios criterios
sin que se conozca la distribucin conjunta asociada: por ejemplo se ajusta a sin que se conozca la distribucin conjunta asociada: por ejemplo, se ajusta a
la distribucin de hogares por tamao, y tambin a la distribucin segn el
nivel de instruccin del jefe de hogar.
Se ajusta la muestra a una de las distribuciones, modificando las
ponderaciones de los cuestionarios (es decir, multiplicando la ponderacin de
todas las unidades de cada porcin de la distribucin por el mismo
coeficiente, para que resulte el nmero de unidades conocido coeficiente, para que resulte el nmero de unidades conocido
exteriormente de la porcin). Se modifican luego las ponderaciones para
ajustarse a la otra distribucin. Se repite el reajuste respecto de la primera
distribucin y despus de un cierto nmero de iteraciones, se obtienen las
d i d fi i i ponderaciones definitivas.
Este mtodo puede adoptarse en el caso de un muestreo aleatorio simple o de
un diseo muestral ms complejo donde las probabilidades de inclusin p j p
finales de las unidades sean iguales y la muestra de tamao fijo
3.Informacinauxiliarcuantitativa
Recomposicin
Recomposicin
Principio: seajustapara satisfacer unvalortotal/medio
SeconoceelverdaderototalT
X
deunavariableauxiliarX
Recomposicin
Recomposicin
3mtodos:
estimadordecociente(oderatio)
estimador de regresin estimadorderegresin
Principio:seajustapara satisfacer unvalormedio.
Se selecciona una muestra para estudiar una variable y pero se observa tambin una
X
Seseleccionaunamuestraparaestudiarunavariabley,peroseobservatambinuna
variableauxiliarx.Deestavariablex,seconocelamediapoblacional
b l d b d b l
X
Seobservalamediaobtenidasobrelamuestraysecomparacon
Seajustalaestimacinporuncoeficientecorrectorque,aplicadoaxestimasumedia
(osutotal)sinerror
x
X
3.1Estimacinporcociente(oporelratio)
+ = u x R y
Recomposicin
Recomposicin
Sesuponequey ex varanproporcionalmente

=
+
eU
u
u x . R y
o
o
o o o
0
-R,coeficientedeproporcionalidad, , p p ,
-u
o
,pequeoparatodoo,nocontrolado,desviacinalaproporcionalidadperfecta,
residuo
L id i l i Losresiduossecompensan,siyslosi
X
Y
R =
X R Y =
X
X R Y
Por lo tanto, siempre se puede escribir:
, u x
X
Y
y
o o o
+ =
0 =

eU
u
o
o
X
X 1
Recomposicin
X y

Recomposicin
i
S i
Q
y
x
X
n
Y

=
e
1
peso: depende de la
x
X
y X
x
y
Y

Q
= =
Sesgo:pequeo,deorden1/n
Varianzadelestimador
peso:dependedela
muestraentera
( )
2
1
1
u Q
S
n N
n
Y

V
|
.
|

\
|
=
con

=
eU
u
u
N
S
o
o
2 2
1
1
dadoque(E(U)=0)sepuedecalcularas:
y x Y , X x y u
S S R S R S S 2
2 2 2 2
+ =
Estimacindelavarianzadelestimador:
2
1
1
u Q
s
n N
n
Y V

|
.
|

\
|
= |
.
|

\
|
. \
y x Y X x y u
s s R s R s s
,


2
2 2 2 2
+ =
i i i
x R

y u =
Recomposicin
Recomposicin
Notas
silavariableauxiliarx ylavariableestudiaday sonaproximadamenteproporcionales,la
varianzadelestimadordecocienteresultainferioraladelestimadorsimple
Como el orden de magnitud de la desviacin tpica es dominante frente al del sesgo, el Comoelordendemagnituddeladesviacintpicaes dominante frentealdelsesgo,el
estimadorporcocienteresultaentoncesinteresante.
Recomposicin
Problema
En una regin agrcola, se desea estimar el rea media (por empresa agrcola) que corresponde a
cultura de cereales (variable y: rea cultivada con cereales). Hay N=2010 empresas agrcolas. Se
observa una muestra ASSR de n=100 empresas agrcolas.
Adems, se conoce el total de la variable auxiliar X, superficie total cultivada.
As, una vez observada la muestra se conoce:
1. ha y ha x ha X 07 29 25 131 32 118 . . . = = =
2. 57 0 708 9173
2 2
.

= = =
y x
s s
3. Den la expresin de la correlacin poblacional y de la correlacin muestral

. Digan si

es sesgado.
4. Den la expresin del estimador de la varianza del estimador de ratio.
5. Muestren que el estimador de ratio de Y es ms preciso que la media simples si y slo si
( ) x V C

1
> donde V C

significaestimador del coeficientedevariacin


( ) y V C

2
> , donde V C significaestimador del coeficiente de variacin.
6. Calculen el estimador de cociente (=de ratio) de Y por punto y por intervalo (nivel de
confianza igual a 95% )

3.2Estimacinporlaregresin
Recomposicin
Recomposicin
u x b a y + +
Sesuponequelasvariablesentretienenunarelacindelsiguientetipo:
Se impone: u
o
pequeos, no
o o o
u x . b a y + + =
Seimpone:u
o
pequeos,no
relacionadosconx
o
,que
verifican;
0 =

eU
u
o
o
Entrelaseleccionesposiblesdeaybverificandolaecuacindearribaylas
constriccionessobreu:
( )( )
S
Y y X x

( )( )
( )
2
2
sy
U
S
S
X x
Y y X x
b =


=
e o
o o
d d
o o o
u x . b a y + + =
( )
x
U

e o
o
X b Y a =
siempreverdadsise
calculana yb as
Enlapoblacin
Recomposicin
Recomposicin
X b a Y . + =
Enlamuestra,seconsideraquelosresiduossecompensan.As:
x b a y . + ~
x b X b y Y ~ .

( ) x X b
x b X b y Y
~
~ .
Esentoncesnaturalaproximar por:
( ) x X b y Y + ~
~
Y
Enlugardeaplicarunareglade3comoenelcaso
delestimadordecociente,secorrigemedianteun g
coeficientequetienelaformadeunadiferencia
Recomposicin
Recomposicin
Pero desconocido
b
Seestimaapartirdelamuestra:
( )( )
( )
2
2
y , x
S i
i i
s
y y x x
b


=
e
Estimadorsesgado
de
d
b
( )
2
2
x
S i
i
s x x


e
b

Tambin:
a
Errorcuadrtico
mediodeorden1/n
x b y a =
Estimador por la regresin:
( ) x X b y Y
REG
+ =

Estimadorporlaregresin:
nointerviene
enlaexpresin
a

Notas
Recomposicin
Recomposicin
son los parmetros verdaderos pero desconocidos de la mejor
recta (con el criterio mnimocuadrtico) ajustada a partir de (x
o
,y
o
) con o
barriendo toda la poblacin
b y a 1.
son los parmetros de la mejor recta (con el criterio mnimo
cuadrtico) ajustada a partir de (x
i
,y
i
) con i barriendo toda la muestra
b y a

22.
Siseutilizaelestimadorporlaregresincalibradosobrexparaestimar
X
( )( )
1 =


=
eS i
i i
x x x x
b

( )
1
2
=


=
eS i
i
x x
b
( ) X x X x X
reg
= + = 1

Pesodelosindividuos
( ) 1
Recomposicin
Recomposicin
( ) ( )
i
s i
i reg
y s w x X b

y Y

= + =
e
( ) ( )
( )
( )

+ =
es i
i
i
i
x x
x x
x X
n
s w
1
Sesgopequeo,deorden1/n,deexpresinmuycompleja
Sesgo,precisin
Varianzadelestimador
2
1
1
u reg
S
n N
n
Y V |
.
|

\
|
= |
.
|

\
|

bx a y u
( )
2 2 2 2
1
1
S u S


o o o
bx a y u =
Estimacindelavarianzadelestimador:
( ) 1
1
S u
N
S
U
u
=

=
e

o
o
( ) s
n n
2 2
2
1
1


| | | |
| |
( )
n
s
N
n
s
n N
n
Y V
y
u reg
2
1
1
1
1


|
.
|

\
|
=
|
.
|

\
|
= |
.
|

\
|
x b

a y u
b

2
1
2 2 2 2 2
i i i
x b a y u =
y , x x y
s i
i u
s b s b s u
n
s + =

=
e
2
1
2 2 2 2 2

Você também pode gostar