Escolar Documentos
Profissional Documentos
Cultura Documentos
1.- Introduccin:
X i , Y i representa un vector aleatorio correspondiente a dos medidas tomadas en el
individuo i-simo. X variable auxiliar, Y variable de inters.
Cuestin fundamental, Cuando realmente interesa utilizar una (o ms de una) variable
auxiliar en un mtodo indirecto?. Las tcnicas de regresin resuelven la cuestin. Estas
mismas tcnicas permitiran generalizar el procedimiento de estimacin si tenemos dos o
ms variables auxiliares que podra ser el caso.
Expresin general de estimadores indirectos: YR Y b 0 X X donde b 0 puede
considerarse un coeficiente de correcin para mejorar Y . Posibles valores para b 0 :
i) Estimador Directo b 0 0 YR Y
ii) Estimador de Razn b 0
Y
X
YR
Y
X
yk
xk
y k
yk
xk
cte. k EY/X x k x k y
y k
k1
n
x k
k1
N
x k
k1
k1
Y
X
y k
k1
N
?
xk
k1
Y
X
Resultados:
i)
E R R
Var R
Var X
2X
1/2
Var X
0 la razn del
| X |
sesgo 0 .
ii) Diseo muestral m.a.s.:
AVar R
AVar R
E. C. M. R
1f
n
1
2
X
1f
n
y k Rx k
sr
n1
y k Rx k 2
1
2X
N1
y 2k R x 2k 2Ry k x k
2
1f
n
1
2
X
ks
ks
n1
ks
6. 7
7. 1
44. 89
50. 41
47. 57
...
...
...
...
...
...
20
8. 9
9. 4
79. 21
88. 86
83. 66
y k
R
k1
20
x k
164.7
154.5
k1
Var R
2 Var R
1
20
1373.71.07 2 1210.5321071288.9
1
2
19
7.725
20
1000
0. 02
Modelo y k x k y k x k YR
U
Como
min y k x k
y k x k
x k
y k
x k
n
N
YR
Y
X
y k
sr
x k
N x Var R
x
YR
X; Y
N2
de
aqui
yk
k
k1
se
deduce
una
y
x k N x x ss RN x ,
sr
AVar YR
1f
n
N 2 1f
n
y k Rx k
y k Rx k 2
U
N1
2
n1
Var m.a.s
N2
1f
n
CorrX, Y
y k Rx k
n1
S 2
y R S x 2RS xy
1 CV U X
2 CV U Y
y la recta de
V 2 N 2
B2
k2
NV 2
SRy W h x hh xh .
h1
Nh
AVar SRY W 2h
1f h
nh
2 2
2
hy R h hx 2R h hxy ; hxy
x hi xh y hi yh
i1
N h 1
h1
nh
AVar SRY W 2h
h1
xh
Xh
1f h
nh
yh
xh
S 2
hy R h S hx 2R h S hxy ; R h
; S hxy
x hi xh y hi yh
i1
n h 1
Obtencin de n fijados B y K:
Tomada una muestra piloto se estima V 2
h
S 2
hy R h S hx 2R h S hxy
Si afijacin proporcional n h nW h , W 2h
1
nW h
1
Nh
V 2
h
B2
k2
y se despeja n.
h1
CRy
STy
STx
AVar CRy
W h y h
x
L
h1
L
W h x h
x.
h1
W 2h
1f h
nh
2 2
2
hy R hx 2R hxy ;
h1
AVar CRy
W 2h
h1
xh
Xh
1f h
nh
STy
STx
S 2
hy R S hx 2RS hxy ; R
W h y h
h1
L
Whxh
h1
Obtencin de n fijados B y K:
Tomada una muestra piloto se estima V 2
h
S 2
hy R S hx 2RS hxy
Si afijacin proporcional n h nW h , W 2h
1
nW h
1
Nh
V 2
h
B2
k2
y se despeja n.
h1
Cuestiones:
1 Cuando usar el estimador estratificado separado o el combinado?
Habitualmente sucede que el error de muestreo es superior con el estimador
combinado. Sin embargo el estimador separado puede tener mayor sesgo puesto que el
estimador de razn de cada estrato contribuye al sesgo. Por tanto, si los tamaos de muestra
son pequeos en cada estrato o si las razones dentro de los estratos son aproximadamente
iguales, utilizaremos el estimador combinado.
2 Cuando usar el estimador de razn?
Cuando la relacin entre las variables Y y X sea aproximadamente lineal a traves del
origen y ademas, la varianza de la variable Y sea proporcional a la varianza de la variable
X.
yx
x
YP x , estimador ms eficiente que el de m.a.s. si xy 12 CV
CV y
1f
Sesgo: E YP y n y xy CV x CV y
1f
2 2
AVar YP n 2
y R x 2R xy
2
1f
2
AVar YP n S 2
y R S x 2RS xy
YD y x x
d k d 2
1f s
Var YD n
; dk yk xk
n1
ii) Utilizar estudios previos para proponer una estimacin del coeficiente de regresin
1f
2 2
Var YD n S 2
y S x 2S xy
Ejemplo:
4.2 Estimador de Regresin:
Consideramos toda la poblacin Uy 1 , x 1 , . . . , y N , x N y que el modelo es
y i 0 1 x i ; i 1, . . . , N.
0 y 1x
min y i 0 1 x i 2
0 , 1
xy
2x
y i y x i x
x i x 2
U
de
segn
un
diseoconocer
0 y s 1 x s; y s s
yk
k
; xs
xk
k
;N
1
k
y k y s x k x s
k
1 s
xkxks
y s y; x s x; 1 S 2xy
x
Por
y 1 y 1 x 1 x
y i
i1N
......
y N y 1 x N x
2 2
1f
Var yreg n S 2
y 1 S x 2 1 S xy
tanto:
x i x
i1
yreg y 1
y 1 x x
n B2V V con V S 2
y 1 S x 2 1 S xy estimado con una muestra previa
N2k2
Ejemplo:
4.2.2 Sea s una muestra obtenida mediante diseo estratificado:
N N 1 . . . N L , en cada estrato h se toma una m.a.s. de n h individuos. Y es la variable de
inters y X la auxiliar.
i) Estimador de regresin separado:
Suponiendo que los n h son suficentemente grandes para que los estimadores en cada
estrato sean lo suficientemente aproximados.
Nh
S hxy
S 2
hx
, yhreg y h h
x hi x h
i1
Nh
y h h hx x h
AVar yrs
h1
1f
W 2h n hh
2 2
S 2
hy h S hx 2 h S hxy
h1
,
W 2h
1f h
nh
S 2
hx
h1
yestr W h y h (estimador
de
con
h1
L
1f
AVar yrc W 2h n hh S 2
hy c S hx 2 c S hxy
estratificado),
h1
diseo
Wh V h
n
h1
L
B2
k2
W2
h
Nh
V h
2 2
con V h S 2
hy c S hx 2 c S hxy estimado con una muestra previa
h1
Encontrar la expresin del tamao de muestra necesario para estimar el total poblacional.
4.3 Expresiones Alternativas para el Estimador de Regresin:
Suponemos observado un vector x de J variables auxiliares y los modelos
E y k x k
E y k 1 2 x k
y 2
1
V y k 2 x k
V y k 2
i) Primera alternativa :
1
Dada la muestra s el ajuste del modelo permite estimar T t /
J
x x
x y
k 1, . . . , N.
t 2k k 1 , . . . , J y y k x k j x jk
T 2k k
ks
k k
ks
k k
s
Para el modelo 1
ys
s
yk
k
1
k
, xs
xk
k
1
k
Para el modelo 2
j1
yr U x k s
s
yk
k
xk
k
s
, 2
x k x s y k y s
k
x k x s 2
k
yk
k
xk
k
y s 2 x s
donde
yr N y s 2 x U x s
e ks y k y k ,
ks
yr y k eksk y k e ks
U
ks
ks
Var yr s kl g ks e ks g ls e ls / kl 1
kl
kl
, e ls
e ls
k
, g ks
U xk
s xkk
Casos Particulares:
Si el modelo es
Var yr
E y k x k
V y k 2 x k
U x
s
2
k
xk
k
1f
n
, bajo m.a.s.
y k x k
n1
e ks
k
0 es que exista J
5.- Ejemplos:
5.1 Una fbrica de frigorficos contempla revisar su poltica de mercado. Por ello, desea
estimar cuntos frigorficos se van a vender el prximo verano, y . Atendiendo a varios
factores, se divide el pas en cuatro zonas. El nmero de comerciales en estas cuatro zonas
es 400, 216, 364 y 274, mientras que el nmero total de refrigeradores vendidos el pasado
verano fue 29100, 12060, 26567 y 1811. Tratando las zonas como estratos, se decide
seleccionar una muestra de 42 comerciales. Se utiliza afijacin de mnima varianza ya que
se facilita la siguiente informacin poblacional respecto del nmero de ventas del ao
2
2
2
pasado en cada estrato: 2
1 207. 36, 2 282. 24, 3 184. 96, 4 127. 69.
Los datos observados se muestran en la siguiente tabla: (X:ventas del pasado verano,
Y:ventas esperadas del prximo verano)
nh
Zona I
Zona II
Zona III
Zona IV
X Y
X Y
X Y
X Y
53
69
44 52
60 67
58 52
84
80
67 73
76 86
65 71
93
87
84 78
78 75
56 62
66
72
52 60
68 77
48 44
77
81
48 42
55 64
73 77
82
94
62 56
48 45
85 80
68
64
56 50
86 98
61 66
84
88
70 76
91 95
79
72
40 48
69 76
98 110
70 79
50
62
79 92
78
70
49 66
92
85
63
77
Nh
Wh
xh
xh
xh
yh
S 2
hy
S 2
hx
S hxy
Estrato 1 14 400 0.319 72.8 29100 76.2 79.4 166.7 211.1 146.5 0.694
Estrato 2
216 0.172 55.8 12060 58.1 59.4 174.3 197.1 164.8 0.836
rh
0.781
0.889
0.900
0.899
73
193
188.3 0.975
274 0.218 66.1 18111 63.7 64.6 170.6 147.9 142.8 0.965
5.2 Un experimento tiene por objeto estimar la superficie (v.a. Y) media de hoja de una
nueva variedad de trigo. El experimentador decide plantar 40 unidades entre tres lugares
diferentes. Se obtienen 640, 710 y 769 hojas respectivamente. El peso total de estas hojas
en estas tres plantaciones fue 69000, 81137 y 78009 grs respectivamente. Usando afijacin
proporcional se toma una m.a.s. de 39 hojas con los siguientes resultados (Y: rea en cm 2 ,
X: peso en grs.);
Estrato I
Estrato II
Estrato III
Y X
Y X
Y X
26. 01 103
21. 08
97
41. 07 130
25. 7
103
26. 13 107
18
89
34. 23 119
28. 05 109
17. 92
91
26. 16 107
33. 71 117
26. 73 105
19. 37
99
28. 56 112
24. 81 101
28
103
29. 43 110
28. 3
107
24. 03
91
22. 41 105
16. 07
81
36. 61 123
32. 06 113
29. 41 111
34. 09 117
27. 64 108
21. 09 104
102
35. 47 121
22. 18 102
34. 78 122
31. 57 113
17. 76
23. 17 106
39. 06 129
28. 21 101
20. 66
99
26. 7
106
19. 84
96
84
21
S hxy
133. 9
68. 41
0. 5109
66. 24
nh
Nh
Wh
xh
xh
xh
110. 9
yh
S 2
hy
0. 523