Escolar Documentos
Profissional Documentos
Cultura Documentos
Cuando los estudios estn basados en muestreo, es importante tener claro cules
son las unidades de muestreo. De esto depender que la inferencia a realizar sea correcta.
Un supuesto bsico para hacer inferencia es que las unidades de muestreo deben ser
independientes entre s. Esto significa que el resultado proporcionado en un dato no es
influenciado por otro. Sin embargo, este supuesto es algunas veces violado debido a un
concepto denominado "pseudo-rplica". El concepto se presenta cuando las respuestas no
son independientes debido a que una unidad de muestreo responde ms de una vez el
mismo cuestionario. La repercusin de las pseudo-rplicas ha tenido impacto en reas de
biologa y ciencias. Algunos artculos relacionados al tema son atribuidos a Hulbert (1984),
Millar & Anderson (2004) y Ruxton & Colegrave (2003). A modo de ejemplo, suponga que
se quiere determinar la cantidad de insectos por hoja de cierta especie de planta. Se cuenta
la cantidad de insectos en tres, cinco y siete hojas de tres plantas de la misma especie. No
obstante, sera un error pensar que se tienen quince datos, ya que las hojas de una misma
planta tienen ms en comn entre ellas que las hojas de otra planta (si una planta ha sido
infectada o colonizada, es probable que presente altas densidades en todas sus hojas).
El cuestionario usado para calcular el ndice nacional de satisfaccin de clientes
(INSC) pregunta por la percepcin acerca del servicio proporcionado por las industrias y
marcas (IM) ms importantes de Chile. El INSC se calcula semestralmente desde el primer
semestre del ao 2000 con el mismo cuestionario preguntando por diferentes marcas. Esto
produce la opcin que un encuestado (cliente) evale el servicio de, por ejemplo, tres IMs,
otro evale cinco IMs y otro evale siete IMs. Esto es similar al caso de los insectos en las
hojas, generando pseudo-rplicas. Adems, aplicar el mismo cuestionario para preguntar
por diferentes IMs en un mismo periodo de tiempo podra generar cansancio o agobio al
responder, provocando una posible no respuesta a ciertas preguntas. Ms an, debido al
tiempo que el encuestado demora en responder, y al cansancio que esto produce, se
presenta el problema de respuestas repetidas. Esto quiere decir que, como la mayora de las
preguntas del cuestionario apuntan al servicio que la IM entrega al cliente, el encuestado da
la misma respuesta a todas las preguntas.
El objetivo de este trabajo es evaluar estadsticamente problemas de ausencia de
respuesta, pseudo-rplicas y respuestas repetidas, en el cuestionario usado para calcular el
INSC. Los resultados de esta evaluacin podran ayudar a mejorar la informacin general o
sectorial entregada cada semestre sobre el tema.
El resto del trabajo se organiza de la siguiente forma. En la Seccin 2 se
introducen los mtodos utilizados en este estudio. En la Seccin 3 se evalan los problemas
de pseudo-rplicas, ausencia de respuesta y respuestas repetidas. En la Seccin 4 se
presentan las conclusiones de este trabajo y futuras posibles investigaciones sobre el tpico.
2. Mtodos
El INSC neto de la variable (pregunta) j se calcula mediante la frmula
INSC =
, (1)
donde es la cantidad de respuestas (telefnicas) y es una variable codificada desde una
pregunta j del cuestionario (en escala de 1 a 7) correspondiente al individuo i dada por
1, si el encuestado evalu la pregunta con nota 6 7;
0, si el encuestado evalu la pregunta con nota 5;
=
1, si el encuestado evalu la pregunta con nota 1, 2, 3 4.
2
600
450
1650
450
451
600
600
750
450
900
450
451
751
451
450
600
450
602
901
7344
150
300
600
900
151
450
150
450
300
301
300
23403
0
0
0
41
0
0
1
0
31
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
74
1.00
0.78
0.74
0.70
Nmero de pseudo-rplicas
1
2
3
72
202
326
42
124
284
437
618
554
24
78
348
34
113
304
45
92
462
32
86
482
274
224
221
30
110
310
170
321
409
22
75
353
26
75
350
37
135
579
43
97
311
46
109
295
22
103
475
69
45
335
72
175
355
235
282
384
2.228
1.802
3.314
22
42
86
11
39
250
73
131
396
294
123
483
29
37
85
21
71
358
17
35
98
53
76
321
9
47
244
15
41
245
16
45
239
4.520
5.553
13.256
0.78
1.00
0.72
0.71
0.74
0.72
1.00
0.84
Nmero de encuestados
185
133
604
125
131
170
165
298
129
294
124
126
208
132
133
164
134
183
308
2.542
47
81
179
309
48
124
45
132
81
82
83
7.499
0.70
0.71 . (2)
0.84
1.00
Desde (2), note que, utilizando los 23.403 datos (es decir, utilizando todas las pseudorplicas), las cuatros variables estn altamente correlacionadas en forma positiva. No
obstante, esta tendencia positiva es ms clara cuando se asignan puntales ms altos que
bajos; ver Figura 2. Esto quiere decir que, si un encuestado asigna una buena calificacin a
una variable (pregunta) para una industria, entonces esa buena calificacin es replicada para
todas las otras variables de la misma industria. Esto puede deberse a que el encuestado ya
tiene una buena opinin global de la industria y, por cansancio u otra razn, solamente
repite el puntaje.
1.00
0.78
0.74
0.71
Satisfaccin
Satisfaccin precio
Confianza
Transparencia
Total duplicados
74
67 (1%)
2.368 (52%)
2.368 (52%)
4.520 (100%)
108 (2%)
2.216 (40%)
2.216 (40%)
5.553 (100%)
495 (4%)
4.564 (35%)
4.564 (35%)
13.256 (100%)
Total
670 (3%)
9.148 (40%)
9.148 (40%)
23.403 (100%)
5. Referencias
DeVries W, Keller W & Willeboordse A (1996) Reducing the response burden: some
developments in the Netherlands. International Statistical Review, 64, 199-213.
Dillman D, Clark J & Sinclair M (1995a) How prenotice letters, stamped return envelopes
and reminder postcards affect mailback response rates for census questionaries. Survey
Methodology, 21, 159-165.
Freeberg T & Lucas J (2009) Pseudoreplication is (still) a problem. Journal of Comparative
Psychology, 123, 450-451.
Hidiroglou M, Drew J & Gray G (1993) A framework for measuring and reducing
nonresponse in surveys. Survey Methodology, 19, 81-94.
Hulbert S (1984) Pseudoreplication and the design of ecological field experiments.
Ecological Monographs, 4, 187-211.
Millar R & Anderson M (2004) Remedies for pseudoreplication. Fisheries Research, 70,
397-407.
Platek R (1977) Some factors affecting non-response. Survey Methodolog, 31, 191-214.
Ramage B, Sheil D, Salim H, Fletcher C, Mustafa NZ, Luruthusamay J, Harrison R, Butod
E, Dzulkiply A, Kassim A & Potts M (2013) Pseudoreplication in tropical forest and the
resulting effects on biodiversity conservation. Conservation Biology, 27, 364-372.
Ruxton G & Colegrave N (2003) Experimental Design for the Life Science. Oxford
University Press, Oxford.