Escolar Documentos
Profissional Documentos
Cultura Documentos
1. Muestreos aleatorios
2. Muestreos no aleatorios
3. Tamao de la muestra
La poblacin o "poblacin objetivo" es ese grupo entero de elementos de los que queremos recoger
datos. Los acercamientos en definirlo se discuten en una pgina separada: Delimitar la poblacin de
estudio.
En un estudio emprico, este grupo puede consistir de gente, animales u otros objetos. En un estudio
de caso contiene apenas un objeto o acontecimiento, pero en una investigacin tericamente
orientada puede ser infinita, es decir usted desea saber algo que es verdad para cada objeto o
acontecimiento del tipo dado en el universo.
El estudio total es un mtodo relativamente costoso, porque el trabajo emprico toma tiempo e
implica a menudo aparato, recorridos y otros costes. Los objetivos de un proyecto de investigacin
no requieren siempre una cuenta absolutamente exacta de la poblacin entera. Una aproximacin
confiable sera suficiente a menudo. Por lo tanto es comn que usted mide o registra solamente tan
muchas unidades de la poblacin a que usted puede permitirse y que sean necesarias para alcanzar
las metas del proyecto. A este fin, varias estrategias estn disponibles. Algunos se listan abajo.
Hay dos principios alternativos que pueden seguirse cuando se elige una muestra:
Divergencia al azar: Usted obtiene algunos casos con las caractersticas inusuales
accidentalmente en la muestra. Esto en cambio infectar los datos resumidos (e.g.
promedios) de la muestra. Si una muestra aleatoria es bastante grande, las divergencias a las
direcciones opuestas se cancelan en su mayor parte.
Sesgo sistemtico, la tendencia, error sistemtico, o una diferencia sistemtica entre
poblacin y muestra, ocurre a menudo en la muestra no aleatoria. Es causado por el mtodo
de seleccin, que favorece a menudo inadvertidamente algunos tipos de artculos antes de
otros. Este fastidio puede causar muchas veces mayor una declinacin en la
representatividad de una muestra que la divergencia al azar podra crear.
Usted puede preguntar por qu utilizar el muestreo no-aleatorio en todos, porque implica el riesgo
del sesgo, una fuente aparentemente innecesaria del desacuerdo con la poblacin? Hay varias
motivaciones posibles:
La poblacin es infinita (o muy cerca) o es imposible hacer una lista de l para la base de la
seleccin al azar.
A veces usted no puede encontrar algunos artculos en la poblacin. Una seleccin al azar
no sera razonable, porque sera posible ejecutar apenas una parte de l.
Los objetivos del estudio no requieren resultados exactos. El muestreo no-al azar es
generalmente ms barato y ms aprisa.
El proyecto incluye un procedimiento eficiente del control ulterior. Por ejemplo, podra ser
difcil de persuadir a clientes escogidos al azar participar en el procedimiento de crear
conceptos del producto nuevo y probar las propuestas, cul toma normalmente varios das.
En lugar, puede ser ms fcil utilizar una muestra no-al azar de los voluntarios para los
grupos de trabajo iniciales del desarrollo de producto. Ms adelante las propuestas finales
entonces se probarn con las muestras apropiadas escogidas al azar de la poblacin de los
clientes de blanco.
Muestras aleatorias
Si una muestra aleatoria se hace correctamente, contiene no tendencia sistematica y es por lo tanto
relativamente representante de la poblacin. Por supuesto, en un estudio de muestreo, nunca
podemos estar seguros al 100% de que los resultados medidos a partir de la muestra sean tambin
ciertos en la poblacin. No obstante, a efectos prcticos suele ser suficiente si podemos afirmar que
el riesgo de una desviacin de la poblacin es, digamos, un 1%. Seremos capaces de hacer tales
afirmaciones que estn basadas en clculo de probabilidades si hemos usado una muestra aleatoria.
El principio de la seleccin de los elementos en una muestra aleatoria es el mismo que cuando se
reparten la baraja. Todos los objetos de la poblacin tienen iguales probabilidades de ser
seleccionados en la muestra. Esta probabilidad es llamada razn de muestreo (sampling ratio en
ingls), y es igual al nmero de elementos de la muestra dividido por el nmero de la poblacin.
Hay mtodos alternativos para crear una muestra aleatoria (en otras palabras,
una "muestra de probabilidad"). En los diagramas siguientes, los casos de la
poblacin original se presentan como puntos u otros smbolos pequeos, y los
casos seleccionados en la muestra se demuestran como smbolos en negrita.
Para asegurar por lo menos algunos de una minora clave (marcada con x en el
diagrama a la derecha) en la muestra, podemos incrementar deliberadamente
la razn de la muestra sobre este grupo de especial importancia. Por supuesto que esto generar un
desequilibrio en las mediciones que se obtengan a partir de la muestra ponderada, pero ser fcil
restaurar el equilibro original. Esto se hace as cuando se combinan los resultados; por ejemplo, al
calcular la media de todas las mediciones daremos a las mediciones de cada grupo su peso
apropiado correspondiente a los porcentajes genuinos en la poblacin.
Muestras no aleatorias
Las muestras no aleatorias (o "no probabilsticas") { son seleccionadas por cualquier procedimiento
que no da todos casos en la poblacin las oportunidades iguales de caer en la muestra. A veces el
contexto del estudio permite o facilita un cierto mtodo de muestreo, a veces el investigador tiene la
posibilidad de escoger el mtodo. Varios tales procedimientos sern discutidos abajo.
En estudios descriptivos la presencia de sesgo es una desventaja grave que usted encontrar ms
adelante en su proyecto, en cundo valorar el muestreo y en cundo escribir el captulo final de su
informe. Por lo tanto puede ser prudente pensar de l por adelantado, cundo escoger el mtodo de
muestreo.
Al valorar una muestra no-aleatorio que usted debe preguntar usted mismo: Sern los resultados de
la muestra el mismo que usted conseguira de la poblacin? Es cierto que el criterio que usted ha
utilizado en seleccionar la muestra (e.g. la buena voluntad de la gente de participar) no tiene
ninguna correlacin con esas variables que usted desee registrar de la muestra? Si hay correlacin,
su muestra est sesgada y usted debe considerar el construir de una muestra nueva con menos
correlacin.
Una muestra de voluntarios puede ser una alternativa prctica cuando no hay lista de los miembros
de la poblacin de quien una muestra aleatoria se podra escoger, o cuando es difcil de contactar a
la gente en una muestra porque sus direcciones no se saben. La desventaja es que es difcil
determinar la presencia del sesgo, es decir si las opiniones u otras caractersticas interesantes de los
voluntarios se desvan de sos de la poblacin. Cuando en vista de esta pregunta, hay dos cuestiones
que plantearse:
Qu es la poblacin que usted apunta? Es cierto que todos los miembros de la poblacin
concernida tenan las mismas oportunidades de ser incluidos en la muestra?
Hay cualquier razn por qu puedan diferir los voluntarios del resto de la poblacin? Por
ejemplo, tienen ellos, o por lo menos algunos de ellos, una razn especial para ofrecerse?
Si usted, por ejemplo, quiere obtener una muestra de gente que ha comprado su ltimo producto,
usted puede incluir en el paquete del producto un formulario franqueo-pagada donde la gente puede
dar sus nombres y direcciones. Qu sucedera si usted pidi adems que los respondedores dieran
sus opiniones del producto? Usted conseguira probablemente respuestas sobre todo de la gente que
tiene una opinin fuerte de su producto, positiva o negativa. La gente sin opinin definida de su
producto quizs no incomodara contestar. La muestra sera as sesgada, y usted tendra que
considerar si tal tendencia podra ser aceptable para sus fines.
El material a veces se ha seleccionado para cualquier propsito, por ejemplo para ser
mantenido en archivos, bibliotecas o museos?
Algunos objetos en el material a veces se han substituido por nuevos?
Qu clases de cosas fueron mirados generalmente como basura, o al contrario, como digno
y apropiado ser preservado?
Hay factores fsicos que pueden haber afectado diferentemente en la preservacin de
varios grupos de material?
Los casos permitidos. Al estudiar las empresas privadas sucede a menudo que la gerencia no
permitir colectar informacin desde ciertas unidades en la organizacin. La decisin de la
administracin es motivada quizs por su juicio sobre los objetivos del estudio, pero del punto de
vista cientfico tal muestra a menudo parecer gravemente sesgada.
Sobrepasar los lmites de la poblacin. No tenemos que incluir elementos que no sean miembros
de la poblacin en nuestra muestra. Por ejemplo, en muestreo bola-de-nieve sucede a menudo que
alguna gente entrevistada nomina a candidatos que no pertenecen a la misma poblacin. Por
supuesto, usted tiene a menudo la opcin de alterar sus delimitaciones originales.
Muestra de especialistas. Puede ser que parezca una idea sensible de preguntar directamente sos,
a menudo pocos, personas que saben mucho sobre el asunto, en vez de preguntar una muestra
grande de legos escogidos al azar cuyo conocimiento puede ser espordico y cuyos opiniones
pueden divergir. As, podramos por ejemplo:
La ventaja a entrevistar a especialistas es que usted necesita entrevistar apenas unas pocas personas
y en la discusin usted consigue rpidamente al punto. Sin embargo, usted no debe pensar que los
"especialistas" puedan ser tomados como muestra de "no especialistas". Son dos poblaciones
diferentes. No debiramos generalizar los resultados de "especialistas" a ninguna otra poblacin.
Si usted entonces desea adems recolectar las opiniones de los consumidores medios, usted debe
definir stos como una poblacin segunda y seleccionar una muestra adecuada de ella, tambin. Una
alternativa deber hacer dos proyectos distintos de estos dos exmenes. Una posibilidad es hacer
estos dos exmenes en sucesin. Podramos tal vez continuar transformando los resultados a partir
de los especialistas en hiptesis que ms tarde verificaramos con una muestra apropiada de la
poblacin "real" o de no especialistas, que seran en los ejemplos citados, respectivamente, los
consumidores y los arrendatarios. En otras palabras, podramos usar la entrevista de los
especialistas como un estudio preliminar slo.
Muestreo normativo. El aspecto normativo es aceptable en los proyectos del desarrollo que
apuntan a mejorar objetos similares en el futuro, pero es mejor guardarlo fuera del muestreo porque
no es compatible con los principios de la representatividad y de la generalizacin.
El propsito principal del muestreo es reducir la necesidad de las operaciones empricas que exigen
el trabajo y el coste. Cmo pequea puede una muestra entonces estar sin perder su utilidad? Es
decir cul es el nmero ms pequeo de los casos que todava nos dan bastante confiables datos
sobre la poblacin?
Muestras aleatorias
Los datos que podemos conseguir de la muestra son normalmente levemente diferentes de los datos
de la poblacin. La razn es que la seleccin al azar ha trado a la muestra no solamente artculos
medios de la poblacin, pero tambin algunos artculos ms o menos excepcionales. Cuntos de
ellos, puede ser anticipado usando la teora de probabilidades. Puede tambin decirnos cmo grande
es el riesgo de conseguir datos errneos debido a estos casos excepcionales. El riesgo es
aproximadamente proporcional a la variacin de las variables y en la relacin inversa al tamao de
muestra.
Usted, por ejemplo, ha medido dos variables de una muestra pequea y ha encontrado que su
correlacin es 0,26. Es siempre posible que tal correlacin se haya creado en la muestra apenas
accidentalmente y no es verdad en la poblacin. Usted desea que la probabilidad de tal accidente
sea menos de 1%. Si usted consulta la tabla que se presenta en t-test, usted encontrar que una
muestra de 100 casos se necesita antes de que la probabilidad de conseguir accidentalmente una
0.26 correlacin disminuya a 1%.
Otro ejemplo. Usted estudia porcentajes y usted desea ser 95% cierto que el porcentaje que usted ha
medido de una muestra es verdad en la poblacin tambin. Aqu usted puede utilizar la frmula
del intervalo de confianza:
donde
Si el intervalo de confianza, segn la frmula, es demasiado ancho, usted puede cortarlo usando una
muestra ms grande. De la frmula usted puede deducir que si usted multiplica el tamao de
muestra por cuatro, el intervalo de la confianza se contraer en la mitad. La frmula es
independiente del tamao de la poblacin.
Las formulas para el clculo son exactas pero algo engorrosas de usar por las muchas alternativas
que intervienen; por ese motivo no se presentan aqu. Una regla que no falla muy aproximada dice
que para hacer un anlisis de varianza necesitar 30 casos, para anlisis de regresin 40 casos
multiplicados por el nmero de variables, y para una prueba Chi por lo menos cinco casos en cada
clula en la tabla de la distribucin. En proyectos importantes con amplios recursos se suele
consultar a un estadstico para calcular el tamao de la muestra. En un proyecto de investigacin
con recursos limitados, la regla general es: usar una muestra tan amplia como nos podemos
permitir.
Muestras no aleatorias
No hay frmula para determinar el tamao de una muestra no aleatoria. Con frecuencia,
especialmente en investigacin cualitativa, podemos simplemente ampliar gradualmente nuestra
muestra y analizar los resultados segn llegan. Cuando en casos nuevos ya no se presenta
informacin nueva, podemos concluir que nuestra muestra est saturada, y terminaremos el
trabajo. Este mtodo es, sin embargo, muy vulnerable al muestreo sesgado, con lo que tenemos que
ser muy cuidadosos y asegurarnos que no omitimos a ningn grupo de nuestra poblacin.
Si usted puede permitirse hacer una segunda muestra, intente crearla con otro mtodo de seleccin.
Guarde inicialmente separado los datos de cada uno de las muestras. Comparndolas usted tiene un
medio excelente de juzgar la presencia del sesgo en cualquiera de ellos.
Antes de decidir el tamao de una muestra no aleatoria, tal vez queramos leer cmo debe
ser evaluada la representatividad de los resultados a partir de una muestra no aleatoria. De otro
modo podramos sufrir una sorpresa bastante desagradable cuando estemos intentando, demasiado
tarde, definir la poblacin en que nuestros resultados puedan ser declarados vlidos.
Sucede a menudo que algunos casos en la muestra resultan infructuosos porque no pueden ser
alcanzados, o las medidas fallan, o los entrevistados rechazan cooperar etc. El mtodo normal es
entonces sobredimensionar la muestra levemente, y despus se olvida simplemente los casos que
fallan.
Si usted, no obstante, desea haga el muestreo muy cuidadosamente, usted debe preguntarse: Es
probable o posible que los casos que fallan diferencian los acertados en cualquier respecto que
interesa en su proyecto? Solamente cuando la respuesta estar no, la ausencia de estos casos no
introducir sesgo en los resultados. Si usted, al contrario, piensa que los casos que fallan diferencian
sistemticamente del resto, usted puede intentar compensar el sesgo dando pesas diferentes a los
datos que vienen inmediamente y los que vienen slo tras solicitarlas de nuevo. El mtodo se
explica en El problema de la no-respuesta.