Você está na página 1de 54

I.

DISEO Y ANLISIS DEL MUESTREO

Una vez que el problema, los objetivos y las hiptesis de una investigacin han sido planteados, la etapa siguiente que debe ser atendida es el diseo del muestreo. La parte estadstica del muestreo es indispensable en la obtencin de datos, es la piedra angular de la investigacin. Una muestra que no tenga representacin de la poblacin de estudio imposibilita la obtencin de datos con-fiables, an cuando en las etapas posteriores se utilicen las tcnica de anlisis ms sofisticadas. En este apartado se dan las bases tericas para atender las tres grandes preguntas que deben ser contestadas en todo proceso de muestreo: cmo debo tomar las muestras?, dnde debo muestrear? y, cuntas muestras debo tomar? para que mis datos sean representativos de la poblacin que pretendo estudiar.

INTRODUCCIN AL DISEO Y ANLISIS DE MUESTREO DE POBLACIONES FINITAS

1
INTRODUCCIN AL DISEO Y ANLISIS DEL MUESTREO DE POBLACIONES FINITAS
Jorge Navarro Alberto*

Muestreo de poblaciones finitas I Diseo de encuestas por muestreo A diferencia de los cientficos fsicos que realizan experimentos, los cientficos sociales y de la vida silvestre llevan a cabo encuestas para recolectar una muestra. Reconocemos as, que existen diferencias de un campo de la ciencia a otro, en la naturaleza de las poblaciones y la naturaleza en la que una muestra puede ser extrada. Por ejemplo, la poblacin de animales de una especie particular pueden contener nicamente un nmero pequeo de elementos. Las limitaciones en el procedimiento de muestreo tambin varan de un rea de la ciencia a otra. El muestreo en las ciencias fsicas frecuentemente pueden ser ejecutadas bajo condiciones experimentales controladas. Tal control es prcticamente imposible en las ciencias sociales y manejo de recursos naturales. Por ejemplo, un investigador en medicina puede comparar el crecimiento de ratas sometidas a dos frmacos diferentes. Para este experimento los pesos iniciales de las ratas y la ingesta diaria de alimento pueden ser controlados para reducir alguna variacin indeseable en el experimento. En contraste, muy pocas variables pueden ser controladas al estudiar el efecto de las condiciones ambientales sobre el nmero de venados en la Pennsula de Yucatn. Las tcnicas descritas en este captulo se han aplicado primordialmente en el diseo y anlisis de encuestas, por ello el nombre dado a esta rea de la estadsti*

Departamento de Ecologa. Facultad de Medicina Veterinaria y Zootecnia. Universidad Autnoma de Yucatn

19

TCNICAS DE MUESTREO PARA MANEJADORES DE RECURSOS NATURALES

ca. No obstante, las tcnicas han sido ampliadas y mejoradas para dar cabida al muestreo de poblaciones biolgicas, en ramas como la Ecologa o el Manejo de Recursos Naturales. En este captulo se presentan mtodos bsicos para el diseo y anlisis del muestreo de poblaciones finitas tiles al manejador de recursos naturales. Al revisar cada tema, tenga presente que el objetivo primordial de cada seccin es la inferencia. Identifique el procedimiento de muestreo asociado a cada seccin, los parmetros poblacionales de inters, sus estimadores y los lmites asociados a los errores de estimacin.

Inferencia estadstica El objetivo de cualquier encuesta por muestreo es realizar inferencias acerca de una poblacin de inters, partiendo de la informacin obtenida en una muestra de dicha poblacin. Las inferencias en las encuestas por muestreo usualmente son dirigidas a la estimacin de ciertas caractersticas numricas de la poblacin, tales como la media, el total o la varianza. Estas medidas descriptivas numricas de la poblacin se denominan parmetros. Ejemplos de parmetros (parmetros-objetivo). En esta parte introductoria consideraremos tres parmetros-objetivo que habitualmente se desearan estimar en estudios observacionales: la media, el total y la proporcin de xito. Los dos primeros parmetros son tiles cuando el investigador tiene inters en variables cuantitativas. En el cuadro 1 se ejemplifican situaciones en donde estos dos parmetros podran ser estimados.
Cuadro 1

Variable Peso de una vaca Superficie de una finca rstica Nmero de hijos de una familia Contenido en miligramos de fsforo de una hoja

Total Suma de pesos de todas las vacas de un hato Suma de superficies en hectreas Suma de hijos Suma de miligramos

Media Total dividido por el nmero de vacas del hato Total dividido por el nmero de fincas Total dividido por el nmero de familias Total dividido por el nmero de hojas

Ejemplos de totales y medias poblacionales.

Cuando en lugar de variables cuantitativas, el investigador solamente desea registrar una caracterstica cualitativa binaria (es decir, a cada elemento de la
20

INTRODUCCIN AL DISEO Y ANLISIS DE MUESTREO DE POBLACIONES FINITAS

poblacin corresponde una caracterstica o atributo yi que solo puede tomar dos valores, llamados tcnicamente xito y fracaso), entonces un parmetro-objetivo podra ser la proporcin de xitos en la poblacin. Para calcular esta proporcin se suma el nmero de veces que ocurre un xito; entonces la proporcin es igual a ese total dividido entre el nmero de elementos de la poblacin. Por tanto, la proporcin puede considerarse un caso particular de la media aritmtica cuando el resultado de la medida tiene que ser o xito o fracaso. Ejemplos de proporciones se dan en el Cuadro 2. Desde ahora indicamos al lector que las frmulas que iremos presentando en el transcurso de este captulo (que se podrn identificar facilmente por estar en cuadros etiquetados con la leyenda CAJA #), se referirn exclusivamente a los parmetros-objetivo media, total y proporcin.
Cuadro 2

Atributo Venado adulto

Total de clase Nmero de venados adultos Nmero de padres de familia campesina que cultivan maz Nmero de solteros Nmero de personas con opiniones positivass

Proporcin Total de la clase dividido por el nmero de animales (adultos y no-adultos) Total de la clase dividido por el nmero de padres de familia campesina Total de la clase dividido por el nmero de individuos Total de la clase dividido por el nmero de opiniones registradas

Cultivo de maz

Estado civil, soltero Opinin positiva sobre determinada cuestin

Ejemplos de proporciones poblacionales

Estimadores de parmetros Un estimador es una funcin de variables aleatorias observables y quizs otras constantes conocidas, usado para estimar un parmetro. Por ejemplo, la media muestral puede ser usada como un estimador de la media poblacional . Ntese que es una variable aleatoria y tiene una distribucin de muestreo que depende del mecanismo muestral. Algunos de los posibles valores que puede tomar estarn cercanos a , y otros pueden estar bastante alejados de en cualquiera de los lados, positivo o negativo. Con los mtodos que veremos en estas (el secciones, seleccionaremos un plan de muestreo que nos asegure quey valor esperado de es ) y que la varianza de, , es pequea.
21

TCNICAS DE MUESTREO PARA MANEJADORES DE RECURSOS NATURALES

$ un estimador para . Dos propiedades En general, sea un parmetro y sea $ deseables para son: 1. (Insesgamiento de) 2. es pequea. (Varianza mnima entre estimadores de ). $ depender del mecanismo de muestreo Aunque la distribucin de muestreo de y los tamaos de muestra y la poblacin, en muchas situaciones se puede usar el $ es aproximadamente normal. El Teorema del Lmite Central para afirmar que Teorema del Lmite Central y su aplicacin a estimadores como o p (probabilidad de xito de una poblacin binomial) es adecuada si n, el tamao de la muestra , es grande, digamos, .

Definicin. $ un estimador de . El error de estimacin se define Sea un parmetro y . como: No podemos establecer que un estimador observado estar dentro de una distancia especificada de , pero podemos, aproximadamente, encontrar un lmite tal que:

para cualquier probabilidad deseada, , donde . Si tiene una , donde es el valor que separa un rea de /2 distribucin normal, .95 en la cola del lado derecho de la distribucin normal estndar. Si, entonces 1.96, o sea, aproximadamente 2. Ya que muchos estimadores que usamos a lo largo de estas sesiones no van a tener una distribucin precisamente normal para muchos valores de los tamaos de muestra n y de los tamaos de poblacin N, y ya que el Teorema de Tchebysheff establece que al menos 75% de las observaciones para cualquier distribucin de probabilidad estar dentro de dos desviaciones estndar de su media vamos a usar como lmite del error de estimacin. Esto nos da una 0.95 para los casos aproximadamente normales y 0.75 en cualquier otro caso, si . entonces, . En esta forma , se denomina un intervalo de confianza para con coeficiente de $ B se llama el lmite inferior de confianza (LIC) confianza 1 . La cantidad $ B se llama el lmite superior de confianza (LSC). y Si

22

INTRODUCCIN AL DISEO Y ANLISIS DE MUESTREO DE POBLACIONES FINITAS

Elementos del problema de muestreo Consideraremos el problema particular del muestreo de poblaciones finitas, aunque ocasionalmente nos referiremos a poblaciones infinitas. La cantidad de informacin obtenida en la muestra para hacer inferencias acerca de la poblacin depende del nmero de elementos muestreados y de la cantidad de variacin de los datos. El diseo de la encuesta por muestreo es el mtodo de seleccin de la muestra dirigido a controlar la variacin de los datos que pudiera afectar la inferencia. El diseo de la encuesta y el tamao de la muestra determinan la cantidad de informacin pertinente a un parmetro poblacional, siempre y cuando se obtengan mediciones exactas en cada elemento muestreado. Como siempre estaremos sujetos a errores, la manera de controlar la exactitud de las mediciones sera mediante mtodos adecuados de recoleccin de datos y por una buena elaboracin del instrumento de muestreo (o cuestionario o plan de muestreo). Ejemplo. En la comunidad de Villa Natura se realiz una encuesta de opinin para determinar la actitud del pblico hacia la creacin de una nueva seccin especial para acampar en un parque ecolgico. El objetivo de la encuesta fue estimar la proporcin del nmero de personas en la comunidad mayores de 18 aos que pudieran hacer uso de la nueva seccin para acampar. Un tem o unidad experimental ltima es un objeto en el cual se toman las mediciones. En el ejemplo anterior, una unidad experimental ltima es un habitante de la comunidad, mayor de 18 aos. La medicin tomada de esta unidad experimental ltima es la preferencia del individuo en cuestin respecto a la posibilidad de uso, en el futuro, de la seccin para acampar. Podra registrarse la medicin como 0 = no lo usar; 1 = la usar. Una poblacin es una coleccin de elementos acerca de los cuales deseamos hacer una inferencia. La poblacin en el ejemplo de anterior es la coleccin de los habitantes mayores de 18 aos de la comunidad. Otros ejemplos de poblaciones podran ser todos los hospitales en una ciudad, todos los pacientes con una enfermedad ahora y en el futuro, todos los venados cola blanca en un rea, o todas
23

TCNICAS DE MUESTREO PARA MANEJADORES DE RECURSOS NATURALES

las rdenes de pago procesadas por una compaa en el perodo de un ao. Algunas poblaciones, tales como los hospitales en una ciudad, son de un tamao finito de modo que pueden determinarse si es necesario. Otras, como los pacientes con un enfermedad ahora y en el futuro son finitas, pero de un tamao indeterminado. En algunos casos una poblacin es infinita, como son los resultados que pueden obtenerse repetidamente al lanzar una moneda y ver si el resultado es guila o sol.

Consideraciones importantes Uno debe definir cuidadosa y completamente la poblacin antes de recolectar la muestra. As, debemos distinguir entre la poblacin muestreada y la poblacin objetivo, puesto que algunas partes de la poblacin objetivo pueden ser imposibles de alcanzar (p.e. los nios de la calle o los mendigos en ciudades grandes no estn en listas y no tienen residencias permanentes). Sin embargo, ellos son an parte de la poblacin de la ciudad. De manera similar, al considerar la poblacin de pacientes potenciales con una enfermedad, no hay manera de muestrear a aquellos que no han nacido aun. Los estudios debern ser diseados de modo que la correspondencia entre la poblacin objetivo y la poblacin muestreada sea lo ms estrecha posible. Volviendo al ejemplo, si la nica poblacin disponible para el muestreo es una lista de residentes de la comunidad, entonces se debe recolectar informacin acerca de la edad de la persona muestreada y, as, identificar si el individuo tiene ms de 18 aos. Las unidades de muestreo son colecciones no sobrelapadas de elementos de la poblacin que cubren la poblacin completa. En el ejemplo anterior, una unidad de muestreo puede ser un habitante de la comunidad mayor de 18 aos, visitante potencial o no, de la zona para acampar en el parque. Sin embargo, un proceso ms eficiente puede ser muestrear hogares (colecciones de unidades experimentales ltimas). Si los hogares son unidades de muestreo, stos deben definirse de tal manera que ninguna persona mayor de 18 aos de la poblacin pueda ser muestreada ms de una vez, y que cada unidad experimental ltima tenga alguna oportunidad de ser seleccionada.
NOTA. Las muestras de parcelas tomadas, por ejemplo, en estudios en una regin en donde vive un animal, son frecuentemente circulares. A pesar de sus ventajas, obviamente las parcelas no pueden cubrir un campo sin que ocurra algn sobrelapamiento. Se sugiere que ste sea lo ms pequeo posible para lograr un muestreo eficiente.

24

INTRODUCCIN AL DISEO Y ANLISIS DE MUESTREO DE POBLACIONES FINITAS

Un marco es una lista de unidades de muestreo. Como ilustracin de lo que podra ser un marco, consideremos de nuevo el ejemplo de Villa Natura. Si especificamos al visitante del parque, potencial o no, mayor de 18 aos, habitante de la comunidad, como unidad de muestreo = unidad experimental ltima, una lista de estos elementos puede servir como el marco de esta encuesta. Tomando en cuenta que el marco tiene que tomarse de una lista ms amplia, no est claro muchas veces cules son los elementos de la poblacin. Adems actualizar la lista diariamente es imposible. En otras situaciones, un directorio de la ciudad o una lista de padres de familia obtenida de los datos del censo puede servir como un marco. Algunos esquemas de muestreo pueden requerir de marcos mltiples. Por ejemplo, la estimacin de rendimientos de un cultivo en un estado, puede involucrar una lista de productores para ser entrevistados y una lista de parcelas para ser medidas. Una muestra es una coleccin de unidades seleccionadas de un marco o varios marcos. En el ejemplo de la encuesta sobre una nueva seccin del parque, cierto nmero de habitantes con las caractersticas sealadas (la muestra) va a ser entrevistado para determinar su posibilidad de uso de la nueva seccin. Podemos usar la informacin obtenida de estos habitantes acerca de la opinin de los habitantes mayores de 18 aos en toda la comunidad.

Por qu tomar muestras? Hay tres razones principales por las que en una poblacin se deben tomar muestras en lugar de realizar censos: 1. Puede ser imprctico un censo completo debido al costo y el esfuerzo involucrados (p.e. un botnico puede no tener suficiente tiempo para muestrear cada planta en un rea). 2. El muestreo es ms rpido que un conteo completo (p.e. una administracin gubernamental puede decidir tomar una muestra del 10% de la poblacin porque los resultados de un censo completo pueden estar parcialmente obsoletos en el momento en que sean procesados). 3. Las muestras pueden ser ms exactas que los censos completos. La tercera razn puede ser sorprendente. Esto sucede porque a menudo los errores ms grandes en la encuesta no son los errores de muestreo (debidos a los efectos casuales al seleccionar las unidades experimentales). Ms bien, son los errores de no-muestreo que se deben a cosas como un muestreo sesgado, datos
25

TCNICAS DE MUESTREO PARA MANEJADORES DE RECURSOS NATURALES

mal registrados, preguntas no entendidas correctamente, registros perdidos, etc. Una muestra relativamente pequea pero bien organizada puede dar mejores resultados que una encuesta completa o una muestra grande que no puede ser administrada debido a la falta de recursos.

Cmo seleccionar la muestra? El diseo de la encuesta por muestreo.

$ es el estimador de , debemos Si es el parmetro de inters en una poblacin y especificar un lmite o cota para el error de estimacin, B.
error de estimacin con la condicin de que: P(error de estimacin Una seleccin usual de B es: .

Despus de obtener un lmite especfico con su probabilidad asociada 1 , podemos comparar diseos diferentes para determinar cul procedimiento proporciona la precisin deseada al mnimo costo. Los diseos bsicos se irn tratando en las siguientes secciones.

Muestreo irrestricto aleatorio. Procedimiento y estimaciones de medias, totales y proporciones Diseo bsico: Muestreo irrestricto aleatorio (m.i.a). Si un tamao de muestra n es seleccionado de una poblacin de tamao N de tal manera que cada muestra posible de tamao n tiene la misma probabilidad de ser seleccionada, el procedimiento de muestreo se denomina muestreo irrestricto aleatorio. A la muestra obtenida se llama muestra irrestricta aleatoria. Lo que es importante aqu es el proceso de seleccin ms que el resultado. Por tanto, una muestra puede ser aleatoria aun cuando parezca que no es aleatoria porque sucede que por pura casualidad sus elementos provienen de una parte pequea de la poblacin. Por ejemplo, si se toma una muestra aleatoria de muje-

26

INTRODUCCIN AL DISEO Y ANLISIS DE MUESTREO DE POBLACIONES FINITAS

res de una comunidad campesina entonces se podra notar que pareciera contener demasiadas mujeres jvenes. Esto no invalida la muestra puesto que la mayora de las muestras pequeas tienen alguna apariencia de no ser representativas. Cmo seleccionar una muestra irrestricta aleatoria? Con la ayuda de tablas de nmeros aleatorios (o calculadoras con nmeros aleatorios). La seleccin de nmeros corresponder al nmero de elementos de la muestra, de entre un total de N elementos de la poblacin. Con base en esta seleccin, se procede al muestreo mismo. Cmo se analizan los datos generados por un muestreo irrestricto aleatorio? El anlisis de los datos generados depender del parmetro-objetivo. En las Cajas 1 y 2, se describen los estimadores para la media y el total poblacionales, respectivamente. En estos casos, se supone que la variable medida en cada unidad muestral es continua. As, yi representa la variable medida en la i-sima unidad de muestreo seleccionada por el m.i.a., i = 1, 2,, n.
Caja 1

(media muestral de y)

VARIANZA ESTIMADA DE:

Donde

(varianza muestral de y)

LMITE PARA EL ERROR DE ESTIMACIN:

Estimador de la media poblacional m, muestreo irrestricto aleatorio

NOTAS La cantidad (N-n)/N se llama correccin por poblacin finita (cpf). Cuando n sea relativamente pequea con respecto al tamao de la poblacin, la cpf estar muy cercana a 1. En la prctica, la cpf puede despreciarse si (N-n)/N 0.95, o equivalentemente, si . En tal caso, la varianza estimada de es la cantidad s2/n, conocida como el error estndar de la media muestral. Las frmulas dadas arriba se justifican por el Teorema del Lmite Central.
27

TCNICAS DE MUESTREO PARA MANEJADORES DE RECURSOS NATURALES

En muchos casos el tamao de la poblacin no est claramente definido o se desconoce. Por ejemplo, generalmente es imposible conocer el nmero de contribuyentes de un estado, en donde se quisiera seleccionar una muestra de tal poblacin acerca de sus ingresos. Aqu N se supone grande y la cpf se omite.

Ejercicio (Scheaffer et al. 1987, pg. 68). 1. Los encargados de administrar los recursos de los terrenos dedicados a la caza silvestre estn interesados en el tamao de las poblaciones de venado y de conejo en los meses de invierno en un bosque particular. Como una estimacin del tamao de la poblacin, los administradores proponen usar el nmero promedio de grupos densos de conejos y de venados por parcelas de 10 metros por lado. Una muestra irrestricta aleatoria de n = 500 parcelas fue seleccionada, y se observ un nmero de grupos densos de conejos y de venados. Los resultados de este estudio se resumen en el cuadro 3. Estime m1 y m2, el nmero promedio de grupos densos de venados y de conejos, respectivamente, por parcelas de 10 metros por lado. Establezca los lmites para los errores de estimacin.
Cuadro 3

Venados Media muestral = 2.30 Media muestral = 4.52

Conejos Varianza muestral = 0.65 Varianza muestral = 0.97

Grupos densos de venados y conejos


Caja 1

VARIANZA ESTIMADA DE:

LMITE PARA EL ERROR DE ESTIMACIN:

Estimador del total poblacional en el m.i.a.

28

INTRODUCCIN AL DISEO Y ANLISIS DE MUESTREO DE POBLACIONES FINITAS

Ejercicio (Modificado de Scheaffer et al. 1987, pg. 70). 2. Un investigador est interesado en estimar el nmero total de rboles marcados (rboles ms grandes que cierto tamao especfico) en una plantacin de N=1500 mecates (parcelas de 400 m2 c/u). Esta informacin se utiliza para estimar el volumen total de madera aserrada para los rboles de la plantacin. Una muestra irrestricta aleatoria de n=100 parcelas de 1 mecate fue seleccionada, y cada parcela fue examinada en relacin con el nmero de rboles marcados. El promedio muestral para las n=100 parcelas de 1 mecate fue, con una varianza muestral de s2=136. Estime el nmero total de rboles marcados en la plantacin. Establezca un lmite para el error de estimacin.
Caja 3

Si la i sima unidad de muestreo posee la caracterstica deseada de otro modo

VARIANZA ESTIMADA DE

LMITE PARA EL ERROR DE ESTIMACIN:

Estimador de una proporcin poblacional

en el m.i.a.

es simplemente el nmero de xitos dividido entre el tamao de muestra, o sea, es el nmero promedio de xitos en la muestra. Ejercicio (Scheaffer et al. 1987, pg. 69). 3. El Departamento de Caza y Pesca de cierto estado est interesado en la direccin de sus programas futuros de caza. Para mantener un potencial mayor de caza futura, el departamento desea determinar la proporcin de cazadores que buscan cualquier tipo de ave de caza. Se obtuvo una muestra irrestricta aleatoria de n = 1000 de los N = 99,000 cazadores con permiso. Suponga que
29

TCNICAS DE MUESTREO PARA MANEJADORES DE RECURSOS NATURALES

430 indicaron que cazaron aves. Estime , la proporcin de cazadores con permiso que buscan aves de caza. Establezca un lmite para el error de estimacin.

Muestreo aleatorio estratificado. Procedimiento y estimaciones de medias, totales y proporciones Diseo bsico: Muestreo aleatorio estratificado (m.a.e). Aunque el diseo de muestreo irrestricto aleatorio suele suministrar buenas estimaciones de cantidades poblacionales a un costo bajo, es posible incrementar la cantidad de informacin para un costo dado con el muestreo aleatorio estratificado.

Muestra aleatoria estratificada Una muestra aleatoria estratificada es la obtenida mediante la separacin de la poblacin en grupos que no presenten traslapes llamados estratos y la seleccin posterior de una muestra irrestricta aleatoria en cada estrato. En general, no hay nada que perder al usar este tipo de muestreo ms complicado, pero hay algunas ganacias potenciales. Primero, si los individuos dentro de cada estrato son mucho ms similares que los individuos en general, entonces la estimacin de la media poblacional global tendr un error estndar menor que el que puede obtenerse con un muestreo irrestricto aleatorio del mismo tamao muestral. Segundo, puede ser de valor tener estimaciones separadas de los parmetros poblacionales para los diferentes estratos. Tercero, la estratificacin hace posible muestrear diferentes partes de una poblacin en diferentes formas, lo cual puede constituir un posible ahorro en los costos. Generalmente, los tipos de estratificacin que deberan ser considerados son aquellos basados en ubicaciones espaciales, regiones dentro de las cuales se espera que la poblacin sea uniforme. Por ejemplo, al muestrear una poblacin de plantas sobre un rea grande es natural tomar un mapa y partir el rea en unos cuantos estratos aparentemente homogneos basados en factores tales como altitud y tipo de vegetacin. Al muestrear insectos en rboles puede tener sentido estratificar con base en dimetros pequeos, medios y grandes de los rboles. Al muestrear casas-habitacin, un poblado puede dividirse en regiones en donde las caractersticas de edad y clase social son relativamente uniformes. Usualmente la
30

INTRODUCCIN AL DISEO Y ANLISIS DE MUESTREO DE POBLACIONES FINITAS

eleccin de qu estratificar es slo una cuestin de sentido comn para la encuesta en cuestin.

Cmo seleccionar una muestra aleatoria estratificada? 1. Especificar claramente los estratos: cada unidad muestral debe ubicarse en uno y slo un estrato apropiado 2. Seleccionar una muestra irrestricta aleatoria de cada estrato, mediante la tcnica correspondiente 3. Asegurarse que las muestras seleccionadas en los estratos sean independientes Notacin para el muestreo aleatorio estratificado. L = nmero de estratos. Ni = nmero de unidades muestrales en el estrato i. N = nmero de unidades muestrales en la poblacin = N1+ N2 ++ NL . ni = tamao de la muestra en el estrato i. N = tamao de la muestra combinada = n1+ n2++ nL . Puede verse en la Caja 4 que la estimacin de la media poblacional en el m.a.e. es un promedio pesado o ponderado de las medias de las muestras irrestrictas aleatorias en cada estrato, donde los pesos son los tamaos proporcionales de los estratos: Ni /N. De manera similar, la varianza de la media muestral en el m.a.e. es una ponderacin de las varianzas de las muestras irrestrictas aleatorias de cada estrato. Estas ponderaciones aparecen tambin en las frmulas correspondientes a la estimacin de un total en el m.a.e.

31

TCNICAS DE MUESTREO PARA MANEJADORES DE RECURSOS NATURALES

Caja 4

VARIANZA ESTIMADA DE:

LMITE PARA EL ERROR DE ESTIMACIN:

Estimador de la media poblacional m para el m.a.e.

Ejemplo (Manly, 1992, pgs. 30-31). En un bosque se disponen 4 bloques, y cada bloque se subdivide en parcelas de 20 20, haciendo un total de 400 parcelas por bloque. Para estimar el nmero de rboles en el bosque, se toma una muestra aleatoria de los bloques (estratos) eligiendo un nmero de rengln aleatorio entre 1 y 20 y un nmero de columna aleatorio entre 1 y 20, usando un generador de nmeros aleatorios en una computadora. Esto produce los conteos muestrales para el nmero de rboles por parcela que se muestra en el cuadro 4. Con estos datos, la media de la poblacin estimada se encuentra usando la ecuacin del cuadro correspondiente a la estimacin de : = 5.075, con un error estndar de o.238. Ejercicio (Scheaffer et al. 1987, pg. 114) 1. Una escuela desea estimar la calificacin promedio que pueden obtener estudiantes de sexto grado en un examen de comprensin de lectura. Los estu32

INTRODUCCIN AL DISEO Y ANLISIS DE MUESTREO DE POBLACIONES FINITAS

diantes de la escuela son agrupados en tres estratos, los que aprenden de manera rpida en el estrato I, los que aprenden regular en el estrato II y los que aprenden lento en el estrato III. La escuela decide esta estratificacin porque de esta manera se reduce la variabilidad en las calificaciones del examen. El sexto grado contiene 55 estudiantes en el estrato I, 80 en el estrato II y 65 en el estrato III. Una muestra aleatoria estratificada de 50 estudiantes es asignada proporcionalmente y produce muestras irrestrictas aleatorias de n1= 14, n2=20 y n3 =16 de los estratos I, II y III respectivamente. El examen se aplica a la muestra de estudiantes y se obtienen los resultados que se muestran en el cuadro 5. Estimar: a) La calificacin promedio para este grado y b) Un lmite para el error de estimacin.
Cuadro 4

Estrato Unidad Muestral 1 2 3 4 5 6 7 8 9 10 Media Desviacin estndar 1 8 6 8 6 7 7 7 6 8 8 7.1 0.88 2 3 5 5 6 2 4 6 4 5 3 4.3 1.34 3 8 3 5 8 2 4 7 6 5 7 5.5 2.07 4 0 4 3 4 5 4 6 3 3 4 3.4 1.65

Nmero de rboles por bloque o estrato


Cuadro 5

Estrato I 80 68 72 85 90 62 61 92 85 87 91 81 79 83 85 48 53 65 49 72 53 68 71 59

Estrato II 82 75 73 78 69 81 59 52 61 42 42 36 65 43 53 61 42

Estrato III 32 31 29 19 14 31 30

Calificaciones por estratos

33

TCNICAS DE MUESTREO PARA MANEJADORES DE RECURSOS NATURALES

Caja 5

VARIANZA ESTIMADA DE:

LMITE PARA EL ERROR DE ESTIMACIN:

Estimador de la media poblacional m para el m.a.e.

Ejemplo. Respecto al ejemplo referido arriba acerca del muestreo estratificado de rboles en un bosque, y tomando como base los resultados del mismo, obtenemos el nmero total de rboles estimados en la poblacin como: 1600 . 5.075=8210 El error estndar estimado es: = 1600 . 0.238 = 380.8. De aqu, el intervalo de confianza aproximado del 95% para el total poblacional es 8120 380.8, o de 7359 a 8882. Ejercicio (Scheaffer et al. 1987, pg. 115) 2. Un guardabosques quiere estimar el nmero total de acres plantados de rboles en los ranchos de un estado. Ya que el nmero de acres de rboles vara considerablemente con respecto al tamao del rancho, decide estratificar con base en el tamao de los ranchos. Los 240 ranchos en el estado son puestos en una de 4 categoras de acuerdo con el tamao. Una muestra aleatoria estratificada de 40 ranchos, seleccionada mediante asignacin proporcional,
34

INTRODUCCIN AL DISEO Y ANLISIS DE MUESTREO DE POBLACIONES FINITAS

produce los resultados del nmero de acres plantados de rboles que se muestran en el cuadro 6. Estime el nmero total de acres plantados de rboles en los ranchos del estado, y fije un lmite para el error de estimacin. El ejercicio 6, que se presenta a continuacin, se resuelve mediante la estimacin de una proporcin poblacional para un m.a.e. El resumen de las frmulas correspondientes se da en la Caja 6. Nuevamente, el estimador del parmetro en cuestin es un promedio pesado de las estimaciones de las proporciones poblacionales en cada estrato, con pesos iguales a NI /N.
Cuadro 6

Estrato I N1 = 86 n1 = 14 97 42 25 105 27 45 67 125 92 86 43 59 53

Estrato II N2 = 72 n2 = 12 125 67 256 310 220 142 21 155 96 47 236 352 190

Estrato III N 3 = 52 n3 = 9 142 310 495 320 196 256 440 510 396

Estrato IV N4 = 30 n4 = 5 167 220 780 655 540

Nmero de rboles por tamao de rancho

Ejercicio (Scheaffer et al. 1987, pg. 115) 3. Una administracin municipal est interesada en ampliar las instalaciones de un centro de atencin diurna para nios con retraso mental. La ampliacin va a incrementar los costos de asistencia a los nios del centro. Se realiza una encuesta por muestreo para estimar la proporcin de familias con nios afectados que utilizarn las instalaciones ampliadas. Las familias viven en la ciudad donde se encuentra localizado el centro, y otras viven en las reas rurales o suburbanas de los alrededores. Entonces se usa muestreo aleatorio estratificado con personas en la ciudad que usan las instalaciones, personas de los alrededores que las usan, personas en la ciudad que no las usan y personas en los alrededores que no las usan, formando los estratos I, 2, 3 y 4, respectivamente. Registros existentes nos dan N1 = 97, N2 = 43, N3 = 145 y N4 = 68. Se obtiene la siguiente proporcin que usarn las nuevas instalaciones: p1 = 0.87, p2 = 0.93, p3 = 0.60, p4 = 0.53. Estime la proporcin poblacional, p, y establezca un lmite para el error de estimacin.
35

TCNICAS DE MUESTREO PARA MANEJADORES DE RECURSOS NATURALES

Caja 6

VARIANZA ESTIMADA DE:

LMITE PARA EL ERROR DE ESTIMACIN:

Aqu p1 es la estimacin de la proporcin de xito en el l-simo estrato; q1 = 1 p1


Estimador de la media poblacional para el m.a.e.

Contrastes entre el muestreo irrestricto aleatorio y el muestreo estratificado aleatorio. Regla ptima para formar estratos La varianza estimada de un parmetro puede ser menor en el muestreo irrestricto aleatorio que en el muestreo estratificado aleatorio. Esto puede deberse a que hay mucha variacin dentro de algn estrato (ver ejemplo 5.16, del Scheaffer et al. (1987), pgs. 103-105). Si nuestro objetivo en la estratificacin es producir estimadores con varianza pequea, entonces el mejor criterio para definir los estratos es el conjunto de valores que la respuesta puede tomar. Por ejemplo, supngase que deseamos estimar el ingreso promedio por hogar en una comunidad. Podramos estimar este promedio con bastante exactitud si pudiramos poner todos los hogares de bajos ingresos en un estrato y todos los hogares de altos ingresos en otro estrato antes de muestrear. Pero frecuentemente esto es imposible porque el conocimiento detallado de los ingresos antes del muestreo hace desaparecer en principio el problema estadstico. Sin embargo, en ocasiones tenemos algunas frecuencias de datos en categoras generales de la variable
36

INTRODUCCIN AL DISEO Y ANLISIS DE MUESTREO DE POBLACIONES FINITAS

de inters o de alguna variable altamente correlacionada. Para delimitar los estratos, existe el mtodo acumulativo de la raz cuadrada de la frecuencia. Esta regla para encontrar el nmero adecuado de estratos, L, se aplica como sigue: 1. Tabular los datos disponibles en una distribucin de frecuencias basada en la variable de estratificacin 2. Calcular la raz cuadrada de la frecuencia observada y acumula estas races cuadradas hacia abajo de la tabla 3. Obtener las lmites superiores de los estratos para L estratos de los puntos igualmente espaciados

Ejercicio (Krebs, 1989, pg. 223-225) 4. Se tom del Cuadro 6.4 de Krebs (1989). Son las abundancias de almejas de la costa de New Jersey en 1981, de acuerdo a los datos originales publicados por Iachan (1985), dispuestos en orden de la profundidad de la muestra. El objetivo es estimar la abundancia de almejas para esta regin. En este caso la estratificacin se lleva a cabo con base en una variable auxiliar profundidad. Haz la delimitacin de las muestras en L = 5 estratos y, despus, estima la abundancia media global con base en la estratificacin generada (Cuadro 7). Ejercicio (Krebs, 1989, pg. 235) 5. Tabular el nmero observado de almejas (X) en el cuadro 7 en una distribucin de frecuencias acumulativa. Estimar los lmites ptimos de los estratos para esta variable, basado en tres estratos, usando el procedimiento acumulativo de la raz cuadrada de la frecuencia. Qu tanto difieren los resultados de esta estratificacin de los obtenidos estratificando con la variable profundidad.

37

TCNICAS DE MUESTREO PARA MANEJADORES DE RECURSOS NATURALES

Cuadro 7

Clase 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28

Profundidad, Y (m) 14 15 18 19 20 21 22 23 24 25 26 27 28 29 30 32 33 34 35 36 37 38 40 41 42 45 49 52

No. de f muestras 4 1 2 3 4 1 2 5 4 2 2 1 2 3 1 1 4 2 3 2 3 2 3 4 1 2 1 1

Nmero de almejas observadas, X 34, 128, 13, 0 27 361, 4 0, 5, 363 176, 32, 122, 41 21 0, 0 9, 112, 255, 3, 65 122, 102, 0, 7 18, 1 14, 9 3 8, 30 35, 25, 46 15 11 9, 0, 4, 19 11, 7 2, 10, 97 0, 10 2, 1, 10 4, 13 0, 1, 2 0, 2, 2, 15 13 0, 0 0 0

Frecuencia de almejas observadas a diferentes profundidades

Muestreo sistemtico. Procedimiento y estimaciones de medias, totales y proporciones Diseo bsico: Muestreo sistemtico (m.s.) El muestreo irrestricto aleatorio y el muestreo aleatorio estratificado requieren un trabajo muy detallado en el proceso de seleccin de la muestra. Las unidades de muestreo en un marco adecuado deben ser numeradas de modo que un mecanismo de aleatorizacin, tal como una tabla de nmeros aleatorios, pueda utilizarse para seleccionar unidades especficas de la muestra.
38

INTRODUCCIN AL DISEO Y ANLISIS DE MUESTREO DE POBLACIONES FINITAS

Un diseo de muestreo usado a menudo debido principalmente a que simplifica el proceso de seleccin de la muestra se denomina muestreo sistemtico. Ejemplo. (Krebs, 1989, pgs. 227-229.) Los eclogos usan a menudo muestreo sistemtico en el campo. As, las trampas para ratones pueden ser puestas sobre una lnea o en una retcula en intervalos a 50 metros. O el llamado mtodo de la distancia del punto-cuarto pudiera aplicarse a lo largo de una lnea siguiendo una brjula con 100 metros entre puntos. De hecho, el tipo de muestreo sistemtico ms comn en ecologa es el rea de muestreo sistemtico cntrico ilustrado en la Figura 1. El rea de estudio se subdivide en cuadrados iguales y una unidad muestral se toma del centro de cada cuadro. Las muestras a lo largo del lmite exterior estn a la mitad de la distancia de la frontera como lo estn de la muestra ms cercana. Ntese que una vez que ha sido especificado el nmero de muestras, solamente hay una muestra cntrica para cualquier rea todas las otras muestras sern excntricas-.
Figura 1

Desde el punto de vista de la teora del muestreo por encuesta de poblaciones finitas, el muestreo sistemtico, se define como sigue: Una muestra obtenida al seleccionar aleatoriamente un elemento de los primeros k elementos en el marco y despus seleccionar cada k-simo elemento, se denomina muestra sistemtica de 1 en k. El muestreo sistemtico proporciona una opcin til para el muestreo irrestricto aleatorio por las siguientes razones: 1. El muestreo sistemtico es fcil de llevar a cabo en el campo, y por tanto, a diferencia de las muestras irrestrictas aleatorias y las muestras aleatorias estratificadas, est menos expuesto a errores de seleccin que cometen los investigadores en el campo.
39

TCNICAS DE MUESTREO PARA MANEJADORES DE RECURSOS NATURALES

2. El muestreo sistemtico puede proporcionar mayor informacin que la que puede proporcionar el muestreo irrestricto aleatorio por unidad de costo. Esto puede ser consecuencia del deseo de muestrear de manera pareja a lo largo del rea de estudio completa (por ejemplo en ecologa, todo un hbitat). Cmo seleccionar una muestra sistemtica? 1. Se selecciona algn punto de arranque, entre 1 y k, para localizar en el marco. Se requiere conocer el tamao de la poblacin N para poder seleccionar exactamente k. En este caso, para una muestra sistemtica de n elementos de una poblacin de tamao N, k debe ser un nmero aleatorio menor o igual que N/n (k N/n). 2. Se selecciona una unidad al azar entre 1 y k, y despus se selecciona cada ksimo elemento desde el punto de arranque. Ejemplo (Scheaffer et al., 1987, pg. 171). Un investigador en medicina est interesado en obtener informacin acerca del nmero promedio de veces en que 15000 especialistas recetaron un cierto medicamento en el ao anterior (N = 15000). Si se quisiera seleccionar una muestra sistemtica con n = 100 elementos de la poblacin, elegimos el valor de . Supngase que el valor de k elegido es k = 9. Entonces podra-mos seleccionar un nombre (especialista) al azar de entre los primeros k = 9 nombres que aparecen en la lista y luego seleccionar cada noveno nombre hasta que el tamao de muestra 100 es seleccionado. Esta muestra sistemtica es de 1 en 9.
NOTA. En las estimaciones de m y p, si N es desconocida, eliminamos la correcin por poblacin finita (c.p.f.) a saber, (N-n)/N, en las ecuaciones correspondientes.

40

INTRODUCCIN AL DISEO Y ANLISIS DE MUESTREO DE POBLACIONES FINITAS

Caja 7

VARIANZA ESTIMADA DE

donde

LMITE PARA EL ERROR DE ESTIMACIN:

Estimador de la media poblacional m en el muestreo sistemtico


Caja 8

(Requisito: Conocer N, el tamao de la poblacin)

VARIANZA ESTIMADA DE

LMITE PARA EL ERROR DE ESTIMACIN:

Estimador de un total poblacional t en el m.s.

Es correcto usar las frmulas para el m.i.a en las estimaciones de parmetros basados en una m.s.? Reconocers que la varianza estimada de , y es idntica a la varianza estimada de usando m.i.a. Este resultado no implica que las varianzas poblacionales sean iguales.

La varianza de

es:

. Mientras que en el muestreo

41

TCNICAS DE MUESTREO PARA MANEJADORES DE RECURSOS NATURALES

sistemtico es:

, donde es una medida de correlacin

entre pares de elementos dentro de la misma muestra sistemtica.


Caja 9

Si la i sima unidad de muestreo posee la caracterstica deseada de otro modo


VARIANZA ESTIMADA DE

LMITE PARA EL ERROR DE ESTIMACIN:

Estimador de una proporcin poblacional p en el m.s.

Si 1, entonces los elementos dentro de la muestra son bastante similares con respecto a la caracterstica que se est midiendo y el muestreo sistemtico producir una varianza de la media muestral mayor que la obtenida por el m.i.a. Si es negativo, entonces el muestreo sistemtico puede ser mejor que el m.i.a. La correlacin puede ser negativa si los elementos dentro de la muestra sistemtica tienden a ser extremadamente diferentes. no puede alcanzar un valor negativo muy grande como para que la expresin de la varianza llegue a ser negativa. Para cercano a cero y N bastante grande, el muestreo sistemtico y el m.i.a. son aproximadamente iguales. En general, cuando el muestreo sistemtico es equivalente al m.i.a. podemos tomar (por ejemplo, como aproximadamente igual a la varianza $ estimada de en el m.i.a. La posibilidad de que ocurra esto tiene que considerar el tipo de poblacin objetivo:
42

INTRODUCCIN AL DISEO Y ANLISIS DE MUESTREO DE POBLACIONES FINITAS

1. Poblacin aleatoria. Una poblacin es aleatoria si sus elementos estn ordenados al azar 2. Poblacin ordenada. Una poblacin est ordenada si sus elementos dentro de la poblacin estn ordenados de acuerdo a algn esquema 3. Poblacin peridica. Una poblacin es peridica si los elementos de la poblacin tienen variacin cclica Relaciones entre el m.s. y el m.i.a. 1. Los elementos de una muestra sistemtica de una poblacin aleatoria se espera que sean heterogneos con 0. Por tanto, cuando N es grande y, en este caso, el muestreo sistemtico es equivalente al muestreo irrestricto aleatorio. Ejemplo (Scheaffer et al. 1987, pgs. 175-176) Un investigador desea determinar la calidad del jarabe de arce contenido en la savia de los rboles de una finca. El nmero total de rboles es desconocido; por lo tanto, es imposible realizar un m.i.a. de rboles. Como un procedimiento alternativo, el investigador decide usar una muestra sistemtica de 1 en 7. Si quisiera estimar m, el contenido de azcar promedio de los rboles de arce en la finca, es razonable que l suponga que la poblacin de rboles es aleatoria. Segn esta suposicin, la estimada estara dada po la frmula correspondiente para el m.i.a.,

2. Una muestra sistemtica extrada de una poblacin ordenada es generalmente heterognea con 0. Puede demostrarse que para una poblacin ordena . da, Por tanto, una muestra aleatoria de una poblacin ordenada proporciona ms informacin que una m.i.a. por unidad de costo. Ya que no podemos obtener una estimacin de con base en los datos de la muestra, una estimacin conservadora (una que es mayor que lo que se esperara) de est dada por:

43

TCNICAS DE MUESTREO PARA MANEJADORES DE RECURSOS NATURALES

Ejemplo. Si el marco del cual se extrae una muestra sistemtica est listado de acuerdo al valor numrico ascendente de la variable de inters, entonces la poblacin est ordenada. 3. Los elementos de una muestra sistemtica extrada de una poblacin peridica pueden ser homogneos ( > 0). Cuando N es grande y > 0, > .

Por tanto, en este caso, el muestreo sistemtico proporciona menos informacin que el m.i.a. por unidad de costo. Como en las situaciones anteriores, no puede ser estimada directamente mediante una sola muestra sistemtica. Podemos aproximar su valor usando . En general, este estimador subestimar la varianza verdadera de . Para evitar este problema que ocurre con el muestreo sistemtico de una poblacin peridica, el investigador podra cambiar varias veces el punto de inicio aleatorio. Este procedimiento reducir la posibilidad de seleccionar observaciones con la misma posicin relativa en una poblay sist cin peridica. Estos cambios del punto de inicio tendrn el efecto de mezclar los elementos de la poblacin y al mismo tiempo el de seleccionar una muestra sistemtica. As, la muestra obtenida es equivalente a una muestra sistemtica de una poblacin aleatoria y, por tanto, la varianza de puede ser entonces aproximada usando

Ejemplo (Krebs, 1989, pg. 228). La figura 2 ilustra un ejemplo hipottico en la cual una variable ambiental (por ejemplo, contenido de humedad del suelo) vara en una forma peridica, como una sinusoidal sobre el rea de estudio. El efecto de usar muestreo sistemtico para estimar la media de esta variable puede ser de muy diversa ndole. Si no se muestreara en A, siempre se obtendra la misma medicin y se obtendra una estimacin altamente sesgada de la media. Si se tiene suerte y se muestreara en B, se obtendra la misma media y varianza como si se hubiera usado muestreo aleatorio. Qu tan probable es que estos problemas como la variacin peridica vista en los puntos de muestreo A ocurran en datos de campo reales? Milne (1959)
44

INTRODUCCIN AL DISEO Y ANLISIS DE MUESTREO DE POBLACIONES FINITAS

intent responder esta pregunta observando muestras sistemticas tomadas sobre poblaciones biolgicas que haban sido enumeradas completamente (de manera que eran conocidas la media y la varianza verdaderas). l analiz datos de 50 poblaciones y encontr que, en la prctica, no haba un error introducido al suponer que una muestra sistemtica cntrica era una muestra aleatoria simple, usando todas las frmulas de la teora de muestreo irrestricto aleatorio. La variacin peridica como la de la figura 2 no parece ocurrir en sistemas ecolgicos. Ms aun, la mayora de los patrones ecolgicos son altamente aglutinados e irregulares, de modo que la preocupacin de los estadsticos acerca de influencias peridicas, parece ser una preocupacin de ms. La recomendacin prctica es as: se puede usar muestreo sistemtico pero cuidar posibles tendencias peridicas. Krebs termina la seccin correspondiente al muestreo sistemtico en ecologa diciendo que, si tienes para elegir entre tomar una muestra aleatoria o una muestra sistemtica, escoge siempre un muestreo aleatorio, debido a que siempre puede haber preocupacin por la presencia de efectos peridicos que pueden influir en las estimaciones. Pero si el costo e inconveniencia de la aleatorizacin son demasiado grandes, puedes perder muy poco al muestrear de manera sistemtica.
Figura 2

A B
Valor observado de X

A B

A B

Distancia a lo largo del transecto

Variacin peridica de una variable X en funcin de la distancia a lo largo de un transecto.

45

TCNICAS DE MUESTREO PARA MANEJADORES DE RECURSOS NATURALES

Observaciones Las consideraciones acerca de los tipos de poblacin (aleatoria, ordenada y peridica) y la relacin de los estimadores de la varianza de la media muestral para el muestreo sistemtico y el m.i.a., tambin son vlidas para cuando los y una proporcin, . estimadores de inters son un total, Si la estratificacin de la poblacin es ventajosa, el muestreo sistemtico puede usarse dentro de cada estrato en lugar del m.i.a. Como en ciertos casos el muestreo aleatorio sistemtico no es equivalente al m.i.a., un mtodo alternativo para estimar la varianza de una parmetro estimado, , digamos, , es el muestreo sistemtico repetido. Como el nombre lo indica, este mtodo de muestreo requiere de la seleccin de ms de una muestra sistemtica. Los detalles de este mtodo pueden encontrarse en Scheaffer et al. (1987), pgs. 182-186. Ejercicio. (Scheaffer et al. 1987, pgs. 188-189). 6. Edaflogos quieren estimar la cantidad de calcio intercambiable (en ppm) en una parcela de terreno. Para simplificar el esquema de muestreo, en el terreno se sobrepone un malla rectangular. En cada punto de interseccin en la malla se toman muestras de suelo (Figura 3). Determina la cantidad promedio de calcio intercambiable en la parcela de terreno. Establecer un lmite para el error de estimacin. Los datos son: n = 45. intercambiable,
Figura 3

= 90,320 calcio

= 148,03000

Muestreo sistemtico sobre una rejilla

46

INTRODUCCIN AL DISEO Y ANLISIS DE MUESTREO DE POBLACIONES FINITAS

Ejercicio (Scheaffer et al. 1987, pgs. 190-191) 7. Los funcionarios de un museo estn interesados en el nmero total de personas que visitan el lugar durante el periodo de 180 das en que una coleccin de antigedades est en exhibicin. Puesto que llevar el control diario de visitantes es muy costoso, los funcionarios deciden obtener estos datos cada dcimo da. La informacin de esta muestra sistemtica de 1- en -10 se resume en la tabla adjunta. Use estos datos para estimar , el nmero total de personas que visitan el museo durante el perodo especfico. Establezca un lmite para el error de estimacin.
Cuadro 6

Da 3 13 23 M 173

Nmero de personas que visitaron el mueseo 160 350 225 M 290

4,868

1,321,450 Nmero de visitantes a un museo

Ejercicio (Scheaffer et al. 1987, pg. 191) 8. Los funcionarios de cierta sociedad profesional desean determinar la proporcin de miembros que apoyan varias enmiendas propuestas en las prcticas de arbitraje. Los funcionarios conducen una muestra sistemtica de 1- en 10, a partir de una lista en orden alfabtico de los N = 650 miembros registrados. Sea yi = 1, si la i-sima persona favorece los cambios propuestos y yi = 0 si se opone a los cambios. Usar los siguientes datos de la muestra para estimar , la proporcin de miembros en favor de cambios propuestos. Establecer un lmite para el error de estimacin. 48

47

TCNICAS DE MUESTREO PARA MANEJADORES DE RECURSOS NATURALES

Muestreo por conglomerados. Procedimiento y estimaciones de medias, totales y proporciones Diseo bsico: Muestreo por conglomerados (m.c.) Una muestra por conglomerados es una muestra aleatoria en la cual la unidad de muestreo es una coleccin o conglomerado de unidades experimentales ltimas. Se recomienda su uso cuando no se encuentra disponible o es muy costoso obtener un buen marco para la poblacin, mientras que se puede lograr fcilmente un marco que liste conglomerados. Tambin es idneo cuando el costo por obtener datos se incrementa con la distancia que separa las unidades experimentales ltimas. Generalmente, del muestreo aleatorio por conglomerados no puede esperarse que d la misma precisin que una muestra aleatoria simple con el mismo nmero total de elementos, puesto que los elementos cercanos tienden a ser ms similares que los elementos en general. Por tanto, una muestra conglomerada es equivalente a una muestra de unidades experimentales con un tamao de muestra, en cierta forma, ms pequeo. Sin embargo, los ahorros en los costos pueden hacer que una muestra por conglomerados sea considerablemente ms grande que lo que pueda ser una muestra irrestricta aleatoria. De aqu que una muestra por conglomerados puede dar una mejor precisin que una muestra aleatoria simple por el mismo costo de muestreo. Ejemplos. 1. Las manzanas de la ciudad son usadas frecuentemente como conglomerados de hogares o personas. 2. Un naranjo forma un conglomerado de naranjas para la investigacin de infestacin por insectos. 3. Una parcela en el bosque contiene un conglomerado de rboles para la estimacin de volmenes de madera o proporcin de rboles enfermos. Cmo seleccionar una muestra por conglomerados? 1. Especificar los conglomerados apropiados Las unidades experimentales ltimas tienden a presentar caractersticas similares dentro de un conglomerado, as que la medicin de una unidad experimental ltima en un conglomerado puede estar altamente correlacionado con la de otra unidad experimental ltima. Por tanto, si se selecciona un conglomerado de gran tamao, la cantidad de informacin al tomar todas las
48

INTRODUCCIN AL DISEO Y ANLISIS DE MUESTREO DE POBLACIONES FINITAS

medidas de cada unidad experimental ltima puede no incrementarse sustancialmente. El problema de elegir el tamao de conglomerado puede aun ser ms complicado cuando se dispone de un nmero infinito de posibles tamaos de conglomerados, como en la seleccin de parcelas forestales para la estimacin de la proporcin de rboles enfermos. Si existe variabilidad en la densidad de rboles enfermos a lo largo y ancho del bosque, entonces muchos conglomerados pequeos localizados de manera aleatoria o sistemtica, pueden ser lo deseable. Sin embargo, localizar aleatoriamente una parcela consume mucho tiempo y, una vez localizada, el muestreo de muchos rboles es econmicamente inconveniente. Entonces muchas parcelas pequeas son ventajosas para controlar la variabilidad, pero pocas parcelas grandes son econmicamente recomendables. Se debe de encontrar un equilibrio entre el nmero y el tamao de las parcelas. Aunque no hay reglas generales para tomar esta decisin, las encuestas piloto pueden ayudar al investigador a encontrar la direccin. 2. Conformar un marco que liste todos los conglomerados. 3. Seleccionar una muestra irrestricta aleatoria de este marco. 4. Los elementos o unidades experimentales ltimas muestreadas sern todos los elementos de los conglomerados seleccionados.
NOTACIN EN EL MUESTREO POR CONGLOMERADOS

(m.c.).

N = nmero de conglomerados (poblacin); n = nmero de conglomerados (m.i.a.). mi = nmero de elementos en el conglomerado i, i = 1,, N.

tamao promedio del conglomerado en la muestra.

nmero de unidades experimentales ltimas en la poblacin. tamao promedio de los conglomerados en la poblacin. total de todas las observaciones en el i-simo conglomerado.

49

TCNICAS DE MUESTREO PARA MANEJADORES DE RECURSOS NATURALES

Caja 10

VARIANZA ESTIMADA DE

LMITE PARA EL ERROR DE ESTIMACIN:

Aqu

puede ser estimada por

si se desconoce M.

Estimacin de la media poblacional m para el m.c.

Ejercicio (Scheaffer et al. 1987, pgs. 226-227). 9. Un guardabosques desea estimar la altura promedio de los rboles de una plantacin. La plantacin se divide en parcelas de un cuarto de acre. Se selecciona una muestra irrestricta aleatoria de 20 parcelas de un total de 386 parcelas en la plantacin. Se miden todos los rboles en las parcelas muestreadas, con los resultados que se muestran en el cuadro 9. Estime la altura promedio de los rboles en la plantacin y establecer un lmite para el error de estimacin. (Sugerencia: el total para el conglomerado I se puede encontrar tomando mI veces el promedio del conglomerado). El ejercicio 13 se puede resolver mediante la estimacin de un total poblacional (Caja 11). Ntese que el estimador es til nicamente si se conoce el nmero de elementos M en la poblacin.

50

INTRODUCCIN AL DISEO Y ANLISIS DE MUESTREO DE POBLACIONES FINITAS

Cuadro 9

No. de rboles 42 51 49 55 47 58 43 59 48 41

Altura promedio (pies) 6.2 5.8 6.7 4.9 5.2 6.9 4.3 5.2 5.7 6.1

No. de rboles 60 52 61 49 57 63 45 46 62 58

Altura promedio (pies) 6.3 6.7 5.9 6.1 6.0 4.9 5.3 6.7 6.1 7.0

Nmero de rboles y altura promedio de una plantacin

Ejercicio (Scheaffer et al. 1987, pg. 228) 10. Un gran embarque de mariscos congelados es empaquetado en cajas, conteniendo cada una veinticuatro paquetes de 5 libras. Hay cien cajas en el embarque. Un inspector del gobierno determina el peso total (en libras) de mariscos daados para cada una de cinco cajas muestreadas. Los datos son como sigue: 9, 6, 3, 10, 2. Estimar el peso total de mariscos daados en el embarque y establecer un lmite para el error de estimacin.
Caja 11

VARIANZA ESTIMADA DE

LMITE PARA EL ERROR DE ESTIMACIN:

Estimacin de un total poblacional en el m.c. ( = Mm).

51

TCNICAS DE MUESTREO PARA MANEJADORES DE RECURSOS NATURALES

Cuando M se desconoce, se tendr que usar otro estimador de :


Caja 12

es el promedio de los totales de conglomerados para los n conglomerados muestrados


VARIANZA ESTIMADA DE

LMITE PARA EL ERROR DE ESTIMACIN:

Estimador de en el m.c. cuando M se desconoce

es un buen estimador de si n fuera grande (n 20). El sesgo desparece si m1 = m2 == mN . En el caso de , el estimador puede ser menos preciso que pues no usa la informacin de los tamaos de conglomerados m1, m2, , mn . Pero si m1 = m2 == mN, los dos estimadores son equivalentes. Ejercicio (Scheaffer et al. 1987, pg. 226). 11. Los comercios solicitan frecuentemente a los contadores la realizacin de inventarios. Ya que un inventario completo es costoso, a travs del muestreo se pueden realizar inventarios cada cuatro meses. Supngase que una empresa abastecedora de artculos de plomera desea un inventario para muchos artculos pequeos en existencia. La obtencin de una muestra aleatoria de artculos es muy difcil. Sin embargo, los artculos se encuentran dispuestos en anaqueles, y las seleccin de una muestra aleatoria de anaqueles es relativamente facil, considerando a cada anaquel como un conglomerado de artculos. Una muestra de 10 anaqueles de un total de 48 dio los resultados que se muestran en la tabla siguiente. Estimar la cantidad de dlares de los artculos en los anaqueles y establecer un lmite para el error de estimacin.

52

INTRODUCCIN AL DISEO Y ANLISIS DE MUESTREO DE POBLACIONES FINITAS

Cuadro 10

Conglomerado 1 2 3 4 5 6 7 8 9 10

Nmero de artculos, m I 42 27 38 63 72 12 24 14 32 41

Cantidad real de dlares, y i 83 62 45 112 96 58 75 58 67 80

Nmero de artculos y su cantidad en dlares


Caja 13

Sea ai = nmero total de elementos en el conglomerado i que poseen la caracterstica de inters. Entonces:

VARIANZA ESTIMADA DE

LMITE PARA EL ERROR DE ESTIMACIN:

Estimacin de una proporcin poblacional p para el mc.

La frmula de es un buen estimador de p nicamente cuando n es grande (n 20). Si m1 = m2 == mN, entonces p es un estimador insesgado de p, expresada en el cuadro de arriba es un estimador insesgado de la y la varianza real de p, para cualquier tamao de muestra. 12. Una empresa est considerando la revisin de su poltica de jubilacin y quiere estimar la proporcin de empleados que apoyan la nueva poltica. La industria consiste de 87 plantas separadas localizadas en todo el pas. Ya que los resultados deben ser obtenidos rpidamente y con poco dinero, la industria deci53

TCNICAS DE MUESTREO PARA MANEJADORES DE RECURSOS NATURALES

de usar muestreo por conglomerados, con cada planta como un conglomerado. Se selecciona una muestra irrestricta aleatoria de 15 plantas y se obtienen las opiniones de los empleados en estas plantas a travs de un cuestionario. Los resultados se presentan en el cuadro 11. Estimar la proporcin de empleados de la industria que apoyan la nueva poltica de jubilacin y establecer un lmite para el error de estimacin. Ejercicio (Scheaffer et al. 1987)
Cuadro 11 Planta Nmero de empleados Nmero de empleados que apoyan la nueva poltica Planta Nmero de empleados Nmero de empleados que apoyan la nueva poltica

1 2 3 4 5 6 7 8

51 62 49 73 101 48 65 49

42 53 40 45 63 31 38 30

9 10 11 12 13 14 15

73 61 58 52 65 49 55

54 45 51 29 46 37 42

Muestra de empleados de diferentes plantas de una empresa a favor de una nueva poltica.

Comentarios finales acerca del muestreo de conglomerados 1. El muestreo de conglomerados puede ser combinado con el muestreo estratificado, con objeto de que la poblacin quede dividida en L estratos y se pueda seleccionar una muestra por conglomerados en cada estrato. Ver Scheaffer et al. (1987) pginas 215-216. 2. El muestreo sistemtico puede interpretarse como un muestreo por conglomerados en donde el tamao de cada conglomerado es mi = 1, para cada i = 1, 2, , n.

Consideraciones generales acerca de otros diseos de muestreo de poblaciones finitas. Muestreos de encuentro y muestreo secuencial Dentro de la teora de poblaciones finitas, hemos omitido presentar algunos mtodos de estimacin de parmetros basados en diferentes diseos de muestreo. Esto no implica que no sean importantes, pero por el espacio dedicado en esta
54

INTRODUCCIN AL DISEO Y ANLISIS DE MUESTREO DE POBLACIONES FINITAS

primera unidad al tpico del diseo estadstico de muestreo por encuesta, se decidi limitarse a las tcnicas bsicas.

Estimaciones de razn, regresin y diferencia combinadas con los diseos de muestreo bsicos De los mtodos no vistos, tres de ellos hacen uso de una variable auxiliar, x, para realizar la estimacin de parmetros respecto a una variable de respuesta y, sobre la misma unidad muestral. Estos mtodos son: estimacin de razn, de regresin y de diferencia. Lo importante de estas tcnicas es que diversos diseos de muestreo pueden ser empleados en unin con la estimacin. En Scheaffer et al. (1987) y en Cochran (1976), entre otros, se explica con detalle la conjugacin de estos mtodos de estimacin con el muestreo irrestricto aleatorio y con el muestreo aleatorio estratificado.

Muestreo por conglomerados en dos etapas y polietpico Estos mtodos son modificaciones del muestreo por conglomerados o reas. En el muestreo en dos etapas o bietpico no todos los elementos o unidades de los conglomerados forman parte de la muestra, sino que, una vez seleccionados stos, se efecta una nueva seleccin o submuestreo dentro de cada uno. La generalizacin del muestreo por conglomerados bietpico es el polietpico, en donde los conglomerados seleccionados en la primera etapa pueden estar constituidos por nuevos conglomerados incluidos en ellos, de modo que pueda procederse a un submuestreo de unidades de conglomerados dentro de conglomerados y as sucesivamente, en varias etapas (Azorn Poch, 1972).

Submuestras interpenetrantes Este mtodo consiste en la divisin aleatoria de una muestra, generalmente tambin aleatoria, en un cierto nmero de grupos del mismo nmero de unidades. Se emplea para medir la concordancia entre los resultados de muestras sucesivas, en la obtencin rpida de resultados provisionales y en la comparacin de resultados obtenidos por diferentes entrevistadores (Azorn Poch, 1972).

55

TCNICAS DE MUESTREO PARA MANEJADORES DE RECURSOS NATURALES

Muestreos de encuentro Las secciones anteriores se refirieron a lo que puede describirse como la teora clsica de muestreo de poblaciones finitas. Estos problemas cubren mucho de los problemas de muestreo que son probables que surjan en una investigacin, pero hay situaciones en donde se requieren enfoques diferentes. En particular, algunas veces surgen casos en donde no es posible decidir de manera previa dnde y cundo se muestrearn los elementos de la poblacin. En lugar de un esquema de muestreo, debe vislumbrarse qu permite a los elementos ser encontrados con una cierta probabilidad. El anlisis de los datos debe tomar en cuenta la naturaleza de este esquema de muestreo. Como se ver frecuentemente en este curso, varios de los mtodos de muestreo de organismos pueden considerarse mtodos de muestreo de encuentro. Sin embargo, desde una perspectiva biolgica o ecolgica, es difcil evaluar la probabilidad de encuentro de un determinado organismo o elemento de inters. A continuacin damos una lista de diseos de muestreo que son tiles en en el estudio de procesos biolgicos o ecolgicos, mismos que seran tratados en las secciones correspondientes al muestreo de organismos en este curso. Aquel lector que lo desee puede acudir a los libros de Krebs (1988), Manly (1992) y Thompson (1992), en donde se abordan estos mtodos de forma breve y sin demasiado formalismo. Muestreo de marcaje-recaptura Muestreo de remocin Muestreo en transectos (en cualquiera de sus versiones particulares: muestreo de intercepto de lnea, de transecto en banda y de transecto en lnea) Muestreo con sesgo en el tamao Muestreo de posiciones de objetos en el espacio (patrones espaciales) en sus versiones particulares: mtodos basados en distancias, mtodos basados en cuadrantes Muestreo adaptativo. Muestreo de conjunto ordenado.

Muestreo secuencial En el libro de Krebs (1989), en el captulo 7, y en el libro de Azorn Poch (1972), en los captulos 23 y 24, se trata con detalle otro mtodo de muestreo conocido como muestreo secuencial, cuya cualidad ms importante es que los tamaos de las muestras no se establecen a priori. En lugar de ello, se hacen observaciones o

56

INTRODUCCIN AL DISEO Y ANLISIS DE MUESTREO DE POBLACIONES FINITAS

mediciones, una en cada tiempo, y despus de que se haga cada observacin se pregunta a los datos acumulados si puede alcanzarse o no una conclusin. As, el tamao de muestra es minimizado, y en algunos casos solamente la mitad del nmero de observaciones requeridas con el muestreo clsico es necesario con el muestreo secuencial.

Muestreo de poblaciones finitas II (seleccin del tamao de muestra) Enfoque general en el diseo de encuestas por muestreo El nmero de observaciones necesarias para estimar un parmetro requerir que se establezca un lmite para el error de estimacin igual a B e igual tambin a . Como habitualmente contiene en su expresin al tamao de la muestra, sta se puede hallar resolviendo para n:

Por tanto, en las sub-secciones siguientes se encontrarn las frmulas de los tamaos de muestra requeridos para estimar el parmetro indicado con un lmite para el error de estimacin de B; las frmulas variarn segn el parmetro-objetivo y segn el diseo de muestreo. Seleccin del tamao de muestra para estimar medias, totales y proporciones poblacionales en el m.i.a. Ejercicio (Scheaffer et al. 1987, pg. 69) 13. Un psiclogo desea estimar el tiempo de reaccin promedio para un estmulo entre 200 pacientes de un hospital especializado en trastornos nerviosos. De qu tamao debe ser la muestra irrestricta aleatoria que debe tomar para estimar m con un lmite para el error de estimacin de 1 segundo? Use 1.0 segundos como una aproximacin de la desviacin estndar poblacional. Ejercicio (Scheaffer et al. 1987, pg. 70) 14. Usando los resultados de la encuesta descrita en el Ejercicio 2, determine el tamao de muestra requerido para estimar t, el nmero total de rboles en plantacin, con un lmite para el error de estimacin de magnitud B = 1500.

57

TCNICAS DE MUESTREO PARA MANEJADORES DE RECURSOS NATURALES

Caja 14

, donde

Nota: s2 puede aproximarse con s2, a partir de una muestra piloto, o un estudio previo similar, o bien un valor aproximado. . Entonces, en cualquiera de estos casos n ser

: :

, donde

, donde

Nota: puede aproximarse con p (y, as, (1-) se estima con q = 1-p ; ver seccin 1.1.2) a partir de una muestra piloto, o un estudio previo similar, o bien, en el peor de los casos p=0.5 (n ser conservador en este caso). Entonces, en cualquiera de estas situaciones n ser un valor aproximado. En todas estas frmulas, se requiere conocer N, el tamao de la poblacin.
Seleccin del tamao de muestra para estimar medidas totales y proporciones poblacionales en el m.i.a.

Ejercicio (Scheaffer et al. 1987, pg. 69) 15. Usando los datos del Ejercicio 3, determine el tamao de muestra que el Departamento debe obtener para estimar la proporcin de cazadores con permiso que buscan aves de caza. Establezca un lmite para el error de estimacin de magnitud B = 0.02.

Seleccin del tamao de muestra para estimar medias, totales y proporciones poblacionales en el m.a.e. Asignacin de la muestra Para el caso de la seleccin de n en el m.a.e. para estimar m o t o p, se presenta un problema al querer despejar ni (el tamao de la muestra para cada estrato) en la expresin

58

INTRODUCCIN AL DISEO Y ANLISIS DE MUESTREO DE POBLACIONES FINITAS

para el caso en que para el caso de .

,o

Una solucin es asignar una proporcin del tamao de muestra, wI , en cada estrato i. Esta fraccin entonces nos lleva a que ni = nwi , i= 1, 2,, L . Luego, ya es posible despejar n de las dos expresiones anteriores y, al mismo tiempo, conocer ni , los tamaos de muestra para cada estrato. Ntese que es necesario asignar previamente las fracciones wi para cada estrato.Ejercicio (Scheaffer et al. 1987, pgs. 87 y 88)
Caja 15

donde wI es la fraccin de las observaciones asignadas al estrato i, es la varianza poblacional para el estrato i, cuyo valor se puede aproximar como se indica en la Caja 14, y para estimar ; para estimar .

Tamao de muestra aproximado que se requiere para estimar m o t con un lmite para el error de estimacin en el m.a.e.

16. Una empresa publicitaria est interesada en determinar qu tanto debe enfatizar la publicidad televisiva en un determinado municipio, y decide realizar una encuesta por muestreo para estimar el nmero promedio de horas por semana que se ve televisin en los hogares del municipio. ste comprende dos pueblos, pueblo A y pueblo B, y un rea rural. El pueblo A circunda una fbrica, y la mayora de los hogares son de trabajadores fabriles con nios en edad escolar. El pueblo B es un suburbio exclusivo de una ciudad vecina y consta de habitantes ms viejos con pocos nios en casa. Existen 155 hogares en el pueblo A, 62 en el pueblo B y 93 en el rea rural. Una encuesta anterior sugiere que las varianzas del nmero de horas por semana que las familias del municipio dedican a ver televisin por estrato son, aproximadamente, . Deseamos estimar la

59

TCNICAS DE MUESTREO PARA MANEJADORES DE RECURSOS NATURALES

media poblacional mediante . Seleccione el tamao de muestra para obtener un lmite en el error de estimacin igual a 2 hrs, si las fracciones . En otras palabras, se debe tomar un asignadas son nmero igual de observaciones de cada estrato. Ejercicio (Scheaffer et al. 1987, pg. 88) 17. Con relacin al Ejercicio 19., supngase que las varianzas son aproximadas por . Deseamos ahora estimar el total poblacional con un lmite de 400 horas para el error de estimacin. Seleccione el tamao de muestra apropiado, si se va a tomar el mismo nmero de observaciones en cada estrato.
Caja 16

donde wI es la fraccin de las observaciones asignadas al estrato i, i es la proporcin poblacional para el estrato i , cuyo valor se puede aproximar como se indic en la seccin 2.2.1. y . Nota: Como es casi seguro que la proporcin poblacional

de cada estrato i, i, sea desconocida, en las frmula anterior se cambiaran los trminos pi y (1-pi) por sus correspondientes estimaciones i y qi=1-i, respectivamente. Este origina que la estimacin del tamao de muestra sea aproximada.
Tamao de muestra aproximado que requiere para estimar p con un lmite para el error de estimacin en el m.a.e.

Asignacin de la muestra Despus de elegir el tamao de muestra n, existen muchas maneras para dividir entre los tamaos de muestra de los estratos individuales n1, n2,, nL. Cada divisin puede originar una varianza diferente para la media muestral. Por lo que el objetivo ser usar una asignacin de modo que se tengan estimadores con varianzas pequeas al menor costo posible. En trminos del objetivo, el mejor esquema de asignacin est influido por tres factores.
60

INTRODUCCIN AL DISEO Y ANLISIS DE MUESTREO DE POBLACIONES FINITAS

1. El nmero total de elementos en cada estrato 2. La variabilidad de las observaciones dentro de cada estrato 3. El costo por obtener una observacin de cada estrato Veamos cmo se hace la asignacin segn estos criterios
Caja 17

Aqu ci = costo por obtener una observacin individual en el I-simo estrato. Para poder usar la frmula, se debe obtener previamente a la realizacin del muestreo, una aproximacin de la varianza de cada estrato. Las aproximaciones pueden ser obtenidas de estudios anteriores o conociendo la amplitud de variacin de las mediciones de cada estrato. Para la asignacin ptima con la varianza de fija en D, nos da el tamao de la

muestra n, sustituyendo: wi = ni / n: n =

Asignacin aproximada que minimiza el costo para el valor fijo de V( ) o que minimiza V( ) para un costo fijo (Asignacin ptima para estimar m y t).

Para aplicar las frmulas anteriores se deben conocer, entonces, los costos ci, i = 1, 2,, L, y las desviaciones estndar aproximadas i , i = 1, 2,, L. Primero se evala la expresin para n, despus se estiman los ni s que tendrn a n como incgnita, y por ltimo se sustituye n en estas expresiones para nI . Ejercicio (Scheaffer et al. 1987, pg. 114) 18. Una corporacin desea obtener informacin acerca de la efectividad de una mquina comercial. Se va a entrevistar por telfono a un nmero de jefes de divisin, para pedirles que califiquen la maquinaria con base en una escala
61

TCNICAS DE MUESTREO PARA MANEJADORES DE RECURSOS NATURALES

numrica. Las divisiones estn localizadas en Norteamrica, Europa y Asia. Es por eso que se usa muestreo estratificado. Los costos son mayores para las entrevistas de los jefes de divisin localizados fuera de Norteamrica. El cuadro 12 proporciona los costos por entrevista, varianzas aproximadas de las calificaciones, y los Ni que se han establecido. La corporacin quiere estimar la calificacin promedio con V( ) = 0.1. Elegir el tamao de muestra n que obtiene este lmite y encuentrar la asignacin apropiada.
Cuadro 12

Estrato I (Norteamrica) c 1 =$9 = 2.25 N 1 =112

Estrato II (Europa) c 2 =$25 = 3.24 N 2 =68

Estrato III (Asia) c 3 =$36 = 3.24 N 3 =39

Varianzas de las calificaciones de maquinaria para tres divisiones (estratos) de una corporacin y costos de entrevista por estrato.
Caja 18

Si el costo por obtener informacin es el mismo para todos los estratos o si los costos son desconocidos, entonces c1 = c2 = = cL. Esto trae como consecuencia que los trminos de costo se cancelan en las dos ecuaciones de arriba y:

Este mtodo de seleccionar n1, n2,, nL se denomina asignacin de Neyman. En la asignacin de Neyman, el tamao de muestra total es:

Asignacin de Neyman para estimar y

62

INTRODUCCIN AL DISEO Y ANLISIS DE MUESTREO DE POBLACIONES FINITAS

Ejercicio ( Scheaffer et al. 1987, pg. 115) 19. El estudio del ejercicio 5 se va a hacer anualmente, con el lmite para el error de estimacin de 5000 acres. Encuentre un tamao de muestra aproximado para obtener este lmite si se usa la asignacin de Neyman. Use los datos del Ejercicio 5. El ejercicio 23 ilustra la aplicacin de la asignacin del tamao de muestra a estratos, suponiendo que tanto los costos por estrato como las varianzas por estrato son iguales. Esto da lugar a la asignacin proporcional del tamao de muestra, cuyas frmulas se presentan en la Caja 19. Ejercicio ( Scheaffer et al. 1987, pg. 115) 20. Utilizando los datos del Ejercicio 4, encuentre el tamao de muestra requerido para estimar la calificacin promedio, con un lmite de 4 puntos para el error de estimacin. Use asignacin proporcional.
Caja 19

Si adems de suponer c1 = c2 = = cL tambin ecuaciones para las ni s presentadas en la Caja 18, quedan as:

, entonces las

Este mtodo de asignacin de la muestra a los estratos se llama asignacin proporcional porque los tamaos de muestra n1, n2,, nL son proporcionales a los tamaos de los estratos N1, N2,, NL . En la asignacin proporcional, el valor de n que produce , se convierte en:

Esta ltima frmula, aparte de ser vlida cuando se quiere estimar con usara cuando interesa estimar , pero con el valor de
Asignacin proporcional par estimar y

, se

63

TCNICAS DE MUESTREO PARA MANEJADORES DE RECURSOS NATURALES

La frmula correspondiente para n cuando interesa estimar en la asignacin proporcional, se presentar en una de la siguiente serie de frmulas para asignar el tamao de muestra en cada estrato, para estimar .
NOTA. Como es casi seguro que la proporcin poblacional de cada estrato i, i, sea desconocida, en las frmulas siguientes se han cambiado los trminos i y (1-i) por sus correspondientes estimaciones pi y qi=1-pi, respectivamente. Este origina que la estimacin del tamao de muestra sea aproximado.
Caja 20

donde n =

Asignacin aproximada que minimiza el costo para un valor fijo de o minimiza para un costo fijo. (Asignacin ptima para estimar )

Ejercicio ( Scheaffer et al. 1987, pgs. 115-116) 21. Con relacin al Ejercicio 6 acerca de la encuesta por muestreo que realiza un ayuntamiento municipal para estimar la proporcin de familias con nios discapacitados que utlizarn ciertas instalaciones ampliadas, supngase que se van a formar cuatro estratos como se indic en ese Ejercicio, y que aproximadamente el 90% de los que usan las instalaciones y 50% de los que no las usan van a utilizar las nuevas instalaciones. Los costos por efectuar la observacin de un cliente actual es de $4.00 y de $8.00 para uno que no lo es. La diferencia en el costo resulta de la dificultad para localizar a quienes no usan las instalaciones. Registros existentes nos dan N1=97, N2=43, N3=145, N4=68 (como en el Ejercicio 6). Encuentre el tamao de muestra aproximado y la asignacin necesaria para estimar la proporcin poblacional con un lmite de 0.05 para el error de estimacin.
64

INTRODUCCIN AL DISEO Y ANLISIS DE MUESTREO DE POBLACIONES FINITAS

Caja 21

Cuando el costo por obtener informacin es el mismo para todos los estratos o los costos son desconocidos, entonces c1 = c2 = = cL. En este caso, la asignacin de Neyman es:

donde

Asignacin de Neyman para estimar

22. Repita el Ejercicio 24, ahora usando la asignacin de Neyman (i.e. costos iguales). Compare los resultados con la respuesta del Ejercicio 24.
Caja 22

Como se recordar, en la asignacin proporcional, el tamao de la muestra en cada estrato i est dado por:

En el caso del tamao de la muestra n para estimar p, se tiene:

Asignacin proporcional para estimar p

Ejercicio 26. Ahora repita el ejercicio 24 usando asignacin proporcional. Compare los resultados con los de los Ejercicios 24 y 25.
65

TCNICAS DE MUESTREO PARA MANEJADORES DE RECURSOS NATURALES

Seleccin del tamao de muestra para estimar medias, totales y proporciones poblacionales en el m.s. El tamao de muestra requerido se encuentra despejando n de la ecuacin:

para cualquiera de los estimadores de una media, un total o una proporcin, basados en un muestreo sistemtico. La solucin para esta ecuacin involucra, en ,oa . En estas notas, en lugar de usar general al parmetro y, o bien a estimaciones especficas de estos parmetros, usamos la frmula para n de un muestreo irrestricto aleatorio. La seal de alerta se dara en el caso de poblaciones ordenadas (la muestra podra ser extragrande) o de poblaciones peridicas (la muestra podra ser muy pequea). Por tanto, la validez de las frmulas para n, como si se supusiera un muestreo irrestricto aleatorio, solamente se presentar si se muestrean sistemticamente poblaciones aleatorias. En este caso, remitimos al lector a las frmulas que aparecen en la seccin 2.1.2., Cajas 1, 2 y 3. Ejercicio ( Scheaffer et al. 1987, pg. 189) 27. La patrulla de caminos est interesada en la proporcin de automovilistas que portan licencias. En una carretera principal se detivo a cada sptimo conductor. En una verificacin similar con 400 automovilistas, se encontr que el 81% portaban licencia. La patrulla de caminos espera que pasen cuando menos N = 3000 automviles por el puesto de verificacin. Determinar el tamao de muestra para estimar p con aproximacin de B = 0.015 unidades. Seleccin del tamao de muestra para estimar medias, totales y proporciones poblacionales en el m.c. La cantidad de informacin en una muestra por conglomerados es afectada por dos factores, el nmero y el tamao relativo de los conglomerados. No se ha presentado el ltimo factor en ninguno de los procedimientos de muestreo ya analizados. El tamao del lmite para el error de estimacin depende crucialmente de la variacin entre los totales de los conglomerados. Entonces, al intentar obtener lmites pequeos para el error de estimacin, debemos seleccionar conglomerados con la menor variacin posible entre estos totales. Suponer que el tamao del conglomerado (unidad de muestreo) ha sido elegido y se va a considerar nicamente el problema de seleccionar el nmero de conglomerados, n.

66

INTRODUCCIN AL DISEO Y ANLISIS DE MUESTREO DE POBLACIONES FINITAS

Caja 23

donde

se estima con

. Esta estimacin estara disponi-

ble con una encuesta previa, o bien seleccionado una muestra preliminar de n elementos. Algo similar podra hacerse para estimar, el tamao medio del conglomerado. As, las estimaciones de y pueden calcularse de la muestra preliminar y utilizarse para obtener un tamao de muestra total aproximado, n, dado por la frmula de arriba. Aqu.

Tamao de muestra aproximado para estimar m con un lmite B para el error de estimacin

Se obtienen resultados similares cuando se usa


Caja 24

para estimar .

donde

se estima con

se estimara con una en-

cuesta previa, o bien seleccionado una muestra preliminar de n elementos. Entonces, la estimacin puede utilizarse para obtener un tamao de muestra total aproximado, n, dado por la frmula de arriba. Aqu se supone .

Tamao de muestra aproximado para estimar , usando , con un lmite B para el error de estimacin, M conocida

Cuando M es desconocido, se usa el estimador En este caso, se puede despejar n de la ecuacin

para (ver seccin 3.1.6). , en donde

. Aqu es la varianza poblacional de los totales de conglomerados, yI, la cual se estima con:
67

TCNICAS DE MUESTREO PARA MANEJADORES DE RECURSOS NATURALES

Caja 25

donde

se estima con

,y

Tamao de muestra aproximado para estimar , usando con un lmite B para el error de estimacin

De manera anloga a como se deduce la frmula para n requerida para estimar m, se obtendra la frmula correspondiente cuando se desea estimar p.
Caja 26

donde

,y

se estima por

(seccin 1.1.5).

Tamao de muestra aproximado para estimar con un lmite B para el error de estimacin

Ejercicio (Scheaffer et al. 1987, pg. 189) 28. La industria del Ejercicio 15 modific su poltica de jubilacin despus de obtener los resultados de la encuesta. Ahora se quiere estimar la proporcin de empleados a favor de la poltica modificada. Cuntas plantas deben ser muestreadas para tener un lmite de 0.08 para el error de estimacin? Use los datos del Ejercicio 15 para aproximar los resultados de la nueva encuesta.

68

INTRODUCCIN AL DISEO Y ANLISIS DE MUESTREO DE POBLACIONES FINITAS

Referencias Azorn Poch, F. (1972) Curso de Muestreo y Aplicaciones. Aguilar, Madrid. Cochran, W.G. (1976) Tcnicas de Muestreo. CECSA, Mxico. Iachan, R. (1985) Optimum strata boundaries for shellfish surveys. Biometrics 41: 10531062. Krebs, C. (1989) Ecological Methodology. Harper Collins Publishers, New York. Manly, B.F.J. (1992) The Design and Analysis of Research Studies. Cambridge University Press, Cambridge. Milne, A. (1959) The centric systematic area-sample treated as a random sample. Biometrics 15: 270-297. Scheaffer, R. L., W. Mendenhall y L. Ott (1987) Elementary Survey Sampling. Duxbury, Belmont. Thompson, S. (1992) Sampling. Wiley, Nueva York.

69

blanca

II. EL AMBIENTE

Se incluyen los lineamientos del muestreo de recursos no renovables (suelo y agua) con los que los manejadores de recursos han de contender, y de otras herramientas ambientales, como el clima o monolitos de suelo, con que cuentan como elemento de juicio. La importancia del suelo a nivel mundial ha sido recientemente revalorada, ya que la edafsfera es una capa ms del planeta tierra. Esta capa puede considerarse como una geomembrana que permite el intercambio de materia y energa entre la litosfera y la atmsfera, sirviendo de proteccin a la litsfera ante los efectos climticos. Adems, se le califica como un recurso natural no renovable debido a sus bajas tasas de formacin. En los ecosistemas terrestres, es soporte y fuente de nutrimentos para los microorganismos, invertebrados y plantas. Su importancia a nivel agronmico es ampliamente reconocida. En la esfera ambiental, los recursos hdricos estn llamados a ser el gran problema de la humanidad para el presente siglo. Es por esto que el tema cuerpos de agua superficiales es de suma importancia, tanto por el consumo de grandes cantidades de este recurso por las comunidades humanas a nivel domstico y por la industria, como por la descarga de aguas residuales, contaminadas en diversos grados, a los cuerpos de agua. La toma de datos climticos no es menos importante. Este aspecto tiene al menos dos vertientes de relevancia para los manejadores de recursos naturales: el clima como factor que puede limitar u orientar la distribucin y abundancia de los seres vivos, y el clima como elemento cambiante (calentamiento global) que puede modificar estos patrones y que debe ser considerado en la toma de decisiones en materia ambiental.

Você também pode gostar