Você está na página 1de 10

IV. D ISTRIBUCIONES MUESTRALES .

IV.1. ELEMENTOS BÁSICOS DEL MUESTREO. CONCEPTOS BÁSICOS. TIPOS DE MUESTREO.

Cuando nos interesa estudiar las características de poblaciones grandes (que no sean muy
variables), se utilizan muestras representativas por muchas razones, principalmente porque
requieren menor tiempo y dinero que el estudiar a la población completa.

Cuando decimos que una muestra es representativa es porque reúne aproximadamente las
características de la población que son importantes para la investigación.

Cuando se utilizan valores muestrales, para estimar valores poblacionales, o parámetros,


pueden ocurrir dos tipos generales de errores: el error muestral y el error no muestral.

1. Error muestral se refiere a la variación natural existente entre muestras tomadas de


la misma población.
2. Errores no muestrales son errores que surgen al tomar las muestras por el mal
diseño del formulario, errores cometidos en el procesamiento de recolección, y/o
análisis de los datos por eso es que no pueden clasificarse como errores muestrales.

Los tipos más comunes de técnicas de muestreo aleatorios son:


a) El muestreo aleatorio simple,
b) El muestreo estratificado
c) El muestreo por conglomerados
d) El muestreo sistemático.

a) El muestreo aleatorio simple


Si una muestra aleatoria se elige de tal forma que todos los elementos de la población
tengan la misma probabilidad de ser seleccionados, la llamamos muestra aleatoria simple.

Un sorteo es el único método seguro de hacer equiprobables a todos los integrantes de la


población en el proceso de selección.

Hay casos especiales donde no es tan simple numerar a los integrantes de la población para
poder efectuar el sorteo, como sacar una muestra de granos de arroz de una bolsa de 50 Kg,
, en tales casos, la solución es la homogenización de la población previo a la extracción de la
muestra. Por ejemplo, si se colocan los granos de arroz en una mezcladora y se agitan el
tiempo suficiente, luego se toma la muestra en cualquier sector cuando esté bien
homogeneizada. Lo mismo al tomar muestras de agua de río. La misma idea se aplica en el
caso de extracción de sangre a pacientes para efectuar análisis clínicos. El torrente
sanguíneo la homogeniza tan bien que al puncionar en la vena se tiene una muestra
representativa del paciente. Hay casos más difíciles o imposibles de homogeneizar como
tomar una muestra representativa de tierra de un campo, o de arena en una playa. Aquí hay
que subdividir la superficie en sectores, y efectuar un sorteo para seleccionar los lugares de
extracción.

Suponga que nos interesa elegir una muestra aleatoria de 5 estudiantes en un grupo de
estadística de 20 alumnos. 20C5 da el número total de formas de elegir una muestra no
ordenada y este resultado es 15,504 maneras diferentes de tomar la muestra. Si listamos las
15,504 en trozos separados de papel. Un procedimiento más simple para elegir una muestra
aleatoria sería escribir cada uno de los 20 nombres en pedazos separados de papel,
colocarlos en un recipiente, revolverlos y después extraer cinco papeles al mismo tiempo.
Hay muchas situaciones en las cuales el muestreo aleatorio simple es poco práctico,
imposible o no deseado; aunque sería deseable usar muestras aleatorias simples para las
encuestas nacionales de opinión sobre productos o sobre elecciones presidenciales, sería
muy costoso o tardado.

b) Muestreo estratificado requiere de separar a la población según grupos que no se


traslapen llamados estratos, y de elegir después una muestra aleatoria simple en
cada estrato. La información de las muestras aleatorias simples de cada estrato
constituiría entonces una muestra global.

Ejemplo: Suponga que nos interesa obtener una muestra de las opiniones de los profesores
de una gran universidad. Puede ser difícil obtener una muestra con todos los profesores, así
que supongamos que elegimos una muestra aleatoria de cada departamento académico; los
estratos vendrían a ser los departamentos académicos.

c) Muestreo por conglomerados requiere de elegir una muestra aleatoria simple de


unidades heterogéneas entre sí de la población llamadas conglomerados. Cada
elemento de la población pertenece exactamente a un conglomerado, y los
elementos dentro de cada conglomerado son usualmente heterogéneos o disímiles.

Ejemplo: Suponga que una compañía de servicio de televisión por cable está pensando en
abrir una sucursal en una ciudad grande; la compañía planea realizar un estudio para
determinar el porcentaje de familias que utilizarían sus servicios, como no es práctico
preguntar en cada casa, la empresa decide seleccionar una parte de la ciudad al azar, la cual
forma un conglomerado.

En el muestreo por conglomerados, éstos se forman para representar, tan fielmente como
sea posible, a toda la población; entonces se usa una muestra aleatoria simple de
conglomerados para estudiarla. Los estudios de instituciones sociales como iglesias,
hospitales, escuelas y prisiones se realizan, generalmente, con base en el muestreo por
conglomerados.
d) Muestreo sistemático es una técnica de muestreo que requiere de una selección
aleatoria inicial de observaciones seguida de otra selección de observaciones
obtenida usando algún sistema o regla.

Ejemplo: Para obtener una muestra de suscriptores telefónicos en una ciudad grande,
puede obtenerse primero una muestra aleatoria de los números de las páginas del
directorio telefónico; al elegir el vigésimo nombre de cada página obtendríamos un
muestreo sistemático, también podemos escoger un nombre de la primera página del
directorio y después seleccionar cada nombre del lugar número cien a partir del ya
seleccionado. Por ejemplo, podríamos seleccionar un número al azar entre los primeros
100; supongamos que el elegido es el 40, entonces seleccionamos los nombres del
directorio que corresponden a los números 40, 140, 240, 340 y así sucesivamente.

IV.2. CONCEPTO DE DISTRIBUCIÓN MUESTRAL.


Se le llama así a la distribución de todos los valores posibles que puede asumir una
estadística, calculados a partir de muestras del mismo tamaño, seleccionadas
aleatoriamente de la misma población.
¿Cómo calcular la muestra correcta?
El cálculo del tamaño de la muestra es uno de los aspectos a concretar en las fases previas de la investigación y determina el grado de credibilidad que
concederemos a los resultados obtenidos.
Objetivo estadístico
Estimar parámetros Comparar dos grupos
Variables de estudio

𝑍 1−𝛼2 ∗ 𝑝 ∗ 𝑞
Infinita 𝑛=
𝑑2 [𝑍1−𝛼 ∗ √2𝑃 (1 − 𝑃) + 𝑍1−𝛼 ∗ √𝑃1 (1 − 𝑃1 ) + 𝑃2 (1 − 𝑃2 )]2
CATEGÓRICA 𝑛=
𝑁 ∗ 𝑍 1−𝛼2 ∗ 𝑝 ∗ 𝑞 (𝑃1 − 𝑃2 )2
Finita 𝑛= 2
𝑑 ∗ (𝑁 − 1) + 𝑍 1−𝛼2 ∗ 𝑝 ∗ 𝑞

𝑍 1−𝛼2 ∗ 𝑆 2
Infinita 𝑛=
𝑑2 2
(𝑍1−𝛼 + 𝑍1−𝑝 ) ∗ (𝑆12 + 𝑆22 )2
NUMÉRICA 𝑛=
𝑁 ∗ 𝑍 1−𝛼2 ∗ 𝑆 2 (𝑋1 − 𝑋2 )2
Finita 𝑛=
𝑑 2 ∗ (𝑁 − 1) + 𝑍 1−𝛼2 ∗ 𝑆 2
Finita = Tamaño conocido 𝑍1−𝛼 =Nivel de confianza
Infinita= Tamaño desconocido 𝑍1−𝛽 = Potencia de prueba
(>10000) p = prevalencia de la enfermedad.
N= Tamaño de la población Es la proporción de individuos que poseen en p1 = prevalencia de la enfermedad
n= Tamaño de la muestra la población la característica de estudio. Como p2 = prevalencia de la enfermedad
α = Error tipo I es generalmente desconocido se suele S12 = Varianza del grupo 1
β = Error tipo II suponer que p=q=o.5 que es la opción más S22 = Varianza del grupo 2
segura x̄1= Media en el grupo 1
q = 1-p es la proporción que no poseen esa x̄2= Media en el grupo 2
característica
S2 = Varianza
d = precisión
Los valores Z más utilizados y sus niveles de confianza son:

Valor de Z 1.15 1.28 1.44 1.65 1.96 2 2.58


Niel de confianza 75% 80% 85% 90% 95% 95.5% 99%
Variable categórica, sin marco muestral

𝑍 1−𝛼2 ∗ 𝑝 ∗ 𝑞
𝑛=
𝑑2
Calcula el tamaño de la muestra para evaluar la Prevalencia de diabetes en adultos. La Paz
2009

n= Tamaño de la muestra n= ¿?
p = prevalencia de la enfermedad p = 0.15
q = 1-p q = 1 – 0.15 = 0.85
d = precisión d = 0.05
α= Nivel de significancia α= 5%
1-α= Nivel de confianza 1-α= 95%
𝑍1−𝛼 =Valor tipificado 𝑍1−𝛼 =1.96

𝑍 1−𝛼 2 ∗𝑝∗𝑞 1.962 ∗0.15∗0.85


𝑛= = = 195.92 = 196
𝑑2 0.052

Por lo tanto; requerimos como mínimo 196 adultos para obtener un nivel de confianza del
95%, con una precisión del 0.05.

 EL cálculo del tamaño muestral nos muestra el mínimo del que se necesita, mientras
mas mejor.

Ejemplo: ¿A cuántas personas tendríamos que estudiar para conocer la prevalencia de


obesidad?

Confianza = 95%; Precisión = 3%: Proporción esperada = asumamos que puede ser próxima
al 5%; si no tuviésemos ninguna idea de dicha proporción utilizaríamos el valor p = 0,5 (50%)
que maximiza el tamaño muestral:

𝑍 1−𝛼 2 ∗𝑝∗𝑞 1.962 ∗0.05∗0.95


𝑛= = = 203
𝑑2 0.032

Ejemplo: En el proyecto de Al Haouz en Marruecos, se ha calculado que cerca del 30% (0,3)
de los niños de la zona del proyecto padecen de malnutrición crónica. Este dato se basa en
estadísticas nacionales sobre malnutrición en las zonas rurales. Utilizando los valores
estándar indicados supra se efectúa el cálculo siguiente:
Cálculo:

𝑍 1−𝛼 2 ∗𝑝∗𝑞 1.962 ∗0.3∗0.7


𝑛= = = 322.72 = 323
𝑑2 0.052
Basado en una variable categórica con marco muestral conocido

Ejemplo de Cuantos alumnos necesitamos para calcular la prevalencia de Tiña pedís en alumnos de
la Universidad Mundial 2009, cuando en ese año se matricularon 1658 alumnos

𝑁 ∗ 𝑍 1−𝛼2 ∗ 𝑝 ∗ 𝑞
𝑛=
𝑑2 ∗ (𝑁 − 1) + 𝑍 1−𝛼2 ∗ 𝑝 ∗ 𝑞

n= Tamaño de la muestra n= ¿?
N = Tamaño de la población N= 1658
p = prevalencia de la enfermedad p = 0.3
q = 1-p q = 1 – 0.3 = 0.7
d = precisión o error d = 0.05
α= Nivel de significancia α= 5%
1-α= Nivel de confianza 1-α= 1- 0.05 = 95%
𝑍1−𝛼 =Valor tipificado 𝑍1−𝛼 =1.96

1658∗1.962 ∗0.3∗0.7
𝑛= = 270.26 = 271
0.052 ∗(1658−1)+1.962 ∗0.3∗0.7

Por lo tanto; requerimos como mínimo 271 alumnos para un nivel de significancia del 95 %, con una
precisión 0.05.

Ejemplo 2: para realizar una encuesta de satisfacción a clientes de un


determinado modelo de coche del que hemos vendido 10.000 unidades (N), en
la que queremos una confianza del 95,5% que determina que Z=2, deseamos un
error muestral del 5% (d) y consideramos que estarán satisfechos el 50%
(p=q=0.5)

𝑁∗𝑍 1−𝛼 2 ∗𝑝∗𝑞 10000∗22 ∗0.5∗0.5 10000


𝑛= 2 ∗𝑝∗𝑞 =0.052 ∗(10000−1)+ 22 ∗0.5∗0.5 = 25.9975 = 384.6523 = 385
𝑑2 ∗(𝑁−1)+ 𝑍 1−𝛼

Necesitaríamos una muestra de 385 clientes

Ejemplo 2: contrastar el porcentaje de personas de un país que ven un determinado


programa de televisión. Si la población del país es de 40 millones de personas, estimamos
que lo ve el 20% de la población (p=0.2 y q=0.8), queremos una confianza del 95,5% que
determina que Z=2 y estamos dispuestos a asumir un error muestral del 5% (e)
necesitaríamos una muestra de 256 personas.
𝑁∗𝑍 1−𝛼 2 ∗𝑝∗𝑞 40,000000∗22 ∗0.2∗0.8 25600000
𝑛= = 0.052 ∗(40,00000−1)+ 22 ∗0.2∗0.8 = 100000.638 = 255.9983 = 256
𝑑 ∗(𝑁−1)+ 𝑍 1−𝛼 2 ∗𝑝∗𝑞
2
Basado en una variable numérica con marco muestral conocido

𝑁 ∗ 𝑍 1−𝛼2 ∗ 𝑆 2
𝑛=
𝑑2 ∗ (𝑁 − 1) + 𝑍 1−𝛼2 ∗ 𝑆 2

Ejemplo Valor de la Presión Arterial Sistólica (mmHg) en alumnos de la carrera de nutrición- 2009

Cuando en ese año se matricularon 658 alumnos.

n= Tamaño de la muestra n= ¿?
N = Tamaño de la población N= 658
S = Desviación estándar S = 2 mmHg
S2= Varianza S2 = 4
d = precisión d = 0.1 mmHg
α= Nivel de significancia α= 5%
1-α= Nivel de confianza 1-α= 1- 0.05 = 95%
𝑍1−𝛼 =Valor tipificado 𝑍1−𝛼 =1.96

𝑁∗𝑍 1−𝛼 2∗𝑆 2 658 ∗1.962 ∗4


𝑛= = = 460.92 = 461
𝑑 2 ∗(𝑁−1)+ 𝑍 1−𝛼 2 ∗ 𝑆 2 0.1 ∗(658−1)+ 1.962 ∗4

Por lo tanto; requerimos como mínimo 461 alumnos para un nivel de confianza del 95%, con
una recisión de 0.1 mmHG

Nuestra muestra es muy grande porque q nuestra precisión es muy grande de 0.1 mmHg.
Basado en una variable numérica con marco muestral desconocido

𝑍 1−𝛼2 ∗ 𝑆 2
𝑛=
𝑑2
Ejemplo Valor de la hemoglobina en gestantes a nivel del mar- 2009

n= Tamaño de la muestra n= ¿?
S = Desviación estándar S = 1 mg%
S2= Varianza S2 = 1
d = precisión d = 0.1 mg%
α= Nivel de significancia α= 5%
1-α= Nivel de confianza 1-α= 1- 0.05 = 95%
𝑍1−𝛼 =Valor tipificado 𝑍1−𝛼 =1.96

𝑍 1−𝛼2 ∗ 𝑆 2 1.962 ∗ 1
𝑛= =𝑛= = 384.16 = 385
𝑑2 0.12

Por lo tanto; requerimos como mínimo 385 gestantes para un niel de confianza del 95%, con
una precisión de 0.1mg%

Por lo tanto; requerimos como mínimo 461 alumnos para un nivel de confianza del 95%, con
una recisión de 0.1 mmHG

Nuestra muestra es muy grande porque q nuestra precisión es muy grande de 0.1 mmHg

 No incluyo las otras dos formulas para verlas


mejor.

Você também pode gostar