Você está na página 1de 52

MAESTRIA EN CIENCIAS QUIMICAS

DISEÑO ESTADISTICO DE EXPERIMENTOS


Estadística
Dr Fernando Hernández Blanco

Miércoles 2-4 pm Laboratorio

Jueves 4-6 pm clase


MUESTREO

Toda la
población. CENSO

Población o universo estadístico


Tamaño
muestral

Un elemento (o unidad) es un objeto sobre el que se realiza


una medición de una variable bajo estudio
Se desea realizar un estudio sobre el gasto de dinero de las familias colombianas en las
pasadas navidades

Se desea hacer un estudio sobre la proporción de votantes para un determinado


partido político A en las próximas elecciones

Se desea hacer un estudio sobre la calidad de un alimento enlatado en un


supermercado en donde en estantería hay dos lotes diferentes.
Definición 1
Una población es un conjunto de N elementos sobre los que se desea realizar el estudio y de la cual
podemos obtener información sobre una característica X.
Se suele denotar por = {u1, u2, . . . , uN} o simplemente = {1, 2, . . . ,N}.

Definición 2
Se define por unidad de muestreo a los conjuntos no solapados de la población que cubren la
población completamente.
Si cada unidad de muestreo contiene uno y solamente un elemento de la población se le suele
denominar unidad primaria. Si por el contrario contiene varios se le denomina compuesta

Definición 3
Un marco es una lista de unidades de muestreo

Definición 4
Una muestra es una colección de unidades de muestreo obtenidas a partir de un marco..
1. La muestra tiene que ser representativa de la población de la que se
extrae

2. Se pueden producir errores imprevistos e incontrolados. Dichos


errores se denominan sesgos

3. Las distintas maneras de elegir una muestra de una población se


denominan muestreos

4. Al número de unidades (no necesariamente distintas) incluidas en la


muestra se le conoce como tamaño muestral y se denota
generalmente por n

5. El número de unidades que constituyen la población se denomina


tamaño poblacional y se denota por N.

6. El cociente n/N se conoce como fracción de muestreo


Unidad vacía. Es una unidad de muestreo erróneamente incluida en el
marco y que no pertenece a la población objetivo, aunque este relacionada
con la población

Unidad extraña es una unidad que aparece en el marco pero que no es


realmente del marco y que de ninguna manera debiera constar en el
mismo

Duplicaciones unidades repetidas en el marco

Omisiones Unidades omitidas en el marco que son realmente del marco


Todo el muestreo se basa en cuatro enunciados o principios: dos
axiomas, un teorema y una ley:

Axioma 1: Todo trabajo con muestras requiere un


conocimiento previo del universo del cual se extraerán
dichas muestras.

Axioma 2: La similitud entre los componentes del universo


no son propiedades dadas sino distinciones hechas por el
observador.
Teorema del limite central
“Sin tener en cuenta la forma funcional de la población de donde se
extrae la muestra, la distribución de las medias muestrales, calculadas
con muestras de tamaño n extraídas de una población con media µ y
varianza finita σ2, se aproxima a una distribución normal con media
µ y varianza σ2/ n, cuando n aumenta. Si n es grande, la distribución
de medias muestrales puede aproximarse mucho a una distribución
normal”
Ley de los grandes números
“Si un experimento es repetido más y más veces, entonces la frecuencia
relativa del evento tiende a acercarse a la probabilidad del evento”
Etapas del muestreo
Antes de preguntarnos de qué manera se toma una muestra de una población,
quizás debíamos de cuestionarnos sobre la necesidad de trabajar con muestras.
Hay, al menos, tres buenas razones para que una muestra sea generalmente
preferida a un censo:

• El coste, ya que un censo será mucho más caro y, a veces, incluso, prohibitivo.

• El tiempo disponible, cuando en muchos casos la información se necesita de


forma más o menos urgente.

• La precisión que presumiblemente se ganaría con un censo no compensa la


pérdida en tiempo y dinero, pudiéndose alcanzar un nivel razonable de precisión
con un adecuado método de muestreo.
Definir la información que se necesita.
Determinar la población a muestrear y comprobar si existe
información previa.
Definición del método a seguir para tomar la muestra y su
tamaño
Diseño adecuado de la forma de obtener la información
Uso de la muestra para hacer inferencia

Obtención de conclusiones acerca de la población


Tipos de error
Una fuente posible de error procede del hecho de que no observamos toda la
población, y se llama Error de azar o de estimación.

Hacer conclusiones muy generales a partir de la observación


de sólo una parte de la Población, se denomina Error de
muestreo

Hacer conclusiones hacia una Población mucho más grandes


de la que originalmente se tomó la muestra. Error de
Inferencia
Al hablar de métodos de muestreo nos referimos al conjunto de técnicas
estadísticas que estudian la forma de seleccionar una muestra lo
suficientemente representativa de una población cuya información permita
inferir las propiedades o características de toda la población cometiendo un
error medible y acotable. Sin embargo, existen otro muestreos que son
empleados con objetivos diferentes y que pueden ser una fuente de
información.
Aspectos asociados al muestreo

Muestras con probabilidad de error Muestras sin conocimiento de esa


muestral conocido. probabilidad de error muestral

(1) Todos los elementos de mi población tienen En estas técnicas alternativas, es habitual
una probabilidad mayor de cero de ser seleccionar elementos para la muestra basándose
seleccionados en la muestra. en hipótesis relativas a la población de interés, lo
(2) Conozco de forma precisa dicha probabilidad que se conoce como criterios de selección
para cada elemento, lo que se conoce como
probabilidad de inclusión
1. Un esquema muestral completo y actualizado que permita numerar las
unidades del universo
2. Un procedimiento de selección aleatorio, entendiéndose por tal uno que
garantice una probabilidad conocida
3. La fijación de una probabilidad de error muestral, denominada
estadísticamente como nivel de significación o probabilidad de error α
4. Una estimación de la heterogeneidad del universo, que en términos
estadísticos es su varianza

Una muestra no probabilística nos informa de cómo es un universo pero no nos permite
saber con qué precisión: no podemos establecer unos márgenes de error y unos niveles
de confianza.
¿Porque muestreo no-probabilístico?

A veces, para estudios exploratorios, el muestreo probabilístico resulta


excesivamente costoso y se acude a métodos no probabilísticos, aun
siendo conscientes de que no sirven para realizar generalizaciones, pues
no se tiene certeza de que la muestra extraída sea representativa, ya que
no todos los sujetos de la población tienen la misma probabilidad de ser
elegidos. En general se seleccionan a los sujetos siguiendo determinados
criterios procurando que la muestra sea representativa
Muestreo por cuotas
También denominado en ocasiones "accidental". Se asienta generalmente sobre la base de
un buen conocimiento de la población y/o de los individuos más "representativos" o
"adecuados" para los fines de la investigación. En este tipo de muestreo se fijan unas
"cuotas" que consisten en un número de individuos que reúnen unas determinadas
condiciones
 Se divide la población en sub-grupo según ciertas
Ejemplo 1. En un estudio sobre la actitud de la características: sexo, estado civil, edad y otros. Puede
población hacia un candidato político, se les indica a haber combinaciones de cuotas como: hombres mayores de
los encuestadores entrevistar a 150 sujetos: 25% 20 años mujeres casadas.
sean hombres mayores de 30 años; 25% mujeres  En la sección de los casos se manifieste el criterio del
mayores de 30 años; 25% sean hombres menores de investigador por lo general se encarga los de más fácil
25 años; 25% mujeres menores de 25 años. Una vez acceso. Por ejemplo 20 hombres y 50 mujeres.
determinada la cuota se eligen los primeros que se  En Este tipo de muestreo se intenta tener
encuentren que cumplan esas características. Este “representatividad” sin embargo tiene el defecto de que la
método se utiliza mucho en las encuestas de opinión. información recopilada solo es válida para la muestra.
Ventajas Desventajas
Resulta más económico que los No existe un método válido para
muestreos probabilísticos calcular el error
Fácil de ejecutar el trabajo de Dificulta el control del trabajo de
campo campo
No precisa el listado de la población Limitaciones en la representatividad
de la muestra para las características
no especificadas en los controles de
cuotas
Muestreo por bola de nieve
El muestreo por bola de nieve es una técnica de muestreo no probabilística en la que
los individuos seleccionados para ser estudiados reclutan a nuevos participantes
entre sus conocidos.
Básicamente podemos identificar dos tipos de muestreo bola de nieve:
1.Muestreo lineal: Cada individuo participante debe recomendar a otro individuo, de forma que la muestra crece a un
ritmo lineal.
2.Muestreo exponencial: Cada individuo debe invitar a participar a dos o más individuos. De esta forma, cuanta más
gente participa en el estudio, más gente se añade al mismo.

Sin duda, el principal problema de la bola de nieve es el riesgo de "sesgos de comunidad": accedemos a
un subgrupo de individuos dentro de nuestro target y el reclutamiento de nuevos miembros no logra salir
de ese subgrupo.

Respondent Driven Sampling

http://www.respondentdrivensampling.org/
Ventajas Desventajas
Este modelo es particularmente útil El riesgo fundamental está asociado a la
cuando se muestrean poblaciones cuyos selección inadecuada de los primeros
componentes, por motivos morales, miembros de la muestra y de quienes
ideológicos, legales o políticos tienen a dependerá el resto
ocultar su identidad.
A partir de unos pocos individuos el También es posible que ocurran
entrevistador, con ayuda de los primeros, distorsiones si no se tiene en cuenta
va “ conociendo” a nuevos miembros de la criterios muy específicos para la selección
muestra de la muestra
Permite agrandar la muestra inicial hasta No se pueden hacer inferencias a la
obtener una muestra que se considere población bajo estudio.
representativa de la población en estudio.
Muestreo por conveniencia
Consiste en seleccionar una muestra de la población por el hecho de que sea
accesible.
¿Significa lo anterior que los resultados de una muestra por conveniencia son totalmente irrelevantes,
que no nos dicen nada de la población?

Si tenemos buenas razones para pensar que la selección por conveniencia no va a


introducir sesgos respecto al total de la población, los resultados que obtendré
pueden ser una buena imagen del universo estudiado.

La clave está en considerar si la "conveniencia" en la selección


realmente va a representar un sesgo.
• Consiste en la elección por métodos no aleatorios de una
muestra cuyas características sean similares a las de la población
objetivo.

• En este tipo de muestreo la “representatividad” la determina el


investigador de modo subjetivo, siendo este el mayor
inconveniente del método ya que no podemos cuantificar la
representatividad de la muestra.

• Presenta casi siempre sesgos y por tanto debe aplicarse


únicamente cuando no existe alternativa.
Ventajas Desventajas
Menos costoso Difícil generalizar a otros sujetos .
No requiere mucho tiempo Menos representativa de una
población específica
Fácil de administrar y Por lo general Los resultados dependen de las
asegura alta tasa de participación. características únicas de la muestra
Posible generalización a sujetos Mayor probabilidad de error debido
similares al investigador o influencia de
sujetos (sesgos)
Muestreo intencional o discrecional

El muestreo discrecional es una técnica de muestreo no probabilístico donde el


investigador selecciona las unidades que serán muestra en base a su conocimiento y juicio
profesional.
Cuándo utilizar el muestreo discrecional?
Obstáculos del muestreo discrecional

REALIZAR UN MUESTREO DE OPINION NO


PROBABILISTICO EMPLEANDO LAS METODOLOGIAS.
• El muestreo discrecional se utiliza en los casos en que la
especialidad de una autoridad puede seleccionar una
muestra más representativa que pueda arrojar resultados
más precisos que mediante otras técnicas de muestreo
probabilístico.

El proceso consiste en elegir intencionalmente a dedo a los


individuos de la población sobre la base del conocimiento o
juicio de la autoridad o investigador.
1. Factor de elevación: es el cociente entre el tamaño de la población y el tamaño de la
muestra, N/n .
Representa el número de elementos que hay en la población por cada elemento
de la muestra.

2. Factor de muestreo: es el cociente entre el tamaño de la muestra y el tamaño de la


población n/N .
Si se multiplica por 100, obtenemos el porcentaje de la población que representa la
muestra.
El muestreo aleatorio simple (M.A.S.) es la técnica de muestreo en la
que todos los elementos que forman el universo y que, por lo tanto, están
descritos en el marco muestral, tienen idéntica probabilidad de ser
seleccionados para la muestra.
Muestreo con reposición y sin reposición

• Cuando un elemento es seleccionado, y puede volver a ser seleccionado, se dice


que es un muestreo aleatorio con reemplazamiento o reposición. Generalmente
recibe el nombre de muestreo aleatorio simple.

• En caso de que el elemento no vuelva a formar parte de la población de manera


que no puede volver a ser es un muestreo aleatorio sin reposición o
reemplazamiento. también se encuentra con el nombre de muestreo
irrestrictamente aleatorio

Se puede concluir que el muestreo aleatorio simple sin


reposición siempre es más eficiente
MUESTREO IRRESTRICTO ALEATORIO SIN REPOSICION.

Se trata de un tipo de muestreo de unidades elementales

Consiste en obtener la muestra unidad a unidad de forma aleatoria sin


reposición a la población de las unidades previamente seleccionadas.

El orden de colocación de los elementos en las muestras no interviene; es


decir, las muestras con los mismos elementos colocados en orden distinto
se consideran iguales
Las muestras con elementos repetidos son imposibles

Se trata de un procedimiento de selección con probabilidades iguales porque todas


las unidades de la población van a tener la misma probabilidad de pertenecer a la
muestra
Parámetro Estadístico
Media ෠
ത 1 𝑛
𝑋= σ𝑖=1 𝑥𝑖
𝑛

Error estándar de la media s2


V ( x ) = (1 − f )
f= n/N
n
Intervalo de confianza de la  S S 
 x − 1,96 1 − f , x + 1,96 1− f 
media  n n 
Seleccione una muestra de tamaño 4 en una población de tamaño 10 según un
plan simple sin reemplazamiento.

0,375489 0,624004 0,517951


0,0454450 0,632912 0,246090
0,927398 0,32595 0,645951
0,178048.
MUESTREO IRRESTRICTO ALEATORIO CON REPOSICION.

Se realiza la extracción de n elementos, pero de modo que cada vez el


elemento extraído es repuesto al total del universo. De tal modo que un
elemento puede ser extraído varias veces. El cambio principal se
establece en la determinación de la cantidad de muestra.
El muestreo estratificado consiste en dividir toda la población objeto de
estudio en diferentes subgrupos o estratos disjuntos, de manera que un individuo
sólo puede pertenecer a un estrato.
Tipos de muestreo estratificado
Dependiendo del tamaño que asignamos a los estratos, hablaremos
de diferentes tipos de muestreo estratificado. También se acostumbra
a hablar de diferentes formas de "afijación" de la muestra en estratos.

(1) Muestreo estratificado proporcionado


(2) Muestreo estratificado uniforme
(3) Muestreo estratificado optimo.

¿cuando conviene emplear la estratificación?, ¿qué tipo de


estratificación es más conveniente?
El muestreo sistemático era muy popular en el pasado, antes de la
incorporación de la informática. Consistente en escoger un individuo inicial de forma
aleatoria entre la población y, a continuación, seleccionar para la muestra a cada enésimo
individuo disponible en el marco muestral.
1. Elaborar una lista ordenada de los N individuos de la población, lo que sería el marco muestral.

2. Divididir el marco muestral en n fragmentos, donde n es el tamaño de muestra que deseamos. El


tamaño de estos fragmentos será
K=N/n
donde K recibe el nombre de intervalo o coeficiente de elevación.

3. Número de inicio: obtenemos un número aleatorio entero A, menor o igual al intervalo. Este
número corresponderá al primer sujeto que seleccionaremos para la muestra dentro del primer
fragmento en que hemos dividido la población.

4. Selección de los n-1 individuos restantes: Seleccionamos los siguientes individuos a partir del
individuo seleccionado aleatoriamente, mediante una sucesión aritmética, seleccionando a los
individuos del resto de fragmentos en que hemos dividido la muestra que ocupan la misma
posición que el sujeto inicial. Esto equivale a decir que seleccionaremos los individuos
A, A + K, A + 2K, A + 3K, ...., A + (n-1)K
El muestreo por conglomerados es una técnica que aprovecha la existencia de
grupos o conglomerados en la población que representan correctamente el total de la
población en relación a la característica que queremos medir.
1. El primer paso para aplicar esta técnica es definir los conglomerados

2. Una vez definido estos conglomerados, seleccionar al azar algunos de


ellos para estudiarlos.

3. Una vez definimos los conglomerados, el siguiente paso es seleccionar


los conglomerados a estudiar, ya sea mediante un muestreo aleatorio
simple o sistemático.

4. Por último, una vez hemos seleccionado los conglomerados a estudiar,


podemos investigar a todos los sujetos que forman parte de los mismos,
o bien aplicar un nuevo proceso de muestreo dentro del conglomerado.
Etapas del muestreo
Definir la
información que se •Objetivos
necesita.

Determinar la
población a
muestrear y
comprobar si existe
información.

Definición del •Características,


método a seguir para cobertura (temporal
tomar la muestra y y geográfica),
unidades de estudio
su tamaño

Diseño adecuado de
•Problema y
la forma de obtener recursos
la información

•Planeación,
Uso de la muestra para empleo de
hacer inferencia. muestras
preliminares
Porqué una muestra?
• Costo
• Confiabilidad en la información
• Pruebas destructivas
• Rapidez en reunir la información
Objetivos del muestreo.
Seleccionar “buenas” muestras de un tamaño “apropiado”, considerando la
información que tenemos de la población que estamos estudiando y el
presupuesto con que contamos.
Qué es una tamaño de muestra “apropiado”? Depende de:
la variabilidad de la característica que queremos estudiar
la precisión con que queremos hacer la inferencia
el presupuesto que tengamos
el tamaño de la población
Cálculo del Tamaño Muestral
Cada estudio tiene un tamaño muestral idóneo, que permite comprobar lo
que se pretende con la seguridad y precisión fijadas por el investigador

¿De qué depende el tamaño muestral?


Variabilidad del parámetro a estimar: Datos previos, estudios pilotos

Precisión: Amplitud del intervalo de confianza


Nivel de confianza (1- α): Habitualmente 95% o 99%. Probabilidad
complementaria al error admitido (α)
Según lo que antecede puede decirse que existen criterios
generales para establecer el tamaño de la muestra. Uno de ellos es
fijarlo en función del factor más restrictivo, que puede ser:

a) El presupuesto disponible y el costo del muestreo.


b) El tiempo disponible.
c) El error muestral máximo admisible.

Observación: muchas veces se estima la variabilidad entre las


unidades de muestreo a través de la toma de una muestra piloto
previa

Planificación del diseño del


muestreo
Tamaño de la muestra para la población 𝑍 2𝑝 𝑞
infinita o desconocida 𝑛=
𝑖2
Tamaño de la muestra para la población finita
y conocida:
𝑍 2𝑁𝑝 𝑞
𝑛=
𝑖 2 𝑁 − 1 + 𝑍 2𝑝 𝑞
n: tamaño muestral
N: tamaño de la población
Z: valor correspondiente a la distribución de gauss, Zα= 0.05 = 1.96
y Zα= 0.01 = 2.58
p: prevalencia esperada del parámetro a evaluar, en caso de
desconocerse (p =0.5), que hace mayor el tamaño muestral
q: 1 – p (si p = 70 %, q = 30 %)
i: error que se prevé cometer si es del 10 %, i = 0.1

Calculo del tamaño de muestra


Calculo del tamaño de muestra
Calculo del tamaño de muestra

Você também pode gostar