Escolar Documentos
Profissional Documentos
Cultura Documentos
Muestreo probabilístico
Los métodos de muestreo probabilísticos son aquellos que se basan en el
principio de equiprobabilidad. Es decir, aquellos en los que todos los
individuos tienen la misma probabilidad de ser elegidos para formar parte de
una muestra y, consiguientemente, todas las posibles muestras de tamaño n
tienen la misma probabilidad de ser seleccionadas. Sólo estos métodos de
muestreo probabilísticos nos aseguran la representatividad de la muestra
extraída y son, por tanto, los más recomendables. Dentro de los métodos de
muestreo probabilísticos encontramos los siguientes tipos:
Imagina que tienes sólo 10 sujetos. Con este tamaño de la muestra tan
pequeño, la tendencia de sus resultados es que variarán mucho, produciendo
una alta desviación estándar. Ahora imagina que el tamaño de la muestra
aumentó a 100. La tendencia de sus puntuaciones es a agruparse,
produciendo una desviación estándar baja. Formas de eliminar el error de
muestreo Sólo hay una manera de eliminar este error. Consiste en eliminar el
concepto de muestra y probar a toda la población.
Valor esperado
Cuando se tienen las medias de varias muestras sacadas de una población, la
media de todos esos valores, se le conocerá como valor esperado de la media
muestral.
DISTRIBUCIÓN MUESTRAL
El valor esperado de la media muestral E ( ), es igual a la media de la
población (µ) de la que se tomó la muestra. Cuando el valor esperado de un
estimador puntual es igual al parámetro poblacional, se dice que el estimador
puntual es insesgado.
DISTRIBUCIÓN MUESTRAL
En los casos en que n/N < 0.05, para calcular σ deberá usarse la versión
para poblaciones finitas.
Para calcular σ , se necesita conocer σ (la desviación estándar de la población)
y para diferenciar σ de σ, a la desviación estándar de la media muestral se le
llama error estándar de la media. Este término se refiere a la desviación
estándar de un estimador puntual, a través de este valor se puede
determinar qué tan lejos puede estar la media muestral de la media
poblacional.
USO DE LA EXPRESIÓN SIGUIENTE PARA CALCULAR LA DESVIACIÓN
ESTÁNDAR DE LA MEDIA MUESTRAL.
σ
σ =
√n
Siempre que:
1. La población sea infinita; o
2. La población sea finita y el tamaño de la muestra sea menor o igual a
5% del tamaño de la población; es decir, n/N = < 0.05
Distribución uniforme
Medias de las muestras
Distribución exponencial
Medias de las muestras
Estimación puntual:2
Método de los momentos;
Método de la máxima verosimilitud;
Método de los mínimos cuadrados;
Estimación por intervalos.
Estimación bayesiana.
ESTIMACION PUNTUAL
Estimar puede tener dos significados interesantes. Significa querer e inferir.
Desde luego, el primer significado es más trascendente. Pero no tiene ningún
peso en la estadística, disciplina que no se ocupa de los asuntos del amor. El
segundo significado es el importante aquí. Una estimación estadística es un
proceso mediante el que establecemos qué valor debe tener un parámetro
según deducciones que realizamos a partir de estadísticos. En otras palabras,
estimar es establecer conclusiones sobre características poblacionales a
partir de resultados muestrales. Vamos a ver dos tipos de estimaciones:
puntual y por intervalo. La segunda es la más natural. Y verás que forma
parte habitual de nuestro imaginario como personas sin necesidad de una
formación estadística. La primera, la estimación puntual, es la más sencilla y,
por ese motivo, vamos a comenzar por ella. Ocurre, además, que la
estimación por intervalo surge, poco más o menos, de construir un intervalo
de posibles valores alrededor de la estimación puntual. Una estimación
puntual consiste en establecer un valor concreto (es decir, un punto) para el
parámetro. El valor que escogemos para decir “el parámetro que nos
preocupa vale X” es el que suministra un estadístico concreto. Como ese
estadístico sirve para hacer esa estimación, en lugar de estadístico suele
llamársele estimador. Así, por ejemplo, utilizamos el estadístico “media
aritmética de la muestra” como estimador del parámetro “media aritmética
de la población”. Esto significa: si quieres conocer cuál es el valor de la media
en la población, estimaremos que es exactamente el mismo que en la
muestra que hemos manejado.
ESTIMACION POR INTERVALO
Intervalo de confianza
El intervalo de confianza es una expresión del tipo [θ1, θ2] ó θ1 ≤ θ ≤ θ2,
donde θ es el parámetro a estimar. Este intervalo contiene al
parámetro estimado con un determinado nivel de confianza. Pero a
veces puede cambiar este intervalo cuando la muestra no garantiza un
axioma o un equivalente circunstancial.
Error de la estimación
Es una medida de su precisión que se corresponde con la amplitud
del intervalo de confianza. Cuanta más precisión se desee en la
estimación de un parámetro, más estrecho deberá ser el intervalo de
confianza y, si se quiere mantener o disminuir el error, más
observaciones deberán incluirse en la muestra estudiada. En caso de
no incluir nuevas observaciones para la muestra, más error se comete
al aumentar la precisión. Se suele llamar E, según la fórmula E = (θ2 -
θ1)/2.
Límite de Confianza
Es la probabilidad de que el verdadero valor del parámetro estimado
en la población se sitúe en el intervalo de confianza obtenido. El nivel
de confianza se denota por (1-α), aunque habitualmente suele
expresarse con un porcentaje ((1-α)·100%). Es habitual tomar como
nivel de confianza un 95% o un 99%, que se corresponden con valores
α de 0,05 y 0,01 respectivamente.
Valor α
También llamado nivel de significación. Es la probabilidad (en tanto
por uno) de fallar en nuestra estimación, esto es, la diferencia entre la
certeza (1) y el nivel de confianza (1-α). Por ejemplo, en una
estimación con un nivel de confianza del 95%, el valor α es (100-
95)/100 = 0,05
Valor crítico
Se representa por Zα/2. Es el valor de la abscisa en una determinada
distribución que deja a su derecha un área igual a α/2, siendo 1-α el
nivel de confianza. Normalmente los valores críticos están tabulados o
pueden calcularse en función de la distribución de la población. Por
ejemplo, para una distribución normal, de media 0 y desviación típica
1, el valor crítico para α = 0,1 se calcularía del siguiente modo: se busca
en la tabla de la distribución ese valor (o el más aproximado), bajo la
columna "Área"; se observa que se corresponde con -1,28. Entonces
Zα/2 = 1,64. Si la media o desviación típica de la distribución normal no
coinciden con las de la tabla, se puede realizar el cambio de variable t
=(X-μ)/σ para su cálculo.
Con estas definiciones, si tras la extracción de una muestra se dice que "3 es
una estimación de la media con un margen de error de 0,6 y un nivel de
confianza del 99%", podemos interpretar que el verdadero valor de la media
se encuentra entre 2,7 y 3,3, con una probabilidad del 99%. Los valores 2,7 y
3,3 se obtienen restando y sumando, respectivamente, la mitad del error,
para obtener el intervalo de confianza según las definiciones dadas.
Para un tamaño fijo de la muestra, los conceptos de error y nivel de confianza
van relacionados. Si admitimos un error mayor, esto es, aumentamos el
tamaño del intervalo de confianza, tenemos también una mayor probabilidad
de éxito en nuestra estimación, es decir, un mayor nivel de confianza.
INTERVALO DE CONFIANZA
El intervalo de confianza está determinado por dos valores dentro de los
cuales afirmamos que está el verdadero parámetro con cierta probabilidad.
Son unos límites o margen de variabilidad que damos al valor estimado, para
poder afirmar, bajo un criterio de probabilidad, que el verdadero valor no los
rebasará. Es una expresión del tipo [θ1, θ2] ó θ1 ≤ θ ≤ θ2, donde θ es el
parámetro a estimar. Este intervalo contiene al parámetro estimado con una
determinada certeza o nivel de confianza. En la estimación por intervalos se
usan los siguientes conceptos: • Variabilidad del parámetro: Si no se conoce,
puede obtenerse una aproximación en los datos o en un estudio piloto.
También hay métodos para calcular el tamaño de la muestra que prescinden
de este aspecto. Habitualmente se usa como medida de esta variabilidad la
desviación típica poblacional y se denota σ. • Error de la estimación: Es una
medida de su precisión que se corresponde con la amplitud del intervalo de
confianza. Cuanta más precisión se desee en la estimación de un parámetro,
más estrecho deberá ser el intervalo de confianza y, por tanto, menor el
error, y más sujetos deberán incluirse en la muestra estudiada. Llamaremos a
esta precisión E, según la fórmula E = θ2 - θ1. • Nivel de confianza: Es la
probabilidad de que el verdadero valor del parámetro estimado en la
población se sitúe en el intervalo de confianza obtenido. El nivel de confianza
se denota por (1-α), aunque habitualmente suele expresarse con un
porcentaje ((1-α)·100%). Es habitual tomar como nivel de confianza un 95% o
un 99%, que se corresponden con valores α de 0,05 y 0,01, respectivamente.
• Valor α: También llamado nivel de significación. Es la probabilidad (en tanto
por uno) de fallar en nuestra estimación, esto es, la diferencia entre la
certeza (1) y el nivel de confianza (1-α). Por ejemplo, en una estimación con
un nivel de confianza del 95%, el valor α es (100-95)/100 = 0,05. • Valor
crítico: Se representa por Zα/2. Es el valor de la abscisa en una determinada
distribución que deja a su derecha un área igual a α/2, siendo 1-α el nivel de
confianza. Normalmente los valores críticos están tabulados o pueden
calcularse en función de la distribución de la población. Por ejemplo, para
una distribución normal, de media 0 y desviación típica 1, el valor crítico para
α = 0,05 se calcularía del siguiente modo: se busca en la tabla de la
distribución ese valor (o el más aproximado), bajo la columna "Área"; se
observa que se corresponde con -0,64. Entonces Zα/2 = 0,64. Si la media o
desviación típica de la distribución normal no coinciden con las de la tabla, se
puede realizar el cambio de variable t=(X-μ)/σ para su cálculo.
Error estándár de lá mediá muestrál.
El error estándar de la media (llamado en inglés "standard error of the mean"
(SEM)) cuantifica4 las oscilaciones de la media muestral (media obtenida en
los datos) alrededor de la media poblacional (verdadero valor de la media). El
EEM o SEM se estima generalmente dividiendo la desviación estándar de la
población entre la raíz cuadrada del tamaño de la muestra (asumiendo
independencia estadística de los valores en la muestra):
Donde
s es la desviación estándar (es decir, la estimación basada en la
muestra de la desviación estándar de la población).
n es el tamaño (número de individuos de la muestra)
Donde
σ es la verdadera desviación estándar de la población.
Siendo:
el tamaño de la muestra
CONCLUSIONES
El muestreo Estadístico resulta beneficioso para implementarlo en la
realización de un estudio, debido a que mediante este se pueden obtener
probabilidades bajas o altas a través de determinados beneficios que estas
técnicas ofrecen. En los diferentes tipos de muestreo existen no
probabilística en los cuales se deben establecer diferencia en el momento de
realizar nuestras investigaciones por tanto que en el no probabilística no toda
la población forma parte de la muestra y en el probabilística todos los
individuos tienen probabilidad positiva de formar parte de la muestra.
• http://frecuenciaestadistica.blogspot.mx/2009/04/muestreo.html
• http://estadisticavigrado.blogspot.mx/2011/04/teorema-del-limite-
central.html
• https://explorable.com/es/distribucion-de-muestreo
• https://es.scribd.com/search?content_type=documents&page=1&que
ry=%EF%83%98Distribuci%C3%B3n%20muestral%20de%20medias.
• https://es.scribd.com/doc/277667877/Probabilidad-y-Estadistica-
Unidad-IV