Muestreo e Estimacion

INTRODUCCION
Se denomina muestreo al proceso por el que generamos las muestras. Una

muestra es una parte (un subconjunto) de la población, y se desea que la
muestra sea lo más representativa posible de la población de la que procede.
Sin embargo, por muy cuidadosa que sea la selección de la muestra
difícilmente será una representación exacta de la población. Esto significa que
su tendencia central, variabilidad, etc., aproximarán las de la población, pero
habrá cierta diferencia, que interesa sea lo menor posible. Un concepto clave
de muestreo es el de representatividad: Los procedimientos de muestreo
tienen por objeto generar muestras lo más representativas posible de las
poblaciones dados los objetivos de la investigación y las circunstancias que
afectan al muestreo.
TIPOS DE MUESTREO
Existen diferentes criterios de clasificación de los diferentes tipos de
muestreo, aunque en general pueden dividirse en dos grandes grupos:
métodos de muestreo probabilísticos y métodos de muestreo no
probabilísticos.
Muestreo probabilístico
Los métodos de muestreo probabilísticos son aquellos que se basan en el
principio de equiprobabilidad. Es decir, aquellos en los que todos los
individuos tienen la misma probabilidad de ser elegidos para formar parte de
una muestra y, consiguientemente, todas las posibles muestras de tamaño n
tienen la misma probabilidad de ser seleccionadas. Sólo estos métodos de
muestreo probabilísticos nos aseguran la representatividad de la muestra
extraída y son, por tanto, los más recomendables. Dentro de los métodos de
muestreo probabilísticos encontramos los siguientes tipos:
• Muestreo aleatorio simple:

El procedimiento empleado es el siguiente: 1) se asigna un número a
cada individuo de la población y 2) a través de algún medio mecánico
(bolas dentro de una bolsa, tablas de números aleatorios, números
aleatorios generados con una calculadora u ordenador, etc.) se eligen
tantos sujetos como sea necesario para completar el tamaño de
muestra requerido. Este procedimiento, atractivo por su simpleza,
tiene poca o nula utilidad práctica cuando la población que estamos
manejando es muy grande.
• Muestreo aleatorio sistemático:

Este procedimiento exige, como el anterior, numerar todos los
elementos de la población, pero en lugar de extraer n números
aleatorios sólo se extrae uno. Se parte de ese número aleatorio i, que
es un número elegido al azar, y los elementos que integran la muestra
son los que ocupa los lugares i, i+k, i+2k, i+3k,...,i+(n-1)k, es decir se
toman los individuos de k en k, siendo k el resultado de dividir el
tamaño de la población entre el tamaño de la muestra: k= N/n. El
número i que empleamos como punto de partida será un número al
azar entre 1 y k. El riesgo este tipo de muestreo está en los casos en
que se dan periodicidades en la población ya que al elegir a los
miembros de la muestra con una periodicidad constante (k) podemos
introducir una homogeneidad que no se da en la población.
Imaginemos que estamos seleccionando una muestra sobre listas de
10 individuos en los que los 5 primeros son varones y los 5 últimos
mujeres, si empleamos un muestreo aleatorio sistemático con k=10
siempre seleccionaríamos o sólo hombres o sólo mujeres, no podría
haber una representación de los dos sexos.
• Muestreo aleatorio estratificado:

Trata de obviar las dificultades que presentan los anteriores ya que
simplifican los procesos y suelen reducir el error muestral para un
tamaño dado de la muestra. Consiste en considerar categorías típicas
diferentes entre sí (estratos) que poseen gran homogeneidad respecto
a alguna característica (se puede estratificar, por ejemplo, según la
profesión, el municipio de residencia, el sexo, el estado civil, etc.). Lo
que se pretende con este tipo de muestreo es asegurarse de que todos
los estratos de interés estarán representados adecuadamente en la
muestra. Cada estrato funciona independientemente, pudiendo
aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado
para elegir los elementos concretos que formarán parte de la muestra.
En ocasiones las dificultades que plantean son demasiado grandes,
pues exige un conocimiento detallado de la población. (Tamaño
geográfico, sexos, edades,...). La distribución de la muestra en función
de los diferentes estratos se denomina afijación, y puede ser de
diferentes tipos:
Afijación Simple: A cada estrato le corresponde igual número de
elementos muéstrales.
Afijación Proporcional: La distribución se hace de acuerdo con el peso
(tamaño) de la población en cada estrato.
Afijación Optima: Se tiene en cuenta la previsible dispersión de los
resultados, de modo que se considera la proporción y la desviación
típica. Tiene poca aplicación ya que no se suele conocer la desviación.
• Muestreo aleatorio por conglomerados:
Los métodos presentados hasta ahora están pensados para
seleccionar directamente los elementos de la población, es decir, que
las unidades muéstrales son los elementos de la población.
En el muestreo por conglomerados la unidad muestral es un grupo de
elementos de la población que forman una unidad, a la que llamamos
conglomerado. Las unidades hospitalarias, los departamentos
universitarios, una caja de determinado producto, etc., son
conglomerados naturales. En otras ocasiones se pueden utilizar
conglomerados no naturales como, por ejemplo, las urnas electorales.
Cuando los conglomerados son áreas geográficas suele hablarse de
"muestreo por áreas". El muestreo por conglomerados consiste en
seleccionar aleatoriamente un cierto número de conglomerados (el
necesario para alcanzar el tamaño muestral establecido) y en
investigar después todos los elementos pertenecientes a los
conglomerados elegidos.
Ventajas e inconvenientes.
Ventajas e inconvenientes de los distintos tipos de muestreo probabilístico.
CARACTERISTICAS VENTAJAS INCONVENIENTES
Aleatorio Se selecciona una  Sencillo y de Requiere que se

simple muestra de tamaño fácil comprensión. posea de
n de una población  Cálculo rápido antemano un
de N unidades, cada de medias y listado completo
elemento tiene una varianzas.  Se de toda la
probabilidad de basa en la teoría población.
inclusión igual y estadística, y por Cuando se trabaja
conocida de n/N tanto existen con muestras
paquetes pequeñas es
informáticos para posible que no
analizar los datos represente a la
población
adecuadamente.
Sistemático Conseguir un listado  Fácil de aplicar. Si la constante de
de los N elementos  No siempre es muestreo está
de la población necesario tener asociada con el
Determinar tamaño un listado de toda fenómeno de
muestral n. Definir la población. interés, las
un intervalo k= N/n.  Cuando la estimaciones
Elegir un número población está obtenidas a partir
aleatorio, r, entre 1ordenada de la muestra
y k (r= arranque siguiendo una pueden contener
aleatorio). tendencia sesgo de selección
Seleccionar los
conocida, asegura
elementos de la una cobertura de
lista. unidades de todos
los tipos.
Estratificado En ciertas ocasiones  Tiende a  Se ha de
resultará asegurar que la conocer la
conveniente muestra distribución en la
estratificar la
muestra según represente población de las
ciertas variables de adecuadamente a variables
interés. Para ello la población en utilizadas para la
debemos conocer la función de unas estratificación.
composición variables
estratificada de la seleccionadas.
población objetivo a  Se obtienen
hacer un muestreo. estimaciones más
Una vez calculado el precisa
tamaño muestral  Su objetivo es
apropiado, este se conseguir una
reparte de manera muestra lo más
proporcional entre semejante posible
los distintos estratos a la población en
definidos en la lo que a la o las
población usando variables
una simple regla de estratificadoras se
tres. refiere.
Conglomerados Se realizan varias  Es muy eficiente  El error estándar
fases de muestreo cuando la es mayor que en
sucesivas población es muy el muestreo
(polietápico) La grande y dispersa. aleatorio simple o
necesidad de  No es preciso estratificado
listados de las tener un listado .  El cálculo del
unidades de una de toda la error estándar es
etapa se limita a población, sólo de complejo.
aquellas unidades las unidades
de muestreo primarias de
seleccionadas en la muestreo.
etapa anterior.
ERROR DE MUESTREO
El error de muestreo es la desviación de la muestra seleccionada de las
verdaderas características, rasgos, comportamientos, cualidades o figuras de
toda la población.
¿POR QUÉ SUCEDE ESTE ERROR?
El error del proceso de muestreo ocurre cuando los investigadores toman

diferentes sujetos de la misma población, y aún así, los sujetos tienen
diferencias individuales. Debes recordar que cuando tomas una muestra, se
trata de un subconjunto de toda la población y, por lo tanto, puede haber
una diferencia entre la muestra y la población.
La causa más frecuente de dicho error es un procedimiento de muestreo

sesgado. Todo investigador debe tratar de establecer una muestra que esté
libre de sesgos y sea representativa de toda la población. Así, el investigador
es capaz de minimizar o eliminar el error de muestreo.
Otra causa posible de este error es la casualidad. Se lleva a cabo el proceso

de aleatorización y muestreo de probabilidad para minimizar el error del
proceso de muestreo, pero igualmente es posible que todos los sujetos
asignados al azar no sean representativos de la población.
El resultado más común de error de muestreo es el error sistemático en

donde los resultados de la muestra difieren significativamente de los
resultados de toda la población. Se entiende que si la muestra no es
representativa de toda la población, lo más probable es que los resultados de
la muestra difieran de los resultados de toda la población.
TAMAÑO DE LA MUESTRA Y ERROR DE MUESTREO
Dados dos estudios exactamente iguales, dos métodos de muestreo iguales y

la misma población, el estudio con un tamaño de muestra más grande tendrá
menos error del proceso de muestreo que el estudio con un tamaño menor
de la muestra. Debes recordar que a medida que aumenta el tamaño de la
muestra, se acerca al tamaño de toda la población y, por lo tanto, se
aproxima a todas las características de la población, disminuyendo el error
del proceso de muestreo.
DESVIACIÓN ESTÁNDAR Y ERROR DE MUESTREO
La desviación estándar se utiliza para expresar la variabilidad de la población.

Más técnicamente, es la diferencia promedio de todas las puntuaciones
reales de los sujetos de la media o promedio de todas las puntuaciones. Por
lo tanto, si la muestra tiene una alta desviación estándar, se deduce que la
muestra también tiene un alto error del proceso de muestreo.
Se entiende más fácilmente si relacionas la desviación estándar con el

tamaño de la muestra. Debes tener en cuenta que a medida que aumenta el
tamaño de la muestra, la desviación estándar disminuye.
Imagina que tienes sólo 10 sujetos. Con este tamaño de la muestra tan
pequeño, la tendencia de sus resultados es que variarán mucho, produciendo
una alta desviación estándar. Ahora imagina que el tamaño de la muestra
aumentó a 100. La tendencia de sus puntuaciones es a agruparse,
produciendo una desviación estándar baja. Formas de eliminar el error de
muestreo Sólo hay una manera de eliminar este error. Consiste en eliminar el
concepto de muestra y probar a toda la población.
En la mayoría de los casos esto no es posible. Por consiguiente, lo que el

investigador debe hacer es minimizar el error del proceso de muestreo. Esto
se puede lograr con un muestreo probabilístico adecuado y no sesgado y
mediante el uso de un gran tamaño de la muestra.
DISTRIBUCION DE MUESTREO
DISTRIBUCIÓN MUESTRAL
Consideremos todas las posibles muestras de tamaño n en una población.

Para cada muestra podemos calcular un estadístico muestral (la media
muestral , la desviación estándar muestral s, la proporción muestral , etc.)
que variará de una a otra muestra. Así obtenemos una distribución de los
estadísticos resultantes de cada muestra que se llama distribución muestral,
en otras palabras es:
La distribución de probabilidad de todas las muestras de un determinado
tamaño de muestra de la población.
Las muestras aleatorias obtenidas de una población son, por naturaleza

propia, impredecibles. No se esperaría que dos muestras aleatorias del
mismo tamaño y tomadas de la misma población tenga la misma media
muestral o que sean completamente parecidas; puede esperarse que
cualquier estadístico, como la media muestral, calculado a partir de las
medias en una muestra aleatoria, cambie su valor de una muestra a otra, por
ello, se quiere estudiar la distribución de todos los valores posibles de un
estadístico. Tales distribuciones serán muy importantes en el estudio de la
estadística inferencial, porque las inferencias sobre las poblaciones se harán
usando estadísticos muestrales. Conocer esta distribución muestral y sus
propiedades permitirá juzgar la confiabilidad de un estadístico muestral
como un instrumento para hacer inferencias sobre un parámetro poblacional
desconocido.
Hay dos tipos de distribuciones muestrales: la distribución muestral de

medias y la de proporciones.Es la distribución de probabilidad de todos los
valores de la media muestral ( ).
DISTRIBUCIÓN MUESTRAL DE MEDIAS.
La distribución muestral de medias como otras distribuciones de probabilidad

tiene un valor esperado, una desviación estándar y una forma característica.
Valor esperado
Cuando se tienen las medias de varias muestras sacadas de una población, la
media de todos esos valores, se le conocerá como valor esperado de la media
muestral.
VALOR ESPERADO DE LA MEDIA MUESTRAL
E ( ) = valor esperado de la media muestral ( )

µ = media poblacional
E( )=µ
El valor esperado de la media muestral E ( ), es igual a la media de la
población (µ) de la que se tomó la muestra. Cuando el valor esperado de un
estimador puntual es igual al parámetro poblacional, se dice que el estimador
puntual es insesgado.
Desviación estándar de la media muestral.

Es posible demostrar que usando el muestreo aleatorio simple, la desviación
estándar de la media muestral depende de si la población es finita o infinita.
Las dos fórmulas para la desviación estándar son las siguientes:
DESVIACIÓN ESTÁNDAR DE LA MEDIA MUESTRAL.

σ = desviación estándar de la media muestral
σ = desviación estándar poblacional.
n = tamaño de la muestra
N = tamaño de la población.
Población finita Población infinita
σ
N−n σ σ =
σ =√ ( ) √n
N−1 √n
Al observar las dos fórmulas se puede notar que en la de población finita el

N−n
factor √ se requiere y en la infinita no, a este factor se le conoce como
N−1
factor de corrección para una población finita. Esto se ve cuando el muestreo
que se hace en una población finita, es grande, mientras que el tamaño de la
muestra es pequeño, en estos casos el factor de corrección para una
población finita es igual a 1. Por lo tanto, la diferencia entre el valor de la
desviación estándar de la media muestral en el caso de la población finita o
σ
infinita se vuelve despreciable. Entonces σ = es una buena aproximación
√n
a la desviación estándar de la media muestral, aun cuando la población se a
finita. Esta observación lleva a la siguiente regla general, para calcular la
desviación estándar de la media muestral.
En los casos en que n/N < 0.05, para calcular σ deberá usarse la versión
para poblaciones finitas.
Para calcular σ , se necesita conocer σ (la desviación estándar de la población)
y para diferenciar σ de σ, a la desviación estándar de la media muestral se le
llama error estándar de la media. Este término se refiere a la desviación
estándar de un estimador puntual, a través de este valor se puede
determinar qué tan lejos puede estar la media muestral de la media
poblacional.
USO DE LA EXPRESIÓN SIGUIENTE PARA CALCULAR LA DESVIACIÓN
ESTÁNDAR DE LA MEDIA MUESTRAL.
σ
σ =
√n
Siempre que:
1. La población sea infinita; o
2. La población sea finita y el tamaño de la muestra sea menor o igual a
5% del tamaño de la población; es decir, n/N = < 0.05
Forma de la distribución muestral.

El paso final en la identificación de las características de la distribución
muestral de la media es determinar la forma de la distribución muestral. Y
se consideran dos casos:
1. La población tiene distribución normal. Cuando la población tiene
distribución normal, la distribución muestral de la media está
distribuida normalmente sea cual sea el tamaño de la muestra.
2. La población no tiene distribución normal. Y cuan no tiene distribución
normal, el teorema del límite central ayuda a determinar la forma de la
distribución muestral de la media.
TEOREMA DE LIMITE CENTRAL
El teorema del límite central es un teorema fundamental de probabilidad y
estadística. El teorema describe la distribución de la media de una muestra
aleatoria proveniente de una población con varianza finita. Cuando el
tamaño de la muestra es lo suficientemente grande, la distribución de las
medias sigue aproximadamente una distribución normal.
El teorema se aplica independientemente de la forma de la distribución de la

población. Muchos procedimientos estadísticos comunes requieren que los
datos sean aproximadamente normales. El teorema de límite central le
permite aplicar estos procedimientos útiles a poblaciones que son
considerablemente no normales.
El tamaño que debe tener la muestra depende de la forma de la distribución

original. Si la distribución de la población es simétrica, un tamaño de muestra
de 5 podría producir una aproximación adecuada. Si la distribución de la
población es considerablemente asimétrica, es necesario un tamaño de
muestra más grande. Por ejemplo, la distribución de la media puede ser
aproximadamente normal si el tamaño de la muestra es mayor que 50.
Las siguientes gráficas muestran ejemplos de cómo la distribución afecta el

tamaño de la muestra que se necesita.
Distribución uniforme
Medias de las muestras
MUESTRAS DE UNA POBLACIÓN UNIFORME
Una población que sigue una distribución uniforme es simétrica, pero

marcadamente no normal, como lo demuestra el primer histograma. Sin
embargo, la distribución de las medias de 1000 muestras de tamaño 5 de
esta población es aproximadamente normal debido al teorema del límite
central, como lo demuestra el segundo histograma. Este histograma de las
medias de las muestras incluye una curva normal superpuesta para ilustrar
esta normalidad.
Distribución exponencial
Medias de las muestras
MUESTRAS DE UNA POBLACIÓN EXPONENCIAL

Una población que sigue una distribución exponencial es asimétrica y no
normal, como lo demuestra el primer histograma. Sin embargo, la
distribución de las medias de 1000 muestras de tamaño 50 de esta población
es aproximadamente normal debido al teorema del límite central, como lo
demuestra el segundo histograma. Este histograma de las medias de las
muestras incluye una curva normal superpuesta para ilustrar esta
normalidad.
ESTIMACION
En inferencia estadística se llama estimación al conjunto de técnicas que

permiten dar un valor aproximado de un parámetro de una población a partir
de los datos proporcionados por una muestra. Por ejemplo, una estimación
de la media de una determinada característica de una población de tamaño N
podría ser la media de esa misma característica para una muestra de tamaño
n.1
La estimación se divide en tres grandes bloques, cada uno de los cuales tiene
distintos métodos que se usan en función de las características y propósitos
del estudio:
 Estimación puntual:2
 Método de los momentos;
 Método de la máxima verosimilitud;
 Método de los mínimos cuadrados;
 Estimación por intervalos.
 Estimación bayesiana.
ESTIMACION PUNTUAL
Estimar puede tener dos significados interesantes. Significa querer e inferir.
Desde luego, el primer significado es más trascendente. Pero no tiene ningún
peso en la estadística, disciplina que no se ocupa de los asuntos del amor. El
segundo significado es el importante aquí. Una estimación estadística es un
proceso mediante el que establecemos qué valor debe tener un parámetro
según deducciones que realizamos a partir de estadísticos. En otras palabras,
estimar es establecer conclusiones sobre características poblacionales a
partir de resultados muestrales. Vamos a ver dos tipos de estimaciones:
puntual y por intervalo. La segunda es la más natural. Y verás que forma
parte habitual de nuestro imaginario como personas sin necesidad de una
formación estadística. La primera, la estimación puntual, es la más sencilla y,
por ese motivo, vamos a comenzar por ella. Ocurre, además, que la
estimación por intervalo surge, poco más o menos, de construir un intervalo
de posibles valores alrededor de la estimación puntual. Una estimación
puntual consiste en establecer un valor concreto (es decir, un punto) para el
parámetro. El valor que escogemos para decir “el parámetro que nos
preocupa vale X” es el que suministra un estadístico concreto. Como ese
estadístico sirve para hacer esa estimación, en lugar de estadístico suele
llamársele estimador. Así, por ejemplo, utilizamos el estadístico “media
aritmética de la muestra” como estimador del parámetro “media aritmética
de la población”. Esto significa: si quieres conocer cuál es el valor de la media
en la población, estimaremos que es exactamente el mismo que en la
muestra que hemos manejado.
ESTIMACION POR INTERVALO
Consiste en la obtención de un intervalo dentro del cual estará el valor del

parámetro estimado con una cierta probabilidad. En la estimación por
intervalos se usan los siguientes conceptos:
 Intervalo de confianza
El intervalo de confianza es una expresión del tipo [θ1, θ2] ó θ1 ≤ θ ≤ θ2,
donde θ es el parámetro a estimar. Este intervalo contiene al
parámetro estimado con un determinado nivel de confianza. Pero a
veces puede cambiar este intervalo cuando la muestra no garantiza un
axioma o un equivalente circunstancial.
 Variabilidad del Parámetro

Si no se conoce, puede obtenerse una aproximación en los datos
aportados por la literatura científica o en un estudio piloto. También
hay métodos para calcular el tamaño de la muestra que prescinden de
este aspecto. Habitualmente se usa como medida de esta variabilidad
la desviación típica poblacional y se denota σ.
 Error de la estimación
Es una medida de su precisión que se corresponde con la amplitud
del intervalo de confianza. Cuanta más precisión se desee en la
estimación de un parámetro, más estrecho deberá ser el intervalo de
confianza y, si se quiere mantener o disminuir el error, más
observaciones deberán incluirse en la muestra estudiada. En caso de
no incluir nuevas observaciones para la muestra, más error se comete
al aumentar la precisión. Se suele llamar E, según la fórmula E = (θ2 -
θ1)/2.
 Límite de Confianza
Es la probabilidad de que el verdadero valor del parámetro estimado
en la población se sitúe en el intervalo de confianza obtenido. El nivel
de confianza se denota por (1-α), aunque habitualmente suele
expresarse con un porcentaje ((1-α)·100%). Es habitual tomar como
nivel de confianza un 95% o un 99%, que se corresponden con valores
α de 0,05 y 0,01 respectivamente.
 Valor α
También llamado nivel de significación. Es la probabilidad (en tanto
por uno) de fallar en nuestra estimación, esto es, la diferencia entre la
certeza (1) y el nivel de confianza (1-α). Por ejemplo, en una
estimación con un nivel de confianza del 95%, el valor α es (100-
95)/100 = 0,05
 Valor crítico
Se representa por Zα/2. Es el valor de la abscisa en una determinada
distribución que deja a su derecha un área igual a α/2, siendo 1-α el
nivel de confianza. Normalmente los valores críticos están tabulados o
pueden calcularse en función de la distribución de la población. Por
ejemplo, para una distribución normal, de media 0 y desviación típica
1, el valor crítico para α = 0,1 se calcularía del siguiente modo: se busca
en la tabla de la distribución ese valor (o el más aproximado), bajo la
columna "Área"; se observa que se corresponde con -1,28. Entonces
Zα/2 = 1,64. Si la media o desviación típica de la distribución normal no
coinciden con las de la tabla, se puede realizar el cambio de variable t
=(X-μ)/σ para su cálculo.
Con estas definiciones, si tras la extracción de una muestra se dice que "3 es
una estimación de la media con un margen de error de 0,6 y un nivel de
confianza del 99%", podemos interpretar que el verdadero valor de la media
se encuentra entre 2,7 y 3,3, con una probabilidad del 99%. Los valores 2,7 y
3,3 se obtienen restando y sumando, respectivamente, la mitad del error,
para obtener el intervalo de confianza según las definiciones dadas.
Para un tamaño fijo de la muestra, los conceptos de error y nivel de confianza
van relacionados. Si admitimos un error mayor, esto es, aumentamos el
tamaño del intervalo de confianza, tenemos también una mayor probabilidad
de éxito en nuestra estimación, es decir, un mayor nivel de confianza.
INTERVALO DE CONFIANZA
El intervalo de confianza está determinado por dos valores dentro de los
cuales afirmamos que está el verdadero parámetro con cierta probabilidad.
Son unos límites o margen de variabilidad que damos al valor estimado, para
poder afirmar, bajo un criterio de probabilidad, que el verdadero valor no los
rebasará. Es una expresión del tipo [θ1, θ2] ó θ1 ≤ θ ≤ θ2, donde θ es el
parámetro a estimar. Este intervalo contiene al parámetro estimado con una
determinada certeza o nivel de confianza. En la estimación por intervalos se
usan los siguientes conceptos: • Variabilidad del parámetro: Si no se conoce,
puede obtenerse una aproximación en los datos o en un estudio piloto.
También hay métodos para calcular el tamaño de la muestra que prescinden
de este aspecto. Habitualmente se usa como medida de esta variabilidad la
desviación típica poblacional y se denota σ. • Error de la estimación: Es una
medida de su precisión que se corresponde con la amplitud del intervalo de
confianza. Cuanta más precisión se desee en la estimación de un parámetro,
más estrecho deberá ser el intervalo de confianza y, por tanto, menor el
error, y más sujetos deberán incluirse en la muestra estudiada. Llamaremos a
esta precisión E, según la fórmula E = θ2 - θ1. • Nivel de confianza: Es la
probabilidad de que el verdadero valor del parámetro estimado en la
población se sitúe en el intervalo de confianza obtenido. El nivel de confianza
se denota por (1-α), aunque habitualmente suele expresarse con un
porcentaje ((1-α)·100%). Es habitual tomar como nivel de confianza un 95% o
un 99%, que se corresponden con valores α de 0,05 y 0,01, respectivamente.
• Valor α: También llamado nivel de significación. Es la probabilidad (en tanto
por uno) de fallar en nuestra estimación, esto es, la diferencia entre la
certeza (1) y el nivel de confianza (1-α). Por ejemplo, en una estimación con
un nivel de confianza del 95%, el valor α es (100-95)/100 = 0,05. • Valor
crítico: Se representa por Zα/2. Es el valor de la abscisa en una determinada
distribución que deja a su derecha un área igual a α/2, siendo 1-α el nivel de
confianza. Normalmente los valores críticos están tabulados o pueden
calcularse en función de la distribución de la población. Por ejemplo, para
una distribución normal, de media 0 y desviación típica 1, el valor crítico para
α = 0,05 se calcularía del siguiente modo: se busca en la tabla de la
distribución ese valor (o el más aproximado), bajo la columna "Área"; se
observa que se corresponde con -0,64. Entonces Zα/2 = 0,64. Si la media o
desviación típica de la distribución normal no coinciden con las de la tabla, se
puede realizar el cambio de variable t=(X-μ)/σ para su cálculo.
Error estándár de lá mediá muestrál.
El error estándar de la media (llamado en inglés "standard error of the mean"
(SEM)) cuantifica4 las oscilaciones de la media muestral (media obtenida en
los datos) alrededor de la media poblacional (verdadero valor de la media). El
EEM o SEM se estima generalmente dividiendo la desviación estándar de la
población entre la raíz cuadrada del tamaño de la muestra (asumiendo
independencia estadística de los valores en la muestra):
Donde
 s es la desviación estándar (es decir, la estimación basada en la
muestra de la desviación estándar de la población).
 n es el tamaño (número de individuos de la muestra)
Esta estimación puede ser comparada con la fórmula de la verdadera

desviación estándar de la media de la muestra:
Donde
 σ es la verdadera desviación estándar de la población.
Esta fórmula puede alcanzarse desde lo que ya conocemos sobre la varianza

de la suma de variables aleatorias independientes
Nota: El error estándar y la desviación estándar de muestras pequeñas

tienden a infravalorar sistemáticamente el error estándar y la desviación
estándar de la población: el error estándar de la media es un parámetro
sesgado del error estándar de la población. Con n=2 la infravaloración puede
ser del 25%, pero para n=6 la infravaloración es sólo del 5%.6
Supuestos y utilización
el error estándar de una muestra estadística (como lo es de la media de la
muestra) es la desviación estándar estimada del error en el proceso que ésta
es generada. En otras palabras, el error estándar es la desviación estándar de
la distribución muestral de la muestra estadística. La notación para el error
estándar (del inglés) puede ser , (por error estándar de "medida"
(measurement) o "media" (mean)), o .
Los errores estándar proporcionan una medida sobra la incertidumbre de las

medidas de la muestra en un único valor que es usado a menudo porque:
 Si el error estándar de varias cantidades individuales es conocido

entonces el error estándar de alguna función matemática de esas
cantidades puede ser fácilmente calculado en muchos casos:
 Donde la distribución de probabilidad del valor es conocida, ésta

puede ser usada para calcular una buena aproximación de un intervalo
de confianza exacto.
 Donde la distribución de probabilidad es desconocida, relaciones como

la Desigualdad de Chebyshov o la desigualdad de Vysochanskiï–
Petunin pueden ser usadas para calcular unos intervalos de confianza
conservativos.
 Como el tamaño de la muestra tiende a infinito, el teorema del límite

central garantiza que la distribución de la media muestral es
asintóticamente la distribución normal.
Error estándar de la regresión
El error estándar de la regresión es el valor que muestra la diferencia entre
los valores reales y los estimados de una regresión. Es utilizado para valorar si
existe una correlación entre la regresión y los valores medidos. Muchos
autores prefieren este dato a otros como el coeficiente de correlación lineal,
ya que el error estándar se mide en las mismas unidades que los valores que
se estudian. La fórmula7 sería:
Siendo:
 los valores estimados
 los valores medidos
 el tamaño de la muestra
CONCLUSIONES
El muestreo Estadístico resulta beneficioso para implementarlo en la
realización de un estudio, debido a que mediante este se pueden obtener
probabilidades bajas o altas a través de determinados beneficios que estas
técnicas ofrecen. En los diferentes tipos de muestreo existen no
probabilística en los cuales se deben establecer diferencia en el momento de
realizar nuestras investigaciones por tanto que en el no probabilística no toda
la población forma parte de la muestra y en el probabilística todos los
individuos tienen probabilidad positiva de formar parte de la muestra.
El muestreo es sencillamente el procedimiento que se emplea a extraer una

pequilla parte de una población dentro de un universo a esta se le llama
espacio muestral dentro de un universo.
BIBLIOGRAFIA
• http://frecuenciaestadistica.blogspot.mx/2009/04/muestreo.html
• http://estadisticavigrado.blogspot.mx/2011/04/teorema-del-limite-
central.html
• https://explorable.com/es/distribucion-de-muestreo
• https://es.scribd.com/search?content_type=documents&page=1&que
ry=%EF%83%98Distribuci%C3%B3n%20muestral%20de%20medias.
• https://es.scribd.com/doc/277667877/Probabilidad-y-Estadistica-
Unidad-IV

Muestreo e Estimacion

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Muestreo e Estimacion

Enviado por

Direitos autorais:

Formatos disponíveis

INTRODUCCION

Se denomina muestreo al proceso por el que generamos las muestras. Una

• Muestreo aleatorio simple:

• Muestreo aleatorio sistemático:

• Muestreo aleatorio estratificado:

Ventajas e inconvenientes de los distintos tipos de muestreo probabilístico.

CARACTERISTICAS VENTAJAS INCONVENIENTES

Aleatorio Se selecciona una  Sencillo y de Requiere que se

¿POR QUÉ SUCEDE ESTE ERROR?

El error del proceso de muestreo ocurre cuando los investigadores toman

La causa más frecuente de dicho error es un procedimiento de muestreo

Otra causa posible de este error es la casualidad. Se lleva a cabo el proceso

El resultado más común de error de muestreo es el error sistemático en

Dados dos estudios exactamente iguales, dos métodos de muestreo iguales y

DESVIACIÓN ESTÁNDAR Y ERROR DE MUESTREO

La desviación estándar se utiliza para expresar la variabilidad de la población.

Se entiende más fácilmente si relacionas la desviación estándar con el

En la mayoría de los casos esto no es posible. Por consiguiente, lo que el

Consideremos todas las posibles muestras de tamaño n en una población.

Las muestras aleatorias obtenidas de una población son, por naturaleza

Hay dos tipos de distribuciones muestrales: la distribución muestral de

La distribución muestral de medias como otras distribuciones de probabilidad

VALOR ESPERADO DE LA MEDIA MUESTRAL

E ( ) = valor esperado de la media muestral ( )

Desviación estándar de la media muestral.

DESVIACIÓN ESTÁNDAR DE LA MEDIA MUESTRAL.

Al observar las dos fórmulas se puede notar que en la de población finita el

Forma de la distribución muestral.

El teorema se aplica independientemente de la forma de la distribución de la

El tamaño que debe tener la muestra depende de la forma de la distribución

Las siguientes gráficas muestran ejemplos de cómo la distribución afecta el

MUESTRAS DE UNA POBLACIÓN UNIFORME

Una población que sigue una distribución uniforme es simétrica, pero

MUESTRAS DE UNA POBLACIÓN EXPONENCIAL

En inferencia estadística se llama estimación al conjunto de técnicas que

Consiste en la obtención de un intervalo dentro del cual estará el valor del

 Variabilidad del Parámetro

Esta estimación puede ser comparada con la fórmula de la verdadera

Esta fórmula puede alcanzarse desde lo que ya conocemos sobre la varianza

Nota: El error estándar y la desviación estándar de muestras pequeñas

estándar (del inglés) puede ser , (por error estándar de "medida"

(measurement) o "media" (mean)), o .

Los errores estándar proporcionan una medida sobra la incertidumbre de las

 Si el error estándar de varias cantidades individuales es conocido

 Donde la distribución de probabilidad del valor es conocida, ésta

 Donde la distribución de probabilidad es desconocida, relaciones como

 Como el tamaño de la muestra tiende a infinito, el teorema del límite

 los valores estimados

 los valores medidos

El muestreo es sencillamente el procedimiento que se emplea a extraer una

Você também pode gostar