Escolar Documentos
Profissional Documentos
Cultura Documentos
Estadístico: variable aleatoria que sólo depende de la muestra aleatoria elegida para calcularla.
Estimación: Proceso por el que se trata de averiguar un parámetro de la población representado, en
general, por q a partir del valor de un estadístico llamado estimador y representado por
El problema se resuelve en base al conocimiento de la "distribución muestral" del estadístico que se
use.
¿Qué es esto? Concretemos, p.e. en la media (m). Si para cada muestra posible calculamos la media
muestral ( ) obtenemos un valor distinto ( es un estadístico: es una variable aleatoria y sólo
depende de la muestra), habrá por tanto una fpd para , llamada distribución muestral de medias. La
desviación típica de esta distribución se denomina error típico de la media. Evidentemente, habrá una
distribución muestral para cada estadístico, no sólo para la media, y en consecuencia un error típico
para cada estadístico.
Si la distribución muestral de un estadístico estuviera relacionada con algún parámetro de interés, ese
estadístico podría ser un estimador del parámetro.
Si tenemos una muestra aleatoria de una población N(m,s ), se sabe (Teorema del límite central) que
la fdp de la media muestral es también normal con media m y varianza s2/n. Esto es exacto para
poblaciones normales y aproximado (buena aproximación con n>30) para poblaciones cualesquiera. Es
Recuérdese que la probabilidad de que m esté en este intervalo es 1 - a. A un intervalo de este tipo se le
denomina intervalo de confianza con unnivel de confianza del 100(1 - a)%, o nivel de significación de
100a%. El nivel de confianza habitual es el 95%, en cuyo caso a=0,05 y za /2=1,96. Al valor se le
Ejemplo: Si de una población normal con varianza 4 se extrae una muestra aleatoria de tamaño 20 en la
que se calcula se puede decir que m tiene una probabilidad de 0,95 de estar comprendida en
el intervalo
En general esto es poco útil, en los casos en que no se conoce m tampoco suele conocerse s2; en el caso
más realista de s2 desconocida los intervalos de confianza se construyen con la t de
Student (otra fdpcontinua para la que hay tablas) en lugar de la z.
Estimación de proporciones
Sea X una variable binomial de parámetros n y p (una variable binomial es el número
de éxitos en n ensayos; en cada ensayo la probabilidad de éxito (p) es la misma, por ejemplo: número de
diabéticos en 2000 personas).
Si n es grande y p no está próximo a 0 ó 1 (np ³ 5) X es aproximadamente normal con media np y
varianza npq (siendo q = 1 -p) y se puede usar el estadístico (proporción muestral), que es
Obsérvese que para construirlo, ¡se necesita conocer p!. Si n es grande (>30) se pueden
substituir p y q por sus estimadores sin mucho error, en cualquier caso como pq £ 0,25 si se
substituye pq por 0,25 se obtiene un intervalo más conservador (más grande).
¿Qué significa este intervalo? La verdadera proporción de curaciones está comprendida entre,
aproximadamente, 72% y 88% con un 95% de probabilidad.
¿Es suficientemente preciso? Habrá que juzgarlo con criterios clínicos.