Você está na página 1de 22

Estimación por punto y por intervalo

Estimación puntual

500 mg

490 mg 510 mg

Intervalo de confianza

MSc. Mirna Lorena Sorto Álvarez


3.5. Estimación por punto y por intervalo.

Parámetros: Son datos que resumen el


estudio realizado en la población como
por ejemplo la media y la desviación que
se denotan por  y 
Estadísticos: son datos calculados a partir
de una muestra por ejemplo x y s

Si un estadístico se utiliza para aproximar


un parámetro se suele llamar estimador.
Población, Muestra, Parámetros y Estadísticos
Estimación: puntual y por intervalos
Como ya hemos visto, a partir de los estadísticos que hemos
obtenido en la/s muestra/s queremos obtener una idea de
los valores de los parámetros en la población.
Se trata de emplear los estadísticos para estimar los
parámetros.
Veremos DOS tipos de estimadores:
1) Estimación puntual. Aquí obtendremos un punto, un
valor, como estimación del parámetro.
2) Estimación por intervalos. Aquí obtendremos un
intervalo dentro del cual estimamos (bajo cierta
probabilidad) estará el parámetro.
Estimación puntual de parámetros
Un estimador puntual es simplemente un estadístico (media
aritmética, varianza, etc.) que se emplea para estimar
parámetros (media poblacional, varianza poblacional, etc.).
Es decir, cuando obtenemos una media aritmética a partir
de una muestra, tal valor puede ser empleado como un
estimador para el valor de la media poblacional.
(Algunos autores comparan los estimadores con los
lanzamientos de dardos, el círculo central sería el valor real
del parámetro.)
Propiedades deseables en los estimadores
1. Ausencia de sesgo. Su media o valor esperado
coincide con el parámetro de la población
2. Consistencia. A medida que crece el tamaño de la
muestra las estimaciones que nos proporciona el
estimador se aproxima cada vez más al valor del
parámetro.
3. Eficiencia. El estimador puntual con menor error
estándar tiene mayor eficiencia relativa que otros.
4. Suficiencia. No depende del parámetro a estudiar.
La media de una muestra representativa de la población es
un estimador de la media poblacional porque cumple las
propiedades anteriores.
Intervalos de confianza para los
principales parámetros
El caso de la media
En este caso, en lugar de indicar simplemente un único valor como
estimación del parámetro, lo que haremos es ofrecer un intervalo de
valores que sea asumible con cierta probabilidad por el parámetro que
queremos estimar.
-Intervalo de confianza: Es el intervalo de las estimaciones (probables)
sobre el parámetro.

-Límites de los intervalos de confianza: Son los dos valores extremos


del intervalo de confianza
Intervalos de confianza para los principales
parámetros: El caso de la media

Ahora bien, ¿cuán grande habrá de ser el intervalo de confianza?


Evidentemente, si decimos que el intervalo de confianza va de
menos infinito a más infinito, seguro que acertamos...pero eso no
es muy útil.

La idea es crear unos intervalos de confianza de manera que


sepamos en qué porcentaje de casos el parámetro estará dentro
del intervalo crítico.
¿Y cómo fijamos tal porcentaje de casos? Usualmente se asume
un porcentaje del 95%. Al calcular un intervalo de confianza sobre
la media al 95% ello quiere decir que el 95% de las veces que
repitamos el proceso de muestreo (y calculemos la media
muestral), la media poblacional estará dentro de tal intervalo.
Intervalos de confianza para los principales
parámetros: El caso de la media

Nivel de confianza 1-  =0.95

Nivel de significancia  = 0.05


Nivel de confianza

Pero, ¿cómo calculamos estos


dos límites?

Z 0.00 0.01 0.020 0.030 0.04 0.050 0.060


1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750

En una distribución normal tipificada, es muy fácil saber qué puntuación


típica (z) deja a la izquierda el 2.5% de los datos (yendo a las tablas es
-1.96) y cuál deja a la izquierda el 97.5% de los datos (o a la derecha
el 2.5% de los datos: 1.96).
Ahora habrá que pasar esos datos a puntuaciones directas....
Intervalos de confianza para los principales
parámetros: El caso de la media

Pero, ¿cómo calculamos estos dos límites?

Vamos a ver DOS casos.


Primero, veremos el caso de que sepamos la varianza poblacional.
Segundo, veremos el caso de que NO sepamos la varianza poblacional
Intervalos de confianza para los principales
parámetros: El caso de la media
Conocemos 2

Nuestra distribución es normal, pero con cierta media y cierta desviación típica, las
cuales sabemos por el tema anterior:
1) La media de la distribución muestral de medias es la media poblacional 
2) La varianza de la distribución muestral de medias es 2/n
O lo que es lo mismo, la desviación típica de la dist.muestral de medias es 
n
Intervalos de confianza para los principales
parámetros: El caso de la media
Conocemos 2

Recordando

x
Z 

n
 
 x   
p  Z0.025   Z0.025   0.95
  
 
 n 
 
x  z0.025    x  z0.025
n n
Z 0.00 0.01 0.020 0.030 0.04 0.050 0.060
1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750
 
x  1.96    x  1.96
n n
¿Qué quiere decir la expresión siguiente?
 
 x   
p  Z0.025   Z0.025   0.95
  
 
 n 

 
p ( x  z0.025    x  z0.025 )  0.95
n n
Quiere decir que cada vez que extraigamos una
muestra y hallemos la media, el parámetro
desconocido  estará entre los límites de dicho
intervalo el 95% de las veces. (O el 99% si
hubiéramos elegido un intervalo al 99%, etc.)
Intervalos de confianza para los principales
parámetros: El caso de la media

Conocemos 2

En general

 
 x   
p  Z    Z   1  
  
 2 2
 n  
IC : x  Z IC: Intervalo de confianza
n
2
 
x  Z    x  Z
n n
2 2
Intervalos de confianza para la media: CASO DE
DESCONOCER LA VARIANZA POBLACIONAL

Para la media (cuando conocemos la varianza poblacional o el tamaño de


muestra es mayor que 30), tenemos la expresión
 
x  Z    x  Z
n n
2 2
Pero si no conocemos la varianza poblacional (el caso realista) y el tamaño
de muestra es pequeño menor o igual que 30 tenemos la expresión:
s s
x  t    x  t
n n
2 2
No es una distribución normal, sino una distribución t de Student con n-1
grados de libertad.

En todo caso, recordar que si "n" es grande, la distribución t de Student será


virtualmente una distribución normal N(0,1). En otras palabras, si "n" es grande,
ambas fórmulas dan unos intervalos virtualmente iguales, y emplear la distribución
normal es correcto.
Relación entre el tamaño de muestra y la
amplitud del intervalo de confianza
Para el caso de la media y varianza conocida
 
p ( x  1.96    x  1.96 )  0.95
n n

Es claro que a medida que el tamaño de muestra aumenta, la amplitud del


intervalo disminuye. (Evidentemente, esto es general, no sólo para la media.)
Veamos, en todo caso un ejemplo:
Caso A1. Media muestral=10, varianza poblacional=4, tamaño muestral=12
2 2
p(10  1.96    10  1.96 )  p(8.87    11.13)  0.95
12 12

Caso A2. Media muestral=10, varianza poblacional=4, tamaño muestral=20

2 2
p(10  1.96    10  1.96 )  p( 9.12    10.88)  0.95
20 20
• VALORES DE Z SEGÚN INTERVALOS DE CONFIANZA.

Z 0.00 0.01 0.020 0.030 0.04 0.050


1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505

Z 0.00 0.01 0.020 0.030 0.04 0.050 0.060 0.070 0.080


2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951
Relación entre la amplitud del intervalo de
confianza y el nivel de confianza
El caso "usual" (por defecto) es emplear intervalos al 95%.

 
p ( x  1.96    x  1.96 )  0.95
n n
Pero evidentemente es posible emplear intervalos a, digamos, el 99%. En tal
caso, tendremos más seguridad de que el parámetro de interés se halle en los
límites del intervalo. El problema es que incrementar tal índice aumenta así
mismo la amplitud del intervalo.
Caso A1. Media muestral=10, varianza poblacional.=4, tamaño muestral=12.
Intervalo al 95%
2 2
p(10  1.96    10  1.96 )  p(8.87    11.13)  0.95
12 12
Caso A2. Media muestral=10, varianza poblacional=4, tamaño muestral=12.
Intervalo al 99%
2 2
p(10  2.575    10  2.575 )  p(8.51    11.47 )  0.99
12 12
Intervalos de confianza para los principales
parámetros: El caso de la media

NO Conocemos 2

En general

 
 x   
p  t    t   1  
 s 
 2 2
 n  s
IC : x  t  IC: Intervalo de confianza
n
2
s s
x  t    x  t
n n
2 2
• Ejemplo.
• Una máquina llena tazas con helado, y se supone que está
ajustada para verter la cantidad de 250 g. Como la máquina no
puede llenar cada taza con exactamente 250 g, el contenido que
se añade a cada taza individual presenta cierta variación y se le
asigna una variable aleatoria X. Se asume que esta variación se
ajusta a una distribución normal de alrededor de la cantidad
promedio deseada de 250 g, con una desviación estándar de
2.5 g. Para determinar si la máquina está adecuadamente
calibrada, se toma una muestra aleatoria de n = 25 tazas de
helado para pesarlas dando como resultado x  250.2
 
p ( x  1.96    x  1.96 )  0.95
n n
2.5 2.5
250 .2  1.96    250 .2  1.96
25 25
249 .2    251 .1
Conclusión: Como el valor deseado se encuentra en el IC, la máquina está
calibrada
Ejemplo
• El contenido de siete contenedores similares de ácido
sulfúrico son 9.8, 10.2, 10.4, 9.8, 10.0, 10.2, y 9.6
litros. Encuentre un intervalo de confianza del 95%
para la media de todos los contenedores si se supone
una distribución aproximadamente normal.
0.005 0.01 0.025 0.05 0.1
x  10, s  0.283 gl 0.01 0.02 0.05 0.1 0.2
6 3.707 3.143 2.447 1.943 1.440
s s
x  t    x  t
n n
2 2
0.283 0.283
10  2.447    10  2.447
7 7
9.74    10.26
Si el muestreo se realiza repetidamente, el 95% de las veces el contenido
promedio de los contenedores está en dicho intervalo.
• Estudie la aplicación de los
intervalos de confianza en validación
de métodos analíticos

Você também pode gostar