Você está na página 1de 13

Estimacin Estadstica MAT 006 Probabilidad y Estadstica

Estimacin Estadstica

Profesor Gerardo Garca Aguirre

Introduccin

En la Estadstica Inferencial el objetivo es lograr generalizar los resultados obtenidos de una
muestra aleatoria (m.a) a la poblacin de la cual fue seleccionada dicha muestra. De esta
manera, la estimacin estadstica est constituida por mtodos que permiten aproximar u
obtener caractersticas desconocidas (parmetros) de una poblacin. En este sentido,
hablamos de mtodos de estimacin (puntual o por intervalos) y del mtodo de pruebas de
hiptesis.
Una estimacin es una aproximacin a un parmetro y se obtiene por medio de una m.a.
Como los estimadores son variables aleatorias (cambian de muestra a muestra) interesa
conocer sus distribuciones muestrales y diversas propiedades que permitan decidir si una
estimacin puntual es la ms adecuada para aproximar el valor del parmetro poblacional
de inters.


Inferencia estadstica: es el proceso de sacar
conclusiones de la poblacin basados en la
informacin de una muestra de esa poblacin.

ESTADSTICOS, ESTIMADORES Y PARMETROS

Estadstico

Se le llama estadstico (o estimacin) a cualquier cantidad cuyo valor se pueda a partir de


datos muestrales, es una medida de resumen numrica y su valor se conoce en la muestra
pero vara de muestra a muestra.

Son variables aleatorias


Son medidas tomadas en una muestra.

_________________________________________________________________________
1
Estimacin Estadstica MAT 006 Probabilidad y Estadstica

n
Por ejemplo se tienen, el promedio, variancia, propocin, suma X , s 2 , p, X i
i =1

Estimadores

Corresponden a cualquier funcin de los valores de la muestra que permiten aproximan o


estiman los parmetros, todo estimador es un estadstico, pero no todo estadstico es un
estimador.
Ej. , ,

Parmetro

Es una medida de resumen numrica que se calculara usando todas las unidades de la
poblacin.
Es un nmero fijo.
Generalmente no lo conocemos.
n

Ejemplos de medidas de la poblacin X , s , p, X


2

i =1
i


Figura 1. Relacin entre la poblacin y las muestras


Hay dos tipos de estimadores que se utilizan: estimador puntual y estimador por intervalo.


_________________________________________________________________________
2
Estimacin Estadstica MAT 006 Probabilidad y Estadstica

Estimadores puntuales

Un estimador puntual es un nico punto o valor, el cual se considera va a estimar a un
n

parmetro. Por ejemplo el promedio X, s , p, X es un estimador de la media poblacional


2
n
i
i=1 X , s 2 , p, X i
i=1

Usualmente lo obtenemos al seleccionar un estimador (estadstico) y calcular su valor a


partir de la informacin de una m.a dada.

Algunas estimaciones que se realizan frecuentemente en la prctica son:

La estimacin de la media poblacional X, s , p, X 2


n

i=1
i

La estimacin de la proporcin poblacional


La estimacin de la varianza poblacional S2
La estimacin de la diferencias de dos medias
La estimacin de las diferencias de dos proporciones

Los estimadores que se utilizan para estos fines son:


: estimador de la media poblacional .


: estimador de la proporcin poblacional p .
S2: estimador de la varianza poblacional 2.
: estimador de la diferencia de dos proporciones
: estimador de la diferencia de medias

Propiedades de los estimadores puntuales

Usualmente buscamos que los mejores estimadores sean:


Insesgado; es decir E() =
Eficiente, (estimador insesgado de varianza mnima).
Consistente, (para n suficientemente grande, el error producido ser menor que
cualquier constante pequea positiva preasignada).
Suficiente, ( es suficiente si utiliza toda la informacin en una muestra relevante
para la estimacin de ).

Una de las caractersticas ms deseables de los estimadores constituye que sea eficiente
pues esto garantiza que se establezca una precisin asociada con el tamao de la muestra
y la variabilidad de la misma.


_________________________________________________________________________
3
Estimacin Estadstica MAT 006 Probabilidad y Estadstica

Estimacin de parmetros

Corresponde al procedimiento utilizado para conocer las caractersticas de un parmetro


poblacional, a partir del conocimiento de la muestra aleatoria, de tamao n,y en el cual
podemos efectuar una estimacin de un valor de un parmetro de la poblacin; pero
tambin necesitamos precisar un:

Un estimador por intervalo (generalmente se llama intervalo de confianza), es el intervalo


que con un cierto nivel de confianza (1-alfa), el cual es fijado por el investigador y acorde al
objeto de estudio; contiene al parmetro que se est estimando. Se construye sobre el
concepto de un estimador puntual.

El nivel de confianza es la probabilidad de que el parmetro a estimar se encuentre en el


intervalo de confianza y estar ligado al inters del investigador sin embargo comnmente
se tiende a utilizar: 99, 95 y 90%

El error de estimacin admisible, est relacionado con el radio del intervalo de confianza.

DISTRIBUCIN MUESTRAL

Otro aspecto a tomar en cuenta dentro del tamao de una muestra, es el tipo de
distribucin al cual pertenece (respecto a caractersticas peculiares de la muestra). La
construccin de un determinado intervalo de confianza depende en gran medida de la
distribucin a la que pertenezca; tericamente se alude al tamao de la muestra de donde
es habitual que este se pueda distribuir de manera normal (por el teorema del lmite
central) o t de Student.


Imagen 2. Distribucin de una muestra

_________________________________________________________________________
4
Estimacin Estadstica MAT 006 Probabilidad y Estadstica

La estimacin debe estar entonces relacionada con una distribucin de probabilidad de


modo que se cumpla con lo siguiente:

P[1 2] = 1

De donde

P : es la funcin de distribucin

4/6 : Corresponden a los limites de confianza

1 : nivel de confianza asociado y es la significancia estadstica

As, se puede construir un intervalo [1, 2]


ESTIMACIN POR INTERVALO PARA MEDIAS Y PROPORCIONES

Ahora vamos a construir los intervalos que permitan tener un valor que contenga al
parmetro poblacional, debemos tener presente que la seleccin debe realizarse de
manera aleatoria y bajo los principios estadsticos pertinentes.

Intervalo de confianza para la media de una poblacin

De una poblacin de media y desviacin tpica (conocida o desconocida) se pueden


tomar muestras de tamao n elementos, donde cada una de stas muestras viene dada por
una media muestral . De modo tal que la media proveniente de todas las medias
mustrales coincide con la media poblacional .

1. Cuando se tiene un tamao grande de la muestra y hace que


@
se distribuya como una Normal N( , ); de donde se deduce por medio de una
A
estandarizacin que esta normal se distribuye a su vez como una N(0,1).

De este modo se puede calcular entonces un intervalo dados valores de Z que dependan
de un nivel Z / 2

As tenemos:

_________________________________________________________________________
5
Estimacin Estadstica MAT 006 Probabilidad y Estadstica

BCD
P[Z / 2 Z / 2]= 1
EF
G

De donde se puede despejar el valor de de modo que nos queda lo siguiente:

Resultando el intervalo de confianza:


X ZJ/6 ; X + ZJ/6
n n
2. Este razonamiento ser anlogo cuando se tienen poblaciones finitas solamente que la
PCQ
desviacin contendr una correccin por finitud, es decir f = y donde la distribucin
PCR
PCQ S
estara dada por N( , ), al estandarizar volvemos al caso N(0,1) y donde el
PCR Q
intervalo de confianza estar dado por:

Nn Nn
X ZJ/6 ; X + ZJ/6
N1 n N1 n

3. Sin embargo tenemos casos el tamao de muestra es pequeo (n<30) ,donde la desviacin
es desconocida (en la prctica utilizaremos la desviacin estndar s en vez de ) y los
datos provienen de una distribucin normal, para estos casos utilizamos la distribucin de
probabilidad t de student1 en vez de una normal estndar de modo que tenemos un
intervalo:

s s
X tJ QCRWX
; X + t J(QCRWX)
6 n 6 n

1
La distribucin de Student fue descrita en 1908 por William Sealy Gosset. Gosset trabajaba en una fbrica de
cerveza, Guinness, que prohiba a sus empleados la publicacin de artculos cientficos debido a una difusin previa de
secretos industriales. De ah que Gosset publicase sus resultados bajo el seudnimo de Student.

_________________________________________________________________________
6
Estimacin Estadstica MAT 006 Probabilidad y Estadstica

Ntese que de los casos anteriores siempre a la media se le suma o resta un coeficiente este
se denomina Error Mximo de Estimacin E el cual se define de la siguiente manera:

Poblacin infinita
= /

Poblacin infinita
Nn
E = ZJ/6
N1 n
Poblacin finita y pequea pero E = t a QCRWX
b

distribuida normalmente F Q
Cuanto mayor sea el tamao de la muestra, n, menor es el error y cuanto mayor sea el nivel de
confianza, 1-, mayor es el error

Ntese que podemos adems encontrar el tamao de una muestra al despejar en la


ecuacin n, cuando se tienen medias y variancias.

Ejemplos

Ejemplo1. El tiempo que tardan las cajeras de un supermercado en cobrar a los clientes
sigue una ley normal con media desconocida y desviacin tpica 0,5 minutos. Para una
muestra aleatoria de 25 clientes se obtuvo un tiempo medio de 5,2 minutos.

Calcular el intervalo de confianza al nivel del 95% para el tiempo medio que se tarda en
cobrar a los clientes.

Solucin

_________________________________________________________________________
7
Estimacin Estadstica MAT 006 Probabilidad y Estadstica

Sabemos que 1 = 0,95, tomando en cuenta que la distribucin normal es simtrica


tendramos que /2=0,025 y al buscar el valor en cualquiera de las colas se tiene Z /2
=1,96.

Luego de la defincin se tiene que:


As al sustitur obtenemos

Cmo interpretamos este resultado?

Ejemplo 2. Para este mismo ejemplo calcule el tamao muestral necesario para estimar
dicho tiempo medio con un el error de 0,5 minutos y un nivel de confianza del 95%.
Ejemplo 3. Calcule lo mismo de los ejemplos anteriores, pero con una confianza del 99%.
Ejemplo 4. La puntuacin media de una muestra de 20 jueces de gimnasia rtmica, elegidos
al azar, para una misma prueba, present una media de 9,8525 y una cuasi desviacin tpica
muestral de 0,0965. Calcular un intervalo de confianza con un 95% para la nota media.
(Suponemos que la variable que mide la puntuacin sigue una distribucin normal.)

Ejemplo 5. Una mquina produce piezas metlicas de forma cilndrica. Se toma una muestra
de piezas cuyos dimetros son: 1,01 0,97 1,03 1,04 0,99 0,98 0,99 1,01 1,03. Encuentre un
intervalo de confianza del 99% para el dimetro promedio de piezas de esta mquina si se
supone una distribucin aproximadamente normal.

_________________________________________________________________________
8
Estimacin Estadstica MAT 006 Probabilidad y Estadstica

Ejemplo 6. Deseamos valorar el grado de conocimientos en Historia de una poblacin de


varios miles de alumnos. Sabemos, por estudios anteriores, que la desviacin tpica
poblacional es =2,3. Nos proponemos estimar pasando una prueba a 100 alumnos. La
media de esta muestra de 100 alumnos ha resultado ser x =6,32.

Solucin

Halle el intervalo de confianza de con un nivel de confianza del 95%.

6,32 L X 6,32 + L
P(6,32 L X 6,32 + L) = 0,95 P( ) = 0,95
0, 23 0, 23 0, 23
L L L L
P( Z ) = 0,95 (donde Z N (0,1)) P( Z ) = 0,975 = 1,96 (ver tabla)
0, 23 0, 23 0, 23 0, 23
L = 1,96 0, 23 = 0, 45 , con lo que el int ervalo de confianza para , al 95%, y segn esta muestra,
es [6,32 0, 45;6,32 + 0, 45] = [5,87;6,77]

Esto quiere decir, que aunque no sabemos el valor de , podemos asegurar que estar
entre 5,87 y 6,77 con una probabilidad del 95%.

Intervalo de confianza para una proporcin

Si en una poblacin, una determinada caracterstica se presenta en una proporcin p, la


proporcin p , de individuos con dicha caracterstica en las muestras de tamao n, se
de
distribuirn segn N(p, ), con un razonamiento anlogo al caso anterior podramos
Q
obtener un intervalo de confianza para estimar una proporcin a partir de una proporcin
muestral conocida p y con un tamao muestral n ms un nivel de confianza (1-)100%,
para los casos cuando:
La poblacin es infinita

p0 q0 p0 q0
p0 ZJ/6 ; p0 + ZJ/6
n n

La poblacin es finita
_________________________________________________________________________
9
Estimacin Estadstica MAT 006 Probabilidad y Estadstica

Nn p0 q0 Nn p0 q0
p0 ZJ/6 ; p0 + ZJ/6
N1 n N1 n

Adicionalmente se puede ver que el error mximo de estimacin coreponder

pi q i
Poblacin infinita E = ZJ/6 *
n
N n pi q i
Poblacin infinita E = ZJ/6 * *
N1 n

Adems se puede calcular un tamao de muestra despejando del caso anterior a n

Por ejemplo

En una fbrica de componentes electrnicos, la proporcin de componentes finales


defectuosos era del 20%. Tras una serie de operaciones e inversiones destinadas a mejorar
el rendimiento se analiz una muestra aleatoria de 500 componentes, encontrndose que
90 de ellos eran defectuosos. Qu nivel de confianza debe adoptarse para aceptar que el
rendimiento no ha sufrido variaciones?

p = 0.2 q =0.8 p'= 90/ 500 = 0.18

E = 0.2 - 0.18 = 0.02

_________________________________________________________________________
10
Estimacin Estadstica MAT 006 Probabilidad y Estadstica


P (1 - z/2 <1.12) = 0.86861 - 0.8686 = 0.1314

0.8686 - 0.1314 = 0.737



EJERCICIOS
1. Los siguientes son datos de conductividad trmica de cierto tipo de hierro (en BTU/hr-ft-
F):

41,60 41,48 42,34 41,95 41,86 42,18 41,72 42,26 41,81 42,04

Hallar un intervalo de confianza del 95 % y uno del 99% para la media.

1. De 1000 casos de cncer pulmonar seleccionados al azar, 823 son de pacientes que
fallecieron. Construya un intervalo de confianza del 95% para la tasa de mortalidad del
cncer pulmonar

2. En un estudio de prevalencia de factores de riesgo en una cohorte de 412 mujeres


mayores de 15 aos en la Regin Metropolitana, se encontr que el 17.6% eran hipertensas.
Un intervalo de 99% , 95% , 90%, 80% a que conclusiones se puede llegar con cada uno de
los intervalos

3. Se pregunt a 80 pacientes si haban sufrido algn trastorno tras seguir un tratamiento,


de los cuales 60 dijeron que no. La muestra es grande y no esperamos que el porcentaje real
en caso de haber sido extendido a muchos ms pacientes sea muy diferente.

4. En un trabajo de Quetelet se estudia la distribucin del permetro torcico medido en
pulgadas de militares escoceses de principios del siglo XIX. Los resultados se muestran en la
grfica, y aparentan una distribucin normal. La media es 39.8 y la desviacin tpica 2.05; El
tamao de la muestra es de 5738 individuos, por tanto el error estndar es:
E.E = 2.05 / 5738 = 0.027 Podemos decir que el permetro torcico medio es de 39.8
_________________________________________________________________________
11
Estimacin Estadstica MAT 006 Probabilidad y Estadstica

pulgadas con un margen de error de 2. EE = 0.054 pulgadas, la confianza es del 95 %.



5. El tiempo, en minutos, que esperan los clientes de un determinado banco hasta que son
atendidos sigue distribucin normal de medida desconocida y desviacin tpica igual a 3. Los
tiempos que esperaron diez clientes elegidos al azar fueron los siguientes: 15, 2, 25, 3, 1, 5,
55, 45, 33. Determinar un intervalo de confianza de coeficiente de confianza 095, para el
tiempo medio de espera.

6. La duracin de un determinado proceso industrial es una variable aleatoria con
distribucin desconocida. Examinado dicho proceso industrial en 200 ocasiones elegidas al
azar, se observ una duracin media maestral de = 125 hrs. determinar un intervalo de
confianza 095 , para la duracin media del proceso industrial en cuestin.

7. En cierta poblacin se seleccion aleatoriamente una muestra de 300 personas a las que
se les someti a cierto test cultural. De ellas, 225 resultaron aprobadas. Teniendo en cuenta
esta informacin, estimar el porcentaje de persona de esa poblacin que resultaran
aprobada si se las sometiera a dicho test cultural. Obtener, con un nivel de confianza del
95%, un intervalo de confianza para la proporcin.

8. Estimar, con un nivel de confianza del 99%, la proporcin de pintura abstracta que hay
en un museo, si en una determinada muestra de 100 cuadros, 41 son abstractos. Escribe la
frmula del error mximo cometido vlida para tamaos de la muestra menores o iguales
de 100 y mayores de 30.

ESTIMACIN POR INTERVALO PARA DIFERENCIAS DE MEDIAS Y PROPORCIONES

Existen casos donde se necesita hacer comparaciones con poblaciones con caractersticas
semejantes, y con tamaos similares por ejemplo tenemos el rendimiento acadmico de dos
centros educativos, la cantidad de contaminantes que tienen dos sustancias en la atmsfera.
O bien la eficiencia de un nuevo medicamente para la depresin u ansiedad. En comparacin
con el oficial.

Esto nos lleva a realizar comparaciones de diferencias donde se busca que los parmetros
realmente no sean grandes es decir sus diferencias prcticamente tiendan a cero; dicho sea
de paso el factor crucial constituye que por efectos del tipo poblacin a tratar, los costos
dentro de una investigacin hace que se utilicen intervalos de confianza que permitan estimar
donde realmente se encuentra el parmetro poblacional.

Si se desea realizar una diferencia de medias (R 6 ) De donde con una confianza de (1-
)% el valor poblacional estara los siguientes lmites de confianza:

R6 66 R6 66
XR 6 zk + ; XR 6 + zk/6 +
6 R 6 R 6
_________________________________________________________________________
12
Estimacin Estadstica MAT 006 Probabilidad y Estadstica

Ntese que para ello requerimos del valor conocido de R6 y 66 en casos donde se desconoce
el valor de estas varianzas se puede utilizar sR6 y s66 siempre que nR + n6 2 > 30

En casos donde se hace una diferencia de proporciones (pR p6 ) que sean grandes, con una
confianza del (1-)% el valor poblacional se estima para que se encuentre entre los siguientes
limites de confianza:

R R 6 6 R R 6 6
pR p6 zk/6 + ; pR p6 + zk/6 +
R 6 R 6

Veamos los siguientes ejemplos relativos a este tipo de diferencias

El departamento de salud ha encontrado una nueva sustancia que permite reducir los efectos
de fatiga que sufren algunas personas que utilizan medicamentos antidepresivos, para ello
hace un estudio de dos grupos de pacientes donde seleccionan del primero 45 con el nuevo
medicamento; y 38 con el regular entre los pacientes del primer grupo se obtiene que el
promedio de fatiga / semanal en horas fue de 71,3 con una desviacin estndar de 4,1;
mientras que la segunda muestra arrojo un promedio de fatiga / semanal 68,1 con una
desviacin estndar de 5,8: calcule un intervalo de confianza del 95 % para la verdadera
diferencia de medias.
Se realiz una encuesta entre los y las cartagineses y alajuelenses sobre el salario obtenido los
datos corresponde a los siguientes
En promedio los y las cartagineses perciben un salario de 438000 con una desviacin estndar
de 8500 por otro lado los y las alajueleses en promedio obtienen un salario de 526000 con
una desviacin de 9800 se podra asegurar con un 97 % de confianza que el verdadero salario
promedio de cartagineses es diferente al de los y las alajueleses.

_________________________________________________________________________
13

Você também pode gostar