Você está na página 1de 6

Estimación puntual e interválica

29 de marzo de 2019

Universidad Católica San Pablo

Carrera Profesional de Administración de Negocios

Ticona Méndez Ronald Bladimiro

Objetivos

1. Calcular los intervalos de conanza para la media y la proporción.


2. Calcular los intervalos de conanza para la diferencia medias y la diferencia de proporciones
3. Determinar el tamaño de la muestra para el muestra para el muestreo de atributos y de variables.

1. Estimación
Hay dos formas de hacer una inferencia acerca de un parámetro de una población: podemos estimar el valor

del parámetro desconocido o podemos tomar una decisión acerca de valor hipotético del parámetro. Por ejemplo

podemos estimar el número medio µ de trabajos presentados cada hora en un centro de procesamiento de datos

o podríamos querer decidir si la media µ excede o no a cierto valor, digamos 60. El método para tomar una

decisión acerca de uno o más parámetros de una población, denominado prueba estadística de una hipótesis

este tema que tocaremos mas adelante.

La estimación estadística es el proceso mediante el cual se aproxima el valor del parámetro de la población

a partir de la información de una muestra. En este capitulo nos ocuparemos de la estimación.

2. Estimación puntual de parámetros


Un estimador puntual es una regla o fórmula que nos dice cómo calcular una estimación numérica con base

en las determinaciones contenidas en una muestra. El número que resulte del calculo es una estimación puntual.

La media de la muestra X , es un estimador puntual de la media de la población µ, ρ es un estimador puntual


de p y s es un estimador puntual de σ . Supongamos que cierta empresa desea estimar la edad media de los
compradores de equipos estéreo. Se seleccionan una muestra, y calculan la edad media de los compradores en

la muestra. La media de la muestra es un estimador puntual de la media poblacional.

No obstante, un estimador puntual sólo reere una parte de la historia. Si bien se espera que el estimador

puntual esté próximo al parámetro de la población, se desearía expresar qué tan cerca está. Un intervalo de

conanza sirve a este propósito.

Si el parámetro desconocido que queremos determinar es denotado por θ, entonces, la distribución de la

población de X será denotado por f (x, θ).


Denición. Sea X1 , X2 , ... , Xn una muestra aleatoria de tamaño n seleccionada de una población denida X
de parámetro θ cuya distribución la denotamos por f (X, θ). Se denomina estimador puntual del parámetro

θ a cualquier estadística (función real de la muestra) que la denotaremos por Θ̂ = H (X1 , X2 , ... , Xn )es un

estimador puntual de parámetro.

Un estimador puntual es el valor numérico Θ̂ mientras que una estimación puntual es el valor numérico Θ̂
del estimador.

Por ejemplo: un estimador puntual de la media poblacional µ, esto es θ = µ; es la estadística media muestral
(variable aleatoria) X , esto es Θ̂ = X ; cuyo valor numérico x, esto es θ̂ = x, es la estimación puntual de
parámetros.

1
Intervalos de conanza Estadística para Administradores

2.1. Propiedades de los estimadores puntuales

Los buenos estimadores puntales tienen propiedades tales como: insesgadez, eciencia y consistencia.

1. Insesgadez
Si el valor esperado del estadístico muestral es igual al parámetro poblacional que se estudia se dice que

estadístico muestral es un estimador insesgado del parámetro poblacional.

Denición 1. Se dice que la estadística Θ̂ = H(X1 , X2 , . . . , Xn ) es un estimador insesgado del parámetro


θ si E(θ̂) = θ. En caso contrario, se dice que es un estimador sesgado.

Donde: E(θ̂) =valor esperado del estadístico muestral θ̂.

Por lo tanto, el valor esperado o media, de todos los posibles valores de un estadístico muestral insesgado

es igual al parámetro poblacional que se estudia.

2. Eciencia
Supóngase que se usa una muestra aleatoria simple de n elementos para obtener dos estimadores puntuales
insesgados de un mismo parámetro poblacional, En estas circunstancias se preferirá usar el estimador

puntual que tenga el menor error estándar, ya que dicho estimador tenderá a dar estimaciones mas

cercanas al parámetro poblacional.

Denición 2. Se dice que el estimado puntual con menor error estándar tiene mayor eciencia relativa.
Es decir si hay dos estimadores puntuales ensesgados de un parámetro se denomina estimador mas eciente
del parámetro al estimador que tenga menor varianza.
Observación. Cuando se muestren poblaciones normales, el error estándar de la media muestral es menor

que el error estándar de la mediana muestral. Por tanto, la media muestral es mas eciente que la mediana

muestral.

3. Consistencia
Un estimador puntual es consistente si el valor de estimador puntual tiende a estar mas cerca del parámetro

poblacional a medida que el tamaño de la muestra aumenta. En otras palabras, una muestra grande tiende

a proporcionar mejor estimación puntual que una pequeña. Observe que en el caso de la media muestral
√ x,
el error estándar de x está dado por σx = σ/ n. Puesto que σx está vinculado con el tamaño de la muestra,
de manera que muestras mayores dan valores menores de σx , entonces muestras de tamaño grande tienden

a proporcionar estimadores puntales mas cercanos a la media poblacional µ. Mediante un razonamiento

similar, se concluye que la proporción muestral p es un estimador consistente de la proporción poblacional

p.

2.2. Método de máxima verosimilitud

Sea X una variable aleatoria cuya función de probabilidad f (X, θ) depende de un parámetro θ. Sea X1 , X2 , . . . , Xn
una muestra aleatoria de X y sean x1 , x 2 , . . . , x n los valores observados de la muestra. La función de verosi-
militud de la muestra se dene,

V (θ) = f (x1 , x2 , . . . , xn ; θ) = f (x1 ; θ) f (x2 ; θ) · · · f (xn ; θ)


Yn
= f (xi ; θ)
i=1

El método de máxima verosimilitud, consiste en tomar como valor estimado de θ, el valor que hace máxima al

función V (θ).
Observe que si Θ̂hace máxima de V (θ), entonces también hace máxima a su logaritmo L = ln V (θ). Para tal
propósito derivamos, esto es:
n
∂L X ∂ ln f (xi ; θ)
= =0
∂θ i=1 ∂θ
Si la distribución tiene varios parámetros desconocidos, θ1 , θ2 , . . . , θk entonces tendremos k ecuaciones, esto

es:
∂L ∂L ∂L
= 0, = 0, · · · , =0
∂θ1 ∂θ2 ∂θk
a partir de los cuales se obtiene las estimaciones para estos parámetros.

Mg. Ticona Méndez R. Bladimiro 2


Intervalos de conanza Estadística para Administradores

µ − 3σ µ − 2σ µ µ + σ µ + 2σ

Figura 1: Porcentajes de población en los diferentes intervalos simétricos de una normal N (µ, σ 2 )

3. Intervalos conanza
La estimación anterior, la puntual, se utiliza poco, pues no tenemos datos sucientes que nos indiquen el

grado de abilidad del dato muestral que hemos tomado. Lo que tiene mas sentido plantearse es cual es la

probabilidad de que la media o proporción poblacional pertenezcan a un intervalo determinado.

Denición 3. Un intervalo de conanza (o estimador del intervalo) es un rango (o un intervalo) de valores que

se usa para estimar el valor real de un parámetro poblacional. El intervalo de conanza suel abreviarse como IC

Un intervalo de conanza se asocia con un nivel de conanza, como 0.95=95 %. El nivel de conanza nos da

la tasa de éxitos del procedimiento que se utiliza para construir el intervalo de conanza.

3.1. Intervalos de probabilidad



En una variable normal cualquiera N µ, σ 2 , se verica que:

1. En el intervalo (µ − σ, µ + σ) esta el 68'26 % de la población.

2. En el intervalo (µ − 2σ, µ + 2σ) esta el 95.44 % de la población.

3. En el intervalo (µ − 3σ, µ + 3σ) esta el 99.74 % de la población.

Es evidente que a medida que el intervalo se ampla, hay mayor porcenta je de la población en el. En general,

dado un porcenta je del N %, siempre es posible encontrar un intervalo simétrico respecto de la media de forma

que dicho intervalo contenga a dicho porcenta je de población.

Mas explicitamente, se denomina intervalo de probabilidad a aquel intervalo para el cual se sabe que hay

una seguridad del N % de que los parámetros muestrales (x o p ) se encuentren en dicho intervalo. La seguridad
N viene jada previamente.

Denición 4. Si queremos que el N % de la población este en el intervalo, denominaremos nivel de conanza


al numero:
N
1−α=
100
y unido a este, se encuentra el llamado nivel de signicación , que viene dado por α.
Interpretación del nivel de conanza de la media
Si se seleccionan repetidamente 100 muestras de tamaño n, y calculamos la media de cada una de ellas,
tendremos 100 intervalos de conanza al intervalo [a, b], y esperamos que 95 intervalos contienen al parámetro µ
y 5 intervalos no lo contienen (líneas punteados de medias x̄5 , x7 , x8 , x11 , x̄98 ), como se muestra en la siguiente

gura (2).

4. Intervalo de conanza para la media de una población


4.1. Estimación para la media µ: Varianza σ2 supuesta conocida

SeaX1 , X2 , ... , Xn una muestra aleatoria de tamaño n seleccionada de una población denida por la variable
aleatoriaX con media µ y varianza σ 2 . Si la población es normal el tamaño de la muestra puede ser cualquiera
n ≥ 2, pero, si es de otro tipo, el tamaño de la muestra debe ser grande n ≥ 30.

Mg. Ticona Méndez R. Bladimiro 3


Intervalos de conanza Estadística para Administradores
TpM

x 98
b x7 x 11
x 99
x4 x9
x1 x6
µ
x2 x 10
x3 x 12 ⋯ x 100
a x5
x8

Figura 2: 100 Intervalos de connaza

1−α
α 2
α 2
z
−z z1 2

Figura 3: Nivel conanza determinado por z1−α/2

Si la población X es normal N (µ, σ 2 ), entonces por la propiedad reproductiva de la normal (PRN) la

distribución de probabilidades de la media de la muestra X, es normal N (µ, σ 2 /n) para cualquier tamaño de la

muestra (n ≥ 2).
Si la población X no es normal N (µ, σ2 ), entonces siempre que el tamaño n de la muestra sea sucien-
temente grande (n ≥ 30), por el teorema del límite central, la distribución de X es aproximadamente normal

N (µ, σ 2 /n).
Por lo tanto, en cualquiera de los dos casos, la distribución de la variable aleatoria es:

X −µ
Z= √ (1)
σ/ n
La probabilidad o nivel de conanza en al distribución normal de Z se determina valores de z1−α/2 tales que:

 
P −zα/2 ≤ Z ≤ zα/2 = 1 − α (2)

x−µ
Sustituyendo z= √ se tiene:
σ/ n
 
x−µ
P −z1−α/2 ≤ √ ≤ z1−α/2 = 1−α
σ/ n
 
σ σ
P µ − z1−α/2 √ ≤ x ≤ µ + z1−α/2 √ = 1−α
n n
 
σ σ
Como el intervalo de probabilidad a nivel de conanza 1−α para x es: µ − z1−α/2 √ , µ + z1−α/2 √
n n
Es decir:

σ σ
µ − z1−α/2 √ ≤ x ≤ µ + z1−α/2 √
n n
σ σ
µ − z1−α/2 √ ≤ x ∧ x ≤ µ + z1−α/2 √
n n

De donde se obtiene:

Mg. Ticona Méndez R. Bladimiro 4


Intervalos de conanza Estadística para Administradores

σ σ
µ ≤ x + z1−α/2 √ ∧ µ ≤ x − z1−α/2 √
n n

Luego deduce que para un nivel conanza 1 − α, se tiene:

σ σ
x − z1−α/2 √ ≤ µ ≤ x + z1−α/2 √ (3)
n n

xes la media de una muestra aleatoria de tamaño n escogida de una población normal (o no
Por lo tanto: Si

normal pero n sucientemente grande) con varianza σ 2 conocida , entonces, el intervalo de estimación de
la media µ con nivel de conanza (1 − α)100 % es:

LI ≤ µ ≤ LS óµ ∈ [LI, LS]
σ σ
donde: LI = x − z1−α/2 √ (límite inferior) y LS = x + z1−α/2 √ (límite superior)
n n

4.1.1. Error estándar


Se denomina error estándar de un estimador a la desviación estándar del estimador. A su valor numérico

se denomina error estándar estimado. Por ejemplo, el error estánadar de la media de una muestra de una

población innitas (o población nita con sustitución) es:

σ
σx = √
n

4.1.2. Error de la estimación


Por denición, el error de estimación , al estimar µ es el valor numérico:
e = |x − µ| (4)

El valor mínimo de error de estimación es igual a cero, esto ocurre, cuando x estima exactamente µ.
σ
E valor máximo del error de estimación es igual a zα/2 √ ya que aplicando propiedades del valor absoluto
n
al intervalo de estimación de µ, resulta que:

σ
e = |x − µ| ≤ z1−α/2 √ (5)
n
Observación. En el intervalo de conanza de la media de una población nita de tamaño N (sin

reemplazo), se tomará como desviación estándar o error típico a:

r
σ N −n
σx = √ (6)
n N −1

4.1.3. Determinación del tamaño de la muestra


Si se utiliza x como una estimación de µ, entonces, se tiene una conanza de (1 − α) × 100 % de error no
sea mayor a e (z1−α/2 σx ≤ e) cuando el tamaño de la muestra sea al menos
2
z1−α/2 σ2
n=
e2

Si la población es nita de tamaño N y el muestreo es sin reposición, entonces tamaño de muestra es

determinada por:
2
z1−α/2 σ2 N
n= 2
z1−α/2 σ 2 + e2 (N − 1)

También el tamaño de muestra puede ser determinado por la fórmula

z 2 p(1 − p)N
n= (se toma z = 2)
e2 (N − 1) + z 2 p(1 − p)

Debemos hacer de aquí dos observaciones:

Mg. Ticona Méndez R. Bladimiro 5


Intervalos de conanza Estadística para Administradores

1. Si para n se obtiene un valor fraccionario, se redondea el número entero siguiente.

2. En sentido estricto podemos determinar n, solo si se conoce la varianza poblacional σ2 , de la cual se está

seleccionando la muestra. Si nos falta esta información se puede tomar una muestra preliminar de tamaño

n ≥ 30 para obtener un estimación de σ . En este caso usar S como aproximación de σ , se puede determinar
aproximadamente cuantas observaciones se necesitan para el grado deseado de exactitud.

Observación. Que cuanto menor es el error de la estimación mayor es el tamaño de la muestra.

Observación. En estadistica aplicada es frecuente utilizar el valor z1−α/2 = 2, n se obtiene resolviendo σX

4.2. Estimación para la media µ: Varianza σ2 supuesta desconocida

Sea X1 , X2 , ... , Xn variables aleatorias de tamaño n escogidas de una población X cuya distribución de
probabilidades es normal N µ, σ 2 con σ desconocido.


La media y la varianza está dada por:

n n
P P 2
xi (xi − x)
i=1 2 i=1
x= S = (7)
n n−1
El estadístico pivote a usar es:

x−µ
T = √ (8)
S/ n
donde: S es la desviación estándar y T es la distribución t−Studend con n−1 grados de libertad.

Con el mismo razonamiento del anterior, para intervalo de conanza se tiene:

Si x y s son media y desviación estándar respectivamente para un valor particular x1 , x 2 , . . . , x n de la

muestra aleatoria de tamaño n escogida de una población normal con varianza σ 2 desconocida , entonces,
el intervalo de estimación de µ con nivel de conanza del (1 − α/2)100 % es:
S S
x − t1−α/2 √ ≤ µ ≤ x + t1−α/2 √
n n
  α
donde: t1−α/2 es valor característico de la variable t−Studend, vericando P T ≤ t1−α/2 = 1 − .
2

Resumen:
Intervalos para la media µ
σ σ
σ conocido Si la población normalmente x − z1−α/2 √ ≤ µ ≤ x + z1−α/2 √
n n
distribuida o n ≥ 30
S S
x − t1−α/2 √ ≤ µ ≤ x + t1−α/2 √
σ desconocido Si la población normalmente

distribuida.
n n
Si la población no está Se utiliza el método no parámétrico

normalmente distribuida o o bootstrap

n ≤ 30

Mg. Ticona Méndez R. Bladimiro 6

Você também pode gostar