Você está na página 1de 9

Estadstica para ingenieros L. Retamal y H.

Alvarado

1
Unidad 2: INFERENCIA ESTADSTICA


2.1: ESTIMACIN DE PARMETROS POR INTERVALOS DE CONFIANZA


Hemos destacado que un buen estimador de la media poblacional es la media muestral que
tiene desviacin estndar n , y con error estndar pequeo.
Recordemos que cuando las muestras son grandes los promedios muestrales pueden ser
considerados variables normales de media y varianza
2
n .
n
X
Z luego y
n
N X entonces N X




= ) , ( ~ ) , ( ~
2
2
& & N(0,1)


Definicin: Un Intervalo de Confianza ( I. de C.) es un intervalo que tiene a lo menos un extremo
aleatorio y es construido de manera tal que el parmetro de inters que se estima est contenido en
dicho intervalo con una probabilidad 1 - ( Coeficiente de Confianza ).
Un I.de C. puede tener las siguientes formas :

Bilateral : P
|
|

\
|


S I = 1 - Unilateral : P
|
|

\
|


S = 1 - y P
|
|

\
|


I = 1 -

Las probabilidades que el parmetro no este en el intervalo se reparten por igual entre los extremos
del intervalo. Para construir los Intervalos de Confianza se usa el mtodo del Pivote.


Mtodo del Pivote : Se basa en la obtencin de una variable aleatoria que cumpla :
i) Dependa de las observaciones de la muestra y del parmetro desconocido .
ii) Tenga una distribucin de probabilidades que no dependa del parmetro .


Actividad 1:
Se tiene una observacin X
1
de una variable X cuya densidad es:
0 ;
1
) ; (

> =

x e x f
x


Construir un I.de C. de 90% para usando la variable X
1
.

Solucin: Usando la variable U =

X
y verifiquemos que U es un pivote.
Para establecer la densidad de U usamos la expresin :
g (u) = f(x(u))
du
dx
=

u
e



1
=
u
e

, 0 u Luego,
U es un pivote;

I
u y

S
u son los extremos del intervalo tales que:
Estadstica para ingenieros L. Retamal y H. Alvarado

2
P

U u
I
(

S
u ) = 0.90

P 05 . 0 =
|
|

\
|


I
u U

i
u
u
du e
0
= 0.05 . Con

I
u = 0.05
P 05 . 0 =
|
|

\
|


S
u U

S
u
u
du e = 0.05 . Con

S
u = 2.99
Por lo tanto, 0.05 99 . 2 U . Sustituyendo
05 . 0 99 . 2
1 1
X X



A. Intervalo de Confianza para la media

Se distinguen varios casos para construir I. de C. Para la media poblacional, usando un
coeficiente de confianza (1 - ).

Caso 1: La muestra es sacada de una poblacin normal y varianza
2
conocida.
Se usa como pivote ~
n
X
Z


= N(0,1) para cualquier valor de n. Por tanto, podemos escribir que Z
est contenida con probabilidad 1 - en un intervalo que tiene por extremos - ( ) 2 / Z y ( ) 2 / Z .
As, P ( ) = 1 ) /2 Z( Z ) /2 Z( -


Sustituyendo el valor de Z y despejando se obtiene el I. de C. buscado :

|
|

\
|
+
n
Z x
n
Z x

) 2 ( , ) 2 ( :


Observacin: La muestra puede tener un tamao cualquiera en este caso y los intervalos son exactos.

Caso 2: No obstante lo anterior, si el tamao de la muestra es grande una aplicacin del T.C.L.
permite establecer ) 1 , 0 ( ~ N
n S
X
&

.
Luego, un I. de C. 1 - para es:

|
|

\
|
+
n
S
Z x
n
S
Z x ) 2 ( , ) 2 ( :

En esta Unidad consideraremos que n es grande si n 30.



Estadstica para ingenieros L. Retamal y H. Alvarado

3
Caso 3: La muestra aleatoria es sacada de una poblacin normal , pero los parmetros y
2
son
desconocidos.
El pivote es : T = ) 1 ( ~

n t
n S
X

Un I.de C. 1 - para es:

|
|

\
|
+

n
S
t x
n
S
t x
n n
) 2 / ( , ) 2 / ( :
1 1



Actividad 2: El artculo HL analiza el uso de fotografa infrarroja en color para la identificacin de
rboles normales en bosques de pino de Oregon. Entre los datos reportados haba resmenes de
estadsticos para medidas en muestras de rboles sanos y enfermos. Para una muestra de 70 rboles
sanos, el promedio muestral de densidad de capa de tinte fue 1.028 y la desviacin estndar de 1,63.
a) Calcule un intervalo de confianza de 95% para el verdadero promedio de densidad de capa tinte
para todos estos rboles.
c) Qu ocurre con sus intervalos si la desviacin estndar se puede reducir a la mitad?
d) Qu ocurre con sus intervalos anteriores si aumenta su tamao muestral al doble pero
manteniendo la desviacin estndar de 1.63?
b) Suponga de los investigadores haban hecho una estimacin de 0,16 para el valor de S antes de
reunir los datos. Qu tamao de muestra sera necesario obtener un ancho del intervalo de 0,05 con
un nivel de confianza de 95%?



Intervalo de Confianza para la diferencia entre dos media
2 1


Podemos obtener estimadores de funciones de parmetros de dos o ms distribuciones. Por
ejemplo, obtener un I. de C. para la diferencia
2 1
entre los valores medios de dos distribuciones
diferentes, que se desean comparar. En este caso, al igual que en los casos anteriores, debemos
recurrir a un estadstico que naturalmente resulta ser
2 1
X X .
Consideremos dos muestras aleatorias independientes de tamaos
2 1
n y n , provenientes de
dos poblaciones normales con varianzas
2
2
2
1
y conocidas.

En tal situacin la distribucin del estadstico es
|
|
|

\
|
+
2
2
2
1
2
1
2 1 2 1
, ~
n n
N X X


Por lo que el I. de C. correspondiente es:

/2) Z( ) ( :
2
2
2
1
2
1
2 1 2 1
n n
X X

+


Estadstica para ingenieros L. Retamal y H. Alvarado

4
Cuando
2
2
2
1
y son desconocidas, pero los tamaos de muestra
2 1
n y n son suficientemente
grandes reemplazamos dichas varianzas por sus correspondientes estimadores
2
2
2
1
S y S .

Ahora, cuando
2
2
2
1
y son desconocidas pero los tamaos de muestras
2 1
n y n son pequeos la
obtencin de la distribucin del pivote no es directa, a menos que las varianzas de las dos
poblaciones normales sean iguales. En este caso, si
2 2
2
2
1
= = entonces

) 1 , 0 ( ~
1 1
) (
2 1
2 1 2 1
N
n n
X X
Z
+

=


y
2
puede ser estimado por
2
) 1 ( ) 1 (
2 1
2
2 2
2
1 1 2
+
+
=
n n
S n S n
S
p


Verifique que ( )
2 2
=
p
S E !!

Adems
2
) 1 ( 2
2
2
2
2
2
) 1 ( 2
2
1
1
1
2 1
~
) 1 (
, ~
) 1 (



=

=
n n
S n
Y
S n
Y



Donde por observacin anterior
2
) 2 ( 2
2
2
2
2
2
1
1
2 1
2 1
~
) 1 ( ) 1 (
+


+

= + =
n n
S n S n
Y Y Y



Se puede probar que si Z e Y son variables aleatorias independientes entonces

) 2 ( ~
1 1
) (
2
2 1
2 1
2 1 2 1
2 1
+
+

=
+
= n n t
n n
S
X X
n n
Y
Z
T
p

.

Por lo tanto un Intervalo de Confianza, viene dado por:



1 1
/2) ( t ) ( :
2 1
2 2 1 2 1
2 1
n n
S X X
p n n
+
+




Observacin: si suponemos
2
2
2
1
entonces ) ( ~
) (
2
2
2
1
2
!
2 1 2 1
v t
n
S
n
S
X X
T
+

=


donde
1 1
2
2
2
2
! 2
1
2
1
2
!
2
2
2
2
1
2
!
(
(
(
(
(
(

|
|

\
|
+
(
(
(
(
(
(

|
|

\
|
(
(

+ =
n
n
S
n
n
S
n
S
n
S
v
Estadstica para ingenieros L. Retamal y H. Alvarado

5
Actividad 3: Se realiza un estudio para determinar el efecto de la lluvia cida y otros contaminantes
industriales en el agua de lagos. Se obtienen muestras aleatorias de diez lagos en un rea muy
industrializada y de otros ocho en un rea boscosa virgen. Los datos del pH del agua son los
siguientes:
rea Industrial rea Virgen
6.9 7.0 7.0 6.8
6.2 6.5 6.9 7.0
6.3 6.6 6.7 7.0
5.9 5.5 7.1 7.2
6.0 7.3

a) Determine un intervalo de confianza del 95% para las diferencias de medias. Es posible
afirmar que el pH del agua promedio en el rea industrializada tiende a ser ms bajo que en el
rea virgen?.
b) Realice los supuestos necesarios para obtener el intervalo de la parte a).


B. Intervalo de Confianza para una proporcin p

Sea p el parmetro que indica la proporcin de elementos de una poblacin que poseen un atributo
determinado. Si p es el estimador puntual del parmetro determinado en una muestra de tamao n
se cumple que: ) 1 , 0 (
) 1 (

0
N
n p p
p p
Z

=

Un I. de C. 1 - para
0
Z tiene por extremos ) 2 / ( ) 2 / ( Z y Z . Luego

) 2 / (
pq/n
p - p
) 2 / (
pq/n
p - p
) 2 / ( Z Z Z

Tenemos una parbola cuyas races definen el intervalo dentro del cual la parbola es negativa. Por
tanto, los lmites superior e inferior de p son:

) 2 / (
4
) 2 / (
) 2 / (
2
) 2 / (

2
2 2
,

Z n
Z
n q p Z
Z
p n
p
I S
+
+ +
=

Actividad 4: Un estudio reporta que cuando se someti a cada casco de ftbol, de una muestra
aleatoria de 37 del tipo de suspensin, a cierta prueba de impacto, 24 mostraron daos. Sea p la
proporcin de todos los cascos de este tipo que muestran dao al probarse de la muestra descrita.
a) Calcule un intervalo de confianza del 99% para p.
b) Qu tamao de muestra se requerira para que el ancho de un intervalo de confianza del 99%
fuera 0,10 a lo sumo, independientemente de p ?



Estadstica para ingenieros L. Retamal y H. Alvarado

6
Intervalo de Confianza para la diferencia entre dos proporciones
2 1
p p

Para
2 1
n y n relativamente grandes se tiene,
|
|

\
|
|
|

\
|
2
2 2
2 2
1
1 1
1 1
, ~ , , ~
n
q p
p N p
n
q p
p N p & &

Entonces ) 1 , 0 ( ~
) 1 ( ) 1 (
) ( ) (
2
2 2
1
1 1
2 1 2 1
N
n
p p
n
p p
p p p p
Z &


=

En este ltimo estadstico
1
p y
2
p han sido estimados por sus respectivas proporciones muestrales
(en el denominador). Dado que los valores de
2 1
n y n son grandes las aproximaciones siguen
siendo vlidas. Por lo tanto, tenemos un intervalo de confianza aproximado del ( )% 1 100 para
2 1
p p , donde
2 1
p y p son los estimadores mximo verosmiles respectivos de
1
p y
2
p .


|
|

\
|
+ + +
2
2 2
1
1 1
2 1
2
2 2
1
1 1
2 1

) 2 / ( ,

) 2 / (
n
q p
n
q p
Z p p
n
q p
n
q p
Z p p


Actividad 5: Un economista al servicio de una agencia estatal desea determinar si la frecuencia de
desempleo en dos grandes reas urbanas del estado son diferentes. Con base en muestras aleatorias
de cada ciudad, cada una de 500 personas, el economista encuentra 35 personas desempleadas en un
rea y 25 en la otra. Bajo las suposiciones adecuadas y con una confianza del 95%, resuelva
mediante un intervalo de confianza, si existe alguna razn para creer que las frecuencias de
desempleo en las dos reas son diferentes?.


C. Determinacin de tamaos de muestra

El nmero de unidades que se deben seleccionar de una poblacin, mediante un muestreo
aleatorio simple depende de la precisin o error absoluto de estimacin con la cual se quiere estimar
el parmetro de inters, de la varianza de la poblacin y del valor del coeficiente de confianza
utilizado para efectuar la estimacin mediante un intervalo.

Caso 1: la variable es cuantitativa y se estima el valor medio poblacional de una muestra de
tamao n. Se define el error absoluto de estimacin o precisin de la estimacin a la expresin
= X e .
Si la poblacin de donde se saca la muestra es normal y la varianza es conocida de la expresin del
intervalo de confianza se obtiene
n
Z X

) 2 / ( Sustituyendo el primer miembro y
considerando el mayor error:
Estadstica para ingenieros L. Retamal y H. Alvarado

7
2
) 2 / (
) 2 / (
(


= =
e
Z
n
n
Z e



Luego, si es conocida se fijan e y 1 y se determina el valor del tamao de muestra n.
Si es desconocida se debe efectuar un estudio exploratorio y obtener su estimador S con una

muestra razonable
/
n . As,
2
1
) 2 / (

/
(
(


=

e
S t
n
n

.

Caso 2 : La variable es cualitativa y se estima la proporcin de elementos que tienen la caracterstica
indicada por dicha variable mediante el estimador p . El error absoluto de estimacin es p p e =
Como la expresin del I. de .C. 1 es
n
p p
Z p p
) 1 (
) 2 / (

se obtiene

) 1 (
) 2 / (
2
p p
e
Z
n |

\
|
=



Si p no es conocido se puede sustituir con una estimacin
/
p obtenida en un estudio piloto con
una muestra
/
n .
Si no se puede efectuar tal estudio piloto se sustituye p por el valor que hace mxima la varianza.
Para encontrar tal valor derivamos la expresin de la varianza y la igualamos a cero.

2
1
0
) 1 (

= =

p
n
p p
p d
d

Luego, si p = la varianza es mxima. As,
2
2
) 2 / 1 (
|

\
|
=
e
Z
n

.

Actividad 6: Determnese el tamao de muestra para estimar la proporcin poblacional p, con
probabilidad de 96% de que el error cometido en la estimacin sea a lo ms 2%.


D. Intervalo de Confianza para la Varianza
2

Se estableci que si tenemos observaciones de una variable ) 1 , 0 ( ~ N X se cumple que
2
1
2
2
~
) 1 (

n
S n

.
Un intervalo que con probabilidad 1- contenga a 0
2
tiene por extremos
) 2 / ( ) 2 / 1 (
2
1
2
1



n n
y es:

) 2 / 1 (
) 1 (
) 2 / (
) 1 (
2
1
2
2
2
1
2

n n
S n S n




Estadstica para ingenieros L. Retamal y H. Alvarado

8
Observacin: Un I. de C. Para la desviacin estndar se obtiene tomando la raz cuadrada en
cada una de las dos desigualdades anteriores.

Actividad 7: Un ingeniero que trabaja para un fabricante de llantas investiga la duracin promedio
de un compuesto nuevo de caucho. Para ello, construye 16 llantas y las prueba en una carretera hasta
alcanzar el fin de la vida til de stas. Los datos, en km., obtenidos son los siguientes:
60613 59836 59554 60252
59784 60221 60311 50040
60545 60257 60000 59997
69947 60135 60220 60523

Considere que la muestra es obtenida de una distribucin normal.
a) Calcule un intervalo de confianza del 98% para la desviacin estndar de la vida til de las llantas.
b) Qu tan grande deber ser el tamao de la muestra si la longitud de un intervalo de confianza de
95% para la vida til promedio de la llanta es de 2000 km.?


Intervalo de Confianza para el cuociente entre dos Varianzas
2
2
2
1
/

Supongamos que se tienen dos muestras provenientes de dos distribuciones normales con media y

varianzas desconocidas.
2
) 1 ( 2
2
2
2
2
2
) 1 ( 2
1
2
1
1
2 1
~
) 1 (
, ~
) 1 (



n n
S n S n


Entonces ) 1 , 1 ( ~
2 1
2
1
2
2
2
2
2
1

= n n f
S
S
F



De la tabla de la distribucin de Fisher obtenemos los valores ) 2 / ( ) 2 / 1 ( f y f para
) 1 ( 1) - (
2 1
n y n grados de libertad para el numerador y denominador respectivamente, tal que:

( ) = < < 1 ) 2 / 1 ( ) 2 / ( f F f P

=
|
|

\
|

< <

1
) 2 / ( ) 2 / 1 (
2
2
2
1
2
2
2
1
2
2
2
1
f S
S
f S
S
P


De esta manera un I. de C. del ( )% 1 100 para
2
2
2
1
/ est dado por:


|
|

\
|


) 2 / 1 (
,
) 2 / (
:
) 1 , 1 (
2
2
2
1
) 1 , 1 (
2
2
2
1
2
2
2
1
2 1 2 1

n n n n
f S
S
f S
S






Estadstica para ingenieros L. Retamal y H. Alvarado

9

Actividad 8: Una empresa fabricante de computadores tiene dos modelos diferentes de impresora
de matriz de punto, sean ellas tipo A y B. Se recoge informacin respecto de las ventas en 5 meses,
elegidas al azar, en una distribuidora. Los datos obtenidos estn resumidos en la siguiente tabla

n X S
2

Tipo A 5 70 16
Tipo B 5 73 25

Se sospecha que el nmero de artculos vendidos mensualmente tiene la misma variacin con los dos
tipos de impresoras. Qu opina Usted al respecto? Justifique usando nivel de confianza del 95%


Ejercicio Propuesto:

1. Una fbrica trabaja con dos clases de mquinas, de tipo A y de tipo B. el costo semanal X de
reparacin para las mquinas de tipo A tiene una distribucin normal con media
X
y varianza
2
.
El costo semanal Y para las mquinas de tipo B tambin tiene distribucin normal, pero con media
Y
y varianza
2
3 . Luego, el costo semanal esperado para la fbrica es
Y X
+ 2 . Si se tiene una
muestra aleatoria
n
X X X .., ,......... ,
2 1
de costo para las mquinas de tipo A y muestra aleatoria
independiente
m
Y Y Y .., ,......... ,
2 1
de costo para las mquinas de tipo B,
a) Construir un intervalo de 95% de confianza para
Y X
+ 2 . Suponga que se conoce
2
.
c) Qu sucede con el intervalo si aumentan el nivel de confianza y la varianza
2
.
d)

2. Para n grande la distribucin muestral de la desviacin estndar S es a veces aproximada con una
distribucin normal que tiene media y varianza

2
2n
. Verifique que esta aproximacin conduce
al siguiente intervalo del ( ) 1 100% de confianza para


S
Z
n
S
Z
n
1
1 2
2
1
1 2
2
+

< <

( ) ( )



Un fabricante de gasolinas mide el octanaje de su producto. A continuacin se presentan los datos
obtenidos de 30 muestras tomadas del proceso de produccin. Encuentre un intervalo aproximado del
95% para
2
.
86,98 86,90 86,94 87,11 86,80 87,02
87,10 87,13 86,92 87,04 86,92 87,13
87,10 86,91 87,03 86,91 87,05 86,95
86,94 86,92 87,16 87,08 87,13 86,84
86,81 86,83 87,19 86,81 86,98 86,97

Você também pode gostar