Você está na página 1de 26

87

Inferencia estadstica
Ob je ti vos
Estudiar las relaciones entre los estadsticos muestrales y los parmetros
poblacionales.
Desarrollar procedimientos relativos a dos de los problemas fundamen-
tales de la inferencia estadstica: estimacin de parmetros y prueba de
hiptesis.
3.1. Distribucin de estadsticos muestrales
En el estudio de una poblacin es factible observar que los individuos que la
conforman presentan diferencias entre s y como reflejo de ello todas las mues-
tras posibles de cierto tamao n, seleccionadas al azar de esa poblacin, tam-
bin presentarn variaciones entre ellas en su conformacin. Tales variacio-
nes se transmiten al compotamiento de las medidas muestrales tambin
denominadas estadsticos muestrales calculados a partir de cada una de las
muestras, dando origen a nuevas poblaciones de naturaleza terica, las pobla-
ciones de los estadsticos muestrales.
La importancia del estudio de la distribucin de los estadsticos muestra-
les radica en el hecho de que ellos son los estimadores de los parmetros
poblacionales.
Dada una poblacin conocida de tamao N con media poblacional y pro-
porcin poblacional P(e) = P de algn valor e elegido como xito, si de ella se
seleccionan aleatoriamente todas las muestras posibles de tamao n y para
cada una de ellas se calcula la media aritmtica X
i
y la proporcin de xito
p
i
(e)= p
i
, se tendrn m muestras y consecuentemente la misma cantidad m de
medias aritmticas y de proporciones muestrales.
3
Las dos ltimas columnas constituyen las poblaciones de las variables alea-
torias media muestral y proporcin muestral. Por su importancia conceptual,
seguidamente trataremos las distribuciones tericas de las poblaciones de
los estadsticos media muestral (como mejor estimador de ) y proporcin
muestral (como mejor estimador de P).
3.1.1. Distribucin del estadstico media muestral
Los grficos que se presentan a continuacin se refieren a la distribucin de
dos poblaciones, la primera corresponde a una poblacin original conformada
por las edades de los 497 empleados de una empresa grfico.3.1 mien-
tras que la segunda grfico 3.2 representa a la distribucin de la poblacin
terica de las edades medias de todas las muestras de tamao 2 que se
extrajeron de la poblacin original.
Grfico 3.1.
Los parmetros de la poblacin original (de edades) son:
= 35 aos y
2
= 82,90 aos
2
Grfico 3.2.
88
Universidad Virtual de Quilmes
El mejor estimador de un
parmetro poblacional
es aquel que cumple con ciertas
cualidades (insesgabilidad, con-
sistencia, eficiencia y suficiencia)
que aqu no se analizarn.
0,17
0,14
0,11
0,08
0,06
0,03
0,00
22 35 48 62
X
Distribucin de la poblacin original
f
r
e
c
u
e
n
c
i
a

r
e
l
a
t
i
v
a
Grfico.3.1
22
0,20
0,10
0,10
0,05
0,00
35 48 62
Distribucin de la poblacin de las medias
muestrales (muestras de tamao 2)
Medias muestrales
f
r
e
c
u
e
n
c
i
a

r
e
l
a
t
i
v
a
Grfico.3.2
0,17
0,14
0,11
0,08
0,06
0,03
0,00
22 35 48 62
X
Distribucin de la poblacin original
f
r
e
c
u
e
n
c
i
a

r
e
l
a
t
i
v
a
Grfico.3.1
22
0,20
0,10
0,10
0,05
0,00
35 48 62
Distribucin de la poblacin de las medias
muestrales (muestras de tamao 2)
Medias muestrales
f
r
e
c
u
e
n
c
i
a

r
e
l
a
t
i
v
a
Grfico.3.2
Los parmetros de la poblacin terica de las medias muestrales de todas
las muestras de tamao 2 son:
Si se tomaran muestras de tamao n=1 el grfico resultante para la pobla-
cin terica de las medias muestrales de todas las muestras de tamao 1
sera exactamente igual que el Grfico.3.1. (porque cada media es el ele-
mento que conforma la muestra) y sus parmetros seran los mismos que los
de la poblacin original.
Como se puede observar, todas las medias de las poblaciones tericas, an
variando n, coinciden con la media de la poblacin de donde se extrajeron las
muestras.
Conclusin:
Y las varianzas disminuyen proporcionalmente al tamao n de la muestra.
Adems, si las muestras extradas de la poblacin son de tamao grande
(usualmente n > 30), el grfico de la distribucin de la poblacin de las medias
muestrales resulta Grfico.3.3. aproximadamente normal.
Grfico 3.3.
89
Estadistica
35
Distribucin de la poblacin de las medias muestras (n>30)
Medias muestrales
Grfico.3.3
0,11 1 0
Distribucin de la poblacin de las proporciones muestras (n>100)
Proporciones muestrales
Grfico.3.4
Grfico.3.5
Grfico.3.6

X
a b
1-
3

x
= 35 aos y
x
2
= 41, 45 aos
2


Si se tomaran muestras de tamao n=1 el grfico resultante para la
poblacin terica de las medias muestrales de todas las muestras de
tamao 1 sera exactamente igual que el G.3.1. (porque cada media
es el elemento que conforma la muestra) y sus parmetros seran los
mismos que los de la poblacin original.

x
= 35 aos y
x
2
= 82, 90 aos
2


Como se puede observar, todas las medias de las poblaciones tericas,
an variando n, coinciden con la media de la poblacin de donde se
extrajeron las muestras.

Conclusin:

x
=

Y las varianzas disminuyen proporcionalmente al tamao n de la
muestra.

x
2
=

2
n


Adems, si las muestras extradas de la poblacin son de tamao grande
(usualmente n > 30), el grfico de la distribucin de la poblacin de las
medias muestrales resulta G.3.3. aproximadamente normal.

Insertar Imagen N G.3.3.
G.3.3.




Propiedades de la variable aleatoria media muestral

Si en una determinada poblacin se define una variable aleatoria X: {x
1
,
x
2
, x
3 ,, .
x
m,.
} con esperanza E(X) = y varianza V(X) =
2
y se
selecciona slo una muestra aleatoria de tamao n de dicha poblacin
3

x
= 35 aos y
x
2
= 41, 45 aos
2


Si se tomaran muestras de tamao n=1 el grfico resultante para la
poblacin terica de las medias muestrales de todas las muestras de
tamao 1 sera exactamente igual que el G.3.1. (porque cada media
es el elemento que conforma la muestra) y sus parmetros seran los
mismos que los de la poblacin original.

x
= 35 aos y
x
2
= 82, 90 aos
2


Como se puede observar, todas las medias de las poblaciones tericas,
an variando n, coinciden con la media de la poblacin de donde se
extrajeron las muestras.

Conclusin:

x
=

Y las varianzas disminuyen proporcionalmente al tamao n de la
muestra.

x
2
=

2
n


Adems, si las muestras extradas de la poblacin son de tamao grande
(usualmente n > 30), el grfico de la distribucin de la poblacin de las
medias muestrales resulta G.3.3. aproximadamente normal.

Insertar Imagen N G.3.3.
G.3.3.




Propiedades de la variable aleatoria media muestral

Si en una determinada poblacin se define una variable aleatoria X: {x
1
,
x
2
, x
3 ,, .
x
m,.
} con esperanza E(X) = y varianza V(X) =
2
y se
selecciona slo una muestra aleatoria de tamao n de dicha poblacin
3

x
= 35 aos y
x
2
= 41, 45 aos
2


Si se tomaran muestras de tamao n=1 el grfico resultante para la
poblacin terica de las medias muestrales de todas las muestras de
tamao 1 sera exactamente igual que el G.3.1. (porque cada media
es el elemento que conforma la muestra) y sus parmetros seran los
mismos que los de la poblacin original.

x
= 35 aos y
x
2
= 82, 90 aos
2


Como se puede observar, todas las medias de las poblaciones tericas,
an variando n, coinciden con la media de la poblacin de donde se
extrajeron las muestras.

Conclusin:

x
=

Y las varianzas disminuyen proporcionalmente al tamao n de la
muestra.

x
2
=

2
n


Adems, si las muestras extradas de la poblacin son de tamao grande
(usualmente n > 30), el grfico de la distribucin de la poblacin de las
medias muestrales resulta G.3.3. aproximadamente normal.

Insertar Imagen N G.3.3.
G.3.3.




Propiedades de la variable aleatoria media muestral

Si en una determinada poblacin se define una variable aleatoria X: {x
1
,
x
2
, x
3 ,, .
x
m,.
} con esperanza E(X) = y varianza V(X) =
2
y se
selecciona slo una muestra aleatoria de tamao n de dicha poblacin
3

x
= 35 aos y
x
2
= 41, 45 aos
2


Si se tomaran muestras de tamao n=1 el grfico resultante para la
poblacin terica de las medias muestrales de todas las muestras de
tamao 1 sera exactamente igual que el G.3.1. (porque cada media
es el elemento que conforma la muestra) y sus parmetros seran los
mismos que los de la poblacin original.

x
= 35 aos y
x
2
= 82, 90 aos
2


Como se puede observar, todas las medias de las poblaciones tericas,
an variando n, coinciden con la media de la poblacin de donde se
extrajeron las muestras.

Conclusin:

x
=

Y las varianzas disminuyen proporcionalmente al tamao n de la
muestra.

x
2
=

2
n


Adems, si las muestras extradas de la poblacin son de tamao grande
(usualmente n > 30), el grfico de la distribucin de la poblacin de las
medias muestrales resulta G.3.3. aproximadamente normal.

Insertar Imagen N G.3.3.
G.3.3.




Propiedades de la variable aleatoria media muestral

Si en una determinada poblacin se define una variable aleatoria X: {x
1
,
x
2
, x
3 ,, .
x
m,.
} con esperanza E(X) = y varianza V(X) =
2
y se
selecciona slo una muestra aleatoria de tamao n de dicha poblacin
Propiedades de la variable aleatoria media muestral
Si en una determinada poblacin se define una variable aleatoria X: {x
1
, x
2
, x
3
,, .
x
m,.
} con esperanza E(X) = y varianza V(X) = s
2
y se selecciona slo
una muestra aleatoria de tamao n de dicha poblacin para la cual su media
muestral X es un elemento de la poblacin terica de Xs se verifican las
siguientes propiedades:
El desvo estndar
x
tambin se denomina error estndar de la media mues-
tral respecto de la media poblacional.
Estas propiedades se desprenden inmediatamente de las propiedades
enunciadas anteriormente en el apartado 2.2.1. de la Unidad 2 para la espe-
ranza y varianza de una variable aleatoria cualquiera como se puede verificar
a continuacin.
3.1.2. Distribucin del estadstico proporcin muestral
En el grfico 3.4. se representa la distribucin de la poblacin terica de las
proporciones de empleados mayores a 45 aos de todas las muestras de un
cierto tamao n superior a 100.
Grfico 3.4.
90
Universidad Virtual de Quilmes
4
para la cual su media muestral es un elemento de la poblacin terica
de se verifican las siguientes propiedades.

P.1 E( ) =

X
=

COMIENZO DE PASTILLA EN P.1
Esta propiedad est relacionada con la cualidad de insesgabilidad del estimador .
FIN DE PASTILLA

P.2 V( ) =

X
2
=

2
n
DS( ) =
X
=

n


El desvo estndar tambin se denomina error estndar de la media
muestral respecto de la media poblacional.
Estas propiedades se desprenden inmediatamente de las propiedades
enunciadas anteriormente en el apartado 2.2.1. de la Unidad 2 para la
esperanza y varianza de una variable aleatoria cualquiera como se puede
verificar a continuacin.

COMIENZO DE TEXTO APARTE
P.1

E( X )= E
X
i
1=1
n

n












= E
1
n
. X
i
i=1
n






=
1
n
. E( X
i
) =
1
n
. n .
i=1
n

=

P.2

V( X )= V
X
i
1=1
n

n












= V
1
n
. X
i
i=1
n






=
1
n
2
. V( X
i
) =
1
n
2
. n .
2
i=1
n

=

2
n

FIN DE TEXTO APARTE


3.1.2. Distribucin del estadstico proporcin muestral

En el grfico G.3.4. se representa la distribucin de la poblacin terica
de las proporciones de empleados mayores a 45 aos de todas las
muestras de un cierto tamao n superior a 100.

Insertar Imagen N G.3.4.
G.3.4.


4
para la cual su media muestral es un elemento de la poblacin terica
de se verifican las siguientes propiedades.

P.1 E( ) =

X
=

COMIENZO DE PASTILLA EN P.1
Esta propiedad est relacionada con la cualidad de insesgabilidad del estimador .
FIN DE PASTILLA

P.2 V( ) =

X
2
=

2
n
DS( ) =

X
=

n


El desvo estndar tambin se denomina error estndar de la media
muestral respecto de la media poblacional.
Estas propiedades se desprenden inmediatamente de las propiedades
enunciadas anteriormente en el apartado 2.2.1. de la Unidad 2 para la
esperanza y varianza de una variable aleatoria cualquiera como se puede
verificar a continuacin.

COMIENZO DE TEXTO APARTE
P.1

E( X )= E
X
i
1=1
n

n












= E
1
n
. X
i
i=1
n






=
1
n
. E( X
i
) =
1
n
. n .
i=1
n

=

P.2

V( X )= V
X
i
1=1
n

n












= V
1
n
. X
i
i=1
n






=
1
n
2
. V( X
i
) =
1
n
2
. n .
2
i=1
n

=

2
n

FIN DE TEXTO APARTE


3.1.2. Distribucin del estadstico proporcin muestral

En el grfico G.3.4. se representa la distribucin de la poblacin terica
de las proporciones de empleados mayores a 45 aos de todas las
muestras de un cierto tamao n superior a 100.

Insertar Imagen N G.3.4.
G.3.4.


4
para la cual su media muestral es un elemento de la poblacin terica
de se verifican las siguientes propiedades.

P.1 E( ) =

X
=

COMIENZO DE PASTILLA EN P.1
Esta propiedad est relacionada con la cualidad de insesgabilidad del estimador .
FIN DE PASTILLA

P.2 V( ) =

X
2
=

2
n
DS( ) =
X
=

n


El desvo estndar tambin se denomina error estndar de la media
muestral respecto de la media poblacional.
Estas propiedades se desprenden inmediatamente de las propiedades
enunciadas anteriormente en el apartado 2.2.1. de la Unidad 2 para la
esperanza y varianza de una variable aleatoria cualquiera como se puede
verificar a continuacin.

COMIENZO DE TEXTO APARTE
P.1

E( X )= E
X
i
1=1
n

n












= E
1
n
. X
i
i=1
n






=
1
n
. E( X
i
) =
1
n
. n .
i=1
n

=

P.2

V( X )= V
X
i
1=1
n

n












= V
1
n
. X
i
i=1
n






=
1
n
2
. V( X
i
) =
1
n
2
. n .
2
i=1
n

=

2
n

FIN DE TEXTO APARTE


3.1.2. Distribucin del estadstico proporcin muestral

En el grfico G.3.4. se representa la distribucin de la poblacin terica
de las proporciones de empleados mayores a 45 aos de todas las
muestras de un cierto tamao n superior a 100.

Insertar Imagen N G.3.4.
G.3.4.


Esta propiedad est rela-
cionada con la cualidad
de insesgabilidad del estimador X.
35
Distribucin de la poblacin de las medias muestras (n>30)
Medias muestrales
Grfico.3.3
0,11 1 0
Distribucin de la poblacin de las proporciones muestras (n>100)
Proporciones muestrales
Grfico.3.4
Grfico.3.5
Grfico.3.6

X
a b
1-
En la poblacin original, la proporcin de los empleados mayores a 45 aos es:
P(>45) = 0,11
y los parmetros de la distribucin grfico 3.4. de las proporciones mues-
trales son:

p
=0,11 y
2
p
=0,0002
Conclusin:

p
=P
Y las varianzas disminuyen proporcionalmente al tamao n de la muestra.
Adems, si las muestras extradas de la poblacin fueran chicas, la distribu-
cin de la poblacin de las proporciones muestrales no necesariamente resul-
tara aproximadamente normal.
Propiedades de la variable aleatoria proporcin muestral
Si en una determinada poblacin caracterizada por una variable aleatoria X, se
efecta un experimento binomial con parmetros n y P y en consecuencia con
esperanza = n.P y varianza
2
= n. P. ( 1- P) , se selecciona slo una muestra
aleatoria de tamao n de dicha poblacin para la cual su proporcin muestral
de xito p verifica las siguientes propiedades:
El desvo estndar
p
tambin se denomina error estndar de la proporcin
muestral respecto de la proporcin poblacional.
Estas propiedades, al igual que las de la media muestral, se desprenden
inmediatamente de las enunciadas anteriormente en el apartado 2.2.1. de la
Unidad 2 para la esperanza y varianza de una variable aleatoria cualquiera.
3.1.3. Teorema central del lmite
El teorema central del lmite formaliza el comportamiento asintticamente nor-
mal, bajo determinadas condiciones, de la distribucin de una variable aleato-
ria, en particular el de las variables aleatorias media y proporcin muestrales.
Tambin denominado teorema del lmite central, el Teorema central del lmite
TCL como resultante de una construccin colectiva es factible de enunciar-
se, siguiendo a Meyer (1986) de la siguiente manera.
91
Estadistica
5

En la poblacin original, la proporcin de los empleados mayores a 45
aos es:
P(>45) = 0,11

y los parmetros de la distribucin G.3.4. de las proporciones
muestrales son:

p
= 0,11 y
p
2
= 0, 0002

Conclusin:

p
= P

Y las varianzas disminuyen proporcionalmente al tamao n de la
muestra.



p
2
=
P.(1- P)
n


Adems, si las muestras extradas de la poblacin fueran chicas, la
distribucin de la poblacin de las proporciones muestrales no
necesariamente resultara aproximadamente normal.

Propiedades de la variable aleatoria proporcin muestral

Si en una determinada poblacin caracterizada por una variable
aleatoria X, se efecta un experimento binomial con parmetros n y P y
en consecuencia con esperanza = n.P y varianza
2
= n.P.(1-P), se
selecciona slo una muestra aleatoria de tamao n de dicha poblacin
para la cual su proporcin muestral de xito p verifica las siguientes
propiedades.

P.1 E(p) =
P
= P

P.2 V(p) =
p
2
=
P.(1- P)
n
DS(x) =
P
=
P.(1- P)
n


El desvo estndar tambin se denomina error estndar de la
proporcin muestral respecto de la proporcin poblacional.
Estas propiedades, al igual que las de la media muestral, se
desprenden inmediatamente de las enunciadas anteriormente en el
apartado 2.2.1. de la Unidad 2 para la esperanza y varianza de una
variable aleatoria cualquiera.


3.1.3. Teorema central del lmite

El teorema central del lmite formaliza el comportamiento
asintticamente normal, bajo determinadas condiciones, de la
5

En la poblacin original, la proporcin de los empleados mayores a 45
aos es:
P(>45) = 0,11

y los parmetros de la distribucin G.3.4. de las proporciones
muestrales son:

p
= 0,11 y
p
2
= 0, 0002

Conclusin:

p
= P

Y las varianzas disminuyen proporcionalmente al tamao n de la
muestra.


p
2
=
P.(1- P)
n


Adems, si las muestras extradas de la poblacin fueran chicas, la
distribucin de la poblacin de las proporciones muestrales no
necesariamente resultara aproximadamente normal.

Propiedades de la variable aleatoria proporcin muestral

Si en una determinada poblacin caracterizada por una variable
aleatoria X, se efecta un experimento binomial con parmetros n y P y
en consecuencia con esperanza = n.P y varianza
2
= n.P.(1-P), se
selecciona slo una muestra aleatoria de tamao n de dicha poblacin
para la cual su proporcin muestral de xito p verifica las siguientes
propiedades.

P.1 E(p) =
P
= P

P.2 V(p) =


p
2
=
P.(1- P)
n


DS(x) =
P
=
P.(1- P)
n


El desvo estndar tambin se denomina error estndar de la
proporcin muestral respecto de la proporcin poblacional.
Estas propiedades, al igual que las de la media muestral, se
desprenden inmediatamente de las enunciadas anteriormente en el
apartado 2.2.1. de la Unidad 2 para la esperanza y varianza de una
variable aleatoria cualquiera.


3.1.3. Teorema central del lmite

El teorema central del lmite formaliza el comportamiento
asintticamente normal, bajo determinadas condiciones, de la
Teorema Central del
Lmite o Teorema del
Lmite Central de De Moivre (1733)
Laplace (~1810) y otros.
Sean X
1
, X
2
,X
n
... una sucesin de variables aleatorias independientes con
E(X
i
) =
i
y V(X
i
) =
i
2
, i = 1, 2,
Sea X = X
1
+ X
2
+ + X
n.
Luego, para n tendiendo a infinito, la X tiene distribucin asintticamente nor-
mal con
Este teorema nos est diciendo que si una variable aleatoria es la suma de
n variables aleatorias independientes entonces esa variable aleatoria suma ten-
dr distribucin normal, para n grande.
En particular si tales n variables aleatorias independientes tienen todas
distribucin normal entonces se verifica que su suma tiene distribucin nor-
mal, para cualquier valor de n.
Como corolario, se concluye que bajo determinadas condiciones, las
distribuciones de la media y proporcin muestral son normales.
Ejemplos
Teniendo en cuenta la informacin poblacional de las edades de los 497 emple-
ados de una empresa (ver apartados 3.1.1. y 3.1.2.) a saber: la edad media
poblacional es de 35 aos con un desvo estndar de 9,105 aos y una pro-
porcin de empleados mayores a 45 aos del 11%, si se proyectara abrir un
anexo cercano a la empresa con parte del personal y para ello se van a ele-
gir al azar 119 empleados, podemos formularnos las siguientes preguntas:
1)
a. Cul ser la probabilidad de que la edad media de la muestra de 119
empleados que trabajarn en el nuevo anexo sea inferior a los 34 aos?
Como n = 119 es una muestra grande entonces
Por lo tanto
92
Universidad Virtual de Quilmes
6
distribucin de una variable aleatoria, en particular el de las variables
aleatorias media y proporcin muestrales.
Tambin denominado teorema del lmite central, el Teorema central
del lmite TCL como resultante de una construccin colectiva es
factible de enunciarse, siguiendo a Meyer (1986) de la siguiente manera.

COMIENZO DE PASTILLA EN Teorema central del lmite
Teorema Central del Lmite o Teorema del Lmite Central de De Moivre (1733)
Laplace (~1810) y otros.
FIN DE PASTILLA

Sean X
1,
X
2,
X
n
... una sucesin de variables aleatorias independientes
con E(X
i
) =
i
y V(X
i
) =
,
i = 1, 2,

Sea X = X
1
+ X
2
+ + X
n.

Luego, para n tendiendo a infinito, la X tiene distribucin
asintticamente normal con

=
i
i=1
n

y
2
=
i
2
i=1
n



Este teorema nos est diciendo que si una variable aleatoria es la suma
de n variables aleatorias independientes entonces esa variable aleatoria
suma tendr distribucin normal, para n grande.
En particular si tales n variables aleatorias independientes tienen
todas distribucin normal entonces se verifica que su suma tiene
distribucin normal, para cualquier valor de n.


COMIENZO DE LEER ATENTO
Como corolario, se concluye que bajo determinadas condiciones,
las distribuciones de la media y proporcin muestral son
normales.


FIN DE LEER ATENTO

Ejemplos
Teniendo en cuenta la informacin poblacional de las edades de los 497
empleados de una empresa (ver apartados 3.1.1. y 3.1.2.) a saber: la
edad media poblacional es de 35 aos con un desvo estndar de 9,105
aos y una proporcin de empleados mayores a 45 aos del 11%, si se
proyectara abrir un anexo cercano a la empresa con parte del personal y
para ello se van a elegir al azar 119 empleados, podemos formularnos
las siguientes preguntas:

6
distribucin de una variable aleatoria, en particular el de las variables
aleatorias media y proporcin muestrales.
Tambin denominado teorema del lmite central, el Teorema central
del lmite TCL como resultante de una construccin colectiva es
factible de enunciarse, siguiendo a Meyer (1986) de la siguiente manera.

COMIENZO DE PASTILLA EN Teorema central del lmite
Teorema Central del Lmite o Teorema del Lmite Central de De Moivre (1733)
Laplace (~1810) y otros.
FIN DE PASTILLA

Sean X
1,
X
2,
X
n
... una sucesin de variables aleatorias independientes
con E(X
i
) =
i
y V(X
i
) =
,
i = 1, 2,

Sea X = X
1
+ X
2
+ + X
n.

Luego, para n tendiendo a infinito, la X tiene distribucin
asintticamente normal con

=
i
i=1
n

y
2
=
i
2
i=1
n



Este teorema nos est diciendo que si una variable aleatoria es la suma
de n variables aleatorias independientes entonces esa variable aleatoria
suma tendr distribucin normal, para n grande.
En particular si tales n variables aleatorias independientes tienen
todas distribucin normal entonces se verifica que su suma tiene
distribucin normal, para cualquier valor de n.


COMIENZO DE LEER ATENTO
Como corolario, se concluye que bajo determinadas condiciones,
las distribuciones de la media y proporcin muestral son
normales.


FIN DE LEER ATENTO

Ejemplos
Teniendo en cuenta la informacin poblacional de las edades de los 497
empleados de una empresa (ver apartados 3.1.1. y 3.1.2.) a saber: la
edad media poblacional es de 35 aos con un desvo estndar de 9,105
aos y una proporcin de empleados mayores a 45 aos del 11%, si se
proyectara abrir un anexo cercano a la empresa con parte del personal y
para ello se van a elegir al azar 119 empleados, podemos formularnos
las siguientes preguntas:

7
1)
a. Cul ser la probabilidad de que la edad media de la muestra de 119
empleados que trabajarn en el nuevo anexo sea inferior a los 34
aos?
Como n = 119 es una muestra grande entonces N

35,
9,105
119







Por lo tanto
P(X < 34 aos) = P z <
34 - 35
9,105
119












= P(z < 1,198 ) = F (1, 20 ) = 0,1151
La probabilidad de que la media de edad de los empleados que
trabajaran en el nuevo anexo sea inferior a 34 aos es 0,1151.

b. Cul ser la probabilidad de que la edad media de los 119 empleados
supere los 37 aos?

P(X > 37 aos) = P z >
37 - 35
9,105
119












= P(z > 2, 40) =1F (2, 40 ) =1 0, 9918 = 0, 0082
La probabilidad de que la edad media de los empleados supere los 37
aos es 0,0082.

2)
Cul ser la probabilidad de que la proporcin de los empleados
mayores a 45 aos del nuevo anexo sea inferior al 10%.

P(p < 0,10) = P z <
0,10 - 0,11
0,11.0, 89
119












= P(z < -0, 35) = F(-0, 35 ) = 0, 3632

La probabilidad de que la proporcin de los empleados mayores a 45
aos del nuevo anexo sea inferior al 10% es 0,3632.

COMIENZO DE ACTIVIDAD
1.
a. Una carpintera recibe peridicamente grandes partidas de
postes de madera de longitud media de 4 metros procedentes de
un aserradero. Sabiendo que la precisin del proceso de cortado
de los postes est dada por un desvo estndar de 3,5 cm.
i. Cul es la probabilidad de que un poste elegido al azar mida
entre 3,98 y 4,03 metros?
ii. Si se elige una muestra de 80 postes de la ltima partida
recibida, cul es la probabilidad de que la longitud media de la
muestra est comprendida entre 3,98 y 4,03 metros?
iii. Cul es la diferencia entre i) y ii) ? Justifique.

7
1)
a. Cul ser la probabilidad de que la edad media de la muestra de 119
empleados que trabajarn en el nuevo anexo sea inferior a los 34
aos?
Como n = 119 es una muestra grande entonces N

35,
9,105
119







Por lo tanto

P(X < 34 aos) = P z <
34 - 35
9,105
119












= P(z < 1,198 ) = F (1, 20 ) = 0,1151
La probabilidad de que la media de edad de los empleados que
trabajaran en el nuevo anexo sea inferior a 34 aos es 0,1151.

b. Cul ser la probabilidad de que la edad media de los 119 empleados
supere los 37 aos?

P(X > 37 aos) = P z >
37 - 35
9,105
119












= P(z > 2, 40) =1F (2, 40 ) =1 0, 9918 = 0, 0082
La probabilidad de que la edad media de los empleados supere los 37
aos es 0,0082.

2)
Cul ser la probabilidad de que la proporcin de los empleados
mayores a 45 aos del nuevo anexo sea inferior al 10%.

P(p < 0,10) = P z <
0,10 - 0,11
0,11.0, 89
119












= P(z < -0, 35) = F(-0, 35 ) = 0, 3632

La probabilidad de que la proporcin de los empleados mayores a 45
aos del nuevo anexo sea inferior al 10% es 0,3632.

COMIENZO DE ACTIVIDAD
1.
a. Una carpintera recibe peridicamente grandes partidas de
postes de madera de longitud media de 4 metros procedentes de
un aserradero. Sabiendo que la precisin del proceso de cortado
de los postes est dada por un desvo estndar de 3,5 cm.
i. Cul es la probabilidad de que un poste elegido al azar mida
entre 3,98 y 4,03 metros?
ii. Si se elige una muestra de 80 postes de la ltima partida
recibida, cul es la probabilidad de que la longitud media de la
muestra est comprendida entre 3,98 y 4,03 metros?
iii. Cul es la diferencia entre i) y ii) ? Justifique.

La probabilidad de que la media de edad de los empleados que trabajaran en
el nuevo anexo sea inferior a 34 aos es 0,1151.
b. Cul ser la probabilidad de que la edad media de los 119 empleados
supere los 37 aos?
La probabilidad de que la edad media de los empleados supere los 37 aos
es 0,0082.
2)
Cul ser la probabilidad de que la proporcin de los empleados mayores a
45 aos del nuevo anexo sea inferior al 10%?
La probabilidad de que la proporcin de los empleados mayores a 45 aos
del nuevo anexo sea inferior al 10% es 0,3632.
1.
a. Una carpintera recibe peridicamente grandes partidas de postes de
madera de longitud media de 4 metros procedentes de un aserrade-
ro. Sabiendo que la precisin del proceso de cortado de los postes
est dada por un desvo estndar de 3,5 cm.
i. Cul es la probabilidad de que un poste elegido al azar mida entre
3,98 y 4,03 metros?
ii. Si se elige una muestra de 80 postes de la ltima partida recibi-
da, cul es la probabilidad de que la longitud media de la muestra
est comprendida entre 3,98 y 4,03 metros?
iii. Cul es la diferencia entre i) y ii) ? Justifique.
b. Una inmobiliaria de Quilmes ha cambiado su poltica de alquileres
introduciendo una opcin de alquiler a sola firma. Actualmente el
55% de los departamentos que ofrece son con esta modalidad. Del
archivo de alquileres de la inmobiliaria se tom una muestra aleato-
ria de 180 fichas. Cul es la probabilidad de que la proporcin de
inquilinos sin garante est comprendida entre el 48% y el 60%?
93
Estadistica
7
1)
a. Cul ser la probabilidad de que la edad media de la muestra de 119
empleados que trabajarn en el nuevo anexo sea inferior a los 34
aos?
Como n = 119 es una muestra grande entonces N

35,
9,105
119







Por lo tanto
P(X < 34 aos) = P z <
34 - 35
9,105
119












= P(z < 1,198 ) = F (1, 20 ) = 0,1151
La probabilidad de que la media de edad de los empleados que
trabajaran en el nuevo anexo sea inferior a 34 aos es 0,1151.

b. Cul ser la probabilidad de que la edad media de los 119 empleados
supere los 37 aos?

P(X > 37 aos) = P z >
37 - 35
9,105
119












= P(z > 2, 40) =1F (2, 40 ) =1 0, 9918 = 0, 0082
La probabilidad de que la edad media de los empleados supere los 37
aos es 0,0082.

2)
Cul ser la probabilidad de que la proporcin de los empleados
mayores a 45 aos del nuevo anexo sea inferior al 10%.

P(p < 0,10) = P z <
0,10 - 0,11
0,11.0, 89
119












= P(z < -0, 35) = F(-0, 35 ) = 0, 3632

La probabilidad de que la proporcin de los empleados mayores a 45
aos del nuevo anexo sea inferior al 10% es 0,3632.

COMIENZO DE ACTIVIDAD
1.
a. Una carpintera recibe peridicamente grandes partidas de
postes de madera de longitud media de 4 metros procedentes de
un aserradero. Sabiendo que la precisin del proceso de cortado
de los postes est dada por un desvo estndar de 3,5 cm.
i. Cul es la probabilidad de que un poste elegido al azar mida
entre 3,98 y 4,03 metros?
ii. Si se elige una muestra de 80 postes de la ltima partida
recibida, cul es la probabilidad de que la longitud media de la
muestra est comprendida entre 3,98 y 4,03 metros?
iii. Cul es la diferencia entre i) y ii) ? Justifique.

7
1)
a. Cul ser la probabilidad de que la edad media de la muestra de 119
empleados que trabajarn en el nuevo anexo sea inferior a los 34
aos?
Como n = 119 es una muestra grande entonces N

35,
9,105
119







Por lo tanto
P(X < 34 aos) = P z <
34 - 35
9,105
119












= P(z < 1,198 ) = F (1, 20 ) = 0,1151
La probabilidad de que la media de edad de los empleados que
trabajaran en el nuevo anexo sea inferior a 34 aos es 0,1151.

b. Cul ser la probabilidad de que la edad media de los 119 empleados
supere los 37 aos?

P(X > 37 aos) = P z >
37 - 35
9,105
119












= P(z > 2, 40) =1F (2, 40 ) =1 0, 9918 = 0, 0082
La probabilidad de que la edad media de los empleados supere los 37
aos es 0,0082.

2)
Cul ser la probabilidad de que la proporcin de los empleados
mayores a 45 aos del nuevo anexo sea inferior al 10%.


P(p < 0,10) = P z <
0,10 - 0,11
0,11.0, 89
119












= P(z < -0, 35) = F(-0, 35 ) = 0, 3632

La probabilidad de que la proporcin de los empleados mayores a 45
aos del nuevo anexo sea inferior al 10% es 0,3632.

COMIENZO DE ACTIVIDAD
1.
a. Una carpintera recibe peridicamente grandes partidas de
postes de madera de longitud media de 4 metros procedentes de
un aserradero. Sabiendo que la precisin del proceso de cortado
de los postes est dada por un desvo estndar de 3,5 cm.
i. Cul es la probabilidad de que un poste elegido al azar mida
entre 3,98 y 4,03 metros?
ii. Si se elige una muestra de 80 postes de la ltima partida
recibida, cul es la probabilidad de que la longitud media de la
muestra est comprendida entre 3,98 y 4,03 metros?
iii. Cul es la diferencia entre i) y ii) ? Justifique.

3.2. Problemas fundamentales de la inferencia
estadstica
En la vida cotidiana, como en el campo cientfico o profesional, surgen situa-
ciones caracterizadas por la incertidumbre pese a lo cual deben tomarse deci-
siones sustentadas usualmente en los modelos tericos elaborados con base
en observaciones previas de fenmenos similares.
Los dos problemas fundamentales que ataen a la inferencia estadstica
son la estimacin de un parmetro desconocido y las pruebas de hiptesis
cuyas soluciones se basan necesariamente en la evidencia muestral.
3.2.1. Estimacin por intervalo de confianza
La estimacin por intervalo de confianza de un parmetro desconoci-
do consiste en construir a partir de la evidencia muestral un interva-
lo o rango continuo de valores que contendra, con una cierta probabi-
lidad asociada, el verdadero valor del parmetro poblacional.
Por ejemplo, toda persona que realiza una rutina diaria de su casa al trabajo
de hecho est colectando evidencia muestral sobre el tiempo que le insume
el viaje. A partir de las veces que anteriormente hizo el recorrido casa-traba-
jo (lo que constituye un muestreo) estima un cierto intervalo de tiempo que
empleara un da cualquiera en llegar a su trabajo (se entiende, siguiendo la
rutina cotidiana), con una cierta probabilidad.
En el relato anterior se pueden identificar casi completamente todos los ele-
mentos necesarios para la construccin de un intervalo de confianza, a saber:
la evidencia muestral, el nivel de confianza la probabilidad de la estimacin
y el parmetro tiempo esperado a estimar.
La construccin de intervalos de confianza se basa en las distribuciones
que tienen los estadsticos muestrales, o estimadores de los parmetros
poblacionales, ya vistas en el apartado 3.1.
Intervalos de confianza para la media poblacional
Antes de abocarnos al clculo de intervalos desarrollaremos los fundamen-
tos de su construccin. Mantengamos por el momento la pauta del apartado
anterior de contar con una poblacin cuyos y son conocidos y que de ella
se extraer una muestra de tamao n.
La distribucin de los X alrededor de bajo las condiciones generales
expuestas en 3.1.3., se representa de la siguiente forma:
94
Universidad Virtual de Quilmes
Grfico 3.5.
Si en vez de interesarnos en preguntas como P(X>a) P(X<b) nos plantera-
mos una del tipo P(a<x<b) con a y b equidistantes de .,el rea sombreada
(denominada 1)ser la respuesta.
Grfico 3.6.
Si 1 es la probabilidad de que x caiga dentro del intervalo [a,b] entonces
ser la probabilidad de que x caiga fuera de l. Como se puede advertir que-
dar partido en dos, porque estamos considerando un intervalo simtrico alre-
dedor de . Y estandarizando segn Z se tiene lo siguiente.
Grfico 3.7.
95
Estadistica
35
Distribucin de la poblacin de las medias muestras (n>30)
Medias muestrales
Grfico.3.3
0,11 1 0
Distribucin de la poblacin de las proporciones muestras (n>100)
Proporciones muestrales
Grfico.3.4
Grfico.3.5
Grfico.3.6

X
a b
1-
35
Distribucin de la poblacin de las medias muestras (n>30)
Medias muestrales
Grfico.3.3
0,11 1 0
Distribucin de la poblacin de las proporciones muestras (n>100)
Proporciones muestrales
Grfico.3.4
Grfico.3.5
Grfico.3.6

X
a b
1-

X
X
a
Z Z
Z
b
1-
/2
/2 1/2
/2
-Z Z Z
1-
/2
/2 1/2
/2
0
gl grande
gl mediano
gl chico
G.3.7
G.3.8
G.3.10
G.3.9.
Lmite inferior
del intervalo
mx
Lmite superior
del intervalo

mx

Los subndices de los Z estn en relacin con el criterio de acumulacin de la


tabla de la distribucin normal estndar. Como el punto a acumula /2 de
probabilidad su estandarizado Z ser Z
/2
y como el punto b acumula 1/2
de probabilidad su estandarizado ser Z
1/2
. En rigor Z
/2
y Z
1-/2
son igua-
les en valor absoluto pero tienen signo contrario.
Grfico 3.8.
Entonces estandarizando la variable X
el clculo de la probabilidad planteada ser:
Luego, despejando de
96
Universidad Virtual de Quilmes

X
X
a
Z Z
Z
b
1-
/2
/2 1/2
/2
-Z Z Z
1-
/2
/2 1/2
/2
0
gl grande
gl mediano
gl chico
G.3.7
G.3.8
G.3.10
G.3.9.
Lmite inferior
del intervalo
mx
Lmite superior
del intervalo

mx

10


Los subndices de los Z estn en relacin con el criterio de acumulacin
de la tabla de la distribucin normal estndar. Como el punto a
acumula /2 de probabilidad su estandarizado Z ser Z
/2
y como el
punto b acumula 1/2 de probabilidad su estandarizado ser Z
1/2
.
En rigor Z
/2
y Z
1-/2
son iguales en valor absoluto pero tienen signo
contrario.

Insertar Imagen N G.3.8.
G.3.8.



Entonces estandarizando la variable

Z =
x

n


el clculo de la probabilidad planteada ser:


P(a < x < b) = P
a -

n
<
x

n
<
b

n












=1
P(a < x < b) = P Z

2
<
x

n
< Z
1

2












=1
P(a < x < b) = P Z
1

2
<
x

n
< Z
1

2












=1


Luego, despejando de
10


Los subndices de los Z estn en relacin con el criterio de acumulacin
de la tabla de la distribucin normal estndar. Como el punto a
acumula /2 de probabilidad su estandarizado Z ser Z
/2
y como el
punto b acumula 1/2 de probabilidad su estandarizado ser Z
1/2
.
En rigor Z
/2
y Z
1-/2
son iguales en valor absoluto pero tienen signo
contrario.

Insertar Imagen N G.3.8.
G.3.8.



Entonces estandarizando la variable

Z =
x

n


el clculo de la probabilidad planteada ser:


P(a < x < b) = P
a -

n
<
x

n
<
b

n












=1
P(a < x < b) = P Z

2
<
x

n
< Z
1

2












=1
P(a < x < b) = P Z
1

2
<
x

n
< Z
1

2












=1


Luego, despejando de
11

P Z
1

2
<
x

n
< Z
1

2












=1


se tiene
P Z
1

2
.

n
< x < Z
1

2
.

n





=1


Como es conocido, es la diferencia que podra haber entre la
media de la muestra que se seleccionar y la media conocida de la
poblacin. Por su naturaleza, a esta diferencia la consideramos como
error.
es el error de la media muestral respecto de la media
poblacional y 1- es su probabilidad. El mximo valor que puede
tomar ese error o error mximo , en valor absoluto es

mx
= z
1

2
.

n


Puede observarse que cuando se agranda el tamao de la muestra el
error mximo se achica y lo mismo ocurre cuando disminuye el nivel de
confianza. Como ambos casos tienen distintas connotaciones se
analizarn con ms detalle al abordar la construccin de los intervalos.
En la realidad concreta de los problemas estadsticos, en general no
se conoce el valor de la media poblacional de ah la necesidad de su
estimacin y para ello se utiliza la evidencia muestral y la informacin
poblacional que se posea como el tipo de distribucin poblacional
(normal o no) y el conocimiento de otros parmetros (varianza o desvo
estndar).
El clculo de la estimacin por intervalos de confianza para
presenta distintos casos dependiendo de la informacin poblacional con
que se cuente.


Poblacin normal o aproximadamente normal y
2
conocido
En este caso particular, para la construccin del intervalo de confianza
para , se parte de la expresin del error de la media muestral respecto
de la media poblacional a la que arribamos anteriormente:

P(Z
1

2
.

n
< x < Z
1

2
.

n
) =1

y teniendo en cuenta que ahora la incgnita es la despejamos
obteniendo:

P x z
1
a
2


n
< < x + z
1

2


n





=1

se tiene
Como es conocido, X es la diferencia que podra haber entre la media de
la muestra que se seleccionar y la media conocida de la poblacin. Por su
naturaleza, a esta diferencia la consideramos como error.
X es el error de la media muestral respecto de la media poblacional y 1
es su probabilidad. El mximo valor que puede tomar ese error o error mxi-
mo, en valor absoluto es
Puede observarse que cuando se agranda el tamao de la muestra el error
mximo se achica y lo mismo ocurre cuando disminuye el nivel de confianza.
Como ambos casos tienen distintas connotaciones se analizarn con ms
detalle al abordar la construccin de los intervalos.
En la realidad concreta de los problemas estadsticos, en general, no se
conoce el valor de la media poblacional . De ah la necesidad de su estima-
cin y para ello se utiliza la evidencia muestral y la informacin poblacional que
se posea como el tipo de distribucin poblacional (normal o no) y el conoci-
miento de otros parmetros (varianza o desvo estndar).
El clculo de la estimacin por intervalos de confianza para presenta dis-
tintos casos dependiendo de la informacin poblacional con que se cuente.
Poblacin normal o aproximadamente normal y
2
conocido
En este caso particular, para la construccin del intervalo de confianza para
, se parte de la expresin del error de la media muestral respecto de la
media poblacional a la que arribamos anteriormente:
y teniendo en cuenta que ahora la incgnita es la despejamos obteniendo:
Donde ahora 1- es la probabilidad, la confianza que tenemos de que el
intervalo
97
Estadistica
11

P Z
1

2
<
x

n
< Z
1

2












=1


se tiene

P Z
1

2
.

n
< x < Z
1

2
.

n





=1


Como es conocido, es la diferencia que podra haber entre la
media de la muestra que se seleccionar y la media conocida de la
poblacin. Por su naturaleza, a esta diferencia la consideramos como
error.
es el error de la media muestral respecto de la media
poblacional y 1- es su probabilidad. El mximo valor que puede
tomar ese error o error mximo , en valor absoluto es

mx
= z
1

2
.

n


Puede observarse que cuando se agranda el tamao de la muestra el
error mximo se achica y lo mismo ocurre cuando disminuye el nivel de
confianza. Como ambos casos tienen distintas connotaciones se
analizarn con ms detalle al abordar la construccin de los intervalos.
En la realidad concreta de los problemas estadsticos, en general no
se conoce el valor de la media poblacional de ah la necesidad de su
estimacin y para ello se utiliza la evidencia muestral y la informacin
poblacional que se posea como el tipo de distribucin poblacional
(normal o no) y el conocimiento de otros parmetros (varianza o desvo
estndar).
El clculo de la estimacin por intervalos de confianza para
presenta distintos casos dependiendo de la informacin poblacional con
que se cuente.


Poblacin normal o aproximadamente normal y
2
conocido
En este caso particular, para la construccin del intervalo de confianza
para , se parte de la expresin del error de la media muestral respecto
de la media poblacional a la que arribamos anteriormente:

P(Z
1

2
.

n
< x < Z
1

2
.

n
) =1

y teniendo en cuenta que ahora la incgnita es la despejamos
obteniendo:

P x z
1
a
2


n
< < x + z
1

2


n





=1

11

P Z
1

2
<
x

n
< Z
1

2












=1


se tiene
P Z
1

2
.

n
< x < Z
1

2
.

n





=1


Como es conocido, es la diferencia que podra haber entre la
media de la muestra que se seleccionar y la media conocida de la
poblacin. Por su naturaleza, a esta diferencia la consideramos como
error.
es el error de la media muestral respecto de la media
poblacional y 1- es su probabilidad. El mximo valor que puede
tomar ese error o error mximo , en valor absoluto es

mx
= z
1

2
.

n


Puede observarse que cuando se agranda el tamao de la muestra el
error mximo se achica y lo mismo ocurre cuando disminuye el nivel de
confianza. Como ambos casos tienen distintas connotaciones se
analizarn con ms detalle al abordar la construccin de los intervalos.
En la realidad concreta de los problemas estadsticos, en general no
se conoce el valor de la media poblacional de ah la necesidad de su
estimacin y para ello se utiliza la evidencia muestral y la informacin
poblacional que se posea como el tipo de distribucin poblacional
(normal o no) y el conocimiento de otros parmetros (varianza o desvo
estndar).
El clculo de la estimacin por intervalos de confianza para
presenta distintos casos dependiendo de la informacin poblacional con
que se cuente.


Poblacin normal o aproximadamente normal y
2
conocido
En este caso particular, para la construccin del intervalo de confianza
para , se parte de la expresin del error de la media muestral respecto
de la media poblacional a la que arribamos anteriormente:

P(Z
1

2
.

n
< x < Z
1

2
.

n
) =1

y teniendo en cuenta que ahora la incgnita es la despejamos
obteniendo:

P x z
1
a
2


n
< < x + z
1

2


n





=1

11

P Z
1

2
<
x

n
< Z
1

2












=1


se tiene
P Z
1

2
.

n
< x < Z
1

2
.

n





=1


Como es conocido, es la diferencia que podra haber entre la
media de la muestra que se seleccionar y la media conocida de la
poblacin. Por su naturaleza, a esta diferencia la consideramos como
error.
es el error de la media muestral respecto de la media
poblacional y 1- es su probabilidad. El mximo valor que puede
tomar ese error o error mximo , en valor absoluto es

mx
= z
1

2
.

n


Puede observarse que cuando se agranda el tamao de la muestra el
error mximo se achica y lo mismo ocurre cuando disminuye el nivel de
confianza. Como ambos casos tienen distintas connotaciones se
analizarn con ms detalle al abordar la construccin de los intervalos.
En la realidad concreta de los problemas estadsticos, en general no
se conoce el valor de la media poblacional de ah la necesidad de su
estimacin y para ello se utiliza la evidencia muestral y la informacin
poblacional que se posea como el tipo de distribucin poblacional
(normal o no) y el conocimiento de otros parmetros (varianza o desvo
estndar).
El clculo de la estimacin por intervalos de confianza para
presenta distintos casos dependiendo de la informacin poblacional con
que se cuente.


Poblacin normal o aproximadamente normal y
2
conocido
En este caso particular, para la construccin del intervalo de confianza
para , se parte de la expresin del error de la media muestral respecto
de la media poblacional a la que arribamos anteriormente:


P(Z
1

2
.

n
< x < Z
1

2
.

n
) =1

y teniendo en cuenta que ahora la incgnita es la despejamos
obteniendo:

P x z
1
a
2


n
< < x + z
1

2


n





=1

11

P Z
1

2
<
x

n
< Z
1

2












=1


se tiene
P Z
1

2
.

n
< x < Z
1

2
.

n





=1


Como es conocido, es la diferencia que podra haber entre la
media de la muestra que se seleccionar y la media conocida de la
poblacin. Por su naturaleza, a esta diferencia la consideramos como
error.
es el error de la media muestral respecto de la media
poblacional y 1- es su probabilidad. El mximo valor que puede
tomar ese error o error mximo , en valor absoluto es

mx
= z
1

2
.

n


Puede observarse que cuando se agranda el tamao de la muestra el
error mximo se achica y lo mismo ocurre cuando disminuye el nivel de
confianza. Como ambos casos tienen distintas connotaciones se
analizarn con ms detalle al abordar la construccin de los intervalos.
En la realidad concreta de los problemas estadsticos, en general no
se conoce el valor de la media poblacional de ah la necesidad de su
estimacin y para ello se utiliza la evidencia muestral y la informacin
poblacional que se posea como el tipo de distribucin poblacional
(normal o no) y el conocimiento de otros parmetros (varianza o desvo
estndar).
El clculo de la estimacin por intervalos de confianza para
presenta distintos casos dependiendo de la informacin poblacional con
que se cuente.


Poblacin normal o aproximadamente normal y
2
conocido
En este caso particular, para la construccin del intervalo de confianza
para , se parte de la expresin del error de la media muestral respecto
de la media poblacional a la que arribamos anteriormente:

P(Z
1

2
.

n
< x < Z
1

2
.

n
) =1

y teniendo en cuenta que ahora la incgnita es la despejamos
obteniendo:

P x z
1
a
2


n
< < x + z
1

2


n





=1

contenga al verdadero valor de .
El mismo intervalo (con una probabilidad 1 asociada) que anteriormen-
te se ubicaba alrededor del , ahora se ubica alrededor del X para poder esti-
mar (con una confianza 1) el desconocido.

Ntese adems que, en rigor, lo nico que se trajo del estudio previo es el
segmento que se coloc sobre X y su probabilidad asociada. No hay una dis-
tribucin sobre l (la distribucin de la muestra, en todo caso, no forma parte
de la construccin que hicimos).
En resumen, los lmites del intervalo se obtienen sumando y restando el
error mximo a la media muestral ya que sta es el centro del intervalo.
Grfico 3.9.
Por lo tanto, al intervalo tambin se lo puede expresar del siguiente modo:
Como el error mximo disminuye cuando aumenta el
tamao de la muestra o cuando es menor el nivel de confianza, entonces:
Si aumenta el tamao de la muestra, para un mismo nivel de confianza
el valor de z se mantiene constante se obtiene un intervalo de menor
amplitud que implica mayor precisin en la estimacin.
Si disminuye el nivel de confianza (manteniendo el tamao de la muestra) se
obtiene un intervalo de menor amplitud pero eso no implica mejorar la preci-
sin ya que el intervalo tendr menor probabilidad de contener al parmetro.
Ejemplo
Con el fin de controlar el proceso de llenado de paquetes de galletitas de
medio kilo, se seleccionaron al azar 16 de esos paquetes y el peso en gramos
de cada uno de ellos fue el siguiente: 505; 510; 495; 508; 504; 512; 496;
512; 514; 505; 493; 496; 506; 502; 509; 497.
Como informacin adicional se conoce por catlogo de compra de la mqui-
na que la precisin de ella al envasar est dada por un desvo estndar de
= 5 gramos.
98
Universidad Virtual de Quilmes

X
X
a
Z Z
Z
b
1-
/2
/2 1/2
/2
-Z Z Z
1-
/2
/2 1/2
/2
0
gl grande
gl mediano
gl chico
G.3.7
G.3.8
G.3.10
G.3.9.
Lmite inferior
del intervalo
mx
Lmite superior
del intervalo

mx

Con base en la muestra de los 16 paquetes estimaremos el peso medio de


todos los paquetes de galletitas envasados por esa mquina, mediante un
intervalo con un nivel de confianza de 0,95.
La informacin con que se cuenta es la siguiente.
Sobre la poblacin:
La distribucin de los pesos de todos los paquetes llenados por la mqui-
na es normal (o aproximadamente normal) porque los procesos de medi-
cin de un mismo valor nominal (medir longitudes, pesar, etc.) entregan
naturalmente poblaciones normales.
El desvo estndar = 5g.
Sobre la muestra:
El tamao de la muestra seleccionada es n = 16.
El peso medio de los paquetes X = 504g.
El desvo estndar S = 6,802g.
Se obtiene el intervalo de confianza para el peso medio m de llenado de los
paquetes, utilizando la expresin:
Sabiendo que el nivel de confianza establecido es 1- = 0,95 calculamos el
valor de 1-/2 y a continuacin buscamos en la tabla el z
1-/2
. Luego z
0,975
=
1,96.
Reemplazando se obtiene:
Concluimos que, con base en una muestra de 16 paquetes y con una con-
fianza del 95%, se estima que el peso medio de todos los paquetes fabrica-
dos se encuentra entre 501,55g y 506,45g.
Supongamos que el error mximo (2,45g) de la estimacin fuera grande para
cumplir con determinadas exigencias del control de calidad. En ese caso sera
necesario mejorar la estimacin achicando el error mximo tomando una mues-
tra de mayor tamao.
La pregunta que surge es de qu tamao deber ser la nueva muestra
para que el error mximo asociado de la futura estimacin sea, por ejemplo
de 1g, obviamente con el mismo nivel de confianza?
99
Estadistica
En la eleccin de un nivel
de confianza, son estn-
dares los valores 0,90; 0,95 o 0,99.
13
Con el fin de controlar el proceso de llenado de paquetes de galletitas de
medio kilo, se seleccionaron al azar 16 de esos paquetes y el peso en
gramos de cada uno de ellos fue el siguiente: 505; 510; 495; 508; 504;
512; 496; 512; 514; 505; 493; 496; 506; 502; 509; 497.
Como informacin adicional se conoce por catlogo de compra de la
mquina que la precisin de ella al envasar est dada por un desvo
estndar de = 5 gramos.
En base a la muestra de los 16 paquetes estimaremos el peso medio
de todos los paquetes de galletitas envasados por esa mquina, mediante
un intervalo con un nivel de confianza de 0,95.

COMIENZO DE PASTILLA EN nivel de confianza
En la eleccin de un nivel de confianza, son estndares los valores 0,90; 0,95 o
0,99.
FIN DE PASTILLA

La informacin con que se cuenta es la siguiente.

Sobre la poblacin:

la distribucin de los pesos de todos los paquetes llenados por
la mquina es normal (o aproximadamente normal) porque los
procesos de medicin de un mismo valor nominal (medir
longitudes, pesar, etc.) entregan naturalmente poblaciones
normales.
el desvo estndar = 5g.

Sobre la muestra:

el tamao de la muestra seleccionada es n = 16.
el peso medio de los paquetes = 504g.
el desvo estndar S = 6,802g.

Se obtiene el intervalo de confianza para el peso medio de llenado de
los paquetes, utilizando la expresin:

I

= x z
1


n
, x + z
1


n







Sabiendo que el nivel de confianza establecido es 1- = 0,95
calculamos el valor de 1-/2 y a continuacin buscamos en la tabla el
z
1-/2
. Luego z
0,975
= 1,96.

Reemplazando se obtiene:

I

= 504 1,96
5
16
,504 +1,96
5
16






= 501, 55; 506, 45
[ ]


Concluimosque, con baseen una muestra de16 paquetesy con una
confianza del 95%, seestima queel peso medio detodoslospaquetes
fabricadosseencuentra entre501,55g y 506,45g.

13
Con el fin de controlar el proceso de llenado de paquetes de galletitas de
medio kilo, se seleccionaron al azar 16 de esos paquetes y el peso en
gramos de cada uno de ellos fue el siguiente: 505; 510; 495; 508; 504;
512; 496; 512; 514; 505; 493; 496; 506; 502; 509; 497.
Como informacin adicional se conoce por catlogo de compra de la
mquina que la precisin de ella al envasar est dada por un desvo
estndar de = 5 gramos.
En base a la muestra de los 16 paquetes estimaremos el peso medio
de todos los paquetes de galletitas envasados por esa mquina, mediante
un intervalo con un nivel de confianza de 0,95.

COMIENZO DE PASTILLA EN nivel de confianza
En la eleccin de un nivel de confianza, son estndares los valores 0,90; 0,95 o
0,99.
FIN DE PASTILLA

La informacin con que se cuenta es la siguiente.

Sobre la poblacin:

la distribucin de los pesos de todos los paquetes llenados por
la mquina es normal (o aproximadamente normal) porque los
procesos de medicin de un mismo valor nominal (medir
longitudes, pesar, etc.) entregan naturalmente poblaciones
normales.
el desvo estndar = 5g.

Sobre la muestra:

el tamao de la muestra seleccionada es n = 16.
el peso medio de los paquetes = 504g.
el desvo estndar S = 6,802g.

Se obtiene el intervalo de confianza para el peso medio de llenado de
los paquetes, utilizando la expresin:
I

= x z
1


n
, x + z
1



Sabiendo que el nivel de confianza establecido es 1- = 0,95
calculamos el valor de 1-/2 y a continuacin buscamos en la tabla el
z
1-/2
. Luego z
0,975
= 1,96.

Reemplazando se obtiene:

I

= 504 1,96
5
16
,504 +1,96
5
16






= 501, 55; 506, 45
[ ]


Concluimosque, con baseen una muestra de16 paquetesy con una
confianza del 95%, seestima queel peso medio detodoslospaquetes
fabricadosseencuentra entre501,55g y 506,45g.

De la frmula del
mx.
se despeja n.
Para poder estimar la media de todos los paquetes envasados por esa mqui-
na con un error mximo de 1g y con una confianza del 95% debern selec-
cionarse como mnimo 97 paquetes.
2.
Con base en la muestra de 20 piezas plsticas de la matriz ME4 con-
signada en el apartado 1.3. de la Unidad 1 y sabiendo que la precisin
de la balanza est definida por un desvo estndar de 1g.
a. Estimar, con un nivel de confianza del 95%, el peso medio de todas
las piezas plsticas fabricadas por esa empresa.
b. En qu se fundamenta la normalidad de la distribucin de todos
los pesos de las piezas plsticas?
Poblacin normal o aproximadamente normal y
2
desconocido
Consideremos ahora que la especificacin de la desviacin estndar pobla-
cional dada en el problema anterior no se conoce, porque se perdi el cat-
logo o porque el fabricante de la mquina no lo provey, o por otras razones.
Podemos realizar igualmente la estimacin de la media poblacional?
Si la poblacin es normal, y estamos en ese caso, es posible calcular el
error mximo reemplazando el s desconocido por su mejor estimador que es
el desvo muestral S. Pero en lugar de la distribucin normal estndar se debe-
r utilizar la distribucin t de Student la cual fue diseada especialmente para
el muestreo en poblaciones normales.
Sean X
1
, X
2
, . . . , X
n
variables aleatorias independientes que son todas normales con media
y desviacin estndar s. Entonces la variable aleatoria tiene una distribucin t
con n-1 grados de libertad.
Caractersticas de la distribucin t de Student
1- Al igual que en la distribucin Normal:
a) El rango de valores de la t de Student vara de - a +
b) Es simtrica respecto de su media.
V(t) siempre mayor a 1 pero si crece el tamao de la muestra, n el desvo tiende a 1 y
la distribucin t es asintticamente normal de parmetros (0, 1)
100
Universidad Virtual de Quilmes
La di st r i buci n t de
Student fue publicada en
1908 por W. S. Gosset bajo el seu-
dnimo de Student.
x
x
3- Es ms aplanada que la Normal por tener mayor dispersin.
4- Hay una familia de curvas de la distribucin t de Student dependiendo de los grados de
libertad que para una variable es n1 como se muestra en el grfico G.3.10.
Grfico 3.10.
5- Las curvas dependen de los grados de libertad, a mayor grado de libertad corresponde
menor dispersin.
Entonces, en este caso el error mximo es
Y el intervalo de confianza para la media poblacional es:
Volviendo al problema:
La informacin con la que contamos es la siguiente.
Sobre la poblacin:
La distribucin de los pesos de todos los paquetes llenados por la mqui-
na es normal (o aproximadamente normal) porque los procesos de medi-
cin de un mismo valor nominal (medir longitudes, pesar, etc.) entregan
naturalmente poblaciones normales.
Sobre la muestra:
El tamao de la muestra seleccionada n = 16.
El peso medio de los paquetes de la muestra X=504g.
El desvo de la muestra S = 6,802g.
Utilizando el mismo nivel de confianza 1 = 0,95 y sabiendo que los grados
de libertad son 15, buscamos en la tabla de la t del Anexo el valor corres-
pondiente a t
n-1;1-/2
. Luego t
15;0,975
= 2,131.
Reemplazando los datos construimos el intervalo de confianza para la media:
101
Estadistica
x

X
X
a
Z Z
Z
b
1-
/2
/2 1/2
/2
-Z Z Z
1-
/2
/2 1/2
/2
0
gl grande
gl mediano
gl chico
G.3.7
G.3.8
G.3.10
G.3.9.
Lmite inferior
del intervalo
mx
Lmite superior
del intervalo

mx

x
Finalmente, con base en una muestra de 16 paquetes y con una confianza del
95%, se estima que el peso medio de todos los paquetes fabricados se encuen-
tra entre 500,38g y 507,63g.
Notamos que el intervalo obtenido es menos preciso que el hallado en el
ejemplo anterior, donde se conoca el desvo poblacional, y esto se debe a que
en este segundo caso slo se cuenta con las medidas muestrales. Como
era de esperar al contar con menor informacin se obtuvo menor precisin
en la estimacin.
3.
Con base en la muestra de 20 piezas plsticas de la matriz ME4 con-
signada en el apartado 1.3 de la Unidad 1;
a. Estimar, con un nivel de confianza del 95%, la longitud media de
todas las piezas plsticas fabricadas por esa empresa.
b. Qu supuesto tuvo en cuenta acerca de la distribucin de todas las
longitudes de las piezas de plstico para realizar la estimacin?
Poblacin no normal y
2
conocido
Cuando la poblacin no es normal o se desconoce el tipo de distribucin que
posee y se conoce la varianza poblacional, para poder estimar la media pobla-
cional es necesario que la muestra sea grande para que en virtud del Teorema
central del lmite dicha estimacin pueda realizarse utilizando la misma expre-
sin de la primera situacin tratada.
Por otro lado, si la muestra es chica no se puede llevar a cabo la estimacin
por intervalo de confianza de la media poblacional.
Ejemplo
Consideremos la poblacin de los tiempos empleados para realizar todas las
transacciones bancarias posibles por la totalidad de los clientes de un deter-
minado banco.
En este problema la distribucin de los tiempos empleados para realizar
todas las transacciones bancarias no necesariamente es normal.
Repasar las caractersticas de la poblacin definida en este ejemplo con
la tratada en la Unidad 2, apartado 2.2.4. para reconocer la distinta natu-
raleza de cada una.
102
Universidad Virtual de Quilmes
Convengamos que la desviacin estndar de todas las operaciones es cono-
cida y es = 1,5 minutos.
Si se deseara estimar el tiempo medio que tardan los clientes en realizar
todas las operaciones y se seleccionara una muestra aleatoria de 60 clientes
que emplearon en promedio 3,7 minutos con un desvo estndar de 2,1 minu-
tos, la informacin con la que contaramos sera la siguiente:
Sobre la poblacin:
El desvo = 1,5 min.
Sobre la muestra:
El tamao de la muestra seleccionada n = 60.
El tiempo medio de las transacciones de la muestra X=3,7min.
El desvo de la muestra S = 2,1 min.
Calcularemos un intervalo para con una confianza del 95%.
Luego, con base en una muestra de 60 transacciones y con una confianza del
95%, se estima que el tiempo medio de todas las operaciones del banco se
encuentra entre 3,31 min y 4,08 min.
Intervalo de confianza para la proporcin poblacional
Toda la lgica empleada para fundamentar la construccin de intervalos de
confianza para la media poblacional puede extenderse a la fundamenta-
cin de la construccin de intervalos de confianza para estimar la proporcin
poblacional P debido a que, en virtud al Teorema central del lmite, la varia-
ble aleatoria proporcin muestral tiene distribucin normal de parmetros
y si el tamao n de la muestra es grande.
Para construir un intervalo de confianza para la proporcin poblacional, al
igual que en los casos vistos para la media, el intervalo se centrar en el esta-
dstico muestral y ser simtrico alrededor de l.
En este caso el clculo del error mximo debera ser:
pero al desconocer P se utiliza su mejor estimador p, quedando
103
Estadistica
17

Ejemplo
Consideremos la poblacin de los tiempos empleados para realizar todas
las transacciones bancarias posibles por la totalidad de los clientes de un
determinado banco.
En este problema la distribucin de los tiempos empleados para
realizar todas las transacciones bancarias no necesariamente es normal.

COMIENZO DE PARA REFLEXIONAR
Repasar las caractersticas de la poblacin definida en este
ejemplo con la tratada en la Unidad 2, apartado 2.2.4. para
reconocer la distinta naturaleza de cada una.
FIN DE PARA REFLEXIONAR

Convengamos que la desviacin estndar de todas las operaciones es
conocida y es = 1,5 minutos.
Si se deseara estimar el tiempo medio que tardan los clientes en realizar todas
las operaciones y se seleccionara una muestra aleatoria de 60 clientes que
emplearon en promedio 3,7 minutos con un desvo estndar de 2,1 minutos, la
informacin con la que contaramos sera la siguiente:

Sobre la poblacin:
el desvo = 1,5 min
Sobre la muestra:
el tamaos de la muestra seleccionada n = 60
el tiempo medio de las transacciones de la muestra

el desvo de la muestra S = 2,1 min

Calcularemos un intervalo para con una confianza del 95%.


I

= 3, 7 1, 96
1, 5
60
, 3, 7 +1, 96
1, 5
60






= 3, 31 , 4, 08
( )

Luego, con base en una muestra de 60 transacciones y con una
confianza del 95%, se estima que el tiempo medio de todas las
operaciones del banco se encuentra entre 3,31 min y 4,08 min.

Intervalo de confianza para la proporcin poblacional

Toda la lgica empleada para fundamentar la construccin de intervalos
de confianza para la media poblacional puede extenderse a la
fundamentacin de la construccin de intervalos de confianza para
estimar la proporcin poblacional P debido a que, en virtud al Teorema
central del lmite, la variable aleatoria proporcin muestral tiene
distribucin normal de parmetros
p
= P y
p
=
P.(1P)
n
si el tamao
n de la muestra es grande.
17

Ejemplo
Consideremos la poblacin de los tiempos empleados para realizar todas
las transacciones bancarias posibles por la totalidad de los clientes de un
determinado banco.
En este problema la distribucin de los tiempos empleados para
realizar todas las transacciones bancarias no necesariamente es normal.

COMIENZO DE PARA REFLEXIONAR
Repasar las caractersticas de la poblacin definida en este
ejemplo con la tratada en la Unidad 2, apartado 2.2.4. para
reconocer la distinta naturaleza de cada una.
FIN DE PARA REFLEXIONAR

Convengamos que la desviacin estndar de todas las operaciones es
conocida y es = 1,5 minutos.
Si se deseara estimar el tiempo medio que tardan los clientes en realizar todas
las operaciones y se seleccionara una muestra aleatoria de 60 clientes que
emplearon en promedio 3,7 minutos con un desvo estndar de 2,1 minutos, la
informacin con la que contaramos sera la siguiente:

Sobre la poblacin:
el desvo = 1,5 min
Sobre la muestra:
el tamaos de la muestra seleccionada n = 60
el tiempo medio de las transacciones de la muestra

el desvo de la muestra S = 2,1 min

Calcularemos un intervalo para con una confianza del 95%.

I

= 3, 7 1, 96
1, 5
60
, 3, 7 +1, 96
1, 5
60






= 3, 31 , 4, 08
( )

Luego, con base en una muestra de 60 transacciones y con una
confianza del 95%, se estima que el tiempo medio de todas las
operaciones del banco se encuentra entre 3,31 min y 4,08 min.

Intervalo de confianza para la proporcin poblacional

Toda la lgica empleada para fundamentar la construccin de intervalos
de confianza para la media poblacional puede extenderse a la
fundamentacin de la construccin de intervalos de confianza para
estimar la proporcin poblacional P debido a que, en virtud al Teorema
central del lmite, la variable aleatoria proporcin muestral tiene
distribucin normal de parmetros
p
= P y
p
=
P.(1P)
n
si el tamao
n de la muestra es grande.
18
Para construir un intervalo de confianza para la proporcin
poblacional, al igual que en los casos vistos para la media, el intervalo
se centrar en el estadstico muestral y ser simtrico alrededor de l.


I
P
= p
mx
; p +
mx
[ ]

En este caso el clculo del error mximo debera ser:

mx
= z
1

P.(1P)
n

pero al desconocer P se utiliza su mejor estimador p, quedando

mx
z
1

p.(1 p)
n


Por tal motivo, el intervalo de confianza para la proporcin poblacional
P resulta


I
P
= p z
1

2

p.(1 p)
n
, p + z
1

2

p.(1 p)
n






Ejemplo
Para estimar la proporcin de familias que ven por TV un determinado
programa, se seleccion una muestra de 2200 familias que poseen uno o
ms televisores en una determinada ciudad, y de la muestra se obtuvo
que 871 familias ven ese programa. Estimar, utilizando un nivel de
confianza de 0,95, un intervalo para la proporcin de familias que ven
ese programa.

La informacin con la que contamos es la siguiente.
el tamao de la muestra seleccionada n =2200
la proporcin muestral de familias que ven el programa de TV
p =
871
2200
= 0, 396




Para una confianza del 95%, el valor z
0,975
de la tabla es 1,96.

Reemplazando se tiene que el intervalo para P es:


I
P
= p z
1

2

p.(1 p)
n
, p + z
1

2

p.(1 p)
n








I
P
0, 396 1, 96.
0, 396.0, 604
2200
, 0, 396 +1, 96.
0, 396.0, 604
2200




I
P
= [0,386; 0,406]

18
Para construir un intervalo de confianza para la proporcin
poblacional, al igual que en los casos vistos para la media, el intervalo
se centrar en el estadstico muestral y ser simtrico alrededor de l.

I
P
= p
mx
; p +
mx
[ ]

En este caso el clculo del error mximo debera ser:

mx
= z
1

P.(1P)
n

pero al desconocer P se utiliza su mejor estimador p, quedando

mx
z
1

p.(1 p)
n


Por tal motivo, el intervalo de confianza para la proporcin poblacional
P resulta


I
P
= p z
1

2

p.(1 p)
n
, p + z
1

2

p.(1 p)
n






Ejemplo
Para estimar la proporcin de familias que ven por TV un determinado
programa, se seleccion una muestra de 2200 familias que poseen uno o
ms televisores en una determinada ciudad, y de la muestra se obtuvo
que 871 familias ven ese programa. Estimar, utilizando un nivel de
confianza de 0,95, un intervalo para la proporcin de familias que ven
ese programa.

La informacin con la que contamos es la siguiente.
el tamao de la muestra seleccionada n =2200
la proporcin muestral de familias que ven el programa de TV
p =
871
2200
= 0, 396




Para una confianza del 95%, el valor z
0,975
de la tabla es 1,96.

Reemplazando se tiene que el intervalo para P es:


I
P
= p z
1

2

p.(1 p)
n
, p + z
1

2

p.(1 p)
n








I
P
0, 396 1, 96.
0, 396.0, 604
2200
, 0, 396 +1, 96.
0, 396.0, 604
2200




I
P
= [0,386; 0,406]

18
Para construir un intervalo de confianza para la proporcin
poblacional, al igual que en los casos vistos para la media, el intervalo
se centrar en el estadstico muestral y ser simtrico alrededor de l.

I
P
= p
mx
; p +
mx
[ ]

En este caso el clculo del error mximo debera ser:

mx
= z
1

P.(1P)
n

pero al desconocer P se utiliza su mejor estimador p, quedando

mx
z
1

p.(1 p)
n


Por tal motivo, el intervalo de confianza para la proporcin poblacional
P resulta


I
P
= p z
1

2

p.(1 p)
n
, p + z
1

2

p.(1 p)
n






Ejemplo
Para estimar la proporcin de familias que ven por TV un determinado
programa, se seleccion una muestra de 2200 familias que poseen uno o
ms televisores en una determinada ciudad, y de la muestra se obtuvo
que 871 familias ven ese programa. Estimar, utilizando un nivel de
confianza de 0,95, un intervalo para la proporcin de familias que ven
ese programa.

La informacin con la que contamos es la siguiente.
el tamao de la muestra seleccionada n =2200
la proporcin muestral de familias que ven el programa de TV
p =
871
2200
= 0, 396




Para una confianza del 95%, el valor z
0,975
de la tabla es 1,96.

Reemplazando se tiene que el intervalo para P es:


I
P
= p z
1

2

p.(1 p)
n
, p + z
1

2

p.(1 p)
n








I
P
0, 396 1, 96.
0, 396.0, 604
2200
, 0, 396 +1, 96.
0, 396.0, 604
2200




I
P
= [0,386; 0,406]

Por tal motivo, el intervalo de confianza para la proporcin poblacional P resulta
Ejemplo
Para estimar la proporcin de familias que ven por TV un determinado pro-
grama, se seleccion una muestra de 2200 familias que poseen uno o ms
televisores en una determinada ciudad, y de la muestra se obtuvo que 871
familias ven ese programa. Estimar, utilizando un nivel de confianza de 0,95,
un intervalo para la proporcin de familias que ven ese programa.
La informacin con la que contamos es la siguiente.
El tamao de la muestra seleccionada n = 2200.
La proporcin muestral de familias que ven el programa de TV.
Para una confianza del 95%, el valor z
0,975
de la tabla es 1,96.
Reemplazando se tiene que el intervalo para P es:
Con base en una muestra de 2200 familias con el 95% de confianza la verda-
dera proporcin de familias que ven ese programa de TV est comprendida entre
el 38,6% y el 40,6%.
4.
Con base en la muestra de las 96 familias escogidas al azar de cierta loca-
lidad (apartado 1.1.2. de la Unidad 1) con 1 = 0,95 estimar la pro-
porcin de familias en toda la poblacin cuyo gasto medio en alimen-
tos supere los $46.
Determinacin del tamao de una muestra
Como se hizo para la media, se despeja n de la frmula del error mximo, que
en su forma original y en su forma aproximada es:
104
Universidad Virtual de Quilmes
18
Para construir un intervalo de confianza para la proporcin
poblacional, al igual que en los casos vistos para la media, el intervalo
se centrar en el estadstico muestral y ser simtrico alrededor de l.

I
P
= p
mx
; p +
mx
[ ]

En este caso el clculo del error mximo debera ser:

mx
= z
1

P.(1P)
n

pero al desconocer P se utiliza su mejor estimador p, quedando

mx
z
1

p.(1 p)
n


Por tal motivo, el intervalo de confianza para la proporcin poblacional
P resulta


I
P
= p z
1

2

p.(1 p)
n
, p + z
1

2

p.(1 p)
n










Ejemplo
Para estimar la proporcin de familias que ven por TV un determinado
programa, se seleccion una muestra de 2200 familias que poseen uno o
ms televisores en una determinada ciudad, y de la muestra se obtuvo
que 871 familias ven ese programa. Estimar, utilizando un nivel de
confianza de 0,95, un intervalo para la proporcin de familias que ven
ese programa.

La informacin con la que contamos es la siguiente.
el tamao de la muestra seleccionada n =2200
la proporcin muestral de familias que ven el programa de TV
p =
871
2200
= 0, 396




Para una confianza del 95%, el valor z
0,975
de la tabla es 1,96.

Reemplazando se tiene que el intervalo para P es:


I
P
= p z
1

2

p.(1 p)
n
, p + z
1

2

p.(1 p)
n








I
P
0, 396 1, 96.
0, 396.0, 604
2200
, 0, 396 +1, 96.
0, 396.0, 604
2200




I
P
= [0,386; 0,406]

18
Para construir un intervalo de confianza para la proporcin
poblacional, al igual que en los casos vistos para la media, el intervalo
se centrar en el estadstico muestral y ser simtrico alrededor de l.

I
P
= p
mx
; p +
mx
[ ]

En este caso el clculo del error mximo debera ser:

mx
= z
1

P.(1P)
n

pero al desconocer P se utiliza su mejor estimador p, quedando

mx
z
1

p.(1 p)
n


Por tal motivo, el intervalo de confianza para la proporcin poblacional
P resulta


I
P
= p z
1

2

p.(1 p)
n
, p + z
1

2

p.(1 p)
n






Ejemplo
Para estimar la proporcin de familias que ven por TV un determinado
programa, se seleccion una muestra de 2200 familias que poseen uno o
ms televisores en una determinada ciudad, y de la muestra se obtuvo
que 871 familias ven ese programa. Estimar, utilizando un nivel de
confianza de 0,95, un intervalo para la proporcin de familias que ven
ese programa.

La informacin con la que contamos es la siguiente.
el tamao de la muestra seleccionada n =2200
la proporcin muestral de familias que ven el programa de TV
p =
871
2200
= 0, 396








Para una confianza del 95%, el valor z
0,975
de la tabla es 1,96.

Reemplazando se tiene que el intervalo para P es:


I
P
= p z
1

2

p.(1 p)
n
, p + z
1

2

p.(1 p)
n








I
P
0, 396 1, 96.
0, 396.0, 604
2200
, 0, 396 +1, 96.
0, 396.0, 604
2200




I
P
= [0,386; 0,406]

18
Para construir un intervalo de confianza para la proporcin
poblacional, al igual que en los casos vistos para la media, el intervalo
se centrar en el estadstico muestral y ser simtrico alrededor de l.

I
P
= p
mx
; p +
mx
[ ]

En este caso el clculo del error mximo debera ser:

mx
= z
1

P.(1P)
n

pero al desconocer P se utiliza su mejor estimador p, quedando

mx
z
1

p.(1 p)
n


Por tal motivo, el intervalo de confianza para la proporcin poblacional
P resulta


I
P
= p z
1

2

p.(1 p)
n
, p + z
1

2

p.(1 p)
n






Ejemplo
Para estimar la proporcin de familias que ven por TV un determinado
programa, se seleccion una muestra de 2200 familias que poseen uno o
ms televisores en una determinada ciudad, y de la muestra se obtuvo
que 871 familias ven ese programa. Estimar, utilizando un nivel de
confianza de 0,95, un intervalo para la proporcin de familias que ven
ese programa.

La informacin con la que contamos es la siguiente.
el tamao de la muestra seleccionada n =2200
la proporcin muestral de familias que ven el programa de TV
p =
871
2200
= 0, 396




Para una confianza del 95%, el valor z
0,975
de la tabla es 1,96.

Reemplazando se tiene que el intervalo para P es:


I
P
= p z
1

2

p.(1 p)
n
, p + z
1

2

p.(1 p)
n








I
P
0, 396 1, 96.
0, 396.0, 604
2200
, 0, 396 +1, 96.
0, 396.0, 604
2200









I
P
= [0,386; 0,406]

19
Con base en una muestra de 2200 familias con el 95% de confianza la
verdadera proporcin de familias que ven ese programa de TV est
comprendida entre el 38,6% y el 40,6%.

COMIENZO DE ACTIVIDAD
4.
Con base en la muestra de las 96 familias escogidas al azar de
cierta localidad (apartado 1.1.2. de la Unidad 1) con 1 =
0,95 estimar la proporcin de familias en toda la poblacin
cuyo gasto medio en alimentos supere los $46.
FIN DE ACTIVIDAD

Determinacin del tamao de una muestra
Como se hizo para la media, se despeja n de la frmula del error
mximo, que en su forma original y en su forma aproximada es:

mx
= z
1

P.(1P)
n


z
1

p.(1 p)
n


Al no conocer P porque es lo que se quiere estimar y al no conocer p
porque an no se tom la muestra (justamente necesitamos calcular de
qu tamao mnimo deber ser), se presenta un problema que debemos
sortear. Para hacerlo se parte de la suposicin terica de que P = 0,50 ,
lo que es lgico porque es el sustento terico de la curva de distribucin
de las proporciones muestrales; aunque luego como es esperable la
realidad difiera del modelo terico.

Reemplazando y despejando n se tiene:

mx
= z
1~
o
2

0, 50.0, 50
n
= z
1~
o
2
.
0, 50
n
=n =
z
1~o
.0, 50

mx
[
\
|

]
j
2



3.2.2. Pruebas de hiptesis


COMIENZO DE LEER ATENTO
Una prueba test o contraste de hiptesis consiste en un
procedimiento mediante el cual se somete a prueba un
parmetro (u otra caracterstica) poblacional desconocido sobre
el que se tiene alguna suposicin.
Como todo problema de inferencia estadstica la prueba de
hiptesis debe basarse en la evidencia muestral.
FIN DE LEER ATENTO

Cuando el objetivo de una prueba de hiptesis es testear el valor de un
parmetro (desconocido) a partir de un valor hipottico
o
de dicho
parmetro, surge una primera hiptesis estadstica denominada hiptesis
nula (H
o
) que presupone que no habra una diferencia significativa entre
y
o
y que se expresa
Al no conocer P porque es lo que se quiere estimar y al no conocer p porque
an no se tom la muestra (justamente necesitamos calcular de qu tamao
mnimo deber ser), se presenta un problema que debemos sortear. Para
hacerlo se parte de la suposicin terica de que P = 0,50, lo que es lgico por-
que es el sustento terico de la curva de distribucin de las proporciones
muestrales; aunque luego como es esperable la realidad difiera del mode-
lo terico.
Reemplazando y despejando n se tiene:
3.2.2. Pruebas de hiptesis
Una prueba test o contraste de hiptesis consiste en un procedimiento
mediante el cual se somete a prueba un parmetro (u otra caractersti-
ca) poblacional desconocido sobre el que se tiene alguna suposicin.
Como todo problema de inferencia estadstica la prueba de hiptesis
debe basarse en la evidencia muestral.
Cuando el objetivo de una prueba de hiptesis es testear el valor de un par-
metro (desconocido) a partir de un valor hipottico
o
de dicho parmetro,
surge una primera hiptesis estadstica denominada hiptesis nula (H
o
) que
presupone que no habra una diferencia significativa entre y
o
y que se
expresa
H
o
: =
o
Si la evidencia muestral contradijera la afirmacin de H
0
y existiera sospecha
de que la diferencia pudiera ser significativa, surge por oposicin una segun-
da hiptesis estadstica que llamamos hiptesis alternativa (H
A
) la cual sos-
tiene, en contraste con H
0
, que el valor del parmetro diferira significativa-
mente del hipottico
0
.
H
A
puede asumir alguna de las siguientes formas:
H
A
: <
0
H
A
: >
0
En una prueba de hiptesis (PPHH) la hiptesis nula H
0
es en rigor la que se
somete a prueba, y como resultante H
0
puede ser aceptada o rechazada. Si
H
0
resulta ser rechazada la conclusin final de la prueba se inclinara a favor
de H
A
.
Debido al ambiente de incertidumbre en el que se realiza una PPHH, dado
que se basa en la evidencia proporcionada por una muestra, en la decisin final
se pueden cometer dos tipos de errores: rechazar H
0
si en realidad fuere ver-
dadera y aceptar H
0
si en realidad fuere falsa. El primero de ellos se denomina
error de tipo I y tiene asociada una probabilidad , llamada nivel de significa-
cin de la prueba.
105
Estadistica
19
Con base en una muestra de 2200 familias con el 95% de confianza la
verdadera proporcin de familias que ven ese programa de TV est
comprendida entre el 38,6% y el 40,6%.

COMIENZO DE ACTIVIDAD
4.
Con base en la muestra de las 96 familias escogidas al azar de
cierta localidad (apartado 1.1.2. de la Unidad 1) con 1 =
0,95 estimar la proporcin de familias en toda la poblacin
cuyo gasto medio en alimentos supere los $46.
FIN DE ACTIVIDAD

Determinacin del tamao de una muestra
Como se hizo para la media, se despeja n de la frmula del error
mximo, que en su forma original y en su forma aproximada es:

mx
= z
1

P.(1P)
n
z
1

p.(1 p)
n


Al no conocer P porque es lo que se quiere estimar y al no conocer p
porque an no se tom la muestra (justamente necesitamos calcular de
qu tamao mnimo deber ser), se presenta un problema que debemos
sortear. Para hacerlo se parte de la suposicin terica de que P = 0,50 ,
lo que es lgico porque es el sustento terico de la curva de distribucin
de las proporciones muestrales; aunque luego como es esperable la
realidad difiera del modelo terico.

Reemplazando y despejando n se tiene:

mx
= z
1~
o
2

0, 50.0, 50
n
= z
1~
o
2
.
0, 50
n
=n =
z
1~o
.0, 50

mx
[
\
|

]
j
2



3.2.2. Pruebas de hiptesis


COMIENZO DE LEER ATENTO
Una prueba test o contraste de hiptesis consiste en un
procedimiento mediante el cual se somete a prueba un
parmetro (u otra caracterstica) poblacional desconocido sobre
el que se tiene alguna suposicin.
Como todo problema de inferencia estadstica la prueba de
hiptesis debe basarse en la evidencia muestral.
FIN DE LEER ATENTO

Cuando el objetivo de una prueba de hiptesis es testear el valor de un
parmetro (desconocido) a partir de un valor hipottico
o
de dicho
parmetro, surge una primera hiptesis estadstica denominada hiptesis
nula (H
o
) que presupone que no habra una diferencia significativa entre
y
o
y que se expresa
El valor hipottico de un
parmetro es una pre-
suncin o una suposicin que se
realiza sobre l, como por ejem-
plo una especificacin para el con-
trol de calidad, un valor histrico,
un valor de comparacin o un valor
que se elige arbitrariamente.
P(error de tipo I) = P(rechazar H
0
/ H
0
verdadera) = a
El segundo error (aceptar H
0
si en realidad fuere falsa) se llama error de tipo
II y su probabilidad asociada es .
P(error de tipo II) = P(aceptar H
0
/ H
0
falsa) =
En esta carpeta se trabajar slo con la probabilidad a de cometer un error de
tipo I.
Prueba de hiptesis para la media poblacional
La PPHH para la media presenta distintos casos, dependiendo de la infor-
macin poblacional con que se cuente, tal como ocurre en la estimacin por
intervalos de confianza.
Poblacin normal o aproximadamente normal y
2
conocido
Volviendo al ejemplo de controlar el proceso de llenado de paquetes de galle-
titas de medio kilo, abordado en estimacin de la media poblacional por inter-
valo de confianza, cabe preguntarnos si se podra imprimir en todos los paque-
tes el valor nominal de 500g. Para responder a la pregunta debemos realizar
un contraste de hiptesis donde, el parmetro desconocido (que genrica-
mente llambamos ) es el promedio del peso de todos los paquetes enva-
sados, cuyo valor hipottico
0
= 500g es el valor nominal que se quiere impri-
mir. Luego, la hiptesis nula ser H
0
: =
0
, es decir:
H
0
: = 500g
A partir de la evidencia de la muestra de los 16 paquetes donde el peso medio
result X= 504g, se puede plantear la siguiente hiptesis alternativa,
H
A
: > 500g
dado que la evidencia muestral arroj un peso medio (estadstico muestral)
superior al valor nominal (parmetro hipottico).
Entonces el juego de hiptesis para esta PPHH es:
H
0
: = 500g
H
A
: > 500g
Estableceremos ahora un criterio que permita discriminar cundo la diferen-
cia entre el estadstico muestral y el parmetro hipottico no es significativa
(y por extensin no sera significativa la diferencia entre y
0
por lo que se
acepta la H
0
) y cundo esa diferencia s es significativa (y en consecuencia se
rechaza H
0
a favor de H
A
).
Ese criterio est sustentado por el nivel de significacin de la prueba que
determina un valor denominado punto crtico, el cual establece dos regiones:
106
Universidad Virtual de Quilmes
Grfico 3.11.
En particular esta prueba se denomina unilateral derecha porque la zona de
rechazo se encuentra a la derecha del punto crtico.
El desarrollo de la prueba o la contrastacin de las hiptesis se realiza en
el dominio de la normal estndar, por lo que habr que estandarizar tanto
0
y el punto crtico.
Grfico 3.12.
El X estandarizado se denomina estadstico de prueba.
Para el problema que estamos desarrollando, fijaremos un nivel de significacin
o probabilidad de cometer error tipo I de = 0,05.
El punto crtico en Z y el estadstico de prueba resultan:
Grfico 3.13.
107
Estadistica
1-
Zona de Aceptacin de H
O
G.3.11
G.3.12
Zona de Rechazo de H
O
Pto.
crtico

O
X
1-
Zona de Aceptacin de H
O
Zona de Rechazo de H
O
0
0
Z
Z
G.3.13
Zona de Aceptacin de H
O
Zona de Rechazo de H
O
1,64
Z
1

0,05
3,2
1-
Zona de Aceptacin de H
O
G.3.11
G.3.12
Zona de Rechazo de H
O
Pto.
crtico

O
X
1-
Zona de Aceptacin de H
O
Zona de Rechazo de H
O
0
0
Z
Z
G.3.13
Zona de Aceptacin de H
O
Zona de Rechazo de H
O
1,64
Z
1

0,05
3,2
1-
Zona de Aceptacin de H
O
G.3.11
G.3.12
Zona de Rechazo de H
O
Pto.
crtico

O
X
1-
Zona de Aceptacin de H
O
Zona de Rechazo de H
O
0
0
Z
Z
G.3.13
Zona de Aceptacin de H
O
Zona de Rechazo de H
O
1,64
Z
1

0,05
3,2
Si el juego de hiptesis
fuera H
0
: = 500g y H
A
:
< 500g, la zona de rechazo del
grfico estara a la izquierda y la
prueba se denominara unilateral
izquierda.
En la eleccin de un nivel
de si gni fi caci n son
estndares los valores 0,10; 0,05
o 0,01, pero puede optarse por
cualquier otro valor intermedio
entre ellos.
Finalmente, comparando el estadstico de prueba calculado Z=3,2 con el punto
crtico Z
*
0,95
=1,64, observamos que aqul cae en la zona de rechazo de la H
0
por lo que, con base en la muestra de 16 paquetes y con un nivel de signifi-
cacin del 5%, rechazamos H
0
a favor de H
A
.
Conclusin estadstica, con base en la muestra de 16 paquetes y con una
probabilidad de cometer error de tipo I de 0,05; habra una diferencia signifi-
cativa entre la media de todos los paquetes envasados y el valor nominal de
500g. O tambin, el peso medio de todos los paquetes envasados podra ser
significativamente superior a 500g, en consecuencia, no estaramos en con-
diciones de imprimir 500g en los paquetes.
Comentario adicional
La conclusin estadstica a la que se arrib est indicando que habra un desa-
juste en el proceso de llenado de los paquetes por lo cual se debera inspec-
cionar el proceso de envasado. Realizar un ajuste, si fuere necesario, y desar-
mar los paquetes ya hechos para volver a llenarlos con la mquina corregida.
Como esta decisin implica costos adicionales en la fabricacin conviene, en
primer lugar, agrandar la muestra y luego, de acuerdo con los nuevos resulta-
dos del test, tomar la decisin.
5.
Un fraccionador de soda custica envasa paquetes utilizando una mqui-
na que tiene una precisin de =8 gramos. Sobre una partida lista para
su distribucin, compuesta de paquetes cuyo valor nominal es de 250g,
seleccion una muestra de 45 bolsas la cual arroj una media de 245
gramos con un desvo de 10 gramos. La evidencia muestral estara indi-
cando que la media de toda la partida no tendra una diferencia signi-
ficativa con el valor nominal impreso en los envases?
Poblacin normal o aproximadamente normal y
2
desconocido
Si en el proceso de llenado de paquetes de galletitas de medio kilo no se
conoce la precisin de la mquina, la prueba se realiza utilizando el desvo de
la muestra s= 6,802g. En este caso, se usa la t de Student y en consecuen-
cia las expresiones del punto crtico y del estadstico de prueba son respec-
tivamente:
Nuevamente el valor calculado del estadstico de prueba es mayor al punto cr-
tico y cae en la zona de rechazo de la H
0
, entonces se rechaza que = 500g
y se llega a la siguiente conclusin estadstica.
Con base en una muestra de 16 paquetes, desconociendo la precisin de
la mquina y con un nivel de significacin del 5%, el peso medio de todos los
108
Universidad Virtual de Quilmes
23
Comentario adicional
La conclusin estadstica a la que se arrib est indicando que habra un
desajuste en el proceso de llenado de los paquetes por lo cual se debera
inspeccionar el proceso de envasado. Realizar un ajuste, si fuere
necesario, y desarmar los paquetes ya hechos para volver a llenarlos con
la mquina corregida. Como esta decisin implica costos adicionales en
la fabricacin conviene, en primer lugar, agrandar la muestra y luego, de
acuerdo con los nuevos resultados del test, tomar la decisin.

COMIENZO DE ACTIVIDAD
5.
Un fraccionador de soda custica envasa paquetes utilizando una
mquina que tiene una precisin de =8 gramos. Sobre una partida lista
para su distribucin, compuesta de paquetes cuyo valor nominal es de
250g, seleccion una muestra de 45 bolsas la cual arroj una media de
245 gramos con un desvo de 10 gramos. La evidencia muestral estara
indicando que la media de toda la partida no tendra una diferencia
significativa con el valor nominal impreso en los envases?
FIN DE ACTIVIDAD

Poblacin normal o aproximadamente normal y
2
desconocido
Si en el proceso de llenado de paquetes de galletitas de medio kilo no se
conoce la precisin de la mquina, la prueba se realiza utilizando el
desvo de la muestra s= 6,802g. En este caso, se usa la t de Student y en
consecuencia las expresiones del punto crtico y del estadstico de
prueba son respectivamente:
t
n1,1
*
y

t =
x
0
S
n

Entonces

t
n1,1
*
= t
15;0,95
*
=1, 75 y

t =
x
0
S
n
=
504 500
6, 802
16
= 2, 35

Nuevamente el valor calculado del estadstico de prueba es mayor al
punto crtico y cae en la zona de rechazo de la H
0
, entonces se rechaza
que = 500g y se llega a la siguiente conclusin estadstica.
Con base en una muestra de 16 paquetes, desconociendo la precisin
de la mquina y con un nivel de significacin del 5%, el peso medio de
todos los paquetes envasados podra ser significativamente superior a
500g, en consecuencia, no estaramos en condiciones de imprimir 500g
en los paquetes.


COMIENZO DE TEXTO APARTE
Pruebas de hi ptesis bilaterales o a dos col as
Estas pruebas se generan en ciertos problemas donde previamente a la
realizacin de la m uestra , es decir antes de contar con la evidencia
muestral, es necesario tener definida la regin de rechazo.
Son ejemplos de estas pruebas algunas rutinas de control de calidad, en
las que entra en consideracin que se estara en situacin crtica si
paquetes envasados podra ser significativamente superior a 500g, en con-
secuencia, no estaramos en condiciones de imprimir 500g en los paquetes.
Pruebas de hiptesis bilaterales o a dos colas
Estas pruebas se generan en ciertos problemas donde previamente a la realizacin de la mues-
tra, es decir antes de contar con la evidencia muestral, es necesario tener definida la regin
de rechazo.
Son ejemplos de estas pruebas algunas rutinas de control de calidad, en las que entra en con-
sideracin que se estara en situacin crtica si X cayera tanto a la derecha como a la izquierda
de
0
. En este caso la regin de rechazo est definida en dos tramos y hay dos puntos crticos.
Grfico 3.14.
Consecuentemente, el juego de hiptesis es:
H
0
: =
0
H
A
:
0
El desarrollo de la prueba de hiptesis es similar a la anterior, teniendo en cuenta que: si el
estadstico de prueba Z cayera en la zona de aceptacin, se acepta H
0;
si Z cayera dentro de
la regin crtica (zona de rechazo de H
0
) se rechaza H
0
y si estuviera muy prximo a Z* -
Z* es conveniente agrandar la muestra.
Grfico 3.15. Cuadro gua en inferencia estadstica para la media poblacional
109
Estadistica
0
Z
G.3.15
G.3.14
Zona de Aceptacin de H
O Zona de Rechazo de H
O
1,64
0,05
0,38
1-
/2 /2
Zona de Aceptacin de H
O
Zona de Rechazo de H
O
Zona de Rechazo de H
O
Z* Z* Z 0
G.3.14
Usar Z para estimar por
intervalo de confiannza o
para realizar un test de
hiptesis
La poblacin
tiene distribucin
normal?
conocido?
Estas situaciones no se tratan en este curso
conocido?
n>30?
Usar Z (en virtud del teorema central
del lmite) para estimar por intervalo
de confianza o para realizar un test de
hiptesis.
Usar t para estimar por intervalo de confianza
o para realizar un test de hiptesis.
SI SI
SI
NO
NO
NO
NO
SI
0
Z
G.3.15
G.3.14
Zona de Aceptacin de H
O Zona de Rechazo de H
O
1,64
0,05
0,38
1-
/2 /2
Zona de Aceptacin de H
O
Zona de Rechazo de H
O
Zona de Rechazo de H
O
Z* Z* Z 0
G.3.14
Usar Z para estimar por
intervalo de confiannza o
para realizar un test de
hiptesis
La poblacin
tiene distribucin
normal?
conocido?
Estas situaciones no se tratan en este curso
conocido?
n>30?
Usar Z (en virtud del teorema central
del lmite) para estimar por intervalo
de confianza o para realizar un test de
hiptesis.
Usar t para estimar por intervalo de confianza
o para realizar un test de hiptesis.
SI SI
SI
NO
NO
NO
NO
SI
Prueba de hiptesis para la proporcin poblacional
En la muestra de 2200 familias del ejemplo utilizado en intervalos de con-
fianza para la proporcin poblacional, las que ven un determinado programa
de TV representan el 39,6%.
Los productores del programa, para decidir los costos de los espacios
comerciales cuentan con un raiting histrico del 40%. La evidencia muestral
estara indicando una disminucin significativa de la posicin del programa
en el raiting?
Para responder a la pregunta se realizar una PPHH con un nivel de signifi-
cacin del 5%.
Entonces, el par de hiptesis para esta PPHH es:
H
0
: P = 0,40
H
A
: P < 0,40
Dado que el tamao de la muestra es grande, el estadstico proporcin mues-
tral tiene distribucin normal. El punto crtico y el estadstico de prueba son,
respectivamente. Resultando,
Grfico.3.16.
que el estadstico de prueba cae en la zona de aceptacin de la H
0
(ya que -
1,64 < -0,38).
Conclusin: con base en una muestra de 2200 familias y con un nivel de sig-
nificacin de 0,05, la proporcin de familias que ven ese programa de TV en
toda la poblacin no habra cambiado significativamente.
6.
Un mtodo de lectura veloz es efectivo en el 70% de los casos. Un nuevo
mtodo intenta mejorar la efectividad y para comprobarlo se toma una
muestra de 205 estudiantes de los cuales 155 mejoraron su lectura. Se puede
concluir que el nuevo mtodo es significativamente mejor que el anterior?
110
Universidad Virtual de Quilmes
25
y
Z
p P
0
P
0
.(1 P
0
)
n

0, 396 0, 40
0, 40.0, 60
2200
0, 38
0
Z
G.3.15
G.3.14
Zona de Aceptacin de H
O Zona de Rechazo de H
O
1,64
0,05
0,38
1-
/2 /2
Zona de Aceptacin de H
O
Zona de Rechazo de H
O
Zona de Rechazo de H
O
Z* Z* Z 0
G.3.14
Usar Z para estimar por
intervalo de confiannza o
para realizar un test de
hiptesis
La poblacin
tiene distribucin
normal?
conocido?
Estas situaciones no se tratan en este curso
conocido?
n>30?
Usar Z (en virtud del teorema central
del lmite) para estimar por intervalo
de confianza o para realizar un test de
hiptesis.
Usar t para estimar por intervalo de confianza
o para realizar un test de hiptesis.
SI SI
SI
NO
NO
NO
NO
SI
Procedimiento para realizar una prueba de hiptesis
Cualquiera sea el parmetro que se someta a una PPHH, el procedi-
miento involucra los siguientes pasos:
Formular las hiptesis a contrastar a partir de la comparacin de la
evidencia muestral o del planteo previo a la evidencia (prueba bila-
teral) con el valor hipottico del parmetro.
Elegir el nivel de significacin.
Designar el tipo de distribucin de probabilidades del estimador alre-
dedor del parmetro a probar.
Calcular el o los puntos crticos.
Estandarizar el estadstico muestral para producir el estadstico de
prueba.
Observar la zona en la que se ubica el estadstico de prueba respec-
to del o de los puntos crticos.
Decidir la aceptacin o el rechazo de la hiptesis nula, o si el esta-
dstico de prueba se encuentra en un entorno muy prximo al punto
crtico la realizacin de una nueva prueba seleccionando una mues-
tra ms grande.
Concluir en el marco del problema.
7.
Al aumentar el nivel de significacin en una PPHH, la probabilidad de
rechazar una hiptesis nula que en realidad fuera verdadera: aumenta,
disminuye o permanece inalterada?
111
Estadistica

Você também pode gostar