Você está na página 1de 19

UNIVERSIDAD MILITAR NUEVA GRANADA

FACULTAD DE ESTUDIOS A DISTANCIA



PROGRAMA DE INGENERIA CIVIL












PROBABILIDAD Y ESTADSTICA

ACTIVIDAD COMPLEMENTARIA No. 3


DISTRIBUCIONES MUSTRALES Y ESTIMACIN POR INTERVALOS
PRUEBAS DE HIPOTESIS



PRESENTADO POR:

SAL GUILLERMO LUNA CASTRO
CD: D7301874
V SEMESTRE




PRESENTADO A:

TUTOR
ING. NSTOR HUMBERTO AGUDELO DAZ





BOGOTA, MARZO DE 2014


INTRODUCCIN


En este trabajo se quiere resaltar la importancia que nos ofrece la estadstica y la
probabilidad despus de haber tratado el tema de los modelos de probabilidad para
variables discretas y continuas ahora ampliaremos nuestro conceptos al tratar el tema de
las distribuciones mustrales, la estimacin por intervalos y las pruebas de hiptesis y
como son aplicadas estas en la Ingeniera y las herramientas que nos brinda.

A continuacin se plantean y desarrollan una serie de ejercicios que nos permitir el
apropiarnos y conocer los conceptos que nos da la estimacin por intervalos y las pruebas
de hiptesis. Adquiriendo conocimiento y prctica en lo relacionado con el manejo de las
distribuciones: normales y T Student as como su comportamiento.





OBJETIVO GENERAL



Adquirir conocimientos en lo concerniente a la estimacin por intervalos y las
pruebas de hiptesis, de modo que podamos apropiarnos de este conocimiento y
relacionarlo con nuestra labor como Ingenieros Civiles.

OBJETIVO ESPECIFICO

Adquirir habilidad practica a travs de la resolucin de problemas o ejercicios
propuestos relacionados con la estimacin por intervalos y las pruebas de
hiptesis.

Desarrollar ejercicios donde se aplica o en su solucin se hay que hacer uso
de los valores de la tabla de Tstudent en las distribuciones normales.

Conocer y aprender el concepto de hiptesis alternativa e hiptesis nula.

DISTRIBUCIONES MUSTRALES Y ESTIMACIN POR INTERVALOS
PRUEBAS DE HIPOTESIS.

TALLER DE ESTADISTICA INFERENCIAL

1. Una muestra de 12 latas de sopa producida por cierta compaa produjo
los siguientes pesos netos, medidos en onzas:
11.9 12.2 11.6 12.1 12.1 11.8
11.9 11.8 12.0 12.3 11.8 12.0
Si se supone normalidad en los pesos, construya un intervalo de confianza
del 95% para el peso promedio de todas las latas de sopa producidas por
la compaa.
SOLUCIN:
La media muestral y la desviacin estndar para los datos dados son:
96 . 11
12
12 ....... 6 . 11 2 . 12 9 . 11
1
=
+ + + +
= =

=
n
X
X
n
i
i

( )
198 . 0
1 12
4291 . 0
1
1
2
=

=
n
x x
S
n
i
i

( ) 201 . 2 05 . 0 % 95 % 1 100
2
= = =

t





En la tabla se encuentra que t
0.025
=2.201 con 11 grados de libertad, de aqu, el
intervalo de confianza de 95% para es:
n n
p
2

p
2

s
t X
s
t X + < <
|
|

\
|
+ < <
|
|

\
|

12
0.198
201 . 2 11.96
12
0.198
201 . 2 11.96
0855 . 12 8345 . 11 < <
Con un nivel de confianza del 95% se sabe que el peso promedio del contenido
de las latas est entre 11.8345 y 12.0855 onzas.
2. Los siguientes datos registrados en das, representan el tiempo de
recuperacin para pacientes que se tratan al azar con uno de los
medicamentos para curar infecciones graves de la vejiga:
Medicamento 1 Medicamento 2
n
1
= 14 n
2
= 16
x
1
= 17 x
2
= 19
s
1
2
= 1.5 s
2
2
= 1.8
Encuentre un intervalo de confianza de 99% para la diferencia promedio en
el tiempo de recuperacin para los dos medicamentos, suponga
poblaciones normales con varianzas iguales. Qu Concluye?
Solucin:
1
P : Pacientes que se tratan con el medicamento 1.
1
X : Tiempo de recuperacin en das para un paciente tratado con el
medicamento 1.
Tamao de la primer muestra n
1
= 14 das.
Primer media muestral
1
x = 17 das.
Primer varianza muestral
2
1
s = 1.5 das.

2
P : Pacientes que se tratan con el medicamento 2.
2
X : Tiempo de recuperacin en das para un paciente tratado con el
medicamento 2.

Tamao de la segunda muestra n
2
= 16 das.
Segunda media muestral
2
x = 19 das.
Segunda varianza muestral
2
2
s = 1.8 das.

Intervalo de confianza IC = 99% para
1 2
.

( ) 763 . 2 01 . 0 % 99 % 1 100
2
= = =

t

En la tabla se encuentra que t
0.005
=2.763 con (n
1
+ n
2
2) = 28 grados de
libertad. De aqu, el intervalo de confianza de 99% para
1 2
es:

1 2 x x

1 2
=

y
1 2
x x
n
1
n
1

1 2
+ =




2 17 19
1 2
x x
= =

y 3659 . 0 0,1339
16
1
14
1

1 2
x x
= + =




( ) ( ) ( ) ( )
2 n n
s * 1 n s * 1 n
s
2 1
2
2 2
2
1 1 2
p
+
+
=

( ) ( ) ( ) ( )
2886 . 1 s 1.6607
2 16 14
1.8 * 1 16 1.5 * 1 14
s
p
2
p
=
+
+
=


( ) ( )
1 2
p
2
1 2 1 2
1 2
p
2
1 2
n
1
n
1
s t x x -
n
1
n
1
s t x x + + < < +



2 (2.763)*(1.2886)*(0.3659) <
1 2
- < 2 + (2.763)*(1.1886)*(0.3659)
2 1.30 <
1 2
- < 2 + 1.30
0.70 <
1 2
- < 3.30


Con el 99% de confianza se encuentra que la diferencia entre las medias (
1 2
-
) poblacionales se encuentra entre 0.70 y 3.30.

3. Una mquina que produce bolas para cojinetes se le detiene
peridicamente para verificar el dimetro. En este caso en particular no
interesa el dimetro medio, sino la variabilidad de los dimetros.
Supngase que se toma una muestra de 31 bolas y se encuentra que la
varianza de los dimetros es de 0.94 mm
2
. Construya unos intervalos de
confianza de 95% para la varianza, e interprete los resultados, suponiendo
normalidad en la poblacin.
Solucin:
( )
2 1
2
2
94 . 0
1
mm
n
x x
S
n
i
i
=

=

n=31 bolas
( ) ( )
( ) 2 / 1
2
2
2
2 /
2
2
1 - n 1 - n

< <
x
s
x
s

( )
791 . 16
979 . 46 05 . 0 % 95 % 1 100
2
1
2
=
= = =


x
x

En la tabla se encuentra que X
0.025
=46.970 y X
0.975
=16.791, con 30 grados de
libertad, el intervalo de confianza de 95% para la varianza es:

( ) ( )
( ) 2 / 1
2
2
2
2 /
2
2
1 - n 1 - n

< <
x
s
x
s

( ) ( )
791 . 16
94 . 0 30
979 . 46
94 . 0 30
2

< <


68 . 1 6 . 0
2
< <
Con un nivel de confianza del 95% se sabe que la varianza de la poblacin de
los dimetros est entre 0.6 y 1.68 mm
2
.



4. Los siguientes datos representan los tiempos de duracin de las pelculas
que producen dos compaas cinematogrficas.
Compaa Tiempo (minutos)
I 103, 94, 110, 87, 98
II 97, 82, 123, 92, 175, 88, 118
a) Encuentre un intervalo de confianza del 90% para la diferencia entre
los tiempos de duracin promedio de las pelculas que ofrecen las
compaas. Suponga que las diferencias de tiempo se distribuyen
en forma aproximadamente de forma normal con varianzas
diferentes. Qu Concluye?
Solucin:
Compaa 1 Compaa 2
n
1
= 5 n
2
= 7
x
1
= 98.4 x
2
= 110.7
s
1
= 8.375 s
2
= 32.185
Primero se proceder a calcular los grados de libertad:
( ) ( )
(
(

\
|
+
(
(

\
|
|

\
|
+
=
1 n
n
s
1 n
n
s
n
s
n
s
2
2
2
2
2
1
2
1
2
1
2
2
2
2
1
2
1
v
( )
( ) ( ) ( ) ( )
7
6
7
32.185
4
5
8.735
7
32.185
5
8.735
2
2
2
2
2
2 2
=
(

+
(

+
= v
En la tabla se encuentra que t
0.05
=1.895 con 7 grados de libertad, de aqu,
el intervalo de confianza de 90% para es:

( ) ( )
1
2
1
2
2
2
2
1 2 1 2
1
2
1
2
2
2
2
1 2
n
s
n
s
t x x -
n
s
n
s
t x x + + < < +
( ) ( )
7
185 . 2 3
5
735 . 8
895 . 1 98.4 7 . 10 1 -
7
185 . 2 3
5
735 . 8
895 . 1 8.4 9 7 . 10 1
2 2
1 2
2 2
+ + < < +

5 . 36 - 9 . 11
1 2
< <
Se tiene una confianza del 90% de que el intervalo de -11.9 a 36.5
minutos contiene la diferencia entre los tiempos de duracin promedio de
las pelculas que ofrecen las compaas.
b) Construya un intervalo de confianza del 90% para la relacin o
cociente de varianzas. Qu Concluye?
En la tabla
( ) ( ) 56 . 4 6 , 4 ,
05 . 0 2 1 2 /
= = f v v f


( ) ( ) 16 . 6 4 , 6 ,
05 . 0 1 2 2 /
= = f v v f


( )
( )
1 2 2 / 2
2
2
1
2
2
2
1
2 1 2 /
2
2
2
1
,
s
s
,
1
s
s
v v f
v v f

< <
16 . 6
185 . 32
8.375
56 . 4
1
185 . 32
8.375
2
2
2
2
2
1
2
2
< <


417 . 0 1484 . 0
2
2
2
1
< <



5. Cierto genetista se interesa en la proporcin de hombres y mujeres en la
poblacin que tienen cierto trastorno sanguneo menor. En una muestra
aleatoria de 1000 hombres se encuentra que 250 lo padecen; mientras que
275 de 1000 mujeres examinadas tambin lo tienen. Calcule un intervalo de
confianza del 95% para la diferencia entre la poblacin de hombres y
mujeres que padecen el trastorno sanguneo. Qu Concluye?


Solucin:

P
1
: hombres
P
2
: mujeres
p
1
: proporcin de hombres que tienen cierto trastorno sanguneo menor.
p
2
: proporcin de mujeres que tienen cierto trastorno sanguneo menor.
Tamao de la primera muestra n
1
= 1000 hombres.
Tamao de la segunda muestra n
2
= 1000 mujeres.
Nmero de xitos de la primer muestra x
1
= 250.
Nmero de xitos de la segunda muestra x
2
= 275.
Proporcin de xitos de la primera muestra 0.25
1000
250
n
x
p
1
= = =
Proporcin de xito de la segunda muestra 0.275
1000
275
n
x
p
2
= = =

Proporcin de fracasos de la primera muestra 0.75 0.25 1 p 1 q
1 1
= = =

Proporcin de fracasos de la segunda muestra 0.725 0.275 1 p 1 q
2 2
= = =

Diferencia entre proporciones de xitos 0.025 0.275 0.25 p p
2 1
= =

Intervalo de confianza IC = 95%

100 = 100(1 - ) % = 95% => =0.05 =>
2 1
z => z
0.025
1.96


Intervalo de confianza de 95% para la diferencia de las fracciones de poblacin
que favorece el convenio.

2
2 2
1
1 1
n
q * p
n
q * p
+

( ) ( ) ( ) ( )
01967 . 0
1000
725 . 0 * 275 . 0
1000
75 . 0 * 25 . 0
+

( ) ( )
2
2 2
1
1 1
2
1 2 1 2
2
2 2
1
1 1
2
1 2
n
q * p
n
q * p
* z p p p p
n
q * p
n
q * p
* z p p + + < < +


0.025 (1.96)*(0.01967) < p
2
p
1
< 0.025 + (1.96)*(0.01967)
0.025 0.0385532 < p
2
p
1
< 0.025 + 0.0385532
0.01355 < p
2
p
1
< 0.06355

Se afirma con 95% de confianza que la diferencia entre la proporcin de
hombres y mujeres que padecen el trastorno sanguneo se encuentra entre
0.01355 y 0.06355
6. Una compaa petrolera afirma que un quinto de las casas en cierta ciudad
se calientan con petrleo. Tenemos razn en dudar de esta afirmacin si,
en una muestra aleatoria de 1000 casas en esta ciudad, se encuentra que
136 se calientan con petrleo? Utilice un nivel de significancia de 0.01.
2 . 0 :
2 . 0 :
1
<
=
p H
p H
o


01 . 0 =

Si 2.33 Z
R
2.33 No se rechaza H
o

Si Z
R
< -2.33 si Z
R
> 2.33 Se rechaza H
o



n
Pq
P - p
=
R
Z

n
Pq
P - p
=
R
Z

( )( )
06 . 5
1000
8 - 0 0.2
0.2 - 0.136
= =
R
Z


Como Z
R
es menor que -2,33 se rechaza H
0
y por tanto se concluye que si hay
razones para dudar la afirmacin de la compaa petrolera.
7. Se sabe que la duracin, en horas, de un foco de 75 watts tiene una
distribucin aproximadamente normal, con una desviacin estndar de 25
horas. Se toma una muestra aleatoria de 20 focos, la cual resulta tener una
duracin promedio de 1014 horas.
a. Existe evidencia que apoye la afirmacin de que la duracin promedio del
foco es mayor que 1000 horas? Utilice un = 0.05.
1000 :
1000 :
1
<

H
H
o


05 . 0 =

Si 1.96 Z
R
1.96 No se rechaza H
o

Si Z
R
< -1.96 si Z
R
> 1.96 Se rechaza H
o


n
Z
R

- X
R
=


50 . 2
20
25
1000 - 1014
= =
R
Z



Como Z
R
es mayor que 1.96 se rechaza H
0
y por tanto se concluye que no hay
evidencia para la afirmar que la duracin promedio del foco es mayor de 1000
horas.
b. Cul es el valor P para la prueba?
El valor de P es
( ) 0062 . 0 50 . 2 = > = Z p P

8. En un invierno con epidemia de gripe, una compaa farmacutica bien
conocida estudi 2000 bebes para determinar si la nueva medicina de la
compaa era efectiva despus de dos das. Entre 120 bebes que tenan
gripe y se les administr la medicina, 29 se curaron dentro de dos das.
Entre 280 bebs que tenan gripe pero que no recibieron la medicina, 56 se
curaron dentro de dos das. Hay alguna indicacin significativa que
apoye la afirmacin de la compaa de la efectividad de la medicina?
Utilice un = 0.05 y Calcule el valor P.



Solucin:
2 1 1
2 1
:
:
p p H
p p H
o
>
=

05 . 0 =

En la tabla se encuentra que Z
0.025
=1.96
2125 . 0
280 120
56 29
=
+
+
= P

7875 . 0 1 = = p q

( )( )
93 . 0
280
1
120
1
7875 . 0 2125 . 0
280
56
120
29
=
|

\
|
+
|

\
|
|

\
|
=
R
Z

( ) 1762 . 0 93 . 0 = > = Z p P

Como Z
R
es mayor que 0.93 se rechaza H
0
y por tanto se concluye que no hay
evidencia para la afirmar que la nueva medicina es ms efectiva.

9. Se cree que la portada y la naturaleza de la primera pregunta de encuestas
por correo influyen en la tasa de respuesta. Un artculo prob esta teora al
experimentar con diferentes diseos de portadas. Una portada sencilla, y
la otra utiliz la figura de un paracaidista. Los investigadores especularon
que la tasa de devolucin sera menor para la portada sencilla.
Portada
Nmero de
envos
Nmero de
devoluciones
Sencilla 207 104
Paracaidista 213 109
Esta informacin apoya la hiptesis de los investigadores? Haga la
prueba con un nivel de significancia de 0.10
Solucin:

Se trata de una distribucin muestral de diferencia de proporciones.

Datos:

p1= 104/207= 0.5024

p2 = 109/213= 0.5117

n1=207
n2 = 213

H
o
; P
1
-P
2
= 0
H
1
; P
1
-P
2
0
En la tabla se encuentra que Z
0.05
=1.645

( ) ( )
5071 . 0
213 207
109 104 x x
2 1
2 1
=
+
+
=
+
+
=
n n
P
( ) ( )
( )( )
19 . 0
213
1
207
1
4928 . 0 5071 . 0
0 5117 . 0 5024 . 0
=
|

\
|
+

=
R
Z
No se rechaza Ho.

10. Pruebe la hiptesis de que el contenido promedio de los envases de un
lubricante en particular es de 10 litros si los contenidos de una muestra
aleatoria de 10 envases son: 10.2, 9.7, 10.1, 10.3, 10.1, 9.8, 9.9, 10.4, 10.3 y
9.8 litros. Utilice un nivel de significancia de 0.01 y suponga que la
distribucin del contenido es normal.



Solucin:
P: envases de un lubricante.
X: contenido en litros de un envase de ese lubricante.
Tamao de la muestra n = 10 envases.
Media muestral
n
X
x
n
1 i
i
=
= 10.06
10
9.8 ......... 10.1 9.7 10.2
=
+ + + +
= litros.
Desviacin estndar muestral

( )
1 n
X X
s
n
1 i
2
i

=


( )
2458 . 0
1 10
544 . 0
1
1
2
=

=
n
x x
S
n
i
i


Nivel de significancia = 0.01
Hiptesis nula H
0
: = 10 litros.
Hiptesis alternativa H
1
: 10 litros.

n
s
X
t

=


7722 . 0
0777 . 0
10 06 . 10
t =

= .


Si
1 n ,
2

1 n ,
2

t t t

< < , no se rechaza H
0
.
9 ,
2
01 . 0
9 ,
2
01 . 0
t t t < <
9 , 005 . 0 9 , 005 . 0
t t t < <
Aplicando Tabla
- 3.250 < t < 3.250

No se rechaza la hiptesis nula ya que el valor de t hallado se encuentra dentro
de la regin de No Rechazo.
11. Una compaa armadora de automviles grandes trata de decidir si
compra llantas de la marca o de la B para sus modelos nuevos. Se lleva a
cabo un experimento para ayudar a llegar a una decisin, en el que se
usan 12 llantas de cada marca. Los resultados son:
Marca A: xA = 37,900 Kilmetros; SA = 5,100 Kilmetros.
Marca B: xB = 39,800 Kilmetros; SB = 6,900 Kilmetros
Pruebe la hiptesis de que no hay diferencia en las dos marcas de llantas
con un nivel de significancia de 0.05. Tambin calcule el valor de P,
suponiendo normalidad y varianzas diferentes.
Solucin:
Datos:
Tamao de la primer muestra n
1
= 12 llantas.
Tamao de la segunda muestra n
2
= 12 llantas.
Desviacin estndar de la primer muestra s
1
= 5100 Km.
Desviacin estndar de la segunda muestra s
2
= 6900 Km.
Media de la primer muestra
1
x = 37900 Km.
Media de la segunda muestra
2
x = 39800 Km.

Hiptesis nula H
0
:
1
=
2.
Hiptesis alternativa H
1
:
1

2
.

Nivel de significancia = 0.05

Rechazo o No Rechazo de la hiptesis nula.



( ) ( )
(
(

\
|
+
(
(

\
|
|

\
|
+
=
1 n
n
s
1 n
n
s
n
s
n
s
2
2
2
2
2
1
2
1
2
1
2
2
2
2
1
2
1
v

( )
( ) ( ) ( ) ( )
20
11
12
6900
11
12
5100
12
6900
12
5100
2
2
2
2
2
2 2
=
(

+
(

+
= v
En la tabla se encuentra que t
0.025
= 2.086 con 20 grados de libertad, de
aqu, el intervalo de confianza de 95% para es:
( ) ( )
2
2
2
1
1
2
2 1 2 1
n n
X X
s s
t
+

=

( ) ( )
313 . 0
12
6900
12
5100
0 39800 37900
2 2
=
+

= t

Como -0.313 est entre 2.2086 y 2.086, no se rechaza H
o
.
( ) 0183 . 0 086 . 2 = > = Z p P

12. Dos secciones de un curso de estadstica son sometidas a un mismo
examen final. De las calificaciones obtenidas se extrae una muestra
aleatoria de tamao 9 en la grupo "A", y otra de tamao 4 en el grupo "B".
Grupo "A": 65, 68, 72, 75, 82, 85, 87, 91, 95
Grupo "B": 50, 59, 71, 80
a. Con un nivel de significacin de 0.05 podra decirse que los dos grupos
tienen las mismas calificaciones promedio? Suponga que provienen de
poblaciones normales con varianzas iguales.

Solucin:
Tamao de la primer muestra n
1
= 9
Tamao de la segunda muestra n
2
= 4

80
9
95 .......... 72 68 65
1
1
=
+ + + +
= =

=
n
X
X
n
i
i

65
4
80 71 59 50
1
1
=
+ + +
= =

=
n
X
X
n
i
i

( )
50 . 10
1
1
2
1
=

=
n
x x
S
n
i
i

( )
1909 . 13
1
1
2
2
=

=
n
x x
S
n
i
i


Desviacin estndar de la primer muestra s
1
= 10.50.
Desviacin estndar de la segunda muestra s
2
= 13.1909.
Media de la primer muestra
1
x = 80.
Media de la segunda muestra
2
x = 65.

Hiptesis nula H
0
:
1
=
2.
Hiptesis alternativa H
1
:
1

2
.

Nivel de significancia = 0.05

( ) ( ) ( ) ( )
2
1 * 1 *
2 1
2
2
2 1
2
1
+
+
=
n n
n s n s
s
p

( ) ( ) ( ) ( )
2 4 9
1 4 * 1909 . 13 1 9 * 50 . 10
2 2
+
+
=
p
s


( ) ( ) ( ) ( )
2976 . 11
2 4 9
1 4 * 1909 . 13 1 9 * 50 . 10
2 2
=
+
+
=
p
s

( ) ( )
2 1
2 1 2 1
n
1
n
1
X X
+

=
p
s
t

( ) ( )
209 . 2
4
1
9
1
2976 . 11
0 65 80
=
+

= t

Si
2 n n ,
2
2 n n ,
2
2 1 2 1
t t t
+ +
< <

, no se rechaza H
0
.
2 4 9 ,
2
05 . 0
2 4 9 ,
2
05 . 0
+ +
< < t t t
11 , 025 . 0 11 , 025 . 0
t t t < < Aplicando Tabla t
201 . 2 201 . 2 < < t
Si rechazamos la hiptesis nula ya que el valor de t hallado no se encuentra
dentro de la regin crtica.

( ) 0445 . 0 201 . 2 2 = > = Z p P


BIBLIOGRAFIA

Material de estudio Ingeniero Nstor Agudelo Daz unidades 5 y 6.

http://wiki11estadistica.wikispaces.com/estadistica+inferencial

http://www.edukanda.es/mediatecaweb/data

http://colposfesz.galeon.com/est501/suma/sumahtml/conceptos/estadistica.h
tm

http://www.ditutor.com/estadistica/inferencial

Você também pode gostar