Escolar Documentos
Profissional Documentos
Cultura Documentos
MANUAL PARA EL
CURSO DE LA
CLASE DE
PROBABILIDAD Y
ESTADSTICA.
reproducir el proceso
De que no faltars
Explorando en el Internet
Programa de clase.
Asignatura: Probabilidad y estadstica.
Profesor: Ing. Oscar Manuel Robles Snchez.
Introduccin:
Actualmente el estudio de la Probabilidad y Estadstica esta dirigido tanto a los
campos especializados en la Investigacin, como a la Ingeniera, a los negocios, a la
Biologa, la Educacin, etc.
Para fines didcticos el curso se ha dividido en 4 unidades en las cuales el
estudiante conocer y aplicar los principales conceptos de la probabilidad y deber
de desarrollar una habilidad para aplicar un razonamiento lgico matemtico a la
interpretacin y solucin de los fenmenos aleatorios. En la siguiente unidad aplicar
todos sus conocimientos a la generacin y aplicacin de una serie de modelos
matemticos. En la tercera unidad comprender la necesidad de agrupar datos para
darles un tratamiento estadstico y representarlos por una serie de graficas y por sus
valores medios y de dispersin. Finalmente, entender y aplicar el objetivo
fundamental de la estadstica que es el de al Inferencia.
Las 4 unidades consideran el comprender el significado y las implicaciones de
las ideas bsicas, mas que el memorizar una lista de frmulas.
Este curso es importante en la formacin del Ingeniero Civil, ya que el quehacer de las
obras de Ingeniera, depende de las caractersticas de los datos y de cmo estos
acontecen, lo que te permitir disearlas de una manera funcional (caminos, presas,
viviendas, estructuras, agua potable, alcantarillado, etc.).
Este curso requiere de un conocimiento de las matemticas y computacin
bsicas, adems, hay que saber razonar las tcnicas donde el calculo matemtico es
solo un proceso mecnico.
Objetivo General del curso:
El alumno desarrollara una capacidad para reconocer los modelos matemticos
que describen los fenmenos aleatorios, a travs de reconocer a la Estadstica como la
ciencia que se relaciona con los datos y su tratamiento, y a la probabilidad como la
ciencia que aporta los elementos o modelos para la validacin, ambas juntas a travs
de la Inferencia Estadstica.
Contenido Temtico.
Unidad 1.- La Probabilidad
a) Introduccin (como estudiar el curso, descripcin programa).
b) Investigacin, diseo experimental y su teora
c) Teora de los conjuntos
d) Las leyes de la Probabilidad.
e) El Teorema de Bayes.
f) Las tcnicas de conteo o combinatoria.
g) Las variables aleatorias.
h) La esperanza matemtica o valor esperado.
i) La funcin generatriz de momentos.
j) Las distribuciones de probabilidad.
Total 22 hrs.
Total 22 hrs.
Total 10 hrs.
Total 12 hs.
Estadstica elemental.
John Freund Gary Simon
Estadstica
Murray spiegel
UNIDAD 1
Introduccin a la Probabilidad y Estadstica.
En la Ingeniera civil se aceptan una serie de hiptesis simplificatorias (las
cargas son axiales, los materiales son homogneos, los cuerpos son rgidos, etc.) con el
fin de llegar a formulaciones simples de un problema, llamado modelo matemtico, el
cual facilita el calculo pero a la vez es suficientemente representativo. Es un modelo
determinado que funciona al sustituir las variables independientes y definir las
dependientes. Pero en la Ingeniera tambin existen fenmenos que estn sujetos a
leyes azarosas o del azar, es decir existe incertidumbre en su ocurrencia y una
hiptesis no es suficiente, ( volmenes de trnsito, velocidades del viento, volmenes
de agua escurridos por lluvia, diseos de sistemas de agua potable y alcantarillado,
programas de obra, distribucin de transito en la red vial, etc.).
Lo anterior indica contar con una base de datos para interpretar el fenmeno y
una forma de actuar ante un fenmeno con incertidumbre, lo que constituye la esencia
de la Probabilidad y Estadstica.
La probabilidad plantea leyes del azar y las cuales se utilizaran como base para
guiarnos a predecir los resultados de ciertos experimentos o fenmenos teniendo as
una base para la toma de decisin, en la Estadstica observaremos los resultados de
acciones repetitivas y que nos representan la realidad de los datos recolectados de una
muestra asociada a una poblacin, finalmente con la ayuda de probabilidades
estimadas realizaremos inferencias que es el fin ltimo del anlisis del fenmeno y que
nos permite definir la poblacin de la cual se obtuvo la muestra.
La probabilidad razona de la poblacin a la muestra y la estadstica de la
muestra a al poblacin.
Todo Ingeniero requiere de tener conocimientos de la Probabilidad y
Estadstica, ya que para incrementar los conocimientos que se tienen acerca del
mundo es necesario el empleo de las inferencias estadsticas. En un problema de
probabilidad las propiedades de la poblacin se suponen conocidas y se formulan y
responden preguntas en relacin con una muestra tomada de la poblacin. En un
10
11
PROBABILIDAD
Teora de los Experimentos.LA PROBABILIDAD Y LA ESTADISTICA:
Son herramientas usadas en al mayora de las ciencias para poder efectuar
mejores tomas de decisiones.
EXPERIMENTO:
Proceso para obtener una observacin de un fenmeno o proceso cualquiera,
involucra tres etapas; ACCION, RESULTADO Y OBSERVACION.
VARIABLES EXPERIMENTALES:
Son las que tienen un efecto sobre el experimento, pueden ser cuantitativas o
cualitativas.
TIPOS DE EXPERIMENTOS:
Se consideran de dos tipos; los aleatorios y los experimentos determinsticos.
EXPERIMENTO ALEATORIO:
Los datos y resultados estn libres de determinacin, se define por la
distribucin terica de una variable y de su estudio se encarga la probabilidad.
EXPERIMENTO DETERMINISTICO:
Son aquellos en que datos y resultados se conocen en forma absoluta. En su
estudio se encarga de las distribuciones empricas de una variable a travs de
la estadstica.
PUNTOS MUSTRALES:
Un experimento produce uno y solo uno de los sucesos, si a cada suceso se le
asigna un punto se tendr un punto muestral. Un experimento tendr tantos
puntos mustrales como sucesos puedan acontecer.
ESPACIO DE EVENTOS (S):
Es la totalidad de resultados posibles de un experimento, tambin se le llama
universo o poblacin o censo. Es el conjunto de todos los puntos mustrales.
EVENTO SIMPLE:
Es cada uno de los resultados del espacio de eventos (cada punto muestral es
un evento simple).
EVENTO MULTIPLE:
Es un conjunto de eventos simples, se representa con maysculas.
EVENTO IMPOSIBLE:( )
Es el que no se define en el espacio de eventos.
NOTACION CONSTRUCTIVA DE EVENTO UN MULTIPLE:
A = {x x es algo}, A es el conjunto de eventos simples x, tal que x es algo del
experimento.
12
VERIFICACION DE UN EVENTO:
Si A se verifica de nA maneras distintas y B de nB maneras distintas,
ambos se verifican de nA*nB maneras distintas, se generaliza para ms de dos
eventos.
EJEMPLO:
Un experimento consiste en tirar un par de dados y observar las caras
que caen hacia arriba. Determine los eventos mltiples:
A = {x | x es par}
(espacio de eventos)
n x * ny = 6*6 = 36 = ns
B = {x | x es non}
C = {x | x es 12}
D = {x | x es < 2}
Espacio de eventos cualitativo
S = 36
(1,1) (1,2) (1,3) (1,4) (1,5) (1,6)
(2,1) (2,2) (2,3) (2,4) (2,5) (2,6)
(3,1) (3,2) (3,3) (3,4) (3,5) (3,6)
(4,1) (4,2) (4,3) (4,4) (4,5) (4,6)
(5,1) (5,2) (5,3) (5,4) (5,5) (5,6)
(6,1) (6,2) (6,3) (6,4) (6,5) (6,6)
A = {(1, 1); (3, 1); (2, 2); (1, 3); ... (4, 6); (6, 6)}
nA = 18
B = {(2, 1); (1, 2); (4, 1); (3, 2); ... (6, 5); (5, 6)}
nB = 18
C = {(6, 6)}
nC = 1
D = {} vaco o imposible
13
CONJUNTO UNIVERSAL
A=A
A=
AS=S
AS=A
14
CONJUNTO COMPLEMENTARIO
A A' = S
A A' =
PROPIEDAD DE COMPLEMENTO
(A B)' = A' B'
(A B)' = A' B'
ASOCIATIVA
A (B C) = (A B) C
A (B C) = (A B) C
CONMUTATIVA
AB=BA
Y
AB=BA
DISTRIBUTIVA
A (B C) = (A B) (A C)
A (B C) = (A B) (A C)
ASPECTOS CUALITATIVOS Y CUANTITATIVOS DE LOS
CONJUNTOS:
Un conjunto tiene estas dos propiedades, a la probabilidad y estadsticas
solo les interesa el aspecto cuantitativo, es decir, interesa cuantos son pero no
quienes son.
EJEMPLO:
Un experimento consiste en tirar un dado, dados los siguientes
conjuntos mltiples A, B, C, D.:
A = {x | x es par}
B = {x | x es non}
C = {x | x es > 4}
D = {x | x = 3}
Y DONDE
S = {1, 2, 3, 4, 5, 6}
-11DETERMINAR:
AB, AB, ABC, BCD Y (AC) (BD)
15
RESPUESTA:
A = {2, 4, 6}
B = {1, 3, 5}
C = {5, 6}
D = {3}
AB = {2, 4, 6, 1, 3, 5} = {S}
AB = {}
BCD = {1, 3, 5, 6}
n AB = 6
n AB = 0
n ABC = 6
n BCD = 4
n(AC)
DIAGRAMAS DE VENN-EULER
(AB)
B
AB
AB
(AB)
BA
ACB
AB
BA
CAB
C
(ABC)
ABC
ABC
BCA
16
ABC
EJEMPLO:
Un coche puede requerir reparacin general, reparar la transmisin o
llantas nuevas, un coche requiere las tres reparaciones, ocho no requieren
reparacin alguna, dos requieren transmisin y llantas pero no-reparacin, tres
reparacin general y llantas pero no-transmisin, cuatro reparacin y
transmisin pero no llantas, cinco transmisin pero no llantas ni reparacin
general, seis llantas pero no-reparacin general ni transmisin y siete
reparacin general pero no transmisin y llantas.
A) Represente en notacin de conjuntos
B) Elabore el diagrama de Venn-Euler
RESPUESTA
A)
R = reparacin general
T = transmisin
L = llantas
a)
b)
c)
d)
e)
f)
g)
h)
i)
j)
k)
l)
m)
R, T Y L:
SIN REPARACION
T Y L NO R
R Y L NO T
R Y T NO L
T PERO NO R Y L
L PERO NO R NI T
R PERO NO T Y L
S = 36
n(RTL) = 28
nR = 15
nT = 12
nL = 12
n(RTL) = 1
n(RTL) = 8
n(TLR) = 2
n(RLT) = 3
n(RTL) = 4
n(TLR) = 5
n(LRT) = 6
n(RLT) = 7
17
B)
7
5
S= 36
L
(ABC) = 8
ABC=28
EJEMPLO:
En un grupo de 20 alumnos hay 16 aprobados en matemticas y 12 en
fsica pero existen 2 reprobados en ambas. Cuntos alumnos aprobaron las
dos materias?
RESPUESTA:
nM = 16
nF = 12
nS = 20
MF =?
M
MF
MF
FM
n(MF) = 2
MF
Entonces:
n (MF) = ns (MF) = 20 2 = 18
n (MF) = nM + nF n(MF)
18 = 16 + 12 n (MF)
n (MF) = 16 + 12 18 = 10
n(MF) = 10
18
MF = 6
MF = 10
FM = 2
n(MF) = 2
MF = 18
EJEMPLO
Al interrogar a 500 alumnos inscritos a uno o ms cursos semestrales de
lgebra, fsica y estadstica se encontr que tomaron lgebra 329, fsica 186,
estadstica 295, lgebra y fsica 83, lgebra y estadstica 217, fsica y
estadstica 63. Calcule l nmero de estudiantes que cursaron las tres
materias.
RESPUESTA
Datos:
S = 500
n(AEF) = 500
nf = 186
nA = 329
nE = 295
n(AF) = 83
(a + b)
n(AE) = 217 (a + d)
n(FE) = 63
(a + c)
n(AFE) =?
e
f
g
d
E
AFE
nF + nA + nE = (a + b + c + e) + (a + b + d +f) + (a + c + d + g)
nF + nA + nE = 186 + 329 + 295
nF + nA + nE = 810
500 + (a + b) + (a + d) + (a + c) a = 810
500 + 83 + 217 + 63 a = 810
a = 53 = n(AFE) que tomaron las tres materias
19
F
AFE = 30
AEF = 164
AF
FA
E=
E=
EF93
82
E
AFE = 53
EFA = 10
A=
68
Determine adems:
tomaron lgebra pero no estadstica.
tomaron fsica pero no lgebra.
tomaron estadstica pero no fsica.
tomaron lgebra o estadstica pero no fsica.
tomaron lgebra pero no fsica ni estadstica
Conceptos de probabilidad
Existen tres maneras bsicas de definir la probabilidad, surgen de
planteamientos conceptuales diferentes, pero implican lo mismo, La
aleatoriedad.
a) Concepto frecuentista de probabilidad, tambin se denomina de frecuencia
relativa, surge en el siglo XIX cuando inversionistas tuvieron la necesidad
de valuar el riesgo de perdidas en plizas de seguros, tomaron como base
datos de nacimientos y muertes, definieron la frecuencia relativa de
ocurrencia y tomaron una decisin. Es un hecho emprico que la frecuencia
relativa tienda a estabilizarse cuando aumenta la frecuencia total.
La Frecuencia Relativa es una cifra pasada para predecir lo que suceder en
el futuro.
El problema radica en cuantas veces repetir el experimento. El fenmeno
para que sea aplicable debe tener una situacin estable de frecuencia.
Las condiciones para la frecuencia relativa son, de que deben de realizarse
un gran nmero de intentos y el fenmeno debe de tener una consistencia
estable en su frecuencia.
20
21
Teora de la probabilidad
PROBABILIDAD
Este concepto es importante cuando se operan procesos que generan
observaciones que no se pueden predecir, pero su FRECUENCIA RELATIVA
con la cual ocurre en una gran serie de observaciones, generalmente es estable,
estos eventos se denominan ALEATORIOS O ESTOCASTICOS. La frecuencia
relativa da una medida intuitiva de la posibilidad de ocurrencia de un evento
aleatorio en observaciones futuras.
El concepto clsico de probabilidad considera que es finito l numero de
eventos simples asociados a un experimento aleatorio y donde todos y cada uno
de ellos SON IGUALMENTE POSIBLES en su ocurrencia, la probabilidad de un
evento A contenida en S y formado por n A eventos, se obtiene por la relacin
que existe entre los eventos favorables respecto al espacio de eventos a decir:
PA = nA/nS
LIMITES DE LA PROBABILIDAD
La probabilidad es un nmero comprendido entre cero y uno
P (A) = nA/nS
S nA = nS
P (A) = nA/nS = 1
P () = 0
0 < P (A) < 1
22
P(S) = 1
p (Ai)
AB
AUB
n (AB) = nA + nB n(AB)
si todo se divide entre nS tendremos...
n (AB)/nS = nA/nS + nB/nS n(AB)/nS
P(AB) = PA + PB P(AB)
Si no hay interseccin de A y B si n (AB) = los eventos son mutuamente
excluyentes
AUB
nS
23
EJEMPLO 1
Una urna tiene 6 bolas rojas, 4 blancas y 5 azules. El experimento
aleatorio consiste en extraer una bola de la urna y observar su color.
Encuentre la probabilidad de que la bola extrada.
a)
b)
c)
d)
e)
sea roja
sea blanca
sea azul
no sea roja
sea azul o roja
nR = 6
nB = 4
nA = 5
24
A
AB
(AB)
AB
P(A/B)
Probabilidad condicionada
P(A/B) = N(AB)/N (B)
todo entre N(S)
P (A/B) = [N (AB) / N(S)] / [N (B) / N (S)]
P (A/B) = P (AB) / P (B)
P (AB) = P (B) * P (A / B)
Se generaliza
En forma para A
P (B/A) = N (AB) / N (A) = P (A B) / P (A)
P (A B) = P (A) * P (B / A)
De sta manera
P (B) * P(A/B) = P (A) * P (B / A)
Si se quita la condicin se tendr la independencia de eventos, la cual es
diferente de los eventos mutuamente excluyentes.
Para B:
P (A B) = P (B) * P(A / B)
P (A B) = P (B) * P(A)
Para A:
P(A B) = P(A) * P (B/A)
P(A B) = P(A) * P (B)
se quita la condicin
se quita la condicin
25
EJEMPLO
El experimento extraer 3 bolas de una urna con seis bolas rojas, cuatro
blancas y cinco azules.
SIN REEMPLAZO: probabilidad condicionada
CON REEMPLAZO: independencia de eventos
a) P en el orden R, B, A:
C.R.
P (R B A) = PR * PB * PA
= 6/15 * 4/15 * 5/15 = 8/225 = 3.5%
S.R.
P (R B A) = PR * P (B / R) * P(A / R B)
= (6/15 * 4/14 * 5/13) = 4/91 = 4.4%
b) 1 de cada color
S.R.
P (R B A) = P (R A B) P (A R B) P(A B R)
P(BAR) P(BRA) = 6(6/15 * 4/14 * 5/13) = 26.37%
C.R.
c) 2R, 1B
P2R Y 1B = 3P(RRB) = 3(6/15 * 5/14 * 4/13) = 13.19%
d) 3A
P3A = P(AAA) = (5/15 * 4/14 * 3/13) = 2.2%
e) al menos 2R
P2R = P2RP3R = 3P (RRR) + P(RRR) = 3(6/15 * 5/14 * 9/13) + (6/15 * 5/14
* 4/13) = 4.69%
f) cuando mucho 1 azul
P1A = P0A P1A
P1A = 1P (AAA) + 3P (AAA) = (10/15 * 9/14 * 8/13) +3(5/15 * 10/14 *
9/13) = 75.0%
26
EJEMPLO
Una urna contiene 2 bolas blancas y 1 negra, una segunda urna contiene 1
bola blanca, el experimento consiste en pasar una bola de la primera urna a la
segunda urna, encuentre la probabilidad de que al extraer una bola de la urna
dos, esta sea blanca.
ALTERNATIVAS
PROBABILIDAD
B1B1
B1B3
B2B2
B2B3
NB3
NN
1/3 *
1/3 *
1/3 *
1/3 *
1/3 *
1/3 *
FAVORABLE
1/2 = 1/6
1/2 = 1/6
1/2 = 1/6
1/2 = 1/6
1/2 = 1/6
1/2 = 1/6
si
si
si
si
si
no P(B) = 5/6
ser:
C x
SI
X c
SI
C c
no solicitada
X x
no solicitada
C x y x c es decir
o el 50 %.
27
PROBABILIDAD FRECUENTISTA
Existen experimentos en los que la probabilidad de la ocurrencia para
cada uno de los eventos del espacio se mantiene como ocurrencia de frecuencia
relativa, por lo que se les ponga condicin o no, o se trate con independencia de
eventos, su valor no cambiar. Ejemplos: parmetros de calidad, tirar una
moneda, tirar un dado, hijos en familias, etc.
EJEMPLO:
La probabilidad de que un huevo puesto por un insecto encube es un
parmetro estadstico igual a 0.4 encuentre la probabilidad; de que en cuatro
huevos puestos por el insecto encuben tres, por lo menos tres, cuando mucho
uno.
RESPUESTA:
P = 0.4, n = 4,
P(E) + P(E) = 1
entonces P(E) = 0.6
a) PX=3 = 4P(EEEE) = 4(0.4*0.4*0.4*0.6) = 0.1536
b) PX3 = P3P4 = [4*(0.4)3*0.6] + (0.4*0.4*0.4*0.4) = 0.1792
c) PX1 = POP1 = P(EEEE) + 4P(EEEE) = (0.6*0.6*0.6*0.6) +
4(0.4*0.6*0.6*0.6) = 0.4752
28
(4)
(5)
29
P(A/H1) = 0.01
P(A/H2) = 0.03
P(A/H3) = 0.02
Aplicando la formula
P(H1/A) = (0.3*0.01) / (0.3*0.01 + 0.2*0.03 +0.5*0.02) = 0.003/0.019 = 0.157
P(H2/A) = (0.2*0.03) / 0.019 = 0.316
P(H3/A) = (0.5*0.02) / 0.019 = 0.526
Por lo tanto el tercer ingeniero es el que tiene ms probabilidad de cometer el
error.
ANALISIS COMBINATORIO:
Consiste en determinar l nmero de resultados posibles de un
experimento sin necesidad de llevar a cabo una enumeracin directa.
CONTEO
Si un evento se verifica de n1 maneras y otro evento de n2 maneras
ambas se verifican de n 1*n2 maneras distintas. Se generaliza para mas de dos
eventos
EJEMPLO:
Encuentre l nmero de placas que se puede obtener con tres letras y
cuatro nmeros.
n1 = 3 letras _ 27(n1, n2, n3)
n2 = 4 nmeros _10 (n4, n5, n6, n7)
Entonces
30
273*104 = 196 830 000 ser l numero de placas que se pueden obtener.
NOTACION FACTORIAL (n!)
Es el producto de los enteros positivos de 1 hasta n, se acepta que
factorial de 0! = 1.
ORDENACIONES (nOk)
Se llama ordenacin de clase k de n objetos diferentes a los diferentes
grupos ordenados que se pueden obtener tomando k objetos de entre los n,
interesa su ocurrencia y su orden.
nOk = n! / (n-k)!
EJEMPLO:
Obtenga las ordenaciones de las letras a, b, c, d, e tomando 2 a la vez,
donde:
n=5
y
k=2
Entonces
nOk = 5! / (5-2)! = 20
PERMUTACIONES
COMBINACIONES (nCk)
Son los grupos que se pueden formar tomando k objetos de entre los n
interesa su ocurrencia pero no el orden, por lo que deben permutarse k veces
las ordenaciones.
Entonces:
nCk = nOk / k! = n! / k!(n-k)!
31
32
1
DISTRIBUCIN SIMTRICA
ESPERANZA MATEMATICA (VALOR ESPERADO)
Si X es VAD cuya DP es conocida, su esperanza matemtica estar
definida por el valor que tiende a presentarse con ms frecuencia si el
experimento se repite muchas veces.
La esperanza matemtica se define de la siguiente manera:
E = {h(x)} = hxi * Pxi
Habr tantos valores esperados como variables aleatorias se definan.
33
EJEMPLO:
En una lotera para beneficencia se venden 8000 boletos a $1 cada uno.
El premio es un automvil de $3000, si Juan compra 2 boletos. Calcule la
esperanza matemtica o valor esperado de su ganancia.
RESULTADO:
V.A
Ganar
Perder
hxi
$2998
$-2
SUMA
P
2/8000
7998/8000
1
hxi
$20000
$50000
$ 0
Sumas
Pi
0.6
0.3
0.1
1
34
E = {hx} = hxi * Pi = x
valor esperado.
FUNCION GENERATRIZ DE MOMENTOS (fgm)
El tema de fgm ser desarrollado por el alumno y entregado en clase.
EJEMPLO:
Encuentre la x, x, 2x del experimento tirar un par de dados.
Xi
2
3
4
5
6
7
8
9
10
11
12
Pi
1/36
2/36
3/36
4/36
5/36
6/36
5/36
4/36
3/36
2/36
1/36
1
x = Xi * Pi)
x = 2 (1/36) + 3 (2/36) +...
x = 7
CONCENTRACION = 7 2.41,
35
donde
Px = kf(x)
- P(x) dx = 1
EJEMPLO:
Segn datos estadstico una VAC toma valores entre 0 y 4 y su funcin de
probabilidad esta definida por f(x) = - kx. Determine:
a) el valor de k
b) la probabilidad de que P(0 < x < 1)
c) parmetros
d) polgono y concentracin
a. 04 (1/2-kx)dx
x/2 kx2/2 0 4 = 1
2 8k - 0 = 1
k = 1/8
Px = - x/8
b. 01 (1/2 x/8)dx
x/2 x2/16 01
1/2 1/16 - 0 = 7/16
c. x = 04 x(1/2 x/8)dx = x2/4 x3/24 04
x = a 8/3 = 4/3 = 1.33
x2= 04 [(x-4/3)2 (1/2 x/8)]dx = 0.81
x = 0.81 = 0.9
d. concentracin x x
1.33 0.9
de 0.43 a 2.23
Px
x Px
36
4 0
x
Ejemplo1. Se ha encontrado por experiencias, que la duracin de cierto producto es
una v.a.c. que se distribuye segn la siguiente funcin
Fx = e-2x/k para x>0, determine la probabilidad de que el producto tenga una vida de
menos de dos unidades de tiempo y determine la media de la duracin.
LOS MODELOS DE LAS DISTRIBUCIONES DE PROBABILIDAD.
DISTRIBUCIONES TEORICAS DE UNA VARIABLE
Muchos fenmenos aleatorios tienden a mantener una continuidad en su
ocurrencia ya sea en forma consistente o en forma de frecuencia relativa, lo que
permite elaborar o deducir una formula que se ajuste al comportamiento, y que se
denomina MODELO. Atendiendo al tipo de variable por analizar, es decir, discreta o
continua, las distribuciones o modelos mas frecuentes son los siguientes:
CASO DISCRETO
A) Distribucin Hipergeomtrica (H)
B) Distribucin Binomial (B)
C) Distribucin Geomtrica (G)
D) Distribucin de Poisson (P)
E) Distribucin Multinomial (M)
F) Distribucin Binomial Negativa ( B-1 )
CASO CONTINUO
Teorema de Tchebyshef
A) Distribucin Uniforme o Rectangular
B) Distribucin Gamma
C) Distribucin Exponencial
D) Distribucin Normal o Curva de Gauss
E) Ajustes del caso contino al discreto.
CASO DISCRETO:
DISTRIBUCION HIPERGEOMETRICA ( H )
Si tenemos un universo finito de N objetos del cual extraemos n objetos sin
reemplazo de dicho universo y si existe a objetos de cierta caracterstica, la
HIPERGEOMETRICA se define al calcular la probabilidad de que al sacar n objetos x
sean de la caracterstica de a y el resto no lo sea.
Cn
37
x = np
p+q=1
q=1p
EJEMPLO:
Un club esta constituido por 12 hombres y 8 mujeres. Se va a formar un comit de 5
personas.
a) Encuentre la probabilidad de que el comit este formado por 3M y 2H.
b) Si x es una VAD que designa a las mujeres encuentre su DPVAD, polgono,
concentracin, 2x, x y x.
RESPUESTA:
N= 20, n= 5, a= 8
a) p(3M, 2H), x= 3
H = [8C3][(20-8) C (5-3)]/20C5
H = 0.238
b) VAD _ mujeres
x= np p=a/N = 8/20 = 2/5
x=5*(2/5) = 2
2x= [(20-5)/(20-1)] * 5 * 2/5 * 3/5 = 0.947
x= 0.973
concentracin x x = 2 0.97
rango de 1.03 a 2.97
DPVAD x
px
0.4
x
0
1
2
3
4
5
Px
0.051
0.255
0.398
0.238
0.054
0.004
1
DISTRIBUCION BINOMIAL
PRUEBA DE BERNOULLI
Si un experimento esta compuesto por una serie de sucesos con una
probabilidad p de ocurrir o xito y una probabilidad q de no ocurrir o falla y si el
experimento se repite muchas veces y en cada intento se mantienen los valores de p y
q, se dir que se tendr la probabilidad de un xito en un intento o PRUEBA DE
BERNOULLI por ejemplo: tirar una moneda, parmetros de calidad, frecuencia
relativa, etc.
38
Binomial
39
x = np = 6(0.5) = 3
2x = npq = 6(0.5)(0.5) = 1.5
x = 1.22
concentracin x x = 3 1.22
rango de 1.78 a 4.22
El alumno determinar la DPVAD x, el polgono y la concentracin.
EJEMPLO:
En una interseccin en Y que sirve como de libramiento en un camino para no
entrar a una ciudad, segn datos estadsticos permiten asegurar que 2/3 partes del
transito van a la ciudad. Si se aproximan 8 vehculos a la interseccin determine la
probabilidad de que ningn vehculo use el libramiento.
VAD = vehculos que usan el libramiento.
p= 1/3
q= 2/3
n= 8
x= 0
B=[8C0][(1/3)0(2/3)8-0] = 0.000304
x= 8(1/3)= 2.667
2x= 8(1/3)(2/3)= 1.778
x= 1.333
concentracin x x = 2.667 1.333
rango de 1.334 a 4
. Se deja que el alumno determine la DPVAD x y su polgono.
DISTRIBUCION GEOMETRICA
Esta distribucin se basa en la teora binomial, se refiere a la ocurrencia de una
sucesin de pruebas de Bernoulli con probabilidades p y q. La variable aleatoria
geomtrica considera la ocurrencia de una serie de fallas antes de que ocurra el
primer xito o una serie de xitos antes de la primera falla. Si en el experimento
Binomial la ocurrencia simtrica ocurre cuando p= y q= , en el caso geomtrico la
situacin perfecta ser cuando p= obtenindose un comportamiento de tipo
exponencial. La G se define por:
G= px-1 * q
Parmetros: = 1/q
2= p/q2
o bien
G= qx-1 * p
40
Parmetros: = 1/p
2= q/p2
EJEMPLO:
Un dado se lanza varias veces, encuentre la probabilidad de que el primer seis
caiga en el quinto lanzamiento.
x= 5
q= 1/6
p= 5/6
G= px-1q
G=(5/6)4(1/6) = 0.0803
= 1/q = 1/(1/6) = 6
2= p/q2 = (5/6)/(1/6)2= 30
= 5.47
concentracin x x = 6 5.47
rango de 0.53 a 11.47.
Ejemplo :
Un proceso productivo involucra que un elemento se procese en dos mquinas, la
A y la B, en ese orden.
El elemento se puede romper en cada mquina y cuando esto ocurre la mquina
queda temporalmente fuera de servicio y el proceso se interrumpe.
Si la probabilidad de que el elemento se rompa en la maquina A es p 1 y de que se
rompa en la mquina B es p 2, encuentre una expresin que determine el total esperado
de elementos que se procesarn antes de que ocurra la primera ruptura.
Aplique para el caso de que p1 = 0.0000124 y p2 = .00000275
41
EJEMPLO:
En una prisin 120 de los 300 internos purgan condenas por delitos contra la
salud, si se selecciona una muestra de 8 internos. Encuentre la probabilidad de que 3
de los ocho purguen condena por delitos por la salud.
RESPUESTA:
N= 300,
a=120,
n= 8,
x=3 condiciones de una H, pero como N es muy grande
entonces se revisar un ajuste por la binomial:
0.05N n, 15 8 cumple la condicin y el ajuste ser correcto.
B= nCx pxq(n-x) con n=8, x=3, p=120/300= 0.4 y q=180/300= 0.6
B= 8C3 * (0.4)3(0.6)5
B= 0.2787
Se observa que el ajuste funciona ya que el valor de p y q no varan mucho al
hacerlo sin reemplazo 120/300=0.4 119/299=0.398 etc.
DISTRIBUCION MULTINOMIAL
Considere un experimento en los que se verifican los eventos E 1, E2, E3,... Ek
todos mutuamente excluyentes y en el que cada uno tiene una probabilidad de
verificacin P1, P2, P3, ... Pk, si consideramos que el experimento se repite n veces,
donde cada evento se puede verificar n 1, n2, n3, ... nk, donde n1 + n2 + n3 + ... + nk = n (con
reemplazo).
La multinomial se define al calcular la probabilidad de ocurrencia de cada
evento pero en todos sus casos posibles, es decir:
M= [n!/(n1! n2! n3! ... nk!)] (P1)n1.......... (Pk)nk
k
variables aleatorias.
Se deber de calcular los parmetros y para cada variable aleatoria.
EJEMPLO:
De un estudio de Ingeniera de Transito se estableci que l numero total de
viajes de la zona A a la B se distribuye por propsito de la manera siguiente (ver tabla
en la siguiente hoja). Considere un viaje especfico en un autobs del servicio pblico y
en el cual se encontr que iban 15 personas. Determine la probabilidad de que iban con
los siguientes propsitos.
42
RESPUESTA
Propsito
E= propsito
TRABAJO
0,433
NEGOCIOS
0,08
COMPRAS
0,081
RECREO
0,076
ESCUELA
0,304
OTROS
0,026
P= probabilidad
VA = 6
n= numero de pasajeros
B-1 =
(x-1)
C (r-1) prq(x-r)
2x = r(1-p)/p2
S r= 1
x = r/p = 1/p
x = 1(1-p)/p2 = q/p2
r= 1
B-1
G
2
43
EJEMPLO:
Un estudio geolgico indica que un pozo mana petrleo con una probabilidad de
0.2. Cul es la probabilidad de que el 3er. encuentro de petrleo haya manado del 5to
pozo que se perforo?
RESPUESTA:
p= 0.2
q= 0.8
x= 5
r= 3
B-1 = [4C2](0.2)3(0.8)2
B-1 = 0.03072
x= 3/0.2 = 15
Rango = de 7 a 23
2x= 3(1-0.2)/(0.22) = 60
x= 7.75
p= 1[ ] =
q= 1 =
B-1= [5C2](1/4)3(3/4)3
B-1= 0.066
x= r/p = 3/(1/4) = 12
2x= r(1-p)/p2 = 36
concentracin = 12 6
Rango = de 6 a 18
El alumno calcular el caso de 3 monedas.
x= 6
p
0
x
0
44
en un
EJEMPLO:
El 2% de los fusibles producidos por una maquina son defectuosos. Encuentre la
probabilidad de que en una muestra de 200 fusibles tomados al azar.
se tengan 4 defectuosos
cuando mucho 6 defectuosos
entre 15 y 180 defectuosos
Si la VA son defectuosos encuentre su DPVA y parmetros.
RESPUESTA:
n= 200
p= 0.02
q= 0.98 es una binomial
pero como p < 0.05 y n > 100 entonces es adecuado Poisson.
P=[e-x] /x!
a. = np = (200)(0.02)= 4
Px=4 =( e-4 44 ) /4!
Px=4 = 0.195
Px6= p0 + p1 + p2 + p3 + p4 + p5 + p6
= e-4[40/0! + 41/1! + 42/2! + 43/3! + 44/4! + 45/5! + 46/6!] = 0.88
P ( 15 x 180 ) = P15 + P16 + .......... + P 179 + P180
45
Px
0,0183
0,0733
0,1464
0,1952
0,1952
0,1561
0,104
0,0595
0,0297
0,0132
0,25
0,2
0,15
0,1
0,05
0
0
10
0,9909
46
RESPUESTA:
a) Px= 9 en un periodo de 1 minuto
2400/1440 =1.6 veh/min =
Px= 9 = e-x/x!= e-1.6 * 1.69/9! = 3.82 * 10-5
b) Px= 1 e-1.6 * 1.61 / 1! = 0.323
c) se deja al alumno resolverlo
EJEMPLO:
En una interseccin con semforo en tiempo fijo de ciclo de 60 segundos. 200
vehculos/ hora dan vuelta a la izquierda, cada ciclo puede acomodar tres vueltas
izquierda.
a) En que porcentaje de los ciclos es de esperarse que ocurran demoras.
b) Si se proporciona una fase especial para darle vueltas izquierdas, en que porcentaje
de los ciclos no ser necesario esta fase.
RESPUESTA:
Vuelta a la izquierda = 200 veh/hr, 3 vueltas por cada ciclo de 60 seg.
200/60 = 3.3 =
a) Px4 = 1-[p0 + p1 + p2 + p3]
Px4 = 1 e-3.3[3.30/0! + 3.31/1! + 3.32/2! + 3.33/3!]
Px4 = 0.4197 de probabilidades de que haya demoras
b) x = 0
Px=0 = e-x/x!= e-3.3 * 3.30/0!
Px=0 = 3.7% no ser necesario la fase del semforo.
LAS DISTRIBUCIONES CONTINUAS
TEOREMA DE CHEBYSHEV (TCH)
Este teorema es aplicable a cualquier conjunto de observaciones de una
variable aleatoria continua o discreta, por esta razn sus resultados son dbiles o
conservadores. Se puede referir tanto a poblaciones como a muestras. El TCH es un
hecho cientfico ya que esta demostrado matemticamente, es muy conservador, ya
que considera que la fraccin de observaciones que caen en un cierto intervalo tienda
a tomar el concepto al menos, situacin que permite que muchos fenmenos lo
satisfagan. El TCH es aplicable cuando se desconoce la distribucin y su forma, pero
conocidas estas se podrn calcular probabilidades exactas. La condicin ms apropiada
Para aplicar el TCH es cuando las distribuciones presentan una forma del tipo
monticular o tipo joroba, pero an con distribucin desconocida podr ser aplicado, al
ser solo para valores aproximados al TCH tambin se le conoce como de distribucin
libre, el TCH descubri que la fraccin del rea entre dos valores simtricos
47
alrededor de la media esta relacionado con la desviacin estndar tanto para el caso
discreto como para el continuo.
El TCH tambin es la aplicacin para definir la tendencia de una DP ya que una
distribucin acampanada debe satisfacer sus condiciones.
El TCH considera una VA x con parmetros (x, x) y demuestra para todo valor de
k(+) desv std de la media toma los siguientes valores :
P( -kx+k ) 1 (1/k2) para k1
Esto indica que por lo menos 1 1/k2 de las observaciones se encuentran dentro
de k desviaciones estndar de la media. Geomtricamente representa lo siguiente:
F(x)
x
x
x
k
es decir
k
1 1/k2
0 se suele aceptar > 2/3
8/9
15/16
24/25
EJEMPLO:
Un producto tiene un peso promedio de 16 onzas (x = 16), con x= 0.02 onzas.
Qu porcentaje de los productos como mnimo debern de tener su peso entre 15.8
x 16.2 onzas? Si su distribucin continua es desconocida
RESPUESTA: Al desconocer su funcin se podr aplicar el TCH
VA : pesos del producto en onzas.
x = 16
x = 0.02 segn x x
16 k * x
k * x = 0.2
k = 10
se satisface 1 1/k2 = 1 1/102 = 0.99
por lo que el 99% de los productos tendrn su peso en este rango.
48
EJEMPLO:
l numero de clientes a los que un restaurante sirve una noche de viernes es
una VA con una x = 160, x = 7.5, si la distribucin es del tipo monticular encuentre
a) la probabilidad de que se sirvan entre 145 y 175 clientes en una noche de
viernes
b) Con que frecuencia se atendern hasta 200 clientes.
c) l numero de clientes que sern atendidos con una probabilidad del 85%.
RESPUESTA:
Al ser monticular la distribucin pero desconocida la funcin se aplicar TCH.
x = 160, x = 7.5
a) P(145 x 175) = 1 = 3/4 = 0.75 es la probabilidad solicitada.
x k * x
k * x = 15
160 15
k = 15/7.5
k=2
b) Px 200 = 1- 1/5.332 = 0.965 se atender hasta 200 clientes
x k * x
k * x = 40
160 40
k = 40/7.5
k = 5.33
c) 11/k2 = 0.85
k2 = 6.66
k = 2.58 por lo que el intervalo ser de P(141 x 179) = 0.85
ya que 160 ( 2.58 ) ( 7.5 )
k
A=b*h
A = (b-a)(1/b-a)
A =1
F(x)
1/(b-a)
49
50
= funcin de alfa
f(x) = (x-1e-x/)/
por el T.CH, para tener una solucin aproximada al problema. Pero se puede llegar
a una solucin exacta empleando una tcnica programada; por ejemplo, a travs del
Mathcad con la limitativa de no dar solucin para valores grandes de y . Aunque
tambin se podr dar solucin empleando una transformacin de la Gamma std a
travs de la Gamma incompleta.
Los valores de y pueden ser determinados si son conocidos los parmetros
y , ya que con una relacin algebraica se podrn determinar los parmetros de
forma y el de escala, siendo esto lo comn.
Cuando en la funcin Gamma general se tiene que = 1, entonces se denomina
distribucin Gamma estndar de probabilidad, es decir :
F (x;) = [ x-1 e x ] / para x 0 ; 0 para otro modo.
Pero si tenemos definidos los parmetros y , entonces ser conveniente
transformar a la Gamma estndar en la llamada Gamma incompleta de la siguiente
manera X = x / de donde para el calculo de una probabilidad:
P ( X< x ) = F ( x ; , ) = F (x/ ; ) = F ( X , )
Lo anterior implica que se resuelve la probabilidad nicamente con el valor de
y el valor de X, para lo cual se ha diseado una tabla que permite calcularla en forma
exacta la probabilidad
51
EJEMPLO:
El tiempo para efectuar un mantenimiento de un equipo sigue una ley gamma con = 3
y = 2. Un mecnico nuevo emplea 20 minutos para llevar a cabo dicho mantenimiento,
concuerda este tiempo con las experiencias anteriores de mantenimiento.
RESPUESTA:
= = 6
2 = 2 = 12, = 3.46 Concentracin 63.46, en este rango se tendr la mayor
concentracin de probabilidad, por lo que casi se puede aceptar que 20 es demasiado
tiempo y no concordar con las experiencias anteriores. Se compararn estos valores
teniendo como funcin de ajuste el empleo del T.CH. :
k = 14, k = 4.05
Px 20 = 1 1/k2
= 0.94,
o sea que solo en el 6% de los casos se emplearn mas de 20 minutos, por lo que no
concuerda con los tiempos de mantenimiento. Empleando mathcad da una probabilidad
exacta de = 0.997 considerando la funcin [ x 2 e-x/2 ] / 16, se observa la diferencia que
existe entre el valor estimado y el real. Para el caso de un valor mximo de 10 la
probabilidad exacta es 0.875 pero por T. CH. Da 0.25 donde se observa la gran
diferencia en la aproximacin. En la hoja final de anexos se muestra la hoja de clculo
del Mathcad.
Empleando la gamma incompleta, se har la siguiente transformacin:
X = x/ = x/2, el calculo de la probabilidad ser P ( X< x ) = P ( X < 20)
P ( X < 20 ) = F ( x/, )
F ( 20/2, 3 ) = F ( 10,3 ) = F ( X , )
Entrando a la tabla de la gamma incompleta y la cual se adjunta en el anexo de la
pagina final, se tendr que P ( x < 20) = 0.997 que coincide con el valor calculado por
mathcad, para el caso de P ( x<10 ) da 0.875 que tambin coincide con el valor exacto.
Se deja al alumno haga la conclusin de los tres casos.
EJEMPLO:
Los sueldos de los ingenieros de una empresa siguen la ley gamma = 600 y = 50.
a) Determine los parmetros y .
b) Es creble que existen muchos ingenieros con ingresos mayores a 35000.
52
RESPUESTA:
a) = = 30 000
2 = 2 = 1500 000 =1225 Concentracin 300001225 de 28775 a 31225
Como funcin de ajuste se emplear el T.CH.
b) k = 5 000, k= 4.08 para
Px 35 000 = 1 1/(4.08*4.08)
= 0.94,
es decir que no es creble que ganen mas de 35 000 ya que solo el 6%
aproximadamente ganan mas de $ 35000.
La solucin por la Gamma cuando y toman valores muy altos, como es el caso
de este problema, se requerir de algn artificio matemtico, ya que al tratar de dar
solucin por mathcad el programa no da solucin por ser muy grandes los parmetros
600 y 500 como se muestra en el anexo final. Al tratar de emplear la gamma
incompleta sucede lo mismo, ya que la tabla no se define para valores altos, por lo que
la solucin practica ser el empleo del T. CH.
EJEMPLO:
En cierta ciudad, el consumo diario de energa elctrica, en millones de
kilowatts hora, es una variable aleatoria x que tiene una distribucin gamma con
unamedia = 6 y variancia 2 = 12:
. Encuentre los valores de y
. Encuentre la probabilidad de que en cualquier da dado el consumo de energa diario
exceda 12 millones de kilowatts hora.
. Datos = 6 2 = 12 = 3.46, la solucin ser:
==6
2 = 2 = 12 despejando e igualando en ambas ecuaciones:
=6/
= 12 / 2
6 / = 12 / 2
( 6 -12 ) = 0
las races sern 1 = 0 y 2 = 2 si = 6 entonces = 6/2 = 3.
Los parmetros sern:
= 3 y = 2.
. Se deja alumno resolver el segundo inciso por T. CH. Y gamma incompleta.
DISTRIBUCION EXPONENCIAL
Esta distribucin es una variante de la distribucin gamma con la condicin de
que = 1 por lo que la gamma se transforma de la siguiente manera:
f(x) = (x-1 e-x/)/0 (x-1e-x)dx
f(x) = (x1-1 e-x/)/0 (x1-1e-x)dx
f(x) = (x0 e-x/)/0 (x0 e-x)dx
f(x) = e-x//
=1 , X0
53
54
.
55
0.5 0.5
x
l calculo de probabilidades se efecta integrando la curva de Gauss
P (a< x <b) = [1/(x)]e-(x-x)2/2x2 dx
desde a hasta b
z es la VA std.
x z2
56
EJEMPLO:
Los resultados de 500 exmenes de admisin en una universidad, segn el
tratamiento estadstico presento una tendencia normal, encuentre la probabilidad de
que un alumno tomado al azar y que haya presentado el examen haya obtenido
a) cuando mucho 80
b) cuando menos 70
c) entre 70 y 80
d) por lo menos 78
e) cuando mucho 71
f) entre 77 y 82
g) 80 puntos
h) por lo menos 75
i) cuando mucho 72 y cuando menos 78
Determine adems l numero de alumnos que estn en los anteriores rangos, si
consideramos que los parmetros estadsticos fueron una media de 75 ( = 75) y una
desv. Std de 10 ( = 10).
El alumno emplear la tabla normal y elaborar la grfica respectiva.
Respuestas
a) P(x 80)
z = x - / = 80 75/10 =
P(x 80) = 0.5 + 0.1915 = 0.6915
N = (0.6915)(500) = 346
b) P(x 70) = 0.6915
z = 70-75/10 = -1/2
N = 346
c) entre 70 y 80
P(70 x 80) = .383
z1 = 70 75/10 = -1/2
z2 = 80 - 75/10 =
N = 192
P(70 x 80) = 2(0.1915)
d) por lo menos 78
z = 78 75/10 = 0.3
P(x 78) = 0.5-0.1179 = 0.3821
N = 0.3821*500 = 191 alumnos
57
e) cuando mucho 71
z = 71-75/10 = -0.4
P(z 71) = 0.5 0.1554 = 0.3446
N = 172
f) P(77 x 82)
z1 = 77-75/10 = 0.2 0.0793
z2 = 82-75/10 = 0.7 0.2580
P = 0.258 0.0793 = 0.1787, N = 89
g) 80 puntos no es posible, hay que definir un intervalo.
Por ejemplo
P(79 x 81) o bien P ( 79.9 < x < 80.1 )
Ya que se trata de una integral definida por un intervalo y no puntual.
h) por lo menos 75
P(x 75) = 0.5
Z=0
N = 250
i) P(78 x 72)
Z1 = 78 75/10 = 0.3
Z2 = 72 75/10 = -0.3
P(78 x 72) = 1 (2*0.1179) = 0.7642
N = 382
j) Menos de 20
P(X 20) = TIENDE A CERO
Z= 20-75/10 = -5.5
k)P(X 20) = TIENDE A UNO
EJEMPLO:
En una fabrica de arandelas se ha encontrado que su espesor se distribuye
normalmente con una media de 2.2 mm y una desviacin estndar de 0.15mm. Qu
porcentaje de arandelas ser rechazado si no se aceptan espesores:
a) mayores a 2.5mm
b) mayores a 2.5mm pero ni menores a 2.15mm
c) que porcentaje ser aceptado si se rechazan espesores mayores a 2.3mm
El alumno usar la tabla normal y elaborar la grfica :
58
RESPUESTA:
a) z = 2.5 2.2/0.15 = 2
% rechazado = 0.0228
b) P(2.5 x 2.15)
Z1 = 2.5 2.2/0.15 = 2
Z2 = 2.15 2.2/0.15 = -0.333
% rechazado = 0.3935
c) P(x 2.3)
Z = 2.3 2.2/0.15 = 0.677
% aceptado = 0.5 + 0.2486 = 0.7486
cambio la variable aleatoria a aceptacin de las arandelas.
para p 0.5
para p > 0.5
59
a) P(150 x 180)
= np = 1000*1/6 = 167
= npq = 11.8
z1 = 150 167/11.8 = -1.44
z2 = 180 167/11.8 = 1.10
P(150 x 180) = 0.4251 + 0.3643 = 0.7894
b) P(x 175)
Z = 175 167/11.8 = 0.68
P(x 175) = 0.5 0.2517 = 0.2483
c) P(x 120) tiende a 0%
Z = 120 167/11.8 = -3.98
Los valores mayores a z=3 cubren un rea acumulada de .4999 por lo que se podr
aceptar tendencias al 0% o al 100%, segn la prueba solicitada.
60
61
62
63
64
65
66
29
- 59
- 99
- 199
- 499
- 999
- 1999
- 3999
- 7999
- 14999
- 34999
- 69999
- 149999
- 299999
- 499999
en adelante
Nmero aproximado de
Clases que se deben
utilizar
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Ejemplo:
Dados los siguientes datos sobre precipitaciones pluviales media anual en el
D.F. y segn el observatorio metereolgico de Tacubaya efectu el tratamiento
estadstico de los datos, de modo que se aproxime lo ms posible a una Distribucin
Normal y que permita calcular sus parmetros representativos y as poder efectuar
inferencias y tomar decisiones.
Toma de datos:
Ao
1890
1891
1892
1893
1894
1895
1896
1897
1898
1899
1900
1901
1902
1903
1904
1905
1906
1907
1908
1909
precip. mm.
711
726
538
659
473
650
566
721
674
667
670
583
555
617
860
513
654
738
591
504
Ao
precip. mm.
Ao
precip.
1910
451
1930
1911
561
1931
829
1912
646
1932
1913
706
1933
1914
810
1934
1915
397
1935
1916
580
1936
1917
552
1937
1918
702
1938
1919
750
1939
1920
725
1940
1921
692
1941
1922
802
1942
1923
639
1943
1924
714
1944
1925
958
1945
1926
856
1946
1927
744
1947
1928
784
1948
1929
734
1949
mm.
813
762
679
737
764
704
856
760
739
646
882
637
615
731
460
675
604
743
520
67
2) Ordenacin de datos.
958 882 860 856 856 829 813 810
764 762 760 750 744 743 739 738
731 726 725 721 714 711 706 704
679 675 674 670 667 659 654 650
639 637 617 615 604 591 583 580
552 538 520 513 504 473 464 460
3) Rango o Amplitud
A = Mayor - Menor = 958 397 = 561
4) n = 10 se dispersan y se propone n = 8
5) Intervalo de clase
802
737
702
646
566
451
784
734
692
646
555
397
c = 80
marca de
clase Mci
349.5-429.5
389.5
1.7
1.7
429.5-509.5
469.5
8.3
10.0
509.5-589.5
549.5
13.3
14
23.3
589.5-669.5
629.5
12
20.0
26
43.3
669.5-749.5
709.5
20
33.3
46
76.6
749.5-829.5
789.5
15.0
55
91.6
829.5-909.5
869.5
6.7
59
98.3
909.5-989.5
949.5
1.7
60
60
100
SUMAS
frecuencia frecuencia
frecuencia
de clase fi relativa %fi acum. Fi
% Fi
100.0
68
Histograma
Limites - vs - Frecuencia de clase fi
Frecuencia
de Clase
(fi)
25
20
15
10
5
0
429,5 509,5 589,5 669,5 749,5 829,5 909,5
69
Limite inferior vs - % Fi
100
% Fi
80
60
40
20
0
349.5 429.5 509.5 589.5 669.5 749.5 829.5 909.5
Limite Inferior
70
x = xi
n
71
cdi
Mci
Z = Mc cualquiera elegida de partida.
x
di = N de intervalos
dividido por fi
x = c fi * di
fi
despejando x
+ Z
CARACTERSTICAS DE LA MEDIA
Tiene su mayor aplicacin para comportamiento acampanados simtricos.
Es un valor calculado.
Todos los valores intervienen en su clculo.
Es muy afectada por valores extremos disparados.
La suma de las desviaciones con respecto a dicho valor 0.
(xi x) 0
La suma de los cuadrados de las desviaciones es un mnimo
(xi x)2 mnimo
LA MEDIANA:
72
La mediana (Md): es valor del termino colocado a la mitad de la serie cuando los
datos han sido ordenados de acuerdo a su magnitud, por lo que el 50% de los datos
ser mayor igual que la mediana y el 50% menor o igual que la mediana.
La posicin de la mediana (T), para datos nones se obtiene por la formula T = (n
+ 1)/2 pero cuando son muchos datos ser: T = n/2.
Ejemplo: 1, 2, 3, 4, 5 Md = 3
X = 15/5 = 3
1, 2, 2, 4, 5 Md = 2
X = 14/5 = 2.8
Fs
Fi
Li
T fi Fs Fi
T posicin
X c
T Fi
Fs Fi
T Fi
Fs Fi
Md Li c
CARACTERISTICAS DE LA MEDIANA
73
Mo = 2 Md = 2
fi = fs
fi
fs
Mo = Mci
fs > fi
fi
fs
Mo
74
fi > fs
fi
fs
Mo
DEMOSTRACION:
c
Mo = li + x
Mo
li
fi
fs
fi
c-x
fs
fi(x) = fs (c x)
x(fi + fs) = c fs
fs
fi
fs
x = c
fs
fi
fs
Mo = li + c
CARACTERISTICAS DE LA MODA
Se utiliza en lugar de la media cuando el comportamiento no es suficientemente
acampanado.
Es la medida ms tpica y descriptiva.
CONCLUSIONES: si la curva de frecuencias es normal (aproximada).
X Md Mo, pero si hay sesgo entonces:
Mo Md x
Sesgo o cola a la derecha
x Md Mo
sesgo o cola a la izquierda
75
PARMETROS DE DISPERSIN
76
77
S2 = fi (x Mci)2
fi
Empleando el mismo criterio que para la media aritmtica, se pude deducir en
forma matemtica una formula corta de la siguiente manera:
S c
fi ( di ) 2 fidi
fi
fi
k k
1-1/k2
x ks
x S
3/4
x 2S
8/9
x 3S
78
9 10 11
CV 10%
10
13
79
30%
porcentaje
acumulativo
0.00
3.75
16.25
33.75
65.00
86.25
97.50
100.00
80
99
98
95
90
80
70
60
50
40
30
20
10
5
2
1
81
Md
Mo
Fi26 fi12
Fs46 Mo
fs9
Mci
389.5
69.5
549.5
629.5
709.5
789.5
869.5
949.5
fi
1
5
8
12
20
9
4
1
60
%fi
Fi
1.7
1
8.3
6
13.3 14
20.0 26
33.3 46
15.0 55
6.7
59
1.7
100.0
%Fi
1.7
10.0
23.3
43.3
76.6
91.6
98.3
60
Mci(fi)
di
389.5
-4
2347.5
-3
4396.0
-2
7554.0
-1
14190.0
0
7105.5
1
3478.0
2
100.0 949.5
40410
Q
G
H
Des. Media
2
fi(Mci)
fi(logMci) fi(1/Mci) /X-Mci/fi
151710.25
2.591
0.0026
284
1102151.25
13.358
0.0106
1020
2415602.0
21.92
0.0146
992
4755243.0
33.59
0.0191
528
10067805.0
57.02
0.0282
720
5609792.25
26.08
0.0114
1044
3024121.0
11.76
0.0046
784
901550.25
2.98
0.0011
276
28027974.75 169.3
.0922
5648
-80-
fidi
-4
-15
-16
-12
0
9
8
3
-27
Desv.Std.
(X-Mci)2fi
80656
208080
123008
23232
25920
127104
153664
76176
811840
D.S.corta
fi(di)2
16
45
32
12
0
9
16
9
139
82
La media geomtrica:
Log.G = [ fi (log Mci)] / fi = 169.3 / 60 = 2.822
G = antilog. 2.822 = 663.74 mm.
La media armnica:
1/H = [fi ( 1 / Mci )] / fi = .0922 / 60 = 0.00154 H= 650.76 mm.
La desviacin media:
D.M. = fi X Mci / fi = 5648 / 60 = 94.13 mm.
La desviacin estandard:
S = [ fi (X Mci) ] / fi = 811840/60 = 116.32 mm.
2
83
X 1S
X 2S
X 3S
Para cada caso T. Schebysheff exige al menos 67%, 75% y 88.9% y lo cual de
ve cumplido la funcin ser de montculo y con tendencia normal.
Par la regla emprica se exige respectivamente el 68.26%, 95.44% y 99.74%
que tambin lo cumple nuestro anlisis y ser con tendencia normal.
CONCLUSIN:
El tratamiento de los datos da como resultado lo siguiente:
X = 673.5 mm de agua.
S = 116.32 mm de agua.
Tendencia normal.
Tendencia normal ya que:
. Polgono de frecuencias e histograma de forma acampanada.
. Ojiva de forma integral suavizada.
. Similitud de medias.
. C.V. pequeo.
. Cumple con T de Schebysheff y regla emprica.
. La grafica en papel normal tiende a una recta.
Cabe destacar que la aceptacin formal matemtica la dar el anlisis de variancia a
travs de la prueba chi cuadrada.
84
85
2) Ordenacin
11.4 18.0 27.0
12.2 19.4 27.4
12.6 20.2 28.0
12.6 20.4 28.2
12.6 22.2 28.4
14.0 22.6 28.8
15.8 23.0 29.2
16.2 23.6 29.8
16.2 24.2 30.0
18.0 24.8 30.2
1) Toma de Datos
44.0
36.2
15.8
29.2
35.2
12.6
30.0
56.2
45.6
42.2
35.4
38.4
28.8
40.6
56.4
27.0
45.8
24.8
37.4
42.0
Rango o amplitud
A = mayo menor = 125.4 11.4
Intervalo de Clase
C = A / N = 114 / 10 = 11.4
Limites
INF
SUP
0.5
13.5
13.5
26.5 Li
26.5
39.5Ls
39.5
52.5
52.5
65.5
65.5
78.5
78.5
91.5
91.5
104.5
104.5
117.5
117.5 130.5
20.4
14.0
11.4
47.0
37.0
23.6
90.4
40.8
64.6
37.6
56.4
39.4
39.8
32.4
49.4
37.6
43.0
33.6
22.2
41.4
A = 114
20
30.4
31.0
38.0
32.4
33.6
35.2
35.4
35.4
36.2
37.0
37.0
37.4
37.6
37.6
37.8
38.0
38.4
38.4
39.0
39.0
39.2
39.4
39.4
39.4
39.4
39.8
40.0
40.4
40.6
40.8
41.0
41.0
41.4
42.0
42.0
42.2
42.6
43.0
43.2
44.0
44.0
44.0
45.0
45.6
45.8
46.0
47.0
47.8
49.2
49.4
49.6
50.6
52.4
52.6
53.6
56.2
56.4
56.4
60.0
64.6
74.0
86.4
89.6
90.2
90.4
100.0
103.4
108.2
123.8
125.4
con n = 10
Mci
fi
% fi
% Fi
Fi
Mcfi
7
20
33
46
59
72
85
98
111
124
5
15
35
28
7
1
4
2
1
2
0.05
0.15
0.35
0.28
0.07
0.01
0.04
0.02
0.01
0.02
0.05
0.2
0.55
0.83
0.9
0.91
0.95
0.97
0.98
1
5
20
55
83
90
91
95
97
98
100
35
-3
300
-2
1155 -1
1288 0
413
1
72
2
340
3
196
4
111
5
248
6
-15
-30
-35
0
7
2
12
8
5
12
4158
-34
100
43.2
39.4
30.2
39.2
28.2
37.8
29.8
39.4
60.0
40.4
di
fidi
Md
Mc
Fi
Fs
fi
MO
fs
fi X media mci
fi X media mci
fiMci2
filogMci
fi 1/Mci
Fidi2
245
6000
38115
59248
24367
5184
28900
19208
12321
30752
4.2254902
19.51544993
53.1479879
46.55721929
12.39596408
1.857332496
7.71767503
3.982452151
2.045322979
4.18684337
0.714285714
0.75
1.060606061
0.608695652
0.118644068
0.013888889
0.047058824
0.020408163
0.009009009
0.016129032
172.9
323.7
300.3
123.76
121.94
30.42
173.68
112.84
69.42
164.84
5978.882
6985.446
2576.574
547.0192
2124.1948
925.3764
7541.1856
6366.4328
4816.1364
13586.1128
45
60
35
0
7
4
36
32
25
72
224340
155.6317381
3.358725412
1593.8
51450.36
316
86
87
X Media = fiMci / fi
X Media = 4158 / 100
X Media = 41.58
T = fi / 2
T = 50
Mo = li + c (fs / fi + fs)
Mo = 26.5 + 13 ((28)/ (15+28))
Mo = 34.96
Q=
fiMci
fi
224340 2
47.3645437
100
X MediaDeLaMedia ( X Media + Md + Mo + Q + G + H ) / 6
X MediaDeLaMedia 37.48
Rango de A = 125.4 -11.4 = 114
D.M. = fi X Media Mci fi
D.M. = 1593.8 / 100
D.M. = 15.938
S=
fi X media Mci
S=
c fidi
fi
fi
22.6862718
22.6862718
88
= 54.55188023
T.S.
K
1
2
3
X media S
% (1-1k2)
0 ~ 66%
3/4 ~ 75%
8/9 ~ 88%
Regla Emprica
X media S
68.26 %
X media 2 S
95.54 %
X media 3S
100 %
A 18.9
78
datos
78 * 100
78 %
X media 2 S
41.58 22.68
41.58 45.38
A -3.78
93
datos
93 * 100
93 %
X media 3S
41.58 68.07
A -26.5
98
datos
98 * 100
98 %
fi
40
35
30
25
20
15
10
5
0
0
Lim
10 20 30 40 50 60 70 80 90 100 110 120130 140
89
Ojiva
% Fi
0,8
0,6
0,4
0,2
0
0
Lim Sup
2
0
90
4
0
6
0
8
0
91
REGRESIN Y CORRELACIN
(Anlisis bivariable y multivariable)
1
0
0
1
2
0
1
4
0
92
Resorte
93
DIAGRAMA DE DISPERSIN
Una incgnita importante que debe despejarse en el anlisis de regresin es la
forma general de la expresin matemtica que se piensa puede explicar el
comportamiento del fenmeno en base a los indicativos seleccionados; La forma puede
deducirse del conocimiento del propio fenmeno, o por consideraciones grficas al
representar en una grfica el conjunto de puntos mustrales.
Si no se tiene un conocimiento slido del fenmeno en estudio que permita
conocer a priori la forma de la expresin matemtica buscada, un procedimiento
grfico puede resolver el problema. En efecto, dibujando los valores observados de la
variable independiente X con sus correspondientes valores observados de la variable
dependiente Y en un sistema de coordenadas rectangulares, se obtiene un conjunto de
puntos conocidos como diagrama de dispersin.
En caso de que el diagrama de dispersin muestre una tendencia de los puntos a
aproximarse a una lnea recta, como en el caso a) de la figura 2, se dice que existe una
relacin lineal entre las variables. En el caso b) de la figura 2, aunque se aprecia la
existencia de una relacin entre las variables, sta no es lineal y as se llama, relacin
no lineal.
En la figura 3 aparece el diagrama de dispersin de los puntos mustrales de la
tabla 1. En ella se aprecia la tendencia de los puntos a aproximarse o ajustarse a una
lnea recta.
y
.
.
. .
.
..........
..
a) Relacin lineal
............
x
x
b) Relacin no lineal
.........
...........
x
c) No hay relacin
94
Y (fuerza, Kg)
Y = a0 + a1 x
40
30
( xi ,yi
( xi,yi )
desv. inexp.
20
desv. expl.
media
10
0
x (deformacin, cm)
CURVA DE REGRESIN
La curva de regresin es aquella a la cual tienden a aproximarse los puntos del
diagrama de dispersin. En particular, la curva de regresin es una recta de regresin
cuando la relacin funcional entre las dos variables es lineal. La ecuacin de la curva de
regresin se llama ecuacin de regresin.
En el anlisis de regresin es importante indicar explcitamente cul es la
variable independiente y cul la dependiente, expresando que la curva de regresin o
su ecuacin de regresin es de y sobre x cuando sirva para predecir valores de la
variable dependiente Y dados los valores de la variable independiente X.
Para obtener la ecuacin de regresin de un fenmeno en estudio, despus de
haber determinado la forma general de sta del diagrama de dispersin, considerando
que la curva de regresin tenga la curvatura adecuada para eliminar los errores
inherentes al procedimiento de medicin de valores y contenga la informacin
relevante al fenmeno mismo, deben determinarse los valores de los parmetros
desconocidos que afectan a los valores de los indicadores que inciden en el problema.
En el caso de la regresin lineal, que ser el nico que aqu se estudie, se tiene
una ecuacin de regresin de la forma:
Y = a 0 + a1 x
Con dos parmetros por determinarse, que son la ordenada (a 0) al origen de la
recta y su pendiente (a1). Existen diferentes mtodos para determinar estos
parmetros; El que aqu se estudiar es el de los mnimos cuadrados.
95
Y
y1
y2
y3
...
...
yn
en donde
d1 = y1 y1
y1 = a0 + a1 x1
96
x2
xy
y2
1
1
1
2
2
2
3
3
3
4
4
4
9.00
11.00
10.00
22.00
17.00
18.75
30.00
32.50
25.00
37.50
42.50
45.00
1
1
1
4
4
4
9
9
9
16
16
16
9.00
11.00
10.00
44.00
34.00
37.50
90.00
97.50
75.00
150.00
170.00
180.00
81.0000
121.0000
100.0000
484.0000
289.0000
351.5625
900.0000
1056.2500
625.0000
1406.2500
1806.2500
2025.0000
30
300.25
90
908.00
9245.3125
97
n = 12
a0 = (300.25)(90) (30)(908.00) = -217.50 = -1.21
(12)(90) (30)2
180
a1 = (12)(908.00) (30)(300.25) = 1888.50 = 10.49
(12)(90) (30)2
180
Luego la recta de regresin de Y sobre X es:
Y = -1.21 + 10.49 x
Para obtener la ecuacin de la regresin de X sobre Y se deben intercambiar X
y Y en las ecuaciones anteriores obtenindose:
a0 = (x)(y2) (y)(yx)
n y2 (y)2
a1 = n yx (y)(x)
n y2 (y)2
Sustituyendo en ellas los valores de las sumas ya calculadas, se tiene:
a0 = (30)(9245.3125) (300.25)(908.00) = 4732.3750 = 0.23
(12)(9245.3125) (300.25)2
20793.6875
a1 = (12)(908.00) (300.25)(30) = -1888.50 = 0.09
(12)(9245.3125) (300.25)2 20793.6875
y la recta de regresin de X sobre Y es:
x = 0.23 + 0.09y
Se deja al alumno elaborar la grfica correspondiente.
Despejando Y de esta ecuacin se obtiene y = -2.51 + 11.01x, lo que muestra que
las ecuaciones de regresin de Y sobre X y de X sobre Y no son iguales.
Si se grafican ambas ecuaciones se podr encontrar que no coinciden
exactamente pero se podr observar que son muy coincidentes, esto indica que las
rectas de ajuste tienen los pares de puntos muy semejantes a la lnea recta, en caso
de que fueran coincidentes entonces todos los pares de puntos estaran sobre la
recta. Se deja que el alumno lleve a cabo la anterior demostracin.
Si la variable independiente x representa al tiempo, a la recta de regresin se
le denomina de tendencia y se utiliza para estimar, predecir o pronosticar. Los datos
mustrales ordenados segn la variable tiempo se llaman series cronolgicas o de
tiempo.
98
COEFICIENTE DE CORRELACIN
Hasta este momento se ha aceptado el error estndar de la estimacin como un
buen indicador de qu tan bien se ajusta una recta de regresin al conjunto de puntos
mustrales que la producen. Sin embargo, este error estndar de la estimacin tiene
unidades, lo que dificulta decir en un momento dado si un error estndar es o no
pequeo.
A fin de poder hacer comparaciones entre los errores estndar de la
estimacin de diferentes problemas, convendra que estos errores fueran
adimensionales y variaran dentro de un rango nico. Para obtener este indicador que
se llamar coeficiente de determinacin y se expresa por r 2 y corresponde al cociente
de la desviacin explicada de los datos entre la desviacin total de los datos, es decir:
r2 = [ ( y - Y )2] / [ ( y Y )2 ]
La raz cuadrada de r2 da el coeficiente de correlacin.
Donde y corresponde a los pares de puntos, y se refiere al valor estimado en la
ecuacin de ajuste y y se refiere al promedio de los valores de las y.
A continuacin se establece otra forma de la expresin que proporciona
directamente el signo del coeficiente de correlacin lineal.
Despus de sustituir las ecuaciones en otras expresiones y sustituyendo a 0 y a1
por sus valores dados en las expresiones, finalmente la ecuacin a utilizar seria:
n xy (x)(y)
r=
[nx2 (x)2][ny2 (y)2]
Si aplicamos para el problema del resorte se tendr:
r=
99
X Y
1 9
1 11
1 10
2 22
2 17
2 18.75
3 30
3 32.5
3 25
4 37.5
4 42.5
4 45
YC
9.28
9.28
9.28
19.77
19.77
19.77
30.26
30.26
30.26
40.75
40.75
40.75
( YC - Y )2
247.7
247.7
247.7
27.6
27.6
27.6
27.5
27.5
27.5
247.4
247.4
247.4
1650.6
( Y - Y )2
256.6
196.6
225.6
9.12
64.3
39.3
24.8
56
0.0004
155.8
305.6
399.2
1732.9
Para x = 1
Y = -1.21 + 10.49 x = -1.21 + 10.49 (1) = 9.28 as para todo valor de x
Ecuacin de regresin yc = -1.21 + 10.49x
Y = 300.25 / 12 = 25.02
100
EJEMPLO:
De diferentes observaciones acerca del consumo de combustible en vehculos
circulando en terreno plano y a diferentes velocidades se obtuvieron los siguientes
valores promedio.
Efectu un anlisis de regresin y correlacin, mediante un ajuste del tipo polinomial,
para los siguientes puntos mustrales:
x velocidad
M / hr.
20
25
30
y
Gal. / milla
4,04
4
4,18
35
40
45
50
55
60
4,35
4,2
4,75
5,2
5,52
6,15
6,5
6
5,5
5
4,5
4
3,5
3
0
20
40
60
x
20
25
30
35
40
45
50
55
60
360
y
4,04
4
4,18
4,35
4,2
4,75
5,2
5,52
6,15
42,4
x2
400
625
900
1225
1600
2025
2500
3025
3600
15900
x3
8000
15625
27000
42875
64000
91125
125000
166375
216000
756000
x4
160000
390625
810000
1500625
2560000
4100625
6250000
9150625
12960000
37882500
x*y
80,8
100
125,4
152,25
168
213,75
260
303,6
369
1772,8
x2y
1616
2500
3762
5328,75
6720
9618,75
13000
16698
22140
81383,5
80
101
x
20
25
30
35
40
45
50
55
60
360
y
4,04
4
4,18
4,35
4,2
4,75
5,2
5,52
6,15
42,4
Calculo de la correlacin:
y'
4,0682
4,0347
4,0842
4,2167
4,4322
4,7307
5,1122
5,5767
6,1242
42,380
(y'- Y )2
0,412
0,456
0,392
0,243
0,077
0,000
0,162
0,751
2,000
4,493
(y - Y )2
0,4489
0,5041
0,2809
0,1296
0,2601
0,0016
0,2401
0,6561
2,0736
4,595
y = y / n = 42.38 / 9 = 4.71
y2
16,322
16,000
17,472
18,923
17,640
22,563
27,040
30,470
37,823
204,252
(y-y)2
0,00080
0,00120
0,00918
0,01777
0,05392
0,00037
0,00771
0,00321
0,00067
0,095
102
Coeficiente de determinacin:
r2 = desv. Explicada / desv. Total = [ (y- y)2] / [ (y - y)2] =
r2 = 4.489 / 4.595 = 0.977
El coeficiente de correlacin ser:
r = 0.977 = 0.988 indica que las variables estn altamente correlacionadas
en un anlisis no lineal polinomial parablico.
Aplicando la frmula reducida se calculara el coeficiente de correlacin:
r = 1 - [S2y/x / S2y]
S2y/x = ( y yc )2 / ( n 3 ) = .0945 / ( 9 3 ) = 0.01575
S2y = n[ n y2 ( y )2] / [ n2 ( n-1 ) ] = 9[9(204.158)-(42.38)2] / 81(8) = 0.5744
r2 = 1 - [ 0.01575 / 0.5744 ] = 0.973
r = 0.973 = 0.987 alta correlacin.
Se deja al alumno que efecte un anlisis de regresin y correlacin lineal para
los datos anteriores, los compare con la curva de regresin obtenida y con el
coeficiente de correlacin no lineal y obtenga unas conclusiones de la comparacin
anterior.
Regresin y correlacin no lineal.
Para cierto tipo de datos es conveniente compararlos con diferentes tipos de
comportamientos grficos en diferentes clases de papel, con el fin de buscar la
simplicidad en los clculos y observar que si al ir variando el tipo de papel la relacin
entre variables tiende a ser del tipo lineal.
Se podr iniciar con un papel del tipo aritmtico vs aritmtico, se podr variar
a un papel aritmtico vs logartmico llamado tambin semilogaritmico se podr
trabajar con un papel logartmico logartmico vs logartmico. Se grafican los datos y
se observa si hay tendencia lineal y si as se convierten las ecuaciones dadas a formas
relacionadas con los logaritmos.
Por ejemplo un comportamiento de la forma:
Y = a bx
Se puede transformar a uno de la forma:
Log. Y = log a + x log b
Que es una funcin de la forma lineal:
Y = mx + b y = a0 + a1 x
Y = log. Y
b = log a
donde:
m = log b
103
b log x
Como las variables x-y estn afectadas por el logaritmo entonces se tendr una
variacin logartmica, el papel de grfica en ambos ejes ser logartmico.
Si en ambos casos se grafica y la tendencia es una recta, el ajuste se efectuara
empleando las formas de la lnea recta y el anlisis ser mas simple. Para el ajuste
final solo se deber de efectuar las transformaciones correspondientes.
Ejemplo:
En la siguiente tabla aparecen los beneficios netos de una compaa durante sus
primeros seis aos de operacin:
. Elabore la grfica de regresin y busque un ajuste semi-logartmico si la grfica del
tipo aritmtico presenta una tendencia del tipo no lineal.
. Determine la ecuacin de regresin.
. Determine el coeficiente de correlacin.
*Datos:
*Grfica aritmtica:
Aos
1
2
3
4
5
6
Beneficio
neto $
112
149
238
354
580
867
1000
800
600
400
200
0
1
104
100
10
1
0
Sumas
1
2
3
4
5
6
21
112
149
238
354
580
867
2.0492
2.1732
2.3766
2.5490
2.7634
2.9380
14.8494
1
4
9
16
25
36
91
2.0492
4.3464
7.1298
10.1960
13.8170
17.6280
55.1664
n = 6
105
Y = 69.18 (1.52) x
106
METODOS ALEATORIOS
Nmeros aleatorios.
Mtodo del residuo.
Mtodo del coeficiente.
Organizacin del trabajo: deber darse supervisin e instruccin al efectuar el
muestreo y si es posible darles un instructivo de procedimientos.
107
Anlisis de los resultados: una vez obtenidos los datos son necesario e
importante analizarlos para efectuar una estimulacin de la poblacin investigada.
MUESTREO Y RAZONES PARA EL MISMO
Muestreo es simplemente el proceso de aprender algo acerca de la poblacin
sobre la base de una muestra extrada. Al efectuarse un muestreo debern
contestarse la siguiente pregunta:
Cules son las razones para el muestreo?
Hoy casi todas las encuestas estadsticas, que se hacen para la toma de
decisiones en los negocios, la formulacin poltica, desarrollo de las teoras sociales,
son de muestreos. Adems pueden obtenerse resultados fidedignos de procedimientos
de muestreo correctos ya que las poblaciones pueden ser infinitas y en tales casos el
muestreo es el nico procedimiento prctico y posible. Este puede ser an el
procedimiento ms eficiente. Los resultados obtenidos por el estudio de la muestra
pueden ser iguales o ms precisos que los hallazgos de una cuenta completa de
conjunto.
BASE TEORICA DEL MUESTREO
En el muestreo encontramos un poderoso instrumento para predecir el
comportamiento de los fenmenos masivos. Esto es generalizar lgica y precisamente
acerca de miles de valores que no hemos visto, sencillamente por la confianza
proporcionada por ciertos valores. La poblacin tiene propiedades caractersticas,
variaciones limitadas en sus elementos que son reflejados en una muestra pequea y
tomada al azar. La poblacin y las partidas individuales de una poblacin tienden a
variar entre s, esto es que tienden a generar iguales valores arriba y debajo de cierto
valor central es por ello, tenemos diversidad y uniformidad de los datos. Los
promedios son ms estables que los valores individuales. A dems los promedios
resultan ms estables cuantas ms observaciones haya en la muestra. Como pueden
estar seguros entonces sobres el grado de confianza de nuestras conclusiones, la
respuesta sera ALEATORIEDAD. La medicin objetiva de los errores por muestreo
requiere que la muestra sea al azar.
COMO DEBERAN SER LAS MUESTRAS
Se deber comprender algunos trminos:
Marco de poblacin muestreada: identificar las unidades elementales que
deben ser definidas antes de poder observarlas, esto es si la poblacin es accesible,
en caso contrario cuando presenta dificultades se prepara cierta clase de lista con las
cuales identificar las unidades mustrales llamndosele a este marco de poblacin.
108
Muestras: las unidades que forman una poblacin se les llaman unidades de
muestreo que son de dos tipos; las unidades de muestreo elementales que son todas
las contenidas en la poblacin cuyas caractersticas han de ser medidas o contadas,
mientras que las unidades de muestreo primarias son las unidades elementales mismas
o los grupos de las unidades elementales. Una muestra es un conjunto de unidades de
muestreo primario del que pueden hacerse inferencia sobre la poblacin de esta se
espera que sea representativa en la poblacin original. En la teora del muestreo es
importante distinguir las muestras por juicio.
Errores estadsticos: Diferencia entre el valor de una estadstica y el del
parmetro correspondiente. El error de muestreo es el resultado de la muestra y del
censo cuando se obtienen ambos resultados usando los mismos procedimientos.
Eficiencia de los modelos de los muestreos: un modelo se dice que es suficiente
si los resultados deseados son obtenidos al costo ms bajo posible. Un modelo de
muestreo se dice que es ms eficiente que otro si el primero da la misma precisin a
costos ms bajos, o mayor precisin a los mismos costos.
METODO DE MUESTREO
El muestreo o sondeo es una tcnica para seleccionar de una poblacin,
unidades o grupos ms pequeos de este universo considerado, llamados muestra, que
tengan las mismas caractersticas del universo que representan. Los procedimientos
generales para la extraccin de muestras:
Definir el universo con el que se tratar de trabajar.
Elaborar una lista completa y precisa de las unidades y agrupaciones que componen
esta poblacin o universo.
Determinar el tamao de la muestra.
ELECCION DEL TAMAO DE LA MUESTRA
El diseo de un experimento es esencialmente un plan para comparar una
cantidad de informacin que, como cualquier otro producto, puede adquirirse a
distintos precios dependiendo de la forma que se obtienen los datos. Puesto que el
nico producto de la investigacin es la informacin, es deseable compararla a costo
mnimo.
EL MUESTREO ALEATORIO: que consiste en darle a todas las muestras
posibles de una poblacin la misma probabilidad de ser seleccionados, tiene dos
propsitos:
109
110
DISEO DE EXPERIMENTOS
El diseo de un experimento es esencialmente un proyecto para obtener una
cantidad de informacin que, como cualquier otro servicio, se puede adquirir a
diferentes precios que depende de la manera en que se obtuvieron los datos.
El proceso de muestreo o Diseo de Experimentos como se le llama
normalmente, afecta la cantidad de informacin por medicin. Esto conjunto con el
tamao n de la muestra, controla la cantidad total de informacin relevante a una
muestra.
Mendenhall, wackerly
CONCEPTOS BASICOS:
Experimento.- es un proceso por medio del cual se obtiene una observacin o
medicin. La experimentacin se usa para someter a prueba hiptesis y establecer
nuevas relaciones entre variables.
La experimentacin frecuentemente proporciona conclusiones errneas que
pueden ser resultado de los siguientes hechos:
Interpretacin defectuosa del experimento
Suposiciones originales inadecuadas
El experimento fue pobremente diseado o mal ejecutado.
El Diseo Experimental es el plan usado en un experimento. Implica la
asignacin de tratamientos a las unidades experimentales y un amplio entendimiento
de los anlisis por verificar, asegurando que los datos se obtendrn de modo tal que
111
112
113
Etapa Preliminar:
Si no es factible, requerir.
. modificar el presupuesto y/o
. distribucin de tiempo o
. suspender el proyecto.
Establecer l a
Necesidad de
realizar el
experimento.
Posible
modificacin al
alcance del
trabajo analtico.
Limitaciones financieras.
Revisar
cuidadosam
ente el
trabajo
previo en el
campo.
Posible modificacin de
nocin original de
necesidades.
Establecer la
factibilidad
en el tiempo
y con los
costos
previstos.
Etapa Intermedia:
Comenzar el trabajo
analtico preliminar para:
Determinar los
rangos de las
variables y las
exactitudes
necesarias.
Analizar la
incertidumbre de
los datos
Avanzar con el
Modificar el
acuerdo con las
limitaciones del
presupuesto.
trabajo analtico.
Comprar
instrumentos
Comparar los
datos
preliminares
con las
teoras
disponibles
114
C) Etapa Final:
Reunir la totalidad de los datos
Contrastar la teora
con el
experimento,
Correlacionar los
datos, Crear
nuevas teoras
para explicar los
datos, etc.
Correlacionar con la necesidad
original del experimento
115
CAPITULO IV.
LA INFERENCIA ESTADSTICA (I.E)
La I.E. es la parte de la estadstica que proporciona las reglas para inferir
caractersticas de una poblacin a partir de muestras extradas de ellas, junto con las
indicaciones probabilsticas de la veracidad de tales inferencias, en general se le denomina
inferencia estadstica.
La I.E estudia las relaciones que existen en una poblacin, las muestras extradas de
ella y las tcnicas para estimar parmetros.
Los parmetros dependen del objetivo del problema y se pueden referir a la MEDIA,
VARIANZA, DESVIACIN ESTANDAR, MEDIANA, MODA, a la POBLACION, etc. ya sea
en forma individual o en relacin a 2 poblaciones.
Los mtodos para hacer inferencias estadsticas pueden ser de 2 categoras:
La 1era consiste en tomar decisiones respecto al valor del parmetro.
La 2da se basa en predecir el valor del parmetro.
Una presentacin del objetivo y de los tipos de inferencia queda incompleta si no
tenemos una referencia respecto a la bondad de los mtodos de inferencia.
La I.E tiene como base la teora del muestreo, donde el diseo de experimentos trata
los temas de los mtodos de muestreo donde se pretende reducir las variaciones
experimentales que sea representativo y que tenga un mnimo costo.
Para asegurar que los parmetros asociados a la muestra se siguen manteniendo como
representativos en el tiempo, estos deberan de realizarse continuamente por medio del
estudio de muestras representativas.
LAS TCNICAS DE MUESTREO.
Bsicamente un muestreo se basa en un muestreo aleatorio o en un semialeatorio. En el
primero todas las muestras tendrn la misma probabilidad de ser elegidas en donde el sesgo es
eliminado, en el semialeatorio se permite cierto tipo de sesgo.
1. EL MUESTREO ALEATORIO SIMPLE.
Consiste en tomar muestras de tamao n de entre una poblacin N, de manera que todas
tengan la misma probabilidad de ser elegidas, se emplean tcnicas como la de los nmeros
aleatorios.
116
2. EL MUESTREO ALEATORIO PROPORCIONAL.
En forma continua se presentan fenmenos con tendencia binomial y que la tcnica de
muestreo se busca estimar el porcentaje de unidades que tengan esas caractersticas
obteniendo un muestreo proporcional.
3. MUETREO ALEATORIO ESTRATIFICADO.
Cuando los elementos se pueden agrupar en estratos de acuerdo a ciertas
caractersticas de cada estrato, se podr llevar acabo un muestreo aleatorio simple de tamao
proporcional al estrato, donde la muestra representativa ser la total que se obtuvo del
muestreo estratificado.
Estrato
Tamao del
Estrato
1
2
3
4
5
6
N (poblacin)
N1
N2
N3
N4
N5
N6
Tamao de la
muestra
n1
n2
n3
n4
n5
n6
n (tamao de muestra)
117
EJEMPLO # 1
Obtenga el nmero de muestras para las siguientes condiciones.
a)
b)
n=2
n=3
y
y
N = 12
N = 100
SOLUCIN:
a) Numero de muestras = N C n
Numero de muestras = 12C 2 =
Probabilidad =
12!
2! 10!
= 11*12
2
= 66
1 .
NCn
1
66
= 1.5 %
b) Numero de muestras = N C n
Numero de muestras = 100 C 3
= 100!
3!97!
= 161,700
Probabilidad =
1 .
NCn
1
.
161,700
= 0.0006%
118
El clculo del tamao muestral proporcional se define por la siguiente expresin:
ni = Ni (n)
N
Para i = 1, 2,3..k.
EJEMPLO # 2.
Se debe de obtener una muestra de tamao 60 de una poblacin finita de 4000 y la cual cuenta
de 3 estratos de tamao N1 = 2000 N2 = 1200 N3 = 800. Qu tan grandes deben de ser las
muestras de cada estrato?
SOLUCIN:
n = 60
N = 4000
N1= 2000
N2= 1200
N3= 800
n1 = ?
n2 = ?
n3 = ?
(60) = 18
n3 = N3 (n) = 800
N
4000
(60) = 12
119
La proporcionalidad se definir de la siguiente forma:
n1
N1 1
n2
N 2 2
nk
Nk k
n * N1 1
N11 + N22 +.NKK
N1 + N2 +. NK = N (Poblacin)
n Muestra.
EJEMPLO # 3.
Se debe de tomar una muestra de tamao 84 de una poblacin de 10.000, agrupadas en 3
estratos de tamao 5.000, 2.000, y 3.000 y con desviaciones respectivas de 15, 18, y 5.
Qu tan grandes deben de ser las muestras que se deben de obtener para lograr un muestreo
ptimo?
SOLUCIN:
n = 84
N =10.000
N1 = 5.000
N2 = 2.000
N3 = 3.000
1 = 15
2 = 18
3 = 5
n1 =
84 (5.000) (15)
(5.000)(15)+ (2.000) (18)+ (3.000) (5)
n1 =
n1 =
6300000
75000 + 36000 + 150000
6300000
126000
n1 = 50
n2 =
84 (2.000) (18)
(5.000)(15)+ (2.000) (18)+ (3.000) (5)
120
n2 =
n2 =
3024000
75000 + 36000 + 150000
3024000
126000
n2 = 24
n3 =
84 (3.000) (5)
(5,000)(15)+ (2,000) (18)+ (3,000) (5)
n3 =
1260000
75000 + 36000 + 150000
n1 =
1260000
126000
n3 = 10
SIN CONSIDERAR
ni = Ni (n)
N
n1 = N1 (n) = 5,000 (84) = 42
N
10,000
n2 = N2 (n) = 2,000 (84) = 17
N
10,000
n3 = N3 (n) = 3,000 (84) = 25
N
10,000
DISTRIBUCIONES MUESTRALES.
Si consideramos todas las muestras posibles de tamao n que se pueden extraer de una
poblacin de tamao N y para cada una de ellas se calcula el promedio aritmtico, seguramente
este variara de muestra a muestra.
Por lo tanto el promedio es una variable aleatoria como lo pueden ser el rango, la variancia, la
desviacin estndarS, la mediana, el modo, etc.
A todo elemento que es funcin de los valores de los datos de una muestra se denomina
estadstico, entonces todo estadstico tiene una distribucin de probabilidad que se le
denomina distribucin muestral.
121
Si extraemos sin reemplazo todas las muestras posibles de tamao n de una poblacin
de tamao N, se podr demostrar empricamente que los parmetros de la distribucin
muestral del promedio aritmtico se podr representar por
y que los parmetros
poblacionales sern y , definindose las siguientes expresiones para su calculo.
X =
EJEMPLO # 4.
Una poblacin finita esta formada por los nmeros 1, 2, 3, 4, 5 determine los
parmetros de la distribucin muestral del promedio, considerando las muestras de tamao 3
obtenidas sin reemplazo.
Determine los parmetros en funcin de todas las muestras y compare con las formulas
directas.
122
SOLUCION:
n=3
N =5
De muestras = N C n =
N! =
n! (N-n)!
5! = 10
3! 2!
MUESTRAS
1
1
1
2
2
3
3
4
4
5
2
2
2
3
3
4
4
5
5
1
3
4
5
4
5
5
1
1
2
3
2
7/3
8/3
3
10/3
4
8/3
10/3
11/3
3
(2 - 3) 2 = 1
(7/3 3) 2 = 4 / 9
(8/3 3) 2 = 1 / 9
(3 3) 2 = 0
(10/3 3) 2 = 1 / 9
(4 3) 2 = 1
(8/3 3) 2 = 1 / 9
(10/3 3) 2 = 1 / 9
(11/3 3) 2 = 4 / 9
(3 3) 2 = 0
= 30
= 30 / 9
= 30
10
x
=
de datos
1+2+3+4+5
5
= 3
= 3
123
EJEMPLO # 5.
En una bodega se tienen 5,000 varillas, el peso promedio de cada varilla es de 5.02 Kg. con la
desviacin estndar de 0.3kg.
Encuentre la probabilidad de que en una muestra de tamao de 100 varillas se tenga un peso
total.
a) entre 496 y 500 Kg.
b) de ms de 510 Kg.
124
SOLUCION:
Np = 5,000 = 5.02kg = 0.3 Kg.
n = 100
Como n = 100 > 30 (Muestra grande) Distribucin muestral del
Promedio aritmtico (Normal)
125
GRAFICA:
= 0.4778 0.2486
= 0.2292.
22.92% de probabilidad de que el peso total este entre 496 y 500kg en la muestra.
b).- De ms de 510kg
Peso por cada varilla
GRAFICA.
126
P = (0.5 0.4963
P = 0.0037.
EJEMPLO # 6.
Considere una poblacin x que tiene 3 muestras posibles y cuyos promedios son 3, 7,8.
Una poblacin y formada por 2 muestras posibles de promedio 2 y 4. Obtenga los
parmetros de la distribucin muestral de la diferencia de los promedios.
SOLUCION:
X 3 Muestras
3, 7, 8.
127
Y 2 Muestras
2, 4.
1ER PROCEDIMIENTO.
En funcin de todas las muestras
3
3
7
7
8
8
2
4
2
4
2
4
=
=
=
=
=
=
1
-1
5
3
6
4
2DO PROCEDIMIENTO.
Se acepta que
128
En funcin de todo
= (2 3)2 + (4 3)2 = 2 = 1
2
2
129
A).- Por medio de la teora de la estimacin, ya sea puntual o por intervalo de confianza.
B).- Por medio de las pruebas de hiptesis.
TEORIA DE LA ESTIMACIN
Es la inferencia estadstica que consiste en estimar los valores de los parmetros de la
poblacin a partir de estadsticos de la muestra. Un estimador es una regla que nos dice como
calcular la estimacin basada en la informacin contenida en la muestra y expresada mediante
una formula.
ESTIMADORES PUNTUALES.
Se denomina as ya que se estima el parmetro de la poblacin basado en un solo valor
de una estadstica.
Cuando la media de la distribucin muestral de un estadstico es igual al parmetro que
se esta estimando de la poblacin, el estadstico ser un estimador insesgado del parmetro,
en caso contrario ser sesgado.
Si el estadstico de la muestra tiende a ser igual al parmetro de la poblacin a medida
que aumenta el parmetro de la muestra, se tendr un estimador consistente del parmetro
por ejemplo: El promedio es un estimador insesgado y consistente de la media, en cambio la
variancia es un estimador sesgado y consistente de la variancia poblacional.
Si la distribucin muestral de varios estadsticos tienen el mismo valor que la media, el
estadstico con menor variancia es un estimador eficiente de dicha media, caso contrario ser
ineficiente.
Por ejemplo el promedio es un estimador eficiente de la media de poblacin, pero la
mediana es un estimador ineficiente de dicho parmetro, ya que las distribuciones muestrales
del promedio y la mediana cuentan con medias iguales, sin embargo la varianza en su
distribucin muestral es mayor en la mediana que en el promedio.
ESTIMACION PUNTUAL DE LA MEDIA DE UNA POBLACIN.
En la prctica la estimacin nos puede conducir a estimar la media de una poblacin,
por lo que la estimacin de es una aplicacin prctica de la inferencia estadstica. Hemos
aceptado que el valor esperado del promedio aritmtico es igual a la media de la poblacin con
un error estndar.
130
S = 21 toneladas
Estimar =?
La estimacin puntual sera:
Estimando Np
131
Se acepta la estimacin.
En el rango
871 5.94
865 a 877
ESTIMACIN POR INTERVALOS DE CONFIANZA PARA LOS PARAMETROS DE
UNA POBLACIN.
La estimacin de un parmetro de una poblacin mediante un par de nmeros entre los
cuales se encuentra, con una cierta probabilidad, al valor de dicho parmetro se le llama
estimacin del intervalo del mismo.
Si S es un estadstico obtenido de una muestra de tamao n para estimar el valor del
parmetro donde S es la desviacin estndar, conocida o estimada, de su distribucin
muestral, la probabilidad 1 de que el valor de se encuentre en el intervalo de S Z C S a S
+ ZC S donde:
ZC = a una constante la cual se podr escribir de la siguiente manera.
P [S ZC S S + ZC S] = 1-
Si se fija el valor de 1 se podr obtener el valor de Z C necesario para satisfacer
dicha ecuacin, con lo cual se podr definir el intervalo de confianza del parmetro a un nivel
de confianza de 1 .
La constante ZC que fija el intervalo de confianza se le conoce como valor critico y si el
comportamiento del estadstico S es normal debido a que se maneja una muestra de tamao
grande mayor que 30, entonces ZC se deduce de las tablas de la curva normal en una prueba de
2 colas ya que se trata de un intervalo de confianza.
Valor de Zc para diferentes 1 .
GRAFICA.
132
TABLA.
1 .
99.73
99
98
96
95.45
95
90
80
68.27
50
ZC
3.0
2.58
2.33
2.05
2
1.96
1.64
1.28
1
0.674
Si
tiene distribucin normal los valores de Z C se obtendrs de la tabla anterior
para diferentes niveles de confianza.
Por ejemplo
1 = 0.95
1 = 0.99
133
Poblacin Finita
EJEMPLO # 8.
Las mediciones de los dimetros de una muestra aleatoria de 100 tubos de albaal
mostraron una media de 32 cm. con desviacin estndar de 2 cm. obtenga los intervalos de
confianza del 95 y 97 % para dimetros medios de todos los tubos producidos.
SOLUCION:
N = 100 > 30 normal.
S = 2 cm.
a).- (1 ) = 0.95
=?
No conocemos Np
Se estima Np
Trabajando con la formula infinita
1 = 0.95
1 - = 0.95 ZC = 1.96
Desconocemos , se estima
= S =2
32 1.96 (2/100) 32 + 1.96 (2 / 100)
134
31.608 32.408
Intervalo de confianza a un nivel del 95%
b).- (1 ) = 0.97
Para el 97% hay que ir a la tabla (se deja a el alumno que lo realice).
EJEMPLO # 9.
En una muestra aleatoria de 50 calificaciones de un examen de admisin se obtuvo un promedio
aritmtico de 72 puntos con desviacin de 10 puntos. Si el examen se aplico a 1018 personas
determine:
A).- El intervalo de confianza del 95% para la media del total de calificaciones.
B).-El tamao de la muestra n necesario para que el error de la estimacin de la media
poblacional no exceda de 2 puntos a un nivel de confianza del 95%.
C).- El nivel de confianza 1 para el cual la media de la poblacin se encuentren en 721
puntos, con una muestra de n =50
SOLUCION:
n = 50 > 30 normal de su distribucin muestral.
S = 10
Np = 1018 Poblacin finita
135
ZC = 1.96 Para [(1 - ) = 0.95]
= 69.3 74.7
72 1
136
72 1.379 ZC
1.379 ZC = 1
ZC =
1
= 0.72
1.379
GRAFICA.
(1 ) = 2 (0.2642)
(1 ) = 0.5284
Por lo tanto habr una confianza del 52.84%
137
1 > 2, 1 2 o 1 2
Al realizar una prueba de hiptesis, se prueba siempre la verdad de la hiptesis nula
H0, aun cuando de antemano se desee rechazarla.
ERRORES DE LOS TIPOS I y II. NIVEL DE SIGNIFICANCIA.
En muchas ocasiones se presenta el caso de que se rechaza una hiptesis nula cuando
en realidad debera ser aceptada; cuando esto sucede se dice que se ha cometido un error de
tipo I.
En otras ocasiones se acepta una hiptesis nula siendo en realidad falsa; en este caso se dice
que se ha cometido un error de tipo II.
Al probar una hiptesis nula, a la mxima probabilidad con la que se est dispuesto a
cometer un error del tipo I se le llama nivel de significancia, , de la prueba, el cual dentro de
la prctica se acostumbra establecer de 5 por ciento (0.05) o 10 por ciento (0.1). El
complemento del nivel de significancia, 1- , se conoce como nivel de confianza.
Si, por ejemplo, al realizar una prueba de hiptesis se escoge un nivel de significancia
de 10 por ciento, significa que existen 10 posibilidades en 100 de que se rechace sta cuando
debera ser aceptada; es decir, que se rechaza a un nivel de significancia del 10 por ciento, y
que la probabilidad de que la decisin haya sido errnea es de 0.1.
COMPORTAMIENTO DE LOS ERRORES TIPO I Y II.
Supngase que se trata de probar la hiptesis nula de que la media, S, de la
distribucin muestral de la estadstica S es 1, en contra de la hiptesis alternativa que
establece que S = 2, donde 2>1, es decir
H0 : S = 1
H1 : S = 2
En la figura 13.1 se muestra en forma grafica la relacin entre los errores tipo I y II
en el caso en el que la regla de decisin para aceptar o rechazar H 0 es la siguiente:
Si el valor de la estadstica S obtenido de una muestra excede de cierto valor critico
S1, rechcese H0; en caso contrario acptese.
Es evidente que si H0 es verdadera, entonces (rea con rayado doble) es la
probabilidad de que S > S1, o sea la de rechazar a H0 siendo verdadera (error tipo I). Por otro
lado, si H1 es verdadera, entonces (rea con rayado sencillo) es la probabilidad de que S < S 1,
o sea la de aceptar H0 siendo falsa (error tipo II).
Obsrvese que si se aumenta el valor de S1 se reduce la probabilidad , pero se
incrementa la ; lo contrario sucede si se disminuye el valor de S 1.
138
139
Figura 13.2
140
-2.58 < Z < 2.58
Empleando la tabla de rea bajo la curva normal estndar. Pero si el valor
estandarizado de la estadstica se encuentra fuera de dicho intervalo, se concluye que el
evento puede ocurrir con probabilidad de 0.01 si la hiptesis H 0 es verdadera (rea rayada
total de la figura 14.1). En tal caso, el valor Z de la variable estndar difiere
significativamente del que se podra esperar de acuerdo con la hiptesis nula, lo cual inclina a
rechazarla a un nivel de confianza del 99 por ciento.
De lo anterior se deduce que el rea total rayada de la figura 14.1 es el nivel de
significancia de la prueba, y representa la probabilidad de cometer un error del tipo I. Por
ello, la regin de aceptacin de H0 es -2.58 < Z < 2.58, y la de rechazo es Z > 2.58 Y Z < -2.58.
141
0.05
0.01
0.005
-1.645 o 1.645
-2.326 o 2.326
-2.575 o 2.575
-1.960 y 1.960
-2.575 y 2.575
-2.810 y 2.810
142
Para el caso de muestreo sin reemplazo de poblacin finita, se tiene
que
en donde N P es el tamao de la
EJEMPLO:
Se sabe que el promedio de calificaciones de una muestra aleatoria de tamao 100 de
los estudiantes de tercer ao de ingeniera civil es de 7.6, con desviacin estndar de 0.2.
Si denota la media de la poblacin de esas calificaciones, X, Y si se supone que
tiene
distribucin normal, probar la hiptesis = 7.65 en contra de la hiptesis alternativa 7.65,
usando un nivel de significancia de
a. 0.05
b. 0.01
Para la solucin se deben considerar las hiptesis
H0 : = 7.65
H1 : 7.65
Puesto que 7.65 incluye valores menores y mayores de 7.65, se trata de una prueba
de dos colas.
La estadstica bajo consideracin es el promedio aritmtico, , de la muestra, que se supone
extrada de una poblacin infinita. La distribucin muestral de
tiene media
,y
desviacin estndar
,
143
en donde y denotan, respectivamente, la media y la desviacin estndar de la poblacin de
calificaciones.
Bajo la hiptesis H0 (considerndola verdadera), se tiene que
= 7.65 =
EJEMPLO:
La resistencia media a la ruptura de cables de acero fabricados por la empresa x es de
905 Kg. Una empresa consultora sugiere a x que cambie su proceso de manufactura, con lo cual
incrementar la resistencia de sus cables. Se prueba el nuevo proceso, y se extrae una muestra
aleatoria de 50 cables, obtenindose para ellos una resistencia promedio de 926 kg, con
desviacin estndar igual a 42 kg. Se puede considerar que el nuevo proceso realmente
incrementa la resistencia, con un nivel de confianza del 99%?
En este caso, se debe plantear una prueba de hiptesis de una cola, para la cual
H0 : = 905 Kg.
H1 : > 905 Kg.
144
Puesto que el tamao de la muestra es suficientemente grande, se puede aproximar la
distribucin muestral de la resistencia promedio mediante una normal, y estimar el valor de
de la poblacin mediante SX de la muestra.
Considerando a la poblacin infinita, y suponiendo como verdadera a H 0, se tiene que
145
puesto que se trata de una prueba de dos colas a un nivel de significancia del 0.05, la
diferencia es significativa si el valor de z se encuentra fuera del intervalo de -1.96 a
1.96. Como este es el caso, puede concluirse que efectivamente existe diferencia
significativa en ganancia en voltaje de los transistores.
b. Si la prueba es a un nivel de significancia del 0.01, la diferencia es significativa si z se
encuentra fuera del rango de -2.58 a 2.58, partiendo del hecho de que z = 2, la
diferencia entre las ganancias es producto del azar, y se acepta la hiptesis de que
ambos tipos de transistores tienen igual ganancia media en voltaje a un nivel de
confianza del 99%.
Ejemplo.
La estatura promedio de 50 estudiantes varones tomados al azar que participan en
actividades deportivas es de 173 cms, con desviacin estndar de 6.3 cms. Otra muestra
aleatoria de 50 estudiantes varones que no participan en este tipo de actividades tiene
promedio de estatura igual a 171 cms, con desviacin estndar igual a 7. cms. Para probar la
hiptesis de que los estudiantes varones que practican deportes son ms altos que los que no lo
hacen, a un nivel de significancia de 0.05.
Se debe decidir entre las hiptesis:
Ho : x
H1 : x
Siendo x la variable aleatoria asociada a
que practican deportes, y Y la asociada a la de
infinita.
= y
> y
la poblacin infinita de estaturas de alumnos
estudiantes que no lo hacen, que tambin es
146
x = (x / nx) + (Y / ny) = (6.3/50+7.1/50)
= 1.3424
z = (173 - 171) / 1.3424 = 1.489
Se trata de una prueba de una cola y puesto que Z < Zc se concluye que la diferencia
de estaturas se debe nicamente al azar.