Você está na página 1de 146

1

MANUAL PARA EL
CURSO DE LA
CLASE DE
PROBABILIDAD Y
ESTADSTICA.

ING. OSCAR MANUEL ROBLES SNCHEZ


UNIVERSIDAD AUTNOMA DE NUEVO LEN.
FACULTAD DE INGENIERIA. CIVIL.
CMO ESTUDIAR EL CURSO DE PROB. Y EST. Y ACREDITARLO
Los siguientes principios son tiles para tener xito en este curso y en otros cursos:
1.- Para aprovechar este curso al mximo es necesario que te comprometas contigo
mismo y con el curso. Es necesario que le inviertas tiempo, energa y esfuerzo creativo.
Debes pensar y actuar como un cientfico, ingeniero o maestro que se preparan para
ejercer en el mundo real.
2. Tu participacin en clase y las preguntas que hagas te ayudarn a entenderte a ti
mismo, a que el profesor pueda identificar reas donde necesitas ayuda y tus reas de
fortalezas. El uso de la razn al analizar las diversas situaciones permitir entender
mejor el material del curso. No se trata de aplicar una formula para obtener una
contestacin numrica. Es necesario cuestionarlo y justificarlo todo, inclusive a ti
mismo.
3. El curso se enseara en una forma constructivista, por lo cual debes de participar
activamente en la construccin, derivacin y explicacin concreta de los conceptos. Es
conveniente que recrees las construcciones hechas previamente en clase.
4. Se llevarn notas del curso y las cuales formarn parte de tu libreta del curso,
llevaras un avance diario del curso y lo entregaras en un disquete al final de los temas
de cada parcial, lo complementaras con aportaciones tuyas ya sean tericas o
ejercicios y problemas.
5. Al analizar el material, no debers de mirar y memorizar formulas, sino debers de
construirlas, explicarlas y aplicarlas. Ser de gran ayuda

reproducir el proceso

llevado a cabo en el saln de clases, prestando atencin al significado de los conceptos


y al por qu de las derivaciones.
6. Los problemas asignados slo se discuten en clase, se hacen en el saln cuando
existan preguntas especficas al respecto. Debes de resolver los problemas asignados y
no dejarlos para ltima hora, esto facilitar el entender y aplicar los conceptos. Los
exmenes y pruebas cortas anteriores pueden ser de gran ayuda para estudiar.
7. Lee los materiales, en especial los problemas en forma cuidadosa y cabal, pero
nunca en forma mecnica. No asumas que sabes lo que se pide en el problema,
interpreta lo que lees y asegrate que entiendes todo lo ledo. El mismo proceso debe
de ser seguido

cuando escribes. Asegrate de leer crticamente lo que escribes,

recuerda que escribes para que otra persona te entienda.


8. Debes de reproducir los ejemplos y problemas hechos y discutidos en clase y debes
de completar las asignaciones y preguntas especficas que se hacen en clase.
9.- Los textos son elementos complementarios al curso, no constituyen una gua para
el mismo. No se sigue el orden de ningn libro, sin embargo, debes de leer las secciones
apropiadas segn el tema, debes de resolver los ejercicios y sus problemas.
10. Usa las horas de estancia del profesor, plantea preguntas en el saln y despus de
clase, presenta tus puntos de vista sobre los asuntos del curso, usa el correo electrnico
para enviar tus preguntas y dudas en cualquier momento al profesor y a tus
compaeros de clase, usndolo en forma tica y profesional.
11.- Integra los conceptos aprendidos a otras reas de la carrera de ingeniera civil
integrada a tus experiencias que hayas tenido antes.
12. Debes de asegurarte de que:

No llegars tarde a clases

De que no faltars

Trabajaras todos los das


-

Redescubriendo el material en los textos

Haciendo ejercicios y problemas

Explorando en el Internet

Reproduciendo las notas, etc.

13. Formaras un grupo de estudio, ya sea presencial o virtual.


14. Trabaja en la computadora ya que es un instrumento valioso como estudiante y
luego en tu vida profesional. Conctate al Internet y obtn informacin valiosa.
15. SOBRE TODO, S ACTIVO, COMPROMETIDO Y DESPIERTO CON EL
CURSO DE PROBABILIDAD Y ESTADSTICA.

Programa de clase.
Asignatura: Probabilidad y estadstica.
Profesor: Ing. Oscar Manuel Robles Snchez.
Introduccin:
Actualmente el estudio de la Probabilidad y Estadstica esta dirigido tanto a los
campos especializados en la Investigacin, como a la Ingeniera, a los negocios, a la
Biologa, la Educacin, etc.
Para fines didcticos el curso se ha dividido en 4 unidades en las cuales el
estudiante conocer y aplicar los principales conceptos de la probabilidad y deber
de desarrollar una habilidad para aplicar un razonamiento lgico matemtico a la
interpretacin y solucin de los fenmenos aleatorios. En la siguiente unidad aplicar
todos sus conocimientos a la generacin y aplicacin de una serie de modelos
matemticos. En la tercera unidad comprender la necesidad de agrupar datos para
darles un tratamiento estadstico y representarlos por una serie de graficas y por sus
valores medios y de dispersin. Finalmente, entender y aplicar el objetivo
fundamental de la estadstica que es el de al Inferencia.
Las 4 unidades consideran el comprender el significado y las implicaciones de
las ideas bsicas, mas que el memorizar una lista de frmulas.
Este curso es importante en la formacin del Ingeniero Civil, ya que el quehacer de las
obras de Ingeniera, depende de las caractersticas de los datos y de cmo estos
acontecen, lo que te permitir disearlas de una manera funcional (caminos, presas,
viviendas, estructuras, agua potable, alcantarillado, etc.).
Este curso requiere de un conocimiento de las matemticas y computacin
bsicas, adems, hay que saber razonar las tcnicas donde el calculo matemtico es
solo un proceso mecnico.
Objetivo General del curso:
El alumno desarrollara una capacidad para reconocer los modelos matemticos
que describen los fenmenos aleatorios, a travs de reconocer a la Estadstica como la
ciencia que se relaciona con los datos y su tratamiento, y a la probabilidad como la

ciencia que aporta los elementos o modelos para la validacin, ambas juntas a travs
de la Inferencia Estadstica.
Contenido Temtico.
Unidad 1.- La Probabilidad
a) Introduccin (como estudiar el curso, descripcin programa).
b) Investigacin, diseo experimental y su teora
c) Teora de los conjuntos
d) Las leyes de la Probabilidad.
e) El Teorema de Bayes.
f) Las tcnicas de conteo o combinatoria.
g) Las variables aleatorias.
h) La esperanza matemtica o valor esperado.
i) La funcin generatriz de momentos.
j) Las distribuciones de probabilidad.

Total 22 hrs.

Unidad 2.- Los modelos de las distribuciones de probabilidad.


a) Los modelos de variables aleatorias discretas:
a. La distribucin Hipergeomtrica
b. La distribucin Binomial
c. La distribucin Geomtrica
d. La distribucin de Poisson
e. La distribucin Multinomial
f. La distribucin Binomial Negativa
b) Los modelos de las variables aleatorias continuas:
a. El teorema de Tshebyshef
b. La distribucin uniforme
c. La distribucin Gamma
d. La distribucin Exponencial
e. La distribucin normal o curva de Gauss
f. Ajuste del caso contino al caso discreto.

Total 22 hrs.

Unidad 3.- La Estadstica


a) El tratamiento de los datos
b) Los parmetros de tendencia central
c) Los parmetros de dispersin
d) La regresin y la correlacin.

Total 10 hrs.

Unidad 4.- La inferencia Estadstica


a) El diseo de experimentos
b) La teora del muestreo
c) Las distribuciones mustrales del promedio
d) La teora de la estimacin estadstica
e) Las pruebas de hiptesis estadsticas
f) La teora exacta del muestreo.

Total 12 hs.

Algunos libros de referencia:

Introduccin a la probabilidad y estadstica.


William Mendenhall

Estadstica elemental.
John Freund Gary Simon

Introduccin a la probabilidad y estadstica / gua programada


Beaver y Mendenhall

Estadstica
Murray spiegel

Elementos de probabilidad y estadstica


Elmer Mode.

UNIDAD 1
Introduccin a la Probabilidad y Estadstica.
En la Ingeniera civil se aceptan una serie de hiptesis simplificatorias (las
cargas son axiales, los materiales son homogneos, los cuerpos son rgidos, etc.) con el
fin de llegar a formulaciones simples de un problema, llamado modelo matemtico, el
cual facilita el calculo pero a la vez es suficientemente representativo. Es un modelo
determinado que funciona al sustituir las variables independientes y definir las
dependientes. Pero en la Ingeniera tambin existen fenmenos que estn sujetos a
leyes azarosas o del azar, es decir existe incertidumbre en su ocurrencia y una
hiptesis no es suficiente, ( volmenes de trnsito, velocidades del viento, volmenes
de agua escurridos por lluvia, diseos de sistemas de agua potable y alcantarillado,
programas de obra, distribucin de transito en la red vial, etc.).
Lo anterior indica contar con una base de datos para interpretar el fenmeno y
una forma de actuar ante un fenmeno con incertidumbre, lo que constituye la esencia
de la Probabilidad y Estadstica.
La probabilidad plantea leyes del azar y las cuales se utilizaran como base para
guiarnos a predecir los resultados de ciertos experimentos o fenmenos teniendo as
una base para la toma de decisin, en la Estadstica observaremos los resultados de
acciones repetitivas y que nos representan la realidad de los datos recolectados de una
muestra asociada a una poblacin, finalmente con la ayuda de probabilidades
estimadas realizaremos inferencias que es el fin ltimo del anlisis del fenmeno y que
nos permite definir la poblacin de la cual se obtuvo la muestra.
La probabilidad razona de la poblacin a la muestra y la estadstica de la
muestra a al poblacin.
Todo Ingeniero requiere de tener conocimientos de la Probabilidad y
Estadstica, ya que para incrementar los conocimientos que se tienen acerca del
mundo es necesario el empleo de las inferencias estadsticas. En un problema de
probabilidad las propiedades de la poblacin se suponen conocidas y se formulan y
responden preguntas en relacin con una muestra tomada de la poblacin. En un

problema estadstico, las caractersticas de la muestra estn disponibles para el


experimentador y esta informacin nos permite sacar conclusiones respecto a la
poblacin. Es decir, la probabilidad razona de la poblacin a la muestra
(razonamiento deductivo), y la Estadstica razona de la muestra a la poblacin
(razonamiento inductivo o inferencia estadstica). Lo anterior indica que antes de
comprender lo que nos puede decir una muestra en particular acerca de una
poblacin, primero deberemos de entender la incertidumbre asociada con el hecho de
tomar una muestra de una poblacin, de donde, es preferible primero estudiar la
probabilidad y despus de la Estadstica.
En los fenmenos con los cuales trabaja el ingeniero Civil, generalmente existe
un grado de incertidumbre, por ejemplo: en las demandas de trfico, en las
precipitaciones pluviales, en la resistencia del acero, en las cargas sobre un edificio, en
la calidad del agua, en la resistencia del suelo, en la resistencia del concreto, en la
demanda de agua, en al intensidad de un sismo, en la velocidad del viento, etc., los
cuales son fenmenos que no tendrn exactamente los mismos valores observados, an
bajo condiciones aparentemente idnticas. Lo anterior nos lleva a que un Ingeniero
Civil debe de reconocer y tratar la incertidumbre de manera realista y sobre todo de
manera econmica.
Si la Incertidumbre es pequea, ser posible despreciarla, pero si la
Incertidumbre es considerable se debern de seleccionar estimadores prudentes que la
consideren.
El tomar decisiones y el transmitir informacin cuando hay incertidumbre,
son necesidades que requieren de mtodos especiales de anlisis y los cuales son
estudiados por la Probabilidad y la Estadstica, a travs de modelos de la
probabilidad, a travs del tratamiento de los datos y el clculo de parmetros y a
travs del campo de la Inferencia estadstica.
En el plan de estudios de nuestra facultad, existen materias tales como,
Materiales de construccin, Tecnologa del Concreto, Mecnica de Suelos, Geotecnia,
Pavimentos, Ingeniera de trnsito, Ingeniera ambiental y de Salud Pblica,
Administracin de obras, Costos de construccin, Ingeniera del Transporte,
Alcantarillado, Hidrologa, Geologa, las cuales requieren de la toma de muestras, de
su anlisis y de ah llevar a cabo una inferencia al total del universo que se pretende

10

analizar, apoyndose en el tratamiento de los datos, en el calculo de parmetros y en la


regresin y correlacin.
En materias como la de Planeacin del Desarrollo, la Estadstica es
fundamental para la definicin de los diagnsticos que son base para la toma de
decisin. El diseo estructural esta en base a los resultados obtenidos de las muestras
analizadas de materiales, concreto, suelos.
Se puede considerar que todo el campo de la Ingeniera aplicada, requiere de la
aplicacin de alguna parte del campo de la Probabilidad y Estadstica.
LA NECESIDAD DE LA EXPERIMENTACIN:
Un experimento es un procedimiento que da origen a los datos, desde el punto
de vista estadstico de un experimento se dir que se sabe exactamente que hacer para
realizarlo, es repetible bajo condiciones esenciales equivalentes, da un resultado pero
no es conocido para un caso particular. La Investigacin cuantitativa tiene como
finalidad el anlisis o experimentacin de situaciones para el descubrimiento de
nuevos hechos, la revisin o establecimiento de teoras y las aplicaciones prcticas de
las mismas, se basa en los principios de observacin y razonamiento y necesita en su
carcter cientfico el anlisis tcnico de datos para obtener de ellos informacin
confiable y oportuna, por lo que se requiere de la Estadstica como herramienta, por
lo que el investigador debe de manejar los conceptos, tcnicas y procedimientos
estadsticos.
Dos conceptos bsicos en la Estadstica son poblacin y muestra, la poblacin
es sobre la cual queremos hacer afirmaciones a travs de un subconjunto extrado de
ella y que se denomina muestra, las conclusiones tendrn validez estadstica.
El problema de la Estadstica de estudiar una muestra y estimar el parmetro
desconocido para tomar una decisin se resuelve con el diseo experimental.

11

PROBABILIDAD
Teora de los Experimentos.LA PROBABILIDAD Y LA ESTADISTICA:
Son herramientas usadas en al mayora de las ciencias para poder efectuar
mejores tomas de decisiones.
EXPERIMENTO:
Proceso para obtener una observacin de un fenmeno o proceso cualquiera,
involucra tres etapas; ACCION, RESULTADO Y OBSERVACION.
VARIABLES EXPERIMENTALES:
Son las que tienen un efecto sobre el experimento, pueden ser cuantitativas o
cualitativas.
TIPOS DE EXPERIMENTOS:
Se consideran de dos tipos; los aleatorios y los experimentos determinsticos.
EXPERIMENTO ALEATORIO:
Los datos y resultados estn libres de determinacin, se define por la
distribucin terica de una variable y de su estudio se encarga la probabilidad.
EXPERIMENTO DETERMINISTICO:
Son aquellos en que datos y resultados se conocen en forma absoluta. En su
estudio se encarga de las distribuciones empricas de una variable a travs de
la estadstica.
PUNTOS MUSTRALES:
Un experimento produce uno y solo uno de los sucesos, si a cada suceso se le
asigna un punto se tendr un punto muestral. Un experimento tendr tantos
puntos mustrales como sucesos puedan acontecer.
ESPACIO DE EVENTOS (S):
Es la totalidad de resultados posibles de un experimento, tambin se le llama
universo o poblacin o censo. Es el conjunto de todos los puntos mustrales.
EVENTO SIMPLE:
Es cada uno de los resultados del espacio de eventos (cada punto muestral es
un evento simple).
EVENTO MULTIPLE:
Es un conjunto de eventos simples, se representa con maysculas.
EVENTO IMPOSIBLE:( )
Es el que no se define en el espacio de eventos.
NOTACION CONSTRUCTIVA DE EVENTO UN MULTIPLE:
A = {x x es algo}, A es el conjunto de eventos simples x, tal que x es algo del
experimento.

12

VERIFICACION DE UN EVENTO:
Si A se verifica de nA maneras distintas y B de nB maneras distintas,
ambos se verifican de nA*nB maneras distintas, se generaliza para ms de dos
eventos.
EJEMPLO:
Un experimento consiste en tirar un par de dados y observar las caras
que caen hacia arriba. Determine los eventos mltiples:
A = {x | x es par}
(espacio de eventos)
n x * ny = 6*6 = 36 = ns
B = {x | x es non}
C = {x | x es 12}
D = {x | x es < 2}
Espacio de eventos cualitativo
S = 36
(1,1) (1,2) (1,3) (1,4) (1,5) (1,6)
(2,1) (2,2) (2,3) (2,4) (2,5) (2,6)
(3,1) (3,2) (3,3) (3,4) (3,5) (3,6)
(4,1) (4,2) (4,3) (4,4) (4,5) (4,6)
(5,1) (5,2) (5,3) (5,4) (5,5) (5,6)
(6,1) (6,2) (6,3) (6,4) (6,5) (6,6)

A = {(1, 1); (3, 1); (2, 2); (1, 3); ... (4, 6); (6, 6)}

nA = 18

B = {(2, 1); (1, 2); (4, 1); (3, 2); ... (6, 5); (5, 6)}

nB = 18

C = {(6, 6)}

nC = 1

D = {} vaco o imposible

13

Teora de los conjuntos. CONJUNTO:


Es una lista bien definida de objetos, por lo que un evento ser un conjunto.
INCLUSION O IGUALDAD:
Si todos los eventos simples de A son tambin eventos de B se dir que
AB, o sea que A esta contenida en B, en caso contrario se dice que AB.
COMPLEMENTO (A):
Si tenemos un evento A de un experimento cuyo espacio es S se llamara
complemento de A y se representa por A, al conjunto de eventos que estn en
S pero no estn en A.
OPERACIN ENTRE CONJUNTOS:
Sirve para obtener nuevos conjuntos bsicamente se consideran de dos
tipos Unin () e Interseccin ().
UNION:
Dados los eventos A y B la expresin: AB = C, indica el conjunto de
eventos que estn en A o en B pudiendo estar en ambos.
AB = {x | x A y/o x B}
Se generaliza para mas de dos eventos: ABCD.......
INTERSECCION:
Dados los eventos A y B la expresin AB = C, indica el conjunto de
eventos que estn en A y en B, es decir
{x | x A y x B}
Se generaliza para n eventos.
TIPOS DE CONJUNTOS SEGN SUS EVENTOS:
DISCRETOS O CONTINUOS:
Pueden ser discretos, cuando toman el campo de los nmeros enteros.
Sern continuos cuando puedan tomar toda la gama de valores entre dos
enteros consecutivos o en el intervalo de (a, b).
FINITOS E INIFINITOS:
Finito si es contable el campo del espacio de eventos.
Infinito si no puede ser contable el espacio de eventos.
PROPIEDADES DE LOS CONJUNTOS:
CONJUNTO VACIO

CONJUNTO UNIVERSAL

A=A
A=
AS=S
AS=A

14

CONJUNTO COMPLEMENTARIO
A A' = S
A A' =
PROPIEDAD DE COMPLEMENTO
(A B)' = A' B'
(A B)' = A' B'
ASOCIATIVA
A (B C) = (A B) C
A (B C) = (A B) C
CONMUTATIVA
AB=BA
Y
AB=BA
DISTRIBUTIVA
A (B C) = (A B) (A C)
A (B C) = (A B) (A C)
ASPECTOS CUALITATIVOS Y CUANTITATIVOS DE LOS
CONJUNTOS:
Un conjunto tiene estas dos propiedades, a la probabilidad y estadsticas
solo les interesa el aspecto cuantitativo, es decir, interesa cuantos son pero no
quienes son.

EJEMPLO:
Un experimento consiste en tirar un dado, dados los siguientes
conjuntos mltiples A, B, C, D.:
A = {x | x es par}
B = {x | x es non}
C = {x | x es > 4}
D = {x | x = 3}
Y DONDE

S = {1, 2, 3, 4, 5, 6}

(conjunto finito y discreto)

-11DETERMINAR:
AB, AB, ABC, BCD Y (AC) (BD)

15

RESPUESTA:

A = {2, 4, 6}

B = {1, 3, 5}

C = {5, 6}

D = {3}

AB = {2, 4, 6, 1, 3, 5} = {S}

AB = {}

ABC = {2, 4, 6, 1, 3, 5} = {S}

BCD = {1, 3, 5, 6}

(AC) (BD) = {(2, 4, 6, 5) (1, 3, 5)} = {5}


(BD) = 1

n AB = 6
n AB = 0
n ABC = 6
n BCD = 4
n(AC)

DIAGRAMAS DE VENN-EULER

Las operaciones con los conjuntos se pueden representar grficamente,


considerando que el experimento es un conjunto de puntos de un plano y cada
punto del espacio es un evento, como se muestra:

(AB)

B
AB
AB

(AB)
BA

ACB

AB

BA

CAB

C
(ABC)

ABC

ABC

BCA

16
ABC

EJEMPLO:
Un coche puede requerir reparacin general, reparar la transmisin o
llantas nuevas, un coche requiere las tres reparaciones, ocho no requieren
reparacin alguna, dos requieren transmisin y llantas pero no-reparacin, tres
reparacin general y llantas pero no-transmisin, cuatro reparacin y
transmisin pero no llantas, cinco transmisin pero no llantas ni reparacin
general, seis llantas pero no-reparacin general ni transmisin y siete
reparacin general pero no transmisin y llantas.
A) Represente en notacin de conjuntos
B) Elabore el diagrama de Venn-Euler
RESPUESTA
A)
R = reparacin general
T = transmisin
L = llantas
a)
b)
c)
d)
e)
f)
g)
h)
i)
j)
k)
l)
m)

R, T Y L:
SIN REPARACION
T Y L NO R
R Y L NO T
R Y T NO L
T PERO NO R Y L
L PERO NO R NI T
R PERO NO T Y L
S = 36
n(RTL) = 28
nR = 15
nT = 12
nL = 12

n(RTL) = 1
n(RTL) = 8
n(TLR) = 2
n(RLT) = 3
n(RTL) = 4
n(TLR) = 5
n(LRT) = 6
n(RLT) = 7

17

B)

7
5

S= 36

L
(ABC) = 8
ABC=28

EJEMPLO:
En un grupo de 20 alumnos hay 16 aprobados en matemticas y 12 en
fsica pero existen 2 reprobados en ambas. Cuntos alumnos aprobaron las
dos materias?
RESPUESTA:
nM = 16
nF = 12
nS = 20
MF =?
M

MF
MF
FM

n(MF) = 2

MF

Entonces:
n (MF) = ns (MF) = 20 2 = 18
n (MF) = nM + nF n(MF)
18 = 16 + 12 n (MF)
n (MF) = 16 + 12 18 = 10
n(MF) = 10

18

MF = 6

MF = 10
FM = 2
n(MF) = 2

MF = 18

EJEMPLO
Al interrogar a 500 alumnos inscritos a uno o ms cursos semestrales de
lgebra, fsica y estadstica se encontr que tomaron lgebra 329, fsica 186,
estadstica 295, lgebra y fsica 83, lgebra y estadstica 217, fsica y
estadstica 63. Calcule l nmero de estudiantes que cursaron las tres
materias.
RESPUESTA
Datos:
S = 500
n(AEF) = 500
nf = 186
nA = 329
nE = 295
n(AF) = 83
(a + b)
n(AE) = 217 (a + d)
n(FE) = 63
(a + c)
n(AFE) =?

e
f

g
d

E
AFE

nF + nA + nE = (a + b + c + e) + (a + b + d +f) + (a + c + d + g)
nF + nA + nE = 186 + 329 + 295
nF + nA + nE = 810
500 + (a + b) + (a + d) + (a + c) a = 810
500 + 83 + 217 + 63 a = 810
a = 53 = n(AFE) que tomaron las tres materias

19

F
AFE = 30

AEF = 164

AF

FA

E=

E=
EF93

82
E

AFE = 53

EFA = 10

A=

68
Determine adems:
tomaron lgebra pero no estadstica.
tomaron fsica pero no lgebra.
tomaron estadstica pero no fsica.
tomaron lgebra o estadstica pero no fsica.
tomaron lgebra pero no fsica ni estadstica
Conceptos de probabilidad
Existen tres maneras bsicas de definir la probabilidad, surgen de
planteamientos conceptuales diferentes, pero implican lo mismo, La
aleatoriedad.
a) Concepto frecuentista de probabilidad, tambin se denomina de frecuencia
relativa, surge en el siglo XIX cuando inversionistas tuvieron la necesidad
de valuar el riesgo de perdidas en plizas de seguros, tomaron como base
datos de nacimientos y muertes, definieron la frecuencia relativa de
ocurrencia y tomaron una decisin. Es un hecho emprico que la frecuencia
relativa tienda a estabilizarse cuando aumenta la frecuencia total.
La Frecuencia Relativa es una cifra pasada para predecir lo que suceder en
el futuro.
El problema radica en cuantas veces repetir el experimento. El fenmeno
para que sea aplicable debe tener una situacin estable de frecuencia.
Las condiciones para la frecuencia relativa son, de que deben de realizarse
un gran nmero de intentos y el fenmeno debe de tener una consistencia
estable en su frecuencia.

20

b) Concepto subjetivo, es una probabilidad asignada por individuos o personas


en base a su juicio y experiencia, puede considerar una frecuencia relativa o
creencias vividas. Los expertos que toman decisiones, hace un uso elevado
de esta subjetividad. Al formalizarse la subjetividad se puede llegar a
formalizar un concepto de probabilidad para los sucesos.
c) Concepto clsico, es el que considera que todos los resultados son
igualmente verosmiles, y no existe fundamento para preferir una de entre
varias posibilidades, todas sern equiprobables, situacin real, pero a la vez
situacin que quizs no puede existir.
LaPlace considero esta idea y formulo la regla clsica de probabilidad, del
cociente de eventos favorables al de caso posible, todos verosmiles, esta
probabilidad tambin se llama a priori y parte de una simetra en el mundo.
Kolmogoroff planteo una fundamentacin axiomtica de la probabilidad y es
como se aplica actualmente pero basado en el concepto de LaPlace.
El problema surge cuando se tiene que comprobar lo verosmil que es lo
mismo al concepto de que es igualmente probable, es decir, si se justifica la
premisa con el resultado. Entonces que ocurre cuando un experimento no
presenta dicha simetra o que hacer cuando el nmero de resultados del
experimento es infinito.

21

Teora de la probabilidad
PROBABILIDAD
Este concepto es importante cuando se operan procesos que generan
observaciones que no se pueden predecir, pero su FRECUENCIA RELATIVA
con la cual ocurre en una gran serie de observaciones, generalmente es estable,
estos eventos se denominan ALEATORIOS O ESTOCASTICOS. La frecuencia
relativa da una medida intuitiva de la posibilidad de ocurrencia de un evento
aleatorio en observaciones futuras.
El concepto clsico de probabilidad considera que es finito l numero de
eventos simples asociados a un experimento aleatorio y donde todos y cada uno
de ellos SON IGUALMENTE POSIBLES en su ocurrencia, la probabilidad de un
evento A contenida en S y formado por n A eventos, se obtiene por la relacin
que existe entre los eventos favorables respecto al espacio de eventos a decir:
PA = nA/nS

Siempre y cuando el experimento se repita muchas veces.

LIMITES DE LA PROBABILIDAD
La probabilidad es un nmero comprendido entre cero y uno
P (A) = nA/nS
S nA = nS
P (A) = nA/nS = 1
P () = 0
0 < P (A) < 1

PROBABILIDAD POR COMPLEMENTO


nA = nS - nA

Si todos estn en el mismo espacio de eventos se puede dividir todo


entre el espacio de eventos
nA/nS = nS nA/nS
P (A) = 1 P (A)
P (A) = 1 P (A)
P(A) + P(A) = 1

22

Kolmogorov al dar la definicin axiomtica de probabilidad, le permite


desarrollar una teora slida sobre el concepto definido :
Axioma 1: para todo suceso A de S P (A) > 0
Axioma 2: para todo suceso S de S

P(S) = 1

Axioma 3: para toda coleccin de sucesos incompatibles Ai Aj = para


ij
Debe de ser para ai igual a la sumatoria de ai

p (Ai)

Lo anterior indica que cualquier asignacin que hagamos debe de verificar


estos tres axiomas para que se pueda llamar probabilidad.

LEY DE ADICION DE PROBABILIDAD

AB

AUB

n (AB) = nA + nB n(AB)
si todo se divide entre nS tendremos...
n (AB)/nS = nA/nS + nB/nS n(AB)/nS
P(AB) = PA + PB P(AB)
Si no hay interseccin de A y B si n (AB) = los eventos son mutuamente
excluyentes

AUB

nS

23

N(AB) = nA + nB si dividimos todo entre nS tendremos


N(AB)/nS = nA/nS + nB/nS
P(AB) = PA + PB
Se generaliza la ley de adicin de probabilidad tanto para conjuntos que
tengan eventos comunes, como para aquellos que sean
mutuamente
excluyentes, es decir:
P (A B C D ................) = PA + PB + PC + PD +..................

EJEMPLO 1
Una urna tiene 6 bolas rojas, 4 blancas y 5 azules. El experimento
aleatorio consiste en extraer una bola de la urna y observar su color.
Encuentre la probabilidad de que la bola extrada.
a)
b)
c)
d)
e)

sea roja
sea blanca
sea azul
no sea roja
sea azul o roja

nR = 6
nB = 4
nA = 5

Son eventos mutuamente excluyentes


a)
b)
c)
d)
e)

P (R) = n(R)/n(S) = 6/15 = 40%


P (B) = nB/nS = 4/15 = 26.67%
P (A) = nA/nS = 5/15 = 33.33%
P (R) = 1 P (R) = 1 0.4 = 0.6 = 60% P ( AUB )=PA +PB = 60%
P (B) = 1 P (B) = 1 0.2667 = 0.7333 = 73.33% P(AUR)=PA+PR = 73.33%

PROBABILIDAD CONDICIONADA O LEY DE LOS PRODUCTOS


Si consideramos un espacio S y donde B es un evento posible de S, ser posible
considerar a B como un nuevo espacio de eventos. Si A es otro evento posible
de S con un numero de eventos comunes a B, la probabilidad de A en el nuevo
espacio de eventos de B se denomina probabilidad condicional, es decir :

24

A
AB

(AB)

AB

P(A/B)
Probabilidad condicionada
P(A/B) = N(AB)/N (B)
todo entre N(S)
P (A/B) = [N (AB) / N(S)] / [N (B) / N (S)]
P (A/B) = P (AB) / P (B)
P (AB) = P (B) * P (A / B)
Se generaliza
En forma para A
P (B/A) = N (AB) / N (A) = P (A B) / P (A)
P (A B) = P (A) * P (B / A)
De sta manera
P (B) * P(A/B) = P (A) * P (B / A)
Si se quita la condicin se tendr la independencia de eventos, la cual es
diferente de los eventos mutuamente excluyentes.
Para B:
P (A B) = P (B) * P(A / B)
P (A B) = P (B) * P(A)
Para A:
P(A B) = P(A) * P (B/A)
P(A B) = P(A) * P (B)

se quita la condicin

se quita la condicin

25

EJEMPLO
El experimento extraer 3 bolas de una urna con seis bolas rojas, cuatro
blancas y cinco azules.
SIN REEMPLAZO: probabilidad condicionada
CON REEMPLAZO: independencia de eventos
a) P en el orden R, B, A:
C.R.
P (R B A) = PR * PB * PA
= 6/15 * 4/15 * 5/15 = 8/225 = 3.5%
S.R.

P (R B A) = PR * P (B / R) * P(A / R B)
= (6/15 * 4/14 * 5/13) = 4/91 = 4.4%

b) 1 de cada color
S.R.
P (R B A) = P (R A B) P (A R B) P(A B R)
P(BAR) P(BRA) = 6(6/15 * 4/14 * 5/13) = 26.37%
C.R.

P1 DE CADA COLOR = 6(6/15 * 4/15 * 5/15) = 21.33%

c) 2R, 1B
P2R Y 1B = 3P(RRB) = 3(6/15 * 5/14 * 4/13) = 13.19%
d) 3A
P3A = P(AAA) = (5/15 * 4/14 * 3/13) = 2.2%
e) al menos 2R
P2R = P2RP3R = 3P (RRR) + P(RRR) = 3(6/15 * 5/14 * 9/13) + (6/15 * 5/14
* 4/13) = 4.69%
f) cuando mucho 1 azul
P1A = P0A P1A
P1A = 1P (AAA) + 3P (AAA) = (10/15 * 9/14 * 8/13) +3(5/15 * 10/14 *
9/13) = 75.0%

26

EJEMPLO
Una urna contiene 2 bolas blancas y 1 negra, una segunda urna contiene 1
bola blanca, el experimento consiste en pasar una bola de la primera urna a la
segunda urna, encuentre la probabilidad de que al extraer una bola de la urna
dos, esta sea blanca.
ALTERNATIVAS

PROBABILIDAD

B1B1
B1B3
B2B2
B2B3
NB3
NN

1/3 *
1/3 *
1/3 *
1/3 *
1/3 *
1/3 *

FAVORABLE

1/2 = 1/6
1/2 = 1/6
1/2 = 1/6
1/2 = 1/6
1/2 = 1/6
1/2 = 1/6

si
si
si
si
si
no P(B) = 5/6

Entonces la suma de estas probabilidades nos da un 83.3% de sacar una


bola blanca.
Ejemplo:
Encuentre la probabilidad de tener una cara en el lanzamiento de dos
monedas homogneas.
CASOS PROBABILIDAD FAVORABLE

ser:

C x

SI

X c

SI

C c

no solicitada

X x

no solicitada

Por lo que la probabilidad de una cara en el lanzamiento de dos monedas

C x y x c es decir

o el 50 %.

27

PROBABILIDAD FRECUENTISTA
Existen experimentos en los que la probabilidad de la ocurrencia para
cada uno de los eventos del espacio se mantiene como ocurrencia de frecuencia
relativa, por lo que se les ponga condicin o no, o se trate con independencia de
eventos, su valor no cambiar. Ejemplos: parmetros de calidad, tirar una
moneda, tirar un dado, hijos en familias, etc.

EJEMPLO:
La probabilidad de que un huevo puesto por un insecto encube es un
parmetro estadstico igual a 0.4 encuentre la probabilidad; de que en cuatro
huevos puestos por el insecto encuben tres, por lo menos tres, cuando mucho
uno.
RESPUESTA:
P = 0.4, n = 4,
P(E) + P(E) = 1
entonces P(E) = 0.6
a) PX=3 = 4P(EEEE) = 4(0.4*0.4*0.4*0.6) = 0.1536
b) PX3 = P3P4 = [4*(0.4)3*0.6] + (0.4*0.4*0.4*0.4) = 0.1792
c) PX1 = POP1 = P(EEEE) + 4P(EEEE) = (0.6*0.6*0.6*0.6) +
4(0.4*0.6*0.6*0.6) = 0.4752

TEOREMA O REGLA DE BAYES

Una aplicacin interesante de la probabilidad condicional se encuentra en


la regla de Bayes. Considera tener k poblaciones mutuamente excluyentes y si
al realizar el experimento ocurre un evento A entonces podemos desear hacer
inferencias referentes a cual poblacin dio origen al evento A.
A este teorema tambin se le denomina de PROBABILIDAD INVERSA o
Probabilidad de Hiptesis. Si un evento A se verifica cuando se verifica alguno
de los eventos Hi los cuales sern mutuamente excluyentes, se podr definir la
probabilidad de A en cada uno de los eventos Hi y se denomina probabilidad A
Priori, se representa como una condicin
P(A/Hi)
a priori
Bayes considera conocido P(A/Hi), se deber de calcular la probabilidad de que
verificado A se verifique Hi
P(Hi/A)
a posteriori
El teorema de Bayes se demuestra as:
Sabemos que: P (Hi/A) = P (A Hi) / P(A)
(1)
P(A) = P(AH1) + P(AH2) + ........... = P (A Hi)
(2)
Pero P (A/Hi) = P (A Hi) / P( Hi) desp. P(AHi)=P(A/Hi) P (Hi)
(3)

28

Para toda la Hi se tendr P (A Hi) = P (A / Hi) P (Hi)


Pero (2) = (4), es decir: P (A) = P (A / Hi) P (Hi)
Sustituyendo en (1) se tendr (3) / (5) y la formula de Bayes ser:

(4)
(5)

P(Hi/A) = P(Hi)*P(A/Hi) / [PHi * P(A/Hi)]


Ejemplo:
Dos urnas idnticas contienen respectivamente la primera 9 bolas
blancas y 1 negra y la segunda 5 blancas y 20 negras se elige al azar una de las
urnas y se extrae una bola que resulto blanca, cul es la probabilidad de que la
urna elegida haya sido la primera?
RESPUESTA:
A = sale evento blanca, Hi = urnas
P(Hi/A) =?
Datos:
P(H1) =
P(H2) =
A PRIORI P(A/H1) = 9/10
P(A/H2) = 5/25
CON LA FORMULA:
P(Hi/A) = P(H1)*P(A/H1) / Phi * P(A/Hi)
P(Hi/A) = (1/2 * 9/10) / (1/2*9/10 + *5/25) = 9/11 = 0.81 = 81.81%
EJEMPLO:
Si el experimento fue extraer 2 bolas sin reemplazo, y el resultado fue
de una de cada color, cul es la probabilidad de que haya salido de la urna 2?
RESPUESTA:
P(H1) =
P(H2) =
SIN REEMPLAZO:
P(BN) = 2(9/10*1/9) = 1/5 = P(A/H1)
P(A/H2) = 2(5/25*20/24) = 1/3
Aplicando la formula

29

P(Hi/A) = [2(5/25*20/24)(1/2)] / [1/2(9/10*1/9)2 +1/2( 5/25*20/24)2]=


P(Hi/A) = 5/8 = 62%
EJEMPLO:
Una empresa emplea 3 ingenieros (1, 2, 3), estiman respectivamente los
costos del 30, 20 y 50% de los costos de dicha empresa, se sabe que cada
ingeniero comete 1 error grave al estimar sus costos con probabilidad
respectiva del 1, 3 y 2%. Si una licitacin se incurre en un error grave de
estimacin de costos, qu ingeniero tiene mas probabilidad de cometer dicho
error?
RESPUESTA:
Datos:
P(H1) = 0.3
P(H2) = 0.2
P(H3) = 0.5

P(A/H1) = 0.01
P(A/H2) = 0.03
P(A/H3) = 0.02

Aplicando la formula
P(H1/A) = (0.3*0.01) / (0.3*0.01 + 0.2*0.03 +0.5*0.02) = 0.003/0.019 = 0.157
P(H2/A) = (0.2*0.03) / 0.019 = 0.316
P(H3/A) = (0.5*0.02) / 0.019 = 0.526
Por lo tanto el tercer ingeniero es el que tiene ms probabilidad de cometer el
error.

ANALISIS COMBINATORIO:
Consiste en determinar l nmero de resultados posibles de un
experimento sin necesidad de llevar a cabo una enumeracin directa.

CONTEO
Si un evento se verifica de n1 maneras y otro evento de n2 maneras
ambas se verifican de n 1*n2 maneras distintas. Se generaliza para mas de dos
eventos
EJEMPLO:
Encuentre l nmero de placas que se puede obtener con tres letras y
cuatro nmeros.
n1 = 3 letras _ 27(n1, n2, n3)
n2 = 4 nmeros _10 (n4, n5, n6, n7)
Entonces

30

273*104 = 196 830 000 ser l numero de placas que se pueden obtener.
NOTACION FACTORIAL (n!)
Es el producto de los enteros positivos de 1 hasta n, se acepta que
factorial de 0! = 1.
ORDENACIONES (nOk)
Se llama ordenacin de clase k de n objetos diferentes a los diferentes
grupos ordenados que se pueden obtener tomando k objetos de entre los n,
interesa su ocurrencia y su orden.
nOk = n! / (n-k)!
EJEMPLO:
Obtenga las ordenaciones de las letras a, b, c, d, e tomando 2 a la vez,
donde:
n=5
y
k=2
Entonces

nOk = 5! / (5-2)! = 20

PERMUTACIONES

Son ordenaciones de clase n, s k = n


Entonces nOk = nOn = n! / (n-k)! = n! / (n-n)! = n!
Pn = n!

PERMUTACIONES CON OBJETOS IGUALES


S n1 + n2 + n3 + ... = n

n1, n2, n3..... Pn = n! / n1!n2!n3!.......

COMBINACIONES (nCk)
Son los grupos que se pueden formar tomando k objetos de entre los n
interesa su ocurrencia pero no el orden, por lo que deben permutarse k veces
las ordenaciones.
Entonces:
nCk = nOk / k! = n! / k!(n-k)!

PROBABILIDAD POR ANALISIS COMBINATORIO (SOLO SIN REEMPLAZO)

Aplicando el concepto de probabilidad por las tcnicas combinatorias se


podr calcular la probabilidad de un evento.
P = eventos favorables / eventos totales

31

P = No. De formas de tomar ki objetos de entre ni objetos / numero total de


formas de tomar k de entre Ns. Donde k1+k2+...=k y n1+n2+.....=Ns
EJEMPLO:
Experimento: extraer 3 bolas sin reemplazo de una urna con 6R, 4B y 5A
Determine la probabilidad de extraer:
a) 1 de cada color
b) 2 rojas y 1 blanca
c) 3 azules
sin reemplazo para todos
RESPUESTAS:
a) P1 de cada color = P3(RBA) = 6(6/15*4/14*5/13) = 0.2637
P1 de cada color = 6[P(RBA)] = 6(6/15*4/14*5/13) = 0.2637
P1 de cada color = 6C1*4C1*5C1 / 15C3 = 0.2637
b) 2R Y 1B
P(RRB) = 6C2*4C1*5C0 / 15C3 = 0.1318
P(RRB) = 3(6/15*5/14*4/13) = 0.1318
P(RRB) = 2,1P3[P(RRB)] = (3!/2!1!)(6/15*5/14*4/13)= 0.1318
c) 3A
P(AAA) = 0.022
P(A A A ) = 5C3 * 6C0 * 4C0 / 15C3 =0.022

VARIABLES ALEATORIAS (V.A.)


Una variable aleatoria es la que no puede predecirse antes de realizar
el experimento, la VA en el experimento puede tomar una serie de valores x y
a los cuales se le puede asignar una probabilidad de ocurrencia, es decir la V.A
esta definida en S y toma una serie de valores x con probabilidad definida.

TIPOS DE VARIABLES ALEATORIAS


Una V.A. ser discreta (VAD) si toma valores enteros, ser continua
(VAC) s su dominio esta en el rango de (a , b ).

DISTRIBUCION DE PROBABILIDAD DE UNA VAD (DPVAD)


Una variable aleatoria (VA) queda perfectamente descrito al conocer su
comportamiento y el cual se define por su DP. Si a cada valor de una VAD se le
asocia con su probabilidad, al conjunto de pares de puntos obtenidos se le

32

denomina DPVAD x y se representa por la tabulacin de Xi vs Pi y como se


analiza l todo la sumatoria de ocurrencias debe ser igual a 1. El
comportamiento de variable se visualiza a travs de su diagrama Xi vs Pi.
EJEMPLO:
Un experimento aleatorio consiste en tirar un par de dados y observar las
caras que caen hacia arriba. Si X es una VAD que designa las caras que caen
hacia arriba encuentre su DP.
D.P.V.A.D. x
Xi Pi
2
1/36
3
2/36
4
3/36
5
4/36
6
5/36
7
6/36
8
5/36
9
4/36
10 3/36
11 2/36
12 1/36

1
DISTRIBUCIN SIMTRICA
ESPERANZA MATEMATICA (VALOR ESPERADO)
Si X es VAD cuya DP es conocida, su esperanza matemtica estar
definida por el valor que tiende a presentarse con ms frecuencia si el
experimento se repite muchas veces.
La esperanza matemtica se define de la siguiente manera:
E = {h(x)} = hxi * Pxi
Habr tantos valores esperados como variables aleatorias se definan.

33

EJEMPLO:
En una lotera para beneficencia se venden 8000 boletos a $1 cada uno.
El premio es un automvil de $3000, si Juan compra 2 boletos. Calcule la
esperanza matemtica o valor esperado de su ganancia.
RESULTADO:
V.A
Ganar
Perder

hxi
$2998
$-2
SUMA

P
2/8000
7998/8000
1

E = {h(x)} = hxi * Pxi = 2998(2/800) 2(7998/8000)


E = -1.25 POR LO TANTO ES UNA PERDIDA
EJEMPLO:
La experiencia ha mostrado que una enfermedad causa incapacidad parcial en el
60% de los casos e incapacidad completa en el 30% de los casos. Solo 1 persona de
cada 10000 ser afectada por esta enfermedad en un ao dado. Una pliza de seguros
paga $20000 por incapacidad parcial y $50000 por incapacidad total. Qu prima de
seguros debe de cobrar una compaa para que la ganancia esperada sea igual a cero?
V.A.
Parcial
Total
Nada

hxi
$20000
$50000
$ 0
Sumas

Pi
0.6
0.3
0.1
1

E = 0.6 * 20000 + 0.3 * 50000 + 0.1 * 0


E = $27000 / PERSONA / AO
P = 1/10000
$/ persona = 27000 * 0.0001
$/ persona = $2.7/persona / ao

MOMENTOS DE PRIMER ORDEN, CON RESPECTO AL ORIGEN, O LA MEDIA (


x).
La media representa el centro de gravedad de la DP de valores X es una medida de
posicin y corresponde a los momentos tomados con respecto al origen o de primer
orden.
En forma general la media es:

34

E = {hx} = hxi * Pi = x
valor esperado.
FUNCION GENERATRIZ DE MOMENTOS (fgm)
El tema de fgm ser desarrollado por el alumno y entregado en clase.

MOMENTO DE SEGUNDO ORDEN, CON RESPECTO A LA MEDIA, LA


VARIANZA O DESVIACION ESTANDAR.

La varianza es una medida de dispersin o variabilidad que define que tan


cierta es la media, al establecer un rango de ocurrencia de la media. La raz de
la varianza es la desviacin estndar.
E = {hx2} = hxi2 * Pi = (xi - x)2 * Pxi = x2
x = x
Concentracin = x x
2

EJEMPLO:
Encuentre la x, x, 2x del experimento tirar un par de dados.
Xi
2
3
4
5
6
7
8
9
10
11
12

Pi
1/36
2/36
3/36
4/36
5/36
6/36
5/36
4/36
3/36
2/36
1/36
1

x = Xi * Pi)
x = 2 (1/36) + 3 (2/36) +...
x = 7

E = {hx2} = (xi - x)2 * Pxi = x2


x2 = (2-7)2 * 1/36 +...
x2 = 5.83
x = 2.41

CONCENTRACION = 7 2.41,

35

RANGO DE 4.59 A 9.41

VARIABLES ALEATORIAS CONTINUAS (VAC)


Estas variables al tomar toda la gama de valores entre (a, b) se debern de
solucionar por medio de integrales bajo los principios ya establecidos.
Definida una funcin de probabilidad f(x) que es multiplicada por una
constante k que obliga al rea bajo la funcin ser igual a 1.
P(a x b) = ab P(x) dx
P(x > a) = a Px dx
P(x a) = a Px dx
P(x b) = b Px dx
x = - xPx dx
x2 = - (x-x)2 Px dx

donde
Px = kf(x)

- P(x) dx = 1

EJEMPLO:
Segn datos estadstico una VAC toma valores entre 0 y 4 y su funcin de
probabilidad esta definida por f(x) = - kx. Determine:
a) el valor de k
b) la probabilidad de que P(0 < x < 1)
c) parmetros
d) polgono y concentracin
a. 04 (1/2-kx)dx
x/2 kx2/2 0 4 = 1
2 8k - 0 = 1
k = 1/8
Px = - x/8
b. 01 (1/2 x/8)dx
x/2 x2/16 01
1/2 1/16 - 0 = 7/16
c. x = 04 x(1/2 x/8)dx = x2/4 x3/24 04
x = a 8/3 = 4/3 = 1.33
x2= 04 [(x-4/3)2 (1/2 x/8)]dx = 0.81
x = 0.81 = 0.9
d. concentracin x x
1.33 0.9
de 0.43 a 2.23
Px
x Px

36

4 0
x
Ejemplo1. Se ha encontrado por experiencias, que la duracin de cierto producto es
una v.a.c. que se distribuye segn la siguiente funcin
Fx = e-2x/k para x>0, determine la probabilidad de que el producto tenga una vida de
menos de dos unidades de tiempo y determine la media de la duracin.
LOS MODELOS DE LAS DISTRIBUCIONES DE PROBABILIDAD.
DISTRIBUCIONES TEORICAS DE UNA VARIABLE
Muchos fenmenos aleatorios tienden a mantener una continuidad en su
ocurrencia ya sea en forma consistente o en forma de frecuencia relativa, lo que
permite elaborar o deducir una formula que se ajuste al comportamiento, y que se
denomina MODELO. Atendiendo al tipo de variable por analizar, es decir, discreta o
continua, las distribuciones o modelos mas frecuentes son los siguientes:
CASO DISCRETO
A) Distribucin Hipergeomtrica (H)
B) Distribucin Binomial (B)
C) Distribucin Geomtrica (G)
D) Distribucin de Poisson (P)
E) Distribucin Multinomial (M)
F) Distribucin Binomial Negativa ( B-1 )
CASO CONTINUO
Teorema de Tchebyshef
A) Distribucin Uniforme o Rectangular
B) Distribucin Gamma
C) Distribucin Exponencial
D) Distribucin Normal o Curva de Gauss
E) Ajustes del caso contino al discreto.
CASO DISCRETO:

DISTRIBUCION HIPERGEOMETRICA ( H )
Si tenemos un universo finito de N objetos del cual extraemos n objetos sin
reemplazo de dicho universo y si existe a objetos de cierta caracterstica, la
HIPERGEOMETRICA se define al calcular la probabilidad de que al sacar n objetos x
sean de la caracterstica de a y el resto no lo sea.

H =[a C x * (N-a) C (n-x) ]/

Cn

Los parmetros para esta distribucin aplicando la fgm son:


p = a/N
2x = [(N-n)/(N-1)] * npq

37

x = np
p+q=1
q=1p

EJEMPLO:
Un club esta constituido por 12 hombres y 8 mujeres. Se va a formar un comit de 5
personas.
a) Encuentre la probabilidad de que el comit este formado por 3M y 2H.
b) Si x es una VAD que designa a las mujeres encuentre su DPVAD, polgono,
concentracin, 2x, x y x.
RESPUESTA:
N= 20, n= 5, a= 8
a) p(3M, 2H), x= 3
H = [8C3][(20-8) C (5-3)]/20C5
H = 0.238
b) VAD _ mujeres
x= np p=a/N = 8/20 = 2/5
x=5*(2/5) = 2
2x= [(20-5)/(20-1)] * 5 * 2/5 * 3/5 = 0.947
x= 0.973
concentracin x x = 2 0.97
rango de 1.03 a 2.97

DPVAD x

px
0.4

x
0
1
2
3
4
5

Px
0.051
0.255
0.398
0.238
0.054
0.004
1

DISTRIBUCION BINOMIAL
PRUEBA DE BERNOULLI
Si un experimento esta compuesto por una serie de sucesos con una
probabilidad p de ocurrir o xito y una probabilidad q de no ocurrir o falla y si el
experimento se repite muchas veces y en cada intento se mantienen los valores de p y
q, se dir que se tendr la probabilidad de un xito en un intento o PRUEBA DE
BERNOULLI por ejemplo: tirar una moneda, parmetros de calidad, frecuencia
relativa, etc.

38

La distribucin binomial considera una sucesin de pruebas de Bernoulli, con una


p de xito y una q de falla, si el experimento se repite n veces la probabilidad de x
xitos y (n-x) fallas ser pxq(n-x). La binomial se define al encontrar todas las posibles
ocurrencias de lo anterior, es decir:
B = [nCx][pxq(n-x)]
Los parmetros segn la fgm son:
x = np
2x = npq
x = npq
En clase, aplicando la fgm se demostrar, en forma matemtica, las formulas de
la media y de la distribucin estndar.
EJEMPLO:
El 20% (base de datos) de los remaches producidos por una maquina son defectuosos,
encuentre la probabilidad de que en una muestra de 4 remaches tomados al azar.
a) se tengan 3 defectuosos
b) por lo menos 2 defectuosos
c) parmetros: x, 2x, x, concentracin y polgono.
p= 0.2
q= 0.8
n= 4
x=3

Binomial

a. B= [4C3] [(0.2)3(0.8)4-3] = 0.0256


b. Bx 2 = B2 B3 B4
Bx 2 = 4C2(0.2)2(0.8)2 + 4C3(0.2)3(0.8)1 + 4C4(0.2)4(0.8)0
Bx 2 = 0.1808
c. x= np= 4(0.2)= 0.8
2x= npq = 4(0.2)(0.8) = 0.64
x= npq = 0.64 = 0.8
concentracin x x = 0.8 0.8
rango de 0 a 1.6
d. Se deja a que el alumno determine la D.P.V.A.D. x y su pol. De prob.
EJEMPLO:
Se lanza una moneda homognea al aire 6 veces, si x es una VAD que designa las
caras que caen hacia arriba. Determine la probabilidad de tener dos caras. Determine
su DPVAD, pol. Y concentracin para las caras
p = 0.5
q = 0.5
n=6
Binomial
x=2
B = [6C2][(0.5)2(0.5)6-2] = 0.234

39

x = np = 6(0.5) = 3
2x = npq = 6(0.5)(0.5) = 1.5
x = 1.22
concentracin x x = 3 1.22
rango de 1.78 a 4.22
El alumno determinar la DPVAD x, el polgono y la concentracin.
EJEMPLO:
En una interseccin en Y que sirve como de libramiento en un camino para no
entrar a una ciudad, segn datos estadsticos permiten asegurar que 2/3 partes del
transito van a la ciudad. Si se aproximan 8 vehculos a la interseccin determine la
probabilidad de que ningn vehculo use el libramiento.
VAD = vehculos que usan el libramiento.
p= 1/3
q= 2/3
n= 8
x= 0
B=[8C0][(1/3)0(2/3)8-0] = 0.000304
x= 8(1/3)= 2.667
2x= 8(1/3)(2/3)= 1.778
x= 1.333
concentracin x x = 2.667 1.333
rango de 1.334 a 4
. Se deja que el alumno determine la DPVAD x y su polgono.

DISTRIBUCION GEOMETRICA
Esta distribucin se basa en la teora binomial, se refiere a la ocurrencia de una
sucesin de pruebas de Bernoulli con probabilidades p y q. La variable aleatoria
geomtrica considera la ocurrencia de una serie de fallas antes de que ocurra el
primer xito o una serie de xitos antes de la primera falla. Si en el experimento
Binomial la ocurrencia simtrica ocurre cuando p= y q= , en el caso geomtrico la
situacin perfecta ser cuando p= obtenindose un comportamiento de tipo
exponencial. La G se define por:
G= px-1 * q
Parmetros: = 1/q
2= p/q2
o bien
G= qx-1 * p

40

Parmetros: = 1/p
2= q/p2
EJEMPLO:
Un dado se lanza varias veces, encuentre la probabilidad de que el primer seis
caiga en el quinto lanzamiento.
x= 5
q= 1/6
p= 5/6
G= px-1q
G=(5/6)4(1/6) = 0.0803
= 1/q = 1/(1/6) = 6
2= p/q2 = (5/6)/(1/6)2= 30
= 5.47
concentracin x x = 6 5.47
rango de 0.53 a 11.47.
Ejemplo :
Un proceso productivo involucra que un elemento se procese en dos mquinas, la
A y la B, en ese orden.
El elemento se puede romper en cada mquina y cuando esto ocurre la mquina
queda temporalmente fuera de servicio y el proceso se interrumpe.
Si la probabilidad de que el elemento se rompa en la maquina A es p 1 y de que se
rompa en la mquina B es p 2, encuentre una expresin que determine el total esperado
de elementos que se procesarn antes de que ocurra la primera ruptura.
Aplique para el caso de que p1 = 0.0000124 y p2 = .00000275

AJUSTE DE LA DISTRIBUCION HIPERGEOMETRICA POR LA BINOMIAL


La Hipergeomtrica puede ser tratada como Binomial aunque el experimento
sea sin reemplazo. Ya que si n es suficientemente grande, el error que se puede tener
al considerar una probabilidad constante tiende a cero, por lo que el ajuste puede ser
vlido. Se acepta que el ajuste es suficientemente apropiado cuando n es menor que el
5% de N
0.05N n
En este caso los parmetros para la Binomial n, x, p, y q se consideran de la
siguiente manera:
n y x con el mismo criterio pero
P = a/N es constante (sin variacin)
q = 1-p

41

EJEMPLO:
En una prisin 120 de los 300 internos purgan condenas por delitos contra la
salud, si se selecciona una muestra de 8 internos. Encuentre la probabilidad de que 3
de los ocho purguen condena por delitos por la salud.
RESPUESTA:
N= 300,
a=120,
n= 8,
x=3 condiciones de una H, pero como N es muy grande
entonces se revisar un ajuste por la binomial:
0.05N n, 15 8 cumple la condicin y el ajuste ser correcto.
B= nCx pxq(n-x) con n=8, x=3, p=120/300= 0.4 y q=180/300= 0.6
B= 8C3 * (0.4)3(0.6)5
B= 0.2787
Se observa que el ajuste funciona ya que el valor de p y q no varan mucho al
hacerlo sin reemplazo 120/300=0.4 119/299=0.398 etc.

DISTRIBUCION MULTINOMIAL
Considere un experimento en los que se verifican los eventos E 1, E2, E3,... Ek
todos mutuamente excluyentes y en el que cada uno tiene una probabilidad de
verificacin P1, P2, P3, ... Pk, si consideramos que el experimento se repite n veces,
donde cada evento se puede verificar n 1, n2, n3, ... nk, donde n1 + n2 + n3 + ... + nk = n (con
reemplazo).
La multinomial se define al calcular la probabilidad de ocurrencia de cada
evento pero en todos sus casos posibles, es decir:
M= [n!/(n1! n2! n3! ... nk!)] (P1)n1.......... (Pk)nk
k
variables aleatorias.
Se deber de calcular los parmetros y para cada variable aleatoria.
EJEMPLO:
De un estudio de Ingeniera de Transito se estableci que l numero total de
viajes de la zona A a la B se distribuye por propsito de la manera siguiente (ver tabla
en la siguiente hoja). Considere un viaje especfico en un autobs del servicio pblico y
en el cual se encontr que iban 15 personas. Determine la probabilidad de que iban con
los siguientes propsitos.

42

RESPUESTA
Propsito

E= propsito

% de viajes No. de pasajeros

TRABAJO

0,433

NEGOCIOS

0,08

COMPRAS

0,081

RECREO

0,076

ESCUELA

0,304

OTROS

0,026

P= probabilidad

VA = 6

n= numero de pasajeros

M= [15!/6! 2! 1! 0! 5! 1!] * (0.433)6(0.080)2(0.081)1(0.076)0(0.304)5(0.026)1


M= 0.0016
DISTRIBUCION BINOMIAL NEGATIVA (B-1)
Esta distribucin se relaciona con definir l nmero de intentos necesarios
para que ocurra el k-esimo xito.
Una VA con esta distribucin considera los valores de p y q binomiales, trata de
definir que es lo que suceder cuando interesa l numero de la prueba en la cual
ocurre el 2, 3, 4, etc., xito, cuando se define en que prueba ocurre esto se tendr
la Binomial Negativa.
Una VA x tiene una Distribucin Binonial Negativa si cumple que:

B-1 =

(x-1)

C (r-1) prq(x-r)

Donde r es el intento para que ocurra el k eismo xito.


Segn fgm:
x = r/p

2x = r(1-p)/p2

S r= 1
x = r/p = 1/p
x = 1(1-p)/p2 = q/p2
r= 1
B-1
G
2

43

EJEMPLO:
Un estudio geolgico indica que un pozo mana petrleo con una probabilidad de
0.2. Cul es la probabilidad de que el 3er. encuentro de petrleo haya manado del 5to
pozo que se perforo?
RESPUESTA:

p= 0.2

q= 0.8

x= 5

r= 3

B-1 = [4C2](0.2)3(0.8)2
B-1 = 0.03072
x= 3/0.2 = 15
Rango = de 7 a 23

2x= 3(1-0.2)/(0.22) = 60

x= 7.75

Tercer encuentro en el 15avo. Pozo.


x= 15
r= 3
B-1 = [14C2](0.2)3(0.8)12
B-1 = 0.0500
Se deja al alumno que calcule para r = 5 en el sptimo y dcimo pozo.
EJEMPLO:
Se lanzan 2 monedas al aire, encuentre la probabilidad de que en las 2 monedas
caiga guila por tercera vez en el sexto intento.
RESPUESTA:
x= 6
r= 3

p= 1[ ] =
q= 1 =

B-1= [5C2](1/4)3(3/4)3
B-1= 0.066
x= r/p = 3/(1/4) = 12
2x= r(1-p)/p2 = 36
concentracin = 12 6
Rango = de 6 a 18
El alumno calcular el caso de 3 monedas.

x= 6

DISTRIBUCION DE POISSON (P)


Esta distribucin se aplica bsicamente como un ajuste al caso Binomial, ya que
cuando se incrementa el tamao de la muestra, l calculo de operaciones binomiales
resulta ser muy laborioso. Poisson recomienda que se aplique en lugar de la Binomial
cuando se satisfacen las siguientes condiciones:
n

p
0
x
0

44

Siendo suficientemente apropiado


n 100
p 0.05
x < 10
Se observa que el comportamiento de Poisson es exponencial ya que concentra
la mayor cantidad de superficie (probabilidad) hacia el origen.
Binomial y Poisson no son recomendables cuando x
, pero tambin con
cualquier valor de p, q, x,n y se solicitan probabilidades acumuladas. En este caso se
prefiere un ajuste del caso continuo al caso discreto.
Atendiendo a la variabilidad de la media la curva de Poisson podr tomar
varias formas, desde la exponencial hasta las de forma acampanada.
MODELO DE POISSON
Considere un experimento en el que se tiene una probabilidad de un xito
intento igual a p= 1/v donde v
p
0
Bajo estas condiciones Binomial se transforma de la siguiente manera:
P= [ x e-] / x
x = np =
2x = np =
x =
La demostracin se efectuar en clase.

en un

EJEMPLO:
El 2% de los fusibles producidos por una maquina son defectuosos. Encuentre la
probabilidad de que en una muestra de 200 fusibles tomados al azar.
se tengan 4 defectuosos
cuando mucho 6 defectuosos
entre 15 y 180 defectuosos
Si la VA son defectuosos encuentre su DPVA y parmetros.
RESPUESTA:
n= 200
p= 0.02
q= 0.98 es una binomial
pero como p < 0.05 y n > 100 entonces es adecuado Poisson.
P=[e-x] /x!
a. = np = (200)(0.02)= 4
Px=4 =( e-4 44 ) /4!
Px=4 = 0.195
Px6= p0 + p1 + p2 + p3 + p4 + p5 + p6
= e-4[40/0! + 41/1! + 42/2! + 43/3! + 44/4! + 45/5! + 46/6!] = 0.88
P ( 15 x 180 ) = P15 + P16 + .......... + P 179 + P180

45

Segn la respuesta b. Se puede aceptar que tiende a 0, o efectuar un ajuste


continuo por la prueba normal si satisface las condiciones.
DPVAD
x = np = 4
varianza = 4
desviacin estndar = 2
rango de 2 a 6
X
0
1
2
3
4
5
6
7
8
9

Px
0,0183
0,0733
0,1464
0,1952
0,1952
0,1561
0,104
0,0595
0,0297
0,0132

0,25
0,2
0,15
0,1
0,05
0
0

10

0,9909

CASO PARTICULAR DE POISSON


En Ingeniera de Transito es conveniente la aplicacin de Poisson. Ya que si se
considera que el flujo de transito es casual, entonces con esta consideracin y
aceptando que en un periodo de tiempo se podr presentar un flujo de transito, pero
como el tiempo es variable continua, es decir, se podr aceptar un ao, un mes, una
semana, un da, una hora, un segundo. Al ir reduciendo el intervalo de tiempo la
probabilidad de ocurrencia del fenmeno tendera a cero y como l numero de
intervalos en que se divide el tiempo tiende a infinito entonces se aceptaran las
condiciones de Poisson, deduciendo solo el valor de la variable aleatoria bajo estudio.
EJEMPLO: Considere un camino con un transito promedio diario de 2400 vehculos.
a) Encuentre la probabilidad de que en un intervalo de 1 minuto se tengan
exactamente 9 vehculos.
b) se tenga exactamente 1 vehculo
c) c) se tenga por lo menos 5 vehculos.

46

RESPUESTA:
a) Px= 9 en un periodo de 1 minuto
2400/1440 =1.6 veh/min =
Px= 9 = e-x/x!= e-1.6 * 1.69/9! = 3.82 * 10-5
b) Px= 1 e-1.6 * 1.61 / 1! = 0.323
c) se deja al alumno resolverlo
EJEMPLO:
En una interseccin con semforo en tiempo fijo de ciclo de 60 segundos. 200
vehculos/ hora dan vuelta a la izquierda, cada ciclo puede acomodar tres vueltas
izquierda.
a) En que porcentaje de los ciclos es de esperarse que ocurran demoras.
b) Si se proporciona una fase especial para darle vueltas izquierdas, en que porcentaje
de los ciclos no ser necesario esta fase.
RESPUESTA:
Vuelta a la izquierda = 200 veh/hr, 3 vueltas por cada ciclo de 60 seg.
200/60 = 3.3 =
a) Px4 = 1-[p0 + p1 + p2 + p3]
Px4 = 1 e-3.3[3.30/0! + 3.31/1! + 3.32/2! + 3.33/3!]
Px4 = 0.4197 de probabilidades de que haya demoras
b) x = 0
Px=0 = e-x/x!= e-3.3 * 3.30/0!
Px=0 = 3.7% no ser necesario la fase del semforo.
LAS DISTRIBUCIONES CONTINUAS
TEOREMA DE CHEBYSHEV (TCH)
Este teorema es aplicable a cualquier conjunto de observaciones de una
variable aleatoria continua o discreta, por esta razn sus resultados son dbiles o
conservadores. Se puede referir tanto a poblaciones como a muestras. El TCH es un
hecho cientfico ya que esta demostrado matemticamente, es muy conservador, ya
que considera que la fraccin de observaciones que caen en un cierto intervalo tienda
a tomar el concepto al menos, situacin que permite que muchos fenmenos lo
satisfagan. El TCH es aplicable cuando se desconoce la distribucin y su forma, pero
conocidas estas se podrn calcular probabilidades exactas. La condicin ms apropiada
Para aplicar el TCH es cuando las distribuciones presentan una forma del tipo
monticular o tipo joroba, pero an con distribucin desconocida podr ser aplicado, al
ser solo para valores aproximados al TCH tambin se le conoce como de distribucin
libre, el TCH descubri que la fraccin del rea entre dos valores simtricos

47

alrededor de la media esta relacionado con la desviacin estndar tanto para el caso
discreto como para el continuo.
El TCH tambin es la aplicacin para definir la tendencia de una DP ya que una
distribucin acampanada debe satisfacer sus condiciones.
El TCH considera una VA x con parmetros (x, x) y demuestra para todo valor de
k(+) desv std de la media toma los siguientes valores :
P( -kx+k ) 1 (1/k2) para k1
Esto indica que por lo menos 1 1/k2 de las observaciones se encuentran dentro
de k desviaciones estndar de la media. Geomtricamente representa lo siguiente:

F(x)

x
x

x
k

es decir
k

1 1/k2
0 se suele aceptar > 2/3

8/9
15/16
24/25

EJEMPLO:
Un producto tiene un peso promedio de 16 onzas (x = 16), con x= 0.02 onzas.
Qu porcentaje de los productos como mnimo debern de tener su peso entre 15.8
x 16.2 onzas? Si su distribucin continua es desconocida
RESPUESTA: Al desconocer su funcin se podr aplicar el TCH
VA : pesos del producto en onzas.
x = 16
x = 0.02 segn x x
16 k * x
k * x = 0.2
k = 10
se satisface 1 1/k2 = 1 1/102 = 0.99
por lo que el 99% de los productos tendrn su peso en este rango.

48

EJEMPLO:
l numero de clientes a los que un restaurante sirve una noche de viernes es
una VA con una x = 160, x = 7.5, si la distribucin es del tipo monticular encuentre
a) la probabilidad de que se sirvan entre 145 y 175 clientes en una noche de
viernes
b) Con que frecuencia se atendern hasta 200 clientes.
c) l numero de clientes que sern atendidos con una probabilidad del 85%.
RESPUESTA:
Al ser monticular la distribucin pero desconocida la funcin se aplicar TCH.
x = 160, x = 7.5
a) P(145 x 175) = 1 = 3/4 = 0.75 es la probabilidad solicitada.
x k * x
k * x = 15
160 15
k = 15/7.5
k=2
b) Px 200 = 1- 1/5.332 = 0.965 se atender hasta 200 clientes
x k * x
k * x = 40
160 40
k = 40/7.5
k = 5.33
c) 11/k2 = 0.85
k2 = 6.66
k = 2.58 por lo que el intervalo ser de P(141 x 179) = 0.85
ya que 160 ( 2.58 ) ( 7.5 )

k

DISTRIBUCION UNIFORME O RECTANGULAR


Si se selecciona al azar un nmero representado por un punto en el intervalo de
a x b, y su ocurrencia permanece constante, la funcin de densidad de probabilidad
de la variable aleatoria X estar representada por medio de un rectngulo como
muestra en la grfica.

A=b*h
A = (b-a)(1/b-a)
A =1

F(x)

1/(b-a)

49

Para asegurar el principio probabilistico de que el rea bajo la curva es igual a


1, la altura del rectngulo debe ser 1/b-a .
Una variable de este tipo se denomina uniforme y se representa con la
siguiente funcin:
F(x) [1/(b-a)] para a x b
cero para cualquier otro punto
Segn la fgm los parmetros sern:
x = (a + b) / 2
2
x = (b a)2 / 12
Esta distribucin representa la idea fundamental de la probabilidad de que
todo elemento tiene la misma probabilidad de ser elegido, por lo que es una
distribucin empleada para la generacin de nmeros aleatorios.
EJEMPLO:
En la llegada de clientes a una caja registradora de un supermercado, se sabe,
que en un periodo de 30 minutos llega un cliente, determine la probabilidad de que el
cliente haya llegado en los ltimos 5 minutos del periodo, si sabemos que puede llegar
en cualquier instante del intervalo.
RESPUESTA:
En un perodo de 30 min. Llega un cliente
Intervalo (a , b) = (0 , 30)
distribucin uniforme f(x) = 1/(b-a) = 1/(30-0) = 1/30
P(25 x 30) = 3025 (1/30)dx = (1/30) x3025= (1/30) [30-25] = 5/30 = 1/6
= (b + a)/2 = (30 + 0)/2 = 15
2 = (30 0)2/12 = 75
= 8.66
concentracin = 15 8.7
Se generaliza a cualquier periodo de cinco minutos.

DISTRIBUCION TIPO GAMMA


Esta distribucin se relaciona con variables aleatorias a las que solo se les
puede asociar valores no negativos, esto indica que su distribucin es asimtrica o
sesgada a la derecha, lo que implica que la mayor cantidad de rea se concentra
alrededor del origen, como se muestra en la grfica.
F(x)

50

La tipo gamma se define por la siguiente funcin.

= funcin de alfa
f(x) = (x-1e-x/)/

= (x-1 e-x)dx funcin bsica gamma, demostrndose que para entero


es igual a ( -1 ) , si no es entero se emplear la Gamma incompleta.
f(x) = (x-1 e-x/)/ (x-1e-x)dx
0x
= 0 y = 0, para cualquier otro punto
= parmetro de forma (simtrica)
= parmetro de escala (segn )
=
2 = 2
variar segn la curva sea mas sesgada o menos sesgada y segn sea mas o menos
apuntalada. Para la solucin de esta distribucin,

el alumno NO podr optar

por el T.CH, para tener una solucin aproximada al problema. Pero se puede llegar

a una solucin exacta empleando una tcnica programada; por ejemplo, a travs del
Mathcad con la limitativa de no dar solucin para valores grandes de y . Aunque
tambin se podr dar solucin empleando una transformacin de la Gamma std a
travs de la Gamma incompleta.
Los valores de y pueden ser determinados si son conocidos los parmetros
y , ya que con una relacin algebraica se podrn determinar los parmetros de
forma y el de escala, siendo esto lo comn.
Cuando en la funcin Gamma general se tiene que = 1, entonces se denomina
distribucin Gamma estndar de probabilidad, es decir :
F (x;) = [ x-1 e x ] / para x 0 ; 0 para otro modo.
Pero si tenemos definidos los parmetros y , entonces ser conveniente
transformar a la Gamma estndar en la llamada Gamma incompleta de la siguiente
manera X = x / de donde para el calculo de una probabilidad:
P ( X< x ) = F ( x ; , ) = F (x/ ; ) = F ( X , )
Lo anterior implica que se resuelve la probabilidad nicamente con el valor de
y el valor de X, para lo cual se ha diseado una tabla que permite calcularla en forma
exacta la probabilidad

51

EJEMPLO:
El tiempo para efectuar un mantenimiento de un equipo sigue una ley gamma con = 3
y = 2. Un mecnico nuevo emplea 20 minutos para llevar a cabo dicho mantenimiento,
concuerda este tiempo con las experiencias anteriores de mantenimiento.
RESPUESTA:
= = 6
2 = 2 = 12, = 3.46 Concentracin 63.46, en este rango se tendr la mayor
concentracin de probabilidad, por lo que casi se puede aceptar que 20 es demasiado
tiempo y no concordar con las experiencias anteriores. Se compararn estos valores
teniendo como funcin de ajuste el empleo del T.CH. :
k = 14, k = 4.05
Px 20 = 1 1/k2
= 0.94,
o sea que solo en el 6% de los casos se emplearn mas de 20 minutos, por lo que no
concuerda con los tiempos de mantenimiento. Empleando mathcad da una probabilidad
exacta de = 0.997 considerando la funcin [ x 2 e-x/2 ] / 16, se observa la diferencia que
existe entre el valor estimado y el real. Para el caso de un valor mximo de 10 la
probabilidad exacta es 0.875 pero por T. CH. Da 0.25 donde se observa la gran
diferencia en la aproximacin. En la hoja final de anexos se muestra la hoja de clculo
del Mathcad.
Empleando la gamma incompleta, se har la siguiente transformacin:
X = x/ = x/2, el calculo de la probabilidad ser P ( X< x ) = P ( X < 20)
P ( X < 20 ) = F ( x/, )
F ( 20/2, 3 ) = F ( 10,3 ) = F ( X , )
Entrando a la tabla de la gamma incompleta y la cual se adjunta en el anexo de la
pagina final, se tendr que P ( x < 20) = 0.997 que coincide con el valor calculado por
mathcad, para el caso de P ( x<10 ) da 0.875 que tambin coincide con el valor exacto.
Se deja al alumno haga la conclusin de los tres casos.
EJEMPLO:
Los sueldos de los ingenieros de una empresa siguen la ley gamma = 600 y = 50.
a) Determine los parmetros y .
b) Es creble que existen muchos ingenieros con ingresos mayores a 35000.

52

RESPUESTA:
a) = = 30 000
2 = 2 = 1500 000 =1225 Concentracin 300001225 de 28775 a 31225
Como funcin de ajuste se emplear el T.CH.
b) k = 5 000, k= 4.08 para
Px 35 000 = 1 1/(4.08*4.08)
= 0.94,
es decir que no es creble que ganen mas de 35 000 ya que solo el 6%
aproximadamente ganan mas de $ 35000.
La solucin por la Gamma cuando y toman valores muy altos, como es el caso
de este problema, se requerir de algn artificio matemtico, ya que al tratar de dar
solucin por mathcad el programa no da solucin por ser muy grandes los parmetros
600 y 500 como se muestra en el anexo final. Al tratar de emplear la gamma
incompleta sucede lo mismo, ya que la tabla no se define para valores altos, por lo que
la solucin practica ser el empleo del T. CH.
EJEMPLO:
En cierta ciudad, el consumo diario de energa elctrica, en millones de
kilowatts hora, es una variable aleatoria x que tiene una distribucin gamma con
unamedia = 6 y variancia 2 = 12:
. Encuentre los valores de y
. Encuentre la probabilidad de que en cualquier da dado el consumo de energa diario
exceda 12 millones de kilowatts hora.
. Datos = 6 2 = 12 = 3.46, la solucin ser:
==6
2 = 2 = 12 despejando e igualando en ambas ecuaciones:
=6/
= 12 / 2
6 / = 12 / 2
( 6 -12 ) = 0
las races sern 1 = 0 y 2 = 2 si = 6 entonces = 6/2 = 3.
Los parmetros sern:
= 3 y = 2.
. Se deja alumno resolver el segundo inciso por T. CH. Y gamma incompleta.
DISTRIBUCION EXPONENCIAL
Esta distribucin es una variante de la distribucin gamma con la condicin de
que = 1 por lo que la gamma se transforma de la siguiente manera:
f(x) = (x-1 e-x/)/0 (x-1e-x)dx
f(x) = (x1-1 e-x/)/0 (x1-1e-x)dx
f(x) = (x0 e-x/)/0 (x0 e-x)dx
f(x) = e-x//
=1 , X0

53

Los parmetros toman el siguiente valor:


=
2 = 2
= 2 =
EJEMPLO:
La duracin de horas de un CPU es una VA exponencial con = 1000.
a) Determine los parmetros asociados a la distribucin.
b) Encuentre la probabilidad de que el CPU dure mas de 2000.
c) Dure cuando mucho 1500 hrs.
RESPUESTA:
a) = = 1000
2 = 2 = 1 000 000
= 2 = 1000
b) P(x 2000) = (e x/1000/1000)dx (de 2000 hasta infinito) = -[e- - e-2]= 0.13
c) P(x 1500) = (e x/1000/1000)dx (de 0 hasta 1500) = -[e-1.5 e0]= 0.777
EJEMPLO:
Una empresa refinadora de azcar tiene 3 plantas para procesar azcar, todas
reciben azcar morena a granel, la cantidad de azcar que puede procesar cada planta
sigue una ley exponencial con un promedio de refinacin de 4 ton. Para cada una de las
tres plantas. Si las plantas trabajan en forma independiente, determine:
a) Cual es la probabilidad de refinar ms de 4 ton.
b) La probabilidad de que 2 de las 3 plantas refinen ms de 4 ton.
RESPUESTA:
a) = = 4
2 = 2 = 16
= 2 = 4
P(x 4) = (e x/4/4)dx (de 4 hasta infinito) = -[e-/4 - e-4/4]= 0.368
b) 2 de 3 plantas 4 ton. = 0.37 puede ser tratada como binomial.
x = 2, n = 3 , p = 0.37,
q = 0.63
B= 3C2 * (0.37)2(0.63)1 = 0.26

26% de probabilidad de que dos de las tres plantas refinen ms de 4 toneladas

54
.

DISTRIBUCION NORMAL O CURVA DE GAUSS

Una VAC cuya distribucin de probabilidad se presenta continuamente en la


practica es la llamada curva de Gauss y se le considera la ms importante en
estadstica.
Esta ley fue descrita inicialmente por el Francs Abraham Moivre (16671754), que en 1733 publico un folleto { approximatio add summan terminorium binnomi}
donde aparece por primera vez la curva de la distribucin de los errores, pero
finalmente el matemtico alemn Karl Friederich Gauss (1777-1854) la desarrollo y
aplico como la conocemos actualmente, consecuencia de estudiar los errores que se
producen al medir reiteradamente una magnitud. Tambin se le conoce como la
distribucin de Laplace Gauss, ya que Laplace estudio las primeras relaciones de la
ecuacin normal.
La distribucin normal es de gran aplicacin ya que muchos fenmenos que se
presentan en el estudio de las ciencias tienden hacia este comportamiento, tales como,
caracteres morfolgicos de personas, animales plantas, etc.( pesos, tallas, alturas,
dimetros, permetros, etc.); caracteres fisiolgicos ( probar igualdad de dosis de
frmacos, abonos, etc. ); caracteres sociolgicos ( consumos para grupos de edad,
calificaciones, ingresos, etc. ); caracteres sicolgicos ( cocientes intelectuales, grado
de adaptacin, etc. ); errores de medicin etc.
En la Ingeniera Civil fenmenos como la precipitacin, velocidades de punto,
resistencia del concreto, meteorologa, contaminacin ambiental, calidad del acero,
eficiencia de equipo de construccin, etc., tienden a normalidad.
La curva normal es importante ya que la generalidad de las variables aleatorias
continuas tienden a comportamientos normales, otras variables pueden ser
transformadas a normales en forma sencilla, variables que justifican pruebas
estadsticas tienden a ser normales.
La funcin densidad normal segn Gauss esta definida por la siguiente
expresin:
f(x) = [ 1/() ]e-(x-x)2/2x2
Desde - x
Conocidos y
La funcin normal tiene las siguientes caractersticas:
Es simtrica con respecto a la media
Tiene un mximo para x =
Se hace asinttica a los ejes x
El rea bajo la curva es f(x) = 1
Es una curva suavizada y acampanada
Esto obliga a que la desviacin estndar tienda a cierto valor.
Debe ser conocido y

55

Finalmente la grfica seria:


F(x)

0.5 0.5
x
l calculo de probabilidades se efecta integrando la curva de Gauss
P (a< x <b) = [1/(x)]e-(x-x)2/2x2 dx

desde a hasta b

l calculo de probabilidades por integrales resulta laborioso, pero como la curva


de Gauss es muy definida en su forma y caractersticas, se puede realizar un cambio
de base y elaborar una tabla para as calcular las probabilidades.

LA VARIABLE ESTANDARIZA Z (CAMBIO DE BASE)


Para elaborar la tabla de Gauss, pero conservando sus principios se puede hacer
un cambio de base de la siguiente manera:
Z =( x - )/x

z es la VA std.

Por lo que la funcin cambia de la siguiente manera.


f(z) = (1/x)e-z2/2
z =( x - )/x
x z = x -
dx = x dz
f(z) = (1/x)e-z2/2x dz (desde a hasta b)
Para esta funcin se tabula la curva de Gauss. Para cumplir los requisitos es necesario
que:
f(x)
f(z)
z
x1
x2
z
z z
z
z1

x z2

56

EJEMPLO:
Los resultados de 500 exmenes de admisin en una universidad, segn el
tratamiento estadstico presento una tendencia normal, encuentre la probabilidad de
que un alumno tomado al azar y que haya presentado el examen haya obtenido
a) cuando mucho 80
b) cuando menos 70
c) entre 70 y 80
d) por lo menos 78
e) cuando mucho 71
f) entre 77 y 82
g) 80 puntos
h) por lo menos 75
i) cuando mucho 72 y cuando menos 78
Determine adems l numero de alumnos que estn en los anteriores rangos, si
consideramos que los parmetros estadsticos fueron una media de 75 ( = 75) y una
desv. Std de 10 ( = 10).
El alumno emplear la tabla normal y elaborar la grfica respectiva.
Respuestas
a) P(x 80)
z = x - / = 80 75/10 =
P(x 80) = 0.5 + 0.1915 = 0.6915
N = (0.6915)(500) = 346
b) P(x 70) = 0.6915
z = 70-75/10 = -1/2
N = 346
c) entre 70 y 80
P(70 x 80) = .383
z1 = 70 75/10 = -1/2
z2 = 80 - 75/10 =
N = 192
P(70 x 80) = 2(0.1915)
d) por lo menos 78
z = 78 75/10 = 0.3
P(x 78) = 0.5-0.1179 = 0.3821
N = 0.3821*500 = 191 alumnos

57

e) cuando mucho 71
z = 71-75/10 = -0.4
P(z 71) = 0.5 0.1554 = 0.3446
N = 172
f) P(77 x 82)
z1 = 77-75/10 = 0.2 0.0793
z2 = 82-75/10 = 0.7 0.2580
P = 0.258 0.0793 = 0.1787, N = 89
g) 80 puntos no es posible, hay que definir un intervalo.
Por ejemplo
P(79 x 81) o bien P ( 79.9 < x < 80.1 )
Ya que se trata de una integral definida por un intervalo y no puntual.
h) por lo menos 75
P(x 75) = 0.5
Z=0
N = 250
i) P(78 x 72)
Z1 = 78 75/10 = 0.3
Z2 = 72 75/10 = -0.3
P(78 x 72) = 1 (2*0.1179) = 0.7642
N = 382
j) Menos de 20
P(X 20) = TIENDE A CERO
Z= 20-75/10 = -5.5
k)P(X 20) = TIENDE A UNO
EJEMPLO:
En una fabrica de arandelas se ha encontrado que su espesor se distribuye
normalmente con una media de 2.2 mm y una desviacin estndar de 0.15mm. Qu
porcentaje de arandelas ser rechazado si no se aceptan espesores:
a) mayores a 2.5mm
b) mayores a 2.5mm pero ni menores a 2.15mm
c) que porcentaje ser aceptado si se rechazan espesores mayores a 2.3mm
El alumno usar la tabla normal y elaborar la grfica :

58

RESPUESTA:
a) z = 2.5 2.2/0.15 = 2
% rechazado = 0.0228
b) P(2.5 x 2.15)
Z1 = 2.5 2.2/0.15 = 2
Z2 = 2.15 2.2/0.15 = -0.333
% rechazado = 0.3935
c) P(x 2.3)
Z = 2.3 2.2/0.15 = 0.677
% aceptado = 0.5 + 0.2486 = 0.7486
cambio la variable aleatoria a aceptacin de las arandelas.

AJUSTE DEL CASO CONTINUO AL DISCRETO


El clculo de la Binomial resulta muy laborioso cuando se calculan
probabilidades acumuladas con la condicin de que n es muy grande, pero si se
respetan ciertas condiciones mnimas se podra aplicar la curva de Gauss al caso
Binomial y de Poisson siendo mucho mejor el ajuste en cuanto el valor de n sea mucho
mas grande.
Las condiciones sern las siguientes:
np > 5
nq > 5

para p 0.5
para p > 0.5

Los parmetros que se tomaran son:


= np
= npq
EJEMPLO:
Un dado se lanza al aire 1000 veces. Encuentre la probabilidad de que la cara 3 caiga...
a) Entre 150 y 180 veces.
b) Por lo menos 175
c) Cuando mucho 120
El alumno emplear la tabla normal y elaborar la grfica:
RESPUESTA:
Binomial : p = 1/6, q = 5/6, n = 1000
Pero como a),b),c) son probabilidades acumuladas muy laboriosas, entonces se
revisar un ajuste normal: np=167>>5 y p=1/6< 0.5, ok ajuste normal.

59

a) P(150 x 180)
= np = 1000*1/6 = 167
= npq = 11.8
z1 = 150 167/11.8 = -1.44
z2 = 180 167/11.8 = 1.10
P(150 x 180) = 0.4251 + 0.3643 = 0.7894
b) P(x 175)
Z = 175 167/11.8 = 0.68
P(x 175) = 0.5 0.2517 = 0.2483
c) P(x 120) tiende a 0%
Z = 120 167/11.8 = -3.98
Los valores mayores a z=3 cubren un rea acumulada de .4999 por lo que se podr
aceptar tendencias al 0% o al 100%, segn la prueba solicitada.

60

LA ESTADSTICA (Parte 3).


Introduccin
Actualmente las tcnicas estadsticas son utilizadas en casi todas las ramas de
las ciencias, desde las exactas hasta las sociales pasando por las astronmicas,
mdicas y biolgicas entre otras. Las tcnicas utilizadas van desde los simples
promedios y desviaciones estndar hasta modelos de pronsticos de series de
tiempos. Algunas veces dichas tcnicas son utilizadas sin darse cuenta, como es el
caso en la evaluacin de jugadores de Base Ball (promedio de bateo por jugador,
promedio de carreras limpias por juego para un pitcher, etc.).
La razn fundamental por la cual se utilizan las tcnicas estadsticas es para
toma de decisiones cuando no se tiene informacin completa de los hechos, o cuando
se desea efectuar un pronstico sobre la base de datos histricos, es decir cuando
existe un grado de incertidumbre.
Mientras ms informacin se tenga al momento de efectuar una decisin, es
ms posible que dicha decisin sea mejor para la persona que la toma. De cualquier
manera aun teniendo una informacin perfecta se corre el riesgo aunque en menor
grado de tomar una decisin incorrecta.
La Estadstica trata con:
Coleccin, resumen y presentacin de datos.
Inferencia estadstica de universos a partir de muestras.
Anlisis de relacin de dos o ms variables.
Pronsticos y tendencias.
Diseo de Experimentos.
Aunque las tcnicas de la estadstica son utilizadas en diferentes ramas de las
ciencias, la mayora de estas tcnicas son simples y comunes a todas las ramas de
aplicacin.
CASOS.
En este punto se describen algunos problemas que pueden ser resueltos usando
tcnicas estadsticas.
Un grupo de Investigadores de la Universidad Autnoma de Nuevo Len
(UANL), est efectuando un estudio de transporte y se desea encontrar el nmero
promedio de ocupantes por automvil en la ciudad de Monterrey en los viajes que se
efectan entre las 7:30 a.m. y las 18:00 p.m.
Un grupo de Investigadores mdicos en la Ciudad de Guadalajara, ha
desarrollado una frmula para evitar las caries dentales en los nios y desean probar
dicha frmula. La Dependencia de Desarrollo Integral de la Familia (DIF) de la ciudad,
ha aceptado colaborar con los investigadores para llevar a cabo dicha prueba y se ha
aceptado aplicar la medicina con la frmula especial a un nmero de nios de

61

diferentes edades, de diferentes escuelas. Se requiere saber el nmero de nios a los


que se les aplicar la medicina as como la forma en que sern seleccionados.
Se requiere pronosticar la poblacin del rea metropolitana del Distrito
Federal de Mxico para el ao de 2005, con el fin de calcular los requerimientos de
infraestructura, vveres y servicios para dicho ao.
En la Facultad de Agronoma de la UANL, se va a experimentar con diferentes
raciones alimenticias para aves y determinar el efecto sobre la ganancia de peso
obtenida usando las diferentes raciones alimenticias. Se requiere saber el nmero de
pruebas que se van a efectuar con cada tipo de racin alimenticia.
Un instructor en el curso de matemticas avanzadas, desea saber qu mtodo ha dado
mejor resultado en la particin de dicha materia en la Universidad de Guadalajara. Los
mtodos son: impartir la clase; Muy estricto, regularmente estricto, o poco estricto.
Tales mtodos han sido llevados a cabo por el instructor y se cuenta con las
calificaciones obtenidas por alumno en cada uno de los grupos.
En la empresa Compaa Nacional de Subsistencias Populares (CONASUPO) se
ha desarrollado un nuevo envase de leche y se desea saber si dicho envase tendr
aceptacin de los clientes.
VARIABLES DISCRETAS Y CONTINUAS.
Una variable es aquella que puede tomar algn valor en un determinado rango de
valores tales como peso, velocidad, nmero de integrantes de familia, etc. Las
variables pueden ser continuas o discretas. Las continuas son aquellas que pueden
tomar cualquier valor entero o fraccionario en un intervalo, por ejemplo: altura, peso,
presin, etc. Por otro lado, algunas variables pueden tomar slo valores enteros como
nmero de ocupantes por carro, boletos vendidos de cine, etc., a dichas variables se
les conoce como variables discretas.
RECOLECCION DE LA INFORMACION.
Cuando se requiere informacin de tipo estadstico, lo ms probable es que se
tenga que recolectar de diferentes fuentes. Las informaciones pueden ser recabadas
ya sea de fuentes privadas o pblicas. De hecho existen ciertas entidades
gubernamentales y organizaciones internacionales que se encargan de recolectar,
clasificar y presentar informacin al pblico, tal es el caso de los censos que en la
mayora de los pases son efectuados por el gobierno correspondiente y en algunos
casos el mismo es asesorado por organizaciones como la Organizacin de Naciones
Unidad (ONU) o la Organizacin de Estados Americanos (OEA) y por el INTERNET.
Puede suceder que la informacin que se requiere no se encuentre disponible y
en tal caso se tenga que recolectar por medio de observaciones, encuestas u otro
mtodo.
ABUSOS DE LA ESTADISTICA.
Existen situaciones en que se puede llegar a conclusiones incorrectas debido a
informacin estadstica incompleta o mal generada, o a una falta de habilidad en el

62

manejo de las herramientas estadsticas, o a una mala voluntad para manejar y


presentar la informacin de tal manera que represente una situacin diferente a la
real, por ejemplo:
A)
Suponga que existen dos regiones A y B. La regin A es de clima extremoso con
temperaturas de 0 a 3 grados centgrados en tiempo de fro y de 40 a 45 grados en
tiempo de calor. Por otra parte la regin B es de clima templado durante todo el ao y
su temperatura vera de 15 a 25 grados centgrados durante todo el ao. Si se obtiene
el promedio de temperatura diaria durante todo el ao lo ms probable es que las dos
regiones A y B tengan un promedio de alrededor de 20 grados centgrados, con lo cual
se podra creer si no se conocen bien dichas regiones que tienen climas similares.
B)
Suponga que existe una empresa con veinte trabajadores y cuatro empleados.
Cada trabajador gana $500.00 diarios y cada empleado gana $3000.00 diarios. Si se
obtiene el total de salario diario del personal de la empresa, ser (20 x 500.00 / 4 x
3000.00) = $22,000.00 si se obtiene el salario diario promedio por persona ser
$916.66. Dicha cantidad es casi dos veces de lo que en realidad gana la mayora de los
trabajadores.
C)
La empresa ASTRALPO produjo 50,000 bolsas de medio kilo de arroz en el mes
de enero y 47,800 en el mes de febrero. En primera instancia se puede creer que
durante el mes de febrero se trabaj con mayor ineficiencia que en enero, sin
embargo sucedi lo contrario ya que la produccin diaria promedio durante enero fue
de (50,000/31) = 1,612.9 bolsas, mientras que en febrero fue de (47,600/28) = 1,700
bolsas.
As como los casos antes indicados se podran agregar muchos otros, un gran
nmero de ejemplos de uso incorrecto de datos estadsticos ha sido publicado, pero
para entender lo que est incorrecto se debe de conocer el mtodo preciso de
efectuar el anlisis estadstico.
DISTRIBUCIONES EMPRICAS DE UNA VARIABLE O ESTADSTICA.
La nocin de estadstica se deriva originalmente del vocablo estado
estadstica ya que ha sido tradicional que los gobiernos lleven a cabo registros de
poblacin, nacimientos, muertes, cosechas, impuestos, etc., y de contar y medir estos
hechos, genera mucha clase de datos numricos. La persona comn percibe la
estadstica como una columna de cifras o grficas (en libros, revistas, peridicos,
boletines, etc.) este concepto se aproxima mucho al concepto tradicional de la
estadstica.
Desde los comienzos de la civilizacin han existido formas sencillas de realizar
estadsticas utilizando smbolos en pieles, rocas, palos de madera y paredes de cuevas
y as contar personas, animales o ciertas cosas. Los romanos fueron los primeros que
recopilaron gran cantidad de datos.
Con la generalizacin del mtodo cientfico en el siglo XIX, los investigadores
aceptaron la necesidad de reducir a valores numricos para evitar la ambigedad de
las descripciones verbales.

63

La funcin principal de las estadsticas es la de plantear principios que nos


ayuden en las tomas de decisiones frente a las incertidumbres. La estadstica ha
llegado a ser un instrumento cotidiano para todo tipo de profesionales que estn en
contacto con datos cuantitativos que se extraen conclusiones de ellos. La
probabilidad es la base sobre la cual descansa la basta estructura de la estadstica
moderna.
CONCEPTOS DE ESTADSTICA
Consiste en la recopilacin, organizacin, anlisis, resumen y presentacin de
datos numricos, los cuales se pueden obtener de muy diversas fuentes (boletines,
INEGI, BAN-MEX, IND Y COM. y otros, encuestas, entrevistas, etc.). Al recabar la
informacin debe tenerse un objetivo de estudio por lo que deber consultarse a un
profesional de la estadstica antes de llevar a cabo la recoleccin, ya que ha pesar de
tener una gran masa de informaciones quizs estas no nos proporcionen ninguna
informacin til.
CLASIFICACIN DE LA ESTADSTICA
Cuando la estadstica tiene como objetivo la de efectuar nicamente el
tratamiento de los datos, pero sin llegar a generalizaciones se le denominara
estadstica descriptiva. La estadstica que pretende obtener conducciones del
tratamiento de los datos despus de haber estudiado una muestra representativa del
conjunto total de datos posibles llamado poblacin, es decir obtener conclusiones por
el estudio de muestras basndose en una cierta confianza, se le denominara inferencia
o inductiva.
TRATAMIENTO DE DATOS estadstica descriptiva
Al conjunto de los datos observados en el experimento se le conoce como
muestra. Los datos se clasifican como de seccin transversal, cuando se renen en un
instante dado para un problema dado, y datos en serie de tiempo cuando se colectan
en un periodo de tiempo determinado.
Los datos pueden ser cualitativos o cuantitativos, ya sea que la variable del
experimento asuma valores numricos que posean un orden inherente por ejemplo:
pesos, dimetros, velocidades, etc., se llaman cuantitativos. Cuando los datos indican
que la variable pueda tomar valores que asignen a uno u otro conjunto de clases, se
llaman cualitativos.
Por ejemplo: (buenos malos)(defecto no defecto)(llueve no llueve), los
datos tambin pueden ser: univariables y Bivariables. multivariables, segn l numero
de variables que se manejan simultneamente.

64

LA ESTADSTICA DESCRIPTIVA. univariables


El tratamiento de datos estadsticos se lleva a cabo segn los siguientes pasos:
--Toma de datos: es la obtencin de una coleccin de los mismos, los cuales no han sido
ordenados numricamente. La coleccin debe llevarse a cabo con un objetivo definido
y con una tcnica apropiada.
Se basa fundamentalmente en el Diseo Experimental.
--Ordenacin: colocar los datos en orden creciente o decreciente.
--Rango o amplitud (A).
Diferencia entre el mayor y el menor de los valores.
--Numero de grupos clases (n): es el nmero de paquete en los cuales debern de
estar incluidos todos los datos, los estadsticos recomiendan trabajar entre 8 y 20
clases, se recomienda emplear la tabla en base a la formula de H.A. Sturges.
(Anlisis en series de frecuencias)
(Como mnimo se recomienda 5 datos por clase).
--Determinacin del intervalo de clase o anchura del intervalo (c = A/n) se refiere a
los limites que se debern de dar para mantener el mejor agrupamiento, se
recomienda cerrarlos a nmeros enteros, por tanteos se determina el intervalo o
anchura mas apropiado.
--Lmites de clase: definido el intervalo asignar numricamente los lmites de
intervalo, de tal manera que los datos tiendan a concentrarse hacia la parte central.
Se recomienda dar los lmites de manera que todo dato quede comprendido en un
intervalo, por lo que los lmites se propondrn a la siguiente unidad inferior. Se
recomienda que el primer dato quede a la mitad del primer intervalo y as definir el
primer limite, pero segn las necesidades de concentracin esta recomendacin se
podr modificar.
Marca de clase (Mci): es el punto medio del intervalo, este valor se supone es el
que representa a todos los datos del intervalo.
Frecuencia de clase (fi): es l nmero de datos comprendidos en el intervalo,
debe considerarse que las colas tendrn pocos datos. Para evitar errores de
dispersin se recomienda tener por lo menos cinco datos en cada frecuencia.
Histograma: es un grfico de barras de limites Vs frecuencia.
Frecuencia relativa: es el porcentaje de frecuencia parcial (fi/No. de datos) *
100 ( fi/ fi ) * 100.

65

Polgono de frecuencias relativas: se obtiene sobre el histograma al unir todas


las marcas de clase. En este paso se acepta o se rechaza el tratamiento, atendiendo a
las irregularidades del polgono con respecto a lo normal. En caso se rechazo se
volver a los pasos iniciales para hacer las nuevas propuestas de clases, limites,
intervalos.
Frecuencias acumuladas: es la suma de frecuencias relativas con respecto al
lmite superior de cada clase.
% Frec. Acum., es el % de (Fi / fi) * 100
Polgono de frecuencias acumuladas (ojiva): es el grfico de lmites inferiores
Vs % Frecuencias acumuladas. La ojiva permite definir tratamientos normales al tener
forma de una integral suavizada, tambin nos permite el clculo de probabilidad
asociado a las muestras.
Clculos de los parmetros de tendencia central y de dispersin
representativas de la muestra o poblacin y del tratamiento aceptado a las propuestas
hechas en el tratamiento de los datos.
Los pasos anteriores cubren la estadstica descriptiva a la cual se le aplicara la
estadstica inferencia.
El tratamiento representativo ser consecuencia de varios tanteos, donde el
estadstico impondr las condiciones a los datos, en beneficio de la mejor
concentracin y comportamiento deseado a la campana.
TABLA 1: Nmero de clases para usar en la construccin de una distribucin de
frecuencias.
Una de las tcnicas ms comnmente usadas para organizar y resumir los datos
es agrupar los datos en forma de una distribucin de frecuencias. Uno de los primeros
puntos a considerar, cuando se van a agrupar ciertos datos, es cuntos intervalos van a
incluirse. Muy pocos no son convenientes, debido a que hay prdida de informacin. Por
otra parte, si se usan demasiados intervalos no se logra el objetivo de la sntesis. La
mejor gua en relacin con lo anterior, as como para otras decisiones que deben
tomarse al agrupar los datos, es el conocimiento que se tenga de ellos. La tabla 1
provee una gua para el nmero de intervalos (o clases) para usar en construir una
distribucin de frecuencias.
Los resultados son en base a una frmula dada por H.A. Sturges y segn esta frmula
el nmero de intervalos esta dado por :
K = 1 + 3.322 log10 n

66

De la anterior frmula se genera la siguiente tabla:


Nmero de casos
a tabular
15 30
60
100
200
500
1000
2000
4000
8000
15000
35000
70000
150000
300000
500000

29
- 59
- 99
- 199
- 499
- 999
- 1999
- 3999
- 7999
- 14999
- 34999
- 69999
- 149999
- 299999
- 499999
en adelante

Nmero aproximado de
Clases que se deben
utilizar
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

Ejemplo:
Dados los siguientes datos sobre precipitaciones pluviales media anual en el
D.F. y segn el observatorio metereolgico de Tacubaya efectu el tratamiento
estadstico de los datos, de modo que se aproxime lo ms posible a una Distribucin
Normal y que permita calcular sus parmetros representativos y as poder efectuar
inferencias y tomar decisiones.
Toma de datos:
Ao
1890
1891
1892
1893
1894
1895
1896
1897
1898
1899
1900
1901
1902
1903
1904
1905
1906
1907
1908
1909

precip. mm.
711
726
538
659
473
650
566
721
674
667
670
583
555
617
860
513
654
738
591
504

Ao
precip. mm.
Ao
precip.
1910
451
1930
1911
561
1931
829
1912
646
1932
1913
706
1933
1914
810
1934
1915
397
1935
1916
580
1936
1917
552
1937
1918
702
1938
1919
750
1939
1920
725
1940
1921
692
1941
1922
802
1942
1923
639
1943
1924
714
1944
1925
958
1945
1926
856
1946
1927
744
1947
1928
784
1948
1929
734
1949

mm.
813
762
679
737
764
704
856
760
739
646
882
637
615
731
460
675
604
743
520

67

2) Ordenacin de datos.
958 882 860 856 856 829 813 810
764 762 760 750 744 743 739 738
731 726 725 721 714 711 706 704
679 675 674 670 667 659 654 650
639 637 617 615 604 591 583 580
552 538 520 513 504 473 464 460
3) Rango o Amplitud
A = Mayor - Menor = 958 397 = 561
4) n = 10 se dispersan y se propone n = 8
5) Intervalo de clase

802
737
702
646
566
451

784
734
692
646
555
397

c = A/n = 561/8= 70.125 se propone

c = 80

De acuerdo a la propuesta de n=8 y c= 80, se define el primer limite de la


primera clase de manera que quede lo mas centrado posible al primer intervalo: limite
inferior de la primera clase 349.5.
Tabla de anlisis
Limites
Inf sup

marca de
clase Mci

349.5-429.5

389.5

1.7

1.7

429.5-509.5

469.5

8.3

10.0

509.5-589.5

549.5

13.3

14

23.3

589.5-669.5

629.5

12

20.0

26

43.3

669.5-749.5

709.5

20

33.3

46

76.6

749.5-829.5

789.5

15.0

55

91.6

829.5-909.5

869.5

6.7

59

98.3

909.5-989.5

949.5

1.7

60

60

100

SUMAS

frecuencia frecuencia
frecuencia
de clase fi relativa %fi acum. Fi

% Fi

100.0

68

Con la anterior informacin se grafican:


. Histograma, grfico de lmites vs- frecuencia de clase fi
. Polgono de frecuencias relativas, se grafica sobre el histograma.
. Ojiva, grfica de lmite inferior vs- frecuencia acumulada Fi
De la forma que presente los anteriores grficos se podr ir aceptando una tendencia
a una distribucin normal: histograma y polgono de frecuencia de formas acampanadas
simtricas, ojiva de forma semejante al smbolo de integral pero de forma suavizada.

Histograma
Limites - vs - Frecuencia de clase fi

Frecuencia
de Clase
(fi)

25
20
15
10
5
0
429,5 509,5 589,5 669,5 749,5 829,5 909,5

69

Limite inferior vs - % Fi

100

% Fi

80
60
40
20
0
349.5 429.5 509.5 589.5 669.5 749.5 829.5 909.5
Limite Inferior

PARMETROS DE TENDENCIA CENTRAL:

70

En la mayor cantidad de los fenmenos estadsticos los datos tienden a


acumularse o a concentrarse hacia la parte central de las frecuencias respectivas. Los
parmetros de tendencia central tienen como finalidad representar a la masa de dato
en el punto donde hay ms concentracin.
Los parmetros que se utilizan con ms frecuencia son los siguientes:
La media aritmtica (x).
La mediana (Md)
La moda el modo (Mo)
Medias:
Cuadrtica ( Q)
Geomtrica (G)
Armnica (H).
LA MEDIA ARITMTICA:
La media aritmtica (x): es la ms comn y til medida de tendencia central y
corresponde al 1er momento con respecto al origen. La media es representativa cuando
los polgonos de frecuencia sean de forma acampanada y se identifica con el punto de
mayor concentracin. Para comportamientos donde la media no corresponde al punto
de mayor concentracin, es decir comportamiento no acampanado, la media quizs ya
no puede ser buen parmetro por lo que se emplean otros que pueden sustituirle, tal
como la mediana y la moda.
Para una serie de datos la media es un valor que multiplicado por l numero de
trminos de la sumatoria de todos los trminos de la serie:
nx = xi
para datos aislados:

x = xi
n

Para datos agrupados en serie de frecuencias, se considera que la Mci


representa a todos los datos del intervalo es decir, se repite (fi) veces, por la formula
se transforma en la siguiente:
X = fi * Mci
fi
Para datos agrupados en series de frecuencias.

Formula corta para la media

71

Si c = cte (ancho de intervalo), se deduce la siguiente formula corta: para la


media aritmtica:
fi

cdi
Mci
Z = Mc cualquiera elegida de partida.

x
di = N de intervalos

-Z + Mci = cdi Mult. Por fi


-fiz + fi Mci = fi cdi

dividido por fi

-fiz + fi Mci = fi cdi


fi
fi
fi
simplificando
-Z + fi Mci = fi cdi
fi
fi
x

x = c fi * di
fi

despejando x

+ Z

CARACTERSTICAS DE LA MEDIA
Tiene su mayor aplicacin para comportamiento acampanados simtricos.
Es un valor calculado.
Todos los valores intervienen en su clculo.
Es muy afectada por valores extremos disparados.
La suma de las desviaciones con respecto a dicho valor 0.
(xi x) 0
La suma de los cuadrados de las desviaciones es un mnimo
(xi x)2 mnimo

LA MEDIANA:

72

La mediana (Md): es valor del termino colocado a la mitad de la serie cuando los
datos han sido ordenados de acuerdo a su magnitud, por lo que el 50% de los datos
ser mayor igual que la mediana y el 50% menor o igual que la mediana.
La posicin de la mediana (T), para datos nones se obtiene por la formula T = (n
+ 1)/2 pero cuando son muchos datos ser: T = n/2.
Ejemplo: 1, 2, 3, 4, 5 Md = 3
X = 15/5 = 3

1, 2, 2, 4, 5 Md = 2
X = 14/5 = 2.8

Para datos agrupados en serie de frecuencias se puede considerar que la


mediana se calcula partiendo de la tabla de frecuencias acumuladas.
c
Md
T-Fi
T

Fs

Fi

Li

Fi , Fs Frecuencias Acumuladas a la clase Md.


Li , Ls limites de la clase Md.
Md = Li + x
x
c

T fi Fs Fi

T posicin

X c

T Fi
Fs Fi

T Fi
Fs Fi

Md Li c

CARACTERISTICAS DE LA MEDIANA

73

Se utiliza en lugar de la media cuando los comportamientos no son


acampanados o simtricos.
Es un valor de posicin, es decir, es un valor geomtrico.
Es afectado por l nmero de trminos de la serie, pero no por valores
extremos.
Cualquier trmino seleccionado al azar tiene la misma probabilidad de caer
arriba o debajo de la mediana.
CUARTILES, DECILES, PERCENTILES
(Medidas de posicin no central).
La media divide a la serie de frecuencias en dos partes iguales, los cuartiles en
4 partes, los deciles en 10 partes y los percentiles en 100 partes, se calcula usando la
misma formula de la mediana y donde nicamente varia T.Son valores que se aplican a
diferentes casos estadsticos.
LA MODA:
La moda, es el valor que ms se presenta en forma frecuente en una serie de datos.
Ejemplo:
1, 2, 3, 4, 5 x = 3 Md = 3
Mo = multimodal
1, 2, 2, 4, 5 x = 14/5 = 2.8.

Mo = 2 Md = 2

Para datos en serie de frecuencias la moda se localiza en el pico del


Histograma, por lo que al hacer el tratamiento de datos deber de evitarse varios
picos que haga multimodal la grfica, es decir es deseable que sea unimodal.
La moda coincidir con la marca de clase, siempre y cuando las frecuencias
parciales anterior y superior sean iguales, en caso de que no sea as; el punto se
localiza hacia donde exista mayor frecuencia.

fi = fs

fi

fs
Mo = Mci

fs > fi
fi

fs
Mo

74

fi > fs
fi

fs
Mo

DEMOSTRACION:
c

Mo = li + x
Mo

li

fi

fs

fi

c-x

fs

fi(x) = fs (c x)
x(fi + fs) = c fs

fs
fi

fs

x = c

fs
fi

fs

Mo = li + c

CARACTERISTICAS DE LA MODA
Se utiliza en lugar de la media cuando el comportamiento no es suficientemente
acampanado.
Es la medida ms tpica y descriptiva.
CONCLUSIONES: si la curva de frecuencias es normal (aproximada).
X Md Mo, pero si hay sesgo entonces:

Mo Md x
Sesgo o cola a la derecha

x Md Mo
sesgo o cola a la izquierda

Junto a los parmetros media, mediana y moda, se acostumbra calcular otros


parmetros de tendencia central, aunque son poco usuales, y son la media cuadrtica ,

75

la media geomtrica y la media armnica y que bsicamente se obtienen como una


variante de la media aritmtica.
La media cuadrtica ( Q ) :
Se obtiene como la raz cuadrada del promedio de los cuadrados de los trminos de la
serie, o es el resultado de elevar al cuadrado todos los valores observados de la
variable, obtener su media aritmtica y obtener la raz cuadrada de dicha media.
Q = [ x2 / n]
Para datos agrupados en serie de frecuencias ser:
Q = [( fi MCi 2) / fi]
Q se utiliza cuando la variable toma valores positivos y negativos y se emplea
para calcular el promedio sin efectos de signo p.ej. errores de medidas y aplicaciones
fsicas (RSM). En su clculo intervienen todos los valores, es un valor calculado, es
nica para cada distribucin y se define por una expresin algebraica. Es poca
representativa ante la presencia de valores extremos.
La media Geomtrica (G):
La G se obtiene como la raz ensima del producto de los n trminos de una
serie, trminos positivos y no nulos:
G = (X1 . X2 . X3 .............. Xn) 1/n log G = [log X1 + ......... + log Xn]/n
Para datos agrupados en serie de frecuencias:
Log G = [ fi log MCi ] / fi
La G es aplicable para promediar razones, tasas de variacin e ndices
econmicos (inters anual, inflacin) donde el valor de cada ao tiene un efecto
multiplicativo de aos anteriores. Para promediar tasas de crecimiento de una
poblacin estadstica, en general e los casos donde la variable presenta variaciones
acumulativas.
La ventaja de la G es que en su clculo intervienen todos los datos, es nica, es
menos sensible a valores extremos que la media aritmtica, se define por una
expresin. La desventaja es que su valor es menos intuitivo que la media aritmtica.
La media armnica H:
La H es el inverso del promedio de los inversos de los trminos:
1/H =[ 1/xi] / n
1/H = [ fi ( 1/ MCi ) ] / fi
La H tiene su aplicacin cuando los datos se expresan segn una relacin con alguna
unidad p.ej. km/hr, lts/seg, etc. Puede ser mejor que la media aritmtica, es
influenciada por valores pequeos, no acepta datos nulos.
Relacin entre medias H G X Q .

PARMETROS DE DISPERSIN

76

Un parmetro de tendencia central es de escaso valor, si no se conoce el grado


en que los datos se dispersan en dicho valor medio.
Existen una serie de parmetros que representan la dispersin de las series de
frecuencia tomando como base el parmetro de tendencia central elegido, dichos
parmetros son lo siguientes:
Amplitud (A)
Desviacin media (D.M)
Variancia o Desviacin estndar (S2, S)
Coeficiente de variacin (C.V.)
AMPLITUD:
La amplitud es la ms simple de las medidas de dispersin, se obtiene por la
diferencia del valor mayor menos el valor menor, no es un parmetro muy efectivo ya
que dos series con diferente dispersin puede tener la misma amplitud. Bsicamente
se toma como una medida de referencia.
Por ejemplo: Dados los siguientes datos de temperatura,
18, 21, 23, 23, 24, 24, 24, 25, 25, 27, 29, 30. Amplitud = 30 18 = 12
18, 18, 18, 19, 19, 19, 19, 24, 27, 30, 30. Amplitud = 30 18 = 12
Aunque tienen la misma amplitud, las series tienen diferente dispersin y no
corresponden a una situacin semejante.
DESVIACIN MEDIA:
La desviacin media, se obtiene como el promedio de los valores absolutos de
las desviaciones de los trminos con respecto al parmetro central elegido. Para datos
aislados se define de la siguiente manera:
DM = xi - x
n
Para datos agrupados en serie de frecuencias ser :
DM = fi x Mci
fi
El anlisis puede ser con respecto a la x, Md o Mo.
Siempre se obtendr que la desv.std. es mayor a la desv. Media, por lo cual se
considera a la desv. Std. Como un parmetro mas crtico para medir la dispersin por
eso es preferible a las desv. Media.

LA VARIANCIA O DESVIACIN ESTNDAR:

77

La variancia o desviacin estndar, es la medida fundamental de dispersin y se


obtiene como la media cuadrtica de las desviaciones de los trminos de una serie con
respecto al parmetro central elegido que generalmente es la media aritmtica.

S2 = fi (x Mci)2
fi
Empleando el mismo criterio que para la media aritmtica, se pude deducir en
forma matemtica una formula corta de la siguiente manera:
S c

fi ( di ) 2 fidi


fi
fi

UNA MEDIDA DE NORMALIDAD:


La desviacin estndar tiene su sentido prctico para medir la normalidad de
una serie de frecuencias en funcin de un teorema y de una regla emprica, que
permite definir la concentracin del comportamiento del tipo acampanado.
El teorema de Tchebysheff: indica que dado un numero K 1 y un conjunto de
n observaciones, por lo menos (1 1/k 2) de las observaciones se encuentre dentro de
K desviaciones Standard de la media. El teorema se aplica a cualquier conjunto de
observaciones y se puede referir tanto a la muestra como a la poblacin. Este teorema
se puede ilustrar en forma grfica en de la siguiente manera:
Y
Al
(1-1/k2)
X

k k

Si se toman algunos valores de K se obtendr la siguiente tabla:


K

1-1/k2

x ks

x S

3/4

x 2S

8/9

x 3S

78

Para el caso de K=1 se puede considerar una concentracin de al menos 2/3.


Este teorema es muy conservador ya que contempla el concepto al menos, ya
que generalmente la fraccin de las observaciones que caen en el intervalo (1-1/k 2)
excede dichos valores por lo que se acostumbra complementar este teorema con regla
emprica, la cual describe con cierta precisin la variabilidad de una distribucin en
forma acampanada con los siguientes intervalos:
xS
68.26% de las observaciones.
x 2S 95.44% de las observaciones.
x 3S 99.74% de las observaciones.
El teorema de Tchebysheff es un hecho demostrado matemticamente, la regla
emprica es una afirmacin arbitraria, ya que solo contempla que las distribuciones a
ser monticulares.

Pero la consideracin de ambos conceptos nos permite definir si una masa de


datos agrupados en series de frecuencia, tienden hacia un comportamiento de
tendencia normal, aunque la aceptacin matemtica del hecho solo es posible mediante
un anlisis de variancia a travs de la prueba chi cuadrada.
COEFICIENTE DE VARIACION
Es una medida de dispersin relativa que permite comparar las dispersiones de
distintas series de frecuencias, es una medida adimensional, se calcula por la siguiente
expresin:
CV = (s / x) * 100
Es decir indica l % que representa la desviacin standard respecto a la media.

9 10 11
CV 10%

10

13

79

30%

Mientras ms pequeo sea el CV, s tendr ms concentracin y ser ms


representativo.
El CV algunas veces carece de significacin, por ejemplo:
x = 10C
S = 1C
CV = 1/10 * 100 = 10% si se transforma a grados farenheit
F = 1.8C + 32
x = 50F
S = 33.8F
CV = 33.8/50 * 100 = 67%
Se observa como varia el C.V. para el mismo problema.
COMPROBACION DE LA NORMALIDAD
Hay varias maneras en que podemos probar si una distribucin observada tiene
aproximadamente la forma de una distribucin normal. La manera que aqu
presentaremos es cruda y en gran medida subjetiva, pero definitivamente tiene la
ventaja de que es muy fcil de llevarse a cabo.
Para ilustrar esta tcnica, nos referiremos a un ejemplo de datos de emisin de
xido de azufre. Primero convertimos las frecuencias acumulativas en porcentajes
acumulativos dividendo cada una entre 80 la frecuencia total, y multiplicando despus
por 100. Esto nos da:
Toneladas de
xidos de azufre
Menos de 4.95
Menos de 5.95
Menos de 12.95
Menos de 16.95
Menos de 20.95
Menos de 24.95
Menos de 28.95
Menos de 32.95

porcentaje
acumulativo
0.00
3.75
16.25
33.75
65.00
86.25
97.50
100.00

80
99
98
95
90
80
70
60
50
40
30
20
10
5
2
1

Antes de trazar esta distribucin porcentual acumulativa en el papel grfico


especial de la anterior figura, examinemos brevemente sus escalas. Cuando se compra
dicho papel de grfica en forma comercial, la escala porcentual acumulativa ya est
impresa en la manera especial que la hace ideal para nuestros propsitos. La otra
escala consiste en subdivisiones iguales. Esta clase de grfica se conoce como papel de
probabilidad normal o papel de probabilidad aritmtica.
Una vez que hemos trazado los porcentajes acumulativos de menos de como
en la figura anterior, usamos el criterio siguiente:
Si los puntos siguen en gran medida el patrn de una lnea recta, consideramos
que sta es una evidencia positiva de que la distribucin tiene aproximadamente la
forma de una distribucin normal.
Es evidente que en gran medida y aproximadamente no son trminos muy
precisos pero al principio sealan que sta es una tcnica cruda y en gran medida
subjetiva, aunque fcil de realizarse. El patrn ms comn en que la distribucin se
considerara como anormal es l patrn en que los puntos de la extrema derecha
caen por debajo de la lnea recta determinada por el equilibrio de los puntos.
Para fines de este curso se aceptara una tendencia a la normalidad de una serie
de datos agrupados en serie de frecuencias, cuando se cumplan las siguientes
condiciones:
. Forma acampanada y suavizada del Histograma y del polgono de frecuencias.
. Forma de integral suavizada de la grfica de la Ojiva.
. Poca variabilidad en los valores de los parmetros de tendencia central
X Md Mo Q G H
. Poca variabilidad del C.V. y en funcin de la curtosis.
. Que cumpla con el Teorema de Tshebysheff
. Que cumpla con la regla emprica.
. Que cumpla con la grfica de normalidad.

81

TABLA GENERAL DE ANLISIS


LIMITE
INF-SUP
349.5-429.5
429.5-509.5
509.5-589.5
589.5-669.5
669.5-749.5
749.5-829.5
829.5-909.5
909.5-989.5

Md

Mo

Fi26 fi12
Fs46 Mo
fs9

Mci
389.5
69.5
549.5
629.5
709.5
789.5
869.5
949.5

fi
1
5
8
12
20
9
4
1
60

%fi
Fi
1.7
1
8.3
6
13.3 14
20.0 26
33.3 46
15.0 55
6.7
59
1.7
100.0

%Fi
1.7
10.0
23.3
43.3
76.6
91.6
98.3
60

Mci(fi)
di
389.5
-4
2347.5
-3
4396.0
-2
7554.0
-1
14190.0
0
7105.5
1
3478.0
2
100.0 949.5
40410

Q
G
H
Des. Media
2
fi(Mci)
fi(logMci) fi(1/Mci) /X-Mci/fi
151710.25
2.591
0.0026
284
1102151.25
13.358
0.0106
1020
2415602.0
21.92
0.0146
992
4755243.0
33.59
0.0191
528
10067805.0
57.02
0.0282
720
5609792.25
26.08
0.0114
1044
3024121.0
11.76
0.0046
784
901550.25
2.98
0.0011
276
28027974.75 169.3
.0922
5648

-80-

fidi
-4
-15
-16
-12
0
9
8
3
-27

Desv.Std.
(X-Mci)2fi
80656
208080
123008
23232
25920
127104
153664
76176
811840

D.S.corta
fi(di)2
16
45
32
12
0
9
16
9
139

82

Hoja de clculos de los parmetros de tendencia central, de los parmetros de


dispersin y de la aceptacin de normalidad.
Media aritmtica:
X = [Mci(fi)] / fi = 40410/60 = 673.5 mm de agua.
Frmula corta para la media aritmtica:
X = z + c[(fi di)/fi = 709.5 + 80 (-27/60 ) = 673.5 mm de agua.
La media aritmtica igual a 673.5 mm de agua se elige para este caso.
La mediana:
Md = Li + c [(T Fi) / (Fs Fi)] = 669.5 + 80[(30 - 26) / (46-26)] = 685.5mm
La moda:
Mo = li + c[ fs / ( fi + fs ) ] = 669.5 + 80 [ 9 / ( 12 + 9 ) ] = 703.78 mm.
La media cuadrtica:
Q = [ fi (Mci) ] / fi = 28027974.75/60 = 683.47 mm.
2

La media geomtrica:
Log.G = [ fi (log Mci)] / fi = 169.3 / 60 = 2.822
G = antilog. 2.822 = 663.74 mm.
La media armnica:
1/H = [fi ( 1 / Mci )] / fi = .0922 / 60 = 0.00154 H= 650.76 mm.
La desviacin media:
D.M. = fi X Mci / fi = 5648 / 60 = 94.13 mm.
La desviacin estandard:
S = [ fi (X Mci) ] / fi = 811840/60 = 116.32 mm.
2

Frmula corta para la desv std.


S = c [( fi di ) / fi] - [( (fi di)/ fi)2] =
S = 80 (139/60) - (-27/60)2 = 116.32 mm.
2

Se observa que la D.M. es menor que la S: 94.13 < 116.32


El coeficiente de variacin:
C.V. = (S / X) 100 = 116.32 / 673.5 = 17.27%.

T. de Shebysheff y regla emprica:

83

X 1S
X 2S
X 3S

673.5 116.32 de 557.18 a 789.82 40 datos 66.7%.


673.5 2(116.32) de 440.86 a 906.14 58 datos 96.7%.
673.5 3(116.32) de 324.54 a 1022.46 100 datos 100%.

Para cada caso T. Schebysheff exige al menos 67%, 75% y 88.9% y lo cual de
ve cumplido la funcin ser de montculo y con tendencia normal.
Par la regla emprica se exige respectivamente el 68.26%, 95.44% y 99.74%
que tambin lo cumple nuestro anlisis y ser con tendencia normal.
CONCLUSIN:
El tratamiento de los datos da como resultado lo siguiente:
X = 673.5 mm de agua.
S = 116.32 mm de agua.
Tendencia normal.
Tendencia normal ya que:
. Polgono de frecuencias e histograma de forma acampanada.
. Ojiva de forma integral suavizada.
. Similitud de medias.
. C.V. pequeo.
. Cumple con T de Schebysheff y regla emprica.
. La grafica en papel normal tiende a una recta.
Cabe destacar que la aceptacin formal matemtica la dar el anlisis de variancia a
travs de la prueba chi cuadrada.

84

Papel normal aritmtico

85

2) Ordenacin
11.4 18.0 27.0
12.2 19.4 27.4
12.6 20.2 28.0
12.6 20.4 28.2
12.6 22.2 28.4
14.0 22.6 28.8
15.8 23.0 29.2
16.2 23.6 29.8
16.2 24.2 30.0
18.0 24.8 30.2

1) Toma de Datos

44.0
36.2
15.8
29.2
35.2
12.6
30.0
56.2
45.6
42.2

35.4
38.4
28.8
40.6
56.4
27.0
45.8
24.8
37.4
42.0

28.4 37.0 46.0 35.4 19.4


49.2 31.8 86.4 12.6 27.4
38.0 44.0 38.4 74.0 23.0
49.6 30.4 12.2 123.8 42.0
31.0 45.0 90.2 100.0 39.0
47.8 52.6 41.0 40.0 28.0
18.0 41.0 22.6 24.2 89.6
12.6 53.6 125.4 16.2 39.0
18.0 50.6 103.4 52.4 20.2
16.2 108.2 44.0 42.6 39.4

Rango o amplitud
A = mayo menor = 125.4 11.4
Intervalo de Clase
C = A / N = 114 / 10 = 11.4

Limites
INF
SUP
0.5
13.5
13.5
26.5 Li
26.5
39.5Ls
39.5
52.5
52.5
65.5
65.5
78.5
78.5
91.5
91.5
104.5
104.5
117.5
117.5 130.5

20.4
14.0
11.4
47.0
37.0
23.6
90.4
40.8
64.6
37.6

56.4
39.4
39.8
32.4
49.4
37.6
43.0
33.6
22.2
41.4

A = 114

20

30.4
31.0
38.0
32.4
33.6
35.2
35.4
35.4
36.2
37.0

37.0
37.4
37.6
37.6
37.8
38.0
38.4
38.4
39.0
39.0

39.2
39.4
39.4
39.4
39.4
39.8
40.0
40.4
40.6
40.8

41.0
41.0
41.4
42.0
42.0
42.2
42.6
43.0
43.2
44.0

44.0
44.0
45.0
45.6
45.8
46.0
47.0
47.8
49.2
49.4

49.6
50.6
52.4
52.6
53.6
56.2
56.4
56.4
60.0
64.6

74.0
86.4
89.6
90.2
90.4
100.0
103.4
108.2
123.8
125.4

con n = 10

Se propone c = 13 para que el ultimo rango no contenga el valor mximo

Mci

fi

% fi

% Fi

Fi

Mcfi

7
20
33
46
59
72
85
98
111
124

5
15
35
28
7
1
4
2
1
2

0.05
0.15
0.35
0.28
0.07
0.01
0.04
0.02
0.01
0.02

0.05
0.2
0.55
0.83
0.9
0.91
0.95
0.97
0.98
1

5
20
55
83
90
91
95
97
98
100

35
-3
300
-2
1155 -1
1288 0
413
1
72
2
340
3
196
4
111
5
248
6

-15
-30
-35
0
7
2
12
8
5
12

4158

-34

100

43.2
39.4
30.2
39.2
28.2
37.8
29.8
39.4
60.0
40.4

di

fidi

Md

Mc

Fi
Fs

fi
MO
fs

fi X media mci

fi X media mci

fiMci2

filogMci

fi 1/Mci

Fidi2

245
6000
38115
59248
24367
5184
28900
19208
12321
30752

4.2254902
19.51544993
53.1479879
46.55721929
12.39596408
1.857332496
7.71767503
3.982452151
2.045322979
4.18684337

0.714285714
0.75
1.060606061
0.608695652
0.118644068
0.013888889
0.047058824
0.020408163
0.009009009
0.016129032

172.9
323.7
300.3
123.76
121.94
30.42
173.68
112.84
69.42
164.84

5978.882
6985.446
2576.574
547.0192
2124.1948
925.3764
7541.1856
6366.4328
4816.1364
13586.1128

45
60
35
0
7
4
36
32
25
72

224340

155.6317381

3.358725412

1593.8

51450.36

316

86

87

X Media = fiMci / fi
X Media = 4158 / 100
X Media = 41.58

X Media = z + c ( fiMci / fi)


X Media = 46 + 13 (-34 / 100)
X Media = 41.58
Md = Li + c (T FI / FS FI)
Md = 26.5 + 13.0 ((50-20) / (55-20))
Md = 37.96

T = fi / 2
T = 50

Mo = li + c (fs / fi + fs)
Mo = 26.5 + 13 ((28)/ (15+28))
Mo = 34.96
Q=

fiMci
fi

224340 2
47.3645437
100

log G = fi log Mci / fi


log G =155.63-100
log G =1.556317381
G = antilog 1.56
G = 36.0012339
1 / H = ( fi 1 / Mci ) / fi
1 / H = 3.35872541181298 / 100
H = 1 / 0.03359
H = 29.77319898

X MediaDeLaMedia ( X Media + Md + Mo + Q + G + H ) / 6
X MediaDeLaMedia 37.48
Rango de A = 125.4 -11.4 = 114
D.M. = fi X Media Mci fi
D.M. = 1593.8 / 100
D.M. = 15.938

S=

fi X media Mci

S=

c fidi

fi

fi

22.6862718

22.6862718

88

C.V. = (22.7 / 41.58) * 100

= 54.55188023

T.S.
K
1
2
3

X media S

% (1-1k2)
0 ~ 66%
3/4 ~ 75%
8/9 ~ 88%

Regla Emprica

X media S

68.26 %

X media 2 S

95.54 %

X media 3S

100 %

A 18.9

78

datos

78 * 100

78 %

X media 2 S

41.58 22.68
41.58 45.38

A -3.78

93

datos

93 * 100

93 %

X media 3S

41.58 68.07

A -26.5

98

datos

98 * 100

98 %

fi

-86Histograma Y Polgono de Frecuencia

40
35
30
25
20
15
10
5
0
0

Lim
10 20 30 40 50 60 70 80 90 100 110 120130 140

89

Ojiva

% Fi

0,8
0,6
0,4
0,2
0

0
Lim Sup

2
0

90

4
0

6
0

8
0

Papel normal aritmtico

91

REGRESIN Y CORRELACIN
(Anlisis bivariable y multivariable)

1
0
0

1
2
0

1
4
0

Anlisis de regresin: Es la parte de la Estadstica que investiga la relacin


entre dos o ms variables relacionadas en forma determinista, es la funcin de mejor
ajuste.
La Correlacin es una medida cuantitativa de la magnitud con la que las
variables estn relacionadas, mide la bondad del anlisis de regresin.
INTRODUCCIN:
Es muy comn que en la prctica se desee saber si existe o no relacin entre
dos o ms variables. Frecuentemente una ley fsica relaciona variables en tal forma
que una de ellas, la dependiente, pueda expresarse como una funcin de la otra o las
otras, las independientes.
En estos tipos de problemas interesa determinar la expresin matemtica,
tambin llamada modelo matemtico, que explique el comportamiento del fenmeno en
estudio en trminos de valores de algunos indicativos que inciden en el mismo. En
matemticas se dice que se desea definir la expresin analtica que relacione al
conjunto de valores conocidos que influyen en el fenmeno (variable independiente)
con el conjunto de valores asociados al mismo fenmeno y que tambin se conocen
(variable dependiente). El anlisis de regresin resuelve este problema.
Por lo que se refiere al anlisis de correlacin, puede decirse que es un estudio
estadstico tendiente a especificar el grado de confianza con que el modelo
representa el fenmeno fsico.
En lo que sigue se considerar que los fenmenos que se estudiarn son
producidos por un solo agente, es decir, que el comportamiento de los fenmenos ser
explicado por la presencia de una sola variable independiente.
Para hacer el estudio estadstico de algn fenmeno, del agente que lo produce
y de la relacin funcional que existe entre ellos, deber observarse y medirse la
caracterstica asociada al fenmeno en presencia de valores, asignados u observados
por el investigador, de los agentes externos que producen el mismo fenmeno.
As por ejemplo, si se trata de encontrar la relacin que existe entre la
deformacin de un resorte y la fuerza que lo produce, deber tomarse un resorte y
medirse fsicamente la fuerza requerida para producir la elongacin que se quiera en
el resorte. Los valores de la deformacin, es decir, de la variable independiente,
pueden ser elegidos arbitrariamente por el investigador o medidos directamente en
presencia del experimento. En cualquier caso se obtendr un conjunto de valores de la
deformacin y las correspondientes fuerzas productivas. El conjunto de parejas
ordenadas (deformacin, fuerza) se llama los puntos mustrales del experimento.

92

Diagrama de un resorte deformado debido a la aplicacin de una fuerza.

Resorte

a) antes de aplicar la fuerza


deformacin
y fuerza
x
b) despus de aplicar la fuerza

Tabla 1. Valores observados al deformar un resorte.


Deformacin cm Fuerza Kg.
X
y
1
9
1
11
1
10
2
22
2
17
2
18,75
3
30
3
32,5
3
25
4
37,5
4
42,5
4
45

Finalmente, debe decirse que, dependiendo de la forma en que se obtengan los


valores mustrales de la variable independiente, se pueden definir dos tipos de
problemas. El problema de regresin es del Tipo I si los efectos en la variable
dependiente Y se miden para ciertos valores del factor X escogidos previamente por
el experimentador.
El problema es del Tipo II cuando los valores de X y Y son escogidos al azar
en la forma en que ellos se presentan.

93

DIAGRAMA DE DISPERSIN
Una incgnita importante que debe despejarse en el anlisis de regresin es la
forma general de la expresin matemtica que se piensa puede explicar el
comportamiento del fenmeno en base a los indicativos seleccionados; La forma puede
deducirse del conocimiento del propio fenmeno, o por consideraciones grficas al
representar en una grfica el conjunto de puntos mustrales.
Si no se tiene un conocimiento slido del fenmeno en estudio que permita
conocer a priori la forma de la expresin matemtica buscada, un procedimiento
grfico puede resolver el problema. En efecto, dibujando los valores observados de la
variable independiente X con sus correspondientes valores observados de la variable
dependiente Y en un sistema de coordenadas rectangulares, se obtiene un conjunto de
puntos conocidos como diagrama de dispersin.
En caso de que el diagrama de dispersin muestre una tendencia de los puntos a
aproximarse a una lnea recta, como en el caso a) de la figura 2, se dice que existe una
relacin lineal entre las variables. En el caso b) de la figura 2, aunque se aprecia la
existencia de una relacin entre las variables, sta no es lineal y as se llama, relacin
no lineal.
En la figura 3 aparece el diagrama de dispersin de los puntos mustrales de la
tabla 1. En ella se aprecia la tendencia de los puntos a aproximarse o ajustarse a una
lnea recta.

y
.
.

. .
.

..........

..

a) Relacin lineal

............
x

x
b) Relacin no lineal

Figura 2. Diagramas de dispersin tpicos a),b) y c).

.........
...........
x
c) No hay relacin

94

Y (fuerza, Kg)

Y = a0 + a1 x

40
30

( xi ,yi

( xi,yi )

desv. inexp.

20

desv. expl.

desv. total de la var. dep. respecto a la media

media

10
0

x (deformacin, cm)

Figura 3. Diagrama de dispersin del problema del resorte.

CURVA DE REGRESIN
La curva de regresin es aquella a la cual tienden a aproximarse los puntos del
diagrama de dispersin. En particular, la curva de regresin es una recta de regresin
cuando la relacin funcional entre las dos variables es lineal. La ecuacin de la curva de
regresin se llama ecuacin de regresin.
En el anlisis de regresin es importante indicar explcitamente cul es la
variable independiente y cul la dependiente, expresando que la curva de regresin o
su ecuacin de regresin es de y sobre x cuando sirva para predecir valores de la
variable dependiente Y dados los valores de la variable independiente X.
Para obtener la ecuacin de regresin de un fenmeno en estudio, despus de
haber determinado la forma general de sta del diagrama de dispersin, considerando
que la curva de regresin tenga la curvatura adecuada para eliminar los errores
inherentes al procedimiento de medicin de valores y contenga la informacin
relevante al fenmeno mismo, deben determinarse los valores de los parmetros
desconocidos que afectan a los valores de los indicadores que inciden en el problema.
En el caso de la regresin lineal, que ser el nico que aqu se estudie, se tiene
una ecuacin de regresin de la forma:
Y = a 0 + a1 x
Con dos parmetros por determinarse, que son la ordenada (a 0) al origen de la
recta y su pendiente (a1). Existen diferentes mtodos para determinar estos
parmetros; El que aqu se estudiar es el de los mnimos cuadrados.

95

MTODO DE LOS MNIMOS CUADRADOS


Considrese un cierto experimento del que se han obtenido los puntos
mustrales de la tabla 2 y graficados en un diagrama de dispersin.
Tabla 2. Puntos mustrales.
X
x1
x2
x3
...
...
xn

Y
y1
y2
y3
...
...
yn

Se llama desviacin, error o residuo a la diferencia de ordenadas de un punto


muestral Y de la recta de regresin correspondiente a una misma abscisa. As, el
residuo d1 entre el punto muestral (x1, y1) y la recta de regresin de ecuacin Y = a 0 +
a1 x vale:

en donde

d1 = y1 y1
y1 = a0 + a1 x1

Agrupando otras ecuaciones, se obtiene un sistema de dos ecuaciones con dos


incgnitas cuya solucin proporciona, tal vez, un punto extremo para la suma de los
residuos al cuadrado. Este sistema, que se describe a continuacin eliminando los
ndices de las variables independiente y dependiente y los lmites de las sumatorias
por comodidad, reciben el nombre de sistema de ecuaciones normales.
a0n + a1 x = y
a0 x + a1 x2 = xy
Aplicando la condicin suficiente para que el punto extremo proporcione un
valor mnimo a la funcin objetivo considerado, se demuestra que efectivamente la
solucin del sistema de ecuaciones normales define el mnimo de la suma de los
residuos al cuadrado del mtodo de los mnimos cuadrados. No se hace la
demostracin de esto ltima por no tener mayor importancia en la exposicin de este
tema, pero puede dejarse como tarea al lector interesado.

96

Resolviendo el sistema de ecuaciones normales, se obtienen los valores de los


parmetros a0 y a1 de la recta de regresin que mejor se ajusta al conjunto de puntos
mustrales de la tabla 2 de acuerdo con el criterio de los mnimos cuadrados. Estos
son:
a0 = (y)(x2) (x)(xy)
n x2 (x)2
a1 = n xy (x)(y)
n x2 (x)2
donde n indica el nmero de pares de puntos que son datos.
Estos valores, sustituidos en la recta de regresin, proporcionan la ecuacin de
la recta de regresin de Y sobre X. Por medio de ella se pueden estimar o predecir
valores de Y dados valores de X.
EJEMPLO:
Obtener las rectas de regresin de Y sobre X y de X sobre Y para el problema
siguiente:
Para la regresin de Y sobre X se tiene la tabulacin indicada en la tabla 3.
Se deja al alumno elaborar la grfica x y correspondiente a los datos.
Tabla 3.
x

x2

xy

y2

1
1
1
2
2
2
3
3
3
4
4
4

9.00
11.00
10.00
22.00
17.00
18.75
30.00
32.50
25.00
37.50
42.50
45.00

1
1
1
4
4
4
9
9
9
16
16
16

9.00
11.00
10.00
44.00
34.00
37.50
90.00
97.50
75.00
150.00
170.00
180.00

81.0000
121.0000
100.0000
484.0000
289.0000
351.5625
900.0000
1056.2500
625.0000
1406.2500
1806.2500
2025.0000

30

300.25

90

908.00

9245.3125

97

n = 12
a0 = (300.25)(90) (30)(908.00) = -217.50 = -1.21
(12)(90) (30)2
180
a1 = (12)(908.00) (30)(300.25) = 1888.50 = 10.49
(12)(90) (30)2
180
Luego la recta de regresin de Y sobre X es:
Y = -1.21 + 10.49 x
Para obtener la ecuacin de la regresin de X sobre Y se deben intercambiar X
y Y en las ecuaciones anteriores obtenindose:
a0 = (x)(y2) (y)(yx)
n y2 (y)2
a1 = n yx (y)(x)
n y2 (y)2
Sustituyendo en ellas los valores de las sumas ya calculadas, se tiene:
a0 = (30)(9245.3125) (300.25)(908.00) = 4732.3750 = 0.23
(12)(9245.3125) (300.25)2
20793.6875
a1 = (12)(908.00) (300.25)(30) = -1888.50 = 0.09
(12)(9245.3125) (300.25)2 20793.6875
y la recta de regresin de X sobre Y es:
x = 0.23 + 0.09y
Se deja al alumno elaborar la grfica correspondiente.
Despejando Y de esta ecuacin se obtiene y = -2.51 + 11.01x, lo que muestra que
las ecuaciones de regresin de Y sobre X y de X sobre Y no son iguales.
Si se grafican ambas ecuaciones se podr encontrar que no coinciden
exactamente pero se podr observar que son muy coincidentes, esto indica que las
rectas de ajuste tienen los pares de puntos muy semejantes a la lnea recta, en caso
de que fueran coincidentes entonces todos los pares de puntos estaran sobre la
recta. Se deja que el alumno lleve a cabo la anterior demostracin.
Si la variable independiente x representa al tiempo, a la recta de regresin se
le denomina de tendencia y se utiliza para estimar, predecir o pronosticar. Los datos
mustrales ordenados segn la variable tiempo se llaman series cronolgicas o de
tiempo.

98

COEFICIENTE DE CORRELACIN
Hasta este momento se ha aceptado el error estndar de la estimacin como un
buen indicador de qu tan bien se ajusta una recta de regresin al conjunto de puntos
mustrales que la producen. Sin embargo, este error estndar de la estimacin tiene
unidades, lo que dificulta decir en un momento dado si un error estndar es o no
pequeo.
A fin de poder hacer comparaciones entre los errores estndar de la
estimacin de diferentes problemas, convendra que estos errores fueran
adimensionales y variaran dentro de un rango nico. Para obtener este indicador que
se llamar coeficiente de determinacin y se expresa por r 2 y corresponde al cociente
de la desviacin explicada de los datos entre la desviacin total de los datos, es decir:
r2 = [ ( y - Y )2] / [ ( y Y )2 ]
La raz cuadrada de r2 da el coeficiente de correlacin.
Donde y corresponde a los pares de puntos, y se refiere al valor estimado en la
ecuacin de ajuste y y se refiere al promedio de los valores de las y.
A continuacin se establece otra forma de la expresin que proporciona
directamente el signo del coeficiente de correlacin lineal.
Despus de sustituir las ecuaciones en otras expresiones y sustituyendo a 0 y a1
por sus valores dados en las expresiones, finalmente la ecuacin a utilizar seria:
n xy (x)(y)
r=
[nx2 (x)2][ny2 (y)2]
Si aplicamos para el problema del resorte se tendr:

r=

(12) (908) - (30) (300.25)


[ (12) (90) -(30)2] [(12) (9245.3125) (300.25)2 ]
r = 0.976 -> 1 las dos variables estn linealmente correlacionadas.

Se cabra preguntar si el valor 0.976 y el cual fue obtenido de un muestreo,


puede ser inducido a la poblacin completa y en realidad pueda aproximarse a dicho
valor de 0.976, por lo que el estudio debe de complementarse con un anlisis de
confiabilidad de la medida de correlacin.
El coeficiente de correlacin tambin se podr obtener aplicando la expresin
del coeficiente de determinacin y que corresponde a la relacin de la desviacin
explicada con respecto a la desviacin total, por lo que se deber de calcular las
siguientes columnas adicionales en la tabla:

99

X Y
1 9
1 11
1 10
2 22
2 17
2 18.75
3 30
3 32.5
3 25
4 37.5
4 42.5
4 45

YC
9.28
9.28
9.28
19.77
19.77
19.77
30.26
30.26
30.26
40.75
40.75
40.75

( YC - Y )2
247.7
247.7
247.7
27.6
27.6
27.6
27.5
27.5
27.5
247.4
247.4
247.4
1650.6

( Y - Y )2
256.6
196.6
225.6
9.12
64.3
39.3
24.8
56
0.0004
155.8
305.6
399.2
1732.9

Para x = 1
Y = -1.21 + 10.49 x = -1.21 + 10.49 (1) = 9.28 as para todo valor de x
Ecuacin de regresin yc = -1.21 + 10.49x
Y = 300.25 / 12 = 25.02

r2 = 1650.6 / 1732.9 = 0.9525


r = 0.9525 = 0.976 una alta correlacin.

REGRESIN Y CORRELACIN NO LINEAL:


En un anlisis de dos variables se puede presentar que el diagrama de
dispersin muestre un camino trazado de forma no lineal, de la forma Lineal
y = a0 + a1 x, con parmetros a0 y a1,
Pero cuando sea no lineal, p.e. cuadrtica
y = a0 + a1 x + a2 x2 parmetros a0, a1, a2
Cbica y = a0 + a1 x + a2 x2 + a3 x3 etc. Hasta de orden n.
Pero tambin puede ser de la forma exponencial, logartmica o trigonomtrica.
La solucin del problema se vuelve bsicamente algebraica, por lo que el empleo
de un programa de computacin sera lo ms apropiado.
Las formulas de correlacin se dan en el ejemplo respectivo mas adelante.

100

EJEMPLO:
De diferentes observaciones acerca del consumo de combustible en vehculos
circulando en terreno plano y a diferentes velocidades se obtuvieron los siguientes
valores promedio.
Efectu un anlisis de regresin y correlacin, mediante un ajuste del tipo polinomial,
para los siguientes puntos mustrales:

x velocidad
M / hr.
20
25
30

y
Gal. / milla
4,04
4
4,18

35
40
45
50
55
60

4,35
4,2
4,75
5,2
5,52
6,15

6,5
6
5,5
5
4,5
4
3,5
3
0

20

40

60

Parbola mnimo cuadrado. (Ajuste de curva polinomial).


y = a0n + a1x + a2x2
yx = a0x + a1x2 + a2x3
x2y = a0x2 + a1x3 + a2x4

x
20
25
30
35
40
45
50
55
60
360

y
4,04
4
4,18
4,35
4,2
4,75
5,2
5,52
6,15
42,4

x2
400
625
900
1225
1600
2025
2500
3025
3600
15900

x3
8000
15625
27000
42875
64000
91125
125000
166375
216000
756000

x4
160000
390625
810000
1500625
2560000
4100625
6250000
9150625
12960000
37882500

42.38 = 9 a0 + 360 a1 + 15900 a2


1772.35 = 360 a0 + 15900 a1 + 756000 a2
81363.25 = 15900 a0 + 756000 a1 + 37882500 a2

x*y
80,8
100
125,4
152,25
168
213,75
260
303,6
369
1772,8

x2y
1616
2500
3762
5328,75
6720
9618,75
13000
16698
22140
81383,5

80

101

Solucionando por un mtodo matricial se tendr:


a2 = 0.00166
a1 = - 0.0814
a0 = 5.0322
y = 5.0322 - 0.0814x + 0.00166x2
Ecuacin de regresin de mejor ajuste, o parbola de mnimos cuadrados un
ajuste no lineal o polinomial.
Para calcular el coeficiente de correlacin no lineal se aplicar la idea general
del concepto enunciado en pginas atrs:
r2 = [ ( y - y )2 ] / [ ( y y )2 ]
Y =[ y ] / n = 42.38 / 9 = 4.71
Para los valores de x se define el valor de y como se muestra:
x = 20
y1 = 5.0322 0.0814 (20) + 0.00166 (20)2
y1 = 4.066
x = 25
y2 = 5.0322 0.0814 (25) + 0.00166 (25)2
y2 = 4.033
Y as con todos los valores de x. Y

x
20
25
30
35
40
45
50
55
60
360

y
4,04
4
4,18
4,35
4,2
4,75
5,2
5,52
6,15
42,4

Calculo de la correlacin:

y'
4,0682
4,0347
4,0842
4,2167
4,4322
4,7307
5,1122
5,5767
6,1242
42,380

(y'- Y )2
0,412
0,456
0,392
0,243
0,077
0,000
0,162
0,751
2,000
4,493

(y - Y )2
0,4489
0,5041
0,2809
0,1296
0,2601
0,0016
0,2401
0,6561
2,0736
4,595

y = y / n = 42.38 / 9 = 4.71

y2
16,322
16,000
17,472
18,923
17,640
22,563
27,040
30,470
37,823
204,252

(y-y)2
0,00080
0,00120
0,00918
0,01777
0,05392
0,00037
0,00771
0,00321
0,00067
0,095

102

Coeficiente de determinacin:
r2 = desv. Explicada / desv. Total = [ (y- y)2] / [ (y - y)2] =
r2 = 4.489 / 4.595 = 0.977
El coeficiente de correlacin ser:
r = 0.977 = 0.988 indica que las variables estn altamente correlacionadas
en un anlisis no lineal polinomial parablico.
Aplicando la frmula reducida se calculara el coeficiente de correlacin:
r = 1 - [S2y/x / S2y]
S2y/x = ( y yc )2 / ( n 3 ) = .0945 / ( 9 3 ) = 0.01575
S2y = n[ n y2 ( y )2] / [ n2 ( n-1 ) ] = 9[9(204.158)-(42.38)2] / 81(8) = 0.5744
r2 = 1 - [ 0.01575 / 0.5744 ] = 0.973
r = 0.973 = 0.987 alta correlacin.
Se deja al alumno que efecte un anlisis de regresin y correlacin lineal para
los datos anteriores, los compare con la curva de regresin obtenida y con el
coeficiente de correlacin no lineal y obtenga unas conclusiones de la comparacin
anterior.
Regresin y correlacin no lineal.
Para cierto tipo de datos es conveniente compararlos con diferentes tipos de
comportamientos grficos en diferentes clases de papel, con el fin de buscar la
simplicidad en los clculos y observar que si al ir variando el tipo de papel la relacin
entre variables tiende a ser del tipo lineal.
Se podr iniciar con un papel del tipo aritmtico vs aritmtico, se podr variar
a un papel aritmtico vs logartmico llamado tambin semilogaritmico se podr
trabajar con un papel logartmico logartmico vs logartmico. Se grafican los datos y
se observa si hay tendencia lineal y si as se convierten las ecuaciones dadas a formas
relacionadas con los logaritmos.
Por ejemplo un comportamiento de la forma:
Y = a bx
Se puede transformar a uno de la forma:
Log. Y = log a + x log b
Que es una funcin de la forma lineal:
Y = mx + b y = a0 + a1 x
Y = log. Y
b = log a

donde:
m = log b

103

Se observa que x no se altera, por lo que tiene una variacin aritmtica, en


cambio Y si se ve afectada por el logaritmo y habr que efectuar la transformacin
correspondiente. El anlisis corresponde a una variacin semilogaritmica y el papel de
grfica ser en el eje x aritmtico y en el eje y logartmico.
Para una variacin logartmica se tendr una funcin de la siguiente forma:
Y = a xb
La transformacin logartmica ser:
Log. Y = log a +

b log x

Como las variables x-y estn afectadas por el logaritmo entonces se tendr una
variacin logartmica, el papel de grfica en ambos ejes ser logartmico.
Si en ambos casos se grafica y la tendencia es una recta, el ajuste se efectuara
empleando las formas de la lnea recta y el anlisis ser mas simple. Para el ajuste
final solo se deber de efectuar las transformaciones correspondientes.
Ejemplo:
En la siguiente tabla aparecen los beneficios netos de una compaa durante sus
primeros seis aos de operacin:
. Elabore la grfica de regresin y busque un ajuste semi-logartmico si la grfica del
tipo aritmtico presenta una tendencia del tipo no lineal.
. Determine la ecuacin de regresin.
. Determine el coeficiente de correlacin.
*Datos:
*Grfica aritmtica:

Aos
1
2
3
4
5
6

Beneficio
neto $
112
149
238
354
580
867

1000
800
600
400
200
0
1

Como se observa que la grfica en papel aritmtico sigue una tendencia no


lineal, se pasarn los datos a una grfica en papel semi logartmico y se observa que

104

la tendencia es a una recta, por lo que se efectuarn las transformaciones necesarias


para llevar a cabo un ajuste lineal.
1000

100

10

1
0

La ecuacin de ajuste que se buscar ser de la forma:


Y = a0 + a 1 x

Determinacin de la recta de regresin:


Los ajustes de la ecuacin lineal sern:
Y = log y a0 = log a
a1 = log b, es decir:
Log y = log a + x log b, por lo que la ecuacin de ajuste ser de la forma:
= a bx
Tabla de clculos:
X
Y
Y=logy X2
XY

Sumas

1
2
3
4
5
6
21

112
149
238
354
580
867

2.0492
2.1732
2.3766
2.5490
2.7634
2.9380
14.8494

1
4
9
16
25
36
91

2.0492
4.3464
7.1298
10.1960
13.8170
17.6280
55.1664

Aplicando las ecuaciones bsicas de la regresin lineal se tendr:


a0 = [(14.894) (91) - (21) (55.1664)] / [(6) (91) (21)2] =
= (1351.3 - 1158.5) / (546 - 441) = 192.8 / 105 = 1.84

n = 6

105

a1 = [(6) (55.1664) - (21) (14.8494)] / [(6) (91) (21)2] =


= (331 - 311.8) / (105) = 0.183
Y = a0 + a1 x = 1.84 + 0.183 x
de donde:
Y = log y log a = 1.84 log b = 0.183 log y = 1.84 + 0.183 x
a = antilog 1.84 = 69.18
b = antilog 0.183 = 1.52
La ecuacin de regresin ser:

Y = 69.18 (1.52) x

Se deja al alumno a que efecte el clculo del coeficiente de correlacin.


Se deja al alumno a que estudie los casos de regresin y correlacin con ms de
dos variables.
LA INVESTIGACION Y LA ESTADSTICA
La investigacin tiene como objetivo la bsqueda del conocimiento y el
entendimiento. Trata de descifrar de las cosas, y las consecuencias de un conjunto
particular de las cosas.
La investigacin esta compuesta esencialmente de dos elementos, la
observacin y el razonamiento. La observacin es el medio por el cual se obtiene el
conocimiento de los hechos, y se realiza a travs de las percepciones de los sentidos.
El razonamiento, la lleva a determinar las posibles causas de los hechos, relacionados
con los conocimientos existentes.
La investigacin requiere del uso de ciertas herramientas que son
proporcionadas por la estadstica.
La estadstica puede ofrecer a la investigacin en planeacin la manera de
analizar e interpretar los resultados, comprendiendo dos funciones:
Descripcin, resultado de la informacin de tal modo que pueda emplearse
mejor.
Induccin, consiste en formular generalizaciones a una poblacin determinada
sobre una muestra extrada de la misma.
ETAPAS GENERALES DE UNA INVESTIGACION
Determinar que se pretende investigar y su finalidad.
Estadstica, la primera etapa es la de formular el problema o pregunta lo ms
precisamente posible, es decir como son los datos ms relevantes del problema.
Formular, plantear y delimitar el problema.
Identificar las variables.

106

Formular las hiptesis.


Determinacin de la poblacin que va a ser hecha un muestreo.
La poblacin o el universo se definen como el total de las unidades elementales
tales como personas, empresas, etc.
Delimitacin del trabajo de investigacin.
Recolectar nicamente los datos que se utilizaran posteriormente.
Seleccin de mtodos y tcnicas.
Deber definirse si es por variables y por atributos. Muestreo de aceptacin
de variables y por atributos: Si a partir de una muestra deseamos estimar una cierta
caracterstica cuantitativa, se dice que se trata de un muestreo de variables, si en
cambio nos interesa estimar una caracterstica cualitativa, se dice que se trata de un
muestreo de atributos.
Tamao de la muestra: se requiere una muestra mayor para muestreo de
atributos que para el caso muestreo de variables, adems los elementos de la muestra
pueden ser ms costosos y la inspeccin ms destructiva.
Costos: las medidas reales y los clculos requeridos pueden ser ms costosos
por variables.
Normalidad: los planes de variables dependen de la exactitud en la
consideracin de la normalidad de la distribucin de la variable medida.
Operacin: el muestreo de atributos es ms ampliamente conocido que el muestreo de
variables, es decir se requiere menos entrenamiento.
Preparacin de la comunidad, el grupo o los objetos. La poblacin debe dividirse
en unidades de muestreo.
Determinacin y eleccin de la muestra.
En la toma de la muestra de una poblacin cualquier persona puede tomar dicha
muestra, pero puede tomar propensin a seleccionar determinadas unidades, por lo
tanto no le puede asignar una cierta posibilidad de seleccin a cada elemento. Para
evitar estos problemas se tiene los siguientes mtodos de seleccin al azar, es decir,
un procedimiento para seleccionar a cada una de las muestras una igual posibilidad de
seleccin evitando en lo menos posible el sesgo.

METODOS ALEATORIOS
Nmeros aleatorios.
Mtodo del residuo.
Mtodo del coeficiente.
Organizacin del trabajo: deber darse supervisin e instruccin al efectuar el
muestreo y si es posible darles un instructivo de procedimientos.

107

Anlisis de los resultados: una vez obtenidos los datos son necesario e
importante analizarlos para efectuar una estimulacin de la poblacin investigada.
MUESTREO Y RAZONES PARA EL MISMO
Muestreo es simplemente el proceso de aprender algo acerca de la poblacin
sobre la base de una muestra extrada. Al efectuarse un muestreo debern
contestarse la siguiente pregunta:
Cules son las razones para el muestreo?
Hoy casi todas las encuestas estadsticas, que se hacen para la toma de
decisiones en los negocios, la formulacin poltica, desarrollo de las teoras sociales,
son de muestreos. Adems pueden obtenerse resultados fidedignos de procedimientos
de muestreo correctos ya que las poblaciones pueden ser infinitas y en tales casos el
muestreo es el nico procedimiento prctico y posible. Este puede ser an el
procedimiento ms eficiente. Los resultados obtenidos por el estudio de la muestra
pueden ser iguales o ms precisos que los hallazgos de una cuenta completa de
conjunto.
BASE TEORICA DEL MUESTREO
En el muestreo encontramos un poderoso instrumento para predecir el
comportamiento de los fenmenos masivos. Esto es generalizar lgica y precisamente
acerca de miles de valores que no hemos visto, sencillamente por la confianza
proporcionada por ciertos valores. La poblacin tiene propiedades caractersticas,
variaciones limitadas en sus elementos que son reflejados en una muestra pequea y
tomada al azar. La poblacin y las partidas individuales de una poblacin tienden a
variar entre s, esto es que tienden a generar iguales valores arriba y debajo de cierto
valor central es por ello, tenemos diversidad y uniformidad de los datos. Los
promedios son ms estables que los valores individuales. A dems los promedios
resultan ms estables cuantas ms observaciones haya en la muestra. Como pueden
estar seguros entonces sobres el grado de confianza de nuestras conclusiones, la
respuesta sera ALEATORIEDAD. La medicin objetiva de los errores por muestreo
requiere que la muestra sea al azar.
COMO DEBERAN SER LAS MUESTRAS
Se deber comprender algunos trminos:
Marco de poblacin muestreada: identificar las unidades elementales que
deben ser definidas antes de poder observarlas, esto es si la poblacin es accesible,
en caso contrario cuando presenta dificultades se prepara cierta clase de lista con las
cuales identificar las unidades mustrales llamndosele a este marco de poblacin.

108

Muestras: las unidades que forman una poblacin se les llaman unidades de
muestreo que son de dos tipos; las unidades de muestreo elementales que son todas
las contenidas en la poblacin cuyas caractersticas han de ser medidas o contadas,
mientras que las unidades de muestreo primarias son las unidades elementales mismas
o los grupos de las unidades elementales. Una muestra es un conjunto de unidades de
muestreo primario del que pueden hacerse inferencia sobre la poblacin de esta se
espera que sea representativa en la poblacin original. En la teora del muestreo es
importante distinguir las muestras por juicio.
Errores estadsticos: Diferencia entre el valor de una estadstica y el del
parmetro correspondiente. El error de muestreo es el resultado de la muestra y del
censo cuando se obtienen ambos resultados usando los mismos procedimientos.
Eficiencia de los modelos de los muestreos: un modelo se dice que es suficiente
si los resultados deseados son obtenidos al costo ms bajo posible. Un modelo de
muestreo se dice que es ms eficiente que otro si el primero da la misma precisin a
costos ms bajos, o mayor precisin a los mismos costos.

METODO DE MUESTREO
El muestreo o sondeo es una tcnica para seleccionar de una poblacin,
unidades o grupos ms pequeos de este universo considerado, llamados muestra, que
tengan las mismas caractersticas del universo que representan. Los procedimientos
generales para la extraccin de muestras:
Definir el universo con el que se tratar de trabajar.
Elaborar una lista completa y precisa de las unidades y agrupaciones que componen
esta poblacin o universo.
Determinar el tamao de la muestra.
ELECCION DEL TAMAO DE LA MUESTRA
El diseo de un experimento es esencialmente un plan para comparar una
cantidad de informacin que, como cualquier otro producto, puede adquirirse a
distintos precios dependiendo de la forma que se obtienen los datos. Puesto que el
nico producto de la investigacin es la informacin, es deseable compararla a costo
mnimo.
EL MUESTREO ALEATORIO: que consiste en darle a todas las muestras
posibles de una poblacin la misma probabilidad de ser seleccionados, tiene dos
propsitos:

109

Evita la posibilidad de sesgos producidos por una seleccin no aleatoria de


elementos mustrales.
Proporciona una base probabilstica para la seleccin de la muestra.
Puesto que las distribuciones de probabilidad son modelos tericos para las
distribuciones de frecuencia relativas de poblaciones, las muestras seleccionadas en
poblaciones se pueden considerar como observaciones de variables aleatorias.
EL MUESTREO ALEATORIO AL AZAR: es donde se tiene una lista del
universo, y de ella se extrae una muestra mediante mtodos probabilsticas.
EL MUESTREO ESTRATIFICADO: se divide al universo en diferentes
estratos, segn algunas caractersticas y se toman muestras al azar, de cada una de
esas clases. El muestreo puede ser; proporcional, que es cuando se extraen unidades
de acuerdo a un por ciento convenido. Y el no proporcional donde se extrae el nmero
igual a cada una de las clases.
EL MUESTREO SISTEMATICO: se divide las listas en unidades o nombres de
personas por el tamao deseado de la muestra. Se escoge al azar el primer nmero de
la muestra y se suma sucesivamente a este nmero la cantidad anterior encontrada,
hasta extraer la cantidad de personas deseadas.
EL MUESTREO NO ALEATORIO: el muestreo por juicio, seleccionado por
expertos o intencionado, es aqu donde el grupo de expertos elige la muestra segn a
ellos les parece bueno, este muestreo si bien depende de que tan expertos sean los
expertos, indudablemente que habr un error en la muestra.
EL MUESTREO CON REMPLAZAMIENTO: se utiliza una lista y a cada
integrante se le asigna un nmero que ser inscrito en un boleto, que ser incluido en
un recipiente para ser extrado al azar. Al extraer los nmeros sucesivos, puede darse
el resultado que se regrese al recipiente l nmero extrado. Para seleccionar el tipo
de muestreo se deben tener en cuenta los siguientes criterios.
Grado de precisin requerido.
Error de precisin aceptable.
Tiempo.
Costo.
Posibilidades en el terreno.

110

DISEO DE EXPERIMENTOS
El diseo de un experimento es esencialmente un proyecto para obtener una
cantidad de informacin que, como cualquier otro servicio, se puede adquirir a
diferentes precios que depende de la manera en que se obtuvieron los datos.
El proceso de muestreo o Diseo de Experimentos como se le llama
normalmente, afecta la cantidad de informacin por medicin. Esto conjunto con el
tamao n de la muestra, controla la cantidad total de informacin relevante a una
muestra.
Mendenhall, wackerly

Teora Elemental Del Muestreo


Para que las conclusiones de la teora del muestreo e inferencia estadstica
sean vlidas, las muestras deben elegirse de forma que sean representativas de la
poblacin. Un estudio sobre mtodos de muestreo y los problemas de tales mtodos
implican, se conoce como Diseo de Experimentos.
El proceso por medio del cual se extrae de una poblacin, una muestra
representativa de la misma se conoce como muestra al azar, de acuerdo con ello cada
miembro de la poblacin tiene la misma posibilidad de ser incluidos en la muestra. Una
tcnica para obtener una muestra al azar es asignar nmeros a cada miembro de la
poblacin para despus extraer los nmeros en un sorteo. Esto puede ser sustituido
por una tabla de Nmeros Aleatorios construida especialmente para tales propsitos.
S. Schaum

CONCEPTOS BASICOS:
Experimento.- es un proceso por medio del cual se obtiene una observacin o
medicin. La experimentacin se usa para someter a prueba hiptesis y establecer
nuevas relaciones entre variables.
La experimentacin frecuentemente proporciona conclusiones errneas que
pueden ser resultado de los siguientes hechos:
Interpretacin defectuosa del experimento
Suposiciones originales inadecuadas
El experimento fue pobremente diseado o mal ejecutado.
El Diseo Experimental es el plan usado en un experimento. Implica la
asignacin de tratamientos a las unidades experimentales y un amplio entendimiento
de los anlisis por verificar, asegurando que los datos se obtendrn de modo tal que

111

permitan un anlisis objetivo que conduzca a deducciones validas con respecto al


problema establecido.
Debe hacerse todo esfuerzo para ahorrar tiempo, dinero, personal y material
experimental, es decir, que el diseo de experimentos es una materia que se requiere
tanto a la metodologa estadstica como al anlisis econmico.
PLANEAMIENTO DE EXPERIMENTOS
La clave del xito en el trabajo experimental consiste en preguntarse continuamente:
Qu busco?
Por qu mido esto?
Qu me significa la medicin?
Y ms particularmente, sobre todo en las fases iniciales del planteamiento del
experimento son, entre otras:
Cules sern las variables primarias para investigar?
Que tipo de control se deber tener en el experimento?
Que rango de las variables primarias ser necesario para poder describir el
fenmeno bajo estudio?
Existen comercialmente los instrumentos o deben construirse especialmente para el
experimento?
Cuales son los aspectos de seguridad preventiva necesarios, si dentro del
experimento existe alguna operacin peligrosa?
De que fuentes financieras se dispone para llevar a cabo el experimento? Y qu
tanto se apega las caractersticas de los aparatos al presupuesto asignado?
Que mediadas se han tomado para registrar los datos?
Cmo se comporta el fenmeno para saber que medir y como comprobarlo?
PROCEDIMIENTO GENERAL PARA REALIZAR UN EXPERIMENTO
A. Establecer la necesidad para realizar el experimento.
B. establecer las condiciones ptimas de: Presupuesto. Personal. Tiempo, Incluyendo
las programaciones o secuenciacin en tiempo del proyecto.
C. Modificar el alcance del experimento de acuerdo a las condiciones reales de:
presupuesto, personal y tiempo.
Comenzar la planificacin del experimento a detalle, establecer claramente los
objetivos del experimento (verificar el comportamiento de un prototipo o modelo para
su produccin; verificar el anlisis terico de un fenmeno fsico en particular, etc.)
Si el experimento es similar a aquellos que han realizado investigadores
previos, asegurarse de utilizar su experiencia.
Nunca pasar por alto la posibilidad de que el trabajo pudo haber sido echo
anteriormente y estar consignado en la literatura.

112

Continuar la planificacin llevando a cabo los siguientes pasos:


Establecer las variables primarias que deben medirse (Fuerza, deformacin,
gasto, presin, temperatura, volumen, etc.)
Determinar, lo mejor posible, la exactitud que puede requerirse en las
mediciones primarias y l nmero de tales mediciones que sern necesarios para el
adecuado anlisis de datos.
Establecer los procedimientos de clculo para sintetizar los datos antes de
llevar a cabo el experimento para estar seguro de que se van a recoger los datos
necesarios para alcanzar el objetivo del experimento.
Estimar los errores posibles en los resultados antes de que se lleve a cabo el
experimento, para que, si resulta necesario, pueda cambiarse los requisitos de
exactitud de los instrumentos.
Seleccionar los instrumentos para las diversas mediciones que igualen los
requisitos de exactitud anticipados.
Modificar la instrumentacin, si es necesario, de acuerdo a las limitaciones
presupuestadas.
Recopilar unos pocos datos y efectuar un anlisis preliminar de ellos, para estar
en l experimento esta resultando como se haba planeado.
Modificar el arreglo y/o el procedimiento experimental, de acuerdo con los resultados
del punto 5.
Recopilar el cmulo de datos experimentales y analizar los resultados.
Organizar, discutir y publicar los descubrimientos y resultados del
experimento, asegurndose de incluir la informacin concerniente a todos los puntos
anteriores.

113

PLANIFICACION DEL PROGRAMA EXPERIMENTAL

Etapa Preliminar:
Si no es factible, requerir.
. modificar el presupuesto y/o
. distribucin de tiempo o
. suspender el proyecto.

Establecer l a
Necesidad de
realizar el
experimento.

Posible
modificacin al
alcance del
trabajo analtico.

Limitaciones financieras.

Revisar
cuidadosam
ente el
trabajo
previo en el
campo.

Posible modificacin de
nocin original de
necesidades.

Establecer la
factibilidad
en el tiempo
y con los
costos
previstos.

Estimar el alcance del trabajo


analtico.

Establecer el Tiempo y las

Etapa Intermedia:
Comenzar el trabajo
analtico preliminar para:

Determinar los
rangos de las
variables y las
exactitudes
necesarias.

Efectuar planes para el


Diseo y Construccin de
equipo especial.

Juntar algunos datos


preliminares.

Analizar la
incertidumbre de
los datos

Si la comparacin no es favorable, modificar


si es posible, el experimento y/o el anlisis.
Especificar los
instrumentos
necesarios.

Avanzar con el
Modificar el
acuerdo con las
limitaciones del
presupuesto.

trabajo analtico.

Comprar
instrumentos

Comparar los
datos
preliminares
con las
teoras
disponibles

114

C) Etapa Final:
Reunir la totalidad de los datos

Continuar el anlisis incluyendo posible


procesamiento de datos por computadora.

Contrastar la teora
con el
experimento,
Correlacionar los
datos, Crear
nuevas teoras
para explicar los
datos, etc.
Correlacionar con la necesidad
original del experimento

Discutir y Publicar los


resultados del experimento.

115
CAPITULO IV.
LA INFERENCIA ESTADSTICA (I.E)
La I.E. es la parte de la estadstica que proporciona las reglas para inferir
caractersticas de una poblacin a partir de muestras extradas de ellas, junto con las
indicaciones probabilsticas de la veracidad de tales inferencias, en general se le denomina
inferencia estadstica.
La I.E estudia las relaciones que existen en una poblacin, las muestras extradas de
ella y las tcnicas para estimar parmetros.
Los parmetros dependen del objetivo del problema y se pueden referir a la MEDIA,
VARIANZA, DESVIACIN ESTANDAR, MEDIANA, MODA, a la POBLACION, etc. ya sea
en forma individual o en relacin a 2 poblaciones.
Los mtodos para hacer inferencias estadsticas pueden ser de 2 categoras:
La 1era consiste en tomar decisiones respecto al valor del parmetro.
La 2da se basa en predecir el valor del parmetro.
Una presentacin del objetivo y de los tipos de inferencia queda incompleta si no
tenemos una referencia respecto a la bondad de los mtodos de inferencia.
La I.E tiene como base la teora del muestreo, donde el diseo de experimentos trata
los temas de los mtodos de muestreo donde se pretende reducir las variaciones
experimentales que sea representativo y que tenga un mnimo costo.
Para asegurar que los parmetros asociados a la muestra se siguen manteniendo como
representativos en el tiempo, estos deberan de realizarse continuamente por medio del
estudio de muestras representativas.
LAS TCNICAS DE MUESTREO.
Bsicamente un muestreo se basa en un muestreo aleatorio o en un semialeatorio. En el
primero todas las muestras tendrn la misma probabilidad de ser elegidas en donde el sesgo es
eliminado, en el semialeatorio se permite cierto tipo de sesgo.
1. EL MUESTREO ALEATORIO SIMPLE.
Consiste en tomar muestras de tamao n de entre una poblacin N, de manera que todas
tengan la misma probabilidad de ser elegidas, se emplean tcnicas como la de los nmeros
aleatorios.

116
2. EL MUESTREO ALEATORIO PROPORCIONAL.
En forma continua se presentan fenmenos con tendencia binomial y que la tcnica de
muestreo se busca estimar el porcentaje de unidades que tengan esas caractersticas
obteniendo un muestreo proporcional.
3. MUETREO ALEATORIO ESTRATIFICADO.
Cuando los elementos se pueden agrupar en estratos de acuerdo a ciertas
caractersticas de cada estrato, se podr llevar acabo un muestreo aleatorio simple de tamao
proporcional al estrato, donde la muestra representativa ser la total que se obtuvo del
muestreo estratificado.
Estrato

Tamao del
Estrato

1
2
3
4
5
6
N (poblacin)

N1
N2
N3
N4
N5
N6

Tamao de la
muestra

n1
n2
n3
n4
n5
n6
n (tamao de muestra)

El muestreo aleatorio se puede efectuar sobre 2 tipos de poblaciones, la finita sin


reemplazo y la infinita o con reemplazo.
Para una poblacin finita el nmero de muestras que se pueden obtener se define por la
siguiente expresin:
Nmero de muestras = N C n
N Tamao de la poblacin.
n Tamao de la muestra.
Y como el muestreo es aleatorio se plantea la siguiente definicin:
Una muestra de tamao n de una poblacin finita de tamao N es una variable aleatoria si se
selecciona de tal manera que cada una de las N C n muestras posibles tiene la misma
probabilidad
1
de ser seleccionada
N C n.

117
EJEMPLO # 1
Obtenga el nmero de muestras para las siguientes condiciones.
a)
b)

n=2
n=3

y
y

N = 12
N = 100

SOLUCIN:
a) Numero de muestras = N C n
Numero de muestras = 12C 2 =

Probabilidad =

12!
2! 10!

= 11*12
2

= 66

1 .
NCn

1
66
= 1.5 %
b) Numero de muestras = N C n
Numero de muestras = 100 C 3
= 100!
3!97!
= 161,700

Probabilidad =

1 .
NCn

1
.
161,700

= 0.0006%

Para el muestreo aleatorio proporcional estratificado se parte de la siguiente idea.


n1 = n2 . nk Parmetro Binomial.
N1
N2
NK

118
El clculo del tamao muestral proporcional se define por la siguiente expresin:
ni = Ni (n)
N
Para i = 1, 2,3..k.

EJEMPLO # 2.
Se debe de obtener una muestra de tamao 60 de una poblacin finita de 4000 y la cual cuenta
de 3 estratos de tamao N1 = 2000 N2 = 1200 N3 = 800. Qu tan grandes deben de ser las
muestras de cada estrato?

SOLUCIN:
n = 60
N = 4000
N1= 2000
N2= 1200
N3= 800
n1 = ?
n2 = ?
n3 = ?

n1 = N1 (n) = 2000 (60) = 30


N
4000
n2 = N2 (n) = 1200
N
4000

(60) = 18

n3 = N3 (n) = 800
N
4000

(60) = 12

El muestreo estratificado nos permite definir una muestra representativa, ya que se


tomara una muestra ms grande del estrato ms grande. Pero para tener una mejor muestra,
junto al muestreo estratificado se podr considerar la variabilidad donde seria lgico tomar
una muestra mayor del estrato de ms variabilidad.
Si consideramos 1, 2,.......k. Son las desviaciones de los estratos E1, E2,EK.

119
La proporcionalidad se definir de la siguiente forma:
n1
N1 1

n2
N 2 2

nk
Nk k

Donde los tamaos muestrales se definen de la siguiente manera:


ni =

n * N1 1
N11 + N22 +.NKK

N1 + N2 +. NK = N (Poblacin)
n Muestra.
EJEMPLO # 3.
Se debe de tomar una muestra de tamao 84 de una poblacin de 10.000, agrupadas en 3
estratos de tamao 5.000, 2.000, y 3.000 y con desviaciones respectivas de 15, 18, y 5.
Qu tan grandes deben de ser las muestras que se deben de obtener para lograr un muestreo
ptimo?

SOLUCIN:
n = 84
N =10.000
N1 = 5.000
N2 = 2.000
N3 = 3.000
1 = 15
2 = 18
3 = 5
n1 =

84 (5.000) (15)
(5.000)(15)+ (2.000) (18)+ (3.000) (5)

n1 =
n1 =

6300000
75000 + 36000 + 150000
6300000
126000

n1 = 50
n2 =

84 (2.000) (18)
(5.000)(15)+ (2.000) (18)+ (3.000) (5)

120
n2 =
n2 =

3024000
75000 + 36000 + 150000
3024000
126000

n2 = 24
n3 =

84 (3.000) (5)
(5,000)(15)+ (2,000) (18)+ (3,000) (5)

n3 =

1260000
75000 + 36000 + 150000

n1 =

1260000
126000

n3 = 10
SIN CONSIDERAR
ni = Ni (n)
N
n1 = N1 (n) = 5,000 (84) = 42
N
10,000
n2 = N2 (n) = 2,000 (84) = 17
N
10,000
n3 = N3 (n) = 3,000 (84) = 25
N
10,000

DISTRIBUCIONES MUESTRALES.
Si consideramos todas las muestras posibles de tamao n que se pueden extraer de una
poblacin de tamao N y para cada una de ellas se calcula el promedio aritmtico, seguramente
este variara de muestra a muestra.
Por lo tanto el promedio es una variable aleatoria como lo pueden ser el rango, la variancia, la
desviacin estndarS, la mediana, el modo, etc.
A todo elemento que es funcin de los valores de los datos de una muestra se denomina
estadstico, entonces todo estadstico tiene una distribucin de probabilidad que se le
denomina distribucin muestral.

121

DISTRIBUCION MUESTRAL DEL PROMEDIO ARITMETICO

Si extraemos sin reemplazo todas las muestras posibles de tamao n de una poblacin
de tamao N, se podr demostrar empricamente que los parmetros de la distribucin
muestral del promedio aritmtico se podr representar por
y que los parmetros
poblacionales sern y , definindose las siguientes expresiones para su calculo.

X =

Lo anterior solo ser aceptado si el tamao de la muestra es grande, aceptndose como


suficiente que n>30, cuando n<30 se denomina muestra pequea y se requiere del empleo de
distribuciones especificas (tstudent, x2chicuadrada, Fficher).
Para muestras grandes se puede demostrar la distribucin muestral del promedio
aritmtico sigue aproximadamente una ley normal con parmetros
,
independientemente de cmo vari la variable aleatoria X asociada ala poblacin y de acuerdo
al teorema del limite central.
Si la variable aleatoria X se conoce que es normal, la distribucin muestral del
promedio tambin ser normal para muestras pequeas.

EJEMPLO # 4.
Una poblacin finita esta formada por los nmeros 1, 2, 3, 4, 5 determine los
parmetros de la distribucin muestral del promedio, considerando las muestras de tamao 3
obtenidas sin reemplazo.
Determine los parmetros en funcin de todas las muestras y compare con las formulas
directas.

122

SOLUCION:
n=3

N =5

De muestras = N C n =

N! =
n! (N-n)!

5! = 10
3! 2!

MUESTRAS
1
1
1
2
2
3
3
4
4
5

2
2
2
3
3
4
4
5
5
1

3
4
5
4
5
5
1
1
2
3

2
7/3
8/3
3
10/3
4
8/3
10/3
11/3
3

(2 - 3) 2 = 1
(7/3 3) 2 = 4 / 9
(8/3 3) 2 = 1 / 9
(3 3) 2 = 0
(10/3 3) 2 = 1 / 9
(4 3) 2 = 1
(8/3 3) 2 = 1 / 9
(10/3 3) 2 = 1 / 9
(11/3 3) 2 = 4 / 9
(3 3) 2 = 0

= 30

= 30 / 9

= 30
10

x
=
de datos

1+2+3+4+5
5

= 3

= 3

123

CALCULAR EN FUNCION DE LA FORMULA.


POBLACION FINITA.

2 = (1 - 3)2 + (2 - 3)2 + (3 - 3)2 + (4 -3)2 + (5 - 3)2


5
2 = 4+1+0+1+4 = 2
5
= 2
= 1.41

Por lo tanto son correctas las formulas.

EJEMPLO # 5.
En una bodega se tienen 5,000 varillas, el peso promedio de cada varilla es de 5.02 Kg. con la
desviacin estndar de 0.3kg.
Encuentre la probabilidad de que en una muestra de tamao de 100 varillas se tenga un peso
total.
a) entre 496 y 500 Kg.
b) de ms de 510 Kg.

124

SOLUCION:
Np = 5,000 = 5.02kg = 0.3 Kg.
n = 100
Como n = 100 > 30 (Muestra grande) Distribucin muestral del
Promedio aritmtico (Normal)

Por lo que la estimacin se har.

a).- Peso total entre 496 y 500


Peso por cada varilla

125

GRAFICA:

= 0.4778 0.2486
= 0.2292.
22.92% de probabilidad de que el peso total este entre 496 y 500kg en la muestra.
b).- De ms de 510kg
Peso por cada varilla

GRAFICA.

126

P = (0.5 0.4963
P = 0.0037.

DISTRIBUCION MUESTRAL DE DIFERENCIAS DE PROMEDIOS

En la practica es frecuente que se pueda presentar el caso de tener datos de dos


poblaciones con variables aleatorias asociadas x, y, surgiendo la pregunta de que si estas
pueden ser consideradas como una sola, es decir x = y o sea que no hay diferencia significativa
y que las poblaciones se pueden considerar iguales.
Para probar estadsticamente estas hiptesis es necesario conocer los parmetros de
la distribucin muestral de la diferencia de promedios.
Si
son los promedios obtenidos de muestras aleatorias de tamao nx, ny de 2
poblaciones con variables aleatorias x, y, y si los parmetros poblacionales son x, x y y, y
se podr demostrar las siguientes expresiones para la diferencia de los promedios.

EJEMPLO # 6.
Considere una poblacin x que tiene 3 muestras posibles y cuyos promedios son 3, 7,8.
Una poblacin y formada por 2 muestras posibles de promedio 2 y 4. Obtenga los
parmetros de la distribucin muestral de la diferencia de los promedios.

SOLUCION:
X 3 Muestras

3, 7, 8.

127
Y 2 Muestras

2, 4.

1ER PROCEDIMIENTO.
En funcin de todas las muestras

3
3
7
7
8
8

2
4
2
4
2
4

=
=
=
=
=
=

1
-1
5
3
6
4

= (1-3)2 + (-1-3)2+ (5-3)2+ (3-3)2+ (6-3)2+ (4-3)2


6

2DO PROCEDIMIENTO.
Se acepta que

128

En funcin de todo

= (3 - 6)2 + (7 6)2 + (8 6)2 = 14


3
3

= (2 3)2 + (4 3)2 = 2 = 1
2
2

TEORIA ESTADISTICA DE LA ESTIMACIN.


La diferencia estadstica, es decir, sacar conclusiones poblacionales a partir del
estudio de muestras, se puede llevar acabo de 2 maneras:

129
A).- Por medio de la teora de la estimacin, ya sea puntual o por intervalo de confianza.
B).- Por medio de las pruebas de hiptesis.
TEORIA DE LA ESTIMACIN
Es la inferencia estadstica que consiste en estimar los valores de los parmetros de la
poblacin a partir de estadsticos de la muestra. Un estimador es una regla que nos dice como
calcular la estimacin basada en la informacin contenida en la muestra y expresada mediante
una formula.
ESTIMADORES PUNTUALES.
Se denomina as ya que se estima el parmetro de la poblacin basado en un solo valor
de una estadstica.
Cuando la media de la distribucin muestral de un estadstico es igual al parmetro que
se esta estimando de la poblacin, el estadstico ser un estimador insesgado del parmetro,
en caso contrario ser sesgado.
Si el estadstico de la muestra tiende a ser igual al parmetro de la poblacin a medida
que aumenta el parmetro de la muestra, se tendr un estimador consistente del parmetro
por ejemplo: El promedio es un estimador insesgado y consistente de la media, en cambio la
variancia es un estimador sesgado y consistente de la variancia poblacional.
Si la distribucin muestral de varios estadsticos tienen el mismo valor que la media, el
estadstico con menor variancia es un estimador eficiente de dicha media, caso contrario ser
ineficiente.
Por ejemplo el promedio es un estimador eficiente de la media de poblacin, pero la
mediana es un estimador ineficiente de dicho parmetro, ya que las distribuciones muestrales
del promedio y la mediana cuentan con medias iguales, sin embargo la varianza en su
distribucin muestral es mayor en la mediana que en el promedio.
ESTIMACION PUNTUAL DE LA MEDIA DE UNA POBLACIN.
En la prctica la estimacin nos puede conducir a estimar la media de una poblacin,
por lo que la estimacin de es una aplicacin prctica de la inferencia estadstica. Hemos
aceptado que el valor esperado del promedio aritmtico es igual a la media de la poblacin con
un error estndar.

130

Siendo un estimador insesgado, consistente y eficiente.


Si seleccionamos muestras de tamao n de una poblacin, y calculamos su promedio
,
e inducimos la estimacin a la media poblacional, tendremos una estimacin puntual del
estadstico
pero dicha estimacin puntual presenta un error de estimacin que es la
diferencia particular entre la estimacin efectuada y el parmetro que se esta estimando y que
se llama cota del error, es decir
Estimador puntual.
Estimador:

Cota del error

Esto es aplicable para muestras grandes.


EJEMPLO # 7.
Se desea estimar la produccin diaria de un producto elaborado en una planta. Para un
periodo de 50 das la produccin diaria tuvo una media y desviacin estndar de 871 toneladas
y 21 toneladas.
Estime la produccin diaria =?
n = 50 > 30 por lo tanto es una muestra grande.

S = 21 toneladas
Estimar =?
La estimacin puntual sera:

Se aceptara por la siguiente cota.

Estimando Np

131
Se acepta la estimacin.
En el rango

871 5.94
865 a 877
ESTIMACIN POR INTERVALOS DE CONFIANZA PARA LOS PARAMETROS DE
UNA POBLACIN.
La estimacin de un parmetro de una poblacin mediante un par de nmeros entre los
cuales se encuentra, con una cierta probabilidad, al valor de dicho parmetro se le llama
estimacin del intervalo del mismo.
Si S es un estadstico obtenido de una muestra de tamao n para estimar el valor del
parmetro donde S es la desviacin estndar, conocida o estimada, de su distribucin
muestral, la probabilidad 1 de que el valor de se encuentre en el intervalo de S Z C S a S
+ ZC S donde:
ZC = a una constante la cual se podr escribir de la siguiente manera.
P [S ZC S S + ZC S] = 1-
Si se fija el valor de 1 se podr obtener el valor de Z C necesario para satisfacer
dicha ecuacin, con lo cual se podr definir el intervalo de confianza del parmetro a un nivel
de confianza de 1 .
La constante ZC que fija el intervalo de confianza se le conoce como valor critico y si el
comportamiento del estadstico S es normal debido a que se maneja una muestra de tamao
grande mayor que 30, entonces ZC se deduce de las tablas de la curva normal en una prueba de
2 colas ya que se trata de un intervalo de confianza.
Valor de Zc para diferentes 1 .

GRAFICA.

132

TABLA.

1 .
99.73
99
98
96
95.45
95
90
80
68.27
50

ZC
3.0
2.58
2.33
2.05
2
1.96
1.64
1.28
1
0.674

ESTIMACIN DE INTERVALOS DE CONFIANZA PARA EL PROMEDIO.


Los lmites del intervalo de confianza para la media de una poblacin con variable
aleatoria X asociada estarn definidos por la expresin

Si
tiene distribucin normal los valores de Z C se obtendrs de la tabla anterior
para diferentes niveles de confianza.
Por ejemplo
1 = 0.95

1 = 0.99

Es decir los lmites de confianza para la media poblacional se definen de la siguiente


manera

133

Poblacin Finita

EJEMPLO # 8.
Las mediciones de los dimetros de una muestra aleatoria de 100 tubos de albaal
mostraron una media de 32 cm. con desviacin estndar de 2 cm. obtenga los intervalos de
confianza del 95 y 97 % para dimetros medios de todos los tubos producidos.
SOLUCION:
N = 100 > 30 normal.

S = 2 cm.
a).- (1 ) = 0.95
=?
No conocemos Np
Se estima Np
Trabajando con la formula infinita
1 = 0.95

1 - = 0.95 ZC = 1.96
Desconocemos , se estima
= S =2
32 1.96 (2/100) 32 + 1.96 (2 / 100)

134

31.608 32.408
Intervalo de confianza a un nivel del 95%
b).- (1 ) = 0.97
Para el 97% hay que ir a la tabla (se deja a el alumno que lo realice).
EJEMPLO # 9.
En una muestra aleatoria de 50 calificaciones de un examen de admisin se obtuvo un promedio
aritmtico de 72 puntos con desviacin de 10 puntos. Si el examen se aplico a 1018 personas
determine:
A).- El intervalo de confianza del 95% para la media del total de calificaciones.
B).-El tamao de la muestra n necesario para que el error de la estimacin de la media
poblacional no exceda de 2 puntos a un nivel de confianza del 95%.
C).- El nivel de confianza 1 para el cual la media de la poblacin se encuentren en 721
puntos, con una muestra de n =50
SOLUCION:
n = 50 > 30 normal de su distribucin muestral.

S = 10
Np = 1018 Poblacin finita

a).- Intervalo de confianza del 95%


Estimacin s S = =10

135
ZC = 1.96 Para [(1 - ) = 0.95]

= 69.3 74.7

b).- n error 2 puntos, (1 - ) = 95%

Se busca que no exceda de 2 puntos

(1.96 / n (1018 n / 1017))2 < (2)2


384.16 (1018 n) < 4
n
1017
n 87.84
Tamao de la muestra mnimo n > 88
Habr una confianza del 95% para que 70 74.
c).- (1-) =?,
n = 50
71 73

72 1

136

72 1.379 ZC
1.379 ZC = 1
ZC =

1
= 0.72
1.379
GRAFICA.

(1 ) = 2 (0.2642)
(1 ) = 0.5284
Por lo tanto habr una confianza del 52.84%

PRUEBAS DE HIPTESIS ESTADSTICA.


Supngase que una empresa de transporte urbano esta en la disyuntiva de emplear un
nuevo gobernador de velocidades en sus unidades a los que regularmente utiliza, y que su
departamento de control de calidad debe decidir, con base en la informacin de las muestras
de las dos marcas distintas. Las decisiones de este tipo, es decir, que se basa en estudios
estadsticos, reciben el nombre de decisiones estadsticas, y a los procedimientos que
permiten decidir si se acepta o rechaza una hiptesis se les llama pruebas de hiptesis,
pruebas de significancia o reglas de decisin.
Al tomar decisiones estadsticas, es necesario postular las diversas alternativas o
cursos de accin que pueden adoptarse.
En el caso particular de una prueba de hiptesis solamente se tienen dos cursos de
accin posibles, los que se denotarn como H 0 y H1. A la accin H0 se le llama hiptesis nula, y a
la H1, hiptesis alternativa. Por ejemplo, si la hiptesis nula establece que 1 = 2, la hiptesis
alternativa puede ser una de las siguientes:

137
1 > 2, 1 2 o 1 2
Al realizar una prueba de hiptesis, se prueba siempre la verdad de la hiptesis nula
H0, aun cuando de antemano se desee rechazarla.
ERRORES DE LOS TIPOS I y II. NIVEL DE SIGNIFICANCIA.
En muchas ocasiones se presenta el caso de que se rechaza una hiptesis nula cuando
en realidad debera ser aceptada; cuando esto sucede se dice que se ha cometido un error de
tipo I.
En otras ocasiones se acepta una hiptesis nula siendo en realidad falsa; en este caso se dice
que se ha cometido un error de tipo II.
Al probar una hiptesis nula, a la mxima probabilidad con la que se est dispuesto a
cometer un error del tipo I se le llama nivel de significancia, , de la prueba, el cual dentro de
la prctica se acostumbra establecer de 5 por ciento (0.05) o 10 por ciento (0.1). El
complemento del nivel de significancia, 1- , se conoce como nivel de confianza.
Si, por ejemplo, al realizar una prueba de hiptesis se escoge un nivel de significancia
de 10 por ciento, significa que existen 10 posibilidades en 100 de que se rechace sta cuando
debera ser aceptada; es decir, que se rechaza a un nivel de significancia del 10 por ciento, y
que la probabilidad de que la decisin haya sido errnea es de 0.1.
COMPORTAMIENTO DE LOS ERRORES TIPO I Y II.
Supngase que se trata de probar la hiptesis nula de que la media, S, de la
distribucin muestral de la estadstica S es 1, en contra de la hiptesis alternativa que
establece que S = 2, donde 2>1, es decir
H0 : S = 1
H1 : S = 2
En la figura 13.1 se muestra en forma grafica la relacin entre los errores tipo I y II
en el caso en el que la regla de decisin para aceptar o rechazar H 0 es la siguiente:
Si el valor de la estadstica S obtenido de una muestra excede de cierto valor critico
S1, rechcese H0; en caso contrario acptese.
Es evidente que si H0 es verdadera, entonces (rea con rayado doble) es la
probabilidad de que S > S1, o sea la de rechazar a H0 siendo verdadera (error tipo I). Por otro
lado, si H1 es verdadera, entonces (rea con rayado sencillo) es la probabilidad de que S < S 1,
o sea la de aceptar H0 siendo falsa (error tipo II).
Obsrvese que si se aumenta el valor de S1 se reduce la probabilidad , pero se
incrementa la ; lo contrario sucede si se disminuye el valor de S 1.

138

P[S>S1] = (error tipo I)


P[S<S1] = (error tipo II)
Fig.13.1 Probabilidades de los errores tipo I y II en pruebas de hiptesis.
En realidad, la nica forma posible en la cual se pueden minimizar simultneamente los
errores de tipos I y II es aumentando el tamao de la muestra, para hacer ms picudas las
distribuciones muestrales de la estadstica bajo las hiptesis H 0 y H1.
Al observar la figura 13.2 siguiente, es posible concluir que el tamao de los errores I y
II es menor para un tamao de muestra igual a 100 que para un tamao igual a 50,
considerando la misma regla de decisin anterior.

139

Figura 13.2

Sin embargo, esta tcnica de reduccin simultnea de mbos tipos de errores no


siempre puede ponerse en prctica, debido a razones de costo, tiempo, etc.

REGIONES CRTICAS, DE RECHAZO O DE SIGNIFICANCIA. REGIONES DE


ACEPTACIN.
Cuando una hiptesis nula no se acepta se dice que se rechaza a un nivel de
significancia del por ciento, o que el valor estandarizado de la estadstica involucrada es
significativo a un nivel de significancia .
Al conjunto de los valores de la estadstica en el que se rechaza la hiptesis nula se le
denomina regin crtica, de rechazo, o de significancia. Por el contrario, al conjunto de los
valores de la estadstica en el que se acepta la hiptesis se le llama regin de aceptacin.
Considrese que la distribucin muestral de la estadstica S es normal con desviacin
estndar S, que la variable Z resulta de estandarizar a S , que la hiptesis nula , H 0, es que la
media de S vale S, y que la hiptesis alternativa H1es que dicha media es diferente de S , es
decir que

H0: media de la distribucin muestral de S = S


H1: media de la distribucin muestral de S S
Si se adopta la regla de decisin de aceptar la hiptesis H 0, si el valor de Z cae dentro
del intervalo central que encierra al 99 por ciento del rea de la distribucin de
probabilidades, entonces H0 se aceptar en el caso en que

140
-2.58 < Z < 2.58
Empleando la tabla de rea bajo la curva normal estndar. Pero si el valor
estandarizado de la estadstica se encuentra fuera de dicho intervalo, se concluye que el
evento puede ocurrir con probabilidad de 0.01 si la hiptesis H 0 es verdadera (rea rayada
total de la figura 14.1). En tal caso, el valor Z de la variable estndar difiere
significativamente del que se podra esperar de acuerdo con la hiptesis nula, lo cual inclina a
rechazarla a un nivel de confianza del 99 por ciento.
De lo anterior se deduce que el rea total rayada de la figura 14.1 es el nivel de
significancia de la prueba, y representa la probabilidad de cometer un error del tipo I. Por
ello, la regin de aceptacin de H0 es -2.58 < Z < 2.58, y la de rechazo es Z > 2.58 Y Z < -2.58.

Figura. 14.1 Regin de significancia.


En la tabla 14.1 se presentan los valores de la variable estandarizada, Z, que limitan las
regiones de aceptacin y de rechazo para el caso en el que la estadstica involucrada en la
prueba tenga distribucin muestral normal. Cuando en alguna prueba de hiptesis se
consideren niveles de significancia diferentes a los que aparecen en la tabla mencionada,
resulta necesario emplear la de rea bajo la curva normal estndar.

TABLA 14.1 VALORES CRITICOS DE Z


Niveles de significancia,
0.1

Valores de z para pruebas de


una cola.
-1.284 o 1.284

Valores de z para pruebas de


dos colas.
-1.645 y 1.645

141
0.05
0.01
0.005

-1.645 o 1.645
-2.326 o 2.326
-2.575 o 2.575

-1.960 y 1.960
-2.575 y 2.575
-2.810 y 2.810

PRUEBAS DE UNA Y DE DOS COLAS.


En la prueba de hiptesis del ejemplo anterior, la regin de rechazo de la hiptesis nula
qued en ambos extremos (colas) de la distribucin muestral de la estadstica involucrada en la
prueba; a las pruebas de este tipo se les denomina pruebas de dos colas. Cuando la regin de
rechazo se encuentra solamente en un extremo de la distribucin muestral en cuestin, se les
llama pruebas de una cola.
Las pruebas de dos colas se presentan cuando en la hiptesis alternativa aparece el
signo (diferente de), como en el siguiente caso.
H0 : S = 1
H1 : S 2
En donde S es la media de la estadstica S, y 1 es un valor fijo.
En los casos
H0 : S = 1
H1 : S < 1
Y
H0 : S = 1
H1 : S > 1
Las pruebas resultan de una cola.

PRUEBAS DE HIPTESIS PARA LA MEDIA.


Para el caso de una poblacin infinita (o finita en que se muestre con reemplazo), cuya
desviacin estndar se conoce o se puede estimar adecuadamente, si se tiene que la
estadstica S obtenida de la muestra es el promedio aritmtico, entonces la media de su
distribucin muestral es S = X = , y su desviacin estndar es S = X = / n, en donde y
son, respectivamente, la media y la desviacin estndar de la variable aleatoria X asociada a
la poblacin, y n es el tamao de la muestra. En tal caso, si
tiene distribucin normal, la
variable estandarizada correspondiente ser
.

142
Para el caso de muestreo sin reemplazo de poblacin finita, se tiene
que

en donde N P es el tamao de la

Poblacin, por lo que la variable estandarizada ser

En los dos casos anteriores, el valor de Z correspondiente al de de la muestra es el


que se debe comparar con el valor crtico correspondiente al nivel de significancia fijado, para
as aceptar o no la hiptesis nula (prueba de una cola). Si se trata de una prueba de dos colas,
el valor de Z se debe comparar con los dos valores crticos que corresponden al valor de
seleccionado.
En cualquiera de los casos anteriores, el valor o valores crticos se pueden obtener de
la tabla 14.1, para valores comunes de .

EJEMPLO:
Se sabe que el promedio de calificaciones de una muestra aleatoria de tamao 100 de
los estudiantes de tercer ao de ingeniera civil es de 7.6, con desviacin estndar de 0.2.
Si denota la media de la poblacin de esas calificaciones, X, Y si se supone que
tiene
distribucin normal, probar la hiptesis = 7.65 en contra de la hiptesis alternativa 7.65,
usando un nivel de significancia de
a. 0.05
b. 0.01
Para la solucin se deben considerar las hiptesis
H0 : = 7.65
H1 : 7.65
Puesto que 7.65 incluye valores menores y mayores de 7.65, se trata de una prueba
de dos colas.
La estadstica bajo consideracin es el promedio aritmtico, , de la muestra, que se supone
extrada de una poblacin infinita. La distribucin muestral de
tiene media
,y
desviacin estndar
,

143
en donde y denotan, respectivamente, la media y la desviacin estndar de la poblacin de
calificaciones.
Bajo la hiptesis H0 (considerndola verdadera), se tiene que

= 7.65 =

Y utilizando la desviacin estndar de la muestra como una estimacin de , lo cual se supone


razonable por tratarse de una muestra grande,
X = / n = 0.2 / 100 = 0.2 /10 = 0.02
a).- Para la prueba de dos colas a un nivel de significancia de 0.05 se establece la siguiente
regla de decisin
Aceptar H0 si el valor Z correspondiente al valor del promedio de la muestra se encuentra
dentro del intervalo de -1.96 a 1.96 (tabla 14.1). En caso contrario, rechazar H0.
Puesto que

Se encuentra fuera del rango de -1.96 a 1.96, se rechaza la hiptesis H 0 a un nivel de


significancia de 0.05.
b).-Si el nivel de significancia es 0.01, el intervalo de -1.96 a 1.96 de la regla de decisin del
inciso se remplaza por el de -2.58 a 2.58 tabla (14.1). Entonces, puesto que el valor muestral
Z = -2.5 se encuentra dentro de este intervalo, se acepta la hiptesis H 0 a un nivel de
significancia de 0.01.

EJEMPLO:
La resistencia media a la ruptura de cables de acero fabricados por la empresa x es de
905 Kg. Una empresa consultora sugiere a x que cambie su proceso de manufactura, con lo cual
incrementar la resistencia de sus cables. Se prueba el nuevo proceso, y se extrae una muestra
aleatoria de 50 cables, obtenindose para ellos una resistencia promedio de 926 kg, con
desviacin estndar igual a 42 kg. Se puede considerar que el nuevo proceso realmente
incrementa la resistencia, con un nivel de confianza del 99%?
En este caso, se debe plantear una prueba de hiptesis de una cola, para la cual
H0 : = 905 Kg.
H1 : > 905 Kg.

144
Puesto que el tamao de la muestra es suficientemente grande, se puede aproximar la
distribucin muestral de la resistencia promedio mediante una normal, y estimar el valor de
de la poblacin mediante SX de la muestra.
Considerando a la poblacin infinita, y suponiendo como verdadera a H 0, se tiene que

Para la prueba de una cola a un nivel de significancia de = 1 (1 ) = 1 0.99 = 0.01, la


regla de decisin es
Aceptar H0 si el valor estandarizado de x de la muestra es menor o igual a Z c = 2.326
(tabla 14.1); en caso contrario, rechazar H0.
En virtud de que

Es mayor de 2.326, se rechaza H 0 a un nivel de significancia de 1 %, concluyndose que en


realidad el nuevo proceso s incrementa la resistencia de los cables.

PRUEBAS DE DIFERENCIAS DE MEDIAS


Sean
y
los promedios aritmticos obtenidos de dos muestras de tamaos n X Y nY,
extradas respectivamente de dos poblaciones con medias X y Y, y desviaciones estndar X y
Y.
Se trata de probar la hiptesis nula, H 0, de que no existe diferencia entre las medias,
es decir, que X = Y. Si nX y nY son suficientemente grandes (>30), la distribucin muestral de
las diferencias de los promedios es aproximadamente normal. Dicha distribucin muestral es
rigurosamente normal si las variables aleatorias x y y asociadas a la poblacin tienen
distribucin normal, aunque nX y nY sean menores de 30. Para esta distribucin muestral, la
variable estandarizada Z, que se compara con los valores crticos correspondientes, se
encuentra dada por

Con la cual se puede probar la hiptesis nula H 0 en contra de otras hiptesis


alternativas, H1, a un nivel apropiado de significancia.
EJEMPLO:

145

En el laboratorio de pruebas de una empresa fabricante de aparatos electrnicos se


ensayaron dos marcas de transistores, A y B, de caractersticas similares, con objetos de
comprobar su ganancia de voltaje. Se tomaron muestras aleatorias de 100 transistores de cada
marca, arrojando una ganancia promedio de 31 decibeles, con desviacin estndar de 0.3
decibeles para la marca A, y 30.9 decibeles de ganancia promedio, con desviacin estndar de
0.4 decibeles para la otra. Existe una diferencia significativa entre las ganancias en voltaje
de los transistores a un nivel de significancia de a. 0.05 y b. 0.01?
Si A y B son las medias respectivas de las dos poblaciones infinitas a las que
corresponden las muestras, la prueba de hiptesis adopta la forma siguiente:
H0: A = B
H1: A B
a.

puesto que se trata de una prueba de dos colas a un nivel de significancia del 0.05, la
diferencia es significativa si el valor de z se encuentra fuera del intervalo de -1.96 a
1.96. Como este es el caso, puede concluirse que efectivamente existe diferencia
significativa en ganancia en voltaje de los transistores.
b. Si la prueba es a un nivel de significancia del 0.01, la diferencia es significativa si z se
encuentra fuera del rango de -2.58 a 2.58, partiendo del hecho de que z = 2, la
diferencia entre las ganancias es producto del azar, y se acepta la hiptesis de que
ambos tipos de transistores tienen igual ganancia media en voltaje a un nivel de
confianza del 99%.
Ejemplo.
La estatura promedio de 50 estudiantes varones tomados al azar que participan en
actividades deportivas es de 173 cms, con desviacin estndar de 6.3 cms. Otra muestra
aleatoria de 50 estudiantes varones que no participan en este tipo de actividades tiene
promedio de estatura igual a 171 cms, con desviacin estndar igual a 7. cms. Para probar la
hiptesis de que los estudiantes varones que practican deportes son ms altos que los que no lo
hacen, a un nivel de significancia de 0.05.
Se debe decidir entre las hiptesis:
Ho : x
H1 : x
Siendo x la variable aleatoria asociada a
que practican deportes, y Y la asociada a la de
infinita.

= y
> y
la poblacin infinita de estaturas de alumnos
estudiantes que no lo hacen, que tambin es

Bajo la hiptesis H o, se tiene:


x = 0

146
x = (x / nx) + (Y / ny) = (6.3/50+7.1/50)
= 1.3424
z = (173 - 171) / 1.3424 = 1.489
Se trata de una prueba de una cola y puesto que Z < Zc se concluye que la diferencia
de estaturas se debe nicamente al azar.

Você também pode gostar