Você está na página 1de 177

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA


UNIDAD DE CIENCIAS BSICAS

AUTORES
JORGE ELIECER RONDN
MILTON FERNANDO ORTEGN PAVA
EMERSON ALEXANDER CHAPARRO SUESCA

211622 ESTADSTICA Y PROBABILIDAD

BOGOT, JULIO 2012


TABLA DE CONTENIDO
PRESENTACIN ............................................................................................................ 4
UNIDAD UNO: ESTADSTICA DESCRIPTIVA
CAPTULO 1. INVESTIGACIN ESTADSTICA ..................................................................... 7
Leccin 1: Historia de la
Estadstica
..7
Leccin 2: Conceptos fundamentales: poblacin, muestra, variable estadstica, datos y medicin117
Leccin 3: Recoleccin de la informacin: Censos, encuestas. .......................................................... 15
Leccin 4: Organizacin: tablas de frecuencias .................................................................................. 17
Leccin 5: Presentacin de la informacin: histogramas, polgonos, ojivas y caja y bigote. .............. 30
CAPTULO 2. ANLISIS MATEMTICO DE LA INFORMACIN......................................... 41
Leccin 6: Parmetros y Estadsticos .................................................................................................. 41
Leccin 7: Medidas de tendencia central: La media, la mediana y la moda ....................................... 41
Leccin 8: Medidas de dispersin: Rango, Varianza, Desviacin tpica, coeficiente de variacin, puntaje
estandarizado. ...................................................................................................................................... 63
Leccin 9: Medidas de forma: Asimetra y Curtosis. ............................................................................ 70
CAPTULO 3. ANLISIS DE REGRESIN ........................................................................... 80
Leccin 10: Regresin ......................................................................................................................... 80
Leccin 11: Relacin y Correlacin ...................................................................................................... 85
Leccin 12: Regresin Mltiple. ........................................................................................................... 88
UNIDAD DOS: PRINCIPIOS DE PROBABILIDAD ....................................................... 92
CAPTULO 4: FUNDAMENTACIN EN PROBABILIDAD .................................................... 93
Leccin 13: Historia de la Probabilidad
Leccin 14: Experimento Aleatorio, Evento Suceso, Espacio muestral. ......................................... 93
Leccin 15: Principios matemticos aplicados a fenmenos aleatorios: Operaciones entre conjuntos y
propiedades. ....................................................................................................................................... 100
Leccin 16: Definicin de probabilidad: Clsica, frecuentista y Axiomtica. ..................................... 103
CAPITULO 5: TCNICAS DE CONTEO.............................................................................. 107
Leccin 17: Principio fundamental del conteo ................................................................................... 107
Leccin 18: Regla de la multiplicacin ............................................................................................... 109
Leccin 19: Permutaciones y variaciones .......................................................................................... 110
Leccin 20: Combinaciones ............................................................................................................... 113
CAPITULO 6: PROPIEDADES BSICAS DE LA PROBABILIDAD ................................... 115
Leccin 21: Interpretaciones de la probabilidad ................................................................................ 115
Leccin 22: Axiomas de probabilidad: regla de la adicin ................................................................. 116
Leccin 23: Independencia de Sucesos, regla de la multiplicacin ................................................... 118
Leccin 24: Probabilidad condicional ................................................................................................. 120
Leccin 25: Probabilidad total y teorema de Bayes ........................................................................... 123
UNIDAD TRES: VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD
.................................................................................................................................... 126
CAPITULO 7: VARIABLES ALEATORIAS ......................................................................... 127
Leccin 26: Concepto intuitivo y matemtico de variable aleatoria ................................................... 127
Leccin 27: Distribucin discreta de probabilidad: Distribucin de probabilidad y funcin de distribucin
acumulada .......................................................................................................................................... 128

Pgina 2 de 177
Leccin 28: Distribucin contina de probabilidad: funcin de densidad y funcin de distribucin acumulada
............................................................................................................................................................ 131
Leccin 29: Esperanza matemtica y varianza de variables aleatorias ............................................ 133
Leccin 30: Teorema de Chbyshev ................................................................................................. 138
CAPTULO 8: DISTRIBUCIONES DE PROBABILIDAD DISCRETA .................................. 140
Leccin 31: Distribucin uniforme discreta ........................................................................................ 140
Leccin 32: Distribucin Binomial y Poisson ..................................................................................... 154
Leccin 33: Distribucin binomial negativa ............................................ Error! Marcador no definido.
Leccin 34: Distribucin Geomtrica e Hipergeomtrica ....................... Error! Marcador no definido.
CAPTULO 9: DISTRIBUCIONES DE PROBABILIDAD CONTINUA .................................. 154
Leccin 35: Distribucin uniforme continua ....................................................................................... 154
Leccin 36: Distribucin normal y sus aplicaciones. .......................................................................... 155
Leccin 37: Distribucin exponencial ................................................................................................. 164
Leccin 38: Distribucin Ji cuadrado .............................................................................................. 169
Leccin 39: Distribucin T student. .................................................................................................... 171
Leccin 40: Distribucin de Fisher ..................................................................................................... 173

Pgina 3 de 177
PRESENTACIN
El presente modulo est dirigido a estudiantes de programas de grado que oferta la UNAD, bajo la modalidad
de educacin superior a distancia (e Learnig). El material est estructurado en unidades macro del curso
acadmico. El contenido de cada una de las partes fue seleccionado, teniendo en cuenta los saberes mnimos
que se esperara debe alcanzar un estudiante de la Universidad Nacional Abierta y a Distancia en el campo de
matemticas y estadstica.

La propuesta permite que los estudiantes reconozcan los conocimientos mnimos del curso en mencin, que le
permita resolver situaciones propias del mismo y adems, abordar posteriores temticas que requieran de
stos conocimientos.

El material se caracteriza porque en cada leccin se presentar ejemplos modelos del tema en estudio, al final
de cada captulo se exponen ejercicios; que permite la profundizacin de los temas. Al final de la unidad se
presenta una Autoevaluacin de un nivel medio-alto, las cuales permiten verificar los alcances de los
estudiantes en las temticas analizadas y detectar las debilidades y as centrarse en stas, con el fin de
alcanzar las metas propuestas. Lo anterior, pretende servir como gua de aprendizaje autnomo, se
recomienda apoyar este proceso por medio de lecturas especializadas, ayudas audiovisuales, visitas a sitios
Web y prcticas de simulacin; entre otros, as lograr una efectiva comprensin, interiorizacin y aplicacin de
las temticas estudiadas.

La Estadstica es una disciplina que se aplica en muchos campos de la actividad del ser humano. Es muy
frecuente encontrarse en las diferentes disciplinas del saber con incertidumbres como el pronosticar el
crecimiento poblacional de un pas, el crecimiento econmico de una empresa o el crecimiento de produccin y
venta de un producto especfico, el conocer la efectividad de diferentes abonos en el campo agrario, el
determinar la tendencia de contaminacin del agua o el aire, la clasificacin de personal en una empresa para
efectos de una buena y sana poltica laboral, etc.

La Estadstica Descriptiva, en el que los datos son ordenados, resumidos y clasificados con objeto de tener una
visin ms precisa y conjunta de las observaciones, intentando descubrir de esta manera posibles relaciones
entre los datos, viendo cules toman valores parecidos, cules difieren grandemente del resto, destacando
hechos de posible inters, entre otros.

En todos los campos de la investigacin se requiere a menudo el uso racional de los modelos matemticos y
mtodos estadsticos. Los procesos de planeacin, control y toma de decisiones en Ingeniera, economa,
administracin y otros campos, se basan en resultados obtenidos mediante el anlisis estadstico de los
fenmenos en ellos involucrados. El acelerado desarrollo de mtodos, tcnicas y tecnologas para el ptimo
anlisis de datos justifica que un profesional disponga de una slida fundamentacin conceptual para que
realice apropiadamente su evaluacin y aporte sustentaciones a su decisin. Las interpretaciones que generan
los datos pudieran ser errneas para aquellas personas que no cuentan con criterios vlidos para captar la
informacin.

Empricamente se sabe que la Estadstica tiene que ver con datos y la manera en que estos son agrupados.
Esto se reconoce en muchos casos de la vida cotidiana que involucran informacin numrica y el contexto en
que esta informacin es dada a conocer. Aunque tambin puede darse en muchos casos que, si bien estn
relacionados con la estadstica, obedecen a otros fenmenos de disciplinas relacionadas con pero que no
conforman la Estadstica propiamente dicha.

La Estadstica es la ciencia que permite operar con un conjunto de datos y de interpretarlos. Si bien esta
definicin parece un poco ambigua, se ver ms adelante el marco en que ste mtodo se desarrolla y las
leyes que lo rigen. Pero, por ahora, se deja abierta al cuestionamiento del estudiante la gama de posibilidades
que abarca esta definicin. La Estadstica, o el mtodo de la estadstica, se divide en dos ramas: la Estadstica
Descriptiva o deductiva y la Inferencia Estadstica o estadstica inductiva. Este curso se dedica a la Estadstica

Pgina 4 de 177
Descriptiva, por lo que se hace necesario dar a conocer, en trminos generales, en qu consiste la Inferencia
Estadstica.

La Inferencia Estadstica comprende en un todo articulado el mtodo y las tcnicas necesarias para explicar
el comportamiento de un grupo de datos en un nivel superior de lo que estos datos pueden dar a conocer por s
mismos. Es decir, se puede concluir sobre el grupo de datos sobrepasando los lmites del conocimiento inicial
que estos suministran, examinando solamente una parte de la poblacin denominada muestra. Es por ello que
a la Inferencia Estadstica tambin se le conoce como Estadstica Analtica.

Si esto es as, qu le corresponde entonces a la Estadstica Descriptiva? Esta tiene por fin elevar los
aspectos caractersticos del grupo de datos pero sin intentar obtener ms conocimiento del que pueda
adquirirse por s mismos. Es por ello que la Estadstica Descriptiva es el punto de partida del anlisis de un
grupo de datos que involucran una cierta complejidad, o bien puede ser el todo de un anlisis bsico y limitado
del grupo de datos.

Enfrentarse con datos de muy diversa ndole es cosa de todos los das en cualquier prctica del ser humano.
Sin embargo, dado la cantidad innumerable de estos, no siempre se comprende el real alcance de lo que dicen.
Como parte de una base cultural necesaria para desempearse en el mundo de hoy, es requisito desarrollar
una capacidad personal para extraer y describir informacin presente en un conjunto de datos. Y es
precisamente all donde resalta la importancia del estudio del curso en cuestin.

Pgina 5 de 177
UNIDAD UNO
ESTADSTICA DESCRIPTIVA

Pgina 6 de 177
CAPTULO 1: INVESTIGACIN ESTADSTICA
Leccin 1: Historia de la Estadstica
La evolucin de la estadstica, la podemos dividir segn los periodos de la historia de la humanidad, ya que no
se puede pensar que el principio de contar es reciente.

ANTES DEL SIGLO XVI: Desde las antiguas sociedades, no se puede ignorar la necesidad de enumerar y
contar: Contar los individuos, enumerar las familias, los productos agrcolas, los hombres aptos para la guerra y
otros. En el libro Los Nmeros de la Biblia se habla de Censo, relacionado hacia lo maltito. Aunque existen
diversas versiones sobre los inicios precarios de la Estadstica, vale la pena referenciar aquellos que se
consideran de importancia por su motivacin hacia la estadstica moderna.
China: El Emperador YAO dividi su imperio en Provincias, realizando una comparacin de los bienes de cada
una, para cuantificar los impuestos. Se dice que en china se realiz un censo en el ao 2.238 A. C.
Imperio Romano: Se preocupaba por el recuento de sus ciudadanos y los bienes del estado, cuya intencin era
Tributaria y Militar. Se cree que en Roma, el primer Censo fue realizado bajo el mandato de Servio Tulio (578
534 A. C.) cuyo fin era clasificar los ciudadanos segn sus ingresos para establecer el pago de impuestos. Al
inicio del a Era Cristiana, el Emperador Augusto, realizo un Censo, quizs para seguir la lnea del pago de
impuestos.
Imperio Egipcio: Los egipcios bajo el reinado de Amasis II, obligaba a los ciudadanos a declarar su profesin y
fuentes de ingresos, bajo pena de muerte.
Los Griegos: En la Antigua Grecia los Censos eran habituales. Aristteles escribe que por cada nacimiento se
le ofreca una medida de Trigo y una de Cebada por cada fallecimiento a la Diosa Atenea.

EDAD MEDIA: Las referencias nos llevan a la provincia de Crdoba en Espaa donde Bayan Almorgerg,
realizo el primer censo de Viviendas y Edificios; se obtuvieron 113.000 Casas y 300 Mezquitas La Reina Isabel
la Catlica, encargo a Alonso de Quintanilla la labor de recopilar informacin sobre las riquezas del reino y la
cantidad de poblacin en los aos 1.477 - 1.479.

Carlomagno o Carlos I el Grande, en la Europa Medieval, para el ao 786 realizo una clasificacin de los
hombres mayores de 12 aos. Este Emperador fue el promotor del renacimiento por medio de llamado Imperio
Carolingio, donde se busco recuperar la poltica, la cultura y la religin de la Europa medieval. Retomo la
Estadstica para Europa con el fin de un manejo financiero y administrativo.

Guillermo I en Inglaterra o Guillermo el Conquistador, en su libro Domesday


Book, fue la principal fuente de registros, el cual se completo en 1.086,
considerado el Catastro de Inglaterra, documento estadstico - administrativo.
La informacin se recopilo enviando hombres de confianza a todas las
provincias para indagar sobre los bienes que posean los terratenientes, cultivos
y dems, para as poder establecer por medio de sus consejeros el pago de
tributos. Tambin se realizaron estudios estadsticos sobre navegacin y
comercio.

Siguiendo el recorrido sobre la edad media, los aportes de los trabajos


estadsticos de los Espaoles, motivaron el surgimiento de las escuelas que posteriormente Conring y
Achenwall crearon en los siglos XVII y XVIII. El principal precursor espaol fue Jernimo Uztriz, (1.670
1.732) con su obra Teora y Prctica de Comercio y Marina que sirvi como base para tomar decisiones
econmicas a partir de los datos estadsticos existentes. El no era estadstico como tal, pero su trabajo lo
haca ser estadstico.

SIGLOS XVII -XVIII: La Estadstica adquiere un estatus de ciencia y se le da gran importancia, surgen las
escuelas que dinamizaron esta ciencia hasta lo que se conoce hoy.

Pgina 7 de 177
Escuela Alemana: La creacin de esta escuela se le atribuye al Medico y
Publicista Hermann Corning (1.606 1.681) y desarrollada a lo largo de los
siglos VXII y XVIII. Su fundamento estadstico estaba en la descripcin
comparativa de los estados. Lo anterior acorde con el origen etimolgico de la
palabra Estadstica: Statu, Estado o situacin. Pero fue Godofredo Achenwall
(1.719 1.772) discpulo de Conring, quien impulso esta escuela, a l se
reatribuye el Trmino Estadstica. En su obra publicada en 1.749 mostr el
consolidado de los postulados de la nueva ciencia.

Fuente: wikipedia.org/wiki/Hermann_Conring

Escuela Inglesa: Su principal representante fue John Graunt (1.620


1.674) que en contra de la escuela alemana, publico en 1.662 su obra
Aritmtica Poltica, llamada tambin Estadstica Investigadora o
Estadstica Cientfica, la cual fue motivada por el principio pragmtico
de esta escuela, basada en el estudio de las necesidades del conocer
el desarrollo demogrfico de la poblacin londinense, que disminua por
la accin de la peste que azotaba la Ciudad.

En la obra de Graunt, conformada por 12 captulos y un prologo, analiza


los datos demogrficos con el fin de encontrar Relaciones Ocultas,
haciendo previsiones sobre mortalidad infantil y el crecimiento de la
poblacin londinense, discriminacin por genero, diferencias entre
nacimientos y muertes, entre otros. Su primera tabla de mortalidad
publicada 1.592 mostr el grado de desastre que origino la peste que se
presento en Londres. .

El Filosofo, Medico, Economista y Estadstico Ingles William Petty


(1.623 1.687) como continuador de la obra de Graunt, publica su obra
en 1.600 sobre Poltica Aritmtica, donde a partir del Censo de casas
en Londres, Estima la poblacin de la ciudad.

Pero la inquietud de los investigadores de la poca, haca pensar en soportar los principios estadsticos en
principios matemticos. Es as como el Matemtico y Astrnomo Belga Adolphe Quetelet (1.796 1.874)
introduce mtodos de anlisis para estudiar magnitudes macroeconmicas como la Renta, Consuno y otras; es
decir, aplico el razonamiento estadstico en fenmenos sociales. En los pases bajos hace estudios sobre
criminologa, mortalidad y otros aspectos propios de dicha comunidad. Por su trabajo sobre la concepcin del
hombre medio, se creo el ndice de Quetelet que mide la masa corporal de una persona. Fue el organizador de
la primera conferencia internacional sobre Estadstica en 1.853. Por otro lado el Matemtico y Economista
francs Agustin Cournt (1.801 1.877) se reconoce como el pionero de la Economa Matemtica, ya que fue
el primero en utilizar funciones matemticas para explicar fenmenos econmicos; como la demanda, oferta y
precio. Pero tambin propone la definicin frecuentista de probabilidad, adems, habla de intervalos de
confianza como mtodo de estimacin. Se considera uno de los aportadores fuertes a la Ciencias Estadstica.

El Censo fue el instrumento que a comienzos del siglo XIX se utilizo en los pases europeos, para obtener
informacin sobre la demografa y la economa. As en 1.834 se crea La Royal Statistical Society, en Londres y
en 1.839 se crea la American Statistical Association en EE UU.

ESTADSTICA ACTUAL: Los trabajos en fsica realizados por Newton y de Biologa realizados por Darwin,
fueron excelentes pretextos para el desarrollo y modernizacin de la Ciencia Estadstica. Aunque existieron
muchos investigadores que aportaron al fortalecer dicha ciencia, haremos referencia aquellos que marcaron
diferencia y merecen su reconocimiento.

Pgina 8 de 177
En primera instancia mocionaremos al Ingles Sr. Francis Galton (1.822
1.911) antroplogo, gegrafo, estadstico entre otras profesiones que tenia,
realizo la mayora de sus investigaciones sin necesidad de asistir a la
Universidad. Primo de Darwin, fue el primero en resaltar la necesidad de
utilizar mtodos estadsticos para contrastar la Teora Darwiniana, motivacin
que lo llevo a realizar estudios sobre diferencias individuales. Es el motivador
para el uso de la Estadstica en las Ciencias Experimentales, por medio de
dos aportaciones fundamentales, como la regresin y correlacin. Estudi
exhaustivamente la distribucin normal e introdujo el concepto de Lnea de
Regresin, comparando estatura de padres e hijos. Concibe el coeficiente de
correlacin como una medida de la intensidad en la relacin entre dos
caracteres. En su teora no logro reconocer correlaciones negativas.
Patrocino el primer departamento de Estadstica y fue el dinamizador de la
famosa revista Biomtrica.

Karl Pearson, (1.857 1.936) prominente Matemtico, Cientfico y Pensador


Britnico, fue quien estableci la Estadstica Matemtica. Motivado por los
estudios de Galton, realizado estudios sobre distribuciones bidimensionales,
entre sus obras de mencionar se destacan las que analizan la regresin y la
correlacin en estudios sobre medidas de asociacin y contingencia. En 1.900
2
propone la famosa distribucin Ji - Cuadrado ( ) descubierta con el fin de
obtener pruebas para la bondad de ajuste. Fundo el primer departamento de
Estadstica en la Universidad de Londres; adems, oficializo la revista
Biomtrica.

William Sealy Gosset, (1.876 1.937) Estadstico nacido en Canterbury


(Inglaterra) Trabajador de Cervecera en Dubln conocida como Guinness. Sus
estudios sobre Qumica y Matemticas lo llevaron a investigar sobre destilacin.
Por la prohibicin que tena la empresa de publicar sus investigaciones, Gosset
debi utilizar un Pseudnimo para exponer sus investigaciones, el cual an es
conocido como Student. Acudi a Pearson para estudiar en Londres, cuyos
estudios se concentraron en analizar el efecto de las materias primas sobre la
calidad del producto final, con la limitante que deba trabajar con muestras
pequeas. Utilizando el mtodo de Montecarlo y con muestras pequeas, logr
simular procesos de toma de muestras de la distribucin normal y as desarrollo
la famosa distribucin de t student, muy utilizada en muestreo.
es.wikipedia.org/wiki/William_Sealy_Gosset

Ronald Aylmer Fisher, (1.890 1.962) Uno de los personajes ms


importantes de la estadstica, considerado el Padre de dicha ciencia.
Matemtico, Estadstico, Bilogo y Cientfico, nacido en Londres, cuyo
aporte fundamental fue la creacin en 1.920 de la Inferencia Estadstica.
Siguiendo los pasos de Galton, desarrollo investigacin estadstica, la cual
plasm en su obra publicada en 1.925 Statistical Methods for Research
Workers. En el periodo de 1.920 y finales de la segunda guerra mundial se
extiende la aplicacin de los mtodos estadsticos en diversas reas de
conocimiento como la Ingeniera, Medicina, Ciencias Sociales y otros.
Diversas situaciones presentadas en las ciencias agronmicas, impulso a
Fisher a crear en el ao 1.935, la teora del Diseo Experimental, donde
centro sus estudios en identificar las fuentes de variabilidad de los datos experimentales, separo la variacin
muestral en los grupos o subpoblaciones y as dio los fundamentos del conocido Anlisis de Varianza.
Tambin desarrollo lo relacionado con la teora de Estimacin, introduciendo los conceptos como: Estimador y
eficiencia de la estimacin. Utilizando el mtodo de Mxima Verosimilitud logr obtener estimadores

Pgina 9 de 177
adecuados. Por otro lado con el fin de determinar la fiabilidad de las estimaciones, introdujo la conocida teora
sobre estimacin por intervalos.

Jerzy Neyman, (1.894 1.981) Matemtico, Estadstico y Astrnomo, nacido


en Bendery (Rusia), pero de origen polaco, trabajo en un instituto de
Investigacin Agrcola; al igual que Fisher. A estos dos investigadores se les
considera los fundadores de la Estadstica Moderna. Auque Fisher dio los
fundamentos, se le asigna la creacin de los intervalos de confianza en 1.934
al ingenio de Neyman, quien tambin fundo el Laboratorio de Estadstica en
Berkeley. Trabajo en el anlisis de problemas propios de la Astronoma,
Biologa y Climatologa. Entre sus aportes significativos a la estadstica est el
famoso Lema de Neyman Pearson, aplicado en pruebas de hiptesis.
Tambin trabajo sobre muestreo en poblaciones finitas, estableciendo que con
la seleccin aleatoria se obtiene la base de una teora cientfica que permite
predecir la validez de las estimaciones maestrales. Fortaleci la teora sobre
intervalos de confianza, introduciendo principios de probabilidad para asignar
un grado de error preestablecido a las estimaciones obtenidas. Para Neyman la Estadstica Matemtica busca
el establecimiento de Reglas de Comportamiento que permiten seleccionar acciones previamente fijadas, a
partir de resultados observados en experimentos aleatorios. Por ejemplo una prueba de hiptesis (Test
Estadstico) es una regla de este tipo, en el cual se acepta o rechaza una hiptesis, al igual que la estimacin
por intervalo.

Abraham Wald, (1.902 1.950) Nacido en Kolozsvr, (Hungra) de familia Juda, de


grandes estudios en matemticas, especialmente en Geometra. Pero su inquietud lo llevo
al estudio de la estadstica y as fue uno de los fundadores de la llamada Teora de la
Decisin. Aunque se tiene evidencias de que Daniel Bernoulli y Laplace, haban hablado
sobre el tema. En un documento publicado en 1.939, Wald afirma: ... los dos principales
problemas de la teora estadstica en ese momento, la comprobacin de hiptesis y el
clculo, pueden ser consideradas como simples casos especiales de un problema ms
general - conocido hoy como un "problema de decisin estadstica". ... Se define la prdida
de funciones, las funciones de riesgo, a priori, distribuciones, reglas de decisin de Bayes,
la admisibilidad de las normas de decisin, Minimax y reglas de decisin, y demuestra que una regla de
decisin Minimax un riesgo constante, en determinadas condiciones de regularidad. Con esta teora
constituye el modelo estadstico terico, dando origen a la Escuela Decisionsta la cual tiene como filosofa:
Tomar decisiones bajo condiciones de incertidumbre. Esta escuela presenta diferencias con la escuela
inferentista de Fisher, cuyo principio era reducir la incertidumbre por medio de la observacin y
experimentacin, para hacer inferencias estadsticas. Wald trabaja sobre la muy conocida Ruina del Jugador,
tema relevante de los procesos estocsticos, adems; fue el primero en resolver el problema general de la
secuencia de pruebas de hiptesis.

Leccin 2: Conceptos fundamentales: poblacin, muestra,


variable estadstica, datos y medicin.
En este captulo se describen los conceptos y definiciones bsicas necesarios para mayor comprensin de los
temas a desarrollar en esta asignatura. El propsito es estandarizar una terminologa comn. As, se
establecen una serie de convenciones, para agilizar la lectura del texto. El problema consiste en la diversidad
de trminos usados para nombrar los mismos conceptos, debido a la gran variedad de autores, modas y
tendencias, que existen en la bibliografa actual. Cada uno, aportando su cuota de originalidad, pero
complicando la simplicidad. Otro problema que se trata de resolver, es el uso de palabras con un significado
claro en el leguaje diario, pero con uno diferente en la Estadstica. Por tanto, conviene empezar precisando
algunas ideas generales a modo de convencin.

Pgina 10 de 177
Definicin de Estadstica:
Existen diversidad de conceptos y definiciones que permiten establecer especficamente la formulacin de
objetivos y el campo de accin de la Estadstica. Alguna de ellas la define como una rama de las matemticas
que trata de la recopilacin, anlisis, interpretacin y presentacin de datos numricos.

La Estadstica es la ciencia cuyo objetivo es reunir una informacin cuantitativa concerniente a individuos,
grupos, series de hechos, etc. y deducir de ello gracias al anlisis de estos datos unos significados precisos o
unas previsiones para el futuro.

La estadstica, en general, es la ciencia que trata de la recopilacin, organizacin presentacin, anlisis e


interpretacin de datos numricos con e fin de realizar una toma de decisin ms efectiva.

Otros autores tienen definiciones de la Estadstica semejantes a las anteriores, y algunos otros no tan
semejantes. Para Chacn esta se define como la ciencia que tiene por objeto el estudio cuantitativo de los
colectivos; otros la definen como la expresin cuantitativa del conocimiento dispuesta en forma adecuada para
el escrutinio y anlisis. La ms aceptada, sin embargo, es la de Minguez, que define la Estadstica como La
ciencia que tiene por objeto aplicar las leyes de la cantidad a los hechos sociales para medir su intensidad,
deducir las leyes que los rigen y hacer su prediccin prxima.

Los estudiantes confunden comnmente los dems trminos asociados con las Estadsticas, una confusin que
es conveniente aclarar debido a que esta palabra tiene tres significados: la palabra estadstica, en primer
trmino se usa para referirse a la informacin estadstica; tambin se utiliza para referirse al conjunto de
tcnicas y mtodos que se utilizan para analizar la informacin estadstica; y el trmino estadstico, en singular
y en masculino, se refiere a una medida derivada de una muestra.

Utilidad e Importancia:
Los mtodos estadsticos tradicionalmente se utilizan para propsitos descriptivos, para organizar y resumir
datos numricos. La estadstica descriptiva, por ejemplo trata de la tabulacin de datos, su presentacin en
forma grfica o ilustrativa y el clculo de medidas descriptivas.

Ahora bien, las tcnicas estadsticas se aplican de manera amplia en mercadotecnia, contabilidad, control de
calidad y en otras actividades; estudios de consumidores; anlisis de resultados en deportes; administradores
de instituciones; en la educacin; organismos polticos; mdicos; y por otras personas que intervienen en la
toma de decisiones.

Divisin de la Estadstica:
Hay dos fases en el campo de la Estadstica: la Estadstica Descriptiva y la Inferencial.

La primera se limita a la descripcin de una serie de datos a travs de su organizacin y resumen sin llegar a
conclusiones o a generalizaciones con respecto a un grupo mayor. Tambin se conoce como Estadstica
Deductiva. Esta descripcin se hace a travs de la elaboracin de cuadros, grficos, clculos de promedios,
varianzas, proporciones de una o ms variables.

La segunda fase, conocida como Estadstica Inferencial, se deriva de muestras, de observaciones hechas
slo acerca de una parte de un conjunto numeroso de elementos y esto implica que su anlisis requiere de
generalizaciones que van ms all de los datos. La Estadstica Inferencial trata de llegar a conclusiones acerca
de un grupo mayor (poblacin) basado en la informacin de un grupo menor (muestra); busca dar explicaciones

Pgina 11 de 177
al comportamiento de un conjunto de observaciones, probar la significacin o validez de los resultados, intenta
descubrir causas que la originan.

Mtodo Estadstico:
El conjunto de los mtodos que se utilizan para medir las caractersticas de la informacin, para resumir los
valores individuales, y para analizar los datos a fin de extraerles el mximo de informacin, es lo que se llama
mtodos estadsticos. Los mtodos de anlisis para la informacin cuantitativa se pueden dividir en los
siguientes seis pasos:

1. Definicin del problema.


2. Recopilacin de la informacin existente.
3. Obtencin de informacin original.
4. Clasificacin.
5. Presentacin.
6. Anlisis.

Errores Estadsticos Comunes:


Al momento de recopilar los datos que sern procesados se es susceptible de cometer errores as como
durante los cmputos de los mismos. No obstante, hay otros errores que no tienen nada que ver con la
digitacin y que no son tan fcilmente identificables. Algunos de stos errores son:

Sesgo: Es imposible ser completamente objetivo o no tener ideas preconcebidas antes de comenzar a estudiar
un problema, y existen muchas maneras en que una perspectiva o estado mental pueda influir en la
recopilacin y en el anlisis de la informacin. En estos casos se dice que hay un sesgo cuando el individuo da
mayor peso a los datos que apoyan su opinin que a aquellos que la contradicen. Un caso extremo de sesgo
sera la situacin donde primero se toma una decisin y despus se utiliza el anlisis estadstico para justificar
la decisin ya tomada.

Datos no comparables: el establecer comparaciones es una de las partes ms importantes del anlisis
estadstico, pero es extremadamente importante que tales comparaciones se hagan entre datos que sean
comparables.

Proyeccin descuidada de tendencias: la proyeccin simplista de tendencias pasadas hacia el futuro es uno de
los errores que ms ha desacreditado el uso del anlisis estadstico.

Muestreo Incorrecto: en la mayora de los estudios sucede que el volumen de informacin disponible es tan
inmenso que se hace necesario estudiar muestras, para derivar conclusiones acerca de la poblacin a que
pertenece la muestra. Si la muestra se selecciona correctamente, tendr bsicamente las mismas propiedades
que la poblacin de la cual fue extrada; pero si el muestreo se realiza incorrectamente, entonces puede
suceder que los resultados no signifiquen nada

Conceptos Estadsticos:
Escalas de Medicin

Llamaremos medicin al proceso de atribuir nmeros a las variables. El conjunto de reglas o modelos
desarrollados para la asignacin de nmeros a las variables es lo que se denomina escala. La clasificacin de

Pgina 12 de 177
las escalas ms usada es la propuesta por Stevens (1946) que divide las escalas en: nominales, ordinales, de
intervalo y de razn.

Escala nominal: nos permite identificar sujetos como "iguales" o "diferentes". Usando una escala
nominal podemos decidir si un sujeto es igual o diferente a otro, pero no podemos establecer
relaciones de orden respecto a esa caracterstica, ni relaciones de cantidad ni de diferencia. Por
ejemplo: si medimos el color de los ojos podemos establecer la siguiente escala: A azul, V verde,
M marrn y N negro. No podemos ordenar los sujetos de mayor a menor o viceversa,
simplemente podemos asegurar si dos sujetos tienen el mismo o distinto color de ojos. Otros ejemplos:
nacionalidad, sexo, profesin. A este tipo de variables medidas con escala nominal se les puede
asignar a cada categora cualquier tipo de smbolos. En el ejemplo hemos asignado letras pero
podamos haber optado por nmeros: 1 azul, 2 verde, 3 marrn y 4 negro.

Escala ordinal: Esta escala no slo permite la identificacin y diferenciacin de los sujetos sino que
adems permite establecer relaciones del tipo "mayor que" o "menor que". Es decir, de los sujetos se
puede decir cual presenta una mayor o menor magnitud de la caracterstica medida, los objetos se
pueden ordenar. Ejemplo: nivel de estudios se puede asignar 1 a estudios primarios, 2 a estudios
secundarios, 3 a estudios universitarios. Podemos ordenar a los sujetos segn el nivel de estudios, el
valor 3 es mayor que el 2 y el 1. Aunque no podemos afirmar que la diferencia existente entre el 2 y el
1 sea la misma que la que existe entre el 3 y el 2. Ni que el que tenga nivel 3 tenga 3 veces ms de
nivel de estudios que el que tiene nivel 1. Otros ejemplos de escala ordinal: posicin relativa en la
clase, escala de dureza de los minerales.

Escala de intervalo: Con esta escala, adems de poder identificar un objeto y establecer relaciones
del tipo mayor que y menor que, tambin podemos hacer afirmaciones acerca de las diferencias en la
cantidad del atributo de unos y otros objetos. Es decir, disponemos de una unidad de medida, aunque
en este caso el cero sea un punto arbitrario en la escala. Es decir, no indica ausencia total de la
cantidad de atributo. Un ejemplo tpico es el calendario, podemos afirmar que ha transcurrido el mismo
tiempo entre 1960 y 1966 que entre 1980 y 1986 porque contamos con una unidad de medida llamada
ao. Pero no podemos afirmar que hasta el ao 1000 haya pasado el doble de tiempo que hasta el ao
500, porque el valor cero no representa el comienzo del tiempo sino que, en nuestro calendario se
eligi el ao del nacimiento de Cristo como ao 1. Otros ejemplos: la medicin de las temperaturas en
grados Celcius la escala de los test de inteligencia.

Escala de razn: Tambin se llama de proporcin o de cociente. Adems de las caractersticas de las
otras tres escalas, contamos con una unidad de medida con cero absoluto, es decir, que significa
ausencia del atributo o caracterstica medida. Por ejemplo, la longitud, podemos afirmar que un objeto
que mide 10 cm. tiene el doble de longitud que uno que mide 5 cm. Otros ejemplos: peso, duracin de
un suceso, temperatura en grados Kelvin (que s tiene cero absoluto).

Referencia: Apuntes de Estadstica para Profesores, Concepcin Bueno y Toms Escudero.

Variable:
Una variable es una propiedad o caracterstica que puede variar y cuya variacin es susceptible de medirse.

Ejemplos de variables:

- Rendimiento acadmico en las asignaturas cursadas, que adopta distintos valores o modalidades,
normalmente son valores entre 0 y 7.
- Sexo que adopta dos modalidades: varn y mujer
- Lugar de procedencia
- Motivacin ante la asignatura
- Edad

Pgina 13 de 177
En contraposicin a la variable aparece el concepto de constante que es una caracterstica de la poblacin que
slo puede tomar un valor para todos los elementos de la poblacin.

Ejemplos de constantes son:

- Nivel Escolar de los encuestados (todos son universitarios).


- La nacionalidad de los encuestados (Chilenos).

Las variables se pueden clasificar segn el nmero de valores que puedan tomar como variables discretas y
variables continuas.

Variable Continua es la que puede tomar todos los valores de un intervalo. Por ejemplo: el peso, la talla, el
tiempo empleado en la ejecucin de una tarea, la duracin de un suceso, etc.

Variable Discreta es aquella que adopta valores aislados. Ejemplo: raza, lugar de nacimiento, sexo, religin,
nmero de asignaturas aprobadas en el semestre, nmero de alumnos de una clase, nivel socioeconmico,
etc.

Tambin se pueden clasificar atendiendo al tipo de informacin que proveen en cualitativas y cuantitativas.

Variables cualitativas son aquellas que se miden segn una escala nominal u ordinal. Informan ms bien de
una cualidad del sujeto: sexo, color de ojos, nivel socioeconmico, nivel cultural, dureza de los minerales.

Variables cuantitativas son aquellas que se miden segn una escala de intervalo o de razn. De alguna forma
dan cuenta de la cantidad de atributo o caracterstica que el individuo posee. Por ejemplo: peso, talla,
temperaturas, nmero de asignaturas aprobadas.

Pgina 14 de 177
Leccin 3: Recoleccin de la informacin: Censos, encuestas.
Despus de planeada la investigacin, comienza la recoleccin de los datos. Esta consiste en un conjunto de
operaciones de toma de datos que puede ser por observacin, por encuesta o tomada de publicaciones y/o
fuentes confiables que han efectuado investigaciones estadsticas. Para esto se selecciona el mtodo de
recoleccin de la informacin acorde a las necesidades de la investigacin, que se clasifican segn su
cobertura y segn su forma de observacin.

Segn la cobertura

Se trata de decidir si se va a estudiar a la poblacin en su totalidad o slo una parte de ella. Si lo que se desea
es atender a una cobertura total, es decir contar con todos los elementos de las fuentes de informacin, se usa
el censo. Si, en cambio, se hace una enumeracin parcial de las fuentes de informacin, se usa el muestreo.

Por su menor costo, mayor rapidez y menor nmero de personas que intervienen en la investigacin, el
muestreo es el mtodo ms utilizado. El muestreo puede ser de dos tipos: muestreo probabilstico o al azar,
cuando cada uno de los elementos tiene la misma probabilidad de ser escogido obteniendo as una muestra
aleatoria; y muestreo no probabilstico, cuando el investigador selecciona los datos a su propio criterio, de
manera caprichosa, por conveniencia o por cuotas, de manera que las muestras no son seleccionadas
aleatoriamente y los resultados no ofrecen confiabilidad alguna.

Segn la forma de observacin

En este mtodo se tiene en cuenta la forma de medicin del dato. Si se hace de manera que la fuente de
informacin se da cuenta de la medicin que efecta, se dice que se toman los datos por encuesta. stas se
pueden realizar por correo, entrega personal de cuestionario, entrevista, motivacin, telfono, etc.

El otro mtodo de recoleccin de informacin es por observacin, en donde la medicin se realiza sin que la
fuente de informacin se d cuenta del hecho. Este mtodo se basa en el registro de los eventos que ocurren,
por ejemplo cuando se examina el nmero de estudiantes que entran a la biblioteca con el fin de hacer una
consulta referida a las Ciencias Sociales, simplemente se observa la accin del estudiante al entrar a la
biblioteca: si hace o no la consulta que se investiga. Este mtodo puede ser tambin indirecto cuando la
recoleccin consiste en corroborar los datos que otros han observado.

Variables Estadsticas:

Existen dos tipos de variables estadsticas, al saber: Cualitativas y cuantitativas.

Una variable es cualitativa si en la caracterstica que se va a estudiar se busca conocer gustos, preferencias u
opiniones, etc.; por ejemplo: tipo de sangre, gaseosa preferida, color de cabello.
Una variable cualitativa es estadstica cuando es posible clasificar los datos obtenidos de la muestra en clases
bien definidas, en las cuales el individuo que suministra la informacin pueda elegir una de ellas.

Cuando una variable es cualitativa es necesario determinar las posibles respuestas.

Una variable es cuantitativa si la caracterstica que se va a estudiar se pude medir en una escala numrica.

Si la variable tiene la capacidad de tomar cualquier valor que exista entre dos magnitudes dadas,
entonces esta variable ser continua.

Si por el contrario, slo puede tener un valor de entre cierta cantidad de valores dados, entonces ser
discreta.

Pgina 15 de 177
Escalas de Medidas de Variables: Una escala es la relacin numrica entre la longitud real y la longitud que
se asigna en el plano en el cual se va a representar su grfica.

Las variables cuantitativas pueden ser consideradas en diferentes escalas teniendo en cuenta las unidades
asociadas a la poblacin que se encuentra en estudio.

Los datos asociados a un estudio deben estar en las mismas unidades, de tal manera que sea posible
asignarles una escala a todos.
La notacin de una escala es de la forma 1 a n, lo cual indica que n unidades de medida estn representadas
en el grfico e una sola.

EJEMPLO

Los profesores de Educacin Fsica de un colegio medirn la estatura de los nios de secundaria en cada uno
de los grados.

Solucin:

En este caso, la variable estatura es cuantitativa y continua ya que los datos que resultan son nmeros reales;
es posible considerar las mediciones en centmetros o en metros. El profesor de educacin fsica puede usar
un escala de 1 a 10, en la cual cada 10 centmetros de altura estn representados en 1 cm del grfico.

Suponiendo que los estudiantes de primaria tienen alturas entre 100 cm y 140 cm la representacin grfica de
la escala 1:10 es la siguiente:

EJEMPLO

En cada una de las siguientes situaciones, identificar la variable de estudio.


Determinar si es cualitativa o cuantitativa.

1. En un barrio de la ciudad se aplic una encuesta para conocer el consumo, en centmetros cbicos, del
servicio de gas natural.
2. El alcalde de la ciudad quiere revisar la situacin de violencia intrafamiliar en las familias de estrato 3, 4, 5.
3. El nmero de hermanos de cada jugador del equipo de futboll.
4. En un caf gourmet, se decidi preguntar por el tipo de variedad que ms consumen sus clientes.

Solucin

1. La variable es consumo de gas. Es cuantitativa y continua


2. La variable es situacin de violencia. Es cualitativa
3. La variable es nmero de hermanos. Es cuantitativa y discreta
4. La variable es variedad de caf. Es cualitativa.

Pgina 16 de 177
Leccin 4: Organizacin: tablas de frecuencias
Como se mencion en el material de introduccin a la estadstica, la estadstica descriptiva tiene como
propsito describir y resumir un conjunto de datos, para ello, se emplean dos tipos de mtodos a saber:
mtodos grficos y mtodos numricos.

Para introducir los mtodos grficos y numricos recurriremos a la construccin de las Distribuciones de
Frecuencia, mtodo utilizado para organizar y resumir datos. Una tabla de frecuencia esta formada por las
categoras o valores de una variable y sus frecuencias correspondientes; esta tabla se crea por medio de la
tabulacin y agrupacin, se trabaja con una sola variable; sin embargo, cuando el conjunto de datos es mayor,
resulta laborioso trabajar directamente con los valores individuales observados y entonces se lleva a cabo, por
lo general, algn tipo de agrupacin como paso preliminar, antes de iniciar cualquier otro tratamiento de los
datos. Las reglas para proceder a la agrupacin son diferentes segn sea la variable, discreta o continua, para
una variable discreta suele resultar conveniente hacer una tabla en cuya primera columna figuren todos los
valores de la variable X representados en el material, y en la segunda, la frecuencia f con que ha aparecido
cada valor de X en las observaciones.

Primero, definiremos una notacin y/o simbologa estndar a manejar:

La letra X mayscula representar a la variable con la que estamos trabajando.

La letra X mayscula con subndices, X1, X2, X3, servir para representar un valor concreto de la
variable X en el sujeto 1,2,3,... Cuando queramos referirnos a un valor concreto cualquiera de la
variable X escribiremos Xi. Denotaremos por Xk el ltimo valor que toma la variable.

El nmero de elementos que componen la muestra ser n (N si esta considerando una poblacin).

Se llama frecuencia absoluta de un valor Xi, y se simboliza por f i (en alguna literatura la representan
por ni) al nmero de veces que se repite el valor Xi en la muestra. La suma de las frecuencias debe ser
igual al nmero de elementos que componen la muestra, esto es,
fi = = f1 + f2 + f3 + + fk = n

La frecuencia relativa es la fraccin del total de observaciones que presentaron un valor X i en particular
y se simboliza por hi. Para su clculo se hace el cociente entre la frecuencia absoluta y el nmero total
de datos, esto es,
fi
hi
n
La frecuencia relativa puede denotar un porcentaje o una probabilidad de seleccin; la suma de las
frecuencias relativas debe ser igual (o aproximadamente igual) a 1, esto es,
hi = = h1 + h2 + h3 + + hk = 1

La frecuencia absoluta acumulada (Fi) es la suma de los distintos valores de la frecuencia absoluta
tomando como referencia un individuo dado. Cabe mencionar que la ltima frecuencia absoluta
acumulada es igual al nmero de casos, esto es,

F1 = f 1
F2 = f 1 + f 2 = F1 + f 2
F3 = f 1 + f 2 + f 3 = F2 + f 3
.
.
.
Fk = f1 + f2 + f3 + + fk-1 + fk = Fk-1 + fk = n

Pgina 17 de 177
La frecuencia relativa acumulada es el resultado de dividir cada frecuencia absoluta acumulada (Fi) por
el nmero total de datos; se suele representar con la notacin Hi; cabe mencionar que la ltima
frecuencia relativa acumulada es igual a 1; es decir,
Fi
Hi
n

De esta manera, la distribucin de frecuencias para una VARIABLE DISCRETA estar dada de la siguiente
manera:

X fi Fi hi Hi

X1 f1 F1 h1 H1

X2 f2 F2 h2 H2

X3 f3 F3 h3 H3

Xk fk Fk = n hk Hk = 1

fi = n hi = 1

Ejemplo:

El gobierno desea averiguar si el nmero medio de hijos por familia ha descendido respecto de la dcada
anterior. Para ello ha encuestado a 50 familias respecto al nmero de hijos, y ha obtenido los siguientes datos:

i 1 2 3 4 5 6 7 8 9 10
Xi 2 4 2 3 1 2 4 2 3 0

i 11 12 13 14 15 16 17 18 19 20
Xi 2 2 2 3 2 6 2 3 2 2

i 21 22 23 24 25 26 27 28 29 30
Xi 3 2 3 3 4 3 3 4 5 2

i 31 32 33 34 35 36 37 38 39 40
Xi 0 3 2 1 2 3 2 2 3 1

i 41 42 43 44 45 46 47 48 49 50
Xi 4 2 3 2 4 3 3 2 2 1

Determinar:

a. Cul es la poblacin objeto de estudio?


b. Qu variable estamos estudiando?
c. Qu tipo de variable es?
d. Construir la tabla de frecuencias.
e. Cul es el nmero de familias que tiene como mximo 2 hijos?
f. Cuntas familias tienen ms de 1 hijo, pero como mximo 3?
g. Qu porcentaje de familias tiene ms de 3 hijos?

Pgina 18 de 177
Solucin:

a. La poblacin objeto de estudio es el conjunto de familias de un determinado pas.

b. La variable que estamos estudiando es el nmero de hijos por familia

c. El tipo de variable es discreta ya que el nmero de hijos solo puede tomar determinados valores
enteros (es imposible tener medio o un cuarto de hijo).

d. Para construir la tabla de frecuencias tenemos que ver cuntas familias tienen un determinado nmero
de hijos. Podemos ver que el nmero de hijos, toma los valores existentes entre 0 hijos, los que menos
y, 6 hijos los que ms; de esta manera se tiene:

Xi fi Fi hi Hi

2 2
0 2 2 0,04 4% 0,04 4%
50 50
4 6
1 4 2+4= 6 0,08 8% 0,12 12%
50 50
21 27
2 21 6 + 21 = 27 0,42 42% 0,54 54%
50 50
15 42
3 15 27 + 15 = 42 0,30 30% 0,84 84%
50 50
6 48
4 6 42 + 6 = 48 0,12 12% 0,96 96%
50 50
1 49
5 1 48 + 1 = 49 0,02 2% 0,98 98%
50 50
1 50
6 1 49 + 1 = 50 0,02 2% 1,00 100%
50 50

n = 50 1,00 100%

e. El nmero de familias que tienen dos o menos hijos es: 2 + 4 + 21 = 27.

f. El nmero de familias que tienen ms de un hijo pero tres como mximo es: 21 + 15 = 36.

g. Por ltimo el porcentaje de familias que tiene ms de tres hijos, son aquellos que tienen 4; 5 y 6 es
decir 6 + 1 + 1 = 8.

h. El porcentaje ser el tanto por uno multiplicado por cien es decir, la frecuencia relativa de dichos
valores multiplicado por 100: (0,12 + 0,02 + 0,02)* 100 = 0,16*100 = 16%.

Pgina 19 de 177
Tablas de Frecuencia para Variables Continuas
Cuando nos encontramos con una distribucin con un gran nmero de datos, o con VARIABLES CONTINUAS
se suelen agrupar los datos en intervalos de clase para facilitar la comprensin de los datos; sin embargo, este
proceso presenta un problema no deseable en estadstica: se pierde informacin sobre la distribucin de los
datos.

La agrupacin de datos en intervalos de clase consiste en formar grupos de valores consecutivos de la variable
y poner cada uno de estos grupos en cada fila en lugar de poner una sola puntuacin. Cabe mencionar que la
tabla de frecuencias para variables continuas presenta la misma estructura que las descritas anteriormente
para variables discretas, aadiendo un par de elementos que se describirn a continuacin.

En primer lugar se debe definir la cantidad de intervalos a emplear; se recomienda que el nmero de intervalos
(i) debe variar entre 5 y 16. Para determinar el nmero de intervalos existen varios mtodos a saber

Por conocimiento del investigador del rea de investigacin.

Si lo que se desea es realizar una investigacin para comparar los resultados con un estudio anterior,
se consideran los mismos intervalos construidos en el estudio previo, para fines de comparabilidad de
resultados.

Algunos investigadores emplean como nmero de intervalos el resultante de la raz cuadrada de la


cantidad de datos considerados, esto es, i n.
El mtodo ms recomendable es aplicar la frmula de Sturges, que viene dada por la siguiente
expresin matemtica: i 1 3,3 log n .

Una vez establecida la cantidad de intervalos en los cuales se van agrupar los datos, se debe determinar la
longitud de cada uno de ellos, la cual depender del criterio establecido para presentar la informacin. La
longitud puede variar de intervalo a intervalo, sin embargo, se acostumbra a trabajar con intervalos de igual
amplitud. Para determinar la amplitud de los intervalos (A) se recurre a la siguiente frmula:

R Rango o recorrido
A
i N de intervalos
donde,

R = XMax XMin = Mximo valor de los datos Mnimo valor de los datos = X n X1
i 1 3,3 log n

Una vez se tienen estos dos elementos, nmero de intervalos y amplitud de los mismos, se prosigue a
establecer los lmites de cada intervalo. Se indica por Li-1 (o Xi-1) al extremo inferior del intervalo y por Li (o X i) al
extremo superior. Cerramos el intervalo por la izquierda y abrimos por la derecha. Es una manera de
organizarse, pudiendo ser al contrario.

Para operar utilizaremos la marca de clase, el punto medio de un intervalo (denotada en algunos libros por m).
Las marcas de clase pueden obtenerse de 3 maneras a saber:

1. Definirla como la semisuma de los valores extremos del intervalo, esto es sumar los extremos, y dividir
entre 2.
2. Se obtiene la primera marca de clase por el mtodo anterior y si la amplitud (A) es constante, se le
suma a la primera marca de clase obtenida y as sucesivamente.
3. Se divide la amplitud de cada intervalo (A) por dos y se le suma al lmite inferior del intervalo o se le
resta al lmite superior del intervalo.

Pgina 20 de 177
De esta manera, la distribucin de frecuencias para una VARIABLE CONTINUA estar dada de la siguiente
manera:

Xi-1 - Xi m fi Fi hi Hi

X1 X 2 m1 f1 F1 h1 H1

X2 X 3 m2 f2 F2 h2 H2

X3 X 4 m3 f3 F3 h3 H3

Xk-1 Xk mk fk Fk = n hk Hk = 1

fi = n hi = 1

Ejemplo

Un nuevo hotel va a abrir sus puertas en cierta ciudad. Antes de decidir el precio de sus habitaciones, el
gerente investiga los precios por habitacin de 40 hoteles de la misma categora de esa ciudad. Los datos
obtenidos en miles de pesos fueron:

i 1 2 3 4 5 6 7 8 9 10
Xi 3,9 4,7 3,7 5,6 4,3 4,9 5,0 6,1 5,1 4,5

i 11 12 13 14 15 16 17 18 19 20
Xi 5,3 3,9 4,3 5,0 6,0 4,7 5,1 4,2 4,4 5,8

i 21 22 23 24 25 26 27 28 29 30
Xi 3,3 4,3 4,1 5,8 4,4 4,8 6,1 4,3 5,3 4,5

I 31 32 33 34 35 36 37 38 39 40
Xi 4,0 5,4 3,9 4,7 3,3 4,5 4,7 4,2 4,5 4,8
Se pide:

a. Cul es la poblacin objeto de estudio?


b. Qu variable estamos estudiando?
c. Qu tipo de variable es?
d. Qu problema plantea la construccin de la tabla de frecuencias?
e. Cuntos hoteles tienen un precio entre 3,25 y 3,75?
f. Cuntos hoteles tienen un precio superior a 4,75?
g. Qu porcentaje de hoteles cuestan como mucho 4,25?

SOLUCIONES:

a. La poblacin objeto de estudio son los hoteles de una ciudad.

b. La variable que estamos estudiando es el precio de alquiler de habitaciones.

c. El tipo de variable es cuantitativa continua.

Pgina 21 de 177
d. El problema que plantea es que existen muchos valores diferentes para por tanto es bueno agrupar la
serie en intervalos.

La manera de hacerlo sera la siguiente: primero, calculamos el recorrido Re = X n X1= 6,1 3,3 = 2,8.

Para calcular el n de intervalos, recurriremos a la frmula de Sturges: i = 1 + 3.3 log 40 = 6,28 por lo
tanto tomaremos 6 intervalos.

Como el recorrido es 2,8 si lo dividimos por el n de intervalos tendremos la amplitud de cada uno de
2,8
ellos y as: A 0,46 0,5 .
6
Para obtener las marcas de clase, emplearemos el primer mtodo descrito, es decir el promedio de los
lmites de cada intervalo; por ejemplo, para el primer intervalo la marca de clase viene dada por:
3,25 3,75 7
m1 3,5
2 2
De esta manera, la distribucin de frecuencias para el ejemplo viene dada en la siguiente tabla:

[LI-1 - LI) m fi Fi hi Hi

[3,25 - 3,75) 3,5 3 3 0,075 0,075

[3,75 - 4,25) 4 8 11 0,200 0,275

[4,25 - 4,75) 4,5 14 25 0,350 0,625

[4,75 - 5,25) 5 6 31 0,150 0,775

[5,25 - 5,75) 5,5 4 35 0,100 0,875

[5,75 - 6,25) 6 5 40 0,125 1,000

N= 40 1,000

e. El nmero de hoteles que tienen un precio entre 3,25 y 3,75 son 3.

f. El nmero de hoteles que tienen un precio superior a 4,75 son 15.

g. El porcentaje de hoteles que cuestan como mucho 4,25 es: %=F 2*100=0,275*100=27,5%

Existen algunas distribuciones de frecuencias especiales, denominadas simtricas; una distribucin es


simtrica cuando las frecuencias absolutas y/o relativas, equidistantes a un punto son iguales, por ejemplo:

Pgina 22 de 177
Xi-1 Xi fi hi Xi fi hi

46,1 54 2 0,05 2 2 0,10

54,1 62 6 0,15 4 5 0,25

62,1 70 12 0,3 6 6 0,30

70,1 78 12 0,3 8 5 0,25

78,1 86 6 0,15 10 2 0,10

86,1 94 2 0,05 20 1,00

40 1

Diagrama de tallo y hojas


Las distribuciones de frecuencias no son el nico medio para resumir y exponer conjuntos de datos; una
alternativa a ellas son los llamados diagramas de tallo y hojas,

Su obtencin requiere separar cada puntuacin en dos partes, El primer o primeros dgitos, que reciben el
nombre de tallo, y el dgito o dgitos restantes, que reciben el nombre de hojas; por ejemplo, X = 56 se puede
separar en 5 (tallo) y 6 hoja, Estos diagramas tienen la suficiente flexibilidad como para admitir otras
posibilidades,

1. Se identifican los valores mximo y mnimo observados.


2. Se toma una decisin acerca del nmero ms apropiado de tallos distintos.
3. Se listan todos los tallos distintos en una columna, ordenados de forma creciente de arriba abajo.
4. Se escribe cada hoja junto al tallo que le corresponda, preferiblemente ordenados segn su valor.

En general, un nmero de tallos superior a cinco y que no pase de 20 suele ser apropiado, Aparte de ser ms
fcil de construir, el diagrama de tallo y hojas tiene varias ventajas sobre la distribucin de frecuencias, y
tambin algn inconveniente:

1. Ventaja: permite identificar cada puntuacin individual, En las distribuciones tradicionales slo conocemos la
frecuencia del intervalo y nos obliga a tratar los datos de ciertas maneras distorsionantes, La ventaja de
retener cada valor individual viene acompaada del inconveniente de que le diagrama de tallo y hojas no
facilita, como la distribucin de frecuencias clsica, el clculo de los estadsticos que estudiaremos ms
adelante.

2. Ofrece simultneamente tanto un listado de las puntuaciones como un dibujo de distribucin, si tumbamos el
diagrama obtenemos una especie de histograma.

3. Al contener los valores de cada observacin, es ms fcil de modificar para obtener un dibujo con un nivel de
detalle distinto, mayor o menor, de la distribucin.

4. Pueden presentarse dos conjuntos de datos simultneamente en el mismo diagrama, con lo que se facilita la
comparacin.

Objetivos del Diagrama de tallos y hojas

Pgina 23 de 177
Representacin visual de la informacin
Descubrir un patrn de comportamiento de los datos, es decir, qu distribucin pueden seguir los datos
Identificar si hay valores extremos o datos anormales en la muestra

Es aplicable para valores formados por al menos dos cifras.

Principio: Cada nmero se divide en dos partes, una que llamaremos "Tallo" y la otra denominada " ramas u
Hojas".

Formado por uno o ms dgitos principales (cifras mas significativas), ubicados


Tallo
a la izquierda del nmero.
Ramas u hojas Resto de los nmeros (cifras secundarias) ubicadas a la derecha.

Ejemplo.

Considere los siguientes nmeros: 65, 57, 79, 69, 53, 63, 71. Los tallos sern las decenas, y las ramas sern
las unidades, de la siguiente manera

Tallo Ramas
5 73
6 593
7 91

Procedimiento:

1. Se define cmo se van a dividir los nmeros en tallos y ramas, es decir, se identifican cuales van a ser
los tallos, y cuales va a ser las ramas.
2. En una columna se listan los tallos en orden ascendente.
3. Se recorren los datos y se colocan, en la columna siguiente, las hojas de acuerdo al tallo que tengan.

Observaciones:

Se recomienda que el nmero de tallos est entre 5 y 20.


A veces, de acuerdo con la informacin que se tenga, pueden resultar muy pocos tallos, con lo cual las
ramas quedan muy concentradas, y realmente no se obtiene mucha informacin. En estos casos,
puede ser conveniente partir los tallos en dos: Un tallo inferior (que tenga, por ejemplo, las ramas
menores que 5), y un tallo superior (que tenga las ramas mayores o iguales a cinco). As, por ejemplo,
el tallo 6 puede dividirse en 6I, para los valores entre 60 y 64, y el tallo 6S, para los valores entre 65 y
69.
Cuando se parten los tallos en dos, todos los tallos deben partirse en dos. Solamente el primero y el
ltimo tallo podran dejarse sin partir, en caso de que en el primer tallo slo haya informacin para el
tallo superior, y cuando para el ltimo tallo slo haya informacin para el tallo inferior.

Ejemplo

Considere la siguiente informacin sobre duracin de bateras de carro, en aos. Se pide:

Pgina 24 de 177
Construir el diagrama de tallos y hojas usando como tallos la parte entera.
Construir el diagrama de tallos y hojas partiendo cada tallo en dos.

Duracin de bateras (en aos)


2.2 4.1 3.5 4.5 3.2 3.7 3.0 2.6
3.4 1.6 3.1 3.3 3.8 3.1 4.7 3.7
2.5 4.3 3.4 3.6 2.9 3.3 3.9 3.1
3.3 3.1 3.7 4.4 3.2 4.1 1.9 3.4
4.7 3.8 3.2 2.6 3.9 3.0 4.2 3.5

Solucin

Usando como tallos la parte entera

Tallos: Dgitos principales (Parte entera)


Ramas: Dgitos secundarios (Parte decimal)

Tallo Ramas Frecuencia


1 9 1
2 26596 5
3 5270413817463913172482905 25
4 156734172 9
Total 40

Partiendo cada tallo en dos

En este caso el tallo 1 nicamente tendra la parte superior, y el tallo 4 tendra tanto la parte inferior como la
superior

Tallo Ramas Frecuencia


1S 9 1
2I 2 1
2S 6596 4
3I 204131431312420 15
3S 5787697895 10
4I 13412 5
4S 5677 4
Total 40

Analice la diferencia entre los dos diagramas.

Pgina 25 de 177
EMPLEANDO EXCEL - ACTIVIDAD GUIADA
Los siguientes datos corresponden a las ventas en miles de pesos durante el mes pasado de un almacn de
calzado:

200, 500, 380, 415, 800, 725, 298, 654, 385, 475, 789, 658, 458, 589, 254, 365, 563, 698, 478, 589, 798, 695,
587, 458, 556, 668, 574, 258, 654, 789.

Construya una distribucin de frecuencias y responda las siguientes preguntas:

1) El 10% de los das cunto dinero se vendi?

2) Cuntos das se vendi entre 500 y 600 mil pesos?

3) El 57% de las ventas qu valor supera?

4) En 8 de los 30 das cunto dinero se vendi?

Solucin:
Para realizar clculos estadsticos utilizando Excel debe abrir la ventana de herramientas, luego complementos,
herramientas para anlisis y herramientas para anlisis BVA, de esta manera le quedara activado en su
computador la herramienta anlisis de datos. Si ya lo tiene omita estos pasos y pase de una vez a histograma.

PASOS PARA ACTIVAR EL ANALISIS DE DATOS

1. De la barra superior de clic en herramientas :

2. De la ventana que se abre de clic en complementos:

Pgina 26 de 177
2 Aqu se le mostrara una nueva ventana de clic en herramientas para anlisis y herramientas para anlisis -
VBA y despus aceptar:

4. Para comprobar que ya le fue activado el anlisis de datos de nuevamente clic en herramientas y mire que
en la parte inferior de la ventana diga anlisis de datos:

SOLUCIN AL PROBLEMA

Para construir distribuciones de frecuencia en Excel primero escribimos los datos en una columna abrimos la
ventana anlisis de datos:

Pgina 27 de 177
Luego al dar clic en histograma obtenemos la siguiente ventana:

En el rango de entrada debemos darle clic en la flecha roja y luego sealar los datos, despus le damos clic
otra vez en la flecha roja para que nos aparezca la misma ventana. La opcin rango de clases no es
obligatoria, pues si no escribimos nada Excel lo har haciendo todas de igual amplitud, en caso contrario
nosotros se las daremos; en el rango de salida debe escribir la celda donde quiere que le aparezca la
distribucin.

Para nuestro ejemplo lo haremos primero sin escribir el rango de clases y la salida del computador ser:

Clase Frecuencia
200 1
320 3
440 4
560 6
680 9
y mayor... 7

Donde nos ndica que de cero a 200 solo hay un valor, de 200 a 320 hay 3 y as sucesivamente, es decir en las
clases nicamente muestra el lmite superior.

Si desea que los datos aparezcan distribuidos por el nmero de clases determinado por usted, se utiliza
entonces la opcin rango de clases. Para obtener la amplitud de los rangos de las clases se debe determinar
primero el rango de los datos a analizar, lo cual se consigue restndole al dato mayor, el dato menor. Luego
para obtener la amplitud, se divide el resultado anterior en la cantidad de clase que se desea obtener. Si le
damos 6 clases la amplitud ser de 100 y la distribucin quedar as:

Pgina 28 de 177
Clase Frecuencia
300 4
400 3
500 6
600 6
700 6
y mayor... 5

En este caso entre 0 y 300 hay 4, entre 300 y 400 hay 3 y as sucesivamente, se observa que la frecuencia
ms alta esta entre 600 y 700.

Usando las formulas de Excel usted puede construir las dems frecuencias as:

1. Para frecuencias relativas: +(celda de la casilla absoluta / celda del total de datos)*100
2. Para frecuencias acumuladas: copia la primera frecuencia y despus +primera celda de la frecuencia
ms la siguiente, y as sucesivamente. La tabla que obtendr ser la siguiente:

Clase Frecuencia frec relativ frec acumul frec rel acum


200 300 4 13,3333333 4 13,3333333
300 400 3 10 7 23,3333333
400 500 6 20 13 43,3333333
500 600 6 20 19 63,3333333
600 700 6 20 25 83,3333333
700 y mayor... 5 16,6666667 30 100
Totales 30 100

Solucin

1) El 10% de los das cunto dinero se vendi?

De acuerdo con la tabla anterior de las frecuencias se observa que el 10% de los das las ventas estn entre
300 y 400 mil pesos

2) Cuntos das se vendi entre 500 y 600 mil pesos?


Los das en los que se vendi entre 500 y 600 mil pesos fueron 6

3) El 57% de las ventas qu valor supera?


Supera la venta de 500 mil pesos

4) En 8 de los 30 das cunto dinero se vendi?


Se ha vendido ms de 400 mil pesos

Pgina 29 de 177
Leccin 5: Presentacin de la informacin: histogramas,
polgonos, ojivas y caja y bigote.
Las distribuciones de frecuencia las podemos ver representadas grficamente mediante histogramas, grficas
circulares y ojivas. Estas grficas brindan una interpretacin ms rpida y ms clara de los datos que se
obtuvieron de la muestra; sin embargo, existen diversidad de grficos que pueden ser empleados para la
representacin de datos, de acuerdo al tipo de datos y lo que se desee presentar.

Las grficas proporcionan datos en un diagrama de dos dimensiones. En el eje horizontal se puede mostrar los
valores de la variable (las caractersticas que se estn midiendo), y en el eje vertical se sealan las frecuencias
de las clases mostradas en el eje horizontal. A continuacin se presentarn brevemente los distintos tipos de
grficos que se emplean para la presentacin de datos y los pasos para realizarlos utilizando Excel.

Grficos Estadsticos:
Para apreciar a golpe de vista la magnitud o posicin de las variables, se suelen efectuar una representacin
grfica, los sistemas de grficos ms usuales son:

Diagrama de sectores El rea de cada sector es proporcional a la frecuencia que se quiera representar, sea
absoluta o relativa.

Para calcularlo podemos decir que el rea depende del ngulo central, mediante la siguiente proporcin:
ni/N=/360

Como resulta ni /N = fi , tendremos que f i * 360

x5 x1

x4

x2
x3

Cuando lo que se desea es resaltar las proporciones que representan algunos subconjuntos con respecto al
total, es decir, cuando se est usando una escala categrica, conviene utilizar una grfica llamada de pastel o
circular

Por ejemplo, para ilustrar la matrcula en licenciatura (en Mxico) por reas de conocimiento en el ao de 1992
se puede usar algo as como sigue (Fuente: ANUIES,1995):

Pgina 30 de 177
De hecho, si se desea resaltar una de las categoras que se presentan, es vlido tomar esa "rebanada" de la
grfica y separarla de las dems:

Hay que tomar algunas precauciones al utilizar este tipo de grficos. Por un lado, comparar dos grficos
circulares (por ejemplo, si se quisieran comparar las proporciones de matrculas en licenciatura por reas de
conocimiento en licenciatura para dos aos distintos) resulta muy difcil y, por tanto, no es muy aconsejable.

Por otro lado, en ocasiones existen categoras con pocas frecuencias (por ejemplo, dos o tres con
frecuencias relativas menores al 1% cada una), haciendo que la grfica resulte "pesada" y las etiquetas se
encimen. Una posible solucin es juntarlas en una sola categora (por ejemplo, la tpica "otras" o "varias"), pero
entonces habra que ponderar si se hace una grfica extra con dichas observaciones nicamente, haciendo la
anotacin pertinente, o simplemente se ignoran por no resultar significativas.

Diagrama de barras: se utiliza para frecuencias absolutas o relativas, acumuladas o no, de una VARIABLE
DISCRETA. En el eje de abscisas, situaremos los diferentes valores de la variable. En el eje de ordenadas la
frecuencia. Levantaremos barras o columnas SEPARADAS de altura correspondiente a la frecuencia
adecuada.

8
6
ni
4
2
0
x1 x2 x3 x4 x5 Variable

Histograma: Igual que el anterior en cuanto al tipo de frecuencias que se pueden utilizar. La diferencia: es
para variables CONTINUAS. Si la amplitud del intervalo es la misma, elevaremos columnas UNIDAS, a altura
la frecuencia correspondiente. Si la amplitud del intervalo es diferente, el rea del rectngulo columna ser
proporcional a la frecuencia representada.

Pgina 31 de 177
En el eje horizontal (o de las abscisas) se representan los intervalos de los datos, marcndose de manera
continua las fronteras entre cada uno de los stos. De esta manera, el histograma est compuesto rectngulos,
cuyo nmero coincide con la cantidad de intervalos considerados, el ancho de la base de cada uno de esos
rectngulos es la misma siempre y coincide con las fronteras de los intervalos, y la altura corresponde a la
frecuencia de cada intervalo.

Es importante observar que resulta difcil utilizar este tipo de representacin cuando existen intervalos abiertos
o cuando los intervalos no son iguales entre s.

Otra observacin es la amplitud de los intervalos, que se puede establecer utilizando la regla de Sturges, pues
al cambiarla la presentacin visual de un histograma puede variar.

El programa Excel no permite crear de manera automtica histogramas, pues proporciona el ancho de las
columnas de tal manera que quedan separadas. Sin embargo, existe la manera de hacerlas.

Otra observacin pertinente es que se pueden representar en la misma grfica, utilizando las mismas escalas
horizontales y verticales, varios datos correspondientes a las mismas variables producto de varias
observaciones. Esto produce una grfica con varias series, correspondiendo cada una de ellas a cada
observacin de la muestra (o poblacin), y tenindose una grfica compuesta. Es conveniente que cada serie
de datos (u observaciones) sean ilustradas o iluminadas de igual manera entre s, pero distinta de las dems.

El ejemplo que sigue pertenece al comportamiento de las calificaciones parciales de tres alumnos de
preparatoria. Las series (cada una de las calificaciones parciales) estn coloreadas con diferente color para
mostrar el comportamiento tanto individual, como de cada uno de los alumnos con respecto a los dems. Es
interesante observar que la escala horizontal no es continua (es nominal).

Tambin es posible realizar grficas de barras horizontales, los cuales se parecen mucho a las grficas de
columnas, con la salvedad importante de que la funcin de los ejes se intercambian y el eje horizontal queda
destinado a las frecuencias y el eje vertical a las clases.

Es muy comn que este tipo de grficos se utilicen para ilustrar el tamao de una poblacin dividida en estratos
como, por ejemplo, son sus edades. El ejemplo que se presenta es la poblacin de un pas ficticio llamado
"Timbuctulandia":

Pgina 32 de 177
A este tipo de grficos en particular se le llama pirmide de edades por su forma. Incluso, cuando se compara
la poblacin masculina y femenina por estratos de edades, se estila utiliza el lado izquierdo para la poblacin
de un sexo y el lado derecho para el otro, el resultado es una "pirmide" casi simtrica (depender de la
poblacin en particular).

Diagrama de escalera: se utiliza para frecuencias acumuladas.

25
20
15
10
5
0
x1 x2 x3 x4 x5

Grfico de Lneas

Cuando los datos se relacionan entre s, es decir, cuando podemos decir que existe cierta continuidad entre las
observaciones (como por ejemplo el crecimiento poblacional, la evolucin del peso o estatura de una persona a
travs del tiempo, el desempeo acadmico de un estudiante a lo largo de su instruccin escolar, las
variaciones presentadas en la medicin realizada en algn experimento cada segundo o minuto) se pueden
utilizar las grficas de lneas, que consisten en una serie de puntos trazados en las intersecciones de las
marcas de clase y las frecuencias de cada una, unindose consecutivamente con lneas:

Pgina 33 de 177
Este ejemplo muestra el comportamiento del peso corporal (en kilogramos) de dos individuos a lo largo de
cinco observaciones anuales. Al igual que en el caso de las grficas de columnas (y de otras ms) es posible
presentar varias series de observaciones (en este caso cada serie de observaciones son los pesos de un
individuo).

Otra forma de representacin de un uso menos comn, y muy parecida a las grficas de lneas, es el polgono
de frecuencias. La diferencia fundamental entre ambas es que en el polgono de frecuencias se aaden dos
clases con frecuencias cero: una antes de la primera clase con datos y otra despus de la ltima. El resultado
es que se "sujeta" la lnea por ambos extremos al eje horizontal y lo que podra ser una lnea separada del eje
se convierte, junto con ste, en un polgono.

El siguiente ejemplo corresponde al porcentaje del PIB gastado en docencia e investigacin durante el ao de
1990 en cinco pases (fuente: Revista "Ciencia y Desarrollo", 1994, XIX(114):12):

El Excel no crea automticamente polgonos de frecuencias, sino que produce grficas de lneas. Sin embargo,
es posible arreglrselas para hacerlas.

Una grfica similar al polgono de frecuencias es la ojiva, pero sta se obtiene de aplicar parcialmente la misma
tcnica a una distribucin acumulativa y de igual manera que stas, existen las ojivas mayor que y las ojivas
menor que.

Existen dos diferencias fundamentales entre las ojivas y los polgonos de frecuencias (y por esto la aplicacin
de la tcnica es parcial):

1. Un extremo de la ojiva no se "amarra" al eje horizontal, para la ojiva mayor que sucede con el extremo
izquierdo; para la ojiva menor que, con el derecho.

2. En el eje horizontal en lugar de colocar las marcas de clase se colocan las fronteras de clase. Para el
caso de la ojiva mayor que es la frontera menor; para la ojiva menor que, la mayor.

Las siguientes son ejemplos de ojivas, a la izquierda la mayor que, a la derecha la menor que, utilizando los
datos que se usaron para ejemplificar el histograma:

Pgina 34 de 177
La ojiva mayor que (izquierda) se le denomina de esta manera porque viendo el punto que est sobre la
frontera de clase "4:00" se ven las visitas que se realizaron en una hora mayor que las 4:00 horas (en
cuestiones temporales se dira: despus de las 4:00 horas). De forma anloga, en la ojiva menor que la
frecuencia que se representa en cada frontera de clase son el nmero de observaciones menores que la
frontera sealada (en caso de tiempos sera el nmero de observaciones antes de la hora que seala la
frontera).

Si se utiliza una distribucin porcentual acumulativa entonces se obtiene una ojiva (mayor que o menor que
segn sea el caso) cuyo eje vertical tiene una escala que va del 0% al 100%. El siguiente ejemplo es la misma
ojiva menor que, que se acaba de usar, pero con una distribucin porcentual:

Polgono de frecuencias, es la recta que une los extremos de las variables de una distribucin, un ejemplo
clsico es el de la evolucin de la temperatura de un paciente

6
5
4
3
2
1
0
x1 x2 x3 x4 x5

Nota: Si la variable es cualitativa (rubio, moreno, alto bajo, etc.) se suelen utilizar ms los diagramas de
sectores o pictogramas

Si la variable es cuantitativa podemos tener dos casos: Variable discreta o variable continua.

En el primer caso: variable discreta utilizaremos si no piden nada concreto, el diagrama de barras cuando se
refiera a la representacin grfica de la frecuencia absoluta (ni)
8
6
4
2
0
x1 x2 x3 x4 x5

En cambio cuando nos estemos refiriendo a la frecuencia absoluta acumulada optaremos por el diagrama de
escalera

Pgina 35 de 177
25
20
15
10
5
0
x1 x2 x3 x4 x5

En el caso de la variable continua, optaremos por el histograma para las frecuencias absolutas y por el
polgono de frecuencias en el caso de la frecuencia acumulada.

Pictograma: Se suele utilizar para expresar un atributo. Se suelen utilizar iconos que se identifiquen con la
variable (ejemplo un coche) y su tamao suele guardar relacin con la frecuencia

Actualmente, y mucho en los medios masivos de comunicacin, se utilizan grficos para ilustrar los datos o los
resultados de alguna investigacin. Regularmente se utilizan dibujos para representar dicha informacin, y el
tamao o el nmero de estos dibujos dentro de una grfica queda determinado por la frecuencia
correspondiente. A este tipo de grfica se le llama pictograma y stos son dos ejemplos:

El de la izquierda representa la poblacin de los Estados Unidos (cada hombrecillo representa a dos millones
de habitantes), el de la derecha representa la masa de tres planetas de nuestro sistema solar tomando como
unidad a la masa de la Tierra (cada representa la masa de nuestro planeta: Venus tiene masa menor y
Neptuno tiene ms 17 veces ms masa que la Tierra).

Las versiones del Excel 7.0 y anteriores no tienen opciones para realizar este tipo de grficas, las posteriores
s. Otros programas contemporneos (como el Corel Draw o el Harvard Graphics) s son capaces.

Grfico de Dispersin: Cuando se pretende ilustrar la dispersin de las observaciones realizadas, y as


trabajar algunas cosas como correlaciones se puede utilizar una grfica de dispersin. Por ejemplo, el ejemplo
de la izquierda es la dispersin que se presenta al comparar el nmero de tesis doctorales en ciencias exactas
contra el nmero de total de tesis doctorales (todo en Mxico) en observaciones anuales entre 1984 y 1990
(fuente: Revista "Ciencia y Desarrollo", 1994, XIX(114):12):

Pgina 36 de 177
La grfica de la derecha es resultado de comparar el dimetro (en miles de kilmetros) de los planetas
interiores del nuestro sistema solar contra sus densidades (en gramos por centmetro cbico). Es interesante
observar que los puntos parecen "seguir" una lnea imaginaria que se asemeja a una recta, con excepcin de
un caso atpico: Mercurio.

Uno de los usos de este tipo de grficas es precisamente encontrar si las observaciones siguen algn patrn
lineal (una lnea de tendencia) o si existen valores atpicos. Para el caso del Excel, el programa es capaz de
graficar las lneas de tendencias que siguen un conjunto de datos.

Como resumen final, se presenta a continuacin un cuadro resumen donde se clasifica los principales tipos de
grficos a utilizar de acuerdo al tipo de variable que se este trabajando:

Pgina 37 de 177
EMPLEANDO EXCEL - ACTIVIDAD GUIADA

Un profesor realiz una encuesta a sus estudiantes para analizar el ncleo familiar. Para esto pregunt a cada
uno de sus 35 estudiantes el nmero de hermanos y obtuvo los siguientes datos:

N de Hermanos frecuencia
0 4
1 6
2 2
3 8
4 4
5 1
Total 25

El profesor quiere responder las siguientes preguntas:

1. Qu porcentaje corresponde al mayor nmero de hijos?


2. Aproximadamente el 22% de las familias tienen cuntos hijos?
3. El 80% de las familias tienen menos de cuntos hijos?
4. Cuntas familias tienen 3 hijos o menos?

Solucin:
Para poder resolver estas preguntas se va a utilizar los grficos de la siguiente manera:

3. Damos clic en el icono de grficos y obtenemos la siguiente ventana:

Pgina 38 de 177
4. Cualquiera de estas opciones puede escoger, se escoger columnas ya que es la ms comn y adems es
la que representa el histograma de la distribucin, al dar clic en siguiente se obtendr la siguiente ventana:

En el rango de datos damos clic en la flecha roja sealamos la distribucin y luego damos otra vez clic el
misma flecha y clic en siguiente.

3. La siguiente ventana ser:

Pgina 39 de 177
Los dilogos de la ventana son muy sencillos, la siguiente ventana ser; :

Que es la de ubicacin del grfico: en hoja nueva o en alguna celda en especial, y finalizamos dndolo clic en
terminar y el grfico ser:

En este histograma podemos observar que:

1. El mayor nmero de hijos es 3 y corresponde a un 34.5% del total


2. Vemos tambin que el 22% de la poblacin tiene 4 hijos.

Para responder las pregustas 3 y 4 del profesor nos toca realizar la ojiva, la cual obtenemos siguiendo los
pasos anteriores:

5. Aqu observamos que el 80% tiene 4 hijos o menos.


4. El 60% tiene 3 hijos o menos

Pgina 40 de 177
CAPTULO 2. ANLISIS MATEMTICO DE LA
INFORMACIN
Leccin 6: Parmetros y Estadsticos
Parmetro: Son medidas numricas descriptivas, asociadas a la poblacin, son valores fijos pero
2
desconocidos. Algunos de ellos: = La media. = Varianza. = Desviacin tpica o estndar.

Los parmetros como valores fijos, no tienen distribucin de probabilidad, siendo caractersticas propias de la
poblacin objeto de estudio.

Promedio poblacional:

Donde N = total de la poblacin y = Promedio poblacional.

Varianza poblacional: ( )

Estadsticos: Son medidas numricas descriptivas, asociadas a la muestra, se consideras variables aleatorias.
2
Algunos de ellos: = La media o promedio. s = La varianza. s = Desviacin tpica. Los estadsticos como
estn asociados a la muestra aleatoria, tienen distribucin de probabilidad, ya que segn la muestra tomada,
ste varia.

Promedio muestral:

Donde N = total de la poblacin y = Promedio poblacional.

Varianza muestral: ( )

Leccin 7: Medidas de tendencia central: La media, la mediana y


la moda
INTRODUCCIN
En las secciones anteriores se presentaron las tcnicas para agrupar los datos (distribuciones o tablas de
frecuencia) y se plantearon las tcnicas grficas para descubrir los patrones de distribucin ocultos en un
conjunto de datos; se mencion que la estadstica cumpla una funcin descriptiva mediante el uso de cuadros
o tablas y grficos para la clasificacin, ordenacin y presentacin de datos estadsticos, limitando el anlisis
de la informacin a la interpretacin porcentual de las distribuciones de frecuencia.
El anlisis estadstico propiamente dicho, parte de la bsqueda de parmetros sobre los cuales pueda recaer la
representacin de toda la informacin. En esta seccin y en la prxima (medidas de tendencia central y de
dispersin) se definir algunas medidas numricas que se emplean para describir conjuntos de datos.
Una de las caractersticas ms sobresalientes de la distribucin de datos es su tendencia a acumularse hacia el
centro de la misma; esta caracterstica se denomina tendencia central. Las medidas de posicin o de tendencia
central nos permiten determinar la posicin de un valor respecto a un conjunto de datos, el cual
consideraremos como representativo o tpico para el total de las observaciones.

Pgina 41 de 177
Antes de entrar a definir las medidas de tendencia central, repasaremos algunas notaciones simblicas que
son de gran utilidad y son esenciales en la estadstica.

SUMATORIAS Y OTRAS NOTACIONES IMPORTANTES


El uso de la notacin simblica es esencial en estadstica. Por ejemplo, para distinguir entre los valores de n
observaciones se emplea la notacin simblica x1, x2,, xn. En el anlisis estadstico de un conjunto de datos
se requiere del uso de sumas de nmeros, por lo cual, es conveniente introducir una notacin simple para

trminos en secuencia. De esta manera, la suma de x1, x2,, xn se designa por:


n

x
i 1
i x 1 x 2 x 3 ... x n ,
Y se lee suma de las xi, con i variando desde 1 hasta n. La letra i recibe el nombre de ndice de suma toma
valores enteros sucesivos hasta e incluyendo a n, que es el lmite superior o el valor ms grande de i.
Considere, por ejemplo, la sucesin de nmeros: 1, 4, 7, 10, 13,, y suponga que se desea referirse a la suma
de los cuadrados de los primeros cuatro trminos de la sucesin. En la notacin de sumatoria esto se escribira
como
4

y
i 1
2
i 12 4 2 7 2 10 2 1 16 49 100 166
De
n
a) x
i 1
2
i x 12 x 22 x 32 ... x 2n ,

n
b) (x
i 1
i a) (x 1 - a) (x 2 - a) (x 3 - a) ... ( x n - a),

n
c) (x
i 1
i a) 2 (x 1 - a) 2 (x 2 - a) 2 (x 3 - a) 2 ... ( x n - a) 2 ,

n
d) x y
i 1
i i x 1 y1 x 2 y 2 x 3 y 3 ... x n y n ,

n
1. Si c es cualquier constante, entonces c nc
i 1

n n
2. Si c es cualquier constante, entonces cx i c x i
i 1 i 1

n n n
3. x
i 1
i yi x i yi
i 1 i 1

Como ejemplo, consideremos la sucesin de nmeros 1, 2, 3, 4, y sean a=10 y c=5, entonces,

Pgina 42 de 177
x
4 4 4 4
2
i ax i 5 x i2 a x i 5
i 1 i 1 i 1 i 1

2 2 2 2

1 2 3 4 10 1 2 3 4 5 5 5 5
1 4 9 16 10 10 20
30 100 20
150
Otro smbolo til e (pi). Esta letra se emplea para indicar el producto de los trminos de una
secuencia. Por ejemplo, dada la secuencia de observaciones x1, x2,, xn se designa por:
n

x
i 1
i x 1 . x 2 . x 3 .... x n
Donde la letra i tiene el mismo propsito que en la suma.

MEDIDAS DE TENDENCIA CENTRAL


Las medidas de tendencia central, llamadas as porque tienden a localizarse en el centro de la informacin son
de gran importancia en el manejo de las tcnicas estadsticas, sin embargo, su interpretacin no debe hacerse
aisladamente de las medidas de dispersin, ya que la representatividad de ellas est asociada con el grado de
concentracin de la informacin.
Las principales medidas de tendencia central son:
Media aritmtica

Mediana

Moda

Sin embargo, existen otras medidas menos comunes; las medidas de tendencia central, tambin denominadas
medidas de posicin, pueden ser pueden ser de dos tipos:

1. CENTRALES:

Medias: Aritmtica, Geomtrica, Armnica


Medianas
Moda

2. NO CENTRALES O DE POSICIN:

Cuantiles:
Cuartiles
Deciles
Centiles o percentiles

La frmula de clculo de cada una de ellas depende de cmo se encuentren presentados los datos: agrupados
o sin agrupar. Por datos agrupados entenderemos los presentados en una tabla de frecuencias (variable
discreta o continua), mientras que por datos sin agrupar se entender los que se encuentran enlistados.

Media Aritmtica
Es la medida de posicin mas empleada, la ms conocida y sencilla de calcular, de gran estabilidad en el
muestreo y sus frmulas admiten tratamientos algebraicos. Tambin se le conoce como promedio aritmtico o

Pgina 43 de 177
simplemente como la media de un conjunto de observaciones. Cotidianamente e inconscientemente estamos
utilizando la media aritmtica. Cuando por ejemplo, decimos que un determinado fumador consume una
cajetilla de cigarrillos diaria, no aseguramos que diariamente deba consumir exactamente los 20 cigarrillos que
contiene un paquete, sino que es el resultado de la observacin, es decir, dicho sujeto puede consumir 18 un
da, 10 otro, 20, 21, 22; pero segn nuestro criterio, el nmero de unidades estar alrededor de 20.
Su desventaja principal es el de ser muy sensible a valores extremos, es decir, puede afectarse de manera
desproporcionada por la presencia de valores grandes, o de valores muy pequeos.
Se designar el smbolo (la letra griega miu) para designar una media poblacional, y x (que se leer como
x-barra) para designar una media muestral.

Media para datos sin agrupar


1. Sean x1, x2,, xN, los N datos correspondientes a una poblacin. Entonces la media poblacional es,
N

x 1 x 2 x 3 ... x N
xi
1 N
i 1
xi
N N N i 1
2. Sean x1, x2,, xn, los n datos correspondientes a una muestra. Entonces la media muestral es,
n

x 1 x 2 x 3 ... x n
xi
1 n
x i 1
xi
n n N i 1
Ejemplo
Hallar la media aritmtica de los siguientes nmeros: 10, 8, 6, 5, 10, 7.

SOLUCION:
6

x i
1 6 10 8 6 5 10 7
x i 1

6

6 i 1
xi
6
8
Ejemplo
Cantidad de cigarrillos consumidos por un fumador en una semana.
Lunes 18
Martes 21
Mircoles 22
Jueves 21
Viernes 20
Sbado 19
Domingo 19
Entonces la media aritmtica es
7

x i
18 21 22 21 20 19 19
x 1
20
7 7
El fumador consume en promedio 20 cigarrillos diarios.

Para algn campo de la ciencia, especficamente en la fsica, se dice que la media aritmtica es el CENTRO
DE GRAVEDAD de los datos.

Media para datos agrupados


Cuando se cuenta con una variable discreta que se encuentra agrupada en una distribucin de frecuencias de
k valores, la media aritmtica se calcula por la frmula:

Pgina 44 de 177
k

x .f i i
1
x i 1

n

n
xifi
Ejemplo
Al organizar los datos en el ejemplo de la cantidad de cigarrillos consumidos por un fumador en una semana,
se obtiene la siguiente distribucin de frecuencias.
Cantidad Frecuencia
(Xi) (fi)
18 1

19 2

20 1

21 2

22 1
Total 7

x f i i
18(1) 19(2) 20(1) 21(2) 22(1) 140
x 1
20
7 7 7
Para facilidad del clculo de la media, se puede recurrir a construir primeramente en el cuadro, el valor del
numerador as,
Cantidad (Xi) Frecuencia (fi) Xi fi

18 1 18

19 2 38

20 1 20

21 2 42

22 1 22

Total 7 140

Si la informacin se encuentra relacionada en una distribucin de frecuencias por intervalo (variable continua),
se toman como valores de la variable las marcas de clase de los intervalos; recurdese que por marca de
clase se entiende el punto medio entre los lmites de cada clase o intervalo.

Ejemplo

Mediante la siguiente distribucin de frecuencias que nos muestra los espesores en pulgadas, de recipientes
de acero, hallar la media aritmtica.

Pgina 45 de 177
Espesores
0.307 - 0.310 0.311 - 0.314 0.315 - 0.318 0.319 - 0.322 0.323 - 0.326 0.327 - 0.330
en pulg

f 3 5 5 22 14 1 N= 50

SOLUCION:

Espesores
0.307 - 0.310 0.311 - 0.314 0.315 - 0.318 0.319 - 0.322 0.323 - 0.326 0.327 - 0.330
en pulg

f 3 5 5 22 14 1 N= 50

mi 0,3085 0,3125 0,3165 0,3205 0,3245 0,3285


fmi 0,9255 1,5625 1,5825 7,051 4,543 0,3285 15,99

De esta manera, el espesor promedio de los recipientes de acero es de 0,32 pulgadas.

Media Aritmtica Ponderada


En lo que se ha venido presentando, se observa que la media aritmtica se calcula otorgndole a los datos
igual importancia a cada uno de ellos; sin embargo, existen casos donde los datos se encuentran ponderados
por un determinado peso.
La media aritmtica ponderada tiene en cuenta la importancia relativa de cada uno de los datos, para lo cual, la
definimos de la siguiente manera:
n

x w i i
xw i 1
n
,
w
i 1
i

Donde x w es la media ponderada,


xi es el valor de la variable para el i-simo elemento, y
wi es la ponderacin de la i-sima variable para el i-simo elemento.

Ejemplo
Las calificaciones de un estudiante estn conformadas por los siguientes factores: Un examen cuyo valor es el
60% en el cual obtuvo una nota de 3,0; talleres de resolucin de ejercicios con ponderacin del 25% con una
calificacin de 3,5 y por ltimo, laboratorios de consulta y resolucin de ejercicios con un valor del 15% y una
nota de 4,5. Cul es la nota final del primer corte del estudiante?
SOLUCIN
El ejercicio brinda los siguientes datos.
Ponderaciones: w1 = 0,6; w2 = 0,25 y w3 = 0,15.
Datos de la Variable: x1 = 3,0; x2 = 3,5 y x3 = 4,5.
De esta manera, se tiene que:
3

x w i i
3,0(0,60) 3,5(0,25) 4,5(0,15) 1,80 0,875 0,675 3,35
xw i 1
3,35
3
0,60 0,25 0,15
w
1,00 1,00
i
i 1
As, la nota definitiva es 3,4.

Pgina 46 de 177
Para datos agrupados, tenemos que la frmula para calcular la media aritmtica ponderada est dada por,
n

x f w i i i
xw i 1
n

w f
i 1
i i

Propiedades de la media aritmtica


1. La suma de las diferencias de los datos con respecto a la media aritmtica es igual a cero, es decir,

xi 1
i - x 0
Para comprobar esta propiedad recurriremos a las propiedades de la sumatoria descritas previamente.
Tenemos que:
n n n

x i - x x i x
i 1 i 1 i 1
Sin embargo,
n

x i
x i 1
, despejando tenemos que
n
n
nx x i
i 1
Cabe mencionar que una vez calculada la media aritmtica, esta es una constante, por tanto, por
propiedades de la sumatoria:
n

x nx
i 1
De esta manera, reemplazando las dos igualdades en la ecuacin original tenemos que:
n n n

x
i 1
i - x xi x
i 1 i 1

nx - nx
0
Veamos un ejemplo de comprobacin; para ello consideremos los datos dados para el problema del
fumador cuya media es de 20 cigarrillos por da:
X xi - x
18 18 20 = -2
21 21 20 = 1
22 22 20 = 2
21 21 20 = 1
20 20 20 = 0
19 19 20 = -1
19 19 20 = -1
Suma 0

Para una distribucin de frecuencias, consideremos el mismo ejemplo con los datos agrupados:

Pgina 47 de 177
X fi xi - x (xi - x )fi
18 1 18 20 = -2 -2
21 2 21 20 = 1 2
22 1 22 20 = 2 2
20 1 20 20 = 0 0
19 2 19 20 = -1 -2
Suma 7 0

2. La suma de las diferencias cuadrticas de los datos, con respecto a la media aritmtica es mnima.
n 2

x i - x es mnima para x ; quiere decir que para cualquier otro parmetro p, diferente a la media
i 1

n 2 n 2

aritmtica hacer mayor la expresin x i - p > x i - x .


i 1 i 1

3. La media aritmtica de una constante es igual a la constante. Es decir, dada x i=k, para i=1, 2, 3,, n.

1 n 1 n 1
x x i k n.k k
n i1 n i1 n
Ejemplo
Si un alumno presenta 5 parciales y en todos ellos alcanza una calificacin de cuatro, su nota promedio
ser de cuatro:
1 n 1 5 1
x x i 4 5.4 4
n i1 5 i1 5
4. Si a cada uno de los resultados de una variable le sumamos o le restamos una constante C, la media
aritmtica de la nueva variable queda alterada en esa constante. Formalmente, la media de una variable
mas (o menos) una constante es igual a la media aritmtica de la variable mas (o menos) la constante.

Sean x1, x2,, xn datos de una variable X cuya media aritmtica es x . Definimos una variable Y de tal
manera que y1 = x1 c, y2 = x2 c,, yn = xn c, es decir yi = xi c, i=1, 2,, n.
Entonces la media aritmtica de la nueva variable es:
1 n 1 n 1n n
1 n 1 n 1
y y i x i c x i c x i c x n.c
n i1 n i1 n i1 i1 n i1 n i1 n
Es decir,
yxc

Ejemplo
Consideremos la siguiente distribucin de frecuencias:

Pgina 48 de 177
1 5 1 1 5 1
x x ini 134 6,7 y y ini 174 8,7
n i 1 20 n i 1 20
y x 2 6,7 2 8,7

El ejemplo es vlido para la diferencia:

Ejemplo
2
Se tienen 100 baldosas y se midi sobre ellas su resistencia en Kg/m , obteniendo los siguientes datos:

Con base en estos datos, tenemos que la resistencia media de las 100 baldosas es:
1 5 1
x mi n i 44.800 448 Kg/m2
n i 1 100
Si hacemos Y = X 450:

1 5 1
y y ini 200 2 Kg/m2
n i 1 100

Pgina 49 de 177
y x 450 448 - 450 - 2

5. Si cada uno de los datos se multiplica por una constante K, entonces la media aritmtica queda
multiplicada por esa constante.

Sean x1, x2,, xn los datos de una variable X cuya media aritmtica es x .
De igual forma, sea y1 = k.x1, y2 = k.x2,, yi = k.xi,, yn = k.xn.
La media aritmtica de la nueva variable es y k.x :
1 n 1 n k 5 1 5
y
n i 1
y i k.x i x i k. x i k.x
n i 1 n i 1 n i 1
Ejemplo
Considerando la siguiente distribucin de frecuencias y tomando k=2 se tiene que:

1 5 1 1 5 1
x x ini 134 6,7 y y ini 268 13,4
n i 1 20 n i 1 20
y 2.x 2(6,7) 13,4
Ejemplo
1
Si multiplicamos cada una de las resistencias de las 100 baldosas por una constante k , tenemos:
100

1 7 1
y m y ni 100 448 4,48
n i 1 i
1
y 4,48 448 1 x
100 100

6. Empleando las dos propiedades anteriores, podemos calcular la media de una combinacin lineal de
variables, esto es, una transformacin de variables:

Pgina 50 de 177
Sean x1, x2,, xn los datos de una variable X cuya media aritmtica es x ; de manera similar, sean C y K,
dos constantes y Y una variable aleatoria tal que Y = C.X K. Entonces la media aritmtica de la nueva
variable es y c.x k .

Ejemplo
En una empresa constructora de vivienda los salarios semanales tienen una media de $169.000. Como
una solucin al conflicto laboral surgido se proponen dos soluciones al conflicto:
1. Aumento del 6% en el salario semanal, ,

2. Aumento del 4% ms una bonificacin semanal de $5.800 a cada obrero.

Cul de las dos alternativas mejora la situacin de los obreros?

Tenemos que, sea X la variable salario mensual, entonces:


Y1 = 1,06.X y 1,06.x 1,06(169.000) 179.140 , es decir, si aplicamos la primera opcin,
obtendramos un nuevo salario semanal de $179.140.

Y2 = 1,04.X + 5800 y 1,04.x 5.800 1,04(169.000) 5.800 175.760 181.560 , es decir, si


aplicamos la segunda opcin, obtendramos un nuevo salario semanal de $181.560.

7. La media de una muestra es igual a la media ponderada de las sub-muestras, tomndose como
ponderacin los tamaos de las sub-muestras, es decir,

n1 .x1 n2 .x 2 ... nk .x k
x ,
n
Donde n = n1 + n2 + + nk.

Ejemplo

1 5 1
43 2,15 , x 1 1 x ini 1 16 1,33 , 1 1
3 2
x
n i 1
x ini
20
x2 x ini 27 3,375
n1 i 1 12 n2 i 1 8
De esta manera,
n .x n 2 .x 2 12 1,33 8 3,375 43
x 1 1 2,15
n1 n 2 12 8 20

La Mediana

Otra medida de tendencia central, utilizada principalmente en estadstica no paramtrica es la mediana, la


cual, a diferencia de la media, no busca el valor central del recorrido de la variable segn la cantidad de
observaciones, sino que busca determinar el valor que tiene aquella observacin que divide la cantidad de

Pgina 51 de 177
observaciones en dos mitades iguales. Por lo tanto es necesario atender a la ordenacin de los datos, y
debido a ello, este clculo depende de la posicin relativa de los valores obtenidos. Es necesario, antes que
nada, ordenar los datos de menor a mayor (o viceversa).

Hay que tener en cuenta que si x1, x2,, xN-1, xN, se utiliza para denotar el conjunto de las observaciones,
donde el subndice indica el orden en el dato que fue obtenido o registrado, suele utilizarse x(1), x(2),, x(N-1),
x(N), para representar las mismas observaciones, pero ahora ordenadas de menor a mayor, por lo tanto ahora
aparece primero el dato ms pequeo y ltimo el ms grande.

Mediana para datos sin agrupar


Para determinar el valor de la mediana en datos enlistados, hay que tener en cuenta la cantidad de datos que
se recolectaron; es decir, si se tiene un nmero de datos IMPAR o si por el contrario, el nmero de datos es
PAR; a continuacin se presentara la mecnica a emplear para su clculo.
a. Nmero impar de observaciones: La mediana es el valor del dato central as, la mediana puede
expresarse como:

Mediana Me x N 1 , en caso de que N (o n) sea impar.



2
Ejemplo
En el ejercicio de los cigarrillos consumidos por un fumador, los datos suministrados fueron:
Lunes (x1)=18, martes (x2)=21, mircoles (x3)=22, jueves (x4)=21, viernes (x5)=20, sbado (x6)=19 y
domingo (x7)=19.
En primer lugar, tenemos siete (7) datos, un nmero IMPAR.
Ordenando ascendentemente los datos tenemos:

x(1) = 18, x(2) = 19, x(3) = 19, x(4) = 20, x(5) = 21, x(6) = 21, x(7) = 22.
Una vez ordenados los datos, determinamos el valor de la variable que se encuentra en la posicin central
de los datos, es decir:

Me x N 1 x 7 1 x 8 x 4 20

2 2 2
De esta manera, consideramos que en el 50% de los das de la semana este fumador consume mximo
20 cigarrillos; mientras que en el restante 50% de los das fuma mas de 20 cigarrillos.
Ntese que tras del cuarto dato ordenado se encuentran 3 valores observados, la misma cantidad de
observaciones que superan el valor de la mediana, esto es:

La mediana divide la cantidad de datos en dos partes iguales.

b. Nmero par de observaciones: La mediana esta determinado por el valor de la semisuma (promedio
aritmtico) de los valores de los dos datos centrales, esto es:

x N x N
1
2 2
Mediana Me , en caso de que N (o n) sea par.
2

Pgina 52 de 177
Ejemplo
3
Consideremos el consumo mensual de agua en m , por una fbrica de confecciones La Hilacha.
Enero (x1) = 10, Mayo (x5) = 14, Septiembre (x9) = 18
Febrero (x2) = 12, Junio (x6) = 19, Octubre (x10) = 22
Marzo (x3) = 15, Julio (x7) = 17, Noviembre (x11) = 15
Abril (x4) = 18, Agosto (x8) = 18, Diciembre (x12) = 13
En primer lugar, tenemos doce (12) datos, un nmero PAR.
Ordenando ascendentemente los datos tenemos:
x(1) = 10, x(2) = 12, x(3) = 13, x(4) = 14, x(5) = 15, x(6) = 15,
x(7) = 17, x(8) = 18, x(9) = 18, x(10) = 18, x(11) = 19, x(12) = 22.
Una vez ordenados los datos, determinamos el valor de la variable que se encuentra en la posicin central
de los datos, es decir:

x 12 x 12

2
1
2
x 6 x 61 x 6 x 7 15 17 32
Me 16
2 2 2 2 2
3
De esta manera, tenemos que el 50% de los meses la empresa tuvo un consumo de agua menor a 16 m ,
mientras en el restante 50% de los meses el consumo supero esta cifra.
Como se puede observar, en este caso la mediana no es un dato perteneciente a la informacin recogida,
sin embargo, es un parmetro que divide la informacin dejando el 50% por encima y el 50% por debajo
de ella, esto es:

Mediana para datos agrupados - Variable Discreta


En el caso de variables discretas donde cada categora es el valor de la variable, se puede tomar como un
caso de intervalo de amplitud 1 y en este caso el clculo de la mediana funciona exactamente como lo visto
para datos sin agrupar; sin embargo, existe un par de reglas prcticas basadas en las frecuencias absolutas
que pueden ser de utilidad:
n n
a. Cuando Nj-1 < y Nj > , entonces Me = xj.
2 2
n x j-1 x j
b. Cuando Nj-1 = , entonces Me = .
2 2
A continuacin se presentar un par de ejemplos, casos tpicos, donde se trabaja con datos agrupados para
variables discretas.

Pgina 53 de 177
Ejemplo Caso a:
Consideremos la siguiente distribucin de frecuencias para una variable cualquiera:
Xi ni Ni

0 2 2
1 3 5 Nj-1
2 6 11 Nj
3 5 16
4 4 20

20

Para este caso, tenemos un nmero par de datos, de acuerdo a lo planteado para el caso de datos sin agrupar,
la mediana tomara el valor del promedio de los dos valores centrales, esto es, los valores que se encuentren
en la posicin 10 y 11; por tanto, la mediana para este caso es igual a 2. Comprobemos lo anterior con la
frmula presentada:
n 20 n n
Tenemos que 10 , adems Nj-1 < es decir, 5<10 y Nj > o sea 11>10, por tanto,
2 2 2 2
Me = xj = 2.
Ejemplo Caso b:
Consideremos la anterior distribucin de frecuencias con un leve cambio:
Xi ni Ni

0 2 2
1 3 5
xj-12 5 10 Nj-1
xj3 6 16 Nj
4 4 20

20

n 20 n n
Tenemos que 10 , adems Nj-1= es decir, N3=10= , por tanto
2 2 2 2
x j-1 x j 23 5
Me 2,5
2 2 2
Podemos comprobar el resultado anterior, transformando la distribucin de frecuencias en una variable cuyos
datos no estn agrupados,
i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

xi 0 0 1 1 1 2 2 2 2 2 3 3 3 3 3 3 4 4 4 4

23 5
Me 2,5
2 2

Mediana para datos agrupados - Variable Continua

Pgina 54 de 177
Cuando trabajamos con variables agrupadas por intervalos es imposible determinar con precisin los valores
que toman los datos, ya que esa informacin se ha perdido en privilegio del agrupamiento interval. Por lo tanto,
en este caso, debemos buscar otro mtodo para determinar el valor de la mediana. Consideremos como x Ij al
lmite inferior del j-simo intervalo, de manera anloga como x Sj al lmite superior del j-simo intervalo.

Para la variable continua tambin se tienen dos casos, como se ver a continuacin:

n
a. Cuando Nj-1 = , entonces Me = x Sj-1 .
2
n n
b. Cuando Nj-1 < y Nj > , se puede calcular la mediana empleando las frecuencias absolutas mediante
2 2
la siguiente frmula
n
N j-1
M e LI 2 A ,
nj


donde,

LI: Lmite Inferior del intervalo mediano, es decir, el intervalo donde se encuentra la
n
mediana, el cual se determina observando en que intervalo se encuentra la posicin .
2
n: Nmero de observaciones.
Nj-1: Frecuencia absoluta acumulada anterior al intervalo mediano.
nj: Frecuencia absoluta del intervalo mediano.
A: Amplitud del intervalo.

con base en las frecuencias relativas mediante la siguiente frmula

0,5 Fj -1
Me LI A ,
fj

Donde:

LI: Lmite Inferior del intervalo mediano, es decir, el intervalo donde se encuentra la
n
mediana, el cual se determina observando en que intervalo se encuentra la posicin .
2
n: Nmero de observaciones.
Fj-1: Frecuencia relativa acumulada anterior al intervalo mediano.
fj: Frecuencia relativa del intervalo mediano.
A: Amplitud del intervalo.

Pgina 55 de 177
Ejemplo Caso a
Consideremos la siguiente distribucin de frecuencias:
Xi-1 Xi ni Ni
26 2 2
6 10 3 5
10 14 xSj 5 10 Nj-1
14 18 6 16 Nj
18 22 4 20

20 -

n 20 n n
Tenemos que 10 , adems Nj-1= es decir, N3=10= , por tanto
2 2 2 2
Me = xSj = xS3 = 14.

Ejemplo Caso b
Consideremos la anterior distribucin de frecuencias con un leve cambio:
Xi-1 Xi ni Ni
26 2 2
6 10 3 5 Nj-1
10 14 xSj 6 nj 11 Nj Intervalo
Mediano
14 18 5 16
18 22 4 20

20 -
n 20 n n
Tenemos que 10 , adems Nj-1 = N2 = 5 < =10; y Nj = N3 = 11 > =10, por tanto:
2 2 2 2
n
N j-1
M e LI 2 A
nj


20
5
10 2 (14 10)
6


10 5
10 ( 4)
6
5
10 (4)
6
10 3,33
M e 13,33

Pgina 56 de 177
La Moda

La moda, o valor modal, como su nombre lo indica, es el valor ms comn, es el valor de la variable que ms
se repite; es decir, aquel valor de la variable (que puede no ser un nico valor) que observa con mayor
frecuencia dentro de una distribucin. Un conjunto de datos puede tener una sola moda, en este caso se suele
llamar distribucin unimodal, si tiene dos modas se denomina bimodal, o varias modas y llamarse multimodal.
Sin embargo puede ocurrir que la distribucin no posea moda.

Clculo para datos sin agrupar

En los datos sin agrupar o en los datos agrupados para variables discretas donde cada clase es un valor
diferente de la variable, basta una simple inspeccin ocular.

Ejemplo

Consideremos los siguientes datos: 5, 10, 8, 5, 10, 18, 5, 12, 5, 12.

Para este conjunto de datos, el valor que mas se repite es 5, por tanto este valor representa la moda, esto es:
Mo = 5.

Clculo para datos agrupados

Se debe utilizar de preferencia cuando la amplitud de los intervalos es constante, para ello podemos observar y
comprender su clculo as:

Variable Discreta

Consideremos el ejemplo de los salarios de 50 operarias de cierta fbrica en particular, presentado en la


siguiente tabla:

Pgina 57 de 177
Miles de
Pesos/Da ni
Xi
50 1
51 3
52 5
53 9
54 12
55 10
56 5
57 3
58 2

50

El valor que presenta mayor frecuencia es 54 con una repeticin de 12 personas con el mismo salario, de esta
manera, afirmamos que el salario ms comn dentro de la fbrica es de $54.000 diarios.

Consideremos el ejemplo del fumador, cuyos datos se encuentran resumidos a continuacin:

Cantidad Frecuencia
(Xi) (fi)
18 1
19 2
20 1
21 2
22 1
Total 7

Observamos que los valores de mayor frecuencia corresponden a 19 y 21, por tanto, se trata de una
distribucin bi-modal con Mo1= 19 y Mo2 = 21.

Variable Continua

Existen diversas frmulas para la estimacin del valor modal cuando de una variable continua se refiere; sin
embargo, tomaremos como valor modal la marca de clase del respectivo intervalo modal. Cabe mencionar que
por intervalo modal entenderemos aquel intervalo que presenta la mayor frecuencia observada.

Sin embargo, presentaremos las frmulas que se pueden encontrar en los diversos textos para su debido
conocimiento y aplicacin

Clculo a partir de la frecuencia relativa

Pgina 58 de 177
fm fm -1
Mo LI A
2fm fm - 1 fm 1

Donde,

Mo: Moda

LI: Lmite inferior del intervalo modal

fm: Frecuencia relativa del intervalo modal (clase modal)

fm-1: Frecuencia relativa del intervalo pre-modal (clase pre-modal)

fm+1: Frecuencia relativa del intervalo pos-modal (clase pos-modal)

A: Amplitud del intervalo modal.

La frmula para estimar la moda a partir de la frecuencia absoluta es similar a la presentada anteriormente, tan
solo se trabaja con las frecuencias absolutas:

nm nm -1
Mo LI A
2nm nm - 1 nm 1

Ejemplo

Consideremos el ejemplo de las 100 baldosas; cuyos datos se resumen a continuacin:

2
Kg/m
mi ni
Xi
100 200 150 4
200 300 250 10
300 400 350 21 Clase premodal
400 500 450 33 Clase modal
500 600 550 18 Clase posmodal
600 700 650 9
700 800 750 5

100

Observamos que el cuarto intervalo presenta la mayor cantidad de datos, por tanto, este intervalo se denomina
intervalo o clase modal. De esta manera, tenemos que el valor modal esta dado por:

nm nm -1 33 21
Mo LI A 400 100 444,44
2nm nm - 1 nm 1 2(33) 21 18

Pgina 59 de 177
A pesar de que el valor 444,44 no es un dato real de la informacin, asumimos ese parmetro como el de
mayor ocurrencia.

Relacin: Media - Mediana - Moda

Cuando trabajamos un problema de estadstica, debemos decidir si vamos a utilizar la media, la mediana o la
moda como medidas de tendencia central. Las distribuciones simtricas que slo contienen una moda, siempre
tienen el mismo valor para la media, la mediana y la moda. En tales casos, no es necesario escoger la medida
de tendencia central, pues ya est hecha la seleccin.

Obviamente, si todas las observaciones estuvieran concentradas en un solo valor de la variable, media,
mediana y moda coincidiran en el mismo. Si las observaciones se fueran distribuyendo en forma simtrica, a la
izquierda y a la derecha de ese valor central, media, mediana y modo seguiran coincidiendo.

En una distribucin positivamente sesgada (es decir, sesgada hacia la derecha), la moda todava se encuentra
en el punto ms alto de la distribucin, la mediana est hacia la derecha de la moda y la media se encuentra
todava ms a la derecha de la moda y la mediana; es decir, en una distribucin asimtrica a la derecha, la
media, es mayor que la mediana y que la moda, tal como lo presenta el siguiente grfico

Supongamos ahora que las observaciones de la parte izquierda se alejan del valor central ms que las
observaciones de la parte derecha, generando una distribucin asimtrica hacia la izquierda; en este caso
como la media es la suma de los valores de las observaciones dividido por la cantidad total de observaciones,
su valor se correr a la izquierda tambin y por el mismo motivo, la media ser menor que la mediana y ambas

Pgina 60 de 177
menor que la moda; es decir, en una distribucin negativamente sesgada, la moda sigue siendo el punto ms
alto de la distribucin, la mediana est hacia la izquierda de ella y la media se encuentra todava ms a la
izquierda de la moda y la mediana.

Este corrimiento de la media se explica porque si tomamos un conjunto de datos cualquiera a los cuales
calculamos media, mediana y moda y agregamos un dato extremo y volvemos a calcular la media, la mediana
y la moda, veremos que la media puede variar notablemente, mientras que la mediana y la moda permanecen
idnticas. Esta no variacin de la mediana y la moda reciben el nombre de robustez. Las medidas basadas en
el orden como la mediana- gozan de sta en tanto que las medidas basadas en la suma como la media- se
ven ms afectadas por las observaciones extremas y son, por lo tanto, poco robustas.

Cuando la poblacin est sesgada negativa o positivamente, con frecuencia la mediana resulta ser la mejor
medida de posicin, debido a que siempre est entre la moda y la media. La mediana no se ve altamente
influida por la frecuencia de aparicin de un solo valor como es el caso de la moda, ni se distorsiona con la
presencia de valores extremos como la media.

Relacin Emprica entre Media, Mediana y Moda

Para curvas de frecuencia unimodales que sean poco asimtricas tenemos la siguiente relacin emprica

Media Moda = 3(media- mediana).

CUANTILES: Cuartiles, Deciles y Percentiles

Son medidas de localizacin similares a las anteriores, las cuales las denominamos medidas de tendencia
central, sin embargo, tambin pueden ser llamadas medidas de localizacin ya que, igual determinan
posiciones centrales de la informacin. Se les denomina CUANTILES (Q). Su funcin es informar del valor de
la variable que ocupar la posicin (en tanto por cien) que nos interese respecto de todo el conjunto de
variables.
Podemos decir que los Cuantiles son unas medidas de posicin que dividen a la distribucin en un cierto
nmero de partes de manera que en cada una de ellas hay el mismo de valores de la variable.
Las ms importantes son:

CUARTILES, dividen a la distribucin en cuatro partes iguales (tres divisiones): C 1, C2, C3, correspondientes al
25%, 50%, 75%.

DECILES, dividen a la distribucin en 10 partes iguales (9 divisiones): D 1,..., D9, correspondientes a


10%,...,90%.

Pgina 61 de 177
PERCENTILES, cuando dividen a la distribucin en 100 partes (99 divisiones): P 1,..., P99, correspondientes a
1%,...,99%.
Existe un valor en cual coinciden los cuartiles, los deciles y percentiles esto es cuando son iguales a la
Mediana y as veremos
2 5 50

4 10 100
Para su clculo distinguiremos entre distribuciones agrupadas y enlistadas:

En las distribuciones sin agrupar, primero hallaremos el lugar que ocupa:


Entonces tendremos que:

Ni-1 < (%).n < Ni Q = xi


x i x i 1
En el supuesto que (%).n = Ni Q
2
Primero encontraremos el intervalo donde estar el cuantil:
% N N i 1
Lugar Ni-1 < (%) n< Ni Intervalo [Li-1, Li) , en este caso: Q L i 1 ai
ni
Ejemplo: DISTRIBUCIONES AGRUPADAS:
En la siguiente distribucin
xi fi Fi
5 3 3
10 7 10
15 5 15
20 3 18
25 2 20
n = 20

Calcular la mediana (Me); el primer y tercer cuartil (C1, C3); el 4 decil (D4) y el 90 percentil (P90).

Mediana (Me)
Lugar que ocupa la mediana lugar 20/2 = 10.
Como es igual a un valor de la frecuencia absoluta acumulada, realizaremos el clculo:
x i x i 1 10 15
Me 12,5
2 2
Primer cuartil (C1)
Lugar que ocupa en la distribucin (). 20 = 20/4 = 5
Como Ni-1 < (25%).n < Ni, es decir 3 < 5 < 10 esto implicara que C1 = xi = 10

Tercer cuartil (C3)


Lugar que ocupa en la distribucin (3/4).20 = 60/4 = 15, que coincide con un valor de la frecuencia absoluta
acumulada, por tanto realizaremos el clculo:

x i x i 1 15 20
C3 17,5
2 2
Cuarto decil (D4)
Lugar que ocupa en la distribucin (4/10).20 = 80/10 = 8.
Como Ni-1 < (%).n < Ni ya que 3 < 8 < 10 por tanto D4 =10.

Pgina 62 de 177
Nonagsimo percentil (P90)
Lugar que ocupa en la distribucin (90/100).20 = 1800/100 = 18, que coincide con un valor de la frecuencia
absoluta acumulada, por tanto realizaremos el clculo:
x i x i 1 20 25
P90 22,5
2 2
Ejemplo:
DISTRIBUCIONES AGRUPADAS: Hallar el primer cuartil, el cuarto decil y el 90 percentil de la siguiente
distribucin:

[Li-1 , Li) fi Fi
[ 0 , 100) 90 90
[100 , 200) 140 230
[[200 , 300) 150 380
[300 , 800) 120 500
n = 500

Primer cuartil (C4)


Lugar ocupa el intervalo del primer cuartil: (1/4). 500 = 500/4 = 125.
Por tanto C4 estar situado en el intervalo [100 200).
125 90
Aplicando la expresin directamente, tendremos: C 4 100 100 125
140

Cuarto decil (D4)


Lugar que ocupa: (4/10).500 = 200.
Por tanto D4 estar situado en el intervalo [100 200).
Aplicando la expresin tendremos:

200 90
D 4 100 100 178,57
140
Nonagsimo percentil (P 90)
Lugar que ocupa: (90/100).500 = 450.
Por tanto P90 estar situado en el intervalo [300 800).
Aplicando la expresin tendremos:

450 380 70
P90 300 500 300 500 591,67
120 120

Leccin 8: Medidas de dispersin: Rango, Varianza, Desviacin


tpica, coeficiente de variacin, puntaje estandarizado.
Como se mencion anteriormente, las medidas de tendencia central tienen como objetivo sintetizar los datos
en un valor representativo; como complemento, las medidas de dispersin nos dicen hasta que punto estas
medidas de tendencia central son representativas como sntesis de la informacin; de esta manera, las
medidas de dispersin cuantifican la separacin, la dispersin, la variabilidad de los valores de la distribucin
respecto al valor central como la media aritmtica. Cuanto menor es la dispersin, tanto mayor ser la precisin

Pgina 63 de 177
del sistema de medicin. Si los estadgrafos de posicin se relacionan con el concepto de exactitud, los de
dispersin se relacionan con la precisin de las tcnicas.

La dispersin es importante porque:

Proporciona informacin adicional que permite juzgar la confiabilidad de la medida de tendencia central. Si
los datos se encuentran ampliamente dispersos, la posicin central es menos representativa de los datos.

Ya que existen problemas caractersticos para datos ampliamente dispersos, debemos ser capaces de
identificarlos antes de abordar esos problemas.

Quiz se desee comparar las dispersiones de diferentes muestras. Si no se desea tener una amplia
dispersin de valores con respecto al centro de distribucin o esto presenta riesgos inaceptables,
necesitamos tener habilidad de reconocerlo y evitar escoger distribuciones que tengan las dispersiones
ms grandes.

Ya que la dispersin ocurre frecuentemente y su grado de variabilidad es importante, cmo medimos la


variabilidad de una distribucin emprica? Vamos a considerar slo algunas medidas de dispersin: el rango, el
rango inter-cuartlico, la varianza, la desviacin estndar y el coeficiente de variacin.

EL RANGO O RECORRIDO ( R ):
Es la medida de variabilidad ms fcil de calcular. Para datos finitos o sin agrupar, el rango se define como la
diferencia entre el mximo valor (X n XMax) y el mnimo (X1 XMin) en un conjunto de datos, de manera ms
formal:

R = XMx XMn = Xn - X1
Ejemplo:
Se tienen las edades de cinco estudiantes universitarios de 1er ao, a saber: 18,23, 27,34 y 25., para calcular
el rango o recorrido de la variable, se tiene que:

R = Xn X1 = 34 18 = 16 aos

Rango para datos agrupados


Con datos agrupados no se saben los valores mximos y mnimos. Si no hay intervalos de clases abiertos
podemos aproximar el rango mediante el uso de los lmites de clases. Se aproxima el rango tomando el lmite
superior de la ltima clase menos el lmite inferior de la primera clase, de manera ms formal:

R= (lim. Sup. de la clase n lim. Inf. de la clase 1)

Pgina 64 de 177
Ejemplo:
Dada la siguiente distribucin de frecuencia determinar el rango o recorrido:

P.M.
Clases ni fi Ni Fi
mi

7,420 21,835 14,628 10 0,33 10 0,33

21,835 36,250 29,043 4 0,13 14 0,46

36,250 50,665 43,458 5 0,17 19 0,63

50,665 65,080 57,873 3 0,10 22 0,73

65,080 79,495 72,288 3 0,10 25 0,83

79,495 93,910 86,703 5 0,17 30 1,00

Total 30 1,00

El rango de la distribucin de frecuencias se calcula as:

R = (lim. Sup. de la clase n lim. Inf. De la clase 1)

= (93.910 7.420) = 86.49

Propiedades del Rango o Recorrido:

El recorrido es la medida de dispersin ms sencilla de calcular e interpretar puesto que simplemente es la


distancia entre los valores extremos (mximo y mnimo) en una distribucin.
Puesto que el recorrido se basa en los valores extremos, ste tiende a ser errtico. No es extrao que en
una distribucin de datos econmicos o comerciales incluya a unos pocos valores en extremo pequeos o
grandes. Cuando tal cosa sucede, entonces el recorrido solamente mide la dispersin con respecto a esos
valores anormales, ignorando a los dems valores de la variable.
La principal desventaja del recorrido es que slo esta influenciado por los valores extremos, puesto que no
cuenta con los dems valores de la variable. Por tal razn, siempre existe el peligro de que el recorrido
ofrezca una descripcin distorsionada de la dispersin.
En el control de la calidad se hace un uso extenso del recorrido cuando la distribucin a utilizarse no la
distorsionan y cuando el ahorro del tiempo al hacer los clculos es un factor de importancia.

RANGO INTERCUARTLICO:
Teniendo en cuenta la principal desventaja del rango (toma en cuenta solo los valores extremos), surge el
rango intercuartlico, denotado por RI, su clculo se limita a la diferencia entre el tercer y el primer cuartil, es
decir

Pgina 65 de 177
Esto nos dice en cuntas unidades de los valores que toma la variable se concentra el cincuenta por ciento
central de los casos.

VARIANZA
2
Se representa por S . Se define como el promedio de las desviaciones de los datos entre si. La suma de los
cuadrados de los desvos de la totalidad de las observaciones, respecto de la media aritmtica de la
distribucin, es menor que la suma de los cuadrados de los desvos respecto de cualquier otro valor que no sea
la media aritmtica.

Si observamos, veremos que la varianza no es ms que el desvo estndar al cuadrado. Precisamente la


2
manera de simbolizarla es S .

( )

Propiedades de la varianza:

Es siempre un valor no negativo, que puede ser igual o distinta de 0. Ser 0 solamente cuando X i= X
La varianza es la medida de dispersin cuadrtica optima por ser la menor de todas.
Si a todos los valores de la variable se le suma una constante la varianza no se modifica. Vemoslo:

Si a Xi le sumamos una constante Xi = Xi + K. tendremos (sabiendo que )

Si todos los valores de la variable se multiplican por una constante la varianza queda multiplicada por el
cuadrado de dicha constante. Vemoslo:

Si a xi = xi k tendremos (sabiendo que )

Si en una distribucin obtenemos una serie de subconjuntos disjuntos, la varianza de la distribucin inicial se
relaciona con la varianza de cada uno de los subconjuntos mediante la expresin

Siendo
Ni el n de elementos del subconjunto (i)

Pgina 66 de 177
S i2 la varianza del subconjunto (i)

LA DESVIACIN ESTNDAR
Tambin recibe el nombre de desviacin tipo o desvo tpico. Es posible identificar conjuntos de datos que a
pesar de ser muy distintos en trminos de valores absolutos, poseen la misma media. Una medida diferencial
para identificar esos conjuntos de datos es la concentracin o dispersin alrededor de la media.

Desviacin estndar para datos sin agrupar


Una manera que aparece como muy natural para construir una medida de dispersin sera promediar las
desviaciones de la media, pero como vimos

Una manera de evitar que los distintos signos se compensen es elevarlas al cuadrado, de manera que
todas las desviaciones sean positivas. La raz cuadrada del promedio de estas cantidades recibe el
nombre de desviacin estndar, o desviacin tpica y es representada por la siguiente frmula:

( )

La desviacin estndar slo puede utilizarse en el caso de que las observaciones se hayan medido con
escalas de intervalos o razones.

A mayor valor de la desviacin estndar, mayor dispersin de los datos con respecto a su media. Es un
valor que representa los promedios de todas las diferencias individuales de las observaciones respecto
a un punto de referencia comn, que es la media aritmtica. Se entiende entonces que cuando este
valor es ms pequeo, las diferencias de los valores respecto a la media, es decir, los desvos, son
menores y, por lo tanto, el grupo de observaciones es ms homogneo que si el valor de la
desviacin estndar fuera ms grande. O sea que a menor dispersin mayor homogeneidad y a mayor
dispersin, menor homogeneidad.

Desviacin estndar para datos agrupados

1. Clculo usando las frecuencias absolutas

2. Clculo usando las frecuencias relativas

Pgina 67 de 177
Propiedades de la Desviacin Estndar

La desviacin estndar es siempre un valor no negativo.


Es la medida de dispersin ptima por ser la ms pequea.
La desviacin estndar toma en cuenta las desviaciones de todos los valores de la variable.
Si a todos los valores de la variable se le suma una misma constante la desviacin estndar no vara.
Si a todos los valores de la variable se multiplican por una misma constante, la desviacin estndar
queda multiplicada por el valor absoluto de dicha constante.

EL COEFICIENTE DE VARIACIN:
Para comparar la dispersin de variables que aparecen en unidades diferentes (metros, kilos, etc.) o que
corresponden a poblaciones extremadamente desiguales, es necesario disponer de una medida de variabilidad
que no dependa de las unidades o del tamao de los datos. Este coeficiente nicamente sirve para comparar
las dispersiones de variables correspondientes a escalas de razn.

Una manera de construir una medida de variabilidad que cumpla los requisitos anteriores es el llamado
coeficiente de variacin:

(Las barras del denominador representan el valor absoluto, es decir, indican que debe prescindirse de la unidad
de medida de la media). A menor coeficiente de variacin consideraremos que la distribucin de la variable
medida es ms homognea.

PUNTAJE ESTANDARIZADO:
Cuando se tiene una distribucin simtrica, su polgono de frecuencias revelar una forma de campana muy
comn en estadstica. Esta curva es llamada curva normal, de error, de probabilidad o campana de Gauss.
En ella la media aritmtica se localiza en la mitad de la distribucin. En el eje horizontal se ubican los valores
que toma la variable y en el vertical la frecuencia absoluta o relativa. El rea bajo la curva tendr un valor del
100%

Figura: Curva normal o campana de Gauss

Pgina 68 de 177
El puntaje tpico o estandarizado o variable normalizada, es una medida de dispersin muy utilizada como
variable estadstica en este tipo de distribucin, denominada distribucin normal. El puntaje estandarizado
mide la desviacin de una observacin con respecto a la media aritmtica, en unidades de desviacin estndar,
determinndose as la posicin relativa de una observacin dentro del conjunto de datos. Por lo general se
X x
simboliza por Z. Z
s
Por ser adimensional, el puntaje Z es til para comparar datos individuales de distribuciones que tienen
distintas unidades de medida, as como diferentes medias y desviaciones estndar.

Propiedades:
1. z 0
2. z 1
2

EJEMPLO
10.110.1
Al terminar el segundo semestre de lao 2010, un grupo de 150 estudiantes de primer semestre de Ingeniera
de un CEAD, obtuvieron los siguientes resultados en el puntaje final de los cursos Lgica Matemtica y
Estadstica Descriptiva:

Lgica Matemtica: puntuacin media de 3.9 y varianza 3.2.


Estadstica Descriptiva: puntuacin media de 3.7 y desviacin estndar 1.7.

a. En cul curso hubo mayor dispersin absoluta? En cul hubo mayor dispersin relativa?
b. Si un estudiante obtuvo como nota final en Lgica Matemtica 3.8 y en Estadstica Descriptiva 3.5. En
cul curso fue su puntuacin relativa superior?

Solucin:

a. Para determinar la dispersin absoluta:


Lgica Matemtica: s 3.2 s 3.2 1.79
2

Estadstica Descriptiva: s 1,7

Se tiene entonces que en Lgica Matemtica hubo una mayor dispersin absoluta que en Estadstica
Descriptiva.

Pgina 69 de 177
Para la dispersin Relativa:
1.79
Lgica Matemtica: CV 100 45.9%
3.9
1.7
Estadstica Descriptiva: CV 100 46%
3.7
En Estadstica Descriptiva hubo una mayor dispersin relativa 46% > 45.9%

b. Para el clculo de la puntuacin relativa, se hace uso del puntaje estandarizado. Es decir, se requiere
estandarizar las calificaciones convirtindolas en puntuaciones Z.
x x 3.8 3.9
Lgica Matemtica: Z 0.06
s 1.79
x x 3.5 3.7
Estadstica descriptiva: Z 0.12
s 1.7
Estos valores de puntuacin Z negativos indican que ambas calificaciones se encuentran por debajo de la
media. Este es un principio del puntaje estandarizado: Siempre que un valor sea menor que la media, su
puntuacin Z correspondiente ser negativa.

Estos resultados afirman entonces que el estudiante con calificaciones de 3.8 en Lgica Matemtica y 3.5 en
Estadstica Descriptiva, est por debajo del promedio del grupo en ambos cursos.

Dado que -0.06 se encuentra ms cera a 0 (la media de la variable estandarizada), se dice que la puntuacin
relativa del estudiante fue superior en Lgica Matemtica.

Leccin 9: Medidas de forma: Asimetra y Curtosis.


Despus de conocer cmo vara un grupo de datos respecto a su media e identificar otras medidas de
variacin, a continuacin se estudiar algunos aspectos sobre la forma de las curvas que presentan los datos.

Asimetra: La primera caracterstica que se estudia es el coeficiente de asimetra, el cual mide el grado de
simetra en la distribucin de los datos, ya que conocer la distribucin de los datos, permite tomar ciertos
caminos para el anlisis de los mismos.

Si un conjunto de datos tiene distribucin simtrica es porque se cumple: x Me Mo


En las distribuciones asimtricas la media se corre en el sentido del alargamiento o sesgo por efecto de las
frecuencias y de los valores extremos de la variable; la mediana tambin se corre pero menos que la media ya
que en ella slo influyen las frecuencias; en tanto que la moda no es influenciada ni por las frecuencias ni por
los valores extremos. Una distribucin es asimtrica positiva cuando presenta un alargamiento o sesgo a la
derecha: Mo Me x Una distribucin ser asimtrica negativa cuando presenta un alargamiento o
sesgo a la izquierda: x Me Mo

Las asimetras positivas son las ms frecuentes que las sesgadas hacia la izquierda, porque con frecuencia es
ms fcil obtener valores excepcionalmente grandes que valores excepcionalmente pequeos. Ejemplo de ello
es la distribucin de valores en los consumos de servicios pblicos, las calificaciones en pruebas, los sueldos,
etc.

Se reconocen, entre otras, las siguientes medidas para calcular el grado de la asimetra:

Pgina 70 de 177
Coeficiente de Pearson. Asimetra en funcin de la media y la moda. Vara entre 3 y es 0 en la
distribucin normal.
x Mo 3 ( x Me)
As As
s s
Media cuartil de asimetra o media de Bowley. Vara entre 1 y es 0 en la distribucin normal.
Q1 Q3 2Q2
As
Q3 Q1

Si As 0 la distribucin es simtrica.
Si As 0 la distribucin es asimtrica positiva.
Si As 0 la distribucin es asimtrica negativa.

Apuntamiento O Curtosis: Las curvas de distribucin, comparadas con la curva de distribucin normal,
pueden presentar diferentes grados de apuntamiento o altura de la cima de la curva. Esta agudeza en la cima
se observa en la moda. Si la curva es ms plana que la normal se dice que la curva es platicrtica; si es ms
aguda que la normal, recibe el nombre de apuntada o leptocrtica. Si la distribucin es normal, la curva se
conoce tambin como mesocrtica.
Z fi
4

Ap
i
La curtosis es la medida de la altura de la curva y est dada por:
ns 4

Si Ap 3 la distribucin es normal o mesocrtica.


Si Ap 3 la distribucin es apuntada o leptocrtica.
Si Ap 3la distribucin es achatada o platicrtica.
Otra medida de curtosis que se emplea est basada en el rango semiintercuartlico y los percentiles 10 y 9:
QD 2 Q3 Q1
Ap
P90 P10 2( P90 P10 )

En el siguiente ejemplo se puede comprender de una manera prctica, la forma de calcular ste tipo de
medidas.

Pgina 71 de 177
EJEMPLO
El coordinador acadmico del programa de Administracin de Empresas, 10.110.1
desea conocer el rendimiento
acadmico de los estudiantes de primer semestre en el 2010, en los cursos de Lgica Matemtica,
Competencias Comunicativas, Cultura Poltica, Estadstica Descriptiva y Herramientas Informticas. Para esto
selecciona una muestra de 55 estudiantes de los distintos programas que se ofrecen en el CEAD. La siguiente
tabla, arroja los resultados de la investigacin realizada por el funcionario.

Tabla: Distribucin de frecuencias de las calificaciones de primer semestre

Lgica Competencias Cultura Estadstica Herramientas


Calificacin
Matemtica Comunicativas Poltica Descriptiva Informticas
0,0 1 3 2 1 1
0,5 4 3 2 1 2
1,0 7 5 3 2 3
1,5 9 6 4 4 7
2,0 9 7 6 11 9
2,5 8 7 8 14 11
3,0 6 7 9 12 9
3,5 4 6 9 6 7
4,0 3 5 7 3 3
4,5 2 3 4 1 2
5,0 2 3 1 0 1
Total 55 55 55 55 55

En la tabla siguiente se reporta un resumen de las medidas estadsticas por cada uno de los cursos.

Lgica Competencias Cultura Estadstica Herramientas


Medida
Matemtica Comunicativas Poltica Descriptiva Informticas
x 2.25 2.5 2.75 2.53 2.5
Me 2.0 2.5 3.0 2.5 2.5
Mo 1.5 y 2.0 2.0, 2.5 y 3.0 3.0 y 3.5 2.5 2.5
s2 1.45 1.84 1.45 0.76 1.12
s 1.20 1.36 1.20 0.87 1.06
Q1 1.5 1.5 2.0 2.0 2.0
Q2 2.0 2.5 3.0 2.5 2.5
Q3 3.0 3.5 3.5 3.0 3.4

a-) Asimetra:

Para Lgica Matemtica: Se observa que Mo Me x , lo que indica que la distribucin tiene asimtrica
positiva. Para confirmarlo se hace uso del coeficiente de Pearson y la media de Bowley: En este caso se
trabajar con la media de Bowley, pues la distribucin tiene dos modas y no permite un resultado seguro con el
coeficiente de Pearson.

Pgina 72 de 177
Q1 Q3 2Q2 1.5 3 2(2)
As 0.33 0
Q3 Q1 3 1.5

El polgono de frecuencias de las calificaciones de Lgica Matemtica confirma los resultados.

Figura: Curva asimtrica positiva Polgono de frecuencias de calificaciones de Lgica Matemtica

10
9
8
7
Frecuencia

6
5
4
3
2
1

0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0
Calificacin

La curva lleva a concluir que la mayora de los estudiantes estn por debajo de la media en el curso de Lgica
Matemtica y son pocos los estudiantes que la superan.

Para Competencias Comunicativas: Se observa que Mo Me x , lo que indica que la distribucin es


simtrica. Para confirmarlo se hace uso del coeficiente de Bowley, pues la distribucin tiene tres modas y no
permite un resultado seguro con el coeficiente de Pearson.
Q1 Q3 2Q2 1.5 3.5 2(2.5)
As 0
Q3 Q1 3.5 1.5
El polgono de frecuencias de las calificaciones de Competencias Comunicativas confirma los resultados.

Figura: Curva simtrica platicrtica


Polgono de frecuencias de calificaciones de Competencias Comunicativas
con el coeficiente de Pearson.
10
9
8
7
Frecuencia

6
5
4
3
2
1

0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0
Calificacin
Para determinar el grado de apuntamiento o curtosis, se debe determinar el puntaje tpico o estandarizado de
cada clase y luego aplicar la frmula que lo calcula. En la siguiente tabla se indican estos valores.

Pgina 73 de 177
Tabla: Clculo de Z para la distribucin de frecuencias de las calificaciones de Competencias Comunicativas

4
Calificacin f Z Zi f i
0,0 3 -1,838235294 34,2551328
0,5 3 -1,470588235 14,0309024
1,0 5 -1,102941176 7,39910869
1,5 6 -0,735294118 1,7538628
2,0 7 -0,367647059 0,12788583
2,5 7 0 0
3,0 7 0,367647059 0,12788583
3,5 6 0,735294118 1,7538628
4,0 5 1,102941176 7,39910869
4,5 3 1,470588235 14,0309024
5,0 3 1,838235294 34,2551328
Total 55 0 115,133785

Ap
Z i
4
fi
Ap
115.13
0.62 3
ns 4
55 1.36 4
Por lo tanto, la curva es simtrica platicrtica o achatada.

Estos resultados indican que la mayora de los estudiantes en Competencias Comunicativas estn en el rango
de la media del curso, adems sus notas son muy homogneas alrededor de la media.

Para Cultura Poltica: Se observa que Mo Me x , lo que indica que la distribucin es asimtrica negativa.
Para confirmarlo se hace uso de la media de Bowley, pues la distribucin tiene dos modas y no permite un
resultado seguro con el coeficiente de Pearson.
Q1 Q3 2Q2 2.0 3.5 2(3.0)
As 0.33 0
Q3 Q1 3.5 2.0

El polgono de frecuencias de las calificaciones de Cultura Poltica confirma los resultados.

Figura: Curva asimtrica negativa


Polgono de frecuencias de calificaciones de Cultura Poltica
10
9

8
7
Frecuencia

5
4
3

2
1

0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0
Esto quiere decir que las calificaciones de la mayora de los estudiantes del curso Cultura Poltica estn por
Calificacin

encima de la media.

Pgina 74 de 177
Para Estadstica Descriptiva: Se observa que Mo Me x , lo que indica que la distribucin es simtrica.
Para confirmarlo se hace uso del coeficiente de Pearson y la media de Bowley:
x Mo 2.53 2.5 Q1 Q3 2Q2 2.0 3.0 2(2.5)
As 0.03 0 y As 0
s 0.87 Q3 Q1 3.0 2.0
Para determinar el grado de apuntamiento o curtosis, se debe determinar el puntaje tpico o estandarizado de
cada clase y luego aplicar la frmula que lo calcula. En la tabla siguiente tabla se indican estos valores.

Tabla: Clculo de Z para la distribucin de frecuencia de las calificaciones de Estadstica Descriptiva

4
Calificacin f Z Zi f i
0,0 1 -2,908045977 71,516306
0,5 1 -2,333333333 29,6419753
1,0 2 -1,75862069 19,1301647
1,5 4 -1,183908046 7,85835926
2,0 11 -0,609195402 1,51502275
2,5 14 -0,034482759 1,9794E-05
3,0 12 0,540229885 1,02210536
3,5 6 1,114942529 9,27173856
4,0 3 1,689655172 24,4519547
4,5 1 2,264367816 26,289837
5,0 0 -1,352941176 0
Total 55 -4,571331981 190,697484

Ap
Z i
4
fi
Ap
190.70
6.05 3
ns 4
55 0.87 4
Por lo tanto, la curva es simtrica leptocrtica o apuntada.

Lo anterior indica que las calificaciones de Estadstica Descriptiva de la muestra de 55 estudiantes estn muy
cerca de la media y que existe adems, un pico en 2.5, sealando una alta frecuencia en esta calificacin.

Figura: Curva simtrica leptocrtica


Polgono de frecuencias de calificaciones de Estadstica Descriptiva
15
14
13
12
11
10
9
Frecuencia

8
7
6
5
4
3
2
1
0
0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0
Calificacin

Para Herramientas Informticas: Se observa que Mo Me x , lo que indica que la distribucin es


simtrica. Para confirmarlo se hace uso del coeficiente de Pearson:

Pgina 75 de 177
x Mo 2.5 2.5
As 0
s 1.06
El polgono de frecuencias de las calificaciones de Herramientas Informticas confirma los resultados. La curva
es simtrica mesocrtica o normal.

MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSION EN EXCEL


El proceso a seguir, cuando los datos estn SIN AGRUPAR, es decir, tal como se recolectaron, si trabajamos
con la variable nmero de hermanos, para la aplicacin de las diferentes medidas, sern las siguientes:

Consideremos los datos del CUADRO No. 1, que contiene informacin de 10 variables correspondiente a
50 estudiantes seleccionados como muestra, de una poblacin de 1.080 estudiantes, que a continuacin se
reedita:

Cuadro No. 1.
No. Promedio
No. No. Actualmente Calificaciones Edad Estatura Peso
Facultad Sexo libros calificacin
orden hermanos trabaja ICFES (aos) (Cm) (Kg)
ledos matemticas
2 2 2 2 2 4,1 1 360 20 158 48
9 3 2 0 6 3,4 2 320 20 170 70
12 3 1 6 3 3,6 2 330 18 174 78
35 2 2 0 7 3,6 1 280 22 155 60
41 3 1 3 5 4,1 2 320 16 170 72
63 3 2 4 2 3,1 2 320 24 172 69
74 2 2 2 4 3,6 2 325 20 169 66
113 1 1 1 3 3,4 2 280 23 178 82
147 3 1 1 8 5,0 1 310 17 174 83
175 1 2 3 2 2,6 1 270 15 165 60
199 2 2 0 2 3,9 2 290 26 171 66
214 1 1 1 7 3,5 2 310 22 172 80
234 1 1 1 2 3,6 2 320 20 168 70
268 3 1 3 12 3,9 1 310 21 166 64
327 3 1 1 8 5,0 1 310 17 174 83
331 1 2 0 6 3,4 2 380 20 165 58
364 1 2 3 2 3,3 2 280 16 166 58
400 3 2 0 6 3,6 2 280 17 148 46
405 1 2 2 11 4,6 2 400 24 165 60
470 1 2 3 2 3,0 1 300 20 164 70
507 3 1 1 8 5,0 1 310 17 174 83
512 1 2 0 3 2,8 1 310 20 171 59
545 2 1 6 10 3,9 2 310 17 171 64
557 2 1 6 2 3,1 1 270 21 168 60
587 3 1 1 4 3,3 2 300 32 160 65
589 3 2 2 3 2,6 1 270 17 165 59
590 1 1 0 2 2,7 1 280 19 168 71
616 3 2 0 3 3,8 2 265 19 156 54
621 3 1 0 3 3,0 2 290 17 171 82
653 1 1 1 3 3,4 2 280 23 178 82

Pgina 76 de 177
665 2 1 1 2 3,2 2 360 21 158 72
669 3 2 1 1 4,0 1 315 16 165 61
721 2 1 3 4 2,6 1 410 18 140 46
747 2 2 2 2 4,0 1 330 18 158 60
748 1 2 3 2 3,3 2 310 17 159 58
761 3 1 3 5 4,1 2 320 16 170 72
771 3 1 1 1 2,8 1 290 24 171 79
825 2 2 8 2 3,7 1 320 22 167 54
873 1 2 3 5 4,2 2 350 22 169 64
876 3 2 6 2 4,0 2 380 20 165 58
923 1 1 1 3 4,2 1 390 22 174 80
933 1 2 3 10 2,8 2 260 20 165 58
936 2 2 3 10 2,8 2 260 28 158 55
943 3 2 2 6 3,8 2 280 20 168 64
976 3 2 0 3 3,8 2 265 19 156 54
982 3 1 0 6 3,0 2 410 18 174 86
1001 3 1 3 5 3,1 2 280 17 169 76
1017 2 1 5 2 3,8 2 290 15 162 70
1025 2 1 1 2 3,2 2 360 21 158 72
1037 3 2 0 2 3,3 2 325 19 164 60

Ubiqumonos en la barra de MENU, con el MOUSE haciendo CLIC en HERRAMIENTAS debiendo


aparecer la siguiente figura:

Pgina 77 de 177
Figura No. 1. Microsoft Excel

Al hacer CLIC en el submen ANLISIS DE DATOS , debe aparecer la siguiente figura (Fig. 2):

Figura No. 2. Funciones para anlisis

Con la figura No. 2, correspondiente a ANLISIS DE DATOS, procederemos a seleccionar una de las
funciones, en nuestro caso la opcin identificada como ESTADSTICA DESCRIPTIVA, luego al hacer CLIC en
sta y ACEPTAR debe aparecer la figura siguiente (Fig. 3):

Pgina 78 de 177
Figura No. 3. Estadstica Descriptiva

Teniendo en cuenta la Figura No. 3 ESTADSTICA DESCRIPTIVA, se comienza el procesamiento de los


datos. Recordemos que el RANGO DE ENTRADA es el correspondiente a la variable nmero de hermanos
registrados en el Cuadro No. 1.

En la misma figura anterior, aparecen unas opciones de salida, con alternativa de ser una HOJA NUEVA o
en un LIBRO NUEVO.

Adems, aparecen: RESUMEN DE ESTADSTICAS; NIVEL DE CONFIANZA PARA LA MEDIA: 95% o


cualquier otro valor establecido; K-ESIMO MAYOR y, finalmente, K-ESIMO MENOR, activando o haciendo
CLIC en cada uno de ellos, En caso de considerar la obtencin de un mayor nmero de resultados para el
anlisis.

Al hacer CLIC en ACEPTAR, se obtiene la informacin, tal como puede observarse en la figura No. 4.

Medidas
Resultados
Media 2,04
Error tpico 0,27547362
Mediana 1,5
Moda 1
Desviacin estndar 1,94789263
Varianza de la muestra 3,79428571
Curtosis 0,92539916
Coeficiente de asimetra 1,11511128
Rango 8
Mnimo 0
Mximo 8
Suma 102
Cuenta 50
Mayor (1) 8
Menor(1) 0
Nivel de confianza (95.0%) 0,55358463

Figura No. 4. Resultados

Para lograr los anteriores resultados en todas y cada una de las opciones (Resumen de estadsticas; nivel
de confianza para la media, K-simo mayor y K-simo menor), deben sealarse.

Los resultados de la figura No. 4, nos muestra un cuadro resumen con los valores de la Media, Error Tpico;
Mediana; Asimetra; Mnimo; Mximo; Suma; Conteo para la variable NUMERO DE HERMANOS.

Pgina 79 de 177
CAPTULO 3. ANLISIS DE REGRESIN
Leccin 10: Regresin lineal Simple
La palabra Regresin fue utilizada por primera vez por Francis Galton, (1.822 1.911) en sus estudios de
Biologa sobre la herencia, done l noto que las caractersticas promedio de la siguiente generacin de un
grupo particular, tenda a moverse en la direccin de las caractersticas promedio de la poblacin, ms que a la
generacin previa de dicho grupo.

La regresin es considerada una asociacin cuantitativa entre las variables que participan en el fenmeno.
Existen diversas clases de regresin, las cuales son visibles por medio de un modelo matemtico, el cual
relaciona las variables.

Segn el modelo matemtico se conocen diversas clases de regresin:

- Regresin lineal: y x
- Regresin cuadrtica: y 1 x 2 x 2
- Regresin logartmica: y Ln(x)

As existen otros tipos de regresin, que describen fenmenos particulares.

Las variables que se estudian en una regresin son:

Variable de Respuesta: Es la variable Y, la cual se observa bajo condiciones experimentales, pero no se


puede controlar, lo que se mide por medio del llamado Error aleatorio. En todo modelo, se asume que la
variable de respuesta Y tiene distribucin normal, con media E (Y X ) x y con varianza 2. Adems,
los valores observados y1, y2, y3,,yn. no estn correlacionados estadsticamente: Cov(yi, xi) = 0 para i j.

Variables Predictoras: Son las variables x1, x2, x3,,xn; cuyos valores se asumen de antemano, por lo cual no
son variables aleatorias, ya que pueden ser controlables en el fenmeno o experimento.

Diagrama de Dispersin.

Una distribucin bidimensional o bivariante puede representarse grficamente en un plano cartesiano, ubicando
en el eje horizontal o abscisa los valores de la primera variable denominada X y en el eje vertical u ordenada,
los valores de la segunda variable, Y. De manera pues que se grafican tantas parejas ordenadas como
observaciones hayan de las variables.

A este conjunto de puntos o nube de puntos se le denomina diagrama de dispersin, dado que los puntos se
ubican de forma dispersa en el plano cartesiano. En muchos casos el slo diagrama de dispersin indica una
tendencia de agrupacin de los puntos, que puede ser lineal (hacia arriba o hacia abajo), exponencial,
curvilnea o poligonal.

Parte del anlisis estadstico que hace el investigador es determinar cul es la mejor lnea o curva que
representa a ese conjunto de datos. El mejor ajuste se hace cuando se elabora bien la grfica, se conoce la
distribucin y se va adquiriendo experiencia en su clculo y determinacin.

Pgina 80 de 177
Figura: Grficas de dispersin
(a) lineal; (b) curvilnea; (c) sin relacin

Y Y
Y

(a) (b) (c)


X X X

Regresin Lineal Simple.

La regresin examina la relacin entre dos variables restringiendo una de ellas respecto a la otra, con el objeto
de estudiar las variaciones de la primera cuando la otra permanece constante. La regresin es un mtodo que
se emplea para pronosticar o predecir el valor de una variable en funcin de los valores dados de la otra o de
las otras variables.

La regresin lineal simple, se caracteriza porque se tiene la variable de respuesta y Una sola variable
explicativa o independiente. Los datos se pueden representar por medio de parejas ordenadas (xi, yi) para i = 1,
2, 3, , n.

En la regresin lineal simple, la media ( y xi ) se relaciona linealmente con los valores x i, por medio de la

llamada ecuacin de regresin: ( y xi ) i xi . Donde y son los parmetros del modelo, que se
relacionan linealmente, son desconocidos y corresponden a los coeficientes de correlacin.

El modelo de regresin lineal simple se expresa como se presenta a continuacin:


yi xi i

Donde i es llamado Error Aleatorio o Error del Modelo, el cual tiene como caractersticas:
Media: 0 y Varianza: 2 la cual no es medible.
Los parmetros se estiman por medio de datos muestrales, obteniendo una ecuacin de regresin ajustada.
As cada par de observaciones satisface: yi a bxi ei
Donde
a = Estimador de .
b = Estimador de

ei = Los residuales. Se miden as: ei yi yi

Pgina 81 de 177
Grafica: Regresin el Modelo Lineal

Cuando se considera, despus de una inspeccin en la grfica de dispersin, que una lnea recta es la mejor
curva que se ajusta al conjunto de puntos se procede entonces a emplear el mtodo de la regresin lineal
simple. La mejor lnea es aquella que hace mnima la suma de los cuadrados de las diferencias entre los
puntos dados y los obtenidos mediante la lnea ajustada o estimada. Es por eso que a este mtodo tambin se
le conoce como el mtodo de los mnimos cuadrados.

La ecuacin de regresin ajustada ser: y a bx
Donde:

y Variable dependiente (la que se va a predecir)


a: Intercepto de la variable Y
x Variable predictiva o independiente
b: Pendiente de la recta

En esta ecuacin hay dos valores desconocidas: a y b, que deben determinarse aplicando el criterio de los
mnimos cuadrados, buscando as la mejor recta que se ajuste a los datos.

Para hallar los estimadores a y b, se utiliza las siguientes ecuaciones. la demostracin se deja como ejercicio
de investigacin, es muy interesante.

n XY X Y Y b X
b a
n X X
2 2
n

Donde:
b: Pendiente de la recta
a: Intercepto de la variable Y
X: Valores de la variable independiente
Y: Valores de la variable dependiente
n: Tamao de la muestra

Pgina 82 de 177
Algunos autores calcular los valores de a y b en trminos de las medias de de los conjuntos de datos con las
siguientes dos ecuaciones:

n xi y i xi y i
b a y bx
n xi2 ( xi ) 2

Donde:
xi: Valores de la variable independiente
yi: Valores de la variable dependiente
n: tamao de la muestra

EJEMPLO
10.110.1
El departamento de publicidad de una industria alimenticia desea saber si existe una relacin entre las ventas y
el nmero de comerciales de televisin transmitidos por da. Para ello, toma una muestra aleatoria de siete
ciudades. La siguiente tabla muestra los resultados obtenidos.

Tabla: Relacin de ventas de un producto y la emisin del comercial en televisin

Ventas Comerciales
Cantidad de millones por mes Nmero transmitido por da
8,4 9
5,2 6
7,1 8
10 11
12,9 12
12,1 13
14,4 14

a-) Disear el diagrama de dispersin para identificar el comportamiento de los datos.


b-) Determinar la ecuacin de regresin estimada.

Solucin:

a-) Para conocer el tipo de relacin que puede existir entre estas dos variables, el primer paso es determinar
es si el diagrama de dispersin efectivamente insina una tendencia lineal.

Figura: Diagrama de dispersin de ventas de un producto y la emisin del comercial en televisin


16
Nmero de comerciales

14
transmitidos por da

12

10

8
6

4
2

0 2 4 6 8 10 12 14 16

Ventas, cientos de unidades por mes

Pgina 83 de 177
El diagrama confirma la sospecha, se procede ahora a determinar la ecuacin de la recta que ms se ajusta.

b-) Para determinar la ecuacin de regresin: y a bx se debe estimar los parmetros, por medio de los
mnimos cuadrados.

n xi y i xi y i
Donde: b a y bx
n xi2 ( xi ) 2

X Y 2
XY X
Millones por mes Comerciales
8,4 9 75,6 70,56
5,2 6 31,2 27,04
7,1 8 56,8 50,41
10 11 110 100
12,9 12 154,8 166,41
12,1 13 157,3 146,41
14,4 14 201,6 207,36
70,1 73 787,3 768,19

n xi y i xi y i 7 * 787,3 (70,1)(73) 393,8


b 0,85
n x ( xi )
2
i
2
7 * 768,19 (70,1) 2 463,32

a 10,43 0,85 *10,01 1,92 Con la otra ecuacin: a


Y b X 73 (0.85 70,1) 13,415
1,92
n 7 7

As la ecuacin de regresin ajustada es: y 0,85x 1,92

EJEMPLO
Con los datos del ejemplo anterior, cual seran las ventas si se pasan: 10.110.1
a-) 10 comerciales
b-) 7 comerciales.

Solucin:

a-) Como x = 10. Entonces: y 0,85(10) 1,92 10,42 Millones por mes

b-) Para x = 7. y 0,85(7) 1,92 7,87 Millones por mes.

Pgina 84 de 177
Leccin 11: Relacin y Correlacin
CORRELACIN: La correlacin es una medida del grado de asociacin entre las variables explicativas,
respecto al variable de respuesta. El anlisis de correlacin mide La Fuerza de relacin entre las dos
variables a travs del llamado coeficiente de correlacin de Pearson. Se representa con r siendo este un valor
entre -1 y 1. Si el coeficiente de correlacin r es igual o menor que uno, nos indica que tanto la covarianza,
como los coeficientes angulares, son negativos y por tanto la recta ser descendente, por ser la pendiente
negativa. Adems si es igual a -1, nos indica que existe una relacin inversa perfecta entre las variables. Para
el caso de que r sea positivo, la recta es creciente y si es igual a 1, indica que existe una relacin directa
perfecta. En estas condiciones, cada valor de la variable deber ser exactamente igual al estimado y, por tanto
la varianza residual es igual a cero; adems, la varianza explicada igual a la varianza total.

Figura: Grficas de dispersin lineal

(a) positiva (b) negativa

Y Y

(a) (b)
X X

Propiedades:

a-) El coeficiente de correlacin no depende de los valores de x e y.


b-) El valor del coeficiente es independiente de las unidades de x e y
c-) El valor del coeficiente est entre -1 y 1: -1 r 1
d-) Cuando r = 0, entonces no existe correlacin lineal entre las variables.
e-) Cuando r = 1, existe correlacin positiva perfecta y adems es directa, en estos casos
hay dependencia total entre las variables.
f-) Cuando r = -1, existe correlacin negativa perfecta y adems es inversa, en estos
casos tambin hay dependencia total entre las variables.

xy
El coeficiente de correlacin poblacional se define como:
x y
xy: Covarianza de x e y. x y y Desviacin tpica de las distribuciones marginales de x e y. Si (x i, yi) son
valores de una muestra aleatoria proveniente de una poblacin bivariada, entonces el coeficiente de correlacin
s xy
muestral esta dado por: r
s xx s yy
Donde:

s xy xi yi
1
xi yi s xx xi2
1
xi 2 s yy yi2
1
yi 2
n n n
Es pertinente tener presente que si se tiene dos correlaciones: r1 = 0,3 y r2 = 0,9 est indicado que las dos son
positivas, pero NO se puede pensar que: r2 = 3r1

Pgina 85 de 177
EJEMPLO
10.110.1
Un estudio sobre la transformacin de una sustancia en cierto proceso a diferentes temperaturas, origin la
siguiente tabla:
0
x C 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0
y Kg 8,1 7,8 8,5 9,8 9,5 8,9 8,6 10,2 9,3 9,2 10,5

Hallar el coeficiente de correlacin de Pearson e interpretar el resultado.

Solucin:
2 2
x y x y xy
1,0 8,1 1,0 65,61 8,1
1,1 7,8 1,21 60,84 8,58
1,2 8,5 1,49 72,25 10,2
1,3 9,8 1,69 96,04 12,74
1,4 9,5 1,96 90,25 13,3
1,5 8,9 2,25 79,21 13,35
1,6 8,6 2,56 73,96 13,76
1,7 10,2 2,89 104,04 17,34
1,8 9,3 3,24 86,49 16,74
1,9 9,2 3,61 84,64 17,48
2,0 10,5 4,0 110,25 21,0
16,50 100,4 25,85 923,58 152,59

s xy
r
s xx s yy

s xy 152,59
1
16,50100,4 1,99
11
s xx 25,85 16,50 1,1
1 2

11
s yy 923,58 100,4 7,201
1 2

11
1,99 1,99
r 0,708
1,1 7,201 2,81

Como r es positivo y relativamente grande, entonces hay una alta relacin entre las variables temperatura y
cantidad de masa, lo que nos indica que a mayor temperatura, mayor cantidad de transformacin de masa.

DETERMINACIN: El coeficiente de determinacin es una medida de la bondad de ajuste del modelo de


regresin. El coeficiente de determinacin establece el grado de proporcin de la variacin total de la variable
de respuesta, (Y) que es explicado por el modelo, especficamente por la variacin de la variable explicativa.
Lo anterior significa que es necesario medir el porcentaje de la informacin recogida o explicada por el modelo
de regresin obtenido.

Pgina 86 de 177

Medidas de Variacin: Por el anlisis de regresin, se sabe que el i-simo residual ei yi yi se puede
minimizar por el mtodo de mnimos cuadrados, cantidad conocida como la suma de cuadrados del error SSE,
el cual es la medida del error que se comete cuando se utiliza la ecuacin de regresin, para hallar yi a partir
del modelo obtenido.
2
SSE yi yi

De la misma manera, para el i-simo valor de la variable de respuesta yi, se tiene la diferencia yi y que es
la medida del error ocasionado al utilizar y para estimar el valor de la variable de respuesta, obteniendo lo
llamado suma total de cuadrados SST.
SST yi y
2

La otra medida de regresin, es la desviacin de los valores estimados medidos en la lnea de regresin
respecto al valor promedio, originando la llamada suma de cuadrados de la regresin SSR.

SSR yi y
2

Las tres sumas de cuadrados, se relacionan en una de las ecuaciones ms importantes en estadstica: SST =
SSR + SSE

A partir de la ecuacin anterior, se puede ver que el modelo ajusta perfectamente cuando yi yi 0 esto
indica que el valor de la variable de respuesta estara sobre la lnea de regresin. As como SSE = 0, entonces
SST = SSR. Tomando esta ecuacin, se hace la siguiente relacin.
SST SSR SSR
1 Ajuste perfecto.
SST SST SST
SSR
Entonces el Coeficiente de Determinacin: r2
SST

y y
2
Variacin exp licada

2 i
r
y y
Lo anterior significa: 2
i
Variacin total
El coeficiente de determinacin toma valores entre 0 y 1, inclusive. Cuando el coeficiente es cercano a uno,
indica que el modelo es explicado muy bien por la lnea de regresin. Cuando el coeficiente es cercano a cero,
entonces la variacin de la variable de respuesta no es causada por la variable explicativa.

Resumiendo: Cuando r 1 hay dependencia total de y respecto a x. r 0 hay independencia entre las
2 2

variables.

Obtencin de las Variaciones: Las variaciones SST y SSR, se pueden calcular de la siguiente manera:

SST yi2
1
xi yi
n
2

xi y i n xi yi
1
SSR

xi2 n xi
1 2

Pgina 87 de 177
EJEMPLO
10.110.1
Un estudio sobre la transformacin de una sustancia en cierto proceso a diferentes temperaturas, origin la
siguiente tabla:
0
x C 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0
y Kg 8,1 7,8 8,5 9,8 9,5 8,9 8,6 10,2 9,3 9,2 10,5

Hallar el coeficiente de determinacin e interpretar el resultado.

Solucin:
2 2
x y x y xy
1,0 8,1 1,0 65,61 8,1
1,1 7,8 1,21 60,84 8,58
1,2 8,5 1,49 72,25 10,2
1,3 9,8 1,69 96,04 12,74
1,4 9,5 1,96 90,25 13,3
1,5 8,9 2,25 79,21 13,35
1,6 8,6 2,56 73,96 13,76
1,7 10,2 2,89 104,04 17,34
1,8 9,3 3,24 86,49 16,74
1,9 9,2 3,61 84,64 17,48
2,0 10,5 4,0 110,25 21,0
16,50 100,4 25,85 923,58 152,59

SST 923,58
1
16,50100,4 772,98
11
2

152,59 11 16,50100,4
1

SSR 1,99 3,60


2

25,85 16,50
1 2 1,1
11
2
r = 0,004657

Lo que indica el coeficiente es que slo el 0,4657% de la variacin, es explicada por el modelo.

Leccin 12: Regresin Mltiple.


Cuando se emplea ms de una variable independiente para evaluar una variable dependiente es conveniente
utilizar un mtodo de regresin mltiple, que consiste en el mismo procedimiento de una regresin lineal
simple: describir la ecuacin de regresin, determinar el error de estimacin y analizar la correlacin entre las
variables.

A continuacin se desarrollarn estos conceptos suponiendo dos variables independientes. Para ms variables
independientes, slo basta con seguir los mismos pasos.

La ecuacin de regresin est dada por: Y a b1 X 1 b2 X 2

Pgina 88 de 177
Donde:
Y : Variable dependiente.
a: Intercepto de la variable Y.
X 1 , X 2 : Valores de las dos variables independientes.
b1 , b2 : Pendientes asociadas con cada variable independiente, respectivamente.
Los valores de las tres constantes numricas se obtienen resolviendo el siguiente sistema de ecuaciones:

Y na b X b X
1 1 2 2

X Y a X b X b X X
1 1 1
2
1 2 1 2

X Y a X b X X b X
2 2 1 1 2 2
2
2

Una vez obtenida la ecuacin de regresin, se determina el error estndar de la estimacin de regresin
mltiple:

Se
(Y Y ) 2

Se
Y 2
a Y b1 X 1Y b2 X 2Y
n3 n3

Y el coeficiente de determinacin mltiple, estar dado por:

a Y b1 X 1Y b2 X 2Y ny
2

R
2

Y
2
2
ny
Donde:
Y: Valores de la variable dependiente.
a: Intercepto de la variable Y.
X 1 , X 2 : Valores de las dos variables independientes.
b1 , b2 : Pendientes asociadas con cada variable independiente, respectivamente.
y: Media de los valores de la variable dependiente.

EJEMPLO
10.110.1
El jefe de produccin de una empresa manufacturera desea estimar los gastos indirectos de produccin con
base en el nmero de horas de trabajo y en el nmero de horas mquina. En la siguiente tabla se relaciona la
informacin correspondiente al primer semestre del ao.
El jefe de produccin define:
X1 : Horas de trabajo (cientos).
X2 : Horas de mquina (cientos)
Y : Gastos indirectos de produccin (cientos de miles de pesos)

Pgina 89 de 177
Tabla: Gastos indirectos de produccin

2 2 2
Mes X1 X2 Y X1 Y X2Y X1X2 X1 X2 Y
Enero 45 16 29 1305 464 720 2025 256 841
Febrero 42 14 24 1008 336 588 1764 196 576
Marzo 44 15 27 1188 405 660 1936 225 729
Abril 45 13 25 1125 325 585 2025 169 625
Mayo 43 13 26 1118 338 559 1849 169 676
Junio 46 14 28 1288 392 644 2116 196 784
TOTAL 265 85 159 7032 2260 3756 11715 1211 4231

Y na b X b X
1 1 2 2 159 6a 265b1 85b2 (1)
X Y a X b X b X X
1 1 1 1
2
2 1 2 7032 265a 11715b1 3756b2 (2)

X Y a X b X X b X
2 2 1 1 2 2
2
2 2260 85a 3756b1 1211b2 (3)
Se resuelve el sistema de ecuaciones:

Ecuacin (1) multiplicada por 85/6 y restada por la ecuacin (3):

2252.5 85a 13754.17b1 1204.17b2


2260 85a 3756b1 1211b2
7.5 1.83b1 6.83b2 (4)
Se despeja la variable b1 de la ecuacin (4):

7.5 6.83b2
b1
1.83
Ecuacin (1) multiplicada por 265/6 y restada por ecuacin (2):

7022.5 265a 11704.17b1 3754.17b2


7032 265a 11715b1 3756b2
9.5 10.83b1 1.83b2 (5)

Variable b1 reemplazada en la ecuacin (5):

7.5 6.83b2 67.19


9.5 10.83 1.83b2 b2 0.91
1.83 73.97
7.5 6.83b2
b2 reemplazada en la ecuacin (4): b1 0.7
1.83

159 265b1 85b2


b1 y b2 reemplazada en la ecuacin (1): a 17.31
6

Pgina 90 de 177
Se obtiene as la ecuacin de regresin mltiple:

Y a b1 X 1 b2 X 2 Y 17.31 0.7 X 1 0.91X 2

Ejercicios:

1. Explique claramente en qu consiste el proceso de regresin.

2. Cul es la utilidad del coeficiente de regresin y de determinacin.

3. La Compaa LISTO, ha obtenido los siguientes resultados con respecto al costo de la mano de obra directa
y la cantidad de unidades producidas (en miles), de la siguiente manera:

Mano de Obra 18 23 15 21 30 26 28 27 29 19 22 24
Produccin 44 60 40 56 80 70 74 71 78 48 64 69

Con la informacin anterior se requiere lo siguiente:

a-) Estimar el valor mnimo de la mano de obra directa que debe obtenerse para una produccin de 72.870
unidades.

b-) Determinar que tanto estn relacionadas las variables en estudio.

c-) Explicar que tan confiable es la bondad de ajuste del modelo: mano de obra directa en funcin de la
produccin.

4. Una oficina de finca raz est interesada en analizar si la renta de los apartamentos que arrienda son
tpicas, por tanto, a escogido una muestra aleatoria de 11 alquileres y del tamao de los apartamentos de
edificios similares. Los datos se transcriben enseguida.
Renta 230 190 450 310 218 185 340 245 125 350 280
No habitaciones 2 1 3 2 2 2 1 1 2 1 1

a-) Desarrolle el modelo de regresin lineal simple que mejor describa el fenmeno
b-) Hacer el diagrama de dispersin de los datos
c-) Calcular el coeficiente de regresin y determinacin
d-) Hacer el grafico ajustado segn el modelo obtenido.
e-) Realizar los anlisis correspondientes del caso en estudio.

5. Una compaa de ahorro y crdito, desea saber cmo son afectadas las ventas de viviendas por diferentes
tasas de inters. Durante ocho meses se recopil la informacin y se obtuvo el siguiente resultado:

Tasa de inters (%) 7 6.5 5.5 6 8 8.5 6 6.5


Ventas de viviendas 23 38 45 36 16 18 39 41

a. Estimar las ventas en funcin de la tasa de inters.


b. Cuntas viviendas se pueden vender si el inters es del 7.5%?
c. Determinar el error estndar del estimado.
d. Es confiable el modelo?
e. Calcule el tipo de asociacin entre las variables.

Pgina 91 de 177
UNIDAD DOS
PRINCIPIOS DE PROBABILIDAD

Pgina 92 de 177
CAPTULO 4: FUNDAMENTACIN EN PROBABILIDAD
Leccin 13: Historia de la Probabilidad
Para hablar del origen de la probabilidad, se presentan discrepancias, ya que algunos lo reconocen como una
ciencia relativamente reciente, edad media e inicios de la edad moderna. Pero es pertinente hacer un recorrido
a travs de la historia, para conocer cmo ha evolucionado tan interesante ciencia estadstica, lo cual se
estudiar en tres fases.

ANTECEDENTES. JUGOS DE AZAR: Se tienen evidencias arqueolgicas del antiguo Egipto, Pompeya, Irak y
otros, sobre Dados elaborados en hueso, cristal piedra, marfil, madera y arcilla, que estaban tallados, dando
la percepcin de que eran Dados Perfectos. Algunos estudiosos consideran que en la sitiada Troya, se origino
los juegos de azar, pretexto de las largas jornadas de espera (10 aos) que los soldados deban soportar en
dicho asedio.

Los primeros juegos de azar de que se tenga evidencia, adems de los dados son las cartas, los cuales se
utilizaban con propsitos adivinatorios. En el Imperio Romano, se tena la ley de prohibicin de ste tipo de
juego y, solo se poda practicar en ciertas pocas del ao. Este tipo de eventos se hicieron tan populares que
hasta el Cesar lo practicaba en cualquier momento, segn historiadores de esta civilizacin.

En la Europa se presentaban leyes de prohibicin de juegos de este tipo, auspiciado por la Iglesia Cristiana,
quienes consideraban que este tipo de prcticas eran artificios del demonio, para desviar sus principios
cristianos. En Francia Luis IX prohibi los juegos de azar y la elaboracin de dados. En Inglaterra, Eduardo III
y Enrique VIII, incluyeron los dados y cartas en una lista de juegos prohibidos, estimulando otro tipo de juegos,
como el tiro con el arco.

Sin embargo, a pesar de la prohibicin este tipo de juegos se hizo cada vez ms popular, lo que motivo a
algunos pensadores a darles algn tipo de explicacin desde el punto de vista matemtico. Lo anterior con el
fin de conocer las ventajas o desventajas de apostar.

El tema motivo a los cientficos del Renacimiento a realizar estudios, con la inquietud del porque no se haba
analizado con anterioridad, a lo cual Kendall sugiere varios motivos que impidieron la evolucin del Clculo de
Probabilidades, antes del siglo XVI.

1. Desconocimiento del lgebra Combinatoria que resolviera situaciones de juegos.


2. Ausencia de la nocin de suceso aleatorio
3. Barreras morales y religiosas impuestas en contra de los fenmenos de azar y aleatoriedad.
4. Supersticin de los jugadores.

Otros pensaban que la falta de simetra y de equiprobabilidad en el lanzamiento de los dados, eran obstculos
al desarrollo del clculo de probabilidad, pero se pudo saber que algunos de los dados diseados presentaban
simetra perfecta. Sin embargo quedaron muchos interrogantes sin respuesta.

EL CLCULO ARITMTICO: En el renacimiento, el espritu inquieto, ansioso, rebelde y renovador de los


cientficos, motivo darle importancia al estudio de fenmenos de azar, as es pertinente nombrar los que se
consideran que dieron aportes relevantes al estudio de la probabilidad.

Lucas Paccioli, (1.445 1.514) Gemetra y Matemtico Italiano, aunque sus aportes son ms conocidos en el
rea de la Contabilidad, por su formulacin del Mtodo Anfisogrfico o de partida doble contable. Pero tambin
fue precursor el Clculo de Probabilidades, planteando los juegos de azar, donde su objetivo era hallar la
solucin a problemas especficos ms que una teora sobre probabilidad.

Pgina 93 de 177
Gerolamo Cardano, (1.501 1.576) Clebre matemtico, mdico y
astrnomo Italiano, pero tambin tenia la fama de Jugador, por lo cual se
motivo a estudiar sobre teora acerca de juegos de azar. En sus libro; el
primero escrito, sobre juegos de azar escrito en 1.560, pero publicado slo
hasta 1.663. La idea central de la obra era la idealizacin explcita del nmero
de alternativas iguales basadas en un dado ideal. Para Cardano cuando el
nmero de observaciones es pequeo, la frecuencia puede desviarse
sustancialmente de la probabilidad de ocurrencia. Pero si el nmero de
repeticiones es grande, la desviacin es despreciable, as aparece
rudimentariamente la conocida Ley de los Grandes Nmeros.

Sus aportes ms significativos fue en al solucin de ecuaciones de tercer y


cuarto grado, donde ofrece una metodologa de solucin general a este tipo
de ecuaciones. Tambin propone la solucin de un caso particular de la
ecuacin de tercer grado.

Nicollo Tartaglia, (1.499 1.557) Nicolo Fontana; su verdadero nombre, gran


matemtico y Geometra Italiano, autodidacta. Sus esfuerzos se centraron en buscar una
tcnica de solucin de ecuaciones de tercer grado. Respecto a la Probabilidad, sus
aportes fueron a la bsqueda de solucin para problemas de combinatorias que estaban
relacionadas con juegos, disertando la solucin dada por Paccioli al problema del reparto
de la apuesta en el caso del juego interrumpido. Diseo el llamado Tringulo de
Tartaglia, que determina los nmeros combinatorios.

Tringulo de Tartaglia

Galileo Galilei, (1.564 1.642) Matemtico, Fsico, Astrnomo y Filsofo, nacido en Pisa (Italia). Considerado
el gestor de la revolucin cientfica y de la ciencia moderna. Sus aportes a las ciencias son innumerables, no
dejando de aportar a la Probabilidad. En este campo se dedico a analizar problemas sobre juegos de azar, por
ejemplo hace el anlisis de los posibles sucesos que se pueden obtener, cuando se lanzan tres dados. Su
ingenio lo llevo a intuir sobre la Teora del error. Exista un problemas son la estimacin de errores en
mediciones astronmicas, a lo cual galileo comenta que ..Los errores en las mediciones son inevitables, los
cuales estn simtricamente distribuidos.

Blaise Pascal, (1.623 1.662) Matemtico, Fsico, Filsofo y Telogo, nacido


en Clermont (Francia), se le considera el padre de la computadora junto con
Babbage, contribuy de manera efectiva en la teora matemtica de la
probabilidad. En intercambio con Fermat, desarrollo fuertemente la teora de
probabilidad. La motivacin de los estudios de Pascal fue los problemas con
apuestas que tena el llamado Caballero de Mer (1.607 1.684) de la corte de
Luis XIV, quien le plante a Pascal el conocido problema de los puntos, lo que

Pgina 94 de 177
se asume motivo la Correspondencia entre Pascal y Fermat. Pascal le enva a Fermat una carta el 29 de julio
de 1.654 en donde le expone el problema de los puntos: Dos jugadores han pactado el juego a tres rondas y
cada uno apuesta 32 pistolas; el primero ha ganado dos veces y el segundo solamente una vez. Pascal
argumenta que para encontrar la distribucin justa en la apuesta realizada es * ... si ellos juegan otra ronda y
el primero gana, este se lleva toda la apuesta, esto es, las 64 pistolas; si el otro gana, entonces cada uno tiene
dos rondas a su favor, en cuyo caso, si desean parar el juego, cada uno deber tomar su propia apuesta, esto
decir, 32 pistolas, Entonces, si el primer jugador gana, este se queda con las 64 pistolas, si pierde se queda
con 32, solamente. Luego, si ellos no desean correr el riesgo de una ltima ronda y desean separarse del
juego, el primer jugador argumentara lo siguiente: Estoy convencido que me corresponden 32 pistolas, an
cuando pierda la ronda, ellas me pertenecen; con relacin a las otras 32, existen las mismas posibilidades de
que sean para usted como para m. Entonces dividamos estas 32 pistolas en partes iguales y dme una de
ellas, as como las 32 que de seguro son mas. En resumen, al primer jugador le corresponden 48 pistolas y al
segundo 16; en otras palabras, Pascal propone que la apuesta se divida de acuerdo a las probabilidades que
tendran los jugadores de ganar en caso de que el juego continuara.

* APUNTES DE HISTORIA DE LAS MATEMTICAS VOL.1, NO.1, ENERO 2002/ 61

En la misma carta, Pascal encuentra la distribucin justa de la apuesta para otros casos usando el mismo tipo
de situaciones, con argumentos relativamente simples, pero se consideraron inadecuados en situaciones ms
complicadas. En los intercambios con Fermat, Pascal propone una solucin general al Problema de los
Puntos para juegos en los que participan dos personas, apoyndose en resultados sobre el tringulo aritmtico,
que haba obtenido en 1653. As pues, Pascal dio dos soluciones al Problema de los Puntos: Una para casos
particulares y Otra de manera general, que en su opinin diferan de la solucin de Fermat.

Dentro de sus grandes aportes a la probabilidad y en el anlisis de las apuestas, surge el concepto de
Esperanza Matemtica, a partir de argumentar que el clculo de probabilidades es funcin de la esperanza
matemtica que cada jugador tiene de ganar. Pero tambin dio los principios sobre la Teora de la Decisin.

Pierre de Fermat, (1.601 1.665) Matemtico y Jurista, nacido en Beaumont


de Lomagne (Francia), junto con Descartes, fue un de los principales
Matemticos de la primera mitad del siglo XVII, descubri el clculo diferencial
antes que Newton y Leibniz, gestor de la teora de probabilidad junto con
Pascal, pero es conocido tambin por sus aportes a la Teora de Nmeros,
especialmente el famoso Ultimo Teorema de Fermat, el cual fue resuelto en
1.995.

La correspondencia con Pascal sobre el problema planteado por el Caballero de


Mer. La carta original de Fermat, en la que se supone describe su mtodo de
solucin, se extravi; sin embargo, sus argumentos se han podido reconstruir de
una carta que Pascal envi a Fermat el 24 de agosto de 1654. El problema que
Fermat se plantea es el siguiente: * Dos individuos, A y B, que participan en una
serie de juegos se encuentran en la situacin de que el primero necesita ganar dos juegos y el segundo tres
para ganar la apuesta; cmo podemos encontrar la distribucin justa de la apuesta?, en su planteamiento,
Fermat ya no hace referencia a los juegos ganados que tiene cada individuo sino a la cantidad de juegos que le
falta a cada uno para llevarse la apuesta completa. La solucin de Fermat es la siguiente: El juego puede
continuarse a lo ms en cuatro rondas. Cules son los resultados posibles para estas cuatro rondas?
Indiquemos con el smbolo + las victorias de A y con el smbolo - las victorias de B. Existen 16 resultados
posibles, los cuales se describen en siguiente tabla.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
+ + + + - + + - + - - - - - + -
+ + + - + + - + - + - - - + - -
+ + - + + - + + - - + - + - - -
+ - + + + - - - + + + + - - - -

Pgina 95 de 177
De los 16 resultados posibles, las primeros 11 favorecen a A y los restantes a B. En consecuencia, al jugador A
le corresponden 11/16 de la apuesta y a B le corresponden 5/16. Es decir, la distribucin justa de la apuesta es
11::5.

* APUNTES DE HISTORIA DE LAS MATEMTICAS VOL.1, NO.1, ENERO 2002 62

Los mtodos de solucin para el problema del Caballero de Mer, dados por Pascal y Fermat, eran similares,
por tal razn de les da el calificativo de gestores del clculo de probabilidades.

Christiaan Huygens, (1.629 1.695) Matemtico, Fsico y Astrnomo, nacido


en La Haya (Holanda), en su libro De ratiociniis in ludo aleae publicado en
1.656, deja ver lo relacionado al clculo de juegos de azar, considerado el
primer manual sobre Clculo de Probabilidades. En ste deja ver la solucin del
Problema de los Puntos de forma general con un mtodo diferente a los
empleados por Pascal y Fermat, introduciendo formalmente el concepto de
Esperanza Matemtica, como una generalizacin de la media aritmtica.
Tambin resolvi algunos problemas planteados por Pascal y Fermat.

Trabaj sobre problemas Demogrfico Actuariales, construyendo una curva


de mortalidad y definiendo claramente la nocin de Vida Media y Esperanza de
Vida.

La obra de Huygens se considero la ms importante aportacin terica de


probabilidad de dicho siglo, esto hizo ejercer gran influencia en los trabajos de
Bernoulli y De Moivre.

LA PROBABILIDAD MODERNA: El desarrollo de la probabilidad actual, fue dinamizada desde finales del siglo
XVII, al igual que en las pocas anteriores hubo varios investigadores que aportaron a tal fin. Veamos los ms
representativos.

Jacob Bernoulli, (1.654 1.705) Matemtico y Cientfico Suizo, hermano mayor


de Johann Bernoulli, de la dinasta Bernoulli. Su aporte fundamental se dio por
medio de su obra: Ars Conjectandi, el Arte de la conjetura, un trabajo relevante en
la Teora de Probabilidad. La obra fue publicada por su sobrino Nicholas Bernoulli
en el ao 1.713, ocho aos despus de su muerte. Por medio de este trabajo la
Probabilidad adquiere la categora de Ciencia.

La obra esta compuesta de cuatro partes:

Primera Parte: Explicacin crtica de la obra expresada por Huygens, usado por
Bernoulli para dar a conocer su punto de vista sobre los problemas de azar, as logr obtener la frmula de la
Funcin de Probabilidad para esquemas dicotmicos con n repeticiones, conocida actualmente como la
Distribucin de Bernoulli.
Segunda Parte: En esta parte Bernoulli, hace un completo manual sobre el tema de combinatoria, necesario
para resolver problemas de probabilidad, complementado los estudios realizados por Pascal y Leibniz.
Tercera Parte: Plantea 24 problemas diferentes de probabilidad con su respectiva solucin.
Cuarta Parte: En esta parte estn los aportes ms relevantes para la
probabilidad. Por un lado explica la concepcin subjetiva de Probabilidad,
por otro lado la demostracin detallada del que se denomino Teorema
Aureo,, conocido actualmente como Ley de los Grandes Nmeros.

Abraham De Moivre, (1.667 1.754) Matemtico nacido en Champagne


(Francia) un Autodidacta, ley y analiz el trabajo de Huygens. En 1.711

Pgina 96 de 177
public sus memorias De mensura sortis en latn en la revista Philosophical Transactions of the Royal
Society. En 1718, public su libro The Doctrine of Chance: A method of calculating the probabilities of events
in play. En dicha obra explicita el principio de la Independencia Estadstica. Adems, problemas de dados y
juegos. En la segunda edicin de la obra publicada en 1.738 presenta el Teorema Lmite para fenmenos
dicotmicos. Otro trabajo interesante de este matemtico fue el que denomin Miscellanea Analytica donde
aparece la frmula de Stirling que utiliz para derivar la curva normal como una aproximacin a la distribucin
Binomial. Tambin logr obtener una aproximacin para n!, equivalente a la obtenida por Stirling. Es
pertinente comentar que resultados tradicionalmente atribuidos a Laplace y Poisson, se encontraron en la obra
de De Moivre.

Daniel Bernoulli, (1.700 1.782) Matemtico Suizo, hijo de John Bernouulli.


Daniel fue un de los ms destacados matemticos y cientficos de la ltima
dcada del siglo XVIII. Una de sus principales trabajos fue la famosa paradoja
de San Petersburgo, relacionada con la teora de probabilidad y de Decisin,
especficamente sobre la teora para medir el Riesgo. Uno de los primeros
intentos para analizar estadsticamente problemas relacionados con data censal
fue el anlisis que hizo Bernoulli en 1766 sobre la mortandad de la viruela y la
eficacia de la vacunacin.
Pero la ms importante aportacin fue la famosa distribucin llamada con su
nombre: Distribucin de Bernoulli, es una distribucin discreta de probabilidad,
para valores dicotmicos: p como xito y q como fracaso.

Jean DAlembert, (1.717 1.783) Matemtico y fsico Francs, plante que en probabilidades muy pequeas,
se podra considerar equivalente a cero, por lo cual, se podra asumir que dichos sucesos no ocurriran. Su
teora sobre Ley de Equilibrio supone un equilibrio de xitos y fracasos de ciertos eventos, para una serie
larga de dichos eventos.

Thomas Bayes, (1.702 1.761) Matemtico y Telogo Britnico, su obra no


reconocida en ese entonces, inicia con el planteamiento del siguiente
problema: Dado el nmero de veces en el cual un suceso desconocido tiene
lugar y ha fallado; se requiere la probabilidad de que la posibilidad de
ocurrencia en un nico ensayo, este comprendida entre dos valores que
pueden ser dados. Otro aporte de su obra es la definicin sobre relaciones
entre sucesos. Seguido enuncia y prueba siete teoremas. Pero el trabajo ms
reconocido de Bayes es el reconocido y famoso Teorema de Bayes, que en
sntesis hace referencia a la probabilidad de un suceso condicionado por la
ocurrencia de otro. El teorema resuelve el problema conocido como De la
probabilidad inversa; es decir, valorar desde el punto de vista probabilistico,
las posibles condiciones que rigen el supuesto de haber observado cierto
suceso, situacin denominada de probabilidad inversa". Con este aporte se
da origen a la llamada Inferencia Bayesiana, cuyo principio es tomar la
probabilidad (Probabilidad Inductiva) como una creencia ms que una
frecuencia, ya que se procura sacar conclusiones generales (enunciar leyes) a partir de lo objetivamente
observado, y no viceversa.

Adrien Marie Legendre, (1.752 1.833) Matemtico Francs, fue uno de los primeros que aporto al desarrollo
de la probabilidad en los inicios del siglos XIX, inicialmente sobre los aportes al modelo lineal, por medio del
desarrollo del Mtodo de Mnimos Cuadrados, que posteriormente fue perfeccionado por Gauss. El mtodo es
muy utilizado para hacer estimacin de parmetros.

Pgina 97 de 177
Carl Friedrich Gauss, (1.777 1.855) Matemtico, Astrnomo y Fsico,
nacido en Brunswick (Alemania), considerado el Matemtico ms grande de la
Historia, ya que sus aportes han influenciado significativamente las Matemticas
y las Ciencias en general. Entre los aportes a la probabilidad, est el
perfeccionamiento de mtodo de Mnimos Cuadrados, considero que en la
teora de probabilidad, se incluyera el anlisis de los errores en las
observaciones, desarrollo la muy conocida Ley Normal o Ley de Gauss,
desarrollo la distribucin muestral de medias en muestreo donde loa datos
provienen de distribuciones normales. Gauss es el padre de la moderna teora
de errores.
x2
2
e h
Descubri que la funcin de distribucin de los errores es ( x) , la clebre campana de Gauss.
h
Tambin investiga sobre la distribucin hipergeomtrica y sobre estimadores.

Pierre Simon De Laplace, (1.749 1.827) Matemtico, Astrnomo y Fsico


Francs, se le llam El Newton de Francia por algunos de sus
descubrimientos. Buen amigo de Napolen, prominente matemtico que con
sus descubrimientos y trabajos en el campo de la probabilidad, fueron de gran
impulso sobre la actual estadstica. Su trabajo denominado Thorie Analytique
des Probabilities publicada en el ao 1.912 y donde deja establecido la
definicin bsica de probabilidad, partiendo del principio de razn insuficiente.
Otro aporte de su obra fue la definicin de las Funciones Generatrices, muy
utilizado hoy da en teora estadstica. Profundiz sobre el mtodo de mnimos
cuadraos y sobre demografa.
Pero se considera que la principal aportacin que dejo Laplace fue la demostracin rigurosa de uno de los
teoremas ms importantes en estadstica. Teorema Lmite. Laplace extiende el teorema de De moivre a otros
casos donde p no sea necesariamente , haciendo una completa demostracin de convergencia, que
posteriormente Poincar llamo Ley Normal. En el ao 1.814 escribe un trabajo fija una postura Filosfico
Metodolgico sobre el concepto de Azar y el papel de la Probabilidad en situaciones en que el conocimiento del
Ser Humano no es completo. Laplace cre una curiosa frmula para expresar la probabilidad de que el Sol
saliera por el horizonte. l deca que la probabilidad era: (d + 1) / (d + 2), donde d es el nmero de das que el
sol ha salido en el pasado. Laplace deca que esta frmula, que era conocida como la regla de sucesin, poda
aplicarse en todos los casos donde no se sabe nada.
Simeon Denis Poisson, (1.781 1.840) Matemtico y Fsico, nacido en Sceaux
(Francia) Alumno de Laplace y Lagrange, dentro de sus trabajos se conocen: La
ecuacin de Poisson, Ley de Poisson, Distribucin de Poisson, procesos Poisson,
muy aplicados en diversos campos del conocimiento. Dentro de sus investigaciones
encontr la conocida Ley de los Grandes Nmeros, la cual supera el teorema lmite
de Bernoulli, especialmente sobre la convergencia de la distribucin Binomial, en
aquellos casos donde el nmero de repeticiones se hace suficientemente grande (n
) y a su vez la probabilidad se acerca a cero (p 0). Dicha distribucin se le
denomin Ley de los Pequeos Nmeros y posteriormente Ley de los Sucesos
Raros.

Pgina 98 de 177
Para completar este recorrido por la historia de la probabilidad, no podemos olvidar los aportes relevantes de la
Escuela de San Petersburgo (Rusia), que dejo marcado el camino de la probabilidad de manera robusta.

Pafnuttii Lvovich Chebychev, (1.821 1.894) Nacido en Okatovo (Rusia).


En 1.846 defendi su tesis "Un intento de anlisis elemental de la teora
probabilstica". Es conocido por su trabajo en el rea de la probabilidad y
estadstica. La desigualdad de Chebychev dice que la probabilidad de que una
variable aleatoria est a una distancia de su media en ms de a veces, la
2
desviacin tpica es menor o igual que 1/a . Si E(X) es la media (esperanza
matemtica) y es la desviacin tpica, entonces:

P X E ( X ) a
1
para todo nmero real positivo a. La desigualdad
a2
de Chebychev se emplea para demostrar que la ley dbil de los grandes
nmeros.

Andre Markov, (1.856 1.922) naci en Ryazn (Rusia) Fue discpulo de


Chebychev, se doctor en la Universidad de San Petersburgo. Se le recuerda
por sus resultados relacionados con la Teora de Probabilidad, en el ao
1.887 completo una demostracin que le permiti generalizar el Teorema
Central del Lmite, el cual haba trabajo con anterioridad Chebychev. Se le
conoce ms por su trabajo sobre los llamados Procesos Estocsticos,
fenmenos aleatorios que fueron analizados y concentrados en los llamados
Procesos de Markov y especficamente las Cadenas de Markov. Una
herramienta esencial en reas como la Economa, Ingeniera, Investigacin de
Operaciones y muchas ms. Permite analizar fenmenos aleatorios a travs
del tiempo y pronosticar a corto plazo.

Richard Von Mises, (1.883 1.953) Matemtico nacido en Lemberg (Austria),


profesor de las Universidad de Berln y Harvard. Su obra denominada:
Fundamentos del Clculo de Probabilidades publicada en 1.919 y donde hace
referencia a las frecuencias relativas y a partir de esto plante la definicin
frecuentista de probabilidad tal y como se conoce en la actualidad. Uno de sus
estudios sobre Teora de las probabilidades: Problema del Cumpleaos, cuyo
principio es que si se elige en un grupo aleatoriamente un par de personas, la
probabilidad de que coincidan en sus cumpleaos. En un grupo de 23 o ms
personas elegidas aleatoriamente, hay una probabilidad superior al 50% que
cierto par de personas tendr el mismos cumpleaos.

Entre sus escritos se rescatan: Teora matemtica de la probabilidad y de la estadstica, Nueva York, prensa
acadmica, 1964. y Probabilidad y estadstica, generales, Society matemtica americana, 1964.

Pgina 99 de 177
Andrei Nikolyevich Kolmogorov, (1.903 1.987) Matemtico, nacido en
Tambor (Rusia), desarrollo la base axiomtica, el cual fue el pilar de la Teora
de Probabilidad, a partir de la teora de conjuntos. En 1.993 publica su libro
Los Fundamentos de la Teora de la Probabilidad en donde se dejan sentadas
las bases modernas de la teora axiomtica de probabilidad, adquiriendo
reputacin como experto en dicha rea. En 1.938 por medio de un documento
deja ver algunos teoremas bsicos de alisado y prediccin de procesos
estocsticos estacionarios, lo cual fue muy til en aspectos militares, durante la
guerra fra. En la misma lnea de los procesos estocsticos, (Procesos
Aleatorios) basado en los estudios de Markov, el Matemtico Britnico
Chapman y los suyos propios, desarroll de manera independiente el conjunto
de ecuaciones fundamentales de dicha rea, conocidas como Ecuaciones de
Chapman Kolmogorov.
Este matemtico Ruso, aporto a diversas reas de conocimiento, respecto a la Probabilidad, se le reconoce los
trabajos sobre: Los Tres Axiomas de Kolmogorov, son la base de la teora de probabilidad axiomtica y ms
aceptada en la actualidad. Prueba de Kolmogorov Smirnov, prueba no paramtrica para determinar la
bondad de ajuste de dos distribuciones de probabilidad entre ellas. La ecuacin de Chapman Kolmogorov,
que dentro de los procesos estocsticos markovianos, se considera una identidad sobre las distribuciones de
probabilidad conjunta. La Ley Cero Uno de Kolmogorov, hace referencia a que cierto tipo de evento, llamado
Evento de Cola, que son aquellos definidos por una sucesin infinita de eventos independientes, el valor dado
a estos eventos son cero o uno.
Es evidente que existen otros investigadores, que han aportado a la teora de probabilidad, especialmente a la
teora moderna.

Emile Borel, (1.871 1.956), Matemtico y Poltico Francs, fue uno de los pioneros de la
conocida Teora de la Medida y sus aplicaciones a la Teora de Probabilidad En un de sus
libros sobre probabilidad, introduce el experimento mental; conocido popularmente como
Teorema de los infinitos Monos. Tambin publico investigaciones sobre la teora de juegos.

Leccin 14: Experimento Aleatorio, Evento Suceso, Espacio


muestral.

Fenmenos Aleatorios: Son todos que aunque se repiten en las mismas condiciones, un resultado
especfico NO se puede determinar de antemano. En este tipo de fenmenos, lo nico que se puede conocer
son todos los posibles resultados. Algunos ejemplos.
1. Lanzar un dado o una moneda y obtener un nmero de 1 a 6, o, cara / sello.
2. El nmero de defectuosos en una lnea de produccin.
3. La cantidad de llamadas recibidas en una central telefnica por hora.
4. El tiempo de atencin de un cliente en un Banco.

Seguido analizaremos algunos conceptos importantes en probabilidad.

Pgina 100 de 177


Modelo Matemtico: Desde la perspectiva de probabilidad, un modelo es una expresin matemtica,
usada para estudiar los resultados de un experimento, donde se busca establecer la probabilidad de ocurrencia
de un evento, utilizando el modelo propuesto.

Experimento: Son fenmenos en los cuales se pueden tomar datos y donde un resultado en particular, NO
se puede saber de antemano. Los experimentos que nos ocupan en este curso, son los llamados aleatorios.
Fenmenos como sacar una carta de una baraja, elegir un estudiante segn alguna caracterstica definida,
medir la cantidad de lluvia en un lugar y tiempo determinado, otros muchos.

Evento: Tambin llamado suceso, se considera el resultado o resultados de un experimento, los cuales
pueden ser simples o compuestos. Por lo anterior, un evento es un subconjunto del espacio muestral.
a-) Evento Simple: Cuando el resultado es uno solo. Tal es el caso de sacar un 2 al lanzar un dado, obtener
cara al lanzar una moneda, obtener un rey al sacar un carta de una baraja. A todo evento de este tipo se le
llama, eventos elementales.
b-) Eventos Compuestos: Son todos aquellos que estn conformados por eventos elementales, los cuales se
obtienen utilizando operaciones entre conjuntos. Ejemplos de este tipo: Obtener nmero par al lanzar un dado,
obtener un dos al sacar una carta de una baraja.

Espacio Muestral: (E) Se considera al conjunto de todos los posibles resultados de un experimento
aleatorio. Es precisamente el conocer todos los posibles resultados, lo que hace a un fenmeno aleatorio. Los
espacios muestrales se pueden determinar utilizando el conocido Diagrama de rbol o las tcnicas de conteo,
cuando el nmero de eventos son muy grandes.

Ejemplo No 1:

En el experimento de lanzar un dado: E = (1, 2, 3, 4, 5, 6)


En el experimento de lanzar una moneda: E = (cara. Sello)
En el experimento sacar una carta de la baraja: E = (4 ases, bastos, espadas, )
En el experimento de sacar una bola de una caja: E = (nmero de bolas que esta en la caja)

Leccin 15: Principios matemticos aplicados a fenmenos


aleatorios: Operaciones entre conjuntos y propiedades.
Por la importancia que tienen las operaciones entre conjuntos en el anlisis de probabilidad, es pertinente
hacer un repaso de los mismos.

Conjunto: Se define como una coleccin de elementos, que desde la teora de probabilidad se le conoce como
observaciones. Si el nmero de elementos es finito, el conjunto ser finito, pero si el nmero de elementos es
infinito y tiene relacin biunvoca con los nmeros naturales, se le conoce como conjunto infinito numerable.
Los conjuntos se denominan con letras maysculas y los elementos con letras minsculas.

Ejemplo No 2:

A = {a, b, c, d, e} Finito.
B = {1, 2, 3,...} Infinito numerable.

Contenencia: Un conjunto puede tener subconjuntos, que se relacionar por medio de la contenencia. Sea el
conjunto U y sea el conjunto S, se dice que S es subconjunto de U, si cada elemento de S, pertenece a U,
luego: lo que significa que S esta contenido en U.

Pgina 101 de 177


Segn la grfica:
Todo conjunto S es subconjunto de si mismo.

Igualdad de Conjuntos: Sean los conjuntos S1 y S2, si cada elemento de S1 pertenece a S2 y viceversa,
entonces se dice que S1 = S2. Por consiguiente: y

Conjunto Vacio: Cuando un conjunto no tiene elementos, se dice que es vacio. S = {}. Para todo conjunto
universal. El conjunto vacio es subconjunto de todos los conjuntos y en particular de si mismo.

Operaciones entre Conjuntos: Para los intereses de la teora de probabilidad, analizaremos las operaciones
de unin, interseccin y complemento.

UNION: Sean S1, S2,, Sn, una serie de conjuntos, entonces la unin de stos es otro conjunto compuesto por
los elementos comunes y no comunes de todos.
( ) Para i = 1, 2, 3,..., n
E es un conjunto cuando aparece S1, S2,, Sn.
Consecuencia de esto:
1.
2. Cuando
3.

INTERSECCIN: Sean S1, S2,, Sn, una serie de conjuntos, entonces la interseccin de stos es otro conjunto
compuesto por los elementos comunes de todos los conjuntos.
( ) Para i = 1, 2, 3,..., n
I es un conjunto cuando aparece simultneamente S1, y S2,, y Sn.
Consecuencia de lo anterior:
1.
2. Cuando
3.

DIFERENCIA: Dados los conjuntos A y B, entonces


Esto significa la diferencia son los elementos que estn en A y no estn en B.

COMPLEMENTO: Sean S y U dos conjuntos tales que Entonces S es el complemento de S, si y solo


si, Se debe aclarar que Siendo U el conjunto universal. Consecuencia de esto:
1.
2.

Propiedades de las Operaciones: Veamos las siguientes propiedades cuando se operan conjuntos.
Conmutativa:

Pgina 102 de 177


Asociativa: ( ) ( )
Distributiva: ( ) ( ) ( )
( ) ( ) ( )
Complemento: ( )
( ) y ( )

Propiedades aplicadas a la teora de probabilidad.


( ) [ ( ) ( ) ( )]
( ) ( ) ( )
( ) ( ) ( )
( ) ( ) ( )
( ) ( ) ( )

Leccin 16: Definicin de probabilidad: Clsica, frecuentista y


Axiomtica.

La probabilidad se ha definido desde tres enfoques: El csico, el frecuentista y el axiomtico.

Enfoque Clsicas de Probabilidad: En la segunda mitad del siglo XVII se hacen los primeros intentos para
medir la probabilidad de un evento, entre los pioneros se tienen a Pascal, Fermat, Huygens, Bernoulli, Leibniz
entre otros. Pero la definicin formal se le debe al gran matemtico Laplace.

Definicin: Pierre Simon Laplace, en 1.812 define la probabilidad como el cociente entre el nmero de eventos
favorables y el nmero de eventos totales, siempre que todos aquellos tangan la misma probabilidad de
ocurrencia.

( ) n = Casos favorables, N = Casos totales y

La caracterstica fundamental de esta teora, es que todos los eventos del espacio muestral E, tiene la misma
probabilidad.

Ejemplo No 3:

Al lanzar un dado, cual es la probabilidad de obtener el 4.

Solucin:
El espacio muestral S = (1, 2, 3, 4, 5, 6)
La probabilidad de ocurrencia es igual para todos loe elementos del espacio muestral: 1/6
P(X=4) = 1/6

Propiedades:
A partir del enfoque clsico se origina tres propiedades fundamentales de probabilidad.

1. ( ) Como la probabilidad es un cociente entre dos nmeros positivos, donde el numerador puede ser
cero o positivo, entonces NO puede haber probabilidades negativas.

2. ( ) El nmero de eventos favorables no puede ser mayor al nmero de eventos totales; a lo sumo
igual, por tal razn lo mximo del cociente ser uno.

3. ( ) La probabilidad de un evento est acotada entre cero y uno.

Pgina 103 de 177


Limitaciones: En le enfoque clsico, los fenmenos que estn bajo esta connotacin, son ideales, como el caso
del dado, la moneda, las cartas y otros, ya que no existe dados ideales, tampoco monedas ideales, tales como
su simetra, propiedades fsicas y forma perfecta, igual para el caso de las cartas. As el enfoque clsico esta
delimitado al mundo matemtico, ya que slo admite objetos ideales. En la misma lnea, ste enfoque asume
eventos totales finitos, lo que limita su aplicabilidad.

Enfoque Frecuentista de Probabilidad: El principio frecuentista o Regularidad Estadstica fue establecida


formalmente por Von Mises en 1.919, cuyo fundamento est soportado en dos principios:
Primer Principio: La experiencia de la regularidad en las frecuencias relativas, se le conoce como Regularidad
Estadstica, cuyo fundamento es que a pesar de la irregularidad de los resultados individuales, los resultados
promedios en largas sucesiones de experimentos aleatorios, muestra una sorprendente regularidad. Esto
significa que en las repeticiones a largo plazo, se observa una regularidad en el fenmeno.
Segundo Principio: En la teora estadstica, la probabilidad es objetiva, lo que indica que la probabilidad tiene
propiedades como que es determinable y es medible.

Desde esta teora, se requiere realizar el experimento, por lo cual se le ha llamado tambin Probabilidad
Emprica. Con estos principios, se define el enfoque frecuentista, en dos partes.

Definicin No 1: La frecuencia absoluta de un evento en el desarrollo de un experimento aleatorio; cuando


ste se repite N veces en forma independiente, es la cantidad n de apariciones del evento. As la frecuencia
relativa, es el cociente entre la frecuencia relativa y el nmero de ensayos.
Definicin No 2: La probabilidad desde le punto de vista frecuentista, esta definida como el lmite; cuando el
nmero de repeticiones se hace infinita, del cociente entre la frecuencia absoluta y el nmero de ensayos.
( ) ( )

Limitaciones: La teora frecuentista tambin tiene ciertas limitaciones. En primera instancia, el concepto de
lmite utilizado en la definicin, supone que el nmero total de eventos del experimento denotado con N alcance
el infinito, caso que en la realidad no ocurre, con esto la estabilidad de las frecuencias es un enunciado
imposible, desde la demostracin matemtica. Por otro lado, el uso de sucesin infinita en eventos aleatorios
no es suficiente, ya que matemticamente los trminos de las sucesiones siguen una ley inexorable; es decir, a
partir del trmino general todos los trminos quedan definidos claramente.

Enfoque Axiomtico de Probabilidad: Las limitaciones de los enfoques clsicos y frecuentista, condujeron a
buscar una teora de probabilidad ms amplia y soportada en principios matemticos slidos y verificables
lgicamente. Fue as como en 1.933 Kolmogorov plante su teora de probabilidad desde la axiomtica.

Para analizar el enfoque axiomtico de Kolmogorov, se debe analizar dos situaciones previas, que permitir
comprender mejor dicho enfoque.

1. Limitaciones del Enfoque Axiomtico: El planteamiento axiomtico de Kolmogorov presenta la limitacin


de no ofrecer un mtodo prctico de obtencin de probabilidad de eventos aleatorios en el mundo real, para
eliminar dicha limitacin Kolmogorov estableci una conexin del modelo matemtico con el mundo real, para
lo cual utiliz la base emprica de la teora frecuentista. l considero que si un experimento aleatorio se repite
gran cantidad de veces, la frecuencia relativa de un evento difiera ligeramente de la probabilidad del evento.
En trminos de FISZ: La axiomtica del clculo de probabilidades formaliza ciertas regularidades de las
frecuencias relativas del ocurrimiento de un evento aleatorio, regularidad que se observa a travs de una larga
serie de ensayos, realizados bajo condiciones constantes.

2. Algebra de Sucesos: Existen muchos experimentos cuyos nmeros de eventos planteados es superior a
los eventos elementales que se definen en el espacio muestral. Los eventos compuestos se definen a partir de
los eventos elementales, por medio de operaciones entre conjuntos como la unin, interseccin y

Pgina 104 de 177


complemento. El conjunto obtenido presenta una estructura de lgebra. El lgebra incluye el evento
imposible y el evento cierto.

Ejemplo No 4:

Sea el espacio muestral definido como: E = {a, b, n}. Hallar el lgebra generada.

Solucin:

lgebra: = {{}, {a}, {b}, {n}, {a, b}, {a, n}, {b, n}, {a, b, n}}
En la solucin obtenida se observa el evento imposible y el evento cierto.

DEFINICIN:
Sea E el espacio muestral integrado por los eventos elementales, sea A una coleccin de subconjuntos de E;
llamados eventos aleatorios, entonces:

1. El espacio muestral E debe pertenecer a A:


2. Si un suceso B pertenece a A, entonces su complemento tambin pertenece a A. Consecuencia de esto E
tambin cumple la condicin; es decir, el conjunto vacio.
Entonces B Entonces
3. Sean S1 y S2, subconjuntos de A, entonces la unin pertenece a A y por las leyes de De Morgan, la
interseccin tambin pertenece a A.
y

lgebra de Boole: Toda coleccin que cumpla las tres condiciones anteriores (1, 2, 3) se le llama lgebra de
Boole, dado para un nmero finito de eventos.

lgebra: Si se tiene una serie de Eventos Infinitos, pero numerables, S1, S2, , Sn que pertenecen a E,
entonces:

A la coleccin se le conoce como sigma algebra (-lgebra) representada por , la cual rene todos los
posibles eventos del experimento aleatorio.
Al par (S, ) se le conoce como Espacio Probabilizable o medible.

Ejemplo No 5:

Sea E = {1, 2, 3}. Hallar el -lgebra completa generada.

Solucin:

= ({}, {1}, {2}, {3}, {1, 2}, {1, 3}, {2, 3}, {1, 2, 3}).

En la solucin se observa los eventos elementales y los compuestos.

Con los precedentes, ya se puede plantear el enfoque axiomtico.

Teora Axiomtica de Kolmogorov:

Esta teora se soporta en tres axiomas.


Axioma No 1: Si E es un elemento de una -lgebra (), existe un nmero P(E) 0. Llamado probabilidad del
evento E.

Pgina 105 de 177


Axioma No 2: Si E es el espacio muestral de un experimento aleatorio, entonces P(E) = 1.

Axioma No 3: Sean los eventos numerables S1, S2,, Sn los cuales son disyuntos dos a dos.
Entonces:
( ) ( ) A la tripleta (S, , P) se le llama Espacio de Probabilidad.

Ejemplo No 6:

Sea E = {1, 2, 3}. Asumiendo que P(X=1) =3/12, P(X=2) = 4/12, P(X=3) = 5/12. Hallar y P.

Solucin:
Utilicemos el siguiente esquema que nos ayuda a comprender el problema.

E P

{} 0

1 {1} 3/12
2
{2} 4/12
1
{3} 5/12

{1, 2} 7/12
2
{1, 3} 8/12
3
{2, 3} 9/12

{1, 2, 3} 1

Ejemplo No 7:

Realizar las siguientes operaciones


a-)
b-)
c-)
d-)
e-)
f-) ( )

Solucin:
a-)
b-)
c-)
d-)
e-)
f-) ( )

Pgina 106 de 177


CAPITULO 5: TCNICAS DE CONTEO
Leccin 17: Principio fundamental del conteo
Regla de la Suma: La regla de la suma se utiliza cuando un evento se puede hacer de m n formas
diferentes; adems, NO es posible que ocurra el mismo evento de dos maneras distintas y al mismo tiempo.

Definicin: Sea A un evento que se puede hacer de n1 formas, sea B un evento que se puede hacer de n 2
formas, donde NO es posible que ocurra el mismo evento de dos maneras diferentes al mismo tiempo, por
consiguiente el nmero de veces que se puede realizar el evento esta dado por la siguiente expresin:
o
N Maneras Diferentes = n1+ n2

Este tipo de eventos son mutuamente excluyentes.

Ejemplo No 27:

Un ciudadano debe pagar el recibo del agua, para hacerlo puede utilizar 4 bancos, 3 agencias de pago y 2
oficinas privadas. Cuntas opciones para pagar tiene el ciudadano?

Solucin:
No Formas Diferentes = 4 + 3 + 2 = 9 opciones para pagar.

Ejemplo No 28:

Una persona que esta predispuesta a ver televisin un domingo a las 3 p. m. observa la programacin, para lo
cual puede ver 4 partidos de ftbol, 3 pelculas de accin y 2 programas culturales. Cuantas posibilidades
tiene la persona para ver televisin?

Solucin:
No Formas Diferentes = 4 + 3 + 2 = 9 opciones para pagar.

Ejemplo No 29:

En una compaa se desea codificar los Lokers de los empleados, para signar a cada uno su respectivo Loker.
El gerente decide utilizar los nmeros dgitos y las letras del alfabeto Cuantos cdigos se pueden crear, si
ste puede ser dgito, letra o combinacin de los dos, no importa que primero sea letra o nmero?

Solucin:
Nmero de dgitos = 10
Nmero de letras = 26

Pgina 107 de 177


Nmero o Letra = 10 + 26
Combinacin = 26*10 10*26
Cantidad de Cdigos = 10 + 26 + (26*10) + (10*26) = 556 opciones.

Ejemplo No 30:

Jorge Leonardo debe matricular el prximo semestre un curso de Matemticas o un curso de Idiomas en el
mismo horario; de Matemticas cuatro profesores que orientan el curso y de Idiomas hay tres profesores;
adems, debe matricular Estadstica; con tres profesores disponibles y tica con dos profesores disponibles.
De cuantas formas se puede organizar el horario de clase Jorge Leonardo?

Solucin:
Para Matemticas = 4
Para Idiomas = 3
Estadstica y tica = 3*2
Cantidad de formas para organizar el horario = 4 + 3 + (2*3) = 13 opciones.

Ejemplo No 31:

Un Restaurante tiene como plato principal pescado, pero se debe preparar de una sola forma de las siguientes:
Cuatro formas de hacerlo frito, tres formas de hacerlo sudado y dos formas de hacerlo horneado Cuantas
formas tiene el restaurante de preparar el pescado?

Solucin:
Frito = 4
Sudado = 3
Horneado = 2
Cantidad de formas para prepararlo = 4 + 3 + 2 = 9 opciones.

La Regla del Exponente: Se tiene un tipo de combinaciones o arreglos ordenados, en donde se admite
reemplazo.

Definicin: Sea un conjunto con N elementos, se desea obtener un subconjunto de n elementos, de tal
manera que cualquier elemento se puede reemplazar, entonces el nmero de subconjuntos de n elementos
posibles ser:
n
No Arreglos = N

Los casos ms conocidos son el lanzamiento de una moneda y de un dado.

Ejemplo No 38:

En el lanzamiento de una moneda Cuntos casos posibles se obtiene en los siguientes procesos:
a- Tres lanzamientos
b- Cinco lanzamientos

Solucin:
3
a- Para tres lanzamientos: N = 2 y n = 3, entonces: 2 = 8 casos posibles.
5
b- Para cinco lanzamientos: N = 2 y n = 5, entonces: 2 = 32 casos posibles.

Ejemplo No 39:

En el lanzamiento de un dado Cuntos casos posibles se obtiene en los siguientes procesos:


c- Dos lanzamientos

Pgina 108 de 177


d- Cuatro lanzamientos

Solucin:
2
c- Para dos lanzamientos: N = 6 y n = 2, entonces: 6 = 36 casos posibles.
4
d- Para cinco lanzamientos: N = 6 y n = 4, entonces: 6 = 1.296 casos posibles.

Ejemplo No 40:

Una ruleta consta de los colores blanco, rojo, azul y amarillo Cuntos casos posibles se obtiene en los
siguientes intentos:
e- Tres intentos
f- Cinco intentos

Solucin:
3
e- Para tres intentos: N = 4 y n = 3, entonces: 4 = 64 casos posibles.
5
f- Para cinco intentos: N = 4 y n = 5, entonces: 4 = 1.024 casos posibles.

Leccin 18: Regla de la multiplicacin


La regla de la multiplicacin se aplica en situaciones en donde se tienen varios grupos diferentes de eventos y
se desea obtener uno agrupado.

Definicin: Sea A un evento que se puede hacer de n 1 formas, sea B un evento que se puede hacer de n2
formas y sea C evento que se puede hacer de n3 formas, el nmero de veces que se puede hacer
simultneamente A, B y C est dado por la siguiente expresin:
o
N Acciones Conjuntas = n1*n2*n3

Ejemplo No 32:

Un Artista tiene 4 vestidos y 3 pares de zapatos, De cuantas formas se puede vestir el Artista?

Solucin:
Sea A = 4 vestidos y B = 3 pares de zapatos. Entonces:
o
N Formas de Vestir = 4*3 = 12 formas diferentes.

Ejemplo No 33:

En un concesionario hay autos de dos y cuatro puertas, de rines de lujo y niquelados; adems, hay de color
rojo, azul y plateado. Cuntas formas diferentes de exhibicin tiene el concesionario?

Solucin:
Sea A = Nmero de puestas, B = Tipo de rines y C = Color del auto. Entonces:
o
N Formas de exhibicin = 2 * 2 * 3 = 12 formas diferentes de exhibicin.

Ejemplo No 34:

Pgina 109 de 177


Un experimento consiste en lanzar un dado y luego seleccionar aleatoriamente una letra del alfabeto.
Cuntas observaciones habr en el espacio muestral?

Solucin:
Sea A = Elementos del dado: 6 y B = Letras del alfabeto: 26. Entonces:
Elementos del espacio muestral = 6*26 = 156 elementos diferentes
Si se expresa por extensin el espacio muestral: E = [(1,a),(1,b),(1,c),,(6,y),(6,z)]

Ejemplo No 35:

En un plan turstico, a los turistas se les ofrece seis recorridos por da, el plan es de cuatro das y hay doce
sitios diferentes para visitar. De cuantas formas diferentes puede un turista disfrutar el paseo?

Solucin:
Sea A = Nmero de recorridos, B = Nmero de das y C = Nmero de sitios a visitar.
o
N Formas de disfrutar el paseo = 6 * 4 * 12 = 288 formas diferentes de disfrutar el paseo.

Ejemplo No 36:

Un billete de lotera consta de 4 cifras de nmeros, los cuales se pueden repetir y una serie que corresponde a
una letra. Cuantos billetes de lotera se pueden imprimir?

Solucin:
CIFRA 1 CIFRA 2 CIFRA 3 CIFRA 4 SERIE
10 10 10 10 26

10*10*10*10*26 = 260.000 Billetes

Ejemplo No 37:

Las placas de un carro constan de 3 letras y tres nmeros, las cuales se pueden utilizar ms de una vez.
Cuantas placas se pueden emitir?

Solucin:
LETRA 1 LETRA 2 LETRA 3 NMERO 1 NMERO 2 NMERO 3
26 26 26 10 10 10

26*26*26**10*10*10 = 17576.000 Placas.

Leccin 19: Permutaciones y variaciones

Las Permutaciones: Las permutaciones se pueden utilizar para encontrar el nmero de arreglos posibles en
un solo conjunto de objetos. Por medio de las permutaciones se puede determinar los resultados posibles en
forma Ordenada o arreglada de maneras diferentes.

Definicin: Si se tiene n objetos diferentes y se desean ordenar, entonces para el primer puesto se tienen n
posibilidades, para el siguiente puesto (n 1) posibilidades, para el ltimo puesto se tiene slo una posibilidad,
luego: El Nmero de permutaciones de n objetos diferentes sin repeticin es dela forma: Pn = n!

Por definicin 0! = 1.

Pgina 110 de 177


Ejemplo No 41:

En un equipo de baloncesto de cinco jugadores De cuantas formas se puede alinear el equipo para un
partido?

Solucin:
Como se requiere alinear el equipo, es pertinente el orden de los jugadores dentro de la cancha.
PRIMER PUESTO SEGUNDO PUESTO TERCER CUARTO PUESTO QUINTO PUESTO
PUESTO
5 4 3 2 1

Por la definicin: 5! = 120 formas de alinear el equipo.

Ejemplo No 42:

A una fiesta asisten 4 hombres y 4 mujeres, si todos balan Cuantas parejas diferentes se pueden formar?

Solucin:
n = 4 parejas. 4! = 24 parejas diferentes.

Ejemplo No 43:

En la primera fila de un cine hay 9 sillas De cuantas formas se pueden ordenar 9 personas en la primera silla?

Solucin:
Se requiere ordenar las personas en la fila.
F1 F2 F3 F4 F5 F6 F7 F8 F9
9 8 7 6 5 4 3 2 1

Por definicin: 9! =362.880 formas de ordenar las personas en la primera fila del cine.

Ejemplo No 44:

Un estuche tiene 7 casillas y se deben colocar 7 discos en el estuche. De cuantas formas se pueden ordenar
los discos en el estuche?

Solucin:
C1 C2 C3 C4 C5 C6 C7
7 6 5 4 3 2 1
Segn la definicin: 7! = 5.040 formas de ordenar los discos en el estuche.

Las Variaciones: Existen permutaciones donde del total de elementos, slo se utiliza parte de ellos.

Definicin: Si se tiene n objetos diferentes y se desean ordenar r de ellos, de tal forma que r < n, entonces
para determinar la cantidad de ordenamientos se aplica la siguiente ecuacin:
( )

Ejemplo No 45:

Las placas de los carros constan de tres letras y tres nmeros, de tal manera que no se puede repetir nmero
tampoco letra. Cuantas placas diferentes se pueden disear?

Pgina 111 de 177


Solucin:
LETRA 1 LETRA 2 LETRA 3 NMERO 1 NMERO 2 NMERO 3
26 25 24 10 9 8

26*25*24*10*9*8 = 11232.000

Utilizando la ecuacin: ( )

( )

Cantidad de placas = 15.600*720 = 11232.000

Ejemplo No 46:

De un conjunto de 7 elementos, se desea organizar subconjuntos de 4 elementos. Cuantos grupos se pueden


obtener?

Solucin:
PRIMER ELEMENTO SEGUNDO ELEMENTO TERCER ELEMENTO CUARTO ELEMENTO
7 6 5 4
Cantidad de grupos a organizar: 7*6*5*4 = 840

Utilizando la ecuacin: ( )

Ejemplo No 47:

Si en un Club hay 20 personas y se desea escoger 4 de ellos para el comit directivo De cuantas formas se
puede conformar el comit?

Solucin:
En el problema n = 20 y r = 4 entonces:
( )
Formas diferentes para conformar el comit.

Ejemplo No 48:

Con los nmeros dgitos, utilizndolos una sola vez Cuantas cifras de cuatro nmeros se pueden formar?

Solucin:
( )
Cifras diferentes

Permutaciones Con elementos Que Se Repiten: Cuando en el conjunto de elementos hay algunos que se
repiten, entonces se presentan permutaciones con elementos que se repiten.

Definicin: El nmero de observaciones de n objetos, de los cuales n 1 se repite a veces, n2 se repite b veces
y as sucesivamente, por lo cual el nmero de arreglos posibles se puede determinar con la siguiente ecuacin:

Ejemplo No 49:

Pgina 112 de 177


De cuantas formas diferentes se puede ordenar la palabra MISSISSIPI?

Solucin:
En el conjunto: n = 11, ni = 4, ns = 4, np = 2 Luego:

Ejemplo No 50:

Un coleccionista tiene tres pinturas de Picasso, cuatro pinturas de Botero y tres pinturas de Rembranth. De
cuantas formas se pueden organizar juntos, las pinturas?

Solucin:
En el conjunto: n = 10, nPicasso = 3, nBotero = 4, nRembranth = 3 Luego:

Con base en lo anterior, podemos resumir:

Las permutaciones se aplican cuando:


- Se tiene en cuenta el orden
- No se admiten repeticiones.

Leccin 20: Combinaciones


Si el inters es determinar la cantidad de formas en que r observaciones son seleccionadas de un conjunto de
n observaciones diferentes. Sin tener en cuenta el Orden de Seleccin, se est hablando de Combinaciones.
Hablar de combinaciones es hacer referencia a subconjuntos.
Si se tiene r! permutaciones de un conjunto de n observaciones, entonces las nPr permutaciones contiene cada
subconjunto r! veces, al dividir nPr entre r! se obtiene la cantidad de formas sin tener en cuenta el orden.

Definicin: Sea n el nmero de objetos de un conjunto dado, si se toman r objetos a la vez, el nmero de
combinaciones obtenidas est dada por la siguiente expresin:

nCr =( ) Para r = 0, 1 2, 3, , n
( )

Ejemplo No 51:

Al lanzar una moneda 6 veces, De cuantas formas se puede obtener:


a) 2 caras
b) 3 sellos

Solucin:
a) n = 6 y r = 2, entonces: 6C2 =( )
( )

b) n = 6 y r = 3, entonces: 6C3 =( )
( )

Ejemplo No 52:

Si hay 10 hombres y 8 mujeres para conformar un comit que debe estar conformado por 4 hombres y 3
mujeres De cuantas formas se puede conformar dicho comit?

Pgina 113 de 177


Solucin:
Para los hombres: 10C4 =( )
( )

Para las mujeres: 8C3 =( )


( )
Nmero de comits posibles: 210*56 = 11.760

Las combinaciones se aplican cuando:


- No se tiene en cuenta el orden
- No se admiten repeticiones

Pgina 114 de 177


CAPITULO 6: PROPIEDADES BSICAS DE LA
PROBABILIDAD
Leccin 21: Interpretaciones de la probabilidad
Con el fin de comprender la teora de probabilidad, es pertinente estudiar algunos teoremas, que soportan el
desarrollo probabilstico.

Teorema No 1: (Evento Imposible) Dado como conjunto vacio, entonces P () = 0. La probabilidad de un


evento imposible es cero.

Demostracin: Sea un evento A, luego Dado que A y son mutuamente excluyentes, entonces
( ) ( ) ( ) ( ) Luego ( ) ( ) ( ) Para que se cumpla la igualdad ( ( ) debe ser
cero.

NOTA: En la prctica la probabilidad que un evento sea cero, no implica que sea imposible, sino ms bien raro,
por el principio de la frecuencia observada, as el recproco del teorema no siempre se cumple.

Teorema No 2: (Evento Cierto) Dado E el espacio muestral, entonces P (E) = 1. La probabilidad del espacio
muestral es la unidad.

Demostracin: Dado E el conjunto total, la ocurrencia es altamente probable, el axioma No 2 del enfoque
axiomtico lo hace evidente.

Teorema No 4 (Sucesos Disyuntos) Sean los eventos S1 y S2, entonces: S1 y S2 son disyuntos si se cumple:
Cuando dos eventos son tal que su interseccin es vacio, se dice que son Mutuamente
Excluyentes.

Demostracin: Sean los conjuntos S1 y S2, donde S1 son elementos exclusivos de S1 y S2 Elementos que
ninguno es de S1, entonces la interseccin ser vacio.

Teorema No 6: (Probabilidad Acotada) A partir del teorema 1 y 2, se puede inferir que la mnima
probabilidad es cero y la mxima uno, entonces: ( )

Teorema No 7: (Probabilidad del Complemento) Sea S un evento y E el espacio muestral, dado que y
Entonces: P(S) + P(S) = 1.

Ejemplo No 9:

Si A y B, son eventos mutuamente excluyentes, adems P(X = A) = 0,37 y P(X = B) = 0,44, Encontrar:
a) P( A)

Pgina 115 de 177


b) P( B)
c) ( )
d) ( )

Solucin:
a-) Como P ( A) + P(A) = 1, entonces: P ( A) = 1 - P(A) = 1 0,37 = 0,63
b-) Como P (B) + P(B) = 1, entonces: P ( B) = 1 - P(B) = 1 0,44 = 0,56
c-) Por la regla general de adicin: ( ) ( ) ( ) ( ) Como los eventos son
mutuamente excluyentes: ( ) Entonces: ( ) ( ) ( )= 0,37 + 0,44 = 0,81.
d-) Se debe calcular: ( ) ( ) ( ) ( ) Reemplazando:
0,81 = 0,37 + 0,44 0, como se cumple la igualdad, entonces ( )

Ejemplo No 10:

A partir del ejemplo No 9, hallar ( )

Solucin:
Utilizando la propiedad: ( ) ( ) ( )
Como ( ) ( ) Entonces:
( ) ( ) ( )

Leccin 22: Axiomas de probabilidad: regla de la adicin

Teorema No 3: (Regla General de Adicin) Dados los eventos cualesquiera S1 y S2, entonces:
( ) ( ) ( ) ( )
La probabilidad de la unin de dos eventos cualquiera, es igual a la suma de probabilidades de los dos
eventos, menos la probabilidad de su interseccin.

Demostracin: El siguiente grfico nos ayuda a hacer la demostracin.

Entonces: ( ) Donde: ( ) ( ) Por lo tanto:


( ) ( ) ( ) As: ( ) ( ) ( ) Restando las dos ecuaciones: ( )
( ) ( ) ( )
Finalmente: ( ) ( ) ( ) ( )

El teorema tres, prolongado a tres eventos: Dados los eventos cualquiera A, B y C, entonces (
) ( ) ( ) ( ) ( ) ( ) ( ) ( ) La probabilidad de la unin de tres
eventos, es igual a la suma de las probabilidades de cada uno, menos la interseccin de los pares, ms la
probabilidad de la interseccin de todos.

Demostracin: Partimos de ( ) aplicamos el mismo principio del teorema No 3.

Pgina 116 de 177


Teorema No 5: (Regla Especial de Adicin) Sean los eventos S1 y S2, los cuales son disyuntos, entonces
( ) ( ) ( )
En general: ( ) ( )

Demostracin: Buscar los argumentos para realizar la demostracin.

Ejemplo No 7:

Una Empresa realiza un estudio sobre sus ejecutivos, el uso de corbata y determin que su uso es del 42%, el
uso de vestido del 70% y del uso de los dos es del 35%. Al seleccionar aleatoriamente un ejecutivo de la
empresa Cul es la probabilidad de que ste use vestido, corbata o los dos?

Solucin:
Segn los datos: P(X = C) = 0,42; P(X = B) = 0,70 y P(X = C y X = B) = 0,35. Por la forma del problema se
puede aplicar la regla general de adicin.
P(C o B) = 0,42 + 0,70 0,35 = 0,77

Ejemplo No 8:

Un dado es tal que: P(X = 1) = 0,1; P(X = 2) = 0,2; P(X = 3) = 0,3; P(X = 4) = 0,01; P(X = 5) = 0,02; P(X = 6)
= 0,37. Al lanzar el dado una vez Cul es la probabilidad de obtener par?

Solucin:
La pregunta es hallar P(X = Par); adems, se trata de eventos donde se puede aplicar la regla especial de
adicin. Luego: P(X = 2 o X = 4 o X = 6) = P(X = 2) + P(X = 4) + P(X = 6) Por consiguiente: P(X = Par) = 0,2 +
0,01 + 0,37 = 0,48

Ejemplo No 11:

En una caja se encuentran 20 papeletas blancas enumeradas del 1 al 20, 10 papeletas rojas enumeradas del 1
al 10, 40 papeletas amarillas enumeradas del 1 al 40 y 10 papeletas azules enumeradas del 1 al 10. Las

Pgina 117 de 177


papeletas se mezclas de tal manera que cada una tiene la misma probabilidad de ser elegida. Al sacar una
papeleta, hallar:

a-) Que sea azul o blanca.


b-) Que este enumerada de 1 al 5.
c-) Que sea roja o amarilla y enumerada con 1, 2, 3, 4.
d-) Que este enumerada con los nmeros 5, 15, 25, 35.

Solucin:

a-) Como se tienen 10 papeletas azules y 20 papeletas blancas. Siendo el total de 80 papeletas, entonces se
puede aplicar la regla especial de adicin:
( ) ( ) ( ) ( )
b-) Se tienen 4 tipos de papeletas y cada una tiene los nmeros 1, 2, 3, 4, 5. Tambin corresponde a la regla
especial de adicin.
( ) ( ) ( ) ( ) ( ) ( )
( ) ( ) ( ) ( ) ( )

c-) Se tienen 10 papeletas rojas y 40 papeletas amarillas; adems, estn enumeradas con 1, 2, 3, 4. Al igual
que los casos anteriores, se trata de regla especial de adicin.
( ) ( ) ( ) ( )
d-) De las papeletas se tienen enumeradas: 5, 15, 25, 35 tenemos: De 20 blancas hay 5 y 15. De 10 rojas hay
5. De 40 amarillas hay 5, 15, 25, 35. De 10 azules hay 5. As se tienen 4 papeletas del nmero 5, 2 papeletas
del nmero 15, una con el nmero 25 y una con le nmero 35. Las posibilidades son: 4 +2 +1+ 1 = 8.
( )

Ejemplo No 12:

El manejo de una mquina nueva para empaque de producto lquido, tiene las siguientes probabilidades.
Muy difcil: 0,12 Difcil: 0,17 Promedio: 0,43 Fcil: 0,29 Muy fcil: 0,08
Encontrar las siguientes probabilidades:
a-) Difcil o muy difcil.
b-) Ni muy difcil ni muy fcil.
c-) Promedio o mejor.

Solucin:

a-) ( ) ( ) ( )

b -) ( ) ( )
( ) ( )

c- ) ( ) ( )
( )

Leccin 23: Independencia de Sucesos, regla de multiplicacin


A partir de la independencia de eventos y la probabilidad condicional, surge una regla muy importante de
probabilidad, conocida como la Regla de la Multiplicacin para eventos dependientes.

Pgina 118 de 177


DEFINICIN:
Sean A y B dos eventos cualquiera de un espacio muestral E y sea P(A) > 0, entonces:
( ) ( ) ( )
La ecuacin expresa que la probabilidad de que ocurra A y B simultneamente, siendo P(A) > 0, es igual al
producto de la probabilidad de que ocurra A y la probabilidad de que ocurra B dado que ha ocurrido A; es decir,
la probabilidad condicional.

DEFINICIN:
Sean A y B dos eventos cualquieras de un espacio muestral E y sea P(A) > 0, entonces:
( ) ( ) ( )
La ecuacin expresa que la probabilidad de que ocurra A y B simultneamente, siendo P(B) > 0, es igual al
producto de la probabilidad de que ocurra B y la probabilidad de que ocurra A dado que ha ocurrido B; es decir,
la probabilidad condicional.

Generalizando:

DEFINICIN:
Sean S1, S2,, Sn eventos cualquieras de un espacio muestral E, entonces:

( ) ( ) ( ) ( ) ( )

Ejemplo No 17:

En una caja hay 30 artculos, de los cuales 8 son defectuosos. Si se extraen 4 artculos aleatoriamente y en
forma sucesiva y sin reemplazamiento. Cul es la probabilidad de que los 4 artculos son defectuosos?

Solucin:
P(S1) = 4/30. Sacar defectuosos el primer artculo.
P(S2 S1) = 3/29. Sacar defectuosos el segundo artculo.
P(S3 S1 S2)=2/28. Sacar defectuosos el tercer artculo.
P(S4 S1 S2 ) = 4/30*3/29*2/28*1/27 = 24/657.720 = 0,00003645

Ejemplo No 18:

Un empaque de 1.000 artculos es tal que presenta el 1% de defectuosos. Cual es la probabilidad de que al
sacar aleatoriamente 5 artculos, todos sean no defectuosos.

Solucin:
Sea X1 artculo uno defectuoso, entonces X1 artculo no defectuoso
P(X1) = 10/1.000 Entonces: P(X1) = 990/1.000
P(X2) = 9/999 Entonces: P(X2) = 989/999
P(X3) = 8/998 Entonces: P(X3) = 988/998
P(X4) = 7/997 Entonces: P(X4) = 987/997
P(X5) = 6/996 Entonces: P(X5) = 986/996

Luego:
P(X1)* P(X2)* P(X3)* P(X4)* P(X5) = 990/1.000*989/999*988/998*987/997*986/996 = 0,9509

Regla de Multiplicacin: Eventos Independientes

En el anlisis de independencia de eventos, se estableci que los eventos son independientes cuando se
realiza extraccin Con Reemplazamiento, donde el espacio muestral es constante para cada extraccin.

Pgina 119 de 177


DEFINICIN:
Sean A y B dos eventos se dice que son independientes, si se cumple la siguiente igualdad:
( ) ( ) ( )
La ecuacin expresa que la probabilidad de la interseccin entre dos eventos, es igual al producto de las
probabilidades marginales. La definicin se puede extender a tres o ms eventos, stos pueden ser
independientes por pares; sin ser independientes. Para el caso de tres eventos.
( ) ( ) ( ) ( )

DEFINICIN:
Sean A y B dos eventos independientes, entonces A y B tambin son independientes, por consiguiente:
( ) ( ) ( )

Ejemplo No 19:

Se lanza una moneda tres veces, Cul ser a probabilidad de obtener tres caras en los lanzamientos
realizados?

Solucin:
Sea A primer lanzamiento y que sea cara: P(X = A) = 1/2
Sea B segundo lanzamiento y que sea cara: P(X = B) = 1/2
Sea C tercer lanzamiento y que sea cara: P(X = C) = 1/2
( ) ( ) ( ) ( )

Ejemplo No 20:

La probabilidad de comprar Taxi es del 25% y la probabilidad de comprar colectivo es del 65%, si se compra un
transporte para trabajar Cul es la probabilidad de comprar Taxi y Colectivo?

Solucin:
Sea P(X = T) = 0,25 y Sea P(X = C) = 0,65, entonces:
( ) ( ) ( )

Leccin 24: Probabilidad condicional


En fenmenos donde se hacer extracciones sin reemplazamiento, se presenta dependencia de eventos a partir
del segundo en adelante. La siguiente situacin nos ilustra el principio de probabilidad condicional.

Sea A evento que una persona gane el mnimo. Sea B una persona que sea bachiller. Sea N una persona que
no es bachiller. Sea T una persona que sea tcnico profesional. Entonces interpretemos las siguientes
situaciones.

P(A B) = La probabilidad de que una persona gane el mnimo, dado que es bachiller.
P(A N) = La probabilidad de que una persona gane el mnimo dado que no sea bachiller.
P(A T) = La probabilidad de que una persona gane el mnimo dado que es tcnico profesional.
P(N A) = La probabilidad de que una persona no sea bachiller, dado que gana el mnimo.

Para estos casos los primeros trminos se les llama Condicionantes tales como A y N, mientras que a los
segundos se les llama condicionados, tales como B, N, T y A.

Pgina 120 de 177


DEFINICIN:

Sean los eventos A y B, de tal manera que A est condicionado por el evento B, si la probabilidad de que
suceda A depende de que haya ocurrido B, entonces:
( )
( ) Siempre que P(B) > 0.
( )

Anlogamente: Sean los eventos A y B, de tal manera que B est condicionado por el evento A, si la
probabilidad de que suceda B depende de que haya ocurrido A, entonces:
( )
( ) Siempre que P(A) > 0.
( )

Ejemplo No 14:

Al lanzar un dado, cual es la probabilidad de que caiga dos, dado que ha cado par.

Solucin:
La probabilidad de que caiga par es P(X=Par) = 3/6
La probabilidad de que caiga dos es P(X=Dos) = 1/6
( )

Ejemplo No 15:

En un estudio sobre consumidores de servicios que brindan cierta compaa, los resultados se presentan en el
siguiente cuadro.
A = Compaas con buen servicio
B = Compaas con mal servicio.
1 = Compaas con 10 aos o ms
2 = Compaas con menos de 10 aos

A B
1 18 6 24
2 12 16 28
30 22 52

a-) Cual es la probabilidad de seleccionar una compaa que proporcione buen servicio.
b-) Cual es la probabilidad de seleccionar una compaa con ms de 10 aos de experiencia que proporcione
buen servicio.
c-) Cual es la probabilidad de seleccionar una compaa con menos de 10 aos, que proporcione mal servicio.

Solucin:
a-) Compaa con buen servicio: 30
( )

b-) Compaa con ms de 10 aos: 24


Compaas que proporcionan buen servicio y con ms de 10 aos: 18
( )
( )
( )
c-) Compaa que con menos de 10 aos y que proporcione mal servicio: 16
Compaa que proporciona mal servicio: 22.
( )
( )
( )

Pgina 121 de 177


Pgina 122 de 177
Ejemplo No 16:

En un saln de apuestas hay un Dado arreglado de tal forma que el nmero Impar tiene el doble de posibilidad
de salir que el nmero Par. Si se lanza el dado:
a-) Cual es la probabilidad de caiga un nmero mayor a tres.
b-) Cual es la probabilidad de el nmero de puntos tirados sean un cuadrado perfecto.
c-) Cual es la probabilidad de que se obtenga un cuadrado perfecto, dado que es mayor a tres.

Solucin:
Espacio muestral: = {1, 2, 3, 4, 5, 6}
a-) Si a es probabilidad de par entonces 2a probabilidad de impar, entonces: 2a+a+2a+a+2a+a=1
as: 9a = 1, a = 1/9, por consiguiente:
P(X > 3) = P(X=4) + P(X=5) + P(X=6) = 1/9 + 2/9 + 1/9 = 4/9

b-) Los nmeros que son cuadrados perfectos son 1 y 4, entonces: B {1, 4}
P(B) = P(1) + P(4) = 2/9 + 1/9 = 3/9 = 1/3.

c-) P(B A). Donde B = Cuadrado perfecto y A = Nmero mayor a tres.


( )

Leccin 25: Probabilidad total y teorema de Bayes


Ley de Probabilidad Total: Sean A1, A2, ,Ak eventos mutuamente excluyentes, ( ) y exhaustivos
(deben ocurrir uno de ellos) entonces para cualquier otro evento B:
P(B) = P(B A1)*P(A1)+ P(B A2)*P(A2)++ P(B Ak)*P(Ak)
Generalizando: ( ) ( ) ( )

Ejemplo No 21:

Se desea rentar Autos de tres agencias de la siguiente manera: El 60% de la agencia Velox, el 30% de la
agencia Rap y el 10% de la agencia Service. Los autos de la agencia Velox requieren revisin en un 9%, los de
la agencia Rap en un 20% y los de la agencia Service en un 6%. Cul es la probabilidad de que un auto
rentado requiera revisin?

Solucin:
Sea A el evento que un auto requiera revisin, sean V, R y S los eventos que los autos provengan de las
agencias Velox, Rap y Service respectivamente.
Entonces: P(V) = 0,60; P(R) = 0,30; P(S) = 0,10
Por otro lado: P(A V) = 0,09; P(A R) = 0,20; P(A S) = 0,06
La probabilidad total se obtiene as: P(A) = P(A V)*P(V)+ P(A R)*P(R)+ P(A S)*P(S)
Reemplazando: P(A) = 0,60*0,09 + 0,30*0,20 + 0,10*0,06 = 0,054 + 0,06 + 0,006 = 0,116
Entonces el 11,6% de los autos requieren revisin.

Ejemplo No 22:

En un estudio sobre cierta enfermedad, se ha determinado que la probabilidad de que una persona tenga la
enfermedad es del 3%. Se ha diseado una prueba diagnstico para determinar si una persona sometida a la
misma tiene la enfermedad. La probabilidad de que la prueba diagnstica de resultado positivo; sabiendo que
la enfermedad est presente es de 0,90. La probabilidad de que la prueba diagnstica de resultado positivo;
sabiendo que la enfermedad no est presente es de 0,02. Si se le aplica la prueba a una persona, cual es la
probabilidad de que la prueba sea positiva?

Pgina 123 de 177


Solucin:
Sea E el evento prueba positiva, sean T y N los eventos tiene la enfermedad y no tiene la enfermedad
respectivamente.
Entonces: P (T) = 0,03; P (N) = 0,97
Por otro lado: P(E T) = 0,90; P(E N) = 0,02
La probabilidad total se obtiene as: P(E) = P(E T)*P(T)+ P(E N)*P(N)
Reemplazando: P(E) = 0,90*0,03 + 0,02*0,97 =0,0464
Entonces la probabilidad de que una persona sometida a la prueba de diagnstico positivo es del 4,64%.

Ejemplo No 23:

Una compaa de seguros clasifica a sus clientes en dos grupos: Los que son propensos a accidentes (P) y lo
que no son propensos a accidentes (N). Segn las estadsticas de la compaa, la probabilidad de que un
cliente propenso a accidentes tenga uno en un ao es de 40% y la probabilidad de que un cliente no propenso
a accidentes tenga uno en un ao es del 20%. Sabiendo que el 30% de la poblacin es propensa a accidentes,
Cul es la probabilidad de que una persona que compra una pliza sufra un accidente en un ao?

Solucin:
Sea A el evento sufrir un accidente, sean P y N los eventos propensos a accidentes y no propensos
respectivamente.
Entonces: P(P) = 0,4 y P(N) = 0,2
Por otro lado: P(A P) = 0,30; P(A N) = 0,70. As: P(A) = P(A P)*P(P) + P(A N)*P(N)
Reemplazando: P(A) = 0,30*0,4 + 0,70*0,2 = 0,26
Entonces la probabilidad de que una persona que compra la pliza sufra un accidente es del 26%.

Teorema de Bayes: Analizada a ley de probabilidad total, ya se puede definir la muy conocida teorema de
bayes:

Sean B1, B2, , Bk. una particin del espacio muestral E, dado que
P(Bi) 0, para i = 1, 2, , k; entonces para cualquier evento A en el
espacio muestral E; tal que P(A) 0, se tiene:

( ) ( )
( ) Para j = 1, 2, .., k

( ) (| )

Ejemplo No 24:

Utilizando los datos del ejemplo 21, si un auto es rentado y requiere revisin, Cul es la probabilidad de que
sea de la agencia Rap?

Solucin:

Se debe hallar P(R A). Entonces P(A R)*P(R) = 0,30*0,20 = 0,06


Como P(A) = 0,60*0,09 + 0,30*0,20 + 0,10*0,06 = 0,054 + 0,06 + 0,006 = 0,116
( ) ( | )
( | )
( ) ( | )

As el 51,72% de los autos que requieren revisin, provienen de la agencia Rap.

Pgina 124 de 177


Ejemplo No 25:

Utilizando los datos del ejemplo 22, si la prueba diagnstica dio resultado positivo Cul es la probabilidad de
que la enfermedad este en realidad?

Solucin:

Se debe hallar P(T E). Entonces P(E T)*P(T) = 0,90*0,03 = 0,027


Como P(E) = 0,90*0,03 + 0,02*0,97 =0,0464
( ) ( | )
( | )
( ) ( | )

Entonces la probabilidad de que la enfermedad est en realidad es del 58,19%, dado que ha ocurrido resultado
positivo.

Ejemplo No 26:

Un investigador esta 60% de seguro que la persona detenida es culpable, ste tiene cierta caracterstica que la
posee el 20% de la poblacin. En estas condiciones Qu tan seguro est el investigador sobre la culpabilidad
de la persona detenida?

Solucin:

Sea C el evento que la persona es culpable. Sea M el evento que la persona tiene la caracterstica.
P (C) = Probabilidad de que la persona sea culpable. 60%
P (M) = Probabilidad de que la persona tenga la caracterstica.
P (C) = Probabilidad de que la persona no sea culpable. 40%
P (M) = Probabilidad de que la persona no tenga la caracterstica
P (M C) = Probabilidad de que la persona tenga la caracterstica dado que es culpable. 100%
P (M C) = Probabilidad de que la persona tenga la caracterstica dado que no es culpable. 20%

Se debe hallar: P (C M)
P (M C)*P(C) = 1*0,6 = 0,6
P (M) = P (M C)*P(C) + P (M C)*P(C) = 1*0,6 + 0,2*0,4 = 0,68
Entonces:
( ) ( | )
( | )
( ) ( | ) ( ) ( | )

Entonces el investigador esta en un 88,24% seguro de la culpabilidad de la persona detenida.

Pgina 125 de 177


UNIDAD TRES
VARIABLES ALEATORIAS
Y DISTRIBUCIONES DE
PROBABILIDAD

Pgina 126 de 177


CAPITULO 7: VARIABLES ALEATORIAS
Leccin 26: Concepto intuitivo y matemtico de variable
aleatoria
VARIABLE ALEATORIA
Concepto Intuitivo: Una variable aleatoria X es aleatoria si el valor que asume de acuerdo al resultado de un
experimento, es una probabilidad de un evento aleatorio, es decir; transforma eventos aleatorios en nmeros
reales.

Las variables aleatorias se clasificar en dos grandes grupos:


Variables Cualitativas: Son aquellos que generan datos cualitativos, como es el caso de las variables
dicotmicas, tales como Blanco-Negro, Masculino-Femenino, Cara-Sello. Las variables nominales, tales como
Raza, Genero, Programa Acadmico, Canal Favorito, Color. Las variables ordinales, tales como Estrato, Talla,
Sabor, cuerpo de una sustancia, Nivel Acadmico.
Variables Cuantitativas: Son las que generan datos cuantitativos, las cuales se subdividen en discretas y
continuas.
-Variable Aleatoria Discreta: Son las que se pueden contar y organizar en una secuencia utilizando los
nmeros enteros positivos, slo se sume un nmero finito de valores.
Ejemplos: Nmero de personas que visitan un almacn en un da, nmero de llamadas telefnicas recibidas en
un call center por hora, cantidad de carros vendidos por mes, edad aos cumplidos,
-Variable Aleatoria Continua: Son las que toman valores dentro de un intervalo, se dice que estn dentro de
los nmeros reales.
Ejemplos: El ancho de un edificio, el tiempo transcurrido en un desplazamiento, el peso medido a una persona,
el salario de una poblacin, la duracin de un bombilla, la estatura de una persona, la temperatura.
Concepto Matemtico: Sea S un espacio muestral sobre el cual se encuentra definida una probabilidad, sea X
una funcin de valor real definida sobre S. Entonces X es una variable aleatoria debido a que transforma los
resultados de S en puntos sobre la recta real.

Se dice que X es aleatorio ya que involucra la probabilidad de los resultados del espacio muestral.
Ejemplo No 53:

Pgina 127 de 177


Experimento: Lanzar una moneda.
Solucin:
S = {C, S}
P(X = C) = 1 y P(X=S) = 0
Ejemplo No 54:
Experimento: Lanzar un dado.
Solucin:
S = {1, 2, 3, 4, 5, 6}
P(X = 1) = 1/6, P(X = 2) = 1/6, P(X = 5) = 1/6 P(X = 7) = 0
Una variable aleatoria queda definida en un experimento aleatorio, cuando se conoce su campo de variacin y
el conjunto de probabilidades en donde toma valores dicho campo.

Leccin 27: Distribucin discreta de probabilidad.


VARIABLE ALEATORIA DISCRETA:

Funcin de Probabilidad o Distribucin de Probabilidad: Una variable aleatoria X representa los resultados de
un espacio muestral de tal forma que P(X =x), esto significa que debe existir una funcin matemtica que
asigna una probabilidad a cada realizacin x de la variable aleatoria, a esta funcin se le llama Funcin de
Probabilidad o Distribucin de Probabilidad.
DEFINICIN: Sea X una variable aleatoria discreta, entonces f(x) = P(X = x) se le conoce como funcin de
probabilidad de la variable aleatoria X. El par ordenado obtenido se de la forma [x, f(x)]. La funcin debe
satisfacer las siguientes condiciones:
1. P(x) 0 Para todo x que pertenece a X
2. ( )
3. P(X = x) = f(x)
Funcin de Distribucin Acumulada: La funcin de distribucin acumulada F(x) representa la suma de
probabilidades puntuales hasta el valor x inclusive.
DEFINICIN: La funcin de distribucin acumulada de una variable aleatoria X, es la probabilidad de que X sea
menor o igual a un valor especfico x; segn:
( ) ( ) ( )

Caractersticas de F(x):
a-) La funcin F(x) de una variable aleatoria discreta, es una funcin no negativa, por ser una probabilidad.
b-) La funcin F(x) es no decreciente, por ser acumulativa.
c-) La funcin F(x) es acotada; es decir, 0 F(x) 1. Para todo x.
d-) ( ) ( ) Para
e-) ( ) ( ) ( )
f-) ( ) ( ) ( ) ( ) ( )
g-) ( ) ( ) ( ) ( ) ( )

Ejemplo No 55:
Sea el experimento: Lanzar dos dados simultneamente, identificar el espacio muestral, los valores de x y la
probabilidad asociada a cada valor de x. La premisa es la suma de las caras obtenidas.

Solucin:
2
Espacio muestral: S = 6 = 36 resultados posibles. Utilizando la regla de exponente.

Pgina 128 de 177


RESULTADOS X=x P( X = x )
(1, 1) 2 1/36
(1, 2); (2, 1) 3 2/36
(1, 3); (3, 1); (2, 2) 4 3/36
(1, 4); (4, 1); (2, 3); (3, 2) 5 4/36
(1, 5); (5, 1); (3, 3); (4, 2); (2, 4) 6 5/36
(1, 6); (6, 1); (4,3); (3, 4); (5, 2); (2, 5) 7 6/36
(2, 6); (6, 2); (3, 5); (5, 3); (4, 4) 8 5/36
(3, 6); (6, 3); (4, 5); (5, 4) 9 4/36
(4, 6); (6,4); (5, 5) 10 3/36
(5, 6); (6,5) 11 2/36
(6, 6) 12 1/36

Ejemplo No 56:
A partir del ejemplo 55, referente al lanzamiento de los dos dados. Hallar F(x=4).

Solucin:
Por la funcin de distribucin acumulada
( ) ( ) ( )

( ) ( ) ( ) ( ) ( )
( )
Ejemplo No 57:
A partir del ejemplo 55, referente al lanzamiento de los dos dados. Cul ser el valor de probabilidad para
P(X > 4)

Solucin:
Por la funcin de distribucin acumulada.
( ) ( ) ( )
Ejemplo No 58:
A partir del ejemplo 55, referente al lanzamiento de los dos dados. Cul ser el valor de probabilidad para
P(X =3) y ( )

Solucin:
Por la funcin de distribucin acumulada.
( ) ( ) ( ) ( ) ( )

( ) ( ) ( ) ( ) ( )

Ejemplo No 59:
Un dado est arreglado de tal forma que cada nmero impar tiene el doble de probabilidad de ocurrencia que el
nmero par. Sea G el evento que el nmero que cae es mayor a tres.
Hallar P(X =G )?

Solucin:
El espacio muestral: S = {1, 2, 3, 4, 5, 6}. Sea u = Nmero par, entonces 2u = Nmero impar. Entonces segn
los valores del espacio muestral: 2u + u +2u + u + 2u + u = 1. 9u = 1, as u = 1/9
Como G = 4, 5, 6 entonces: u + 2u + u = 1/9 + 2/9 + 1/9 = 4/9, por consiguiente: P(X =G ) = 4/9

Pgina 129 de 177


Ejemplo No 60:
Cul ser la expresin que describe la distribucin de probabilidad para la variable aleatoria X = Nmero
total de caras al lanzar una moneda 4 veces?

Solucin:
4
El espacio muestral = 2 = 16. Segn la regla del exponente.
P(X = 0) =1/16, P(X = 1) = 4/16, P(X = 2) = 6/16, P(X = 3) =4/16, P(X = 4) = 1/16.
Haciendo el anlisis:
Para X = 0. Tenemos: ( )

Para X = 1. Tenemos: ( )
Generalizando:
( )
Para X = x = ( ) ( ) Para x = 0, 1, 2, 3, 4.
Ejemplo No 61:
Mostrar que ( ) para x = 1, 2, 3, 4, 5. Es una funcin de distribucin de probabilidad de la variable
aleatoria discreta X.

Solucin:
Se debe mostrar primero que f(x) 0, lo cual se cumple para los valores de la variable aleatoria.
Seguido debemos mostrar que ( ) . Entonces:
( ) ( ) ( ) ( ) ( ) ( )

Como se puede ver f(x) cumple las dos condiciones, as queda mostrado que f(x) es funcin de distribucin de
probabilidad.

Ejemplo No 62:
En un casino se tiene un dado cargado para jugar, segn la siguiente tabla.
1 2 3 4 5 6

( 0,1 0,1 0,2 0,4 0,15 0,05

Hallar la funcin de distribucin acumulada y hacer la grafica de P(X = x) y F(x).

Solucin:
Funcin de distribucin acumulada.
1 2 3 4 5 6

( 0,1 0,2 0,4 0,8 0,95 1,0

La grafica de P(X = x)

Pgina 130 de 177


La grafica de F(x)

Leccin 28: Distribucin contina de probabilidad.


VARIABLE ALEATORIA CONTNUA:
Funcin de Probabilidad o Funcin de Densidad de Probabilidad: La distribucin de probabilidad de una
variable aleatoria continua X tiene funcin de densidad de probabilidad f(x), la cual representa la probabilidad
de que a X b.

DEFINICIN: Sea f(x) una funcin considerada funcin de densidad de probabilidad, si cumple las siguientes
condiciones.

1. f(x) 0 Para - < x <


2. ( )
3. ( ) ( )

La grfica que representa la funcin de densidad de probabilidad, es el rea bajo la curva, cuyo valor total es
uno. La probabilidad en un intervalo a X b ser el rea acotada por la funcin de densidad y las rectas x = a
y x = b.

La curva normal se desarrolla alrededor de la media, donde con una desviacin estndar se abarca el 68,3%
de la informacin, con dos desviaciones estndar se abarca el 95,5% de la informacin y con tres desviaciones
estndar se abarca el 99,7% de la informacin.

Pgina 131 de 177


Funcin de Distribucin Acumulada: La funcin de distribucin acumulada F(x) es el rea acotada por la
funcin de densidad que va desde - < x < , la curva de F(x) es lisa y no decreciente.

DEFINICIN: La funcin F(x) se considera funcin de distribucin acumulada para la variable aleatoria X si
cumple:
( ) ( ) ( ) Donde t = Variable de transicin

Caractersticas de F(x):
a-) F (-) = 0
b-) F () = 1
c-) ( ) ( ) ( ) ) Para - < x <
d-) P( a< X < b ) = F( b ) F( a )
e-) La derivada de la funcin de distribucin acumulada es la funcin de densidad.
( )
( )

Ejemplo No 63:
El estudio de intervalo de llegada a un Banco es una variable aleatoria, cuya funcin de densidad es:
( ) *
Determinar:
a-) El valor de k
b-) La funcin de distribucin acumulada
c-) La probabilidad de que x 8
d-) La probabilidad de que 2 < X < 6

Solucin:
a-) Por definicin: Entonces: Evaluando ( )|
k = 1/2
b-) Como ( ) ( ) ( ) Donde: ( )
Para x > 0
c-) ( ) ( )
Entonces el 98,17% es la probabilidad de que transcurra 8 minutos entre dos visitas
consecutivas en el Banco.
d-) ( ) ( ) ( ) ( ) ( ) ( ) ( )
As: ( )

Pgina 132 de 177


Ejemplo No 64:
Dada la funcin de distribucin acumulada ( ) Para x > 3 y 0 En otros casos.
Hallar:
a-) La funcin de densidad
b-) P ( X 5 )
c-) P( X > 8 )

Solucin:
( )
a-) Por definicin f(x) se obtiene derivando F(x). ( ) As: ( )
b-) ( ) ( )
( )

c-) ( ) ( ) ( ) ( ) As: ( )

Leccin 29: Esperanza matemtica y varianza de variables


aleatorias
ESPERANZA MATEMTICA

El concepto de Esperanza Matemtica o Valor Esperado fue motivado por los juegos de azar, siendo Jacob
Bernoulli en 1.713 utilizo la esperanza para indicar cual sera la situacin de un jugador que deseaba ganar
en un juego. Bernoulli, analiz la siguiente situacin: Si la ganancia por juego (g) se multiplica por el
porcentaje de veces que se gana P(g) y se le resta la prdida(p) multiplicada por el porcentaje de veces que
ocurre prdida P(p), se obtiene el valor esperado del juego:

E(Juego) = g*P(g) + p*P(p)

Posteriormente Von Mises le dio carcter estadstico al concepto de esperanza, aplicada a variables
aleatorias que dieron alternativas de ganar o perder, llegando a la expresin:

( ) ( )

Donde: xi son los valores de las alternativas y p (xi) la probabilidad de las alternativas.
-) Por la regularidad estadstica, el valor lmite de la frecuencia relativa de cada posibilidad se da como:
( )

-) La media se define como:

Por lo anterior, la esperanza matemtica E(X) se considera como el valor medio de la distribucin terica de
probabilidad del fenmeno estudiado. Dicho de otra manera, es el valor hacia donde tiende la media aritmtica,
cuando el nmero de observaciones es muy grande; es decir, es el lugar hacia donde se centra la distribucin
de probabilidad.

Pgina 133 de 177


Caso Discreto: (Una Variable)
DEFINICIN: Sea X una variable aleatoria discreta y sea f(x) el valor de la distribucin de probabilidad en
X, entonces el valor esperado de la variable aleatoria est dada por la siguiente expresin:

( ) ( )

Ejemplo No 78:
Una variable aleatoria X puede tomar los valores: 1, 2, 3, 4. Las probabilidades de cada caso
son: 0.20, 0.25, 0.30, 0.25 respectivamente. Hallar la esperanza matemtica.

Solucin:
Por definicin ( ) ( )

Caso Continuo: (Una Variable)


DEFINICIN: Sea X una variable aleatoria continua y sea f(x) el valor de la densidad de probabilidad en
X, entonces el valor esperado de la variable aleatoria est dada por la siguiente expresin:
( ) ( )

Ejemplo No 79:
4
Sea la variable aleatoria continua X, cuya funcin de densidad f(x) = 5x para 0 X 1. Hallar E(X)

Solucin:
Por definicin ( ) ( ) ( ) ( )
E(X) = 5/6

Ejemplo No 80:
3
Sea la variable aleatoria continua X, cuya funcin de densidad f(x) = 4x para 0 X 1. Hallar E(X)

Solucin:
Por definicin ( ) ( ) ( ) ( )
E(X) = 4/5

La esperanza matemtica no siempre existe, para el caso discreto, E(X) existe si la serie infinita que tenga, sea
convergente. Para el caso continuo, cuando la integral es impropia, la esperanza existe si la integral es
convergente.

Propiedades del Valor Esperado:

1.) La esperanza matemtica de una constante, es igual a la constante: E(k) = k

2.) La esperanza matemtica de la suma de algebraica de variables aleatorias, es igual a la suma algebraica
de las esperanzas matemticas de cada una de las variables aleatorias.
E(X1 X2 Xn) = E(X1) E(X2) E(Xn)

Pgina 134 de 177


3.) La esperanza matemtica del producto algebraico de variables aleatorias, es igual al producto
algebraico de las esperanzas matemticas de cada una de las variables aleatorias, si y solo si, son
estadsticamente independientes. E(X1 * X2 **Xn) = E(X1) * E(X2) * * E(Xn)

4.) La esperanza matemtica de las desviaciones de los valores de la variable aleatoria, respecto a la media
es cero. E(X ) = 0 Luego: E(X) =

Lo anterior deja ver que la esperanza matemtica es un parmetro o caracterstica de la tendencia central de
la distribucin.

5.) Si la variable aleatoria X se le suma una constante, la esperanza matemtica de la variable queda
modificada en la constante; es decir; un cambio del origen en la variable aleatoria, afecta su esperanza
matemtica. E(X + k) = E(X) + K

6.) Si una variable aleatoria X se le multiplica por una constante, su esperanza matemtica tambin queda
multiplicada por la constante. Un cambio en la escala de la variable aleatoria, afecta su esperanza
matemtica. E(k*X) = kE(X) Para k = Constante

7.) La esperanza matemtica de una transformacin lineal de una variable aleatoria, ser la transformacin
lineal de la esperanza matemtica de la variable aleatoria. E(a + bX) = a + bE(X).

Ejemplo No 81:
En un pedido de 12 computadores se incluyen 2 de marca DELL, si se seleccionan 3 aparatos aleatoriamente
para hacer un despacho. Cuntos aparatos de marca DELL pueden ser despachados?

Solucin:
El planteamiento: x computadores de marca DELL y 3 x computadores de otras marcas. El total de aparatos
a seleccionar es: ( ) Computadores marca DELL ( ) Computadores de otras marcas ( )
La funcin de probabilidad cuya variable aleatoria X son los computadores de marca DELL despachados ser:
( )( )
( ) Para x = 0, 1, 2
( )
Entonces:
X 0 1 2
f(x) 6/11 9/22 1/22

Con estos datos se calcula E(X). Como la variable aleatoria es discreta, entonces:
E(X) = 0*6/11 + 1*9/22 + 2*1/22 = 1/2. El promedio de envos repetidos es 1/2.

Ejemplo No 82:
2
Sea la variable aleatoria X con funcin de densidad f(x) = 1/3 x Para -1 < X < 2

Solucin:
A partir de la definicin y por las propiedades de la esperanza matemtica.
E(g(X)) = E(4X + 3) = 4E(X) + 3
( ( )) ( ) ( ( ))

( ( )) ( )

Pgina 135 de 177


VARIANZA DE UNA VARIABLE ALEATORIA

Se sabe que la media o valor esperado describe el lugar donde se centra la distribucin de probabilidad, pero
no ofrece una descripcin adecuada de la forma de la distribucin. Es pertinente y necesario caracterizar la
variabilidad de dicha distribucin. La medida de variabilidad ms importante en estadstica es la varianza de la
variable aleatoria o de la distribucin de probabilidad.

Caso Discreto:

DEFINICIN: Sea X una variable aleatoria discreta, con distribucin de probabilidad f(x) y media , entonces la
varianza de X est dada por la siguiente expresin:
( ) [( ) ] ( ) ( )

Donde (x - ) se conoce como la desviacin de las observaciones respecto a la media. Esta al ser evaluada al
cuadrado y luego promediadas, sern menores para valores de x muy cercanas a .
Una forma alternativa para la varianza es:
( ) ( )

Ejemplo No 86:
Sea la variable aleatoria X que representa las funciones de distribucin A y B.
x 0 1 2 3 4
A f(x) 0.3 0.4 0.3
B f(x) 0.2 0.1 0.3 0.3 0.1

a-) Hallar la varianza de X en el caso A


b-) Hallar la varianza de X en el caso B
c-) Cual de las dos distribuciones tiene menor varianza

Solucin:
a-) Primero se calcula E(X) = = 1*0.3 + 2*0.4 + 3*0.3 = 2.0

( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )

( )

b-) E(X) = = 0*0.2 + 1*0.1 + 2*0.3+3*0.3+4*0.1 = 0+0.1+0.6+0.9+0.40 = 2.0

( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )
( )

c-) La varianza del caso B es mayor que la varianza del caso A, as la varianza del caso A es menor, lo que
indica que la funcin de distribucin de la variable A es ms estable que la B.

Caso Continuo:

DEFINICIN: Sea X una variable aleatoria continua, con funcin de densidad de de probabilidad f(x) y media ,
entonces la varianza de X est definida como sigue a continuacin:
( ) [( ) ] ( ) ( )

Ejemplo No 87:

La demanda mensual de un producto est dada por la variable aleatoria X, cuya funcin de densidad se define
como:

Pgina 136 de 177


( ) ( )
{

Hallar la varianza de X.

Solucin:
Por de definicin ( ) [( ) ] ( ) ( ) As que debemos hallar primero la media.

( ) [ ( )] ( ) ( ) ( )

( ) ( ) ( ) Ahora si podemos hallar la varianza.

( ) ( ) ( ) ( )

( ) ( )

Desarrollando el mismo ejercicio, utilizando la forma alternativa de la varianza.


( ) ( )
Primero: ( ) ( ) ( ) ( )
( ) [ ] ( ) ( )
Segundo: ( ) ( )

Propiedades de la Varianza:

1. La varianza es siempre no negativa, Como ( ) entonces: ( ) Cuando la varianza es


cero, los fenmenos se conocen como distribuciones degenerativas o causales.

2. La varianza de una constante es cero. ( ) Para K = Constante

3. La varianza de la suma de dos variables aleatorias, es igual a la suma algebraica de las varianzas de dichas
variables aleatorias mas dos veces su covarianza. ( ) ( ) ( ) ( )

4. Si a una variable aleatoria se le suma o resta una constante, la varianza no cambia.


( ) ( ) ( ) ( )

5. Si a una variable aleatoria se le multiplica por una constante, la varianza se modifica, tal que la constante
queda al cuadrado y multiplicada por la varianza de la variable aleatoria. ( ) ( )

6. El error cuadrado medio (ECM) es la dispersin de la variable aleatoria entorno a un origen K, dicho error
se hace mnimo cuando coinciden con la varianza. ( ) ( ) ( )

Pgina 137 de 177


Leccin 30: Teorema de Chbyshev
La varianza de una variable aleatoria nos muestra el grado de agrupamiento que tienen los datos alrededor de
la media, as la probabilidad de que una variable aleatoria tome un valor dentro de cierto intervalo alrededor de
la media, ser mayor si tiene una varianza menor que otra variable aleatoria que tenga mayor varianza.
2
En trminos de rea, una variable aleatoria con V(X) = grande, presentar mayor rea y muy lejana de la
2
media . Por el contrario una variable aleatoria con V(X) = pequea, nos dir que la mayor parte del rea
est alrededor de la media .

El matemtico ruso P L Chebyshev (1.821 1.894) descubri descubri que la fraccin de rea entre dos
valores simtricos cualquiera alrededor de , est relacionado con la desviacin estndar. EL siguiente
teorema nos da una estimacin de la probabilidad de que una variable aleatoria tome un valor entre K
desviaciones estndar de la media , para cualquier valor de K.

TEOREMA: Sean y la media y desviacin estndar de una variable aleatoria X, entonces para cualquier
constante K, la probabilidad de que X asuma al menos un valor dentro de K desviaciones estndar de la
2
media, est dado por 1 1/K . Entonces:
( )

El teorema de Chebyshev nos ofrece un lmite inferior de probabilidad, pero no se puede saber el valor real de
probabilidad. Como se ver en el siguiente ejemplo, la probabilidad de que la variable aleatoria est entre dos
desviaciones estndar, no puede ser menor a 3/4

Ejemplo No 88:

Cul ser la probabilidad de que la variable aleatoria X, asuma al menos un valor dentro de 2 desviaciones
estndar?

Solucin:
Como K = 2, Luego: ( )
Entonces: ( )

Pgina 138 de 177


Ejemplo No 89:

Una variable aleatoria X tiene una media de 12 y varianza 16, la distribucin de probabilidad es desconocida,
hallar P (4 < X < 20)

Solucin:
Por el teorema de Chebyshev: ( )
Como 12 4K = 4, entonces: K = 2, de igual manera: 12 + 4K = 20, K = 2. Por consiguiente:
( ( ) ( )) As: P (4 < X < 20)

Ejemplo No 90:
2
Una variable aleatoria X tiene una media = 8 y varianza = 9, hallar P ( X - 8 6)

Solucin:
Por principios de probabilidad: P ( X - 8 6) = 1 - P ( X - 8 < 6) Ahora:
P ( X - 8 < 6) = P (-6 < X < 6) = P(-6+8 < X < 6+8) = P(2 < X < 14).
Por Chebyshev: ( ( ) ( ))
Como: 8 3K = 2 y 8 + 3K = 14, entonces: K = 2.
Luego: P (2 < X < 14) 3/4. Entonces: 1 - P ( X - 8 < 6) = 1 3/4 = 1/4.
Finalmente: P ( X - 8 6) 1/4

Ejemplo No 91:
2
Una variable aleatoria Y tiene una media = 10 y varianza = 4, hallar P ( Y - 10 < 3)

Solucin:
P ( Y - 10 < 3) = P (-3 < Y - 10 < 3) = P (-3 + 10 < Y < 3 + 10) = P (7 < Y < 13) .
Por Chebyshev: ( ) Pero: 10 2K = 7, as: K = 3/2.
2
Luego: P (7 < Y < 13) 1-1/(3/4) = 5/9 Entonces: 1 - P (7 < Y < 13) 5/9

Pgina 139 de 177


CAPTULO 8: DISTRIBUCIONES DE PROBABILIDAD
DISCRETA
Leccin 31: Distribucin uniforme discreta
La distribucin uniforme discreta es la ms sencilla de las distribuciones de probabilidad, los valores que toma
la variable aleatoria tienen igual probabilidad.

DEFINICIN: Una variable aleatoria X tiene una distribucin uniforme discreta y se conoce como variable
aleatoria uniforme discreta, si y solo si, su distribucin de probabilidad est dada por:
( ) Para x = x1, x2, ... , xK y xi xj para i j.

Segn la expresin, los valores de x1, x2, ... , xK toman la misma probabilidad.

Propiedades:

Media: De otra manera:


Varianza: De otra manera: ( )

Ejemplo No 92:

En el lanzamiento de un Dado normal, cual es la probabilidad de ocurrencia de los eventos, corresponde a


una distribucin uniforme?

Solucin:
Espacio muestral: S = {1, 2, 3, 4, 5, 6}
P(X = xK) = 1/6. f(x, 6) = 1/6 Para x = 1, 2, 3, 4, 5, 6
Como la probabilidad es constante en todo el espacio muestral, evidentemente la distribucin es uniforme
discreta.

Pgina 140 de 177


Ejemplo No 93:

En una caja hay USB de 1, 2, 3, 4, 6 GB,


a-) Cul es la distribucin de probabilidad?
b-) Cual es la probabilidad de seleccionar una USB de 3GB?

Solucin:
Espacio muestral: S = {1, 2, 3, 4, 6}
P(X = xK) = 1/5. f(x,5) = 1/5 Para x = 1, 2, 3, 4, 6.
Como la probabilidad es constante en todo el espacio muestral, evidentemente la distribucin es uniforme
discreta.

Leccin 32: Distribucin Binomial y Poisson

DISTRIBUCIN BINOMIAL.
La distribucin Binomial es una de las distribuciones ms utilizadas, dentro de las distribuciones discretas. Se
dice que la Binomial, es una generalizacin de la distribucin Bernoulli, ya que la Bernoulli ocurre para un
ensayo y la Binomial ocurre para n ensayos. La distribucin Binomial se caracteriza porque tiene dos posibles
resultados: xito y Fracaso. Si p(x) es la probabilidad de xito, q(x) = 1 p(x) es la probabilidad de fracaso.

DEFINICIN: Sea X una variable aleatoria que representa el nmero de xitos en n ensayos y sea P la
probabilidad de xito en cualquiera de los ensayos, entonces X tiene distribucin de probabilidad Binomial,
cuya funcin de probabilidad se define de la siguiente manera:

( ) ( ) Para x = 0, 1, 2,, n y n = Entero

Los parmetros de la Binomial son: n y p

Un experimento Binomial tiene las siguientes caractersticas:


1 - ) Tiene n ensayos idnticos
2 - ) Cada ensayo tiene slo dos resultados posibles.
3 - ) Los ensayos son independientes
4 - ) El inters es hallar el nmero de xitos en n ensayos.

Propiedades:

Media: Varianza:

Pgina 141 de 177


Asimetra: Curtosis:

Veamos algunas distribuciones binomiales , para un X dado y una probabilidad definida.

X = 20 y P(X=x) = 0,2 X = 20 y P(X=x) = 0,5

X = 20 y P(X=x) = 0,75 X = 20 y P(X=x) = 0,95

Ejemplo No 94:

En un experimento se realizan 10 ensayos, la probabilidad de xito es 0,1 Hallar P(X = 2)

Solucin:
Segn el problema: n = 10, p = 0.1, q = 0.9
( ) ( )( ) ( ) ( ) ( )
( )

Ejemplo No 95:

En una industria farmacutica se quiere determinar la efectividad de un medicamento, en ensayos preliminares


se ha establecido que de cada 50 pacientes, 40 responden bien al producto. Si se toman 4 pacientes Cul es
la probabilidad de que dos de ellos respondan positivamente al medicamento?

Solucin:
Segn los datos del problema: n = 4, x = 2, p = 4/5 = 0,8

Pgina 142 de 177


Entonces: ( ) ( )( ) ( ) ( ) ( )
La probabilidad de que dos de los pacientes tomados como muestra respondan positivamente al medicamente
es del 15,36%

Ejemplo No 96:

La compaa Q.ac fabrica Benzoato de Sodio como preservante contra hongos. La experiencia muestra que el
producto tiene problemas de efectividad en un 5%. Se realiz un experimento con 25 productos idnticos.

a-) Cul es la probabilidad de que por lo menos 2 de ellos presente problemas de efectividad?
b-) Cul es la cantidad esperada del producto con problemas de efectividad?

Solucin:
a-) Se debe hallar: P(X 2) = 1 P(x 1) Donde: P(X 1) = P(X = 0) + P(X = 1)
( ) ( )( ) ( ) ( ) ( )

( ) ( )( ) ( ) ( ) ( )
( ) As: ( )

b-) Se debe hallar E(X) =


E(X) = = n*p = 25 * 0,05 = 1,25

Ejemplo No 97:

En un estudio sobre la Vitamina C para resfriado, se prob que de cada 10 personas que la consumen, 8
personas no presentan resfriado durante un ao. Si la probabilidad de no presentar resfriado es del 50%
cuando no se consume la vitamina Cul es la probabilidad de observar 8 o ms personas sin resfriado? .Se
asume que la vitamina es ineficaz para aumentar la resistencia al resfriado.

Solucin:
Segn los datos: p = 0.5, q = 0.5, n = 10, x 8.
P(X 8) = P(X = 8) + P(X = 9) + P(X = 10)
( ) ( )( ) ( ) ( ) ( )

( ) ( )( ) ( ) ( ) ( )

( ) ( )( ) ( ) ( ) ( )
( )

Ejemplo No 98:
2
En un estudio sobre la Vitamina C para resfriado, (ejemplo 97) hallar: , , A, K

Solucin:

( )

La distribucin de la efectividad para la vitamina C es simtrica.

Tabla de la Distribucin Binomial:

Para simplificar los clculos, casos donde x toma muchos valores, se ha diseado la tabla de distribucin.

Pgina 143 de 177


Ejemplo No 99:

Hallar, utilizando la tabla:


a-) P(X = 2) Para n = 10 y p = 0,5
b-) P(X = 3) Para n = 10 y p = 0,3
c-) P(X = 2) Para n = 6 y p = 0,4

Solucin:
a-) En la tabla se busca para n = 10 y p = 0,5. Entonces: P(X = 2) = 0,0439
b-) En la tabla se busca para n = 10 y p = 0,3. Entonces: P(X = 3) = 0,2668
c-) En la tabla se busca para n = 6 y p = 0,4. Entonces: P(X = 2) = 0, 3110

Ejemplo No 100:

Hallar, utilizando la tabla


a-) P(X 2) Para n = 6 y p = 0,15
b-) P(X 3) Para n = 8 y p = 0,25

Solucin:
a-) En la tabla se busca para n = 6 y p = 0,15, el valor para x = 0 y para x = 1.
Para P(X 2) = 1 P(X 1) = 1 (0,3771 + 0,3993) = 0,2236

b-) En la tabla se busca para n = 8 y p = 0,25, el valor para x = 0, para x = 1, para x = 2 y para x = 3.
Para P(X 3)=P(X = 0)+ P(X = 1) + P(X = 2) + P(X = 3)=0,1001 + 0,2670 +0,3115 + 0,2076 = 0,8862

La tabla de distribucin Binomial, por lo general va hasta n = 20, as x = 0, 1, 2, 3, , 20

Pgina 144 de 177


DISTRIBUCIN POISSON.
Cuando n es muy grande, el clculo de probabilidades binomiales es muy complicado, casi imposible. Para
superar dicha limitacin, el estadstico francs Simeon Denis Poisson (1.781 1.840), quien en 1.838
desarroll una distribucin de probabilidad discreta, bajo los siguientes argumentos:
Qu forma tiene el lmite de la distribucin Binomial cuando n , p 0, mientras n*p permanece constante.
A n*p lo llam .
La distribucin de probabilidad Poisson de variable discreta, aplica a eventos independientes ocurridos
medidos en el tiempo o espacio, a velocidad constante. Casos como:
-) Nmero de bacterias en un volumen de lquido
-) Nmero de defectos de una mquina en unidad de tiempo.
Las probabilidades individuales son cada vez ms pequeas conforme la variable aleatoria toma valores cada
vez ms grande.

DEFINICIN: Sea X una variable aleatoria, que representa el nmero de eventos aleatorios independientes
que ocurren a rapidez constante sobre el tiempo o espacio, entonces se dice que X tiene distribucin Poisson
con funcin de probabilidad, dada por la siguiente expresin:

( ) Para x = 0, 1, 2, 3, y = n*p = Parmetro

Se define como el promedio de ocurrencia del evento en el tiempo o espacio.

Pgina 145 de 177


Propiedades:

Media: Varianza:
Asimetra: Curtosis:

Ejemplo No 105:

Sea = 2, Hallar P(X=0)

Solucin:
( )

Ejemplo No 106:

Un fabricante de envases plsticos compra a un proveedor el polipropileno, el cual garantiza que de cada 100
Kg, slo 1 Kg, es defectuoso. En un pedido de 1.000 Kg, Cul es la probabilidad de que todo el pedido trabaje
bien?

Solucin:
A partir de los datos del problema: n = 1.000 Kg, p = 1/100 = 0,01
x = 0 Nmero de defectuosos
= n*p = 1.000*0,01 = 10
Entonces: ( )
La probabilidad de que todo el pedido trabaje bien es del 0,004%

Ejemplo No 107:

A partir del ejemplo sobre el fabricante de envases plsticos, ejemplo 106. Cul es la probabilidad que a lo
ms 3 Kg sean defectuosos?

Solucin:
El planteamiento es: ( ) ( ) ( ) ( ) ( )
( ) Ya calculado
( )

( )

( )
Entonces: ( )

Ejemplo No 108:

A partir del ejemplo sobre el fabricante de envases plsticos, ejemplo 106. Hallar la media, varianza, asimetra
y curtosis.

Solucin:

Media: Varianza:
Asimetra: Curtosis:

Pgina 146 de 177


Tabla de la Distribucin Poisson:

Al igual que la distribucin Binomial, la distribucin Poisson tiene una tabla que simplifica los clculos.

Ejemplo No 109:

Para = 2, Hallar P(X = 0) y P(X = 2)

Solucin:
a-) Para P(X = 0) = 0,1353
b-) Para P(X = 2) = 0,2707

Ejemplo No 109:

Para = 1,5 Hallar P(X = 2) y P(X = 5)

Solucin:
a-) Para P(X = 2) = 0,2510
b-) Para P(X = 5) = 0,0141

Pgina 147 de 177


Pgina 148 de 177
Leccin 33: Distribucin Binomial Negativa.

DISTRIBUCIN BINOMIAL NEGATIVA.

Con los principios de distribucin Binomial y sus propiedades, excepto que los ensayos se repiten hasta
obtener un nmero fijo de xitos. Para el caso de la Binomial Negativa el inters est en hallar la probabilidad
de que ocurra el k-eximo xito en el x-eximo ensayo. Experimentos de est tipo se conoce como experimento
Binomial negativo o distribucin de tiempo de espera Binomial o distribuciones de pascal.

Casos de Este Tipo:


-)La probabilidad de que el sexto paciente expuesto a una enfermedad, sea el segundo en adquirirla.
-) La probabilidad de identificar el tercer retraso de llegada al trabajo de los ltimos 30 das.
-) La probabilidad de que el sptimo paciente presente alivio, sea el doceavo paciente que recibe el
medicamento.

As que el k-eximo xito va a ocurrir en el x-eximo ensayo.

DEFINICIN: Sea X una variable aleatoria, se considera Binomial Negativa, si y solo si, su distribucin de
probabilidad esta dada por la siguiente expresin:

( ) ( ) Para x = K, K + 1, K + 2,

En este tipo de distribucin, los ensayos son independientes y repetidos, las repeticiones se hacen hasta
obtener xito.

Propiedades:

Media: De otra forma:

Varianza: ( ) De otra manera:


Ejemplo No 101:

Al lanzar 3 monedas Cul es la probabilidad de obtener slo caras o slo sellos por segunda vez en el quinto
lanzamiento?

Solucin:
Segn los datos del problema: x = 5, K = 2, p = 1/4 (En el primer lanzamiento hay 2 posibilidades y en el
segundo lanzamiento otras dos posibilidades). Entonces:

( ) ( ) ( )( ) ( ) ( )( ) ( )
( )

La probabilidad de obtener solo caras o solo sellos por segunda vez en el quinto lanzamiento, es del 10,55%

Ejemplo No 102:

La probabilidad de que un nio expuesto a una enfermedad, la contenga es del 0,4 Cul es la probabilidad de
que el decimo nio expuesto, sea el tercero en contraerla?

Pgina 149 de 177


Solucin:
Segn los datos del problema: x = 10, K = 3, p = 0,4. Entonces:
( ) ( )( ) ( ) ( )( )

La probabilidad de que el decimo nio expuesto, sea el tercero en contraerla es del 6,43%

Ejemplo No 103:

En el cobro de penaltis un jugador falla en el 5% de veces. Cual es la probabilidad de que falle por segunda
vez al cobrar 15 penaltis?

Solucin:
Segn los datos del problema: x = 15, K = 2, p = 0,05. Entonces:
( ) ( )( ) ( ) ( )( )

La probabilidad de que el jugador falle por segunda vez al cobrar 15 penaltis es del 1,796%

Ejemplo No 104:

Para los ejemplos del nio expuesto a la enfermedad (ejemplo No 102 y No 103) Hallar la media y la varianza.

Solucin:

a-) Media: Varianza: ( )

b-) Media: Varianza: ( )

Leccin 34: Distribucin Geomtrica e Hipergeomtrica.


DISTRIBUCIN GEOMTRICA.
Cuando se analiza la distribucin Binomial Negativa, se observa que K toma valores positivos mayores que uno
(K > 1), pero existen fenmenos donde la Binomial Negativa tiene K = 1; es decir, son casos donde se tienen
una distribucin de probabilidad para el cual nmero de eventos requeridos donde se obtiene Un Solo xito,
como es el caso de lanzar una moneda hasta obtener cara.

DEFINICIN: Sea X una variable aleatoria discreta, se considera variable aleatoria geomtrica, si y solo si, su
distribucin de probabilidad est dada por la siguiente expresin.

( ) Para x = 1, 2, 3, Donde q = 1 p

En esta distribucin de probabilidad, se caracteriza por las siguientes razones:


-El proceso consta de un nmero no definido de pruebas o experimentos separados o separables. El proceso
concluir cuando se obtenga por primera vez el resultado deseado (xito).
-Cada prueba puede dar dos resultados mutuamente excluyentes: A y no A

Pgina 150 de 177


-La probabilidad de obtener un resultado A en cada prueba es p y la de obtener un resultado no A es q, siendo
(p + q = 1).
-Las probabilidades p y q son constantes en todas las pruebas, por tanto, las pruebas, son independientes.
Este es un proceso tpico con reemplazamiento.

Propiedades:

Media:
Varianza:

Ejemplo No 110:

En una ciudad capitalina la probabilidad de que un ciudadano adquiera su licencia de conduccin en un solo
ensayo es del 75% Cul es la probabilidad de que un solicitante obtenga su licencia de conduccin en el
cuarto ensayo?

Solucin:
Los datos: x = 4, p = 0,75 Entonces:
( ) ( ) ( )( ) ( )( )
La probabilidad de que el solicitante obtenga su licencia de conduccin en el cuarto ensayo es del 1,171%

Ejemplo No 111:

En un proceso de fabricacin se ha establecido que de cada 200 artculos, 3 son defectuosos. Cul es la
probabilidad de que el sexto artculo de los inspeccionados sea el primero defectuoso?

Solucin:
Segn el planteamiento: x =6, p = 3/200 = 0,015 Entonces:
( ) ( ) ( )( )
La probabilidad de que el sexto artculo de los inspeccionados sea el primero defectuoso es del 1,39%

Ejemplo No 112:

La probabilidad de que un estudiante apruebe un examen escrito para obtener una certificacin de
competencias es de 0,70. Cul es la probabilidad de que un estudiante apruebe el examen:
a-) En el tercer intento
b-) Antes del cuarto intento

Solucin:
a-) Segn el planteamiento: x =3, p = 0,70 Entonces:
( ) ( ) ( )( )
La probabilidad de que un estudiante apruebe el examen en el tercer intento es de 6,3%

b-) P(X < 4) Entonces: P(X < 4) = P(X = 1) + P(X = 2) + P(X = 3)


( ) ( )( )
( ) ( )( )
( ) ( )( )
( )
La probabilidad de que un estudiante apruebe el examen antes del cuarto intento es de 97,30%

Pgina 151 de 177


DISTRIBUCIN HIPERGEOMTRICA.
En los principios de probabilidad de analiz el muestreo con reemplazamiento y sin reemplazamiento, que
ilustran la regla dela multiplicacin para eventos independientes y dependientes respectivamente. Ahora nos
ocuparemos en buscar una ecuacin anloga a la Distribucin Binomial, pero que sea vlida para el muestreo
sin reemplazamiento, donde los ensayos no son independientes.

Considerando un conjunto de N elementos de los cuales M son considerados como xitos y N M como
fracasos, el inters es hallar la probabilidad de obtener x xitos en n ensayos, de los N elementos del conjunto.

La distribucin hipergeomtrica es til en fenmenos donde el nmero de elementos de la poblacin es


pequeo respecto al tamao de la muestra (n/N 0,05). Entonces la probabilidad de un xito en un ensayo
dado, depende de los resultados de los ensayos anteriores, as la distribucin de x xitos sigue una distribucin
hipergeomtrica.

DEFINICIN: Sea N el nmero total de observaciones de una poblacin finita, de tal manera que K de las
observaciones son de un tipo y N K de las observaciones de otro tipo. Si elegimos una muestra aleatoria de
tamao n, la probabilidad de que la variable aleatoria X sea de un tipo y n K sea de otro tipo, est dada por
la funcin de probabilidad segn la siguiente expresin:

( )( )
( ) Para x = 0, 1, 2, , n. x K; (n x) (N K) y N, n, K Z
+
( )

Los parmetros de esta distribucin son: N, n, K. La hipergeomtrica es my utilizada en Control de Calidad y


aceptacin de muestreo. El tamao de la poblacin es pequea, respecto al tamao de la muestra. La
probabilidad en cada evento cambia.

Propiedades:

( )( ) ( )
Media: ( ) Varianza: ( )
( ) ( )

( )( )( ) ( )( )
Asimetra: ( )(
Curtosis: K ( )( )( )(
( ) ) )

Ejemplo No 113:

Un producto industrial es envasado en lotes de 20 unidades, el plan de muestreo consiste en tomar 5 unidades
de cada lote y rechazar si se observa ms de una unidad defectuosa. Si en un lote hay 4 unidades
defectuosas Cul es la probabilidad de que el lote sea aceptado?

Solucin:
Para que el lote sea aceptado se debe cumplir: P(X 1). Donde: N = 20, n = 5, K = 4. Entonces:
( ) ( ) ( )
( )( ) ( )( )
( )
( ) ( )

( )( ) ( )( )
( )
( ) ( )

Pgina 152 de 177


( ) ( ) ( )
La probabilidad de que el lote sea aceptado, en las condiciones dadas es del 75,12%

Ejemplo No 114:

Hallar las propiedades del producto industrial envasado en lotes de 20 unidades (Ejemplo No 113)

Solucin:
Media: ( ) ( )
( )( )
Varianza:
( )

( )( )( )
Asimetra: ( )(
( ) )
( )( )
Curtosis: K ( )( )( )( )

Ejemplo No 115:
Una poblacin consta de 12 unidades, sea X el nmero de xitos en una muestra de 4 unidades, si de un lote 8
son xitos Cul es la probabilidad de no obtener xito en la muestra?

Solucin:
Del problema: N = 12, n = 4, K = 8. Entonces: P(X = 0)
( )( ) ( )( )
( )
( ) ( )
La probabilidad de no obtener xito en la muestra es del 0,202%

Ejemplo No 116:

Del ejercicio sobre la poblacin que consta de 12 unidades, (Ejemplo No 115).


a-) Cual es la probabilidad de obtener exactamente 2 xitos.
b-) Cual es la probabilidad de que por lo menos 2 sean xito.

Solucin:
Del problema: N = 12, n = 4, K = 8. Entonces:
a-)
( )( ) ( )( )
( )
( ) ( )
La probabilidad de obtener exactamente dos xitos es del 33,94%

b-) P(X 2) = 1 P(X < 2) = 1 {P(X =0) + P(X =1)}


( )( ) ( )( )
( )
( ) ( )

( )( ) ( )( )
( )
( ) ( )

( ) ( )

Pgina 153 de 177


La probabilidad de que por lo menos 2 sean xito, es del 93,334%

CAPTULO 9: DISTRIBUCIONES DE PROBABILIDAD


CONTINUA

Leccin 35: Distribucin uniforme continua


La distribucin uniforme continua es la ms sencilla de estas distribuciones, la variable aleatoria toma el mismo
valor en un intervalo finito. LA Funcin de densidad de probabilidad de la variable aleatoria es uniforme sobre el
intervalo de definicin.

DEFINICIN: Una variable aleatoria X tiene una distribucin uniforme continua en el intervalo [ ], se conoce
como variable aleatoria uniforme continua, si y solo si, su funcin de densidad est dada por la siguiente
expresin:

Donde
Esta distribucin se simboliza:

Funcin de distribucin: La funcin de distribucin acumulada esta dada por:

Propiedades:
Media: [ ]

Veamos la demostracin:

[ ] ( ) [ ]
( ) ( )

( )( )
[ ]
( ) ( )

( )
Varianza: [ ]

Pgina 154 de 177


Veamos la demostracin:

Primero hallamos: [ ] [ ]
( ) ( )

[ ] [ ] ( [ ]) ( )
( ) ( )

( ) ( )
[ ]
( )

Leccin 36: Distribucin normal y sus aplicaciones.


Es una de las distribuciones de probabilidad ms importantes en todo el campo de la estadstica ya que gran
parte de la teora estadstica y de probabilidad que se ha construido y de las distintas tcnicas estadsticas para
el anlisis de datos que se aplica en la actualidad se fundamenta en esta distribucin; en especial, juega un
papel clave en el desarrollo de la inferencia estadstica, pues muchas de las herramientas usadas en la toma
de decisiones o en las pruebas de hiptesis, tienen su fundamento en la distribucin normal.

Un gran nmero de estudios pueden ser aproximados usando una distribucin normal:

Algunas variables fsicas datos meteorolgicos (temperatura, precipitaciones, presin atmosfrica, etc.).
Caracteres morfolgicos de individuos (personas, animales o plantas) o mediciones en organismos vivos.
Caracteres sociolgicos, por ejemplo, consumo de ciertos productos por individuos de un mismo grupo.
Notas o puntajes en pruebas de admisin o de aptitud.
Errores en instrumentacin.
Proporciones de errores en diversos procesos, etc.

2
(o desviacin
in de densidad viene dada por la siguiente expresin matemtica:

Pgina 155 de 177


2
1 x
1
f(x, , 2 ) e 2
, - x
X N , 2
2 .

Donde,
e = base de los logaritmos naturales = 2,71828

Su grfica, denominada curva normal, tiene forma de campana, tal como se muestra a continuacin.

Al dar a la funcin los valores de , y valores a x, obtendremos la distribucin en cuestin, la que tiene
2

forma de campana, por lo que tambin se le conoce como campana de Gauss. Hay un nmero infinito de
funciones de densidad Normal, una para cada combinacin de y . La media mide la ubicacin de la
distribucin y la desviacin estndar mide su dispersin. De esta manera, podemos tener distribuciones con
distintas medias pero con la misma medida de variacin, o distribuciones con la misma media pero con
distintas variaciones o, simplemente distribuciones con distintas medias y distintas variaciones, tal como se
observa en los siguientes grficos:

Algunas caractersticas especiales de la distribucin normal se enumeran a continuacin:

Pgina 156 de 177


a)

b) Es asinttica con respecto a su eje horizontal; esto quiere decir que jams va a tocar el eje de las equis.

c) El rea total bajo la curva es 1, esto es,

2
1 X -
1 -

dx 1
2
e

2

f) S sumamos a , se observar que aproximadamente el 68,26% de los datos se encuentran bajo la


curva, si sumamos a 2, el 95,44% de los datos estar entre esos lmites y si sumamos a 3,
entonces el 99,74% de los datos caer dentro de esos lmites. Esta caracterstica es a la vez una forma
emprica y rpida de demostrar si los datos que se analizan tienen una distribucin Normal; ya que para
trabajar los datos con esta distribucin, debe verificarse que efectivamente as se distribuyen, ya que de no
hacerlo, las decisiones que en un momento dado se tomarn de un anlisis de los datos con la distribucin
Normal, seran errneas.

Cmo se determinan probabilidades con la distribucin Normal?

Acuerdo a como se trataron las distribuciones de probabilidad continuas, lo ms lgico es que la funcin f(x,,
), se integre entre los lmites de la variable x; esto es,
2

Pa X b Pa X b f(x; ; 2 )dx
b

La integral anterior nos dara el rea bajo la curva de la funcin, desde a hasta b, que corresponde o es igual a
la probabilidad buscada.

Debido a la dificultad que se presenta para integrar esta funcin cada vez que sea necesario, lo que se hace es
tipificar el valor de la variable x, esto es, x se transforma en un valor de z, de la siguiente manera:
x
z valor

Este valor de z es buscado en una tabla donde vienen reas asociadas a este valor, y haciendo uso de los
valores tabulados, se determina la probabilidad requerida. La tabla que es usada para calcular las
probabilidades es la que nos da el rea que se muestra a continuacin:

Pgina 157 de 177

0 Z
Ejemplo 1:

El acero que se utiliza para tuberas de agua a menudo se recubre internamente con un mortero de cemento
para evitar la corrosin. En un estudio de los recubrimientos de mortero de una tubera empleada en un
proyecto de transmisin de agua en California (Transportation Engineering Journal, Noviembre de 1979) se
especific un espesor de 7/16 pulgadas para el mortero. Un gran nmero de mediciones de espesor dieron una
media de 0,635 pulgadas y una desviacin estndar de 0,082 pulgadas. S las mediciones de espesor, tenan
una distribucin Normal, qu porcentaje aproximado fue inferior a 7/16 de pulgada?

Solucin:
x = variable que nos define el espesor del mortero en pulgadas
= 0,635 pulgadas
= 0,082 pulgadas

X = 7/16
=0.635
7 / 16 0.635 Z=
0.4375 0.635
Z 2.4085 2.41
0.082 0.082
p(z = -2.41) = 0.492

p(x 7/16 pulgadas) = 0.5- p(z = -2.41) = 0.5-0.492 = 0.008

Por tanto, 0.008 x 100% = 0.8% de los recubrimientos de mortero tienen un espesor menor de 7/16 pulgadas.

Ejemplo 2:

Un tubo fluorescente estndar tiene una duracin distribuida Normalmente, con una media de 7.000 horas y
una desviacin estndar de 1.000 horas. Un competidor ha inventado un sistema de iluminacin fluorescente
compacto que se puede insertar en los receptculos de lmparas incandescentes. El competidor asegura que
el nuevo tubo compacto tiene una duracin distribuida Normalmente con una media de 7.500 horas y una
desviacin estndar de 1.200 horas.

a. Cul tubo fluorescente tiene mayor probabilidad de tener una duracin mayor de 9.000 horas?

b. Cul tubo tiene mayor probabilidad de tener una duracin de menos de 5.000 horas?

Solucin:
a) Tubo 1

Pgina 158 de 177


X1 = variable que nos define la duracin en horas de un tubo fluorescente
= 7.000 horas
= 1.000 horas

Tubo 2
X2 = variable que nos define la duracin del tubo fluorescente del competidor
= 7.500 horas
= 1.200 horas

=7.000
9,000 7 ,000 X= 9000
z1 2.00 p(z1 = 2,00) = 0,4772
1,000

p(x1 9.000 horas) = 0,5 p(z1 = 2,00) = 0.5 0.4772 = 0.0228

=7.500 X = 9.000

9,000 7 ,500
z2 1.25 p(z2 = 1.25) = 0.3944
1,200

p(x2 9,000 horas) = 0.5 p(z2 = 1.25) = 0.5 0.3944 = 0.1056

Por tanto el tubo fluorescente del competidor tiene una probabilidad mayor de durar ms de 9,000 horas.

b)

X = 5000
=7000

Pgina 159 de 177


5,000 7 ,000
z1 2.00 p(z1 = -2.00) = 0.4772
1,000

p(x1 5,000 horas) = 0.5 p(z1 = -2.00) = 0.5 0.4772 = 0.0228

X = 5000
5,000 7 ,500
z2 2.08 p(z2 = -2.08) = 0.4812
1,200 = 7500

p(x2 5,000 horas) = 0.5 p(z2 = - 2.08) = 0.5 0.4812 = 0.0188

Por tanto, el tubo fluorescente que tiene una mayor probabilidad de durar menos de 5,000 horas es el del
primer fabricante.

Ejemplo
La distribucin de la demanda (en nmero de unidades por unidad de tiempo) de un producto a menudo puede
aproximarse con una distribucin de probabilidad Normal. Por ejemplo, una compaa de comunicacin por
cable ha determinado que el nmero de interruptores terminales de botn solicitados diariamente tiene una
distribucin Normal, con una media de 200 y una desviacin estndar de 50.
a) En qu porcentaje de los das la demanda ser de menos de 90 interruptores?
b) En qu porcentaje de los das la demanda estar entre 225 y 275 interruptores?
c) Con base en consideraciones de costos, la compaa ha determinado que su mejor estrategia consiste en
producir una cantidad de interruptores suficiente para atender plenamente la demanda en 94% de todos los
das. Cuantos interruptores terminales deber producir la compaa cada da?

Solucin:
a) X = variable que nos indica el nmero de interruptores demandados por da a una compaa de cable

= 200 interruptores por da


= 50 interruptores por da

X = 90 = 200
Pgina 160 de 177
90 200
z 2.20 p(z = - 2.20) = 0.4861
50

p(x 90) = 0.5 p(z = -2.20) = 0.5 0.4861 = 0.0139


Por tanto, 0.0139 x 100% = 1.39% de los das se tendr una demanda menor de 90 interruptores.

b)

= 200 X2 = 275
X1 = 225
225 200
z1 0.50 p(z1= 0.50) = 0.1915
50

275 200
z2 1.50 p(z2 = 1.50) = 0.4332
50

p(225 x 275) = p(z2) p(z1) = 0.4332 0.1915 = 0.2417

Por tanto, 0.2417 x 100% = 24.17% de los das se tendr una demanda entre 225 y 275 interruptores.

d) c) En este caso se trata de determinar que valor toma x cuando se pretende cumplir con el 94% de
la demanda de todos los das.

Por tanto despejaremos de la frmula de z;

94%

= 200 X=

Pgina 161 de 177


x
Z ; x = + z

x = + z(p = 0.44) = 200 + z(p = 0.44)(50) =
= 200 + (1.55)(50) = 277.5 278 interruptores terminales por da

cmo se obtiene el valor de z?

En la tabla buscamos la z que corresponde a una probabilidad de 0.44 y nos damos cuenta de que no existe un
valor exacto de 0.44 por lo que tomamos los valores de rea ms cercanos; luego,

z(p = 0.4394) = 1.50; z(p = 0.4406) = 1.60

Por tanto si interpolamos, encontramos que el valor de z para una probabilidad de 0.44 es de 1.55, y es el
valor que se sustituye en la ecuacin.

Cul es la razn de usar un rea de 0.44 en lugar de una de 0.94 para buscar en la tabla el valor de z?

Es muy simple, la tabla que estamos usando es una tabla que solo trabaja con reas que son definidas de la
media hasta el valor de x y x puede estar tanto del lado derecho de la media, como del lado izquierdo de la
media, es por esto que el rea a utilizar es de 0.44 que se encuentra al lado derecho de la media.

Pgina 162 de 177


En un examen de matemticas, en el que se ha evaluado de 0 a 20 puntos, el 67% de los alumnos ha obtenido
una puntuacin igual o menor que 12,2 y el 9% ha obtenido puntuacin superior a 16,7. Suponiendo que la
distribucin de las puntuaciones sea normal, calcule su media y su desviacin tpica.

Solucin

Pgina 163 de 177


Los paquetes recibidos en un almacn tienen un peso medio de 300 Kg. y una desviacin tpica de 50 Kg.
Cul es la probabilidad de que 25 de esos paquetes, elegidos al azar, excedan el lmite de carga del
montacargas donde se van a meter, que es de 8200 Kg.?

Solucin

Leccin 37: Distribucin Exponencial.

La distribucin exponencial, como funcin de distribucin de variable continua, tiene una gran utilidad prctica
ya que podemos considerarla como un modelo adecuado para la distribucin de probabilidad del tiempo de
espera entre dos hechos que sigan un proceso de Poisson. De hecho la distribucin exponencial puede
derivarse de un proceso experimental de Poisson con las mismas caractersticas que las que enuncibamos al
estudiar la distribucin de Poisson, pero tomando como variable aleatoria, en este caso, el tiempo que tarda en
producirse un hecho

Obviamente, entonces , la variable aleatoria ser continua. Por otro lado existe una relacin entre el parmetro
a de la distribucin exponencial , que ms tarde aparecer , y el parmetro de intensidad del proceso l , esta
relacin es a = l

Al ser un modelo adecuado para estas situaciones tiene una gran utilidad en los siguientes casos:

Distribucin del tiempo de espera entre sucesos de un proceso de Poisson

Distribucin del tiempo que transcurre hasta que se produce un fallo, si se cumple la condicin que la
probabilidad de producirse un fallo en un instante no depende del tiempo transcurrido .Aplicaciones en
fiabilidad y teora de la supervivencia.

Pgina 164 de 177


Funcin de densidad.

A pesar de lo dicho sobre que la distribucin exponencial puede derivarse de un proceso de Poisson , vamos a
definirla a partir de la especificacin de su funcin de densidad:

DEFINICIN: Dada una variable aleatoria X que tome valores reales no negativos {x > 0} diremos que tiene
una distribucin exponencial de parmetro a con a > 0, si y slo si su funcin de densidad tiene la expresin:

( ) Se dice que x Exp()

Grafica de la Funcin Exponencial

Grficamente como ejemplo planteamos el

Funcin de Distribucin Acumulada:

En la principal aplicacin de esta distribucin, que es la Teora de la Fiabilidad, resulta ms interesante que la
funcin de distribucin la llamada Funcin de Supervivencia o Funcin de Fiabilidad. La funcin de
Supervivencia se define cmo la probabilidad de que la variable aleatoria tome valores superiores al valor dado
X:

Si el significado de la variable aleatoria es "el tiempo que transcurre hasta que se produce el fallo": la funcin
de distribucin ser la probabilidad de que el fallo ocurra antes o en el instante X: y , en consecuencia la
funcin de supervivencia ser la probabilidad de que el fallo ocurra despus de transcurrido el tiempo X ; por lo
tanto, ser la probabilidad de que el elemento, la pieza o el ser considerado "Sobreviva" al tiempo X ; de ah el
nombre.

Pgina 165 de 177


Grafica de la Funcin de distribucin Acumulada: Para

En la que se observa lo que sera la diferencia entre funcin de distribucin y la de supervivencia

Propiedades:

Media: ( )

Varianza: ( )

La distribucin exponencial es un caso particular de distribucin gamma con k = 1. Adems la suma de


variables aleatorias que siguen una misma distribucin exponencial es una variable aleatoria expresable en
trminos de la distribucin gamma.

Ejemplo: El tiempo durante el cual cierta marca de batera trabaja en forma efectiva hasta que falle (tiempo de
falla) se distribuye segn el modelo exponencial con un tiempo promedio de fallas igual a 360 das.

a) qu probabilidad hay que el tiempo de falla sea mayor que 400 das?.

b) Si una de estas bateras ha trabajado ya 400 das, qu probabilidad hay que trabaja ms de 200 das
ms?

c) Si se estn usando 5 de tales bateras calcular la probabilidad de que ms de dos de ellas continen
trabajando despus de 360 das.

Solucin

Sea X=el tiempo que trabaja la batera hasta que falle. El tiempo promedio de falla es de 360 das. Entonces, X
~Exp (=1/360) y su funcin de densidad es:

Pgina 166 de 177


EJEMPLO: Suponga que la vida de cierto tipo de tubos electrnicos tiene una distribucin exponencial con vida
media de 500 horas. Si X representa la vida del tubo (tiempo q dura el tubo).

a) Hallar la probabilidad que se queme antes de las 300 horas.

b) Cul es la probabilidad que dure por lo menos 300 horas?

c) Si un tubo particular ha durado 300 horas. cal es la probabilidad de que dure otras 400 horas?

Solucin

Los dos ejemplos fueron tomados de:http://www.monografias.com/trabajos84/distribucion-exponencial/distribucion-


exponencial.shtml. Tomado 19 Julio 2012

Pgina 167 de 177


Leccin 38: Distribucin Weibull.
La tecnologa actual nos permite disear muchos sistemas complicados cuya operacin, o quiz seguridad,
depende de le confiabilidad de los diversos componentes que conforman los sistemas. Por ejemplo, un fusible
puede quemarse, una columna de acero puede torcerse. Componentes idnticos sujetos a idnticas
condiciones ambientales fallaran en momentos diferentes.

Se tiene un modelo continuo asociado a variables del tipo tiempo de vida, tiempo hasta que un mecanismo
falla, etc. La funcin de densidad de este modelo viene dada por:

Los parmetros de la funcin son: > 0 y > 0, donde es un parmetro de escala y es un parmetro de
forma.

La funcin de distribucin acumulada se obtiene por la integracin de la funcin de densidad y se define de la


siguiente manera:

Grafica de la Funcin de Densidad Grafica de la Funcin acumulada

Propiedades:

Media: ( ) ( )

Pgina 168 de 177


Varianza: ( ) * ( ) ( )+

Asimetra:

Curtosis:

Donde: .

Al igual que la distribucin gamma y la exponencial, la distribucin de weibull tambin se aplica a problemas de
confiabilidad y de vida como los de tiempo de antes del fallo o la vida de un componente que se mide desde
algn tiempo especifico hasta que falla .

Ejemplo

El tiempo de vida x, en horas , de un artculo en el taller mecnico tiene una distribucin de Weibull con
=0.01 y =2 cul es la probabilidad de que falle antes de ocho horas de uso.

Solucin:

P(x<8)=f(8)=1- e(0.01 )8 =1-0.527=0.473

Leccin 39: Distribucin Jicuadrado


La (distribucin ji) o tambin llamada distribucin chi - cuadrada es un caso especial de la distribucin gamma
esta tiene muchas aplicaciones como los temas que se tratan de muestreo, anlisis de varianza y estadstica
no paramtrica

La familia de distribuciones Chi-cuadrado ( ) es una distribucin unimodal con asimetra positiva.


2

Esta caracterizada por un parmetro llamado grados de libertad (gl).
La media en esta familia es igual a gl.
La varianza es igual a 2 veces la media.
Representa la distribucin de la suma de los cuadrados de n variables aleatorias independientes
normalmente distribuidas.

La variable aleatoria continua x tiene una distribucin j-i cuadrada, con v grados de libertad, si su funcin de
densidad est dada por :

para x >0

n 0, en cualquier otro caso

Pgina 169 de 177


Donde v es un entero positivo.

Grafica de la Funcin Chi Cuadrado:

Funcin de densidad de Probabilidad Funcin de distribucin Acumulada

Se puede ver una Ji Cuadrado con 5 grados de libertad.


C
hi-c
u adrado(gl=5)
0,20

0,15

0,10

0,05

0,00
0 5 10 15 20

Propiedades:

La media: =
La Varianza: 2 = 2
Donde son los grados de libertad.

Pgina 170 de 177


Ejemplo:
Encontrar la P(c2 >4.11 ; gl=3)=0.25
Encontrar c2* tal que P(c2 > c2 * ; gl=5)=0.05
c2 *=11.07

Ejemplo:
Cul es la distribucin de probabilidad de chi cuadrado de 4 grados de libertad de que x<1.2

Solucin:

Segn la tabla en la columna 4y la fila de 1.2 tenemos


P(x/<1.2)=0.121901

Leccin 40: Distribucin t-student.


En Estadstica y Probabilidad, existe una distribucin creada por William Gosset, estadstico Britnico, quien en
sus investigaciones, desarroll la distribucin llamada con el seudnimo t Student, la cual surge del problema
de estimar la media de una poblacin normalmente distribuida cuando el tamao de la muestra es pequeo.
Aparece de manera natural al realizar la prueba t de Student para la determinacin de las diferencias entre dos
medias muestrales y para la construccin del intervalo de confianza para la diferencia entre las medias de dos
poblaciones cuando se desconoce la desviacin tpica de una poblacin y sta debe ser estimada a partir de
los datos de una muestra.

Entre sus caractersticas se tiene:

Es una familia de distribuciones con forma de campana, Simtrica y Unimodal.


En esta familia de distribuciones la media es 0.

Se obtiene por el cociente entre la normal y la raz cuadrada de una dividida por sus grados de libertad.

Pgina 171 de 177


t de Student (g.l.= 10)
0,45

0,30

0,15

0,00
-3,50 -1,75 0,00 1,75 3,50

La desviacin estndar depende de un parmetro denominado grados de libertad.

Ejemplo:

Cul es la probabilidad acumulada de que una distribucin t student con 9 grados de libertad, de que x < 0,25.

Solucin:

Segn el planteamiento: P (t9 < 0,25). Entonces buscando en la tabla: Columna 9 y fila con 0,25, se obtiene:
P (t9 < 0,25) = 0,596

Pgina 172 de 177


Ejemplo:

Encontrar la P (t > 0,82; gl=2)

Solucin:

En la tabla se observa que: P (t > 0,82; gl=2)=0.25

Ejemplo:

Encontrar t* tal que P(t >t* ; gl=8)=0.05

Solucin:

Encontrar t* tal que P (t > 1,86; gl = 8) = 0.05, as que t = 1,86

Leccin 41: Distribucin de F-Fisher


Existen ciertas situaciones donde se requiere comparar el comportamiento de dos poblaciones, por medio de la
varianza, casos como identificar la precisin de un instrumento de medicin con la de otro, la estabilidad de un
proceso de manufactura contra otro, la calificacin de docente contra otro y muchas situaciones ms.

Pgina 173 de 177


La comparacin de varianzas son un tema importante en la inferencia estadstica y en estudios de muestreo,
de esto surge una distribucin fundamental en estadstica: Distribucin de Fisher o Distribucin de Fisher
Snedecor.
Intuitivamente, cuando el cociente entre las dos varianzas es muy pequeo, cercano a uno, se tiene poca
evidencia para pensar que las varianzas poblacionales ( ) no son iguales. De igual manera cuando el
cociente es muy grande, hay evidencia de que la varianzas poblacionales son diferentes.

Sean las variables aleatorias X y Y, con distribucin Chi cuadrado e independientes, con 1 y 2 grados de

libertad. Entonces, la distribucin de variable aleatoria continua es distribucin F de Fisher, cuya

funcin de densidad esta dad por la siguiente expresin:

( )
* +( ) ( )

( )
( ) ( )( )( )

Propiedades:

La media: Para 2 > 2

( )
La Varianza: ( ) (
Para 2 > 4
)

Donde son los grados de libertad.

Grafica de la Distribucin Fisher:

Tabla de la Distribucin Fisher:

Para cada nivel de significancia (), se da los grados de libertad del numerador en la primera fila y los grados
de libertad del denominador en la primera columna, la interseccin es el valor de la distribucin.

Pgina 174 de 177


Ejemplo:

Hallar el valor de la distribucin F para los siguientes casos:

a-) El rea a la derecha de F para = 0,25 si 1 = 4 y 2 = 9.


Solucin: Como el rea que da la tabla es desde cero a un valor dado de Fisher, se tiene que localizar primero
los grados de libertad del denominador que son 9, luego un rea de 0.75 con 4 grados de libertad del
numerador.

b-) El rea a la izquierda de F para = 0,95 si 1 = 15 y 2 = 10.

Solucin: En este caso se puede buscar el rea de 0.95 directamente en la tabla con sus respectivos grados de
libertad. 15 y 10, para = 0,95

c-) El rea a la derecha de F para = 0,95 si 1 = 6 y 2 = 8.

Pgina 175 de 177


Solucin: Se tiene que buscar en la tabla un rea de 0.05, puesto que nos piden un rea a la derecha de F de
0.95.

d-) El rea a la izquierda de F para = 0,10 si 1 = 24 y 2 = 24.


Solucin: Se busca directamente el rea de 0.10, con sus respectivos grados de libertad, 24 y 24 para
numerador y denominador.

Pgina 176 de 177


BIBLIOGRAFA

BEJARANO BARRERA, Hernn (1995). Estadstica Descriptiva. Santa fe de Bogot: UNISUR.

CHRISTENSEN, Howard B. (1999). Estadstica Paso a Paso. Mxico: Editorial Trillas.

MARTNEZ BENCARDINO, Ciro (2004). Estadstica Bsica Aplicada. Santa fe de Bogot: ECOE Ediciones.

MARTNEZ BENCARDINO, Ciro (2003). Estadstica y Muestreo. Santa fe de Bogot: ECOE Ediciones.

MILTON, J. Susan (1999). Estadstica para biologa y ciencias de la salud. Madrid: McGraw Hill
Interamericana.

PORTUS GOVINDEN, Lincoyn (2001). Introduccin a la Estadstica. Segunda edicin. Santa fe de Bogot.
McGraw Hill.

PORTILLA CHIMAL, Enrique (1980). Estadstica, Primer Curso. Bogot: Nueva Editorial Interamericana.

SPIEGEL, Murria R. (1991). Estadstica. Serie de compendios Schaum. Mxico: McGraw Hill.

SMITH, A. Stanley. (1992). Curso de Estadstica Elemental para las ciencias aplicadas. Primera edicin. Santa
fe de Bogot. Editorial Addison Wesley Iberoamericana.

CIBERGRAFIA
http://www.liccom.edu.uy/bedelia/cursos/metodos/material/estadistica/med_disp.html

http://www.tuveras.com/estadistica/estadistica02.htm

http://www.universidadabierta.edu.mx/SerEst/MAP/METODOS%20CUANTITATIVOS/Pye/tema_12.htm

http://www.uv.es/ceaces/base/modelos%20de%20probabilidad/exponencial.htm. Tomado Julio 19 2012

http://www.itch.edu.mx/academic/industrial/estadistica1/cap03c.html. Tomado Julio 23 de 2012

http://html.rincondelvago.com/distribuciones-de-probabilidad_1.html. Tomado Julio 23 de 2012

http://es.wikibooks.org/wiki/Tablas_estad%C3%ADsticas/Distribuci%C3%B3n_t_de_Student

Tomado Julio 25 de 2012

Pgina 177 de 177

Você também pode gostar