Você está na página 1de 75

Asignatura: Estadística Descriptiva

Docente: MSc. Roly Alcides Cristobal Lara

ESTADÍSTICA

INTRODUCCIÓN
En las últimas décadas la estadística ha alcanzado un alto grado de desarrollo, hasta el
punto de incursionar en la totalidad de las ciencias.
La estadística es una ciencia auxiliar para todas las ramas del saber; su utilidad se entiende
mejor si tenemos en cuenta que los quehaceres y decisiones diarias embargan cierto grado
de incertidumbre y ayuda en la incertidumbre, trabaja con ella y nos orienta para tomar
las decisiones con un determinado grado de confianza.
Los críticos de la estadística afirman que a través de ella es posible probar cualquier cosa,
lo cual es un concepto profano que se deriva de la ignorancia en este campo y de lo
polifacético de los métodos estadísticos. Sin embargo muchos "investigadores"
tendenciosos han cometido abusos con la estadística, elaborando "investigaciones" de
intención, teniendo previamente los resultados que les interesan mostrar a personas
ingenuas y desconocedoras de los hechos. Otros, por ignorancia o negligencia, abusan de
la estadística utilizando modelos inapropiados o razonamientos ilógicos y erróneos que
conducen al rotundo fracaso de sus investigaciones.

1. DEFINICIÓN
Definir la estadística es una tarea difícil porque tendríamos que definir cada una de las
técnicas que se emplean en los diferentes campos en los que interviene. Sin embargo,
diremos, en forma general, que “La ESTADISTICA es la ciencia que le facilita al
hombre el estudio de datos masivos, proporcionando un conjunto de métodos
científicos para recolectar, resumir, clasificar, analizar e interpretar el
comportamiento de los datos con respecto a una característica, materia de estudio o
investigación, pasa de esa manera a sacar conclusiones valederas y efectuar
predicciones razonables de ellos y así mostrar una visión de conjunto clara y de más
fácil apreciación con respecto a la fuente de información que nos permiten tomar
decisiones optimas en casos de incertidumbre”

Estadística: Etimológicamente
El origen etimológico de la palabra “estadística” no está bien determinado, supuesto que
existen distintas opiniones y referencias. Para algunos viene de la voz griega STATERA
que significa “balanza”, otros sostienen que deriva del latín STATUS que significa
“situación” mientras que algunos autores afirman que procede del alemán STAAT que
significa “estado” pues era función principal de los gobiernos de los estados establecer
registros de población, nacimientos, defunciones, etc.

2. BREVE RESEÑA HISTORICA


Desde los comienzos de la civilización han existido formas sencillas de estadística, pues
ya se utilizaban representaciones gráficas y otros símbolos en pieles, rocas, palos de
madera y paredes de cuevas para contar el número de personas, animales o ciertas cosas.
Hacia el año 3000 a.c. los babilonios usaban ya pequeñas tablillas de arcilla para recopilar
datos tabulados sobre la producción agrícola y de los géneros vendidos o cambiados
mediante trueque. Los egipcios analizaban los datos de la población y la renta del país
CURSO: ESTADÍSTICA DESCRIPTIVA

mucho antes de construir las pirámides en el siglo XXXI a.c. Los libros bíblicos de
Números y Crónicas incluyen, en algunas partes, trabajos de estadística. El primero
contiene dos censos de la población de Israel y el segundo describe el bienestar material
de las diversas tribus judías.
En China existían registros numéricos similares con anterioridad al año 2000 a.c. Los
griegos realizaban censos cuya información se utilizaba para cobrar impuestos hacia el
594 a.c.
El Imperio romano fue el primer gobierno que recopiló una gran cantidad de datos sobre
la población, superficie y renta de todos los territorios bajo su control. Durante la edad
media sólo se realizaron algunos censos exhaustivos en Europa. Los reyes visigodos
ordenaron hacer estudios minuciosos de las propiedades de la Iglesia en los años 758 y
762 respectivamente. Después de la conquista normanda de Inglaterra en 1066, el rey
Guillermo I de Inglaterra encargó un censo. La información obtenida con este censo,
llevado a cabo en 1086, se recoge en el Domesday Book. En 1662 apareció el primer
estudio estadístico notable de población, titulado Observations on the London Bills of
Mortality (Comentarios sobre las partidas de defunción en Londres). Un estudio similar
sobre la tasa de mortalidad en la ciudad de Breslau, en Alemania, realizado en 1691, fue
utilizado por el astrónomo inglés Edmund Halley como base para la primera tabla de
mortalidad. En el siglo XIX, con la generalización del método científico para estudiar
todos los fenómenos de las ciencias naturales y sociales, los investigadores aceptaron la
necesidad de reducir la información a valores numéricos para evitar la ambigüedad de las
descripciones verbales.
El desarrollo de la Estadística se fundamenta científicamente a partir de los años 30 a raíz
de los problemas planteados en la sociedad industrial, por el desarrollo de otras ramas de
las Matemáticas y de otros campos como la Biología, Medicina, Informática.
En nuestros días, la estadística se ha convertido en un método efectivo para describir con
exactitud los valores de datos económicos, políticos, sociales, psicológicos, biológicos y
físicos, y sirve como herramienta para relacionar y analizar dichos datos. El trabajo del
experto estadístico no consiste ya sólo en reunir y tabular los datos, sino sobre todo en el
proceso de interpretación de esa información. El desarrollo de la teoría de la probabilidad
ha aumentado el alcance de las aplicaciones de la estadística. Muchos conjuntos de datos
se pueden aproximar, con gran exactitud, utilizando determinadas distribuciones
probabilísticas; los resultados de éstas se pueden utilizar para analizar datos estadísticos.
La probabilidad es útil para comprobar la fiabilidad de las inferencias estadísticas y para
predecir el tipo y la cantidad de datos necesarios en un determinado estudio estadístico.

3. RAMAS DE LA ESTADÍSTICA
La estadística se divide en dos ramas que no son independientes; por el contrario, son
complementarias y entre ambas dan la suficiente ilustración sobre una posible realidad
futura, con el fin de que quien tenga poder de decisión, tome las medidas necesarias para
transformar ese futuro o para mantener las condiciones existentes.
En atención a su metodología, por sus procedimientos y alcances bien definidos, la ciencia
estadística se clasifica en:

3.1 ESTADÍSTICA DESCRIPTIVA O DEDUCTIVA:


Se encarga de la recolección, clasificación y descripción de datos muestrales o
poblacionales, para su interpretación y análisis. Su finalidad es obtener información,
analizarla, elaborarla y simplificarla y presentándolos en forma clara; eliminando la
confusión característica de los datos preliminares lo necesario para que pueda ser

M,Sc. Roly Alcides Cristobal Lara 2


CURSO: ESTADÍSTICA DESCRIPTIVA

interpretada cómoda y rápidamente y, por tanto, pueda utilizarse eficazmente para el fin
que se desee.
Permite la elaboración de cuadros, gráficos e indicadores bien calculados;
suficientemente claros, como para disipar las dudas y la oscuridad de los datos masivos.
El análisis se limita en sí mismo a los datos coleccionados y no se realiza generalizaciones
acerca de la totalidad de donde provienen esas observaciones (población).
La Estadística Descriptiva no es mas que el trabajo preliminar para el Estadística
Inferencial.

3.2 ESTADÍSTICA INFERENCIAL O INDUCTIVA


La estadística inferencial sobre la base de la muestra estudiada saca conclusiones, o sea,
hace inferencia o inducción, en cuanto al universo o población, de donde se obtuvo dicha
muestra, basándose en los datos simplificados y analizados; detectando las interrelaciones
que pueden unirlos, las leyes que los rigen y eliminando las influencias del azar; llegando
más allá de las verificaciones físicas posibles.
¿Cómo se selecciona la muestra?, ¿cómo se realiza la inferencia?, y ¿qué grado de
confianza se puede tener en ella? son aspectos fundamentales de la estadística inferencial,
para cuyo estudio se requiere un alto nivel de conocimientos de estadística, probabilidad
y matemáticas. Comprende la teoría de estimación y prueba de hipótesis.

4. OBJETIVOS
Los objetivos de la estadística pueden ser clasificados en tres grandes capítulos:
descripción, análisis y predicción.

4.1 Descripción de grandes colecciones de datos empíricos reduciéndolos a un


pequeño número de características que concentra la parte más importante y significativa
de la información proporcionada por los datos.
La descripción supone que los datos que vienen expresados en su forma natural deben ser
clasificados y presentados sistemáticamente en cuadros o tablas como una pequeña
reducción de datos, esto se obtiene cuando el comportamiento y características de los
datos se expresan por un conjunto de indicadores, medidas de resumen o estadígrafos.
La estadística de inicia estudiando el problema, puesto que es un trabajo preliminar de
casi todas las investigaciones estadísticas; de este modo tanto como la reducción como la
descripción de la información se estudia en la Estadística Descriptiva.
Es importante anotar que la descripción estadística de los fenómenos o hechos es el primer
aspecto al cual se redujo la ciencia estadística durante mucho tiempo, aplicándose
especialmente a los datos demográficos, sociales económicos, etc.

4.2 Análisis estadístico de datos experimentales y de los fenómenos observados,


toda la investigación estadística incluye un problema de análisis, con el objeto de
formarse un concepto de la población o universo y adoptar decisiones; en este caso no es
necesario observar toda a una población sino que será suficiente elegir una muestra
representativa. La preocupación del análisis estadístico es inferir propiedades para una
población sobre la base de resultados muestrales conocidos. Aquí se presenta varios
problemas que presentan la Estadística, la estimación estadística, el cálculo de
probabilidades, las pruebas estadísticas, etc. Estos son aspectos que corresponde
esencialmente a la Inferencia Estadística.
Todo análisis debe suponer la elección adecuada de una muestra representativa, la que
será estudiada en detalle para obtener conclusiones o resultados, que dentro de ciertos
márgenes de aceptación sean válidas a toda la población de la cual fue elegida la muestra.

M,Sc. Roly Alcides Cristobal Lara 3


CURSO: ESTADÍSTICA DESCRIPTIVA

4.3 Predicción o comportamiento de los fenómenos en el futuro, lo cual constituye


la máxima aspiración practica de toda ciencia. Este objetivo de predicción y previsión
esta implícito tanto en la descripción como en el análisis estadístico, puesto que en general
interesa orientar la toma de decisiones con vigencia y afecto en el futuro.
Naturalmente que las estimaciones y proyecciones dependen del grado de conocimiento
del comportamiento del pasado y presente de las variables en estudio.
Para concretar estos objetivos, la Estadística se vale por una parte del censo, que recopila
datos del todo, analiza la distribución y variación de las características de los elementos
que componen una población claramente definida; por otra parte del muestreo, que
permite estimar o inferir características de un todo considerando una parte representativa.
Basándose en el análisis de experiencias y evaluaciones pasadas y actuales, hace
estimaciones de fenómenos y características para un futuro, propone valores esperados.
La estadística también se vale de una seria de artificios matemáticos y del cálculo de
probabilidades, para definir sobre la validez de supuestos, construir modelos y métodos
estadísticos.

5. CONCEPTOS BÁSICOS

5.1 POBLACIÓN
Es el conjunto mayor o colección completa de todos los elementos (puntajes. personas,
mediciones, etc.) que posee al menos una característica común observable, cuyo estudio
nos interesa o acerca de los cuales se desea información.
La población debe estar perfectamente definida en el tiempo y en el espacio, de modo que
ante la presencia de un potencial integrante de la misma, se pueda decidir si forma parte o
no de la población bajo estudio. Por lo tanto, al definir una población, se debe cuidar que el
conjunto de elementos que la integran quede perfectamente delimitado.
La población puede ser según su tamaño de dos tipos:
Población finita: cuando se tiene un número determinado de elementos.
Población infinita: cuando el número de elementos es indeterminado, o tan grande
que pudiesen considerarse infinitos.
Tamaño de la Población: Es el número total de elementos que tiene la población estudiada
y se denota con la letra “N”

5.2 MUESTRA
Es un subconjunto de la población a la cual se le efectúa la medición con el fin de estudiar
las propiedades de la población de la cual es obtenida.
Una muestra debe ser representativa, esto es, guarda las mismas características de la
población de donde fue seleccionada y debe ser adecuada en cuanto a la cantidad de
elementos que debe tener con respecto a la población.
Existen diversos métodos para calcular el tamaño de la muestra y también para
seleccionar los elementos que la conforman, pero es importante que sea representativa de
la población y sus elementos escogidos al azar para asegurar la objetividad de la
investigación.
Tamaño de muestra: Es el número de elementos de la muestra y se denota con letra “n”

5.3 UNIDADES ESTADÍSTICAS


Son los elementos de la población que puede ser algo con existencia real, como un
automóvil o una casa, o algo más abstracto como la temperatura, un voto, o un intervalo
de tiempo.

M,Sc. Roly Alcides Cristobal Lara 4


CURSO: ESTADÍSTICA DESCRIPTIVA

Estas pueden ser:


- Unidad de investigación: Es la unidad mínima que mantiene la integridad de
los datos que interesan estudiar y analizar. Es decir, el ente que contiene las
partes que se van a analizar.
- Unidad de análisis: Está definida como el elemento que se examina y del que
se busca la información dentro de la unidad de investigación.
- Unidad de observación: Se denomina a la unidad a través de la cual se
obtiene la información, esta puede o no coincidir con la unidad de análisis.
También se denomina unidad respondiente.
- Unidades de muestreo: Son aquellas que contienen las unidades de análisis
de la población y que se utilizarán para confeccionar o seleccionar la muestra.

5.4 PARÁMETROS ESTADÍSTICOS


Es un número que describe alguna característica de la población o medida de resumen de
una población. Se considera como un valor verdadero de la característica estudiada y
para determinar su valor es necesario utilizar la información poblacional completa, y por
lo tanto la decisión se toman con certidumbre total.

5.5 ESTADÍGRAFO O ESTADÍSTICO


Es un número que describe alguna característica de la muestra o medida de resumen de
una muestra y la toma de decisión contiene un grado de incertidumbre.

5.6 DATO
Es el valor, respuesta o registro que adquiere una característica o variable asociado a un
elemento de la población o muestra, como resultado de la observación, entrevista o
recopilación en general. Puede ser un número, una palabra o un símbolo.

6. VARIABLE
Es una característica estudiada de las unidades estadísticas.

Tipos de Variables: Podemos mencionar seis tipos:


6.1 Según la Naturaleza de la Variable

a) Variables Cualitativas o Estadísticas de Atributos


Cuando expresan una cualidad, característica o atributo, tiene carácter cualitativo,
sus datos se expresan mediante una palabra, no es numérico.
Por ejemplo; estado civil, los colores, lugar de nacimiento, profesiones, actividad
económica, causas de accidentes, etc.

b) Variables Cuantitativas
Cuando el valor de la variable se expresa por una cantidad, es de carácter
numérico. El dato o valor puede resultar de la operación de contar o medir, por
ejemplo; edad, número de hijos por familia, ingresos, viviendas por centro
poblado, niveles de desempleo, producción, utilidades de empresas, etc.
Las variables cuantitativas pueden ser: Discreta y Continua.
b.1) Variable Discreta
Cuando el valor de la variable resulta de la operación de contar, su valor esta
representado solo por números naturales (enteros positivos), Ejemplos; hijos

M,Sc. Roly Alcides Cristobal Lara 5


CURSO: ESTADÍSTICA DESCRIPTIVA

por familia, numero de accidentes por día, trabajadores por empresa,


población por distritos, habitaciones por vivienda, etc.
b.2) Variable Continua
Cuando la variable es susceptible de medirse, es toda variable cuyo valor se
obtiene por medición o comparación con una unidad o patrón de medida. Las
variables continuas pueden tener cualquier valor dentro de su rango o
recorrido, por tanto se expresa por cualquier número real, Ejemplos; área de
parcelas, ingresos monetarios, producción de maíz, peso, estatura, tiempo de
servicios, horas trabajadas, niveles de empleo, etc.

6.2 Según El Orden De Las Observaciones


a) Datos atemporales o no ordinales
Cuando se prescinde del orden en que se realiza las observaciones. El orden de la
observación no altera el valor variable. Por ejemplo; averiguar las edades de los
alumnos de un aula, en este caso, cualquiera que sea el orden que elijan los
alumnos, la edad no va a variar.

b) Series de tiempo, cronológicas o históricas


Cuando en la obtención de los datos se tiene en cuenta el orden cronológico de la
observación, o al momento o tiempo que pertenece, son variables analizadas en
función del tiempo. Por ejemplo; población demográfica en la década 1985 –
1995, variación mensual de precios, volumen anual de las exportaciones,
evolución y tendencia de la matricula en educación superior en el periodo 1990 –
1995, etc.

6.3 Según el Número de Variables


a) Estadísticas unidimensionales
Son las estadísticas de una sola variable, es el caso de considerar
independientemente un aspecto del fenómeno estudiado. Por ejemplo; clasificar
personas por la edad, viviendas por el número de habitantes, la estatura de
estudiantes de estadística, etc.

b) Estadísticas bidimensionales
Cuando se considera simultáneamente dos variables o aspecto en cada elemento
del conjunto o fenómeno que se estudia. La bidimensional requiere que las
variables tengan cierta asociación o relación, de modo que una variable pudiera
de alguna manera explicar el comportamiento de la otra. Por ejemplo; numero de
hijos según el nivel educativo de la madre, profesores por edad y tiempo de
servicios, producción por años, importaciones anuales, etc.

c) Estadísticas multidimensionales
Cuando se considera simultáneamente mas de dos variables o aspectos en cada
elemento de la población o muestra. La multidimensional también supone que
entre las variables exista alguna relación o interdependencia, entre los cuales es
posible determinar una variable dependiente y otras independientes. Por ejemplo;
el consumo según el ingreso y número de personas por familia, la demanda, el
precio, la inversión en propaganda; el nivel de fecundidad según la edad, nivel
educativo de la madre y área de residencia, etc.

M,Sc. Roly Alcides Cristobal Lara 6


CURSO: ESTADÍSTICA DESCRIPTIVA

6.4 Según la Escala de Medición


a) Variables Nominales
Son aquellas variables que establecen la distinción de los elementos en diversas
categorías, sin implicar algún orden entre ellas, distribuye a la unidad de análisis
en dos o más categorías. Ejemplos; sexo, estado civil, deportes de practica,
profesiones, lugar de nacimiento, etc.

b) Variables Ordinales
Aquellas variables que implican orden entre sus categorías, pero no grados de
distancia igual entre ellas, están referidas a un orden de jerarquía, donde las
categorías expresan una posición de orden. Ejemplo; grado de instrucción, clases
sociales, grado de simpatía, rango de agresividad, orden de merito, etc.

c) Variable de Intervalo
Son aquellas que suponen a la vez orden y grados de distancia iguales entre las
diversas categorías, pero no tienen origen natural, sino convencional, tiene un cero
relativo. Por ejemplo; coeficiente de inteligencia, temperatura, puntuación
obtenida en una escala, etc.
d) Variables de Razón
Estas variables comprenden a la vez todos los casos anteriores, distinción, orden,
distancia y origen único natural; el valor se expresa con un numero real tiene un
cero absoluto. Por ejemplo; edad, peso, ingresos, numero de hijos, producción,
accidentes de transito, etc.

6.5 Según Amplitud de las Unidades de Observación

a) Variables Individuales
Referida a características de individuos o personas, una empresa, centro
educativo. Son variables para estudio de casos, donde se pueden subdividir en
variables públicas y privadas.
a.1 Variable Pública
Aquella en que los valores individuales son conocidos por otras personas y
se saben que son conocidos. Ejemplos; edad, sexo, ocupación, estado civil,
etc.
a.2 Variable Privada
Cuando los valores individuales pueden ser conocidos por otros, una vez
averiguados. Ejemplos; el coeficiente de inteligencia, opiniones frente a la
política económica, conductas de consumo, etc.

b) Variables Colectivas
Aquellas que se refieren a características de las unidades cuando estas son
colectivas, conjuntos o grupos (empresas, ciudades, escuelas, etc.) Ejemplos; tasa
de mortalidad, urbanización, nivel educativo promedio, tasa de crecimiento
demográfico, etc.

6.6 Según La Relación Entre Variables

a) Variables Dependientes

M,Sc. Roly Alcides Cristobal Lara 7


CURSO: ESTADÍSTICA DESCRIPTIVA

Son aquellas que se explican por otras variables, son los efectos o resultados
respecto a los cuales hay que buscar su motivo, causas o razón de ser. Es la
variable que traduce la consecuencia del efecto de una o varias razones de causas,
de otras variables.

b) Variables Independientes
Son las variables explicativas o predictivas, cuya asociación, relación o influencia
en la variable dependiente se pretende descubrir en la investigación, las variables
independientes (VI) son los que se traducen o explican las causas o razones de las
variaciones en la variable dependiente(VD).
Simplificando, en relación de variables, las causas o antecedentes serian las
variables independientes (VI) y el efecto o consecuente es la variable dependiente
(VD).
Ejemplo: En el caso más simple, para la relación de dos variables.
1.- El presupuesto familiar (VD) depende de los ingresos (VI).
2.- El volumen de ventas (VD) se explica por la inversión en propaganda (VI).
3.- El número de hijos por familia (VD) tiene relación con el nivel educativo de
los padres (VI).
4.- El analfabetismo (VD) tiene relación con el lugar de residencia (VI) y la
expansión del servicio educativo (VI).

c) Variables Intervienientes o Interferentes


Son aquellas que coparticipan con la variable independiente condicionando el
comportamiento de la variable dependiente.
En el caso de la relación entre presupuesto familiar (VD) y los ingresos (VI),
algunas variables serian la conducta de consumo, la edad de los miembros de la
familia, etc.

7. FUENTES DE INFORMACIÓN

Las fuentes de información esta constituida por cada uno de los lugares de donde se toman
los datos. De acuerdo al tipo del lugar del cual procede esta información podemos
clasificarlo de la siguiente manera:

7.1 FUENTE PRIMARIA


Los datos de la fuente primaria son obtenidos directamente de las unidades de
observación (fuente). Mediante cualquier técnica o instrumento de recolección de
datos originales.

7.2 FUENTE SECUNDARIA


Los datos de la fuente secundaria son aquellos datos que ya han sido publicados
con anterioridad, recolectados con fines diferentes de los que la investigación
específica necesita.
Estos datos se encuentra como archivos registros administrativos boletines,
informes estadísticos requeridos en el ámbito nacional o sectorial elaborados por
organismos especializados los que pueden ser públicos o privados.

7.3 FUENTE EXPERIMENTAL

M,Sc. Roly Alcides Cristobal Lara 8


CURSO: ESTADÍSTICA DESCRIPTIVA

Los datos de la fuente experimental diseñado y ejecutado bajo condiciones


cuidadosamente controlados.
En estas condiciones el investigador manipula ciertos estímulos, tratamientos o
condiciones y observa el resultado de las unidades observadas.
Existen muchos métodos mediante los cuales podemos obtener los datos
necesarios primero, podemos buscar datos ya publicados por fuentes
gubernamentales, industriales o individuales. En segundo Lugar, podemos diseñar
un experimento para obtener los datos necesarios. Tercero, podemos conducir un
estudio. Cuarto, podemos hacer observaciones del comportamiento, actitudes u
opciones de los individuos en los que estamos interesados.
Estas fuentes de datos también pueden clasificarse como:

7.4 FUENTES INTERNAS.


Los datos procedentes de Fuentes Internas son aquellos que se generan dentro de
la propia organización .entre ellos están , por ejemplo , los recursos de la cantidad
de géneros o servicios producidos, el número de horas de trabajo consumidas en
cada unidad de producción, la cantidad de materiales utilizados o desperdiciados
y el numero d ausencias al trabajo. Estos datos se consiguen de los departamentos
operativos y de los departamentos staffs como son los de contabilidad y de
recursos humanos.

7.5 FUENTE EXTERNAS.


Los datos que se generan fuera de los negocios u organizaciones se dice que se
producen de fuentes externas. Entre las fuentes mas importantes de esta clase de
información .Están las agencias gubernamentales, las asociaciones profesionales
y comerciales y las publicaciones especializadas existen asimismo, empresas
privadas que se dedican a la recolectar y publicar una información útil sobre
economía en general condiciones especificas de mercado

M,Sc. Roly Alcides Cristobal Lara 9


CURSO: ESTADÍSTICA DESCRIPTIVA

Fuentes de
recolección
de datos

Fuentes de Fuentes de datos


datos secundarios
primarios

Registros Fuentes externas


internos

 Resultados de ventas
(clientes) Datos Fuentes estandarizados de Internet
 Actividad de mercadotecnia publicados datos de mercadotecnia
(insumos)
 Información de costos
 Informes de distribuidores y
retroalimentación. Electrónic Impreso  Auditorias a tiendas
 Retroalimentación de los
os s  Servicios de retiros de almacén
clientes  Paneles de compra de
consumidores
 Gobierno
 Fuentes de datos individuales
 Asociaciones
 Servicios multimedia
comerciales
 Publicaciones periódicas
 Periódicos
 Libros
 Informes anuales
 Estudios privados

M,Sc. Roly Alcides Cristobal Lara 10


CURSO: ESTADÍSTICA DESCRIPTIVA

Separata Nº 02

MÉTODOS DE RECOLECCIÓN DE DATOS

Comprende fundamentalmente la aplicación de los principales procedimientos y métodos


que son utilizados con el fin de obtener los datos necesarios para un estudio determinado.
Elegir el método de recolección de datos depende de las posibilidades de acceso o
contacto con los elementos investigados, del tamaño de la población o muestra, de la
oportunidad de obtener datos y del presupuesto y exigencias del tiempo.
Los objetivos principales para la recolección son:
- Obtener los datos o respuestas a las variables analizadas.
- Proporcionar información adecuada y oportuna con fines de una óptima
planificación.
Para seleccionar el método de recolección de datos se debe tener en cuenta lo siguiente:

a. Establecer Objetivos Claros


Antes de recoger la información se debe decidir que se va a hacer con ella. Cualquier
recolección de información a de tener un objetivo especifico y ser seguida por acciones.
La información es una guía para nuestras acciones. A partir de al información conocemos
los hechos pertinentes y adoptamos acciones apropiadas basadas en esos hechos.

b. Definir su propósito
Una vez que se define el objetivo de la recolección de la información, también se
determina los tipos de comparación que se necesitan, y esto a su vez identifica el tipo de
datos que se deben de recoger.

c. Confiabilidad De Las Mediciones


Esta directamente relacionada a la adecuada selección de la muestra

1. METODOS

a. CENSO
Es un método de recolección de datos mediante el cual la información se obtiene analizando
a la totalidad de los elementos que componen la población o universo bajo estudio. Un censo
debe cumplir las condiciones de universalidad (censar a todos los elementos de la población)
y simultaneidad (realizarse en un momento determinado) Un censo es equivalente a una
fotografía de la población bajo estudio.
El término censo no sólo se aplica a aquellos análisis que comprenden todas las unidades de
todo un país y que se realizan con una frecuencia de recolección quinquenal o decenal, como
es el caso de los censos de población, económicos, agropecuarios, etc., sino también a todo
análisis, cualquiera sea su cobertura geográfica, número de unidades de información, o
frecuencia de su recolección, siempre que incluya todas las unidades que componen el
universo que se investiga.

b. OBSERVACION
Es un proceso permanente de la investigación, a través del cual se conocen las
propiedades, relaciones y conexiones internas de un fenómeno e incluye las experiencias

M,Sc. Roly Alcides Cristobal Lara 11


CURSO: ESTADÍSTICA DESCRIPTIVA

mas causales y menos reguladas, como los registros filmados mas exactos de las
experiencias llevadas acabo en laboratorio.
Es un proceso sistemático realizado con instrumentos y técnicas especificas para cada
caso. Para realizarla, es necesario que el observador tenga un marco teórico y conceptual
de referencia sobre los indicadores de las variables de la hipótesis que permita llegar a la
“obtención de conceptos con significación objetiva”.

b.1 Procedimientos
La observación científica debe realizarse considerando las siguientes pautas
Preparar estrategias orientadas a capacitar información concreta.
Determinar la forma como controlar las variables.
Planificarla
Determinar el método y el tipo de observación.

b.2 Clases de observación


Las clases de observación son las siguientes:

Natural: constituye el instrumento de trabajo propio de los estudios iniciales de las


ciencias, en donde la creatividad, la imaginación y la capacidad organizativa del
investigador juegan un papel muy importante

Diferencial o Selectiva: es la que se orienta a determinar las diferencias existentes entre


los datos con sistema de clasificaciones. Estas diferencias son inherentes a la naturaleza
del objeto–sujeto (sexo, color etc) y adquiridas a través del desarrollo social (nivel
educativo, categoría ocupacional etc.)

Experimental: es un proceso previamente establecido, donde el investigador a través de


estímulos modifica o altera algunos de los componentes que conforman la estructura del
objeto de estudio con finalidad de obtener un resultado esperado, o reproducir el
fenómeno en las mismas condiciones.

Ordinaria o no Participante.- Se denomina así porque el observador esta fuera de los


sucesos pero no es independiente a ellos. Se utiliza cuando se tiene dificultades para
penetrar en el grupo social que origina el problema

Participante.- Es la observación desde adentro de la población. El investigador se


incorpora a ella y participa de las tareas y acontecimientos cotidianos , a fin de conocer
las relaciones sociales de producción.

b.3 Desventajas de la observación


Requiere personal especializado.
Puede resultar un método demasiado caro.
No es conveniente cuando se estudia grandes masas humanas.

c. ENTREVISTA
Consiste en una interacción entre dos personas, una de las cuales el investigador fórmula
determinadas preguntas relativas al tema en investigación, mientras que la otra el
investigado proporciona verbalmente o por escrito la información que le es solicitada.
La entrevista tiene una ventaja principal que le acentúa y es que puede completarse con
la observación directa, también tiene como principal desventaja el hecho que la

M,Sc. Roly Alcides Cristobal Lara 12


CURSO: ESTADÍSTICA DESCRIPTIVA

personalidad, posición social, la inflexión de la voz, la manera de hacer las preguntas


puedan hacer variar la respuesta.
Es una técnica que permite obtener información sobre las propiedades de un problema.
Los datos pueden ser novedosos o complementarios y ayudaran a cuantificar las
características y la naturaleza del objeto de estudio.

c.1 Aplicación
Esta técnica se aplica a informantes claves. Se considera informante clave a las personas
representativas y previamente seleccionadas de un grupo social para prestar información
sobre el tema de investigación.

c.2 Entrevistas no estructuradas:


Una entrevista no estructurada o no formalizada es aquella en que existe un margen más
o menos grande de libertad para formular las preguntas y las respuestas. No se guían por
un cuestionario o modelo rígido.
 Entrevista formal.
 Entrevista focalizada.
 Entrevista por pautas o guías.

c.3 Entrevistas formalizadas:


Se desarrolla en base a un listado fijo de preguntas cuyo orden y redacción permanece
invariable. Comúnmente se administran a un gran número de entrevistados para su
posterior tratamiento estadístico. Las preguntas suelen dividirse en dos grandes tipos:
1. Preguntas de alternativas fijas o cerradas.
2. Preguntas de final abierto o abiertas.

d. ENCUESTA
Es una técnica que permite obtener información de una muestra representativa de una
determinada población. Es un proceso a través del cual conseguimos datos de primera
mano y todos ellos que permitan especificar mejor el problema.
Dichos datos constituyen un aporte estadístico importante y son utilizados en los análisis
cualitativos-cuantitativos de las unidades encuestadas.
d.1 Organización
Organizar una encuesta implica:
Planear, dirigir, coordinar y controlar su aplicación.
Determinar por muestreo las unidades de análisis a encuestar.

Entrenar a los supervisores de campo y a los encuestadores


Precisar lugar fecha hora para la aplicación de dicha técnica.
Ordenar el materia de la encuesta
Indicar a los encuestadores los procedimientos para la ejecución de la encuesta.
Establecer las estrategias para seleccionar las unidades de análisis.

d.2 Aplicación
Para lograr el éxito de la encuesta debemos aplicar las siguientes estrategias.
Comprometer el apoyo de las entidades sociales
Determinar la muestra numérica
Centrar la encuesta para captar la información deseada.
Crear en la población un clima favorable a la aplicación de la encuesta.

M,Sc. Roly Alcides Cristobal Lara 13


CURSO: ESTADÍSTICA DESCRIPTIVA

Programar charlas, conferencias, para dar a conocer a la población da información que


necesitamos y al importancia que tiene para la solución del problema.

d.3 Tipos de encuesta


Encuesta Retrospectiva: en este tipo de encuesta se parte de datos que se conoce y la
investigación consiste en descubrir características de su historia.

Encuesta prospectiva: comienza con una muestra de la población estudiando una o mas
características a través del tiempo.

Encuesta directa por observación: es cuando el investigador observa personalmente


unidad por unidad.

M,Sc. Roly Alcides Cristobal Lara 14


CURSO: ESTADÍSTICA DESCRIPTIVA

CUESTIONARIO
1. Concepto
Un cuestionario es un plan formalizado para recolectar datos de los encuestados. La
función del cuestionario es la medición del comportamiento pasado, de las actitudes y de
las características del encuestado.
La medición de actitudes ha crecido en importancia, así como el número de técnicas para
su medición. Estas técnicas generalmente se incorporan al cuestionario. Los aspectos
involucrados en el diseño del cuestionario se relacionan directamente con el desarrollo y
administración de estas técnicas de medición de actitudes.

1.1 Componentes del cuestionario


Generalmente un cuestionario tiene cinco secciones:
1. Datos de identificación: generalmente ocupan la primera sección del cuestionario y
se relacionan con el nombre, dirección y número telefónico del encuestado. Los datos
adicionales incluirían elementos tales como la hora y la fecha de la entrevista, además del
nombre o código del entrevistador.
2. Solicitud de cooperación: es una pequeña enunciación abierta diseñada para obtener
la cooperación del encuestado con relación a la entrevista. Usualmente identifica primero
al entrevistador y/o a la organización que elabora la entrevista. En seguida se explica el
objeto del estudio y se indica el tiempo que se requiere para completar la entrevista.
Por ejemplo

BUENOS DÍAS (TARDES)


COMUNICOMETRÍA ESTA HACIENDO UNA ENCUESTA CON EL
PROPÓSITO DE CONOCER UNA SERIE DE OPINIONES QUE SE TIENE
ACERCA DE ESTA EMPRESA, Y PARA ELLO LE PEDIRÍA FUERA TAN
AMABLE DE CONTESTAR UNAS PREGUNTAS. NO LE TOMARA MÁS DE
20 MINUTOS.
LA INFORMACIÓN QUE NOS PROPORCIONE SERÁ MANEJADA CON LA
MAS ESTRICTA CONFIDENCIAL DESDE LUEGO, NO HAY PREGUNTAS
DELICADAS.

3. Instrucciones: Se refieren a comentarios realizados al entrevistador o encuestado con


relación a la forma de utilizar el cuestionario. Estos comentarios aparecen directamente en el
cuestionario cuando se emplea una encuesta por correo. En el caso de las entrevistas
personales y telefónicas se incluye una hoja por separado titulada "instrucciones para el
entrevistador" en la cual se explica el objetivo del estudio, plan de muestreo y otros aspectos
del proceso de recolección de datos. Además, el cuestionario puede contener instrucciones
especiales referidas con el uso de preguntas específicas.
Por ejemplo
¿Se ha obtenido la cooperación de todo el personal o la mayoría de este para el proyectó?

SI 1 NO 2
(Pase a la pregunta 26) (Pase a la pregunta 27)
4. Información solicitada: Constituye la parte más grande del cuestionario.
5. Datos de clasificación: Tratan sobre las características del encuestado. Estos datos los
suministra directamente el encuestado en el caso de una encuesta por correo. En las
personales y telefónicas el entrevistador recolecta los datos o, en algunos casos, puede estimar
tipos más sensibles de datos basado en la observación, por ejemplo, el ingreso.

M,Sc. Roly Alcides Cristobal Lara 15


CURSO: ESTADÍSTICA DESCRIPTIVA

1.2 Diseño del cuestionario


No existen pasos, principios o pautas que garanticen un cuestionario efectivo y eficiente. El
diseño es una técnica aprendida por el investigador a través de la experiencia y no por medio
de la lectura de una serie de pautas. De esta experiencia acumulada han surgido una serie de
pautas, que organiza el diseño en una secuencia de siete pasos, a saber:

1. Revisión de las consideraciones preliminares


El aspecto central es el desarrollo de los objetivos de la investigación y la enumeración
de las necesidades de información. Debe formularse el diseño de investigación, visualizar
y planear los pasos en el proceso de investigación. Por consiguiente deben tomarse
muchas decisiones antes del diseño del cuestionario:

a) decisiones previas: la etapa del diseño del cuestionario supone que el proyecto está
avanzado y que se han tomado muchas decisiones. Las decisiones relacionadas con el
diseño del cuestionario deben basarse en las decisiones relacionadas con otros aspectos
del proyecto de investigación y ser compatibles con ellas. Estas decisiones previas,
relacionadas al tipo de diseño de investigación y fuentes de información influyen
directamente sobre la característica y función del cuestionario dentro del proyecto. Es
esencial tener una visión clara de la población objetivo y conocer los detalles del plan de
muestreo. El diseño del cuestionario está muy relacionado con las características del
grupo de encuestados. Cuanto más heterogéneo sea ese grupo, más difícil será diseñar
sólo un cuestionario que sea apropiado para todos. Generalmente el cuestionario debe
diseñarse para que lo pueda comprender el menos capaz de los encuestados. Es necesario
especificar las escalas de medición y los medios de comunicación que se utilizarán. Se
deben visualizar las etapas del procesamiento y análisis de datos, así como la naturaleza
de los hallazgos de la investigación.

b) Vinculo entre las necesidades de información y los datos que van a recopilarse:
Antes de diseñar el cuestionario, el investigador debe tener una lista detallada de las
necesidades de información, así como una definición clara del grupo de encuestados. El
cuestionario es el vínculo entre la información que se necesita y los datos que van a
recolectarse.

Lógicamente, las preguntas del cuestionario deben fluir de la lista de necesidades de


información. ES obvio que no debe incluirse en el cuestionario ninguna pregunta, a menos
que se relacione con una necesidad específica de información. Sin embargo, en la práctica
existe una fuerte tendencia a incluir preguntas que parecen "interesantes" pero que no
tienen un vínculo específico con las necesidades de información. Las preguntas
innecesarias aumentan el costo de la encuesta e incrementan las demandas al encuestado.

2. Decidir sobre el contenido de las preguntas


El contenido de las preguntas está influido por:

a) habilidad para responder con precisión: suponiendo que los datos deseados sean
pertinentes al problema de decisión, el investigador debe estar consciente de la capacidad
del encuestado para proporcionar los datos. Muchos tipos de datos no se pueden recolectar
de manera exacta de los encuestados. Los datos inexactos pueden provenir de:

- La desinformación del encuestado: A menudo se nos formulan preguntas sobre temas


que no conocemos. En un cuestionario, las preguntas pueden poner a los encuestados en

M,Sc. Roly Alcides Cristobal Lara 16


CURSO: ESTADÍSTICA DESCRIPTIVA

esta situación. Es posible que se les solicite que proporcionen datos sobre el ingreso bruto
mensual o acerca de las compras con tarjeta de crédito de su cónyuge cuando no poseen
los datos exactos. Es posible que se les formulen preguntas sobre anuncios publicitarios,
productos, marcas o tiendas minoristas que desconocen por completo. Muchas veces los
encuestados responden estas preguntas aunque desconozcan el tema, quizá debido a que
no desean admitir esta falta de conocimiento. Algunas veces, la manera en que se formula
la pregunta estimula al encuestado para que la responda, porque implica que debería
conocer la respuesta.
- El encuestado es olvidadizo: Con frecuencia se formulan preguntas que hace algún
tiempo podíamos contestar pero que ahora hemos olvidado. Los estudios de investigación
han demostrado que olvidamos rápidamente la mayor parte de las situaciones después de
que las conocemos. La tasa de olvido es veloz durante los primeros días. Por consiguiente,
cuanto más tiempo haya transcurrido desde el momento del suceso, mayor será la
posibilidad de olvido. Cuando las necesidades de información de un estudio requieran
preguntas que solicitan al encuestado recordar sucesos sin importancia o que ocurren con
poca frecuencia, el investigador se encuentra a un problema potencialmente grave en el
diseño del cuestionario. Cuando nos enfrentamos con la recolección de datos acerca de
sucesos sin importancia o poco frecuentes, se debe tratar de entrevistar a aquellos
encuestados que tengan mayores posibilidades de recordar, por ejemplo, los compradores
recientes. En segundo lugar, el cuestionario puede incluir técnicas que estimulen la
recordación del suceso por parte del encuestado. La ventaja de la recordación con ayuda
proviene de la clave utilizada para estimular la memoria del encuestado. El grado de
estimulación puede variar desde insinuaciones limitadas hasta la presentación del suceso
real. Este último enfoque hacia la recordación con ayuda recibe el nombre de método de
reconocimiento. Los crecientes intentos para estimular la memoria del encuestado van
acompañadas de la posibilidad de una sugerencia sesgada que resulta de la presentación
de las claves. Cuando se emplea este enfoque, generalmente los investigadores
recomiendan que es útil tener varios niveles de estimulación sucesiva. Esto permite que
el investigador analice la influencia de la secuencia de preguntas y seleccione un nivel de
estimulación más apropiado para el estudio.
b) Deseo de responder con precisión: La renuencia a responder con precisión puede
reflejarse en un rechazo para responder una pregunta o una serie de preguntas (error de
no respuesta por ítem), y suministrar deliberadamente una respuesta incorrecta o
distorsionada a una pregunta (error de medición).
Existen tres razones para no estar dispuesto a responder con exactitud:
- la situación no es apropiada para revelar los datos;
- revelar los datos sería algo embarazoso
- revelar los datos es una amenaza potencial al prestigio o a las normas de los
encuestados.
Es importante recordar que el encuestado tiene una motivación limitada para responder
con exactitud a las preguntas. En el caso de las entrevistas personal y telefónica, la
presencia del entrevistador puede dar como resultado una mayor preocupación del
encuestado hacia cómo reaccionaría el encuestador a las respuestas y no a la exactitud de
éstas. El resultado puede ser un error de no-respuesta por ítem o, lo que es peor, respuestas
inexactas.
La buena voluntad del encuestado para responder a una pregunta es también una función
de su comprensión sobre el propósito legítimo para el cual se utilizan los datos. La
recolección de datos de clasificación puede ser un serio problema en este caso. El
encuestado puede dudar sobre si debe proporcionar datos exactos cuando se enfrenta

M,Sc. Roly Alcides Cristobal Lara 17


CURSO: ESTADÍSTICA DESCRIPTIVA

repentinamente a preguntas personales relacionadas con la edad, la ocupación y los


ingresos.
Las preguntas que ponen en aprietos al encuestado o que contienen un elemento de
prestigio o de adhesión a normas sociales pueden dar como resultado una respuesta
sesgada.
Se han desarrollado varios métodos para tratar el sesgo que resulta de la renuencia del
encuestado a responder con exactitud:
Enunciando contrarrestado: comienza la pregunta con un enunciado que sugiere que el
comportamiento en cuestión es bastante común y luego formula la pregunta al encuestado.
Enunciado indirecto: presenta al encuestado la pregunta sensible, elaborada con palabras
que se refieran a otras personas. Se supone que el comportamiento o actitud del
encuestado se verán reflejados en la respuesta.
Categorías de respuesta clasificadas: muestra al encuestado una tarjeta que numera las
alternativas de respuestas sensibles, identificadas con letras o con números. El encuestado
debe utilizar la letra o el número para indicar una respuesta a la pregunta sensible.
Técnica de respuesta aleatoria: formula al encuestado dos preguntas que puede contestar
con un "si" o un "no". Una de las preguntas es la sensible, mientras que la otra pregunta
trata un tema que no es sensible. Se utiliza un procedimiento aleatorio (por ejemplo),
lanzar al aire una moneda) para determinar cuál de las dos preguntas contestará el
encuestado. Puesto que el formato de respuestas de las dos preguntas es idéntico (es decir,
si o no) el entrevistador no sabe cuál de las preguntas contestó el encuestado.

3º Decidir sobre el formato de respuestas:


Una vez que se han analizado los problemas relacionados con el contenido de las
preguntas, el siguiente tema se refiere al tipo de preguntas que debe emplearse. En este
caso la preocupación está asociada con el grado de estructura impuesto a las respuestas
de la persona. Los tres tipos de preguntas varían entre formatos de respuesta no
estructurados y estructurados: (1) preguntas de respuesta abierta, (2) preguntas de
selección múltiple y (3) preguntas dicotómicas.

a) Preguntas de respuesta abierta: Requiere que los encuestados proporcionen su


respuesta a la pregunta. En la entrevista por correo debe dejarse un espacio en blanco para
que el encuestado escriba la respuesta. En las entrevistas persona l y telefónica, el
encuestado informa verbalmente la respuesta al entrevistador, quien a su vez escribe la
respuesta en el cuestionario.

Ventajas: Estas preguntas sirven como una excelente primera pregunta de un tema.
Permiten que se expresen las actitudes generales, lo que puede ser de gran ayuda para
interpretar las preguntas más estructuradas. Además, establecen una armonía y logran
obtener la cooperación del encuestado para que responda preguntas más específicas y
estructuradas. Las preguntas introductorias de respuesta abierta son especialmente
importantes en las encuestas por correo. Las preguntas de respuesta abierta influyen sobre
las respuestas en menor grado que las preguntas de selección múltiple o dicotómicas. Los
encuestados no están influenciados por un conjunto predeterminado de alternativas de
respuesta y pueden expresar libremente puntos de vista divergentes a las expectativas del
entrevistador. Esta característica hace que las preguntas de respuesta abierta sean útiles
para la investigación exploratoria. Además, estas preguntas pueden proporcionar al
investigador ideas, comentarios y explicaciones útiles para desarrollar un "tacto" para los
hallazgos de la investigación. El informe final puede incluir citas de las preguntas de

M,Sc. Roly Alcides Cristobal Lara 18


CURSO: ESTADÍSTICA DESCRIPTIVA

respuesta abierta para dar realismo y vida a los hallazgos más estructurados de la
investigación.

Desventajas: Una de las principales desventajas es el alto potencial de sesgo por parte del
entrevistador. Los entrevistadores rara vez registran al pie de la letra las respuestas de los
encuestados. Esto da como resultado que el entrevistador resuma la respuesta o suprima
aquellos aspectos de la pregunta que él considere poco importantes. Una segunda
desventaja radica en el tiempo y costo asociados con la codificación de las respuestas. En
el caso de una encuesta grande, se requieren procedimientos exhaustivos de codificación
para resumir las respuestas divergentes en un formato útil para el análisis y la presentación
de los datos. El tiempo y costo de este proceso puede representar una parte significativa
del costo total del proyecto de investigación.

Algunas veces se utilizan preguntas precodificadas con el propósito de aprovechar las


ventajas de las preguntas de respuesta abierta y disminuir algo del tiempo y costo
asociados al proceso de edición y codificación. Una pregunta precodificada es una
pregunta de selección múltiple que se presenta al encuestado como una pregunta de
respuesta abierta. Las alternativas de respuesta no se leen al encuestado. Por el contrario,
el entrevistador selecciona la alternativa de respuesta adecuada basándose en la respuesta
del encuestado a la pregunta de respuesta abierta.
Otras desventajas incluyen la ponderación extra implícita que se da a los encuestados que
se expresan en forma precisa y que tienden a expresar más puntos en sus respuestas.
Asimismo, las preguntas de respuesta abierta son menos apropiadas para los cuestionarios
autoadministrados. Esto se debe a que los encuestados tienden a ser más breves cuando
escriben que cuando hablan.
En general, las preguntas de respuesta abierta son más apropiadas para la investigación
exploratoria y la investigación diseñada para desarrollar preguntas más estructuradas.
Aunque el costo para desarrollar preguntas estructuradas efectivas puede ser alto, debe
evaluarse en contraste con las desventajas de las preguntas de respuesta abierta.
Por otro lado las preguntas abiertas son particularmente útiles cuando no tenemos
información sobre las posibles respuestas de las personas o cuando esta información es
insuficiente.

b) preguntas cerradas: definen de antemano las alternativas de respuesta, pueden ser


dicotómicas (dos alternativas de respuesta) o incluir varias alternativas de respuesta Las
preguntas cerradas son fáciles de codificar y preparar para su análisis, pero su principal
desventaja reside en que limitan las repuestas de la muestra y en ocasiones ninguna de las
opciones describe con exactitud lo que las personas tienen en mente.
Exige que el encuestado seleccione una respuesta de una lista suministrada en la pregunta
o a continuación de la misma. Al encuestado se le solicita que seleccione una o más de
las alternativas que se presentan.

Ventajas: Superan muchas de las desventajas asociadas con las preguntas de respuesta
abierta. Lo más importante es que reducen el sesgo del entrevistador y el costo y tiempo
asociados con el procesamiento de los datos. Normalmente el entrevistador encontrará
que este tipo de preguntas es más fácil y rápido de administrar. Finalmente, con
cuestionarios autoadministrados es difícil que los encuestados mantengan la cooperación
a menos que la mayor parte de las preguntas tengan un formato de respuesta estructurado.

M,Sc. Roly Alcides Cristobal Lara 19


CURSO: ESTADÍSTICA DESCRIPTIVA

Desventajas: El diseño de preguntas efectivas de selección múltiple requiere de una


cantidad considerable de tiempo y costo. A menudo se requiere un estudio exploratorio
con base en preguntas de respuesta abierta para formular las alternativas de respuesta. Si
estas últimas no incluyen una o más de las respuestas predominantes, se genera un sesgo
sustancial en los resultados. Aunque existe la alternativa de "otros (especificar)" el
encuestado tiende a seleccionar entre las alternativas especificadas en vez de utilizar esta
categoría. En segundo lugar, las preguntas de selección múltiple tienden a sesgar los datos
de acuerdo con el orden en el cual se presentan las alternativas de respuesta.

Aspectos en el diseño de preguntas de selección múltiple: Hay que considerar dos


aspectos:
Número de alternativas: Este número se ve influenciado por los dos siguientes principios:
a) las alternativas de respuestas deben ser colectivamente exhaustivas, es decir, deben
incluir todas las posibles alternativas de respuesta. La inclusión de la alternativa "otros
(especificar)"es un intento por cumplir con este principio. b) Las alternativas deben ser
mutuamente excluyentes, es decir que los encuestados deben identificar una alternativa
que represente claramente su respuesta.
Sesgo de posición: En el caso de una lista de números, como los precios o los números
de visitas a un lugar, se establece un sesgo hacia la posición central del conjunto de
números. Cuando se involucran ideas, la primera alternativa en la lista tiene una mayor
oportunidad de selección. Para controlar el sesgo de posición, el investigador debe
alternar el orden en el cual se enumeran las alternativas.

c) Preguntas dicotómicas: Es una forma extrema de la pregunta de selección múltiple


que permite al encuestado sólo dos respuestas, como "si – no", "estoy de acuerdo – no
estoy de acuerdo", etc. Generalmente las dos alternativas de interés se combinan con una
alternativa neutral, como "no sé" o "sin opinión".
Por ejemplo:
¿Estudia usted actualmente?
( ) si ( ) No
Ventajas: Son esencialmente las mismas que las de selección múltiple. Los
entrevistadores encuentran que las preguntas pueden administrarse con rapidez y
facilidad. La posibilidad de que se presente un sesgo por parte del entrevistador es menor
y las respuestas son fáciles de codificar, procesar y analizar.

Desventajas: Existe el riesgo de suponer que el grupo de encuestador aborda el tema en


términos dicotómicos, cuando en realidad pueden existir muchos grados de sentimientos
presentes o predominar la indecisión. Forzar a los encuestados a que expresen sus puntos
de vista en forma dicotómica cuando no están polarizados, puede generar resultados que
contienen un error sustancial de medición. Las preguntas dicotómicas son especialmente
susceptibles al error que resulta de las palabras con que se formula la pregunta.

Aspectos de diseño de la pregunta dicotómica: El aspecto fundamental se relaciona con


la decisión de incluir o no una alternativa neutral de respuesta. Si no se incluye, el
encuestado se verá forzado a seleccionar entre las dos posiciones que se presentan. Si hay
disponibilidad de una alternativa neutral, y especialmente si se le muestra al encuestado,
éste puede evitar tomar una posición sobre el tema mediante la selección de la alternativa
neutral. Cuando se incluye la alternativa neutral, debe disminuir el número de no
respuestas e incrementarse el número de respuestas neutrales. Si un grupo significativo
de encuestados es verdaderamente neutral, la inclusión de la alternativa neutral debe

M,Sc. Roly Alcides Cristobal Lara 20


CURSO: ESTADÍSTICA DESCRIPTIVA

incrementar la exactitud de los resultados. Sin embargo, puede surgir una fuente de sesgo
cuando los encuestados que no son neutrales seleccionan la alternativa neutral por razones
de conveniencia, confusión, etc. Si la proporción de encuestados verdaderamente neutral
es grande, es conveniente la inclusión de la alternativa neutral. Si se considera que la
proporción de encuestados neutrales es pequeña, es mejor forzar a los encuestados a que
seleccionen entre las dos posiciones de interés.

d) Número de preguntas para medir una variable


En ocasiones sólo basta una pregunta para recolectar la información necesaria sobre la
variable a medir. por ejemplo, para medir el nivel de escolaridad de una muestra., basta
con preguntar: ¿Hasta qué año escolar cursó? o ¿cuál es su grado máximo de estudios?.
En otras ocasiones es necesario elaborar varias preguntas para real consistencia de las
respuestas por ejemplo el nivel económico puede medirse preguntando: ¿cuál es su nivel
mensual de ingresos?, también preguntando: Aproximadamente, ¿cuántos focos
eléctricos tiene su casa?, es recomendable hacer solamente las preguntas suficientes. Si
se justifica hacer varias preguntas, entonces es conveniente plantearlas en el cuestionario.
Esto último ocurre con frecuencia en el caso de variables con varias dimensiones o
componentes a medir, en donde se incluyen varias preguntas para medir las distintas
dimensiones.

e) Precodificación de las preguntas


Siempre que se pretendan efectuar análisis estadístico es necesario codificar las
respuestas de los sujetos a las preguntas del cuestionario, y debemos recordar que esto
significa asignarlas símbolos o valores numéricos a dichas respuestas. Además cuando
se tienen preguntas ".cerradas", es posible codificar "a priori" o precodificadas las
alternativas de respuesta e incluir esta premodificación en el cuestionario.
Por ejemplo
Cuando se enfrenta usted a un problema en su trabajo, para resolverlo recurre
generalmente a:
(1) Su superior inmediato
(2) Su propia experiencia
(3) Sus compañeros
(4) Los manuales de políticas- y procedimientos
(5) Otra fuente ___________________________
(especificar)

En ambas preguntas (abiertas y cerradas) las respuestas van acompañadas de su valor


numérico correspondiente si han sido precodificadas obviamente en las preguntas
"abiertas" no puede darse la premodificación,. la codificación se realiza posteriormente,
una vez que se tienen las respuestas. Las preguntas y alternativas de respuesta
precodificadas tienen la ventaja que su codificación y preparación para el análisis son más
sencillas y requieren de menos tiempo.

4º Decisión sobre las palabras de las preguntas


La parte central del cuestionario está compuesta por las preguntas formuladas. Estas
preguntas representan el vínculo entre los datos y las necesidades de información del
estudio. Es muy importante que el investigador y el encuestado den el mismo significado
a las preguntas formuladas. Si no es así, un grave error de medición está presente en los
resultados de la investigación.

M,Sc. Roly Alcides Cristobal Lara 21


CURSO: ESTADÍSTICA DESCRIPTIVA

Puesto que no existe una forma única y correcta de redactar una pregunta, es importante
tener en cuenta qué efecto puede tener una determinada redacción sobre los resultados.
Para lograr este propósito puede emplearse la técnica de la división por balotas, la cual
selecciona los cuestionarios en grupos y asigna a preguntas alternativas a cada grupo. La
comparación entre las preguntas alternativas determina la forma como la redacción de la
pregunta afecta los resultados. Esta técnica permite una mejor interpretación de los
resultados de la encuesta, que cuando se utiliza una sola versión de la pregunta.
Los siguientes son nueve principios generales que se deben considerar al diseñar la
redacción de una pregunta:
1. Emplear palabras sencillas
2. Emplear palabras claras (las que tienen sólo un significado)
3. Evitar preguntas que sugieren la respuesta
4. Evitar preguntas sesgadas
5. Evitar alternativas implícitas
6. Evitar supuestos implícitos
7. Evitar estimaciones
8. Evitar preguntas de doble respuesta
9. Considerar el marco de referencia
10. El lenguaje utilizado en las preguntas debe ser adaptado a las características del
encuestado.
11. Las preguntas no deben de incomodar al receptor

5º Decidir sobre la secuencia de las preguntas


Una vez que se ha determinado la redacción de las preguntas, el siguiente paso es
establecer su secuencia, es decir, el orden o flujo de las preguntas en el cuestionario. La
secuencia de las preguntas puede influir en la naturaleza de las respuestas de los
encuestados y puede ser la causa de un grave error en los hallazgos de la encuesta.
Es conveniente iniciar con preguntas neutrales o fáciles de contestar, para que el
respondiente vaya adentrándose en la situación. No se recomienda comenzar con
preguntas difíciles de responder o preguntas muy directas. Imaginamos un cuestionario
diseñado para obtener opiniones en torno al aborto que empiece con una pregunta poco
sutil tal como: ¿Esta usted de acuerdo en que se legalice el aborto en este país? Sin lugar
a dudas será un fracaso.
Aunque este aspecto del diseño se basa, en gran parte, en las capacidades del investigador,
existen varias pautas útiles:
1. Utilizar una pregunta introductoria sencilla e interesante
2. Formular primero las preguntas generales
3. Colocar las preguntas poco interesantes y difíciles al final de la secuencia
4. Distribuir las preguntas en orden lógico.

6º Decidir sobre las características físicas


La apariencia física del cuestionario puede influir en el logro de la cooperación del
encuestado. Este caso se presenta, particularmente, en las encuestas por correo. Es
importante que el nombre de la organización patrocinadora de la encuesta (por lo general
un nombre ficticio para evitar sesgo) y el nombre del proyecto aparezcan claramente en
la primera página.
En el caso de las entrevistas personal y telefónica, los cuestionarios deben enumerarse en
serie. Esto facilita el control del cuestionario en las operaciones de campo y durante el

M,Sc. Roly Alcides Cristobal Lara 22


CURSO: ESTADÍSTICA DESCRIPTIVA

procesamiento de datos. Los cuestionarios por correo no tienen que identificarse


numéricamente cuando es importante mantener el anonimato del encuestado.
Finalmente, el formato de una pregunta puede influir en la respuesta. En el caso de
cuestionarios auto administrados y los administrador por un entrevistador, los
investigadores han descubierto que cuanto más líneas o espacios en blanco se dejen para
registrar la respuesta a las preguntas de respuesta abierta, más extensa será la respuesta.

7º Tamaño de un cuestionario
No existe una regla al respecto, si es muy corto se pierde información y se resulta largo
puede resultar tedioso de responder o al menos no completar el cuestionario. El tamaño
depende del número de variables y dimensiones a medir, el interés de los respondientes y
la manera como es administrado (de este punto se hablara en el siguiente inciso).

8º Aplicación de cuestionario
Los cuestionarios pueden se aplicados de diversas maneras:
a) Auto administrativo. En este caso el cuestionario se les proporciona directamente
a los respondientes, quienes lo contestan. No hay intermediarios y las respuestas
las marcan ellos.
b) Por la entrevista personal. En esta situación, un entrevistador aplica el
cuestionario a los respondientes (entrevistados). El entrevistador va haciéndole
las preguntas al respondiente y va anotando las respuestas.
c) Por entrevista telefónica. Esta situación es similar a la anterior, solamente que la
entrevista no es “cara a cara” sino a través del teléfono. El entrevistador la hace
las preguntas al respondiente por este medio de comunicación.
d) Auto Administrado y enviado por correo posta, electrónico o servicio de
mensajería. En este caso también los respondientes contestan directamente
cuestionario, ellos marcan o anotan las respuestas, no hay intermediario.
Solamente que no se entregan los cuestionarios directamente a los respondientes
(“en propia mano”) sino que se les envía por correo y otro medio, no hay
retroalimentación inmediata, si los sujetos tienen alguna duda o se les puede
aclarar en el momento.

9º Llevar a cabo una pre-prueba, revisión y borrador final


Antes de que el cuestionario esté listo para las operaciones de campo, necesita una pre-
prueba y revisión. La pre-prueba se refiere a la prueba inicial de uno o más aspectos del
diseño de investigación. En este caso interesa la pre-prueba del diseño del cuestionario,
porque se necesita una pre-prueba para buscar las áreas que deben mejorarse, a pesar de
los conocimientos del investigador. La mayor parte de los cuestionarios requieren, por lo
menos, una pre-prueba y una revisión antes de estar listos para las operaciones de campo.
Preferiblemente, el cuestionario debe someterse a esta pre-prueba de la misma forma que
va a emplearse en el estudio final. Sin embargo, si se tiene el borrador inicial del
cuestionario, es mejor hacer una pre-prueba con entrevistadores personales, aunque la
encuesta vaya a realizarse por correo o por teléfono. Un entrevistador capacitado puede
responder a las solicitudes de una explicación, detectar las áreas de confusión y explorar
la naturaleza de esta confusión. El entrevistador debe estar consciente de las palabras que
no entiendan todos los encuestados, probar la secuencia de las preguntas y anotar las
dificultades mecánicas y similares. Por último, será necesario someter a pre-prueba el
cuestionario revisado, tal como va a presentarse en la encuesta final.
El número de personas entrevistadas en una pre-prueba puede oscilar entre 15 y 30. La
muestra debe ser similar a la de las personas entrevistadas en el estudio principal.

M,Sc. Roly Alcides Cristobal Lara 23


CURSO: ESTADÍSTICA DESCRIPTIVA

10º Consejos para la administración del cuestionario, dependiendo del contexto


Cuando se tiene población analfabetita, con niveles de educativos bajos o niños que
apenas comienzan a leer o no dominan la lectura, el método más conveniente de
administración de un cuestionario es por una entrevista.
Cuando se utiliza las entrevistas telefónicas se debe tomar en cuenta el horario. Ya que si
ambos solo a una hora (digamos en la mañana), nos encontramos con unos cuantos
subgrupos de la población.
Cuando lo enviamos por correo o es auto administrado directamente, las instrucciones
deben pecar de precisas, claras y completas. Y debemos de dar instrucciones que motiven
al respondiente para que continuara contestando el cuestionario.
Las entrevistas personales requieren de una atmósfera apropiada el entrevistador debe ser
amable y tiene que generar confianza en el entrevistado. Cuando se trata de entrevistador
del sexo masculino, mujeres simpáticas y agradables suelen resultar excelentes
entrevistadores.
Quien responde a una entrevista debe concentrarse en las preguntas y estar relajados. La
elección del contexto para administrar el cuestionario deberá ser muy cuidadosa y
dependerá del presupuesto del que disponga, el tiempo de entrega de los resultados, los
objetivos de la investigación y el tipo de respondientes. (Edad, nivel educativo, etc.).
Cuando los cuestionarios son muy complejos de contestar o aplicar, suele utilizarse en un
manual que explica a fondo las instrucciones y como debe responderse o ser administrado.
Un aspecto muy importante que es necesario mencionar, resise en que cuando se
construya un cuestionario al igual que otros instrumentos de medición se debe ser
consistente en todos los aspectos. Por ejemplo, si se decide que las instrucciones vayan
en mayúsculas o algún tipo de letras especial, todas las instrucciones deberán hacer así.
Si se refiere que los códigos de las categorías de respuesta van en recuadro, todas deberán
ajustarse a esto. Si no se es consistente, algunos respondientes o entrevistados pueden
desconectarse.

M,Sc. Roly Alcides Cristobal Lara 24


CURSO: ESTADÍSTICA DESCRIPTIVA

Separata Nº 03

ORGANIZACIÓN DE DATOS

La siguiente fase a la recolección de datos es la Organización y Clasificación de los


Datos.
Para iniciar la organización de datos definiremos algunos conceptos:

1. Clase: Es una división de la variable. Se denota como subíndice con la letra “i” y el
número total de clases con “m”

2. Frecuencia: Es las veces que se repite una clase de la variable. Estas son: Simples y
Acumuladas

2. 1 Frecuencias Simples: Son aquellas frecuencias que sólo correspondes a una clase
de la variable entre ellas tenemos:

2.1.1. Frecuencia Absoluta Simple


La frecuencia absoluta simple de la clase ci es el número fi, de observaciones que
presentan una modalidad perteneciente a esa clase.
Además se cumple que:
m

f
i 1
i n

2.1.2 Frecuencia Relativa Simple


Frecuencia Relativa Simple de la clase ci es el cociente hi, entre las frecuencias absolutas
de dicha clase y el número total de observaciones, es decir:
fi
hi 
n

Obsérvese que fi es el tanto por uno de observaciones que están en la clase ci.
Multiplicado por representa el porcentaje de la población que comprende esa clase.
También cumple:
m

hi 1
i 1

2.1.3 Frecuencia Porcentual Simple


Frecuencia Porcentual Simple de la clase ci es el producto de pi, entre las frecuencias
relativas de dicha clase por 100, es decir
pi  hi *100
Cumple lo siguiente:
m

p
i 1
i  100

M,Sc. Roly Alcides Cristobal Lara 25


CURSO: ESTADÍSTICA DESCRIPTIVA

2.2 Frecuencias Acumuladas: Aquellas frecuencias que se obtienen por la suma de dos
o más clases de la variable

2.2.1 Frecuencia Absoluta Acumulada

Fi, se calcula sobre variables cuantitativas, y es el número de elementos de la población


cuya modalidad es inferior o equivalente a la modalidad ci:
i
Fi  f 1  f 2  ....  f i   f k
k 1

2.2.2 Frecuencia Relativa Acumulada

Hi, se calcula sobre variables cuantitativas, siendo el tanto por uno de los elementos de
la población que están en alguna de las clases y que presentan una modalidad inferior o
igual a la ci, es decir:
i
Fi
Hi   h1  h2  ...  hi   hk
n k 1

2.2.3 Frecuencia Porcentual Acumulada

Pi, se calcula sobre variables cuantitativas, siendo el tanto por ciento de los elementos de
la población que están en alguna de las clases y que presentan una modalidad inferior o
igual a la ci, es decir :
i
Pi  H i *100  p1  p2  ...  pi   pk
k 1

3. Distribución de Frecuencias

Llamaremos distribución de frecuencias o tabla de frecuencias al arreglo de filas y


columnas que contiene al conjunto de clases junto a las frecuencias correspondientes a
cada una de ellas. Una tabla estadística sirve para presentar de forma ordenada las
distribuciones de frecuencias. Su forma general es la siguiente:

M,Sc. Roly Alcides Cristobal Lara 26


CURSO: ESTADÍSTICA DESCRIPTIVA

Variable cualitativa

CLASE Fi hi pi
C1 f1 h1 p1
C2 f2 h2 f2

C3 f3 h3 p3

C4 f4 h4 p4

.. . . .
. . . .
Cm Fm hm pm

Variable cuantitativa

CLASE fi Fi hi Hi pi Pi
C1 f1 F1 = f1 h1 H1 = h1 p1 P1 = p1
C2 f2 F2 = f1 + f2 h2 H2 = h1 + h2 f2 P2 = p1 + p2

C3 f3 F3 h3 H3 p3 P3

. . .
. . . .
Cm fm Fm = n hm Hm = 1 pm Pm = 100

Si las clases van a estar conformadas por intervalos se debe seguir los siguientes pasos:
1. Determinar el mínimo (Mín) y el máximo (Máx) del conjunto de datos
2. Calcular el Rango (R) de datos mediante: R = Máx – Mín
3. Elegir el número de clases (m): se puede utilizar la siguiente fórmula m  2.54 n
siempre es un valor entero, redondear según criterios de redondeo. El valor de m
se puede elegir también a criterio y necesidades del investigador en un intervalo
de 5<m<20
R
4. Se calcula la amplitud del intervalo (a) mediante: a  siempre se redondea por
m
exceso (esto es siempre aumentar una unidad en la cifra de redondeo. Ejemplo si
a=1.23 y se desea redondear a 1 decimal el valor de a = 1.3)
5. Debido al redondeo por exceso que se realiza en el paso anterior, se debe realizar
el ajuste al rango (si el cociente de la amplitud es exacto no seguir este paso)
mediante los siguiente pasos:
5.1 Calcular el nuevo rango (R’) mediante R’ = a*m
5.2 Calcular el exceso del nuevo rango que estará dado por d=R’-R

M,Sc. Roly Alcides Cristobal Lara 27


CURSO: ESTADÍSTICA DESCRIPTIVA

5.3 A la diferencia se divide en dos partes (d/2) y se le disminuye al Mín (Mín –


d/2) y se le agrega al Máx (Máx + d/2) obteniendo nuevos límites.
6. Construir los intervalos de clase de la siguiente manera:

[yi-1 – yi> fi Fi hi Hi pi Pi
Mín – Mín +a f1 F1 = f1 h1 H1 = h1 p1 P1 = p1
Mín+a – Mín+2a f2 F2 = f1 + f2 h2 H2 = h1 + h2 f2 P2 = p1 + p2

Mín+2a – Mín+3a f3 F3 h3 H3 p3 P3

f4 F4 h4 H4 p4 P4

Mín+ka - Máx fm Fm = n hm Hm = 1 pm Pm = 100

M,Sc. Roly Alcides Cristobal Lara 28


CURSO: ESTADÍSTICA DESCRIPTIVA

PRACTICA DE ORGANIZACIÓN DE DATOS

1. Se realiza una encuesta a los estudiantes de la UCCI acerca de la preferencia de


en marcas de gaseosas, los resultados fueron los siguientes:
IK PE CC CC PE IK IK PE PE 7U
PE IK 7U IK CC 7U PE PE IK IK
7U O CC O IK PE PE IK 7U CC
O PE IK PE CC 7U CC CC PE PE
IK IK CC PE PE IK IK 7U PE CC
Donde : IK : Inca Kola PE : Pepsi
CC : Coca Cola 7U : 7 UP O : Otras
a. Construya una tabla de frecuencias y un cuadro de frecuencias.
b. ¿Qué porcentaje de alumnos de UCCI prefieren Inca Kola?
c. ¿Cuántos alumnos prefieren Pepsi?

2. La inversión anual (miles de $) de un grupo de pequeñas empresas fueron:


10 17 8 13 40 6 17 10 30 14 8 14 15 16
19 20 27 25 22 28 14 30 10 11 12 11 25 30 11
a. Construir una tabla de frecuencias.
b. Represente la información de la tabla mediante un polígono de frecuencias.

3. El Número de Acciones negociadas en la Bolsa de valores de Nueva York son las


siguientes
300 1000 1900 2700 3400 3800 4800 5600 6700 7400
400 1200 2000 2900 3400 3900 4800 5900 6700 7400
700 1400 2100 3100 3600 4300 5200 6200 6900 7600
900 1500 2500 3100 3700 4500 5300 6300 7200 7900
1000 1700 2700 3400 3800 4700 5600 6400 7300 8000
Construya la tabla de frecuencias.

4. El número de pasajeros diarios que viajaron a diferentes partes del país en una
línea aérea son los siguientes:
68 72 50 70 65 83 77 78 80 93
71 74 60 84 72 84 73 81 84 92
77 57 70 59 85 74 78 79 91 102
83 67 66 75 79 82 93 90 101 80
79 69 76 94 71 97 95 83 86 69
Construya la tabla de frecuencias.

5. Un cobrador de una empresa ha registrado el número de días que tarda en cobrar


cada una de sus cuentas de crédito. Se han obtenido los siguientes 30 registros:
21 6 12 45 57 11 20 32 8 10 7 105 28 19 19
72 40 13 21 26 5 14 19 38 3 86 42 28 20 35
a. Construya la tabla de frecuencias.
b. Las cuentas con más de 6 semanas (46 días) de retraso se consideran
incobrables y se envían al departamento legal. ¿Qué proporción de las
cuentas tendrán que ser enviadas al departamento

M,Sc. Roly Alcides Cristobal Lara 29


CURSO: ESTADÍSTICA DESCRIPTIVA

RECONSTRUCCIÓN DE TABLAS DE FRECUENCIAS


6. El consumo mensual de agua (m3) de 80 familias se tabuló en una distribución de
frecuencias simétrica de 7 intervalos de amplitud iguales a 3 siendo la marca clase
del cuarto intervalo igual a 19. Si las frecuencias del primer y tercer intervalo son
iguales a al 5% y15% del total respectivamente, y si la quinta frecuencia
porcentual acumulada es 85% del total.
a. Reconstruir la distribución de frecuencias
b. Grafique un polígono de frecuencias.

7. Los tiempos de vida útil (en días) de un tipo de objeto, se tabuló en una
distribución de frecuencias de 5 intervalos de igual amplitud con frecuencias
relativas acumuladas: 0,10 0,25 0,55 0,80 1,00. Determine la distribución de
frecuencias, si la tercera frecuencia absoluta acumulada es 11 y la segunda marca
de clase es 6 y si el limite inferior del cuarto intervalo es 12. Construir la tabla de
distribución de frecuencias.

8. La demanda diaria de azúcar (en miles de kilogramos) recopilada durante 190 días
en un supermercado, se tabuló en una distribución de frecuencias simétricas de 5
intervalos de amplitud igual a 4. Si la marca de clase del intervalo central es igual
a 12 y si la curva de frecuencias absolutas satisface la relación:
f(xi) = -(xi – 12)2 + 70 Donde xi es marca de clase

9. El tiempo (en horas) de 120 familias que utilizan su computadora se tabularon en


una distribución de frecuencias de 5 intervalos de amplitud igual a 4, siendo el
tiempo mínimo de uso 2 horas. La primera y segunda frecuencias son iguales al
10% y 15% del total de casos respectivamente. Si el 73.75% de las familias lo
usaron menos de 17 horas y el 85% menos de 19 horas.
a. Construya la tabla de frecuencias.
b. Grafique un polígono de frecuencias relativas.

10. Los puntajes de una prueba de aptitud se tabularon en una distribución de


frecuencias de 6 intervalos de amplitud constante. Si las marcas de clases del
segundo y cuarto intervalo son 40 y 80, las frecuencias relativas están relacionadas
de la siguientes manera: del primer es igual al sexto intervalo, la tercera y quinta
frecuencia son iguales, la cuarta frecuencia es igual a 0,25, del segundo intervalo
es igual al cuarto menos el primero, el tercer intervalo es al igual primero más
0.10 y la frecuencia absoluta acumulada del sexto intervalo es igual a 60.
Completar la distribución de frecuencias.

11. Las puntuaciones de un examen aplicado a un grupo de estudiantes, se tabularon


en una distribución de frecuencias de 6 intervalos de igual amplitud, de manera
que la marca de clase del segundo intervalo es 25 y el límite superior del quinto
intervalo es 60. Si las frecuencias porcentuales del primero al cuarto intervalo son
respectivamente 15, 20, 35, 14 y el 94% de la puntuaciones son menores de 60.
12. En una compañía el sueldo mínimo de 200 empleados es de S/525. Si se sabe que
10% de empleados ganan al menos S/525, pero menos de S/630, 30% ganan
menos de S/735, 55% ganan menos de S/840, 90% ganan menos de S/945 y el
10% restante de empleados ganan a lo más S/1050

M,Sc. Roly Alcides Cristobal Lara 30


CURSO: ESTADÍSTICA DESCRIPTIVA

Separata Nº 04

GRÁFICOS ESTADÍSTICOS

1. CONCEPTO
Una gráfica o diagrama es un dibujo complementario a una tabla o cuadro, que permite
observar las tendencias de un fenómeno en estudio y facilita el análisis estadístico de las
variables ahí relacionadas.

2. COMPONENTES DE UNA GRÁFICA:


Una gráfica, cuadro o una tabla, debe constar de:

2.1 Título adecuado: Claro y conciso, que responda a las preguntas: ¿Qué relaciona?,
¿cómo?, ¿cuándo?, y ¿dónde se hicieron las observaciones?

2.2 El cuerpo: O gráfico en sí, cuya elección debe considerar el o los tipos de variables
a relacionar, el público a quien va dirigido y el diseño artístico del gráfico.

2.3 Notas de pie de gráfico: En ella se presentan aclaraciones respecto al gráfico, las
escalas de los ejes, o se otorgan los créditos a las fuentes respectivas. Esta componente es
opcional

2.4 Fuente: Corresponde al área de la empresa o institución responsable de la elaboración


de la información

Es importante resaltar que por medio de gráficos tendenciosos se pueden deformar o


resaltar situaciones o estados, que presentados en un gráfico apropiado, mostrarían un
comportamiento normal. Generalmente una información es distorsionada por algunas de
las siguientes causas:
La relación entre los ejes no es la mas apropiada (ver gráficos No.1 y No.2.)

Variación de La Inflación en Gráfico No. 2


Colombia 1995-2000

Gráfico No. 1 Gráfico No. 3

M,Sc. Roly Alcides Cristobal Lara 31


CURSO: ESTADÍSTICA DESCRIPTIVA

Como se puede observar, el gráfico No.1 “realza” el decrecimiento de la variable


inflación, mientras que el No.2 intenta mostrar una estabilización o decrecimiento
parsimonioso.
Los dos dibujos son incorrectos debido a que no conservan una proporción adecuada entre
sus ejes. Sin embargo, el gráfico No. 3 tiene una buena proporción entre los ejes. Pero, la
distorsión se debe a la mala numeración en el eje “Y” pues, el punto de origen O ha sido
eliminado y asignado un valor arbitrario, la escala es inadecuada para resaltar el
decrecimiento inflacionario de los dos últimos períodos.
Ambas situaciones son erróneas o tendenciosas y se deben corregir asignando escalas
apropiadas a los ejes y utilizando la siguiente regla:

Donde:Lx: Longitud del eje horizontal


Ly: Longitud del eje vertical
“La longitud del eje vertical es igual a tres cuartos de la longitud del eje horizontal”.

3. PRINCIPALES TIPOS DE GRÁFICOS

Existe una gran cantidad de gráficos para la representación de datos estadísticos, entre los
principales tenemos:

1. Gráfico de Barras:
El gráfico de barras, como su nombre lo indica, está constituido por barras rectangulares
de igual ancho, conservando la misma distancia de separación entre sí. Se utiliza
básicamente para mostrar y comparar frecuencias de variables cualitativas o
comportamientos en el tiempo, cuando el número de ítems es reducido.
Se construye de la siguiente manera la base de las barra la conforman las categorías de la
variable y su altura se presenta con la frecuencias simples (absoluta, relativa o porcentual)
Se clasifican por:
Barras Simples: Compara valores entre categorías de una variable
Barras Dobles: Compara valores entre categorías de dos variables
Barras Múltiples Compara valores entre categorías de dos variables
Barra Verticales: Las categorías de la variable deben ubicarse en el eje X
Barras Horizontales: Las categorías de la variable deben ubicarse en el eje Y
Barras Apiladas: Compara entre categorías el aporte de cada valor en el total

M,Sc. Roly Alcides Cristobal Lara 32


CURSO: ESTADÍSTICA DESCRIPTIVA

2. Gráfico de Sectores Circulares:


Usualmente llamado gráfico de pastel, debido a su forma característica de una
circunferencia dividida en sectores, por medio de radios que dan la sensación de un pastel
tajado en porciones.
Se usa para representar variables cualitativas en porcentajes o cifras absolutas cuando el
número de ítems no es superior a 5 y se quiere resaltar uno de ellos. Para su construcción
se procede de la siguiente forma: La circunferencia tiene en su interior 360 grados, los
cuales hacemos corresponder al total de la información, es decir al 100%; luego, para
determinar el número de grados correspondiente a cada componente se multiplica el
porcentaje respectivo por 360 y se divide por 100, los cuales se miden con la ayuda de un
transportador para formar los sectores de los diferentes ítems.

CECATEC: Estado Civil de 50 Participantes en el Taller de Tejido

Fuente: Centro de Capacitación

3. Gráfico de Líneas o Tendencia:


Usado básicamente para mostrar el comportamiento de una variable cuantitativa a través
del tiempo. El gráfico de líneas consiste en segmentos rectilíneos unidos entre sí, los
cuales resaltan las variaciones de la variable por unidad de tiempo. Para su construcción
ha de procederse de la siguiente manera: en el eje de las ordenadas (Y) se marcan los
puntos de acuerdo con la escala que se esté utilizando. En el caso de una escala aritmética,
distancias iguales en el eje, representan distancias iguales en la variable.
El eje de la variable X se divide en unidades de tiempo iguales, teniendo presente el
número de ítems que ha de presentarse, así como la longitud del eje. Es de anotar la
conveniencia de mostrar la interrupción y acercamiento del eje a su origen cuando esto
haya ocurrido.
Cuando se tienen varias variables a representar, con el fin de establecer comparaciones
entre ellas (siempre que su unidad de medida sea la misma); se utiliza plasmarlos en un

M,Sc. Roly Alcides Cristobal Lara 33


CURSO: ESTADÍSTICA DESCRIPTIVA

sólo gráfico, el cual es el resultado de representar varias variables en un mismo plano. A


este tipo de gráfico se le conoce como gráfico de líneas compuesto.

4. Histograma de Frecuencias:
Es un gráfico de barra pero unidas. Se utiliza básicamente para mostrar la distribución de
frecuencias de variables cuantitativas. El histograma se construye dibujando barras
contiguas que tienen como base la amplitud de cada intervalo y como alturas las
frecuencias respectivas.
Para la construcción de un histograma de frecuencias de fácil interpretación y que no
falsee la información, debe disponerse de una distribución de frecuencias por intervalos
con amplitud igual para cada clase o intervalo. En el eje de las abscisas procedemos a
representar los intervalos de la variable, y en el eje de las ordenadas las frecuencias de
cada clase.

Distribuidora Chespi S.A.: Ventas Diarias en artículos de primera necesidad

Venta diarias (miles de sóles)


Fuente: Área de Contabilidad

5. Polígono de Frecuencias:
Es un gráfico poligonal cerrado. Se utiliza básicamente para mostrar la distribución de
frecuencias de variables cuantitativas. Para la construcción de un polígono de frecuencias,
se marcan los puntos medios (marcas de clase) de cada uno los intervalos en la parte
superior de cada barra del histograma de frecuencias, los cuales se unen con segmentos
de recta.

Distribuidora Chespi S.A.: Ventas Diarias en artículos de primera necesidad

M,Sc. Roly Alcides Cristobal Lara 34


CURSO: ESTADÍSTICA DESCRIPTIVA

Venta diarias (miles de sóles)


Fuente: Área de contabilidad

6. Histograma de Frecuencias Acumuladas:


Se utiliza básicamente para mostrar la distribución de frecuencias acumulada de variables
cuantitativas El histograma de frecuencias acumuladas también es obtenido a partir de
una distribución de frecuencias, tomando en el eje horizontal las clases de la variable, y
en el eje vertical las frecuencias acumuladas correspondientes a cada intervalo. Se
construye de la misma manera que un histograma pero utilizando frecuencias acumuladas.
Se puede mostrar mediante las barras o bien mediante un polígono abierto. Para la
construcción de un histograma de frecuencias acumulado, se marcan los límites
superiores de cada uno los intervalos en la parte superior de cada barra del histograma de
frecuencias acumulado, los cuales se unen con segmentos de recta. Este gráfico se le
conoce también con el nombre de Ojiva de frecuencias.

Distribuidora Chespi S.A.: Ventas Diarias en Distribuidora Chespi S.A.: Ventas Diarias en
artículos de primera necesidad artículos de primera necesidad

Venta diarias (miles de sóles) Venta diarias (miles de sóles)

7. Diagramas de dispersión o nubes de puntos:

Este tipo de gráfico es útil para representar la relación existente entre dos variables de
tipo cuantitativo
La representación gráfica de este tipo de variables es en realidad semejante a la
representación de puntos en el plano, usando unos ejes de coordenadas. Cada pareja de
valores da lugar a un punto en el plano y el conjunto de puntos que se obtiene se denomina
"diagrama de dispersión o nube de puntos".

M,Sc. Roly Alcides Cristobal Lara 35


CURSO: ESTADÍSTICA DESCRIPTIVA

Televisores: Relación entre Unidades Vendidas y Precio

V
e
n
t
a

Precio (Dólares)

8. Pictograma:
Tiene la característica de que las unidades de la variable se debe representar con símbolos
que lo identifique y su tamaño va en relación a la frecuencia de la categoría de la variable

9. Pirámide:
Se utiliza principalmente para presentar la distribución de la población por grupos etéreos
y género

10. Mapa:
Se utiliza principalmente para presentar información estadística por zonas geográficas de
un país, región, etc.

M,Sc. Roly Alcides Cristobal Lara 36


CURSO: ESTADÍSTICA DESCRIPTIVA

INTERPOLACIÓN E INTERPRETACIÓN DE CUADROS Y GRAFICOS

1. La distribución de los sueldos de los empleados en el mes de Octubre de una


fábrica se muestra en el siguiente cuadro :

Sueldo Mensual Total


(nuevos soles) Empleados
485 - 585 5
585 - 685 8
685 - 785 13
785 - 885 8
885 - 985 4
985 - 1085 2

a. ¿Cuántos empleados ganan entre 600 y 800 soles mensuales?


b. ¿Qué porcentaje de empleados ganan por lo menos 500 soles

2. Las ventas diarias (miles de dólares) de una tienda de equipos de parapentes se


tiene en el siguiente cuadro:

Ventas Días
(miles de $)
15 - 25 9
25 - 35 12
35 - 45 8
45 - 55 3
55 - 65 3
TOTAL 35

a. ¿Cuántos días se vendieron entre 20 mil y 40 mil dólares?


b. ¿Qué porcentaje de días observados se vendieron más de 50 mil dólares?

3. La demanda diaria de azúcar en un supermercado se presentan en el siguiente


histograma de frecuencias.
35
30
D 25
i 20
a 15
s 10
5
0
210 320 430 540 650 760
870
Demanda (kg)

a. ¿Cuántos días se observaron para este estudio?


b. ¿Cuántos días se vendieron más de 500 kg de Azúcar?

M,Sc. Roly Alcides Cristobal Lara 37


CURSO: ESTADÍSTICA DESCRIPTIVA

4. El siguiente cuadro muestra información de los accidentes ocurridos en 1999 en


Lima Metropolitana, según las causas. Utilice un gráfico de sectores para
presentar esta información.

CAUSAS DE ACCIDENTES ACCIDENTES


Exceso De Velocidad 1248
Ebriedad Del Conductor 535
Imprudencia Del Conductor 2379
Imprudencia Del Peatón 570
Desacato De Señales 246
Otros 140
TOTAL 5118

5. La demanda diaria de azúcar en un supermercado se presentan en el siguiente


histograma de frecuencias.
30
27
24
D 21
i 18
a 15
12
s 9
6
3
0
25 35 45 5565 7585
Demanda(kg)

a. ¿Cuántos días se observaron para el estudio?


b. ¿Cuántos días se vendieron más de 30 kg pero menos de 60 kg?

6. Las ventas anuales de un grupo de pequeñas empresas se presentan en la siguiente


ojiva de frecuencias.
22
20
18
16
E 14
12
m
10
p 8
6
4
2
0
8 18 28 38 48 58
Ventas(miles de $)

a. ¿Cuántas pequeñas empresas se estudiaron?


b. ¿Qué % de pequeñas empresas vendieron entre 20 y 45 mil dólares al año?

M,Sc. Roly Alcides Cristobal Lara 38


CURSO: ESTADÍSTICA DESCRIPTIVA

Separata Nº 05

MEDIDAS DESCRIPTIVAS

En los temas anteriores, se trató sobre la clasificación, ordenación y presentación de datos


estadísticos en distribuciones de frecuencia, limitando el análisis de la información a su
interpretación porcentual.
Una distribución de frecuencias presenta siempre varios valores. Si tratamos de saber
cuáles de estos valores por sí solos definen mejor al conjunto, no es posible decidir por
cual de ellos.
El análisis estadístico propiamente dicho, parte de la búsqueda de parámetros sobre los
cuales pueda recaer la representación de toda la información, realizándose esta
representación en las medidas descriptivas o también denominadas medidas de resumen.
Las principales medidas descriptivas se clasifican en:
1. Medidas de Tendencia Central y Posición
2. Medidas de Dispersión
3. Medidas de Asimetría
4. Medidas de Kurtosis

1. MEDIDAS DE TENDENCIA CENTRAL Y POSICIÓN

Las medidas de tendencia central, llamadas así porque tienden a localizarse en el centro
de la información.
De tendencia porque no necesariamente son valores que la distribución presenta, sino
valores hacia los cuales tiende o aproxima.
Centrales porque, normalmente, en el gráfico de frecuencias serán siempre valores
medios centrales.
Las medidas de tendencia central responden a la necesidad de describir una colectividad
en función de una sola medida que la caracterice y distinga, ya sea porque son los más
frecuentes (moda) o porque alrededor de ellos se agrupa la mayor parte de la población o
muestra (media o mediana),
Las medidas de tendencia central, son también medidas de posición ya que, de todas
maneras ocupan un lugar dentro de la información, los parámetros posicionales son muy
útiles en la interpretación porcentual de la información.
Este tipo de medidas son de gran importancia en el manejo de las técnicas estadísticas,
sin embargo, su interpretación no debe hacerse aisladamente de las medidas de dispersión,
ya que la representabilidad de ellas está asociada con el grado de concentración de la
información.
Las principales medidas de tendencia central y posición son:
Media aritmética.
Mediana
Moda.
Cuantiles
Media Ponderada
Media Geométrica
Media Armónica

M,Sc. Roly Alcides Cristobal Lara 39


CURSO: ESTADÍSTICA DESCRIPTIVA

MEDIA ARITMÉTICA

Definida matemáticamente como el cociente entre la suma de todos los valores de la


variable y el número de observaciones.

Cálculo de la Media

Para datos no agrupados Para datos agrupados

X
 xi X
 xi fi X   xi hi
n n

Simbología:
Si la media muestral es calculada de una población se simboliza mediante 
Si la media muestral es calculada de una muestra de una población se simboliza
mediante x
Propiedades de la media aritmética
1. La suma de las diferencias de los datos con respecto a la media aritmética es igual cero.

2. La suma de las diferencias cuadráticas de los datos, con respecto a la Media Aritmética,
es mínima.
3. La media aritmética de una constante es la misma constante.
4. Si a cada uno de los resultados le sumamos o le restamos una constante k , la Media
Aritmética queda alterada en esa constante.
5. Si cada uno de los datos se multiplica por una constante k, entonces la media aritmética
queda multiplicada por esa constante
6. La media aritmética de la suma o diferencia de dos variables es la suma o diferencia de
sus medias.

Ventajas de la media aritmética


- Es fácil de entender y usar.
- Hace uso de todos los datos de la distribución, por lo cual es una medida de tendencia
central eficiente.
- Es el más conocido y popular de los promedios, el primero en el que piensan las
personas, aunque no sepan estadística.
- El hecho de que su definición no sea lógica sino matemática hace que sea la medida de
tendencia central usada con preferencia en Inferencia Estadística y en la mayoría de
tests estadísticos.

Desventajas de la media aritmética


- Puede ser influenciada por valores extremos, que la hagan perder su valor como medida
de tendencia central
- En ciertos casos puede no representar un valor observable, lo cual en el caso de variables
discretas resulta artificioso.
- No puede calcularse para series cualitativas

M,Sc. Roly Alcides Cristobal Lara 40


CURSO: ESTADÍSTICA DESCRIPTIVA

- Resulta tedioso calcular la media debido a que utilizamos cada uno de los puntos de dato
de nuestro cálculo.
- Somos incapaces de calcular la media para un conjunto de datos que tiene clases de
extremo abierto, ya sea en el inferior o en el superior de la escala.

MEDIANA

Su definición no es matemática sino lógica, entendemos por mediana aquel valor de la


variable que divide en dos partes iguales a un conjunto ordenado de datos.

Simbología
Se simboliza con Me

Cálculo de la Mediana

Para datos no agrupados


Para el calculo de la mediana los datos deben estar ordenados de menor a mayor, y deja
a su izquierda y derecha el mismo número de elementos, es decir, el valor que ocupa el
lugar central es la mediana.
Lo anterior tiene sentido en caso de que la serie tenga un número impar de elementos, si
por el contrario tuviera un número par habría dos valores centrales, y en este caso se toma
como mediana la media aritmética de los dos valores centrales.

Para datos agrupados


Se aplica el siguiente estadígrafo
n / 2  F j 1
Me  Li j  a j
fj

50  Pj 1
0,5  H j 1 Me  Li j  a j
Me  Li j  a j pj
hj
MODA

Entendemos por moda el valor de la variable que más veces se repite, y en una
distribución de frecuencias el valor con mayor frecuencia absoluta simple

Simbología
Se simboliza con Mo

Cálculo de la Moda

Datos no agrupados
En este caso la determinación de la moda es inmediata por simple observación. Aquel
valor de la variable con mayor frecuencia absoluta simple es la moda.
Puede darse el caso de que no haya moda (amodal), sólo una (unimodal), dos modas
(bimodal) o varias modas (multimodal).

M,Sc. Roly Alcides Cristobal Lara 41


CURSO: ESTADÍSTICA DESCRIPTIVA

Datos Agrupados
f j  f j 1
Mo  Li j  a j
h j  h j 1 ( f j  f j 1 )  ( f j  f j 1 ) p j  p j 1
Mo  Li j  a j Mo  Li j  a j
(h j  h j 1 )  (h j  h j 1 ) ( p j  p j 1 )  ( p j  p j 1 )

PERCENTILES

Sucede también con frecuencia que al investigador o al analista le interesa reducir la


distribución de frecuencias de una variable a ciertas estructuras porcentuales que le sirvan
como patrón para efectuar comparaciones entre segmentos equivalentes de otras
distribuciones similares.
Lo que propone el análisis percentílico es simplemente determinar los valores de la
variable debajo de los cuales caen determinados porcentajes de frecuencia.
Hemos definido la mediana como aquel valor de la variable que deja por debajo de sí el
50% de las observaciones, definiremos el percentil de orden K como el valor de la
variable que deja por debajo de sí el i% de las observaciones.
Todo percentil sigue siendo índice de posición pero no tiene porque ser índice de
tendencia central (sólo el percentil 50 -mediana- lo es).
Entre los percentiles más frecuentes encontramos:
Los cuarteles: dividen la serie en cuatro partes iguales, en cuatro intervalos incluyendo
cada uno el 25% de las observaciones (Q1, Q2 y Q3) que dejan por debajo de sí el 25%,
50% y 75%, respectivamente de los valores de la serie.

Se necesita, entonces calcular tres cuartillas ya que la cuarta queda automáticamente

Los deciles: dividen la serie en 10 partes iguales cada una con el 10% de sus elementos.
El percentil 50 coincide con el decil 5, con el cuartil segundo y es lo que hasta ahora
hemos llamado mediana.

Cálculo de los Percentiles


Si para calcular la mediana buscábamos el ordinal correspondiente a n/2, o lo que es lo
mismo 50*n/100, para calcular cualquier percentil haremos lo mismo pero partiendo de
que el ordinal que queremos buscar será el correspondiente a i*n/100.
Hecho lo anterior el cálculo de cualquier percentil sigue los mismos pasos que los
seguidos en el cálculo del percentil 50 (mediana).
Para Datos Agrupados
i %n  F j 1
Pi  Li j  a j
fj

i 100  H j 1 i %  Pj 1
Pi  Li j  a j Pi  Li j  a j
hj pj

MEDIA PONDERADA

M,Sc. Roly Alcides Cristobal Lara 42


CURSO: ESTADÍSTICA DESCRIPTIVA

Hemos visto que la Media Aritmética se calcula con base a la magnitud de los datos,
otorgándoles igual importancia a cada uno de ellos. Sin embargo en muchas ocasiones la
magnitud del dato esta ponderada con un determinado peso que lo afecta relativamente.
La media aritmética ponderada aparece cuando a cada valor de la variable se le otorga
una ponderación o peso, en función de su distinta importancia relativa.
La Media Aritmética ponderada tiene en cuenta la importancia relativa de cada uno de
los datos, para lo cual la definimos con la siguiente expresión:

xw  
xi wi
 wi
Media de Submuestras: Se utiliza cuando la muestra total está dividida en submuestras o

una población dividida en sub poblaciones x


x ni i

n i

MEDIA GEOMÉTRICA

La media geométrica de un conjunto de n valores es la raíz n-ésima del producto de los


valores en el conjunto.
Este estadígrafo se aplica especialmente en los casos en que existe una taza de crecimiento
como ocurre en el crecimiento poblacional, en el calculo del monto de capitales a interés
compuesto.

Cálculo de la media geométrica

Para Datos No Agrupados Para Datos Agrupados

xg  n xi xg  n x i
fi

MEDIA ARMÓNICA

La media armónica se designa por “H”. es un estadígrafo de posición, definido como:


“La media armónica de un conjunto de valores X1;X2;.........Xn es el inverso de la media
aritmética de los inversos de los valores considerados”. También se tiene media armónica
simple y ponderada.
La media armónica se aplica cuando se presenta una relación entre variables implícitas.
Como por ejemplo productividad y tiempo.

Cálculo de la Media Armónica

Para Datos No Agrupados Para Datos Agrupados


n n
xh  xh 
1 1
x  x fi
i i

M,Sc. Roly Alcides Cristobal Lara 43


CURSO: ESTADÍSTICA DESCRIPTIVA

M,Sc. Roly Alcides Cristobal Lara 44


CURSO: ESTADÍSTICA DESCRIPTIVA

PRACTICA DE MEDIDAS DE TENDENCIA CENTRAL

1. El número de pasajeros diarios que viajaron a diferentes partes del país en una
línea aérea son los siguientes:
60 64 42 60 57 75 69 70 72 85 63 66 52
76 64 76 60 73 60 84 69 49 60 51 79 68
70 71 83 94
a. Calcular el promedio diario de pasajeros.
b. ¿Cuál es la cantidad máxima de pasajeros que viajaron el 50% de los días
observados?
c. Calcular la cantidad más frecuente de pasajeros diariamente

2. El gasto diario en fotocopias 15 estudiantes universitarios son las siguientes:


24,5 13,70 14,73 13,96 15,41 11,03 14,85 21,09
23,50 26,34 6,34 9,45 4,56 12,24 25,33
Calcular e interpretar:
a. Media b. Mediana c. Moda d. P90

3. El número de trabajos atendidos semanalmente en un centro de computo son los


siguientes:
58 64 42 62 57 75 69 70 72 85 67 62 58
76 64 76 65 78 76 84 73 44 62 55 79 98
70 71 83 91
a. ¿Cuál es el número promedio de trabajos atendidos?
b. ¿Cuál es la cantidad máxima de trabajos atendidos en la mitad de las
semanas observadas?
c. ¿Cuántos trabajos de atendieron en el 85% de los días observados

4. Las puntuaciones de un examen aplicado a un grupo de estudiantes, se tabularon


en una distribución de frecuencias de 6 intervalos de igual amplitud, de manera
que la marca de clase del segundo intervalo es 25 y el límite superior del quinto
intervalo es 60. Si las frecuencias porcentuales del primero al cuarto intervalo son
respectivamente 15, 20, 35, 14 y el 94% de la puntuaciones son menores de 60.
a. Calcular la puntuación promedio de este grupo de estudiantes.
b. Determine el puntaje máximo de la mitad de los estudiantes a los cuales
se les aplicó el examen
c. ¿Cuál es el puntaje más frecuente obtenido en el examen?

5. Los tiempos de vida útil (en días) de un tipo de objeto, se tabuló en una
distribución de frecuencias de 5 intervalos de igual amplitud con frecuencias
relativas acumuladas: 0,10 0,25 0,55 0,80 1,00. Determine la distribución de
frecuencias, si la tercera frecuencia absoluta acumulada es 11 y la segunda marca
de clase es 6 y si el limite inferior del cuarto intervalo es 12. Construir la tabla de
distribución de frecuencias.
a. Calcular el tiempo de vida promedio de dichos objetos.
b. Determine el tiempo de vida máximo 75% de los objetos producidos.
c. Calcular el tiempo de vida más frecuente de los objetos.

6. En una compañía el sueldo mínimo de 200 empleados es de S/525. Si se sabe que


10% de empleados ganan al menos S/525, pero menos de S/630, 30% ganan

M,Sc. Roly Alcides Cristobal Lara 45


CURSO: ESTADÍSTICA DESCRIPTIVA

menos de S/735, 55% ganan menos de S/840, 90% ganan menos de S/945 y el
10% restante de empleados ganan a lo más S/1050.
a. Calcular el sueldo promedio de los empleados de esta compañía.
b. Determine el sueldo máximo de la mitad de los empleados de la compañía.

7. Los siguientes 3 automóviles obtuvieron el kilometraje por galón de gasolina que


se indica abajo después de cubrir un trayecto de 500 Km. en una pista de pruebas:
Automóv Km./Gal
il ón
A 50.0
B 62.4
C 77.6

a. ¿Cuál es el número promedio de kilómetros por galón de los 3 automóviles?


b. Suponga que cada uno de los 3 automóviles llena 10 galones de gasolina en
el tanque y recorre un trayecto hasta que la gasolina se agota. Los Km. por
galón son los mismos que los mostrados. ¿Cuál es el número promedio de
kms. Por galón para los tres automóviles?
c. Compare esta respuesta con la de la parte (a) y explique.

8. Cada uno de cinco digitadores copió 10 páginas de material impreso a las


siguientes velocidades (cada página contenía 300 palabras):
43 64 75 52 31 palabras por minuto
a. ¿Cuál fue la velocidad promedio de los cinco digitadores?
b. Suponga que cada uno de los cinco digitadores digitaba por 10 minutos
a las velocidades indicadas ¿cuál sería la velocidad promedio en
palabras por minuto? Compare su respuesta con la parte (a) y explique.

9. Se han analizado las notas de estadística de dos aulas y se ha obtenido los


siguiente: la nota modal del aula A es 83, la nota media es 74 y la mediana es 77;
en el aula B, la nota modal es 71, la media es 80 y la mediana 77.
a. Dibuje una curva representando cada aula. Indique en ellas mas medidas
de tendencia central.
b. ¿Sería posible que el aula A, más de la mitad de los estudiantes obtenga
más de la nota media?
c. ¿Sería posible que el aula B, más de la mitad de los estudiantes obtenga
menos de la nota media?

10. Se pidió a 88 estudiantes de varios programas de MBA indicaron los salarios


iniciales mínimos que estaban dispuestos a aceptar. Los resultados son los
siguientes:

M,Sc. Roly Alcides Cristobal Lara 46


CURSO: ESTADÍSTICA DESCRIPTIVA

Sueldos Iniciales Estudiantes


(nuevos soles) MBA
1500 – 2000 5
2000 – 2500 8
2500 – 3000 7
3000 – 3500 10
3500 – 4000 12
4000 – 4500 15
4500 – 5000 12
5000 – 5500 10
5500 – 6000 2
6000 – 6500 7
Total 88

Si una empresa prestigiosa desea contratar los sólo a los titulados en MBA sólo
del 25% superior de su promoción. ¿cuál es el salario mínimo que debería ofrecer?

11. INEI da a conocer una gran cantidad de datos económicos y financieros, entre
ellos el PBI. A continuación se da el índice del PBI durante el año 1995 hasta el
1998
Período Indice
PBI
1995 1.0154
1996 1.0177
1997 1.0184
1998 1.0116
Calcular el incremento promedio del PBI.

12. Se selecciona al azar 100 vendedores de una gran compañía de seguros. A


continuación se muestra el número de pólizas vendidas durante una semana.

Nº de Vendedore Calcular e interpretar :


Pólizas s a. Media
1 2 b. Mediana
2 10 c. Moda
3 15 d. Tercer Cuartil
4 20 e. Decil tres
5 30 f. Percentil 67
6 14
7 5
8 2
9 2

13. Un encargado de compras ha obtenido muestras de tarjetas de video de dos


proveedores. En su propio laboratorio ha probado ambas marcas con respecto a la
duración de su vida útil, obteniéndose los siguientes resultados.

Vida Util Empresas


(horas) A B

M,Sc. Roly Alcides Cristobal Lara 47


CURSO: ESTADÍSTICA DESCRIPTIVA

700 – 900 10 3
900 – 1100 16 42
1100 – 1300 26 12
1300 – 1500 8 3

Calcular la medida más apropiada para decidir cual de las marcas debe
comprar.

14. En una empresa donde trabajan 500 obreros. El salario medio mensual alcanza a
1280 soles mensuales. Que sucede con este promedio si a cada trabajador:
a. se le aumentan 200 nuevos soles.
b. se le aumenta el 15% de su sueldo.
c. se le aumenta el 8% de sus sueldos, dándole además una bonificación de
120 nuevos soles por movilidad

15. Un grupo de 100 atletas viajan en dos aviones, el primero lleva 40 atletas y el
segundo los restantes. El peso medio de los 100 atletas es de 87,7 kgs. El peso
medio de los atletas que van en el segundo avión es de 4,6 kgs menos que el
primero. ¿Cuál es el peso medio de los atletas de cada avión?

16. El salario mensual pagado a los empleados de cierta empresa es de 1400 nuevos
soles. Los salarios medios mensuales pagados a los hombres y las mujeres de la
empresa son 1440 y 1350 nuevos soles respectivamente. Determine el porcentaje
de hombres y mujeres que trabajan en la empresa.

17. En la Carrera de Informática de la UCCI se conoce que en el curso de


Administración tiene 80 alumnos, su puntaje promedio es 14,2 y desviación
estándar 3,6; en el curso de Matemáticas hay 60 alumnos, su puntaje promedio es
12,8 y desviación estándar de 2,4; mientras que en curso de Estadística sólo se
sabe que el porcentaje promedio es 11,8 y desviación estándar de 2,9. Se sabe
que el promedio de los tres cursos es 13,5.
a. Determine el número de alumnos de Estadística.
b. Cual es el grupo de alumnos más consistente.

18. Los salarios en dólares de una muestra de 45 personas se clasifican en una


distribución de frecuencias de 5 intervalos de igual amplitud. Se sabe que el sueldo
más bajo es de $175, que la marca de clase del segundo intervalos es $220, que
las frecuencias absolutas del primer y tercer intervalo son respectivamente 5 y 20
y que las frecuencias acumuladas absolutas del segundo y cuarto intervalo son
respectivamente 15 y 42.
Calcular e interpretar
a. Complete la tabla de frecuencias.
b. El sueldo medio.
c. Si hay un aumento del 15% sobre sus sueldos y una bonificación de $23
por movilidad. ¿cuál será el promedio y la desviación estándar de los
sueldos?

19. El histograma que se presenta a continuación, representa las ventas (en miles de
nuevos soles) de una empresa.

M,Sc. Roly Alcides Cristobal Lara 48


CURSO: ESTADÍSTICA DESCRIPTIVA

12

10

D 8
I
A 6
S
4

0
127 137 142 147 162

VENTAS

Realice un análisis de las ventas utilizando las medidas de resumen que


considere más apropiadas y compare los resultados con el ejercicio
anterior.

20. A continuación se presenta los índices de precios de 4 artículos que se venden en


la cafetería de la Universidad

Artículo PRECIO PRECIO INDICE


2000 2001 2000/2001
Menú 2.0 2.5 1.25
Salchipapa simple 1.2 1.5 1.25
Arroz Chaufa 3.0 3.5 1.17
Sandwich de pollo 1.5 2.0 1.33

Calcular el incremento promedio de los precios de estos artículos.

M,Sc. Roly Alcides Cristobal Lara 49


CURSO: ESTADÍSTICA DESCRIPTIVA

2. MEDIDAS DE DISPERSIÓN

El análisis estadístico o el estudio de una serie estadística no puede quedarse sólo en el


cálculo de las medidas de tendencia central o de posición tales como la media, mediana,
moda, percentiles, ya que no estaríamos siendo absolutamente fieles a la realidad, suele
existir datos extremos inferiores y superiores a la media aritmética, los cuales no están
siendo bien representados por este parámetro, hay veces que la media, por sí sola, no es
muy significativa. Además puede ocurrir que series absolutamente distintas pueden tener
medias iguales y este hecho no significa que las distribuciones sean exactamente iguales.
Por lo tanto es necesario profundizar en su estudio, para lo cual se requiere ver si los
valores de la variable están muy o poco separados de la media aritmética.
La media aritmética es más representativa cuanto más agrupados estén los valores de la
serie respecto a ella y al revés y a la mayor o menor separación de los valores respecto a
la media se le llama dispersión o variabilidad.
Para medir el grado de dispersión de una variable, se utilizan principalmente los
siguientes indicadores o medidas de dispersión:

2.1 Rango o recorrido 2.4 Varianza


2.2 Recorrido semi intercuartil 2.5 Desviación típica o estándar
2.3 Desviación media 2.6 Coeficiente de variabilidad.

2.1 RANGO O RECORRIDO

Es la medida de dispersión mas sencilla ya que solo considera los dos valores extremos
de una colección de datos, sin embargo, su mayor utilización está en el campo de la
estadística no paramétrica.

Cálculo del Rango


R = Xmax – Xmin

2.2 RECORRIDO SEMI INTERCUANTIL

La desviación cuartil de un conjunto de datos esta definida por:

Q = (Q3 - Q1)/2

Donde Q3 y Q2 son el primer y tercer cuartil de los datos. A veces se usa el “Recorrido
intercuartil Q3 – Q1 “
El recorrido semi-intercuartil o desviación cuartil, da una idea de la dispersión del 50%
de los datos centrales. Suele utilizarse cuando la mediana es el índice más representativo.

2.3 DESVIACIÓN MEDIA

La desviación media, mide la distancia absoluta promedio entre cada uno de los datos, y
el parámetro que caracteriza la información. Usualmente se considera la desviación media
con respecto a la media aritmética:

M,Sc. Roly Alcides Cristobal Lara 50


CURSO: ESTADÍSTICA DESCRIPTIVA

Cuanto más alta es la desviación absoluta media mayor es la dispersión y menos


representativa la media aritmética.
Cálculo de la Desviación Media

Para datos no agrupados Para datos agrupados


n m

 xi  x x i  x fi
DM  i 1
DM  i 1

n n

2.4 VARIANZA

El problema de los signos en la desviación media, es resuelve tomando los valores


absolutos de las diferencias de los datos con respecto a la media aritmética. Ahora bien,
la varianza obvia los signos elevando las diferencias al cuadrado, lo cual resulta ser más
elegante, aparte de que es supremamente útil en el ajuste de modelos estadísticos que
generalmente conllevan formas cuadráticas.
La varianza es uno de los parámetros más importantes en estadística paramétrica, se puede
decir que, teniendo conocimiento de la varianza de una población, se ha avanzado mucho
en el conocimiento de la población misma.
Numéricamente definimos la varianza, como desviación cuadrática media de los datos
con respecto a la media aritmética
La varianza nos mide la mayor o menor representatividad de la media aritmética
- Si la varianza es grande nos indica gran dispersión, la media aritmética no es
representativa.
- Si casi todos los valores están muy cercanos a la media aritmética entonces la varianza
se acercará a cero, con lo que se dice que la serie es concentrada.
- La varianza nunca puede ser negativa.
De su forma de cálculo se desprenden dos problemas:
- Se expresa en unidades cuadradas (nuevos soles cuadrados, minutos cuadrados, etc.)
- si la media aritmética no es una buena medida de tendencia central, la varianza que se
basa en ella tampoco será una buena medida de dispersión.

Cálculo de la Varianza
Para datos no agrupados Para datos agrupados
- Varianza de la Muestra - Varianza de la muestra

 x i  x   x  x f i
n m
2 2
i
s2  i 1
s2  i 1

n n
- Varianza de la población - Varianza de la población

 x  x
N m

 x    fi
2 2
i i
2  i 1
2  i 1

N N

Simbología
S2 : Varianza de la muestra
2 Varianza de la Población

M,Sc. Roly Alcides Cristobal Lara 51


CURSO: ESTADÍSTICA DESCRIPTIVA

2.5 DESVIACIÓN ESTÁNDAR O TÍPICA

Para eliminar el problema de la elevación al cuadrado de la varianza, se realiza una


transformación consistente en calcular la raíz cuadrada de la varianza con lo que
obtendríamos la desviación estándar o típica
De una Muestra De una Población
s s 2
  2

Con lo que la desviación estándar o típica vendrá dada en las mismas unidades que los
valores de la variable.
- La desviación estándar o típica siempre es positiva porque la varianza también lo es.
- La desviación estándar o típica es la medida de dispersión óptima, más exacta, más
estable y más utilizada, sirviendo de base para las medidas de asimetría, estadísticos
típicas y correlación.
- Cuanto más se acerca a cero la desviación más concentrada es la serie.
- Suele decirse que cuando la desviación estándar o típica es menor que la media
aritmética la serie es concentrada y sí la desviación estándar o típica es mayor que la
media aritmética la serie es dispersa.

2.6 COEFICIENTE DE VARIABILIDAD


Con frecuencia nos interesa establecer comparaciones de la dispersión, entre diferentes
muestras que posean distintas unidades de medida (por ejemplo, nuevos soles con
dólares), las medidas de dispersión antes mencionadas no permiten realizar este tipo de
comparaciones, pero es el coeficiente de variabilidad quien nos ayuda a realizar estas
comparaciones.
El coeficiente de variabilidad es una medida de dispersión relativa (sin unidades de
medida) tiene en cuenta el valor de la media aritmética, para establecer un número
relativo, que hace comparable el grado de dispersión entre dos o más variables, y se define
como:

Para determinar la homogeneidad (tiene menor variabilidad) de dos o más muestras que
tienen diferente unidad de medida, se elige aquella que tenga el menor CV.

3. MEDIDAS DE ASIMETRÍA

En la Parte I de Medidas de descriptivas, se mencionó la relación empírica de las tres


medidas de tendencia central: Media, Mediana y moda, la cual nos mostraba el tipo de
distribución de una serie de datos. Ahora determinaremos esta relación pero mediante un
indicador más representativo que se le conoce como el índice de Asimetría. El índice de
asimetría de Pearson se define como
x  Mo
As 
s
En distribuciones asimétricas se verifica que : x  Mo  3( x  Me) , entonces el índice de
asimetría es:
3( x  Me)
As 
s

M,Sc. Roly Alcides Cristobal Lara 52


CURSO: ESTADÍSTICA DESCRIPTIVA

Interpretación:
Si As = 0, La distribución es simétrica, esto es x  Me  Mo
Si As > 0, La distribución es asimétrica positiva, esto es Mo Me x
Si As < 0, La distribución es asimétrica negativa, esto es x Me Mo

4. MEDIDAS DE CURTOSIS

La curtosis es la característica de una distribución de frecuencias en la cual se compara la


dispersión de los datos observados cercanos al valor central con la dispersión de los datos
cercanos a ambos extremos de la distribución, Se aplica cuando la distribución es
simétrica.
Se calcula mediante:
P  P25
K  75  .5
P90  P10
Interpretación:
Si K tiende a 0 la distribución es normal
Si K tiende a 0.5 es leptocúrtica
Si K tiende a -0.5 es platicúrtica

PRACTICA DE MEDIDAS DE RESUMEN – PARTE II

1. El número de trabajos atendidos semanalmente en un centro de computo son los


siguientes:
58 64 42 62 57 75 69 70 72 85
67 62 58 76 64 76 65 78 76 84
73 44 62 55 79 98 70 71 83 91
Calcule e interprete:
a. ¿Cuántos trabajos en promedio son atendidos en el centro de computo?
b. ¿En cuánto varían el número de trabajos con respecto a su promedio?

2. La inversión anual (en miles de soles) de un grupo de pequeñas empresas de la


ciudad fueron:
10 12 40 10 30 14 16 20 25 28 30 26 30 10 18 17
13 17 21 14 15 19 27 22 14 11 13 15 18 20 30 39
Calcule e interprete:
a. S2 c. CV e. Curtosis
b. S d. Asimetría

3. La demanda diaria de azúcar (en miles de kilogramos) recopilada durante 190 días
en un supermercado, se tabuló en una distribución de frecuencias simétricas de 5
intervalos de amplitud igual a 4. Si la marca de clase del intervalo central es igual
a 12 y si la curva de frecuencias absolutas satisface la relación:
f(x) = -(x – 12)2 + 70 Donde xi es marca de clase

a. Construir la tabla de distribución de frecuencias.


b. Calcular la dispersión de la demanda diaria de azúcar.
c. Determine la Asimetría.

M,Sc. Roly Alcides Cristobal Lara 53


CURSO: ESTADÍSTICA DESCRIPTIVA

d. Determine la Curtosis.
e. Calcule el coeficiente de variación

4. El consumo mensual de agua (m3) de 80 familias se tabuló en una distribución de


frecuencias simétrica de 7 intervalos de amplitud iguales a 3 siendo la marca clase
del cuarto intervalo igual a 19. Si las frecuencias del primer y tercer intervalo son
iguales a al 5% y15% del total respectivamente, y si la quinta frecuencia
porcentual acumulada es 85% del total.
Calcule e interprete:
a. S2 c. CV e. Curtosis
b. S d. Asimetría

5. Los puntajes de una prueba de aptitud se tabularon en una distribución de


frecuencias de 6 intervalos de amplitud constante. Si las marcas de clases del
segundo y cuarto intervalo son 40 y 80, las frecuencias relativas están relacionadas
de la siguientes manera: del primer es igual al sexto intervalo, la tercera y quinta
frecuencia son iguales, la cuarta frecuencia es igual a 0,25, del segundo intervalo
es igual al cuarto menos el primero, el tercer intervalo es al igual primero más
0.10 y la frecuencia absoluta acumulada del sexto intervalo es igual a 60.
Completar la distribución de frecuencias.

a. b. S c. CV d. Asimetría e. Curtosis
S2

M,Sc. Roly Alcides Cristobal Lara 54


CURSO: ESTADÍSTICA DESCRIPTIVA

Separata Nº 06

TEORIA DE PROBABLIDAD

La Teoría de la Probabilidad constituye la base o fundamento de la Estadística, ya


que las ingerencias que hagamos sobre la población o poblaciones en estudio se
moverán dentro de unos márgenes de error controlado, el cual será medido en
términos de probabilidad.
Dado que la Estadística se utiliza con mucha frecuencia hoy en día, inclusive ya en
el lenguaje cotidiano, es conveniente saber entender con toda precisión qué es lo que
se nos dice, por ejemplo, en los medios de comunicación cuando se hace referencia
a la probabilidad de algún suceso.
Así, es corriente oír decir que la probabilidad de que un recién nacido sea varón es
aproximadamente del 50 %, hasta podemos leer en la prensa cosas tales como que
en una evaluación internacional sobre matemáticas y ciencias, desarrollada por la
National Assessment of Educational Progress de Estados Unidos, entre escolares de
13 años, los chicos muestran un mejor rendimiento en matemáticas que las chicas,
haciendo esta afirmación con un margen de error muy pequeño (del 5 %). Nos
apresuramos a decir, claro está, que el informe no afirma que los niños tengan una
mayor aptitud o una mayor capacidad para las matemáticas, sino que
"probablemente" estos resultados son la consecuencia de unos determinados (y
erróneos) comportamientos sociales.
La aplicación de la teoría de la probabilidad es de mucha utilidad para realizar
estudios inferenciales de estadística además en ciertos enfoques sistémicos,
especialmente en los ámbitos de la termodinámica, la teoría de la información y
simulación de sistemas.
Para iniciar el estudio de esta teoría empezaremos a conocer su historia y a definir
algunos conceptos básicos

1. HISTORIA.
En la sociedad francesa de 1650 el juego era un entretenimiento corriente, sin
demasiadas restricciones legales. En este entretenimiento están las raíces de la
teoría de la probabilidad, pues cada vez se introducido juegos mas complicados
que dejaron de sentir la necesidad de un método para calcularla probabilidad de
ganar en cada juego.
La probabilidad se obtiene dividiendo el número de casos favorables entre el
número de los casos posibles, por tanto la probabilidad de obtener oros al extraer
al azar una carta de una baraja es 10/40 = 1/4 y se admitían que al repetir la
fracción 400 veces, devolviendo la carta a la baraja tras cada extracción, sería muy
poco usual que la frecuencia relativa de los oros obtenidos estuviesen alejadas de
1/4.
Un jugador apasionado, el caballero De Méré, encontró un desacuerdo entre las
frecuencias relativas de la veces que ganaba - valores observados realmente - y el
valor de la correspondiente probabilidad de ganar que el mismo había calculado.
Consultó esta discrepancia en París con el famoso matemático y filósofo Pascal,
quien se interesó por los problemas que le proponía De Méré y comenzó una
correspondencia epistolar sobre cuestiones probabilísticas con otros matemáticos

M,Sc. Roly Alcides Cristobal Lara 55


CURSO: ESTADÍSTICA DESCRIPTIVA

amigos, sobre todo con Fermat. Esta correspondencia puede considerarse el origen
de la teoría de probabilidades.
Pronto Pascal y Fermat probaron el desacuerdo de De Méré se debía a que era
erróneo el calculo de probabilidad que había hecho, ya que De Méré se había
equivocado al considerar como equiprobables casos que no le eran, y sólo cuando
los casos posibles son equiprobables tiene sentido aplicar la definición dada de
probabilidad.
El desarrollo de la teoría de probabilidades tiene otro punto de referencia en 1713,
en que se publica la obra "Ars conjectandi" (El arte de la Conjetura) de J.
Bernoulli, donde estudia la distribución binominal y su célebre teoría que da para
esta distribución la expresión matemática de la propiedad de estabilidad de las
frecuencias relativas.
Otro hito es la segunda edición de la obra "The Doctrine of Chances" (La doctrina
de las probabilidades) aparecidas en 1738 y debida al hugonote francés De
Moivre, que por motivos religiosos huyó de Francia refugiándose en Inglaterra,
donde vivió de la resolución de problemas de juegos de azar. En la obra señalada
aparecen las primeras indicaciones sobre la distribución normal de probabilidades.
En 1812 Laplace publica su famosa "Theoríe Analytique des probabilités", que
contiene una exposición completa y sistemática de la teoría matemática de los
juegos de azar, además de una gran cantidad de aplicaciones de la teoría de la
probabilidad a muchas cuestiones científicas y prácticas.
Tras la obra de Laplace se extendieron las aplicaciones de su obra otras ramas de
la Ciencia durante el siglo XIX, y así, Gauss y Laplace independientemente
aplicaron la teoría de la probabilidad al análisis de los errores de medida en las
observaciones físicas y astronómicas, Maxwell, Boltzmann y Gibbs aplicaron la
probabilidad en su obra "Mecánica Estadística", que ha sido fundamental en
distintas partes de la Física moderna. Ya durante nuestro siglo las aplicaciones de
la teoría de la probabilidad se han extendido por los más variados campos, como
genética, economía, psicología...
También, y pese al éxito de las aplicaciones, se oyeron voces críticas a la
definición clásica de probabilidad, que exigía "a priori" saber, o suponer, que
todos los casos posibles eran igualmente favorables. Además en ciertos casos era
imposible aplicar la definición clásica de probabilidad, como puede suceder al
intentar calcular la probabilidad de que un chinche caiga con la punta hacia arriba,
o de que un hombre de 30 años muera el próximo año.
Si bien la matemática cambió profundamente de forma entre las dos guerras
mundiales, también es cierto que buena parte de la matemática que siguió a la
Segunda Guerra Mundial consistía en el comienzo de algo radicalmente nuevo
que anunciaba una nueva era. La teoría de conjuntos y la teoría de la medida han
ido invadiendo a lo largo del siglo XX una parte cada vez más extensa de la
matemática, pero pocas de sus ramas se han visto afectadas tan profundamente
por esta tendencia como la teoría de probabilidades, a la que Borel había dedicado
ya en 1909 sus "Eléments de la théorie des probabilités".
El primer año del nuevo siglo se anunciaba ya propicio para las aplicaciones de la
teoría de probabilidades tanto a la fisica como a la genética, puesto que en 1901
publicaba Glbbs su obra Elementary Principles in Statistical Mechanics, y el
mismo año fue fundada la revista Biometrika por Karl Pearson (1857-1936).
Francis Galton (1822-1911) fue muy precoz y un estadístico nato que estudió los
fenómenos de regresión; en 1900 Pearson en la universidad de Londres popularizó
el criterio de la «chi-cuadrado». Uno de los títulos de Poincaré había sido el de

M,Sc. Roly Alcides Cristobal Lara 56


CURSO: ESTADÍSTICA DESCRIPTIVA

"profesor de cálculo de probabilidades", lo que indicaba un interés creciente por


el tema.
En Rusia se inició el estudio de las cadenas de sucesos eslabonados, especialmente
en 1906-1907, por obra de Andrei Andreyevich Markov (o Markoff, 1856-1922),
discípulo de Tchebycheff y coeditor de las Oeuvres (2 vols., 1899-1904) de su
maestro. En la teoría cinética de los gases y en muchos fenómenos sociales y
biológicos, la probabilidad de un suceso depende frecuentemente de los resultados
anteriores, y especialmente desde mediados de este siglo las cadenas de Markov
de probabilidades eslabonadas se han estudiado muy detalladamente. En su
búsqueda de una fundamentación matemática para la teoría de probabilidades en
expansión, los estadísticos encontraron a mano las herramientas necesarias, y hoy
no es posible ya dar una exposición rigurosa de la teoría de probabilidades sin
utilizar los conceptos de función medible y de las teorías de integración modernas.
En Rusia mismo, por ejemplo, Andrel Nicolaevich Kolmogoroff hizo
importantes progresos en la teoría de procesos de Markov (1931) y dio solución a
una parte del sexto problema de Hilbert, en el que se pedía una fundamentación
axiomático de la teoría de probabilidades, utilizando la medida de Lebesgue.
El análisis clásico se había ocupado principalmente de funciones continuas,
mientras que los problemas de probabilidades generalmente se refieren a casos
discretos. La teoría de la medida y las sucesivas extensiones del concepto de
integral se adaptaban perfectamente a conseguir una asociación más estrecha entre
el análisis y la teoría de probabilidades, especialmente a partir de mediados del
siglo, cuando Laurent Schwartz (1915- ), de la universidad de París, generalizó el
concepto de diferenciación mediante su teoría de distribuciones (1950-1951).

2. CONCEPTOS BÁSICOS

2.1 Fenómenos o Experimentos Aleatorios:


Es aquel que en las mismas condiciones iniciales produce distintos resultados
finales que son conocidos por anticipado, pero no se puede predecir con
certeza el resultado en cada experiencia en particular.
La Estadística, y por tanto el Cálculo de Probabilidades, se ocupan de los
denominados fenómenos o experimentos aleatorios.
Simbología: E o S
Por ejemplo: Lanzamiento de un dado, nota obtenida en un examen, etc.

2.2 Fenómenos Deterministas:


Es aquel que en las mismas condiciones produce los mismos efectos.
Por ejemplo:

2.3 Espacio Muestral


Es el conjunto de todos los resultados posibles diferentes de un determinado
experimento aleatorio, donde:
a) Cada elemento de S representa un resultado del experimento
b) Cualquier forma de verificar el experimento da un resultado que
corresponde a un elemento de S y sólo uno.
Simbología: Letra griega Ω (omega).
Un espacio muestral S asociado a un experimento aleatorio, es un conjunto
tal que:
a) Cada elemento de S representa un resultado del experimento

M,Sc. Roly Alcides Cristobal Lara 57


CURSO: ESTADÍSTICA DESCRIPTIVA

b) Cualquier forma de verificar el experimento da un resultado que corresponde


a un elemento de S y sólo uno.

2.4 Sucesos o Eventos


Sea A el conjunto de todos los subconjuntos de Ω. En principio, cualquier
elemento de A, es decir, cualquier subconjunto del espacio muestral contendrá
una cierta incertidumbre En Cálculo de Probabilidades dichos subconjuntos
reciben en el nombre de sucesos o evento, se simbolizan con letras latinas
mayúsculas.

2.4 Tipos de Sucesos

2.4. 1 Sucesos Elementales:


Es el formado por un solo elemento. Son los elementos del espacio
muestral Ω

2.4.2 Suceso Compuesto


Es el formado por dos o más elementos.

2.4.3 Suceso Seguro


Es el que va a ocurrir siempre, por lo tanto debe ser el mismo espacio
muestral Ω

2.4.4 Suceso Imposibles


Es el que no va a ocurrir nunca, se simboliza con 

2.4.5 Sucesos Incompatibles o Disjuntos


Son los que no pueden ocurrir a la vez.

2.4.5 Suceso Contrario o Complementario


Dado un suceso A, se denomina suceso contrario o complementario A’
al suceso que se verifica o ocurre cuando no lo hace A, está formado por
los elementos del espacio muestral que no pertenecen a A

Ejemplos

Ejemplo 1: Se lanza una moneda


Experimento Aleatorio: Lanzamiento de una moneda
Espacio muestral asociado al experimento aleatorio: Ω= {Cara, Cruz}
Sucesos elementales asociados: A= {Cara} y B= {Cruz}
Suceso Imposible: Obtenga 1 A=
Suceso Complementario: No obtenga cara A’ = {Cruz}

Ejemplo 2: Se lanza un dado


Experimento Aleatorio: Lanzamiento de un dado
Espacio muestral asociado al experimento aleatorio: Ω={1, 2, 3, 4, 5, 6}
Sucesos elementales asociados: A={1}, B={2}, C={3}, D={4}, E={5} y F={6}
Suceso o evento: Obtener número par, P={2,4, 6}
Sucesos imposible: obtener 7 A=

M,Sc. Roly Alcides Cristobal Lara 58


CURSO: ESTADÍSTICA DESCRIPTIVA

Suceso seguro: obtener un número menor de 7 M= {1, 2, 3, 4, 5, 6}


Sucesos Complementario: No obtener un número par P’= {1, 3, 5}

Ejemplo 3: Se lanza dos monedas


Experimento Aleatorio: Lanzamiento de una moneda
Espacio muestral será   CC, CS, SC, SS siendo C la cara de una moneda y X
el reverso de la misma o cruz.
Suceso o evento: Obtener una cara, P={CS, SC}
Sucesos imposible: Obtener tres sellos A=

2.5 Operaciones con Sucesos

A pesar de la interpretación que tiene el espacio muestral, no es más que un


conjunto abstracto de puntos (los sucesos elementales), por lo que el lenguaje, los
conceptos y propiedades de la teoría de conjuntos constituyen un contexto
natural en el que desarrollar el Cálculo de Probabilidades.

Sea A el conjunto de todos los subconjuntos de Ω. En principio, cualquier


elemento de A, es decir, cualquier subconjunto del espacio muestral contendrá una
cierta incertidumbre, por lo que trataremos de asignarle un número entre 0 y 1
como medida de su incertidumbre. En Cálculo de Probabilidades dichos
subconjuntos reciben en el nombre de sucesos o evento, siendo la medida de la
incertidumbre su probabilidad (P). La tripleta (Ω,A,P) recibe el nombre de espacio
probabilístico.

Por ejemplo: Determinar el espacio probabilística de lanzar un dado.

Solución: El espacio probabilístico asociado al experimento aleatorio consistente


en el lanzamiento de un dado, tendrá como:

1. Espacio muestral: Ω={1,2,3,4,5,6}


2. Espacio de sucesos el conjunto de las partes por ser Ω finito, el cual contiene
26 elementos,

A = { Φ, {1}, {2}, {3}, {4}, {5}, {6}, {1,2}, {1,3}, {1,4}, {1,5}, {1,6}, {2,3},
{2,4}, {2,5}, {2,6}, {3,4}, {3,5}, {3,6}, {4,5}, {4,6}, {5,6}, {1,2,3},

M,Sc. Roly Alcides Cristobal Lara 59


CURSO: ESTADÍSTICA DESCRIPTIVA

{1,2,4}, {1,2,5}, {1,2,6}, {1,3,4}, {1,3,5}, {1,3,6}, {1,4,5}, {1,4,6},


{1,5,6}, {2,3,4}, {2,3,5}, {2,3,6}, {2,4,5}, {2,4,6}, {2,5,6}, {3,4,5},
{3,4,6}, {3,5,6}, {4,5,6}, {1,2,3,4}, {1,2,3,5}, {1,2,3,6}, {1,2,4,5},
{1,2,4,6}, {1.,2,5,6}, {1,3,4,5}, {1,3,4,6}, {1,3,5,6}, {1,4,5,6}, {2,3,4,5},
{2,3,4,6}, {2,3,5,6}, {2,4,5,6}, {3,4,5,6}, {1,2,3,4,5}, {1,2,3,4,6},
{1,2,3,5,6}, {1,2,4,5,6}, {1,3,4,5,6}, {2, 3, 4, 5, 6}, Ω }.

Obsérvese que este conjunto contiene los sucesos sobre los que habitualmente se
tiene incertidumbre, como por ejemplo que salga un número par, {2,4,6}, o un
número mayor que cuatro, {5,6}, o simplemente que salga un seis, {6}, y que
como se ve es cerrado respecto de las operaciones entre conjuntos.
3. El último elemento del espacio probabilístico es la probabilidad, que como
antes dijimos está definida sobre A, asignando a cada suceso un número entre
0 y 1.

Por tanto, asociado a todo experimento aleatorio existen tres conjuntos: El espacio
muestral , la clase de los sucesos, es decir, el conjunto de los elementos con
incertidumbre asociados a nuestro experimento aleatorio A, y una función real,
P:A [0, l], la cual asignará a cada suceso (elemento de A) un número entre cero
y uno como medida de su incertidumbre.
No obstante, que la elección del espacio muestral asociado a un experimento
aleatorio no tiene por qué ser única, sino que dependerá de que sucesos
elementales queramos considerar como distintos y del problema de la asignación
de la probabilidad sobre esos sucesos elementales.

2.6 Comparación de Conjuntos y Sucesos

Veamos algunas peculiaridades del Cálculo de Probabilidades respecto a la teoría


de conjuntos.

Simbología Teoría de Cálculo de Lectura en


Conjuntos Probabilidades Probabilidades
A Conjunto A Suceso o Evento A Ocurre el Suceso o
evento A
 Conjunto nulo o Evento imposible No ocurre el suceso
vacío o evento
Ω Conjunto Universal Suceso seguro
A’ Complemento de A Complemento del No ocurre A
evento A
AB Unión de conjuntos Unión de eventos Ocurre el suceso A
o el suceso B
Al menos uno de los
dos eventos ocurre
AB Intersección de Intersección de Ocurre el evento A
conjuntos sucesos y el evento B
Los dos eventos
ocurren
AB= Intersección de Sucesos La ocurrencia de
conjuntos es nula incompatibles ambos suceso es
imposible.

M,Sc. Roly Alcides Cristobal Lara 60


CURSO: ESTADÍSTICA DESCRIPTIVA

A-B Diferencia de Diferencia de Ocurre el evento A


conjuntos sucesos pero no el evento B
AB Inclusión de Inclusión de Siempre que ocurra
conjuntos eventos el suceso A, ocurre
el suceso B
A Conjunto Potencia Clase de los sucesos

3. CONCEPTOS DE PROBABILIDAD

Ahora analizamos brevemente los conceptos que se han desarrollado a lo largo de la


historia, con el propósito de formalizar las ideas intuitivas que desde el origen del hombre
siempre existieron sobre la probabilidad, aunque no llegaran a formalizarse hasta
comienzos del siglo XIX.

3.1 Concepto frecuentista


Es el cociente entre la frecuencia observada del suceso y el total de observaciones,
cuando el experimento se realiza un número grande de veces.
Es un hecho, empíricamente comprobado, que la frecuencia relativa de un suceso
tiende a estabilizarse cuando la frecuencia total aumenta.
Surge así el concepto frecuentista de la probabilidad de un suceso como un
número ideal al que converge su frecuencia relativa cuando la frecuencia total
tiende a infinito.
Así, solemos afirmar que la probabilidad de que salga un seis al tirar un dado es
1/6 porque al hacer un gran número de tiradas su frecuencia relativa es
aproximadamente esa.
El problema radica en que al no poder repetir la experiencia infinitas veces, la
probabilidad de un suceso ha de ser aproximada por su frecuencia relativa para un
n suficientemente grande, y ¿cuán grande es un n grande?. 0, ¿qué hacer con
aquellas experiencias que solo se pueden repetir una vez?.

3.2 Concepto clásico


Está basado en el concepto de resultados igualmente verosímiles y motivado por
el denominado Principio de la Razón Insuficiente, el cual postula que si no existe
un fundamento para preferir una entre varias posibilidades, todas deben ser
consideradas equiprobables (igual probabilidad).
Así, en el lanzamiento de una moneda perfecta la probabilidad de cara debe ser
igual que la de cruz y, por tanto, ambas iguales a 1/2..
De la misma manera, la probabilidad de cada uno de los seis sucesos elementales
asociados al lanzamiento de un dado debe ser 1/6.
Laplace recogió esta idea y formuló la regla clásica del cociente entre casos
favorables y casos posibles, supuestos éstos igualmente verosímiles.
casos favorables
P( A) 
casos posibles
El problema aquí surge porque en definitiva igualmente verosímil es lo mismo
que igualmente probable, es decir, se justifica la premisa con el resultado. Además
¿qué ocurre cuando estamos considerando un experimento donde no se da esa
simetría?, o, ¿ qué hacer cuando el número de resultados posibles es infinito?.

3.3 Concepto subjetivo

M,Sc. Roly Alcides Cristobal Lara 61


CURSO: ESTADÍSTICA DESCRIPTIVA

Se basa en la idea de que la probabilidad que una persona da a un suceso debe


depender de su juicio y experiencia personal, pudiendo dar dos personas distintas
probabilidades diferentes a un mismo suceso.
Estas ideas pueden formalizarse, y si las opiniones de una persona satisfacen
ciertas relaciones de consistencia, puede llegarse a definir una probabilidad para
los sucesos.
El principal problema a que da lugar esta definición es, como antes dijimos, que
dos personas diferentes pueden dar probabilidades diferentes a un mismo suceso.

3.4 Definición formal de Probabilidad


Los anteriores conceptos de lo que debería ser la probabilidad de un suceso,
llevaron a Kolmogorov a dar una definición axiomática de probabilidad. Es decir,
a introducir rigor matemático en el concepto de probabilidad, de forma que se
pudiera desarrollar una teoría sólida sobre el concepto definido.
Así, llamaremos probabilidad a una aplicación
P:A [0, 1]
tal que
Axioma 1: Para todo suceso A de A sea P(A) 0.
Axioma 2: Sea P(Ω) = 1
Axioma 3: Para toda colección de sucesos incompatibles, {Ai} con Ai
Aj =  para ij, debe ser:

Obsérvese que esta definición no dice cómo asignar las probabilidades ni siquiera
a los sucesos elementales. Solo dice que cualquier asignación que hagamos debe
verificar estos tres axiomas para que pueda llamarse Probabilidad.

4. PROPIEDADES ELEMENTALES DE LA PROBABILIDAD

Toda probabilidad cumple una serie de propiedades, las cuales se obtienen como
consecuencia de los axiomas que debe de cumplir. A continuación vamos a demostrar
las más importantes:

1. P(  ) = 0.
En efecto: Si consideramos la sucesión infinita

es

por lo que, por el axioma 3, deberá ser:

es decir,

P(A)=P(A) +  P( A )
i2
i

M,Sc. Roly Alcides Cristobal Lara 62


CURSO: ESTADÍSTICA DESCRIPTIVA

de donde se deduce que P(Ai)= P(  ), para todo i=2,...., no debe sumar nada, es
decir, debe ser
P(  ) = 0.

2. Se cumple la aditividad finita para sucesos incompatibles. Es decir,

si Ai  Aj=  , i  j
En efecto: Basta considerar la sucesión

y aplicar de nuevo el axioma 3 y luego la propiedad anterior, quedando

es decir, la propiedad deseada.

3. La probabilidad del complementario de un suceso A es


P (A') = 1 - P(A)
En efecto: Aplicando primero el axioma 2 y luego la aditividad finita acabada de
demostrar, será
P (A U A') = P(Ω) = 1
y
P(A) + P(A') = 1
de donde se obtiene la propiedad propuesta.

4. Si dos sucesos son tales que A B, entonces P(A) <P(B).


En efecto: B se puede poner de la forma
B = A  (B - A)
con lo que, por la aditividad finita de la probabilidad, será
P(B) = P(A) + P(B - A)
La propiedad enunciada se tendrá ahora como consecuencia de ser P(B - A) > 0
por el axioma 1.

5. La probabilidad de todo suceso A es un número entre 0 y 1:


0 < P(A) < 1.
En efecto: De hecho, el que sea mayor que cero es una de las exigencias requeridas
para que sea probabilidad (axioma l).
El que sea menor que 1 se obtiene de la propiedad anterior observando que todo
suceso A está contenido en el suceso seguro, A Ω.

6. Si dos sucesos no son incompatibles, la probabilidad de su unión debe


calcularse por la siguiente regla:
P(AB) = P(A) + P(B) - P(A  B).
Si los sucesos son incompatibles A  B = , en este caso P(A  B)=P()=0
Si son sucesos incompatibles P(AB) = P(A) + P(B)

M,Sc. Roly Alcides Cristobal Lara 63


CURSO: ESTADÍSTICA DESCRIPTIVA

En efecto: Los sucesos A y B se pueden escribir como unión de sucesos disjuntos


de la forma,
A = (A  B)  (A  B') , B = (A  B)  (A'  B)

con lo que, por la propiedad de aditividad finita antes demostrada, será


P(A) = P (A  B) + P (A  B') y P(B) = P (A  B) + P (A'  B)
es decir,
P (A  B') = P(A) - P(A  B) y P (A'  B) = P(B) - P (A  B).
Como, por otro lado, A  B se puede expresar como unión disjunta de la forma
A  B = (A  B) U (A  B') U (A'  B)
su probabilidad será
P(A  B) = P (A  B) + P (A  B') + P (A'  B)
y, sustituyendo los valores antes calculados para los dos últimos sumandos,
quedará
P(A  B) = P (A  B) + P(A) - P (A  B) + P(B) - P (A  B)
o en definitiva,
P(A  B) = P(A) + P(B) - P (A  B)
como queríamos demostrar.

Algunos otros teoremas de probabilidades

1. Probabilidad del suceso seguro


La probabilidad del suceso seguro es 1, es decir

2. Resta de conjuntos

Se define el conjunto A-B como el que está formado por los elementos de A que no
están en B. Por tanto si quitamos a A los elementos comunes a A y B ( ) nos
queda A-B

3. Desigualdad de Boole

4. Probabilidad de la unión de tres o más sucesos


Vamos a probar que siendo y sucesos cualesquiera

M,Sc. Roly Alcides Cristobal Lara 64


CURSO: ESTADÍSTICA DESCRIPTIVA

P( A1  A2  A3 )  P( A1 )  P( A2 )  P( A3 )  P( A1  A2 )  P( A1  A3 )  P( A2  A3 )  P( A1  A2  A3 )
Luego entonces para el cálculo de la probabilidad de un suceso o evento
A en un modelo uniforme, estará dado por:

No obstante, dicho cómputo no resulta siempre fácil por lo que es conveniente


tener presente las fórmulas de las variaciones, combinaciones y permutaciones,
ya que éstas facilitarán el cálculo.

Si de un grupo de N elementos tomamos n importándonos el orden de los n


elementos seleccionados, tendremos variaciones y si no nos importa el orden,
combinaciones. Además, si admitimos la posibilidad de que entre estos n pueda
haber elementos repetidos, hablaremos, respectivamente, de variaciones y de
combinaciones con repetición.
Por último, si solamente queremos contar el número posible de reordenaciones de
un conjunto de elementos, hablaremos de permutaciones con o sin repetición
dependiendo de que admitamos o no la posibilidad de que haya elementos
repetidos.
Las fórmulas son:
 Variaciones de N elementos tomados de n en n
VnN  V N , n = N · (N - 1) · ... · (N - n +1)

 Variaciones con repetición de N elementos tomados de n en n


VRnN  VR N , n = N n

 Combinaciones de N elementos tomados de n en n

 Combinaciones con repetición de N elementos tomados de n en n

 Permutaciones de N elementos
PN = N! = N · (N - 1) · ... · 2 · 1
 Permutaciones con repetición de N elementos, uno de los cuales se repite n1
veces, otro n2 veces, ..., otro nr veces

M,Sc. Roly Alcides Cristobal Lara 65


CURSO: ESTADÍSTICA DESCRIPTIVA

PRACTICA DIRIGIDA DE PROBABILIDAD ELEMENTAL

1. Se va a elegir 3 alumnos de una aula, los cuales tienen la condición de aprobados


o desaprobados. Determine el espacio muestral y calcule la probabilidad de elegir
:
a. al menos dos alumnos aprobados
b. sólo un desaprobado

2. Cierto juego llamado craps se juega con dos dados. Un jugador lanza ambos dados
y gana incondicionalmente si produce un natural (la suma de los dos números a la
vista 7 u 11); pierde incondicionalmente si lanza craps (un 2, 3 o 12)
a. Determine la probabilidad de un jugador lanzará un natural en la primera
tirada de los dados.
b. Determine la probabilidad de un jugador no lance craps en la primera
tirada de los dados.

3. YES/MVS es un sistema experto experimental para ejercer un control activo sobre


un sistema de computo y proporcionar sugerencias a los operadores de
computadoras. YES/MVS se diseñó con una base de conocimientos que consiste
en 548 reglas que se activan en respuesta a mensajes o consultas del operador de
computadoras. La siguiente tabla indica el número de reglas asignadas a diferentes
subdominios de acciones de operador. Las reglas de la base de conocimientos de
YES/MVS se prueban y ajustan periódicamente, si es necesario. Suponga que se
elige una regla al azar para probarla y se toma nota de su tipo(acción/consulta del
operador)

Acción/Consulta del N° de
operador Reglas
Planificación por lotes 139
Espacio de colas JES 104
Enlaces de C a C 68
Errores de Hardware 87
Gestión de SMF 25
Latencia e IPL 52
Desempeño 41
Monitor de segundo plano 32

a. ¿Qué probabilidad tiene cada una de las acciones/consultas del operador?


b. ¿Que probabilidad hay de que la regla sea de enlace C a C o de error de hardware?
c. ¿qué probabilidad hay de que no sea una regla de desempeño?

4. La distribución de los miembros de seis partidos políticos, están distribuidos en la


siguiente tabla:
SEXO A B C D E F
HOMBRES 90 80 65 35 37 13
TOTAL 105 100 70 45 40 15

Se elige una personal al azar, cuál es la probabilidad de que:

M,Sc. Roly Alcides Cristobal Lara 66


CURSO: ESTADÍSTICA DESCRIPTIVA

a. Sea mujer
b. Sea un hombre del partido C
c. Sea del partido B o D
d. Sea al menos de alguno de los partidos C, E, F
e. Sea una mujer o pertenezca al partido D
f. Sea hombre que no pertenece al partido E

5. Las investigaciones de las quejas de los consumidores referente a productos


realizado por Defensa del Consumidor ha generado gran interés por parte de los
fabricantes en la calidad de sus productos. Un fabricante de procesadores de
alimentos realizó un análisis de un gran número de quejas de los consumidores y
determinó que estaban en las seis categorías que se muestran en el cuadro. Si se
recibe una queja de un consumidor,
a. ¿Cuál es la probabilidad de que la causa de la queja sea por el funcionamiento
eléctrico del producto después del periodo de garantía?
b. ¿Cuál es la probabilidad sea durante el periodo de garantía?
c. ¿Cuál es la probabilidad de que la causa de la queja sea por el aspecto del
producto?
Periodo Razón de las quejas
Eléctrica Mecánica Aspecto
Durante el periodo de garantía 18% 13% 32%
Después del periodo de garantía 12% 22% 3%

6. De 150 alumnos, 130 están matriculados en al menos uno de los cursos de


Matemática y Estadística. 70 llevan Matemáticas, 80 Estadística. ¿Cuál es la
probabilidad de que al elegir a un alumno al azar este matriculado en:
a. los dos cursos
b. sólo en uno

7. Raúl se presenta a dos universidades A y B. El estima la probabilidad de que sea


admitido en la universidad A es 0,8 y a la universidad B en 0,75, en al menos una
de ellas e 0,95. ¿cuál es la probabilidad de que :
a. ingrese a ambas universidades?
b. ingrese sólo a una?

8. En la ciudad de Huancayo se emite un reporte informativo “Buenos Días Perú” en


la mañana y otro “24 Horas”, el la noche. El 10% de las familias de esta ciudad
sintonizan el programa por la mañana, 30% ven el programa por la noche y 7%
ven ambos programas, ¿Cuál es el % de las familias que no ven ninguno de estos
dos programas informativos?

9. Una muestra de 200 votantes reveló la siguiente información concerniente a tres


candidatos A, B y C de cierto partido que se presentan a 3 cargos diferentes: 28 a
favor de A y B, 98 a favor de A o B pero no de C, 42 a favor de B pero no de A o
C, 122 a favor de B o C pero no de A, 64 a favor de C pero no de A o B, 14 a
favor de A y C pero no de B. ¿qué porcentaje de votantes favorecieron a:
a. los tres candidatos?
b. Al candidato B?
c. A los candidatos B y C?
d. A los candidatos A o B?

M,Sc. Roly Alcides Cristobal Lara 67


CURSO: ESTADÍSTICA DESCRIPTIVA

e. Solamente a los candidatos A y C?


f. Sólo al candidato A?
g. Solamente a un candidato?
h. Solamente a dos candidatos?

10. El departamento de Transporte Público de la Municipalidad de Lima realizó una


investigación a 1000 personas para determinar los diferentes medios de transporte
utilizados durante el año anterior: Los resultados de la investigación nos indican
que:
420 personas viajaron en ómnibus
580 personas viajaron en microbús
200 personas viajaron en taxi,
180 personas viajaron en ómnibus y microbús.
60 personas viajaron en ómnibus y en taxi
80 personas viajaron en microbús y en taxi
30 personas viajan de las tres formas.
Seleccionando al azar una persona de la muestra, señale la probabilidad de que
utilice:
a. Sólo ómnibus
b. sólo ómnibus y microbús
c. sólo ómnibus y taxi
d. sólo taxi
e. sólo microbús
f. ninguno de los tres medios

11. De 320 personas que trabajan en informática, consultadas a cerca de sus


actividades (programadores, consultores y profesores), se obtuvo el siguiente
resultado: 40 se desenvuelven como programadores solamente. El número de
personas que realizan las tres actividades es el séxtuplo tanto de los que son
solamente profesores y consultores, como de los que son solamente
programadores y consultores y es el tripe de los que se desenvuelven solamente
como profesores y programadores. El número de personas que son solamente
consultores es igual al número de programadores. El número de profesores
solamente es la mitad de los que realizan las tres actividades más 6 personas. 14
personas declaran no participar en ninguna de las actividades señalas. Si se elige
a una persona al azar ¿cuál es la probabilidad de que:
a. sea consultor?
b. Sea programador?
c. Sea profesor y consultor?
d. Sólo tenga una actividad?
e. Sólo tenga dos actividades?
f. Realice las tres actividades?

12. Un estudiante debe contestar 5 de 7 preguntas de un examen, ¿ cuál es la


probabilidad que conteste 3 de las 4 primeras?

13. Un laboratorio e computación tiene 29 computadoras, distribuidas en 6 filas de 4


máquinas cada una con un pasillo en medio y al final 5 máquinas juntas. Si se
deben ubicar a 25 alumnos ¿cuál es la probabilidad que los 14 asientos de los
costados queden ocupados?

M,Sc. Roly Alcides Cristobal Lara 68


CURSO: ESTADÍSTICA DESCRIPTIVA

14. Se contrata los servicios de calificación de computadoras para encontrar las tres
mejores marcas de monitores SVGA. Se incluirá un total de 10 marcas en el
estudio. Si el servicio de calificación no puede distinguir diferencias entre las
marcas y por lo tanto obtener el ordenamiento final al azar. ¿cuál es la
probabilidad e que la marca de la compañía Z quede:
a. en primer lugar?
b. entre los tres primeros lugares?

15. Un programador de computadoras debe seleccionar 3 trabajos de 5 que esperan su


atención. Si, aunque el programador no lo sabe, los trabajos varían en cuanto al
tiempo de programación que requieren, indique la probabilidad de que el
programador escoja los dos trabajos que requieren menor tiempo? (suponga que
los dos primeros trabajos son los de menor tiempo)

16. Un comerciante tiene 12 unidades de cierto artículo de los cuales 4 tienen algún
defecto. Un cliente pide para comprar 3 de tales artículos pero que no tengan
defecto, si el comerciante escoge al azar y de una sola vez 4 de tales artículos
¿Cuál es la probabilidad de que con las cuatro unidades escogidas satisfagan el
pedido del cliente?

M,Sc. Roly Alcides Cristobal Lara 69


CURSO: ESTADÍSTICA DESCRIPTIVA

Separata Nº 7

5. PROBABILIDAD CONDICIONADA E INDPENDENCIA DE SUCESOS

5.1 Probabilidad condicionada


Hasta ahora se suponía que toda la información antes de la prueba en un
experimento aleatorio, estaba contenida en el espacio muestral, y a partir de aquí,
se calculaba la probabilidad de un suceso A, Suponiendo ahora que tenemos una
información adicional, se trata de ver como el conocimiento d la ocurrencia de
otro suceso B (la información adicional), no vacío, puede modificar la
probabilidad de ocurrencia del suceso A. Con este objetivo se define la
probabilidad condicionada del suceso A al suceso B (A/B) de la siguiente manera:
Definición: Dado un espacio probabilístico (Ω,A,P) y un suceso B A tal que
P(B) > 0, llamaremos probabilidad condicionada del suceso A respecto al B
a:
P( A  B)
P( A / B)  siempre que P(B) > 0
P( B)
A partir de esta definición podemos deducir que
P( A  B ) = P(A/B) · P(B)
y como los sucesos A y B pueden intercambiarse en la expresión anterior, será:
P(A  B) = P(A/B)·P(B) = P(B/A)·P(A)
por lo que tenemos una expresión más para calcular la probabilidad condicionada

Por ejemplo
Si se lanza un dado y sale un número par ¿cuál es la probabilidad que sea 4?
Solución:
Sea
  1,2,3,4,5,6
B  2,4,6 entonces, P( B)  
3 1
y
6 2
A  B  4 entonces, P( A  B) 
1
6
calculando la probabilidad condiconalserá
1
P( A  B) 6
P( A / B)  
P( B) 1
2
1
P( A / B) 
3

Teorema de la probabilidad Compuesta o Producto


De la Definición de Probabilidad Condicionada se deduce que la probabilidad de
la intersección de dos sucesos es el producto de la probabilidad de uno de ellos,

M,Sc. Roly Alcides Cristobal Lara 70


CURSO: ESTADÍSTICA DESCRIPTIVA

por la probabilidad condicionada del otro suponiendo que se ha verificado


primero.
P( A  B ) = P(A/B) · P(B) con P(B)>0
En el caso de tres sucesos A,B y C tendremos

P( A  B  C ) = P(A).P(B/A).P(C/A  B) con P(A  B)>0

Generalizando n sucesos A1, A2, …., An tenemos:

P( A1  A2  …  An ) = P(A1).P(A2/A1)…P(An/A1  A2  …  An-1)
Siempre que P(A1  A2  …  An-1)>0

5.2 Independencia de sucesos


Existen situaciones en las que la información suministrada por la ocurrencia de
un suceso B no altera para nada el cálculo de la probabilidad de otro suceso A.
Son aquellas en las que el suceso A es independiente de B. Es decir, cuando
P(A/B) = P(A).
Como entonces, por la última expresión de la probabilidad condicionada, es

y, por tanto, se podría decir que también B lo es de A, hablaremos de sucesos


independientes cuando esta situación ocurra. La definición formal que se da a
continuación implica estas dos situaciones.
Definición: Dos sucesos A y B de un mismo espacio probabilístico (Ω, A, P)
se dicen independientes cuando
P( A  B ) = P(A) · P(B)

6. TEOREMA DE PROBABILIDAD TOTAL Y TEOREMA DE BAYES

6.1 Teorema de la Probabilidad Total


Sea un espacio probabilístico (Ω, A, P) y {An} A una partición de sucesos
de Ω . Es decir,
A n  A n   y Ai  Aj = para todo ij.
n n
Entonces, para todo suceso B A es

P(B) =  P( B / A ).P( A )
n
n n

Ejemplo
Una población está formada por tres grupos étnicos: A (un 30%), B (un 10%) y C
(un 6O%). Además se sabe que el porcentaje de personas con ojos claros en cada
una de estas poblaciones es, respectivamente, del 20%, 40% y 5%. Por el teorema
de la probabilidad total, la probabilidad de que un individuo elegido al azar de
esta población tenga ojos claros es:
P(ojos claros) = P(A) ·P(ojos claros/A) + P(B) · P(ojos claros/B) + P(C) · P(0jos claros/C ) =
=0'3 · 0'2 + 0'1 · 0'4 + 0'6 · 0'05
= 0'13.

M,Sc. Roly Alcides Cristobal Lara 71


CURSO: ESTADÍSTICA DESCRIPTIVA

6.2 Teorema de Bayes


El siguiente teorema es un resultado con una gran carga filosófica detrás, el cual
mide el cambio que se va produciendo en las probabilidades de los sucesos a
medida que vamos haciendo observaciones. Paradógicamente a su importancia,
su demostración no es más que la aplicación de la definición de probabilidad
condicionada seguida de la aplicación del teorema de la probabilidad total.

Teorema: Sea un espacio probabilístico (Ω, A, P) y {An} A una partición

de sucesos de Ω y B A un suceso con probabilidad positiva. Entonces, para


todo suceso Ai es

Este teorema tiene una interpretación intuitiva muy interesante. Si las cosas que
pueden ocurrir las tenemos clasificadas en los sucesos Ai de los cuales conocemos
sus probabilidaes P(Ai), denominadas a priori, y se observa un suceso B, la
fórmula de Bayes nos da las probabilidades a posteriori de los sucesos A,
ajustadas o modificadas por B.

M,Sc. Roly Alcides Cristobal Lara 72


CURSO: ESTADÍSTICA DESCRIPTIVA

PRACTICA DE PROBABILIDAD CONDICIONAL Y REGLA DE


LA MULTIPLICACIÓN

17. Un lote consta de 10 artículos buenos, 4 con pequeños defectos y 2 con defectos
graves. Se elige al azar 2 artículos (sin sustitución) encuentre la probabilidad de
que:
a. ambos sean buenos.
b. Ambos tengan defectos graves.
c. por lo menos uno sea bueno.
d. a lo más uno sea bueno.
e. Exactamente uno sea bueno.
f. ninguno tenga defectos graves.
g. Ninguno sea bueno

18. Análisis S.A., una pequeña firma consultora, está negociando dos contratos. La
Gerencia piensa la probabilidad de ganar el primer contrato es de 60%, y que el
ganador tendrá ventaja definitiva en la negociación del segundo contrato. La
Gerencia cree, que si Análisis S.A. gana el primer contrato va a tener un 70% de
probabilidad de ganar el segundo, pero si pierde el primer contrato, la probabilidad
de ganar el segundo disminuirá a 0.10.
a. ¿cuál es la probabilidad de que Análisis S.A. pierda ambos contratos?
b. ¿Cuál es la probabilidad de que el Análisis S.A. gane el segundo
contrato?

19. Un ejecutivo está en proceso de contratar a un nuevo Gerente de Marketing. Hay


cuatro candidatos para el empleo. El ejecutivo los entrevistará individualmente en
los días sucesivos. Debido a ciertos factores que están fuera de su control, el
ejecutivo debe decidir inmediatamente después de entrevistar
a cada candidato si lo contrata o no (o sea, que no puede esperar hasta hablar con
todos para decidirse).
Sólo un candidato será empleado. Cada candidato puede ser calificado como
excelente, bueno, promedio o malo. Con lo que ya sabe de los candidatos el
ejecutivo cree son similares, cada cual con una probabilidad de 0,2, de ser
calificado excelente después de la entrevista, una probabilidad de 0,5 de ser
calificado bueno, una probabilidad de 0,2 de ser calificado promedio y una
probabilidad de 0,1 de ser calificado malo.
El ejecutivo ha decidido adoptar la siguiente estrategia: si el primer candidato
obtiene calificación excelente, lo contrata; sino, entrevista al segundo. Si el
segundo obtiene la calificación de excelente lo contrata, sino, entrevista al tercero.
Si el tercero obtiene una calificación de excelente o buena lo contrata, sino
entrevista el cuarto. Por supuesto no podrá continuar, independiente de la
calificación que logra el cuarto tendrá que contratarlo.
a. ¿cuál es la probabilidad de que con esta estrategia pueda contratar un
gerente con calificación excelente o buena?
b. ¿cuál es la probabilidad de contratar un gerente con una calificación mala?

20. Se mezclan dos microchips defectuosos con dos buenos. Se comienzan a probar
una a una hasta que se descubren las defectuosas. ¿Cuál es la probabilidad de que
el segundo microchip defectuoso, sea el tercero robado?

M,Sc. Roly Alcides Cristobal Lara 73


CURSO: ESTADÍSTICA DESCRIPTIVA

21. Las investigaciones de las quejas de los consumidores referente a productos


realizado por Defensa del Consumidor ha generado gran interés por parte de los
fabricantes en la calidad de sus productos. Un fabricante de procesadores de
alimentos realizó un análisis de un gran número de quejas de los consumidores y
determinó que estaban en las seis categorías que se muestran en el cuadro. Si se
recibe una queja de un consumidor.
a. ¿Cuál es la probabilidad de que la causa de la queja sea por el
funcionamiento eléctrico del producto después del periodo de garantía?
b. ¿Cuál es la probabilidad de que la causa de la queja sea el aspecto del
producto, dado que la queja se originó durante el periodo de garantía?

Periodo |Razón de las quejas


Eléctrica Mecánica Aspecto
Durante el periodo de garantía 18% 13% 32%
Después del periodo de garantía 12% 22% 3%

22. Del primer examen de estadística resulta que el 40% de los alumnos está
aprobado. Se estima en 70% los alumnos que no estarán aprobados en el segundo
examen y una probabilidad de ¾ que un alumno no esté aprobado en el segundo
examen si estuvo aprobado en el primer examen. Si se elige al azar un alumno,
calcular la probabilidad de que este aprobado en el segundo examen y este
desaprobado en el primer examen.

23. Considere los eventos A y B tales que P(A)=1/4, P(B/A)=1/2, P(A/B)=1/4. Diga,
si cada uno de los siguientes incisos son verdaderos o falsos (demuéstrelo)
a. Ay B son mutuamente excluyentes c. P(A’/B’) = ¾
b. A es sub evento de B d. P(A/B) + P(A/B’) = 1

PROBABILIDAD TOTAL Y TEOREMA DE BAYES

24. En un día cualquiera cuatro máquinas producen artículos en las siguientes


proporciones. M1 produce el doble de M4, M3 produce el triple de M4 mientras que
M1 produce la mitad de M2. Las proporciones no defectuosas son respectivamente
90%, 95%, 90% y90. Si se elige al azar un artículo de la producción de un día,
¿cuál es la probabilidad de que resulte no defectuoso?

25. Un sistema de monitoreo automático emplea equipo de video de alta tecnología y


microprocesadores para detectar intrusos. Se ha creado un prototipo del sistema y
se está utilizando en exteriores en una planta de municiones para armamento. El
sistema se diseñó de modo que detectara intrusos con una probabilidad de 0,9. Sin
embargo los ingenieros de diseño esperan que esta probabilidad varíe con las
condiciones del clima. El sistema registra automáticamente las condiciones del
clima cada vez que detecta un intruso. Con base a una serie de pruebas
controladas, en las que se liberó a un intruso en la planta en diversas condiciones
climáticas, se cuenta con la siguiente información. En los casos en que

el intruso sí fue detectado por el sistema, el clima estuvo despejado 75% del
tiempo, nublado 20% del tiempo y lluvioso 5% del tiempo. Cuando el sistema no

M,Sc. Roly Alcides Cristobal Lara 74


CURSO: ESTADÍSTICA DESCRIPTIVA

detectó al intruso, 60% de los días estuvieron despejados, 30% nublados y 10%
lluvioso. Utilice esta información para calcular la probabilidad de detectar un
intruso cuando el clima está lluvioso.

26. Todas las noches el señor Pérez llega tarde a su casa. La señora Pérez que es una
buena esposa, le deja encendida la luz de la entrada a la casa: LA probabilidad
que el señor Pérez llegue borracho es 0,6. Si llega borracho, hay una probabilidad
de 0,9 de que olvide apagar la luz, en tanto que ésta es de sólo 0,05 si llega sobrio.
Dado que el señor Pérez apagó la luz una cierta noche, ¿cuál es la probabilidad de
que haya llegado borracho?

27. Los vendedores de una empresa están organizados en 4 mesas de trabajo, de la


siguiente manera, en la primera mesa se encuentran el 20% de ellos, en la segunda
el 15%, en la tercera el 45% y es resto en la cuarta. La probabilidad que se realice
una venta en cada una de las mesas son 68%, 56%, 87% y 77% respectivamente
a. Calcular la probabilidad de que se realice una venta.
b. Si se realiza una venta, cual es la probabilidad que sea de la tercera mesa

28. Supóngase que se compra un pequeño hotel en la playa. En determinada operación


de fin de semana, la probabilidad que obtenga una ganancia si el tiempo es
“favorable” es de 3/4. Si el tiempo es “desfavorable” esa probabilidad es de 1/8.
Supóngase también, de acuerdo a los pronósticos, la probabilidad de que el tiempo
sea “favorables” es de 2/5.
a. ¿Cuál es la probabilidad de obtener una ganancia de fin de semana?
b. Supóngase que el lunes comunica a un amigo que obtuvo la ganancia.
Hállese la probabilidad de que el tiempo haya sido “favorable” la semana
anterior?

M,Sc. Roly Alcides Cristobal Lara 75

Você também pode gostar