Capítulo 1 Estadística Descriptiva

Facultad de Ingeniería, UASLP Área de Metalurgia
Capítulo 1: Estadística.
1.1 Generalidades
Definición: Murray R. Spiegel, (1991) dice: “La estadística estudia los métodos
científicos para recoger, organizar, resumir y analizar datos, así como para sacar
conclusiones válidas y tomar decisiones razonables basadas en tal análisis.
La Estadística se divide en dos ramas:

 La estadística descriptiva, que se dedica a los métodos de recolección,
descripción, visualización y resumen de datos originados a partir de los
fenómenos en estudio. Los datos pueden ser resumidos numérica o
gráficamente.
 La inferencia estadística, que se dedica a la generación de los modelos,
inferencias y predicciones asociadas a los fenómenos en cuestión teniendo
en cuenta la aleatoriedad de las observaciones. Se usa para modelar
patrones en los datos y extraer inferencias acerca de la población bajo
estudio.
Ambas ramas (descriptiva e inferencial) comprenden la estadística aplicada.
Hay también una disciplina llamada estadística matemática, la cual se refiere a las
bases teóricas de la materia. La palabra estadísticas también se refiere al
resultado de aplicar un algoritmo estadístico a un conjunto de datos, como en
estadísticas económicas, estadísticas criminales, etc.
Etimología
La palabra "estadística" procede del latín statisticum collegium ("consejo de
Estado") y de su derivado italiano statista ("hombre de Estado" o "político"). El
término alemán Statistik, que fue primeramente introducido por Gottfried
Achenwall (1749), designaba originalmente el análisis de datos del Estado, es
decir, "la ciencia del Estado" (también llamada "aritmética política" de su
traducción directa del inglés).
No fue hasta el siglo XIX cuando el término estadística adquirió el
significado de recolectar y clasificar datos. Este concepto fue introducido por el
inglés John Sinclair.
En su origen, por tanto, la estadística estuvo asociada a datos, a ser
utilizados por el gobierno y cuerpos administrativos (a menudo centralizados). La
colección de datos acerca de estados y localidades continúa ampliamente a través
de los servicios de estadísticas nacionales e internacionales. En particular, los
censos suministran información regular acerca de la población.
Desde los comienzos de la civilización han existido formas sencillas de
estadística, pues ya se utilizaban representaciones gráficas y otros símbolos en
pieles, rocas, palos de madera y paredes de cuevas para contar el número de
Ramiro A. Ramírez Cano 1

personas, animales o ciertas cosas. Hacia el año 3000 a. C. los babilónicos

usaban ya pequeñas tablillas de arcilla para recopilar datos en tablas sobre la
producción agrícola y de los géneros vendidos o cambiados mediante trueque.
Los egipcios analizaban los datos de la población y la renta del país mucho
antes de construir las pirámides en el siglo XI a. C.
Los libros bíblicos de Números y Crónicas incluyen, en algunas partes,
trabajos de estadística. El primero contiene dos censos de la población de Israel y
el segundo describe el bienestar material de las diversas tribus judías.
En China existían registros numéricos similares con anterioridad al año
2000 a. C. Los griegos clásicos realizaban censos cuya información se utilizaba
hacia el 594 a. C. para cobrar impuestos.
Estado actual
Durante el siglo XX, la creación de instrumentos precisos para asuntos de
salud pública (epidemiología, bioestadística, etc.) y propósitos económicos y
sociales (tasa de desempleo, econometría, etc.) necesitó de avances sustanciales
en las practicas estadísticas.
Hoy el uso de la estadística se ha extendido más allá de sus orígenes como
un servicio al Estado o al gobierno. Personas y organizaciones usan la estadística
para entender datos y tomar decisiones en ciencias naturales y sociales, medicina,
ingeniería, negocios y otras áreas.
La estadística es entendida generalmente no como un sub-área de las
matemáticas sino como una ciencia diferente "aliada". Muchas universidades
tienen departamentos académicos de matemáticas y estadística separadamente.
La estadística se enseña en departamentos tan diversos como psicología,
educación y salud pública.
Al aplicar la estadística a un problema científico, industrial o social, se
comienza con un proceso o población a ser estudiado. Esta puede ser la población
de un país, de granos cristalizados en una roca o de bienes manufacturados por
una fábrica en particular durante un periodo dado. También podría ser un proceso
observado en varios instantes y los datos recogidos de esta manera constituyen
una serie de tiempo.
Por razones prácticas, en lugar de compilar datos de una población entera,
usualmente se estudia un subconjunto seleccionado de la población, llamado
muestra. Datos acerca de la muestra son recogidos de manera observacional o
experimental. Los datos son entonces analizados estadísticamente lo cual sigue
dos propósitos: descripción e inferencia.
El concepto de correlación es particularmente valioso. Análisis estadísticos
de un conjunto de datos puede revelar que dos variables (esto es, dos
propiedades de la población bajo consideración) tienden a variar conjuntamente,
como si hubiera una conexión entre ellas. Por ejemplo un estudio del ingreso
anual y la edad de muerte entre personas podría resultar en que personas pobres

tienden a tener vidas más cortas que personas de mayor ingreso. Las dos
variables se dicen a ser correlacionadas. Sin embargo, no se pude inferir
inmediatamente la existencia de una relación de causalidad entre las dos
variables. El fenómeno correlacionado podría ser la causa de un tercero,
previamente no considerado, llamado variable confundida.
Si la muestra es representativa de la población, inferencias y conclusiones
hechas en la muestra pueden ser extendidas a la población completa. Un
problema mayor es el de determinar que tan representativa es la muestra extraída.
El concepto matemático fundamental empleado para entender la
aleatoriedad es el de probabilidad. La estadística matemática (también llamada
teoría estadística) es la rama de las matemáticas aplicadas que usa la teoría de
probabilidades y el análisis matemático para examinar las bases teóricas de la
estadística.
El uso de cualquier método estadístico es válido solo cuando el sistema o
población bajo consideración satisface los supuestos matemáticos del método. El
mal uso de la estadística puede producir serios errores en la descripción e
interpretación, afectando las políticas sociales, la práctica médica y la calidad de
estructuras tales como puentes y plantas de reacción nuclear.
Incluso cuando la estadística es correctamente aplicada, los resultados
pueden ser difícilmente interpretados por un no experto. Por ejemplo, el significado
estadístico de una tendencia en los datos, que mide el grado al cual la tendencia
puede ser causada por una variación aleatoria en la muestra, puede no estar de
acuerdo con el sentido intuitivo. El conjunto de habilidades estadísticas básicas (y
el escepticismo) que una persona necesita para manejar información en el día a
día se refiere como cultura estadística.
Métodos estadísticos
Estudios experimentales y observacionales
Un objetivo común para un proyecto de investigación estadística es
investigar la causalidad, y en particular extraer una conclusión en el efecto que
algunos cambios en los valores de predictores o variables independientes tienen
sobre una respuesta o variables dependientes.
Hay dos grandes tipos de estudios estadísticos para estudiar causalidad:
estudios experimentales y observacionales. En ambos tipos de estudios, el efecto
de las diferencias de una variable independiente (o variables) en el
comportamiento de una variable dependiente es observado. La diferencia entre los
dos tipos es la forma en que el estudio es conducido. Cada uno de ellos puede ser
muy efectivo.
Un estudio experimental implica tomar mediciones del sistema bajo estudio,
manipular el sistema y luego tomar mediciones adicionales usando el mismo
procedimiento para determinar si la manipulación ha modificado los valores de las
mediciones. En contraste, un estudio observacional no necesita manipulación

experimental. Por el contrario, los datos son recogidos y las correlaciones entre
predictores y la respuesta son investigadas.
Un ejemplo de un estudio experimental es el famoso experimento de
Hawthorne el cual pretendía probar cambios en el ambiente de trabajo en la planta
Hawthorne de la Western Electric Company. Los investigadores estaban
interesados en verificar si al incrementar la iluminación en un ambiente de trabajo,
la producción de los trabajadores aumentaba. Los investigadores primero midieron
la productividad de la planta y luego modificaron la iluminación en un área de la
planta para ver si cambios en la iluminación afectarían la productividad. La
productividad mejoró bajo todas las condiciones experimentales. Sin embargo, el
estudio fue muy criticado por errores en los procedimientos experimentales,
específicamente la falta de un grupo control y seguimiento.
Un ejemplo de un estudio observacional es un estudio que explora la
correlación entre fumar y el cáncer de pulmón. Este tipo de estudio normalmente
usa una encuesta para recoger observaciones acerca del área de interés y luego
produce un análisis estadístico. En este caso, los investigadores recogerían
observaciones de fumadores y no fumadores y luego mirarían los casos de cáncer
de pulmón en ambos grupos.
Los pasos básicos para un experimento son:
 Planeamiento estadístico de la investigación, lo cual incluye encontrar
fuentes de información, selección de material disponible en el área y
consideraciones éticas para la investigación y el método propuesto. Se
plantea un problema de estudio.
 Diseñar el experimento concentrándose en el modelo y la interacción entre
variables independientes y dependientes. Se realiza un muestreo
consistente en la recolección de datos referentes al fenómeno o variable
que deseamos estudiar. Se propone un modelo de probabilidad, cuyos
parámetros se estiman mediante estadísticos a partir de los datos de
muestreo. Sin embargo, se mantiene lo que se denominan "hipótesis
sostenidas" (que no son sometidas a comprobación). Se valida el modelo
comparándolo con lo que sucede en la realidad. Se utiliza métodos
estadísticos conocidos como test de hipótesis y prueba de significación.
 Se producen estadísticas descriptivas.
 Inferencia estadística. Se llega a un consenso acerca de qué dicen las
observaciones acerca del mundo que observamos.
 Se utiliza el modelo validado para tomar decisiones o predecir
acontecimientos futuros. Se produce un reporte final con los resultados del
estudio.
La estadística es una ciencia transversal a una amplia variedad de disciplinas,

desde la física hasta las ciencias sociales, desde las ciencias de la salud hasta el

control de calidad, y es usada para la toma de decisiones en áreas de negocios e

instituciones gubernamentales.
Disciplinas especializadas
Algunos campos de investigación usan la estadística tan extensamente que tienen
terminología especializada. Estas disciplinas incluyen:
Ciencias actuariales Estadística en las Ciencias de la Salud

Matemáticas Estadísticas Investigación de Operaciones
Estadística en Medicina Estadísticas de Consultoría
Estadística en Agronomía Estadística del Medio Ambiente
Estadística en Planificación Estadística económica
Estadística en Investigación Estadística en Ingeniería
Estadística en Literatura Geo. y Sist. de información geográfica
Estadística en Astronomía Demografía
Estadística en la Antropología Calidad y productividad
Estadística en Historia Estadísticas sociales
Estadística Militar Cultura estadística
Geoestadística Encuestas por Muestreo
Bioestadística Análisis de procesos
La estadística es una herramienta básica en negocios y producción. Es usada

para entender la variabilidad de sistemas de medición, control de procesos (como
en control estadístico de procesos CEP, para compilar datos y para tomar
decisiones. En estas aplicaciones es una herramienta clave, y probablemente la
única herramienta disponible.
Población:
El concepto de población en estadística va más allá de lo que comúnmente
se conoce como tal. Una población se precisa como un conjunto finito o infinito de
personas u objetos que presentan características comunes.
“Una población es un conjunto de todos los elementos que estamos
estudiando, acerca de los cuales intentamos sacar conclusiones”. Levin & Rubin
(1996).
Cuando la población es muy grande, es obvio que la observación de todos
los elementos se dificulte en cuanto al trabajo, tiempo y costos necesarios para
hacerlo. Para solucionar este inconveniente se utiliza una muestra estadística.
Es a menudo imposible o poco práctico observar la totalidad de los

individuos, sobre todos si estos son muchos. En lugar de examinar el grupo entero
llamado población o universo, se examina una pequeña parte del grupo llamada
muestra.
Muestra:
“Se llama muestra a una parte de la población a estudiar, que sirve para
representarla”. Murray R. Spiegel (1991).

“Una muestra debe ser definida en base de la población determinada, y las

conclusiones que se obtengan de dicha muestra solo podrán referirse a la
población en referencia”, Cadenas (1974).
Tipos de muestreo
Existen dos métodos para seleccionar muestras de poblaciones; el
muestreo no aleatorio o de juicio y el muestreo aleatorio o de probabilidad. En este
último todos los elementos de la población tienen la oportunidad de ser escogidos
en la muestra. Una muestra seleccionada por muestreo de juicio se basa en la
experiencia de alguien con la población.
Variables y Atributos:
Las variables, también suelen ser llamados caracteres cuantitativos, son
aquellos que pueden ser expresados mediante números. Son caracteres
susceptibles de medición. Como por ejemplo, la estatura, el peso, el salario, la
edad, etc.
Según, Murray R. Spiegel, (1992) “una variable es un símbolo, tal como X,
Y, que puede tomar un valor cualquiera de un conjunto determinado de ellos,
llamado dominio de la variable. Si la variable puede tomar solamente un valor, se
llama constante.”
Los atributos también llamados caracteres cualitativos, son aquellos que
no son susceptibles de medición, es decir que no se pueden expresar mediante un
número.
IUTIN (1997). “Reciben el nombre de variables cualitativas o atributos,
aquellas características que pueden presentarse en individuos que constituyen un
conjunto.
Censo:
Se entiende por censo aquella numeración que se efectúa a todos y cada
uno de los caracteres componentes de una población.
Para Levin & Rubin (1996) “Algunas veces es posible y práctico examinar a
cada persona o elemento de la población que deseamos describir. A esto lo
llamamos una numeración completa o censo.
Encuesta:
Se entiende por encuesta las observaciones realizadas por muestreo, es
decir son observaciones parciales.
El diseño de encuestas es exclusivo de las ciencias sociales y parte de la
premisa de que si queremos conocer algo sobre el comportamiento de las
personas, lo mejor, más directo y simple es preguntárselo directamente a ellas.
(Cadenas, 1974).

1.2 Introducción a la Estadística Descriptiva
La estadística descriptiva es una ciencia que analiza series de datos (por

ejemplo, edad de una población, altura de los estudiantes de una escuela,
temperatura en los meses de verano, etc) y trata de extraer conclusiones sobre el
comportamiento de estas variables.
Datos Estadísticos:
Los datos estadísticos no son otra cosa que el producto de las
observaciones efectuadas en las personas y objetos en los cuales se produce el
fenómeno que queremos estudiar. Dicho en otras palabras, son los antecedentes
(en cifras) necesarios para llegar al conocimiento de un hecho o para reducir las
consecuencias de este.
Los datos estadísticos se pueden encontrar de forma no ordenada, por lo
que es muy difícil en general, obtener conclusiones de los datos presentados de
esta manera. Para poder obtener una precisa y rápida información con propósitos
de descripción o análisis, estos deben organizarse de una manera sistemática; es
decir, se requiere que los datos sean clasificados. Esta clasificación u
organización puede muy bien hacerse antes de la recopilación de los datos.
Las variables pueden ser de dos tipos:
Variables cualitativas o atributos: no se pueden medir numéricamente (por

ejemplo: nacionalidad, color de la piel, sexo).
Variables cuantitativas: tienen valor numérico (edad, precio de un producto,

ingresos anuales).
Las variables también se pueden clasificar en:
Variables unidimensionales: sólo recogen información sobre una característica

(por ejemplo: edad de los alumnos de una clase).
Variables bidimensionales: recogen información sobre dos características de la

población (por ejemplo: edad y altura de los alumnos de una clase).
Variables pluridimensionales: recogen información sobre tres o más

características (por ejemplo: edad, altura y peso de los alumnos de una clase).
Por su parte, las variables cuantitativas se pueden clasificar en discretas y

continuas:
Discretas: sólo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo:
número de hermanos (puede ser 1, 2, 3....,etc, pero, por ejemplo, nunca podrá ser
3.45).

Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo,
la velocidad de un vehículo puede ser 80.3 km/h, 94.57 km/h...etc.
1.2.1 Distribución de frecuencia.
La distribución de frecuencia es la representación estructurada, en forma

de tabla, de toda la información que se ha recogido sobre la variable que se
estudia.
Variable Frecuencias absolutas Frecuencias relativas

(Valor) Simple Acumulada Simple Acumulada
x x x x x
X1 n1 n1 f1 = n 1 / n f1
X2 n2 n1 + n2 f2 = n 2 / n f1 + f2
... ... ... ... ...
Xn-1 nn-1 n1 + n2 +..+ nn-1 fn-1 = nn-1 / n f1 + f2 +..+fn-1
Xn nn ∑n fn = n n / n ∑f
Siendo X los distintos valores que puede tomar la variable.

Siendo n el número de veces que se repite cada valor.
Siendo f el porcentaje que la repetición de cada valor supone sobre el total
Ejemplo 1.1
Medimos la altura de los niños de una clase y obtenemos los siguientes resultados
(m):
Alumno Estatura Alumno Estatura Alumno Estatura
x x x x x x
Alumno 1 1,25 Alumno 11 1,23 Alumno 21 1,21

Si presentamos esta información estructurada obtendríamos la siguiente

tabla de frecuencia:
Variable Frecuencias absolutas Frecuencias relativas

(Valor) Simple Acumulada Simple Acumulada
x x x x x
1,20 1 1 3,3% 3,3%
1,21 4 5 13,3% 16,6%
1,22 4 9 13,3% 30,0%
1,23 2 11 6,6% 36,6%
1,24 1 12 3,3% 40,0%
1,25 2 14 6,6% 46,6%
1,26 3 17 10,0% 56,6%
1,27 3 20 10,0% 66,6%
1,28 4 24 13,3% 80,0%
1,29 3 27 10,0% 90,0%
1,30 3 30 10,0% 100,0%
Si los valores que toma la variable son muy diversos y cada uno de ellos se
repite muy pocas veces, entonces conviene agruparlos por intervalos, ya que de
otra manera obtendríamos una tabla de frecuencia muy extensa que aportaría muy
poco valor a efectos de síntesis.
1.2.2 Distribución de frecuencia agrupada.
Ejemplo 1.2
Supongamos que medimos la estatura de los habitantes de una vivienda y
obtenemos los siguientes resultados (m):
Habitante Estatura Habitante Estatura Habitante Estatura
x x x x x x
Habitante 1 1,15 Habitante 11 1,53 Habitante 21 1,21

Si presentáramos esta información en una tabla de frecuencia

obtendríamos una tabla de 30 líneas (una para cada valor), cada uno de ellos con
una frecuencia absoluta de 1 y con una frecuencia relativa del 3,3%. Esta tabla
nos aportaría escasa información.
En lugar de ello, preferimos agrupar los datos por intervalos, con lo que la
información queda más resumida (se pierde, por tanto, algo de información), pero
es más manejable e informativa:
Estatura Frecuencias absolutas Frecuencias relativas

Cm Simple Acumulada Simple Acumulada
x X x x x
1,01 - 1,10 1 1 3,3% 3,3%
1,11 - 1,20 5 6 16,7% 20,0%
1,21 - 1,30 1 7 3,3% 23,3%
1,31 - 1,40 3 10 10,0% 33,3%
1,41 - 1,50 5 15 16,7% 50,0%
1,51 - 1,60 5 20 16,7% 66,7%
1,61 - 1,70 2 22 6,7% 73,3%
1,71 - 1,80 3 25 10,0% 83,3%
1,81 - 1,90 2 27 6,7% 90,0%
1,91 - 2,00 3 30 10,0% 100,0%
El número de tramos en los que se agrupa la información es una decisión

que debe tomar el analista: la regla es que mientras más tramos se utilicen menos
información se pierde, pero puede que menos representativa e informativa sea la
tabla.
Diámetro (in) Frecuencia
0.7247 − 0.7249 2
Ejemplo 1.3
0.7250 − 0.7252 6
La siguiente tabla muestra la 0.7253 − 0.7255 8
distribución de los diámetros 0.7256 − 0.7258 15
de las cabezas de los 0.7259 − 0.7261 42
remaches fabricados por una 0.7262 − 0.7264 68
compañía. 0.7265 − 0.7267 49
0.7268 − 0.7270 25
0.7271 − 0.7273 18
0.7274 − 0.7276 12
0.7277 − 0.7279 4
0.7280 − 0.7282 1
250

Clases:
La primera clase o categoría comprende los valores de 0.7247 a 0.7249 in y
está indicada por el símbolo 0.7247-0.7249.
Puesto que dos remaches corresponden a ese rango, la correspondiente

frecuencia de clase es 2.
Intervalos de clases:
Un símbolo que define a una clase, tal como 0.7247-0.7249 se conoce
como intervalo de clase. Los números extremos 0.7247 y 0.7249 son los límites de
clase, inferior y superior respectivamente.
Límites Reales de clase:

El intervalo de clase 0.7247 - 0.7249, teóricamente incluye todas las
medidas desde 0.72465 hasta 0.72495 in, valores que reciben el nombre de
limites reales inferior y superior respectivamente.
Los límites reales de clase se obtienen sumando al límite superior de un
intervalo de clase el límite inferior del intervalo de clase contiguo superior y
dividiendo por dos.
Por ejemplo: hallar los límites reales del intervalo 0.7274 – 0.7276.
0.7273  0.7274
LRI   0.72735
2
0.7276  0.7277
LRS   0.72765
2
Tamaño o anchura de un intervalo de clase:

El tamaño o anchura de un intervalo de clase es la diferencia entre los
límites reales de clase que lo forman y se conoce como anchura de clase, tamaño
de clase o longitud de clase.
Si todos los intervalos de clase de una distribución de frecuencia tienen
igual anchura, esta se representa por c.
En nuestro ejemplo c = 0.72765 – 0.72735 = 0.0003
Marca de clase:
La marca de clase es el punto medio del intervalo de clase y se obtiene
sumando los límites inferior y superior de la clase y dividiendo por dos. Por
ejemplo la marca de clase del intervalo 0.7265 – 0.7267 es:
0.7265  0.7267 072645  0.72675

  0.7266
2 2

Este valor es llamado también punto medio de la clase. Para análisis

matemáticos posteriores, todas las observaciones pertenecientes a un intervalo de
clase dado se suponen coincidentes con la marca de clase.
1.2.3 Reglas generales para formar distribuciones de frecuencia.

1) Determinar el mayor y el menor entre los datos registrados para obtener el
rango.
2) Dividir el rango en un número conveniente de intervalos de clase del mismo
tamaño. Como parte de este análisis se determina el valor de c.
3) Se recomienda que el dato menor del conjunto sea el límite inferior del
primer intervalo, a partir del valor de c, se establece el límite superior de la
clase.
4) Se generan los intervalos que sean necesarios.
5) Los intervalos se eligen también de manera que las marcas de clase
coincidan con los datos observados.
6) Determinar el número de observaciones que caen dentro de cada intervalo
de clase, es decir encontrar las frecuencias de clase.
Se recomienda utilizar las funciones estadísticas del Excel para generar los
intervalos y sus correspondientes frecuencias.
1.2.4 Gráficas
Histogramas y polígonos de frecuencia.
Son representaciones gráficas de las distribuciones de frecuencia.
1) Un histograma o histograma de frecuencias consiste en un gráfico de
barras que tienen:
a) Sus bases en el eje horizontal con centros en las marcas de clase y
altura igual a las frecuencias de los intervalos de clase.
b) Superficies proporcionales a las frecuencias de clase.
2) Un polígono de frecuencias es una gráfica de línea que se obtiene mediante
la unión de los puntos (a, b) donde a son las marcas de clase y b su
respectiva frecuencia.
Distribuciones de frecuencia relativa.

La frecuencia relativa de una clase es la frecuencia de la clase dividida por
la suma de las frecuencias de todas las clases, se expresa como un porcentaje.
Si las frecuencias en la tabla de frecuencias se sustituyen por las
correspondientes frecuencias relativas, la tabla resultante se conoce como
distribución de frecuencias relativas, distribución porcentual o tabla de frecuencias
relativas.
Su representación gráfica se obtiene del histograma o polígono de
frecuencias sin más que cambiar la escala vertical de frecuencia a frecuencia
relativa.
Las gráficas resultantes se llaman histogramas de frecuencias relativas o
histogramas porcentuales y polígonos de frecuencias relativas o polígonos
porcentuales respectivamente.

Distribuciones de frecuencia acumulada: Ojivas.

La frecuencia total de todos los valores menores que el límite real superior
de la clase de un intervalo, se conoce como frecuencia acumulada hasta ese
intervalo de clase inclusive.
Una tabla que represente las frecuencias acumuladas se llama distribución
de frecuencias acumuladas ó distribución acumulada.
En otros casos es necesario considerar una distribución de frecuencias
acumuladas de todos los valores mayores al límite real inferior de clase de cada
intervalo, ésta es llamada una distribución acumulada “mayor que” ó “más que”,
mientras que la mencionada anteriormente es conocida como distribución
acumulada “menor que”.
Un gráfico que represente las frecuencias acumuladas menores que
cualquier límite real superior de clase, tomando a los límites reales superiores en
el eje x y las frecuencias acumuladas menores que en el eje y, se conoce como
ojiva menor que. Si colocamos en el eje x, los límites reales inferiores y en el eje y
las frecuencias acumuladas mayor que, obtendremos la ojiva mayor que u ojiva o
más.
Distribuciones de frecuencia relativa acumulada. Ojivas porcentuales.

La frecuencia relativa acumulada o frecuencia porcentual acumulada es la
frecuencia acumulada dividida por la frecuencia total.
Si sustituímos a las frecuencias acumuladas por las frecuencias relativas
acumuladas, obtenemos las distribuciones de frecuencias relativas (porcentuales)
acumuladas y los polígonos de frecuencias relativas acumuladas u ojivas
porcentuales “menor que” o “mayor que”.

Ejemplo 1.4
En la producción de acero al manganeso se utiliza un horno de 4 toneladas,
en el cual se hacen 5 coladas en un turno de 8 horas. Se requiere controlar el
contenido de Manganeso por medio de adiciones finales, de acuerdo con el
análisis previo del baño, no debiendo de exceder el contenido de Mn del 1 %, pues
en caso contrario será rechazada la colada.
Como en cada turno se puede considerar que se han empleado los mismos
materiales, equipo y personal similar, la calidad dependerá de la eficiencia con que
se opere el horno.
Los datos recabados en una semana, a fin de establecer el control fueron

los siguientes:
Coladas por turno

DIA TURNO
1ª 2ª 3ª 4ª 5ª
1 0.70 0.72 0.61 0.75 0.73
Lunes 2 0.83 0.68 0.83 0.71 0.73
3 0.86 0.78 0.71 0.70 0.90
1 0.80 0.78 0.68 0.70 0.74
Martes 2 0.64 0.66 0.79 0.81 0.68
3 0.68 0.64 0.71 0.69 0.81
1 0.80 0.63 0.69 0.62 0.75
Miércoles 2 0.65 0.81 0.68 0.84 0.66
3 0.64 0.70 0.66 0.69 0.93
1 0.77 0.83 0.88 0.70 0.64
Jueves 2 0.72 0.67 0.77 0.74 0.72
3 0.73 0.66 0.72 0.73 0.71
1 0.79 0.70 0.63 0.70 0.88
Viernes 2 0.85 0.80 0.78 0.85 0.62
3 0.67 0.78 0.81 0.84 0.96
Reglas generales para formar distribuciones de frecuencia.
1) Determinar el mayor y el menor entre los datos registrados para obtener el

rango.
VMayor = 0.96 VMenor = 0.61 Rango = VMayor - VMenor
R = 0.96 – 0.61 = 0.35

2) Dividir el rango en un número conveniente de intervalos de clase del mismo

tamaño. Como parte de este análisis se determina el valor de c.
Se proponen varios valores para c:
c1 = 0.03 c2 = 0.05 c3 = 0.07
R
# de intervalos = 1
c
R 0.35 R 0.35 R 0.35

1   1  13 1  1  8 1  1  6
c1 0.03 c2 0.05 c3 0.07
Escogemos la situación intermedia, c = 0.05
3) Se recomienda que el dato menor del conjunto sea el límite inferior del
primer intervalo, a partir del valor de c, se establece el límite superior de la
clase.
0.61  0.65
4) Se generan los intervalos que sean necesarios.
5) Los intervalos se eligen también de manera que las marcas de clase

coincidan con los datos observados.
6) Determinar el número de observaciones que caen dentro de cada intervalo

de clase, es decir encontrar las frecuencias de clase.
Clases Frecuencia M Clase

0.61 – 0.65 11 0.63
0.66 – 0.70 20 0.68
0.71 – 0.75 16 0.73
0.76 – 0.80 11 0.78
0.81 – 0.85 11 0.83
0.86 – 0.90 4 0.88
0.91 – 0.95 1 0.93
0.96 – 1.00 1 0.98
∑ fi = 75

De acuerdo a la información del ejemplo 1.3, obtener:
a) Distribución de frecuencias. h) Polígono de frecuencias.

b) Distribución de frecuencias acumuladas menor que. i) Ojiva menor que.
c) Distribución de frecuencias acumuladas mayor que. j) Ojiva mayor que.
d) Distribución de frecuencias relativas. k) Histograma porcentual.
e) Distribución de frecuencias relativas menor que. l) Polígono porcentual.
f) Distribución de frecuencias relativas mayor que. m) Ojiva menor que porcentual.
g) Histograma. n) Ojiva mayor que porcentual.
Diámetro (in) Frecuencia M. de Clase Lím. Reales Frec.Acum < Frec. Acum > Frec % Frec. Ac. < % Frec. Ac. > %
0.7246 L.R.I − L.R.S
0.7247 − 0.7249 2 0.7248 0.72465 − 0.72495 < 0.72495 = 2 > 0.72465 = 250 0.8 0.8 100.0
0.7250 − 0.7252 6 0.7251 0.72495 − 0.72525 < 0.72525 = 8 > 0.72495 = 248 2.4 3.2 99.2
0.7253 − 0.7255 8 0.7254 0.72525 − 0.72555 < 0.72555 = 16 > 0.72525 = 242 3.2 6.4 96.8
0.7256 − 0.7258 15 0.7257 0.72555 − 0.72585 < 0.72585 = 31 > 0.72555 = 234 6.0 12.4 93.6
0.7259 − 0.7261 42 0.7260 0.72585 − 0.72615 < 0.72615 = 73 > 0.72585 = 219 16.8 29.2 87.6
0.7262 − 0.7264 68 0.7263 0.72615 − 0.72645 < 0.72645 = 141 > 0.72615 = 177 27.2 56.4 70.8
0.7265 − 0.7267 49 0.7266 0.72645 − 0.72675 < 0.72675 = 190 > 0.72645 = 109 19.6 76.0 43.6
0.7268 − 0.7270 25 0.7269 0.72675 − 0.72705 < 0.72705 = 215 > 0.72675 = 60 10.0 86.0 24.0
0.7271 − 0.7273 18 0.7272 0.72705 − 0.72735 < 0.72735 = 233 > 0.72705 = 35 7.2 93.2 14.0
0.7274 − 0.7276 12 0.7275 0.72735 − 0.72765 < 0.72765 = 245 > 0.72735 = 17 4.8 98.0 6.8
0.7277 − 0.7279 4 0.7278 0.72765 − 0.72795 < 0.72795 = 249 > 0.72765 = 5 1.6 99.6 2.0
0.7280 − 0.7282 1 0.7281 0.72795 − 0.72825 < 0.72825 = 250 > 0.72795 = 1 0.4 100.0 0.4
0.7283 −
250 100.0

HISTOGRAMA
80
70 68
60
49
50
FRECUENCIA
42
40 Series1
30
25
20 18
15
12
10 8
6
4
2 1
0
0.7248 0.7251 0.7254 0.7257 0.7260 0.7263 0.7266 0.7269 0.7272 0.7275 0.7278 0.7281
DIAMETRO DE CABEZA DE REMACHES (Marca de Clase) in.
POLIGONO DE FRECUENCIA
80
70
68
60
50 49
FRECUENCIA
42
40 Series1
30
25
20
18
15
12
10
8
6
4
2 1
0
0.7248 0.7251 0.7254 0.7257 0.7260 0.7263 0.7266 0.7269 0.7272 0.7275 0.7278 0.7281
DIAMETRO DE CABEZA DE REMACHE (Marca de Clase) in.

OJIVA MENOR QUE
300
250 249 250

245
233
215
200
190
FRECUENCIA
Series1
150
141 Series2
100
73
50
31
16
8
0 2
0.72495 0.72525 0.72555 0.72585 0.72615 0.72645 0.72675 0.72705 0.72735 0.72765 0.72795 0.72825
DIAMETRO DE CABEZA DE REMACHES (Limite real superior) in.
OJIVA MAYOR QUE
300
250 250 248

242
234
219
200
177
FRECUENCIA
150 Series1
109
100
60
50
35
17
5 1
0
0.72465 0.72495 0.72525 0.72555 0.72585 0.72615 0.72645 0.72675 0.72705 0.72735 0.72765 0.72795
DIAMETRO DE CABEZA DE REMACHE (Limite Real Inferior) in.

HISTOGRAMA PORCENTUAL
30
27.2
25
19.6
20
FRECUENCIA %
16.8
15 Series1
10
10
7.2
6
4.8
5
3.2
2.4
1.6
0.8 0.4
0
0.7248 0.7251 0.7254 0.7257 0.7260 0.7263 0.7266 0.7269 0.7272 0.7275 0.7278 0.7281
DIAMETRO DE CABEZA DE REMACHE (Marca De Clase) in.
POLIGONO DE FRECUENCIA %
30
27.2
25
20 19.6
FRECUENCIA %
16.8
15 Series1
10 10
7.2
6
5 4.8
3.2
2.4
1.6
0.8 0.4
0
0.7248 0.7251 0.7254 0.7257 0.7260 0.7263 0.7266 0.7269 0.7272 0.7275 0.7278 0.7281
DIAMETRO DE REMACHE (Marca de Clase) in.

OJIVA MENOR QUE %
120
100 99.6 100

98
93.2
86
80
76
FRECUENCIA %
60 Series1
56.4
40
29.2
20
12.4
6.4
3.2
0 0.8
0.72495 0.72525 0.72555 0.72585 0.72615 0.72645 0.72675 0.72705 0.72735 0.72765 0.72795 0.72825
DIAMETRO DE CABEZA DE REMACHE (Limite Real Superior) in.
OJIVA MAYOR QUE %
120
100 100 99.2

96.8
93.6
87.6
80
FRECUENCIA %
70.8
60 Series1
43.6
40
24
20
14
6.8
2 0.4
0
0.72465 0.72495 0.72525 0.72555 0.72585 0.72615 0.72645 0.72675 0.72705 0.72735 0.72765 0.72795
DIAMETRO DE CABEZA DE REMACHE (Limite Real Inferior) in.

1.2.5 Ejercicios propuestos: Distribución de frecuencias y sus gráficos.

Para cada uno de los ejercicios siguientes obtener:
a) Distribución de frecuencias. h) Polígono de frecuencias.

b) Distribución de frecuencias acumuladas menor que. i) Ojiva menor que.
c) Distribución de frecuencias acumuladas mayor que. j) Ojiva mayor que.
d) Distribución de frecuencias relativas. k) Histograma porcentual.
e) Distribución de frecuencias relativas menor que. l) Polígono porcentual.
f) Distribución de frecuencias relativas mayor que. m) Ojiva menor que porcentual.
g) Histograma. n) Ojiva mayor que porcentual.
Ejercicio 1.1
SECTOR MINERO
Volumen de Producción Minera por Principales Entidades Federativas y Municipios
Plomo Zacatecas Unidad de Medida: Toneladas.
FUENTE: INEGI. Estadística de la Industria Minerometalúrgica.
1995/05 4,739 1997/07 5,107 1999/12 1,681 2002/05 3,419

1995/06 5,029 1997/08 4,977 2000/01 1,393 2002/06 2,853
1995/07 4,542 1997/09 4,280 2000/02 1,176 2002/07 3,372
1995/08 4,234 1997/10 5,185 2000/03 1,522 2002/08 3,625
1997/11 6,081 2000/04 1,064 2002/09 2,667
1995/09 6,129
1997/12 5,996 2000/05 1,756 2002/10 4,883
1995/10 3,971 2000/06 2002/11
1998/01 4,835 1,620 4,140
1995/11 5,420 2000/07 1,911 2002/12 4,299
1998/02 4,583
1995/12 4,856 2000/08 1,760 2003/01 3,696
1998/03 3,897
1996/01 6,135 2000/09 1,605 2003/02 3,664
1998/04 4,218
1996/02 4,588 2000/10 1,737 2003/03 3,706
1998/05 6,052
1996/03 3,729 1998/06 4,125 2000/11 1,916 2003/04 3,835
1996/04 4,486 1998/07 3,870 2000/12 1,891 2003/05 3,581
1996/05 4,482 1998/08 4,026 2001/01 1,749 2003/06 4,429
1996/06 3,871 1998/09 3,424 2001/02 1,970 2003/07 4,544
1996/07 4,064 1998/10 5,102 2001/03 2,777 2003/08 4,725
1996/08 5,514 1998/11 3,381 2001/04 2,346 2003/09 4,435
1998/12 3,107 2001/05 2,342 2003/10 4,680
1996/09 4,475
1999/01 3,205 2001/06 2,429 2003/11 4,699
1996/10 4,025 2001/07 2,475 2003/12 4,280
1999/02 2,406
1996/11 4,690 1999/03 2,060 2001/08 1,813 2004/01 4,351
1996/12 7,497 1999/04 1,738 2001/09 2,154 2004/02 3,670
1997/01 3,480 1999/05 1,406 2001/10 2,276 2004/03 4,361
1997/02 6,589 1999/06 1,547 2001/11 2,332 2004/04 3,848
1997/03 3,697 1999/07 3,091 2001/12 2,414 2004/05 4,478
1997/04 4,028 1999/08 863 2002/01 2,814 2004/06 4,655
1999/09 1,886 2002/02 3,122
1997/05 5,231
1999/10 2,822 2002/03 3,244
1997/06 6,301 2002/04 2,757
1999/11 733

Ejercicio 1.2
SECTOR MINERO
Zinc Zacatecas Unidad de Medida: Toneladas.
FUENTE: INEGI. Estadística de la Industria Minerometalúrgica.
PERIODO Total 1996/08 8164 1999/04 9114 2001/12 10322

1994/01 8735 1996/09 6290 1999/05 7019 2002/01 13745
1994/02 3924 1996/10 6776 1999/06 8570 2002/02 14354
1994/03 13059 1996/11 8268 1999/07 7904 2002/03 11879
1994/04 10033 1996/12 10702 1999/08 8289 2002/04 15768
1994/05 8302 1997/01 9490 1999/09 9752 2002/05 14790
1994/06 11639 1997/02 6791 1999/10 4640 2002/06 15845
1994/07 7023 1997/03 6871 1999/11 6814 2002/07 16805
1994/08 7435 1997/04 5700 1999/12 7475 2002/08 18933
1994/09 7397 1997/05 7902 2000/01 6245 2002/09 9985
1994/10 9856 1997/06 7655 2000/02 5399 2002/10 18707
1994/11 5981 1997/07 9417 2000/03 7181 2002/11 16611
1994/12 9862 1997/08 9954 2000/04 6033 2002/12 17930
1995/01 7255 1997/09 9838 2000/05 7943 2003/01 16163
1995/02 6505 1997/10 9417 2000/06 8060 2003/02 15947
1995/03 4120 1997/11 9157 2000/07 8276 2003/03 17011
1995/04 7441 1997/12 6950 2000/08 7787 2003/04 15828
1995/05 13542 1998/01 8330 2000/09 8150 2003/05 15482
1995/06 5713 1998/02 7962 2000/10 9203 2003/06 17063
1995/07 8534 1998/03 9585 2000/11 7309 2003/07 15894
1995/08 6752 1998/04 7349 2000/12 8074 2003/08 15861
1995/09 13921 1998/05 10705 2001/01 8620 2003/09 14982
1995/10 7133 1998/06 8495 2001/02 8147 2003/10 16508
1995/11 10675 1998/07 10227 2001/03 9365 2003/11 14643
1995/12 8066 1998/08 8862 2001/04 8471 2003/12 15341
1996/01 8634 1998/09 8189 2001/05 9160 2004/01 15704
1996/02 7125 1998/10 8910 2001/06 9535 2004/02 14418
1996/03 7642 1998/11 9452 2001/07 9136 2004/03 16290
1996/04 7441 1998/12 9457 2001/08 11377 2004/04 15136
1996/05 7539 1999/01 11382 2001/09 11360 2004/05 16244
1996/06 8689 1999/02 9384 2001/10 12028 2004/06 16513
1996/07 7049 1999/03 9839 2001/11 14718

Ejercicio 1.3
Sector Minero Volumen de Producción Minera por Principales Entidades Federativas y Municipios
Coque Coahuila de Zaragoza Unidad de Medida: Toneladas.
Fuente: INEGI. Estadística de la Industria Minerometalúrgica.
PERIODO Total 1993/09 115,008 1997/06 135,102 2001/03 140,962

1990/01 149,941 1993/10 123,488 1997/07 140,154 2001/04 136,701
1990/02 139,491 1993/11 120,449 1997/08 137,730 2001/05 143,216
1990/03 156,703 1993/12 125,730 1997/09 135,210 2001/06 138,229
1990/04 154,783 1994/01 124,473 1997/10 125,277 2001/07 134,204
1990/05 154,617 1994/02 112,719 1997/11 128,366 2001/08 127,522
1990/06 148,709 1994/03 127,035 1997/12 132,905 2001/09 121,241
1990/07 146,133 1994/04 124,089 1998/01 134,384 2001/10 114,824
1990/08 145,217 1994/05 129,470 1998/02 122,941 2001/11 124,414
1990/09 144,941 1994/06 121,955 1998/03 137,403 2001/12 108,687
1990/10 147,645 1994/07 126,252 1998/04 132,067 2002/01 110,153
1990/11 149,276 1994/08 124,645 1998/05 135,096 2002/02 101,593
1990/12 150,253 1994/09 121,662 1998/06 132,467 2002/03 111,773
1991/01 142,922 1994/10 132,374 1998/07 135,414 2002/04 112,320
1991/02 132,741 1994/11 125,599 1998/08 151,626 2002/05 127,646
1991/03 146,579 1994/12 127,424 1998/09 147,013 2002/06 126,206
1991/04 133,822 1995/01 131,443 1998/10 152,510 2002/07 129,723
1991/05 135,296 1995/02 126,127 1998/11 146,647 2002/08 132,806
1991/06 137,453 1995/03 137,535 1998/12 153,986 2002/09 128,080
1991/07 136,550 1995/04 134,091 1999/01 144,802 2002/10 131,419
1991/08 135,383 1995/05 149,791 1999/02 138,517 2002/11 122,989
1991/09 129,955 1995/06 138,205 1999/03 157,437 2002/12 116,383
1991/10 128,352 1995/07 127,496 1999/04 141,806 2003/01 118,956
1991/11 123,660 1995/08 138,643 1999/05 135,529 2003/02 115,271
1991/12 132,949 1995/09 133,460 1999/06 134,244 2003/03 132,093
1992/01 128,823 1995/10 136,467 1999/07 139,207 2003/04 128,575
1992/02 126,581 1995/11 144,082 1999/08 142,068 2003/05 130,032
1992/03 128,146 1995/12 144,289 1999/09 138,506 2003/06 115,101
1992/04 119,402 1996/01 145,442 1999/10 142,224 2003/07 116,004
1992/05 125,196 1996/02 132,901 1999/11 142,012 2003/08 121,987
1992/06 114,648 1996/03 140,716 1999/12 146,880 2003/09 117,995
1992/07 116,420 1996/04 137,607 2000/01 138,215 2003/10 120,868
1992/08 122,374 1996/05 138,424 2000/02 131,194 2003/11 118,715
1992/09 123,195 1996/06 134,250 2000/03 143,192 2003/12 126,509
1992/10 125,757 1996/07 136,576 2000/04 145,078 2004/01 113,917
1992/11 114,585 1996/08 140,343 2000/05 146,823 2004/02 108,065
1992/12 115,245 1996/09 135,522 2000/06 141,887 2004/03 125,624
1993/01 109,423 1996/10 141,054 2000/07 147,013 2004/04 121,466
1993/02 107,137 1996/11 135,438 2000/08 147,202 2004/05 118,947
1993/03 123,802 1996/12 138,237 2000/09 138,933 2004/06 117,252
1993/04 118,667 1997/01 138,797 2000/10 144,873 2004/07 122,180
1993/05 117,063 1997/02 127,330 2000/11 142,095 2004/08 122,689
1993/06 115,949 1997/03 139,531 2000/12 142,449 2004/09 120,894
1993/07 119,393 1997/04 134,966 2001/01 141,631 2004/10 126,958
1993/08 120,508 1997/05 137,541 2001/02 126,580

1.3 Medidas Descriptivas
Las medidas descriptivas son valores numéricos calculados a partir de la

muestra y que nos resumen la información contenida en ella.
Posición.
Dividen un conjunto ordenado de datos en grupos con la misma
cantidad de individuos:
a) Cuartiles.
b) Deciles.
c) Percentiles.
Centralización.
Indican valores con los cuales, los datos, parecen agruparse:
a) Media.
b) Mediana.
Medidas c) Moda.
descriptivas
Dispersión.
Representan la mayor o menor concentración de los datos con
respecto a las medidas de centralización:
a) Varianza.
b) Desviación típica.
Forma.
Indicadores que describen el comportamiento gráfico de los datos:
a) Asimetría.
b) Apuntamiento o curtosis.
1.3.1 Medidas de Posición: Cuantiles

Los cuantiles son valores de la distribución que la dividen en partes iguales,
es decir, en intervalos, que comprenden el mismo número de valores.
Los más usados son los cuartiles, los deciles y los percentiles.
Cuartiles: son los tres valores que dividen al conjunto de datos ordenados en
cuatro partes iguales, son un caso particular de los percentiles:
- El primer cuartil Q1 es el menor valor que es mayor que una cuarta parte de
los datos.

- El segundo cuartil Q2 (la mediana), es el menor valor que es mayor que la

mitad de los datos.
- El tercer cuartil Q3 es el menor valor que es mayor que tres cuartas partes
de los datos.
Deciles: son los nueve valores que dividen al conjunto de datos ordenados en
diez partes iguales, son también un caso particular de los percentiles.
Percentiles: son 99 valores que dividen en cien partes iguales el conjunto de

datos ordenados. Ejemplo, el percentil de orden 15 deja por debajo al 15% de las
observaciones, y por encima queda el 85%
1.3.2 Medidas de Tendencia Central: Promedios
Este tipo de medidas nos permiten identificar y ubicar el punto (valor) alrededor
del cual se tienden ha reunir los datos (“Punto central”). Estas medidas aplicadas a
las características de las unidades de una muestra se les denomina estimadores o
estadígrafos; mientras que aplicadas a poblaciones se les denomina parámetros o
valores estadísticos de la población. Los principales promedios son la media, la
mediana y la moda.
1. Media.
Es la medida de posición central más utilizada, la más conocida y la más
sencilla de calcular, debido principalmente a que sus ecuaciones se prestan para
el manejo algebraico, lo cual la hace de gran utilidad. Su principal desventaja
radica en su sensibilidad al cambio de uno de sus valores o a los valores extremos
demasiado grandes o pequeños. La media se define como la suma de todos los
valores observados, dividido por el número total de observaciones.
Cuando los valores representan una población la ecuación se define como:
Donde (µ) representa la media, (N) representa el tamaño de la población y

(Xi) representa cada uno de los valores de la población. Ya que en la mayoría de
los casos se trabajan con muestras de la población todas las ecuaciones que se
presenten a continuación serán representativas para las muestras. La media
aritmética para una muestra esta determinada como

Donde (X) representa la Media para la muestra, (n) el tamaño de la muestra

y (Xi) representa cada uno de los valores observados.
Es importante resaltar que existe una gran variedad de medias como la Media
geométrica, la Media ponderada, la Media cuadrática, etc. Por el momento sólo
hacemos énfasis en la media aritmética ya que es la más utilizada, aunque se
recomienda a los lectores profundizar en estos temas.
2. Mediana.
Con esta medida podemos identificar el valor que se encuentra en el centro de
los datos, es decir, nos permite conocer el valor que se encuentra exactamente en
la mitad del conjunto de datos después que las observaciones se han ubicado en
serie ordenada. Esta medida nos indica que la mitad de los datos se encuentran
por debajo de este valor y la otra mitad por encima del mismo. Para determinar la
posición de la mediana se utiliza la fórmula
Para comprender este concepto vamos a suponer que tenemos la serie ordenada
de valores (2, 5, 8, 10 y 13), la posición de la mediana sería:
Lo que nos indica que el valor de la mediana corresponde a la tercera

posición de la serie, que equivale al número (8). Si por el contrario contamos con
un conjunto de datos que contiene un número par de observaciones, es necesario
promediar los dos valores medios de la serie. Si en el ejemplo anterior le
anexamos el valor 15, tendríamos la serie ordenada (2, 5, 8, 10, 13 y 15) y la
posición de la mediana sería,
Es decir, la posición tres y medio. Dado que es imposible destacar la

posición tres y medio, es necesario promediar los dos valores de la posiciones
tercera y cuarta para producir una mediana equivalente, que para el caso
corresponden a (8 + 10)/2 =9. Lo que nos indicaría que la mitad de los valores se
encuentra por debajo del valor 9 y la otra mitad se encuentra por encima de este
valor.

En conclusión la mediana nos indica el valor que separa los datos en dos
fracciones iguales con el cincuenta por ciento de los datos cada una. Para las
muestras que cuentan con un número impar de observaciones o datos, la mediana
dará como resultado una de las posiciones de la serie ordenada; mientras que
para las muestras con un número par de observaciones se debe promediar los
valores de las dos posiciones centrales.
3. Moda.
La medida modal nos indica el valor que más veces se repite dentro de los
datos; es decir, si tenemos la serie ordenada (2, 2, 5 y 7), el valor que más veces
se repite es el número 2 quien sería la moda de los datos. Es posible que en
algunas ocasiones se presente dos valores con la mayor frecuencia, lo cual se
denomina Bimodal o en otros casos más de dos valores, lo que se conoce como
multimodal.
En conclusión las Medidas de tendencia central, nos permiten identificar los

valores más representativos de los datos, de acuerdo a la manera como se
tienden a concentrar. La Media nos indica el promedio de los datos; es decir, nos
informa el valor que obtendría cada uno de los individuos si se distribuyeran los
valores en partes iguales. La Mediana por el contrario nos informa el valor que
separa los datos en dos partes iguales, cada una de las cuales cuenta con el
cincuenta por ciento de los datos. Por último la Moda nos indica el valor que más
se repite dentro de los datos.
1.3.3 Medidas de Dispersión.
Las medidas de tendencia central tienen como objetivo el sintetizar los

datos en un valor representativo, las medidas de dispersión nos dicen hasta que
punto estas medidas de tendencia central son representativas como síntesis de la
información.
Las medidas de dispersión cuantifican la separación, la dispersión, la

variabilidad de los valores de la distribución respecto al valor central.
Medidas de dispersión
Varianza ( s2 ): es el promedio del cuadrado de las distancias entre cada

observación y la media aritmética del conjunto de observaciones.
Desviación Típica (S): La varianza viene dada por las mismas unidades que la
variable pero al cuadrado, para evitar este problema podemos usar como medida

de dispersión la desviación típica que se define como la raíz cuadrada positiva de

la varianza
Para estimar la desviación típica de una población a partir de los datos de

una muestra se utiliza la fórmula (cuasi desviación típica):
Recorrido o Rango Muestral (Re). Es la diferencia entre el valor de las

observaciones mayor y el menor. Re = xmax - xmin
1.3.4 Medidas de Forma.
Comparan la forma que tiene la representación gráfica, bien sea el

histograma o el diagrama de barras de la distribución, con la distribución normal.
Medida de Asimetría.
Esta medida nos permite identificar si los datos se distribuyen de forma

uniforme alrededor del punto central (Media aritmética). La asimetría presenta tres
estados diferentes, cada uno de los cuales define de forma concisa como están
distribuidos los datos respecto al eje de simetría.
Se dice que la asimetría es positiva cuando la mayoría de los datos se
encuentran a la izquierda del valor de la media aritmética, la curva es Simétrica
cuando se distribuyen aproximadamente la misma cantidad de valores en ambos
lados de la media y se conoce como asimetría negativa cuando la mayor cantidad
de datos se aglomeran a la derecha de la media.

El Coeficiente de asimetría, se representa mediante la ecuación

matemática:
Donde (g1) representa el coeficiente de asimetría de Fisher, (Xi) cada uno

de los valores, ( ) la media de la muestra y (ni) la frecuencia de cada valor. Los
resultados de esta ecuación se interpretan:
 (g1 = 0): Se acepta que la distribución es Simétrica, es decir, existe

aproximadamente la misma cantidad de valores a los dos lados de la
media. Este valor es difícil de conseguir por lo que se tiende a tomar los
valores que son cercanos ya sean positivos o negativos (± 0.5).
 (g1 > 0): La curva es asimétricamente positiva por lo que los valores se
tienden a reunir más en la parte izquierda que en la derecha de la media.
 (g1 < 0): La curva es asimétricamente negativa por lo que los valores se
tienden a reunir más en la parte derecha de la media.
Desde luego entre mayor sea el número (Positivo o Negativo), mayor será la
distancia que separa la aglomeración de los valores con respecto a la media.
Diremos que una distribución es simétrica cuando su mediana, su moda y su

media aritmética coinciden.
Diremos que una distribución es asimétrica a la derecha si las frecuencias

(absolutas o relativas) descienden más lentamente por la derecha que por la
izquierda.
Si las frecuencias descienden más lentamente por la izquierda que por la

derecha diremos que la distribución es asimétrica a la izquierda.
Medida de Apuntamiento o Curtosis.
Miden la mayor o menor cantidad de datos que se agrupan en torno a la

moda. Se definen 3 tipos de distribuciones según su grado de curtosis:

Distribución mesocúrtica: presenta un grado de concentración medio alrededor

de los valores centrales de la variable (el mismo que presenta una distribución
normal).
Distribución leptocúrtica: presenta un elevado grado de concentración alrededor

de los valores centrales de la variable.
Distribución platicúrtica: presenta un reducido grado de concentración alrededor

de los valores centrales de la variable.
Para calcular el coeficiente de Curtosis se utiliza la ecuación:
Donde (g2) representa el coeficiente de Curtosis, (Xi) cada uno de los

valores, ( ) la media de la muestra y (ni) la frecuencia de cada valor. Los
resultados de esta fórmula se interpretan:
 (g2 = 0) la distribución es Mesocúrtica: Al igual que en la asimetría es

bastante difícil encontrar un coeficiente de Curtosis de cero (0), por lo que
se suelen aceptar los valores cercanos (± 0.5 aprox.).
 (g2 > 0) la distribución es Leptocúrtica
 (g2 < 0) la distribución es Platicúrtica
Cuando la distribución de los datos cuenta con un coeficiente de asimetría

(g1 = ±0.5) y un coeficiente de Curtosis de (g 2 = ±0.5), se le denomina Curva
Normal. Este criterio es de suma importancia ya que para la mayoría de los
procedimientos de la estadística de inferencia se requiere que los datos se
distribuyan normalmente.

La principal ventaja de la distribución normal radica en el supuesto que el

95% de los valores se encuentra dentro de una distancia de dos desviaciones
estándar de la media aritmética; es decir, si tomamos la media y le sumamos dos
veces la desviación y después le restamos a la media dos desviaciones, el 95% de
los casos se encontraría dentro del rango que compongan estos valores.
1.3.5 Ejercicios propuestos: Medidas Descriptivas. (Medidas de posición,

centralización, dispersión y de forma)
Ejercicio 1.4
SECTOR MINERO
Plomo Zacatecas Unidad de Medida: Toneladas.
Ejercicio 1.5
SECTOR MINERO
Zinc Zacatecas Unidad de Medida: Toneladas.
Ejercicio 1.6
SECTOR MINERO
Coque Coahuila de Zaragoza Unidad de Medida: Toneladas.
Fuente: INEGI. Estadística de la Industria Minerometalúrgica
Para cada uno de los ejercicios anteriores, obtener:
a) Cuartiles. e) Varianza.
b) Media. f) Desviación Típica.
c) Mediana. g) Coeficiente de asimetría.
d) Moda. h) Coeficiente de curtosis.
(Tomar los datos de los ejercicios 1.1, 1.2 y 1.3).

Utilice las funciones estadísticas de Excel.

Capítulo 1 Estadística Descriptiva

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Capítulo 1 Estadística Descriptiva

Enviado por

Direitos autorais:

Formatos disponíveis

Facultad de Ingeniería, UASLP Área de Metalurgia

La Estadística se divide en dos ramas:

Ramiro A. Ramírez Cano 1

personas, animales o ciertas cosas. Hacia el año 3000 a. C. los babilónicos

Ramiro A. Ramírez Cano 2

Ramiro A. Ramírez Cano 3

La estadística es una ciencia transversal a una amplia variedad de disciplinas,

Ramiro A. Ramírez Cano 4

control de calidad, y es usada para la toma de decisiones en áreas de negocios e

Ciencias actuariales Estadística en las Ciencias de la Salud

La estadística es una herramienta básica en negocios y producción. Es usada

Es a menudo imposible o poco práctico observar la totalidad de los

Ramiro A. Ramírez Cano 5

“Una muestra debe ser definida en base de la población determinada, y las

Ramiro A. Ramírez Cano 6

1.2 Introducción a la Estadística Descriptiva

La estadística descriptiva es una ciencia que analiza series de datos (por

Las variables pueden ser de dos tipos:

Variables cualitativas o atributos: no se pueden medir numéricamente (por

Variables cuantitativas: tienen valor numérico (edad, precio de un producto,

Las variables también se pueden clasificar en:

Variables unidimensionales: sólo recogen información sobre una característica

Variables bidimensionales: recogen información sobre dos características de la

Variables pluridimensionales: recogen información sobre tres o más

Por su parte, las variables cuantitativas se pueden clasificar en discretas y

Ramiro A. Ramírez Cano 7

1.2.1 Distribución de frecuencia.

La distribución de frecuencia es la representación estructurada, en forma

Variable Frecuencias absolutas Frecuencias relativas

Siendo X los distintos valores que puede tomar la variable.

Ramiro A. Ramírez Cano 8

Si presentamos esta información estructurada obtendríamos la siguiente

Variable Frecuencias absolutas Frecuencias relativas

1.2.2 Distribución de frecuencia agrupada.

Ramiro A. Ramírez Cano 9

Si presentáramos esta información en una tabla de frecuencia

Estatura Frecuencias absolutas Frecuencias relativas

El número de tramos en los que se agrupa la información es una decisión

Diámetro (in) Frecuencia

Ramiro A. Ramírez Cano 10

Puesto que dos remaches corresponden a ese rango, la correspondiente

Límites Reales de clase:

Tamaño o anchura de un intervalo de clase:

0.7265  0.7267 072645  0.72675

Ramiro A. Ramírez Cano 11

Este valor es llamado también punto medio de la clase. Para análisis

1.2.3 Reglas generales para formar distribuciones de frecuencia.

Distribuciones de frecuencia relativa.

Ramiro A. Ramírez Cano 12

Distribuciones de frecuencia acumulada: Ojivas.

Distribuciones de frecuencia relativa acumulada. Ojivas porcentuales.

Ramiro A. Ramírez Cano 13

Los datos recabados en una semana, a fin de establecer el control fueron

Coladas por turno

Reglas generales para formar distribuciones de frecuencia.

1) Determinar el mayor y el menor entre los datos registrados para obtener el

R = 0.96 – 0.61 = 0.35

Ramiro A. Ramírez Cano 14

2) Dividir el rango en un número conveniente de intervalos de clase del mismo

c1 = 0.03 c2 = 0.05 c3 = 0.07

R 0.35 R 0.35 R 0.35

Escogemos la situación intermedia, c = 0.05

4) Se generan los intervalos que sean necesarios.

5) Los intervalos se eligen también de manera que las marcas de clase