Escolar Documentos
Profissional Documentos
Cultura Documentos
Capítulo 1: Estadística.
1.1 Generalidades
Definición: Murray R. Spiegel, (1991) dice: “La estadística estudia los métodos
científicos para recoger, organizar, resumir y analizar datos, así como para sacar
conclusiones válidas y tomar decisiones razonables basadas en tal análisis.
Etimología
La palabra "estadística" procede del latín statisticum collegium ("consejo de
Estado") y de su derivado italiano statista ("hombre de Estado" o "político"). El
término alemán Statistik, que fue primeramente introducido por Gottfried
Achenwall (1749), designaba originalmente el análisis de datos del Estado, es
decir, "la ciencia del Estado" (también llamada "aritmética política" de su
traducción directa del inglés).
No fue hasta el siglo XIX cuando el término estadística adquirió el
significado de recolectar y clasificar datos. Este concepto fue introducido por el
inglés John Sinclair.
En su origen, por tanto, la estadística estuvo asociada a datos, a ser
utilizados por el gobierno y cuerpos administrativos (a menudo centralizados). La
colección de datos acerca de estados y localidades continúa ampliamente a través
de los servicios de estadísticas nacionales e internacionales. En particular, los
censos suministran información regular acerca de la población.
Desde los comienzos de la civilización han existido formas sencillas de
estadística, pues ya se utilizaban representaciones gráficas y otros símbolos en
pieles, rocas, palos de madera y paredes de cuevas para contar el número de
Estado actual
Durante el siglo XX, la creación de instrumentos precisos para asuntos de
salud pública (epidemiología, bioestadística, etc.) y propósitos económicos y
sociales (tasa de desempleo, econometría, etc.) necesitó de avances sustanciales
en las practicas estadísticas.
Hoy el uso de la estadística se ha extendido más allá de sus orígenes como
un servicio al Estado o al gobierno. Personas y organizaciones usan la estadística
para entender datos y tomar decisiones en ciencias naturales y sociales, medicina,
ingeniería, negocios y otras áreas.
La estadística es entendida generalmente no como un sub-área de las
matemáticas sino como una ciencia diferente "aliada". Muchas universidades
tienen departamentos académicos de matemáticas y estadística separadamente.
La estadística se enseña en departamentos tan diversos como psicología,
educación y salud pública.
Al aplicar la estadística a un problema científico, industrial o social, se
comienza con un proceso o población a ser estudiado. Esta puede ser la población
de un país, de granos cristalizados en una roca o de bienes manufacturados por
una fábrica en particular durante un periodo dado. También podría ser un proceso
observado en varios instantes y los datos recogidos de esta manera constituyen
una serie de tiempo.
Por razones prácticas, en lugar de compilar datos de una población entera,
usualmente se estudia un subconjunto seleccionado de la población, llamado
muestra. Datos acerca de la muestra son recogidos de manera observacional o
experimental. Los datos son entonces analizados estadísticamente lo cual sigue
dos propósitos: descripción e inferencia.
El concepto de correlación es particularmente valioso. Análisis estadísticos
de un conjunto de datos puede revelar que dos variables (esto es, dos
propiedades de la población bajo consideración) tienden a variar conjuntamente,
como si hubiera una conexión entre ellas. Por ejemplo un estudio del ingreso
anual y la edad de muerte entre personas podría resultar en que personas pobres
tienden a tener vidas más cortas que personas de mayor ingreso. Las dos
variables se dicen a ser correlacionadas. Sin embargo, no se pude inferir
inmediatamente la existencia de una relación de causalidad entre las dos
variables. El fenómeno correlacionado podría ser la causa de un tercero,
previamente no considerado, llamado variable confundida.
Si la muestra es representativa de la población, inferencias y conclusiones
hechas en la muestra pueden ser extendidas a la población completa. Un
problema mayor es el de determinar que tan representativa es la muestra extraída.
El concepto matemático fundamental empleado para entender la
aleatoriedad es el de probabilidad. La estadística matemática (también llamada
teoría estadística) es la rama de las matemáticas aplicadas que usa la teoría de
probabilidades y el análisis matemático para examinar las bases teóricas de la
estadística.
El uso de cualquier método estadístico es válido solo cuando el sistema o
población bajo consideración satisface los supuestos matemáticos del método. El
mal uso de la estadística puede producir serios errores en la descripción e
interpretación, afectando las políticas sociales, la práctica médica y la calidad de
estructuras tales como puentes y plantas de reacción nuclear.
Incluso cuando la estadística es correctamente aplicada, los resultados
pueden ser difícilmente interpretados por un no experto. Por ejemplo, el significado
estadístico de una tendencia en los datos, que mide el grado al cual la tendencia
puede ser causada por una variación aleatoria en la muestra, puede no estar de
acuerdo con el sentido intuitivo. El conjunto de habilidades estadísticas básicas (y
el escepticismo) que una persona necesita para manejar información en el día a
día se refiere como cultura estadística.
Métodos estadísticos
Estudios experimentales y observacionales
Un objetivo común para un proyecto de investigación estadística es
investigar la causalidad, y en particular extraer una conclusión en el efecto que
algunos cambios en los valores de predictores o variables independientes tienen
sobre una respuesta o variables dependientes.
Hay dos grandes tipos de estudios estadísticos para estudiar causalidad:
estudios experimentales y observacionales. En ambos tipos de estudios, el efecto
de las diferencias de una variable independiente (o variables) en el
comportamiento de una variable dependiente es observado. La diferencia entre los
dos tipos es la forma en que el estudio es conducido. Cada uno de ellos puede ser
muy efectivo.
Un estudio experimental implica tomar mediciones del sistema bajo estudio,
manipular el sistema y luego tomar mediciones adicionales usando el mismo
procedimiento para determinar si la manipulación ha modificado los valores de las
mediciones. En contraste, un estudio observacional no necesita manipulación
experimental. Por el contrario, los datos son recogidos y las correlaciones entre
predictores y la respuesta son investigadas.
Un ejemplo de un estudio experimental es el famoso experimento de
Hawthorne el cual pretendía probar cambios en el ambiente de trabajo en la planta
Hawthorne de la Western Electric Company. Los investigadores estaban
interesados en verificar si al incrementar la iluminación en un ambiente de trabajo,
la producción de los trabajadores aumentaba. Los investigadores primero midieron
la productividad de la planta y luego modificaron la iluminación en un área de la
planta para ver si cambios en la iluminación afectarían la productividad. La
productividad mejoró bajo todas las condiciones experimentales. Sin embargo, el
estudio fue muy criticado por errores en los procedimientos experimentales,
específicamente la falta de un grupo control y seguimiento.
Un ejemplo de un estudio observacional es un estudio que explora la
correlación entre fumar y el cáncer de pulmón. Este tipo de estudio normalmente
usa una encuesta para recoger observaciones acerca del área de interés y luego
produce un análisis estadístico. En este caso, los investigadores recogerían
observaciones de fumadores y no fumadores y luego mirarían los casos de cáncer
de pulmón en ambos grupos.
Los pasos básicos para un experimento son:
Planeamiento estadístico de la investigación, lo cual incluye encontrar
fuentes de información, selección de material disponible en el área y
consideraciones éticas para la investigación y el método propuesto. Se
plantea un problema de estudio.
Diseñar el experimento concentrándose en el modelo y la interacción entre
variables independientes y dependientes. Se realiza un muestreo
consistente en la recolección de datos referentes al fenómeno o variable
que deseamos estudiar. Se propone un modelo de probabilidad, cuyos
parámetros se estiman mediante estadísticos a partir de los datos de
muestreo. Sin embargo, se mantiene lo que se denominan "hipótesis
sostenidas" (que no son sometidas a comprobación). Se valida el modelo
comparándolo con lo que sucede en la realidad. Se utiliza métodos
estadísticos conocidos como test de hipótesis y prueba de significación.
Se producen estadísticas descriptivas.
Inferencia estadística. Se llega a un consenso acerca de qué dicen las
observaciones acerca del mundo que observamos.
Se utiliza el modelo validado para tomar decisiones o predecir
acontecimientos futuros. Se produce un reporte final con los resultados del
estudio.
Disciplinas especializadas
Algunos campos de investigación usan la estadística tan extensamente que tienen
terminología especializada. Estas disciplinas incluyen:
Población:
El concepto de población en estadística va más allá de lo que comúnmente
se conoce como tal. Una población se precisa como un conjunto finito o infinito de
personas u objetos que presentan características comunes.
“Una población es un conjunto de todos los elementos que estamos
estudiando, acerca de los cuales intentamos sacar conclusiones”. Levin & Rubin
(1996).
Cuando la población es muy grande, es obvio que la observación de todos
los elementos se dificulte en cuanto al trabajo, tiempo y costos necesarios para
hacerlo. Para solucionar este inconveniente se utiliza una muestra estadística.
Muestra:
“Se llama muestra a una parte de la población a estudiar, que sirve para
representarla”. Murray R. Spiegel (1991).
Tipos de muestreo
Existen dos métodos para seleccionar muestras de poblaciones; el
muestreo no aleatorio o de juicio y el muestreo aleatorio o de probabilidad. En este
último todos los elementos de la población tienen la oportunidad de ser escogidos
en la muestra. Una muestra seleccionada por muestreo de juicio se basa en la
experiencia de alguien con la población.
Variables y Atributos:
Las variables, también suelen ser llamados caracteres cuantitativos, son
aquellos que pueden ser expresados mediante números. Son caracteres
susceptibles de medición. Como por ejemplo, la estatura, el peso, el salario, la
edad, etc.
Según, Murray R. Spiegel, (1992) “una variable es un símbolo, tal como X,
Y, que puede tomar un valor cualquiera de un conjunto determinado de ellos,
llamado dominio de la variable. Si la variable puede tomar solamente un valor, se
llama constante.”
Los atributos también llamados caracteres cualitativos, son aquellos que
no son susceptibles de medición, es decir que no se pueden expresar mediante un
número.
IUTIN (1997). “Reciben el nombre de variables cualitativas o atributos,
aquellas características que pueden presentarse en individuos que constituyen un
conjunto.
Censo:
Se entiende por censo aquella numeración que se efectúa a todos y cada
uno de los caracteres componentes de una población.
Para Levin & Rubin (1996) “Algunas veces es posible y práctico examinar a
cada persona o elemento de la población que deseamos describir. A esto lo
llamamos una numeración completa o censo.
Encuesta:
Se entiende por encuesta las observaciones realizadas por muestreo, es
decir son observaciones parciales.
El diseño de encuestas es exclusivo de las ciencias sociales y parte de la
premisa de que si queremos conocer algo sobre el comportamiento de las
personas, lo mejor, más directo y simple es preguntárselo directamente a ellas.
(Cadenas, 1974).
Datos Estadísticos:
Los datos estadísticos no son otra cosa que el producto de las
observaciones efectuadas en las personas y objetos en los cuales se produce el
fenómeno que queremos estudiar. Dicho en otras palabras, son los antecedentes
(en cifras) necesarios para llegar al conocimiento de un hecho o para reducir las
consecuencias de este.
Los datos estadísticos se pueden encontrar de forma no ordenada, por lo
que es muy difícil en general, obtener conclusiones de los datos presentados de
esta manera. Para poder obtener una precisa y rápida información con propósitos
de descripción o análisis, estos deben organizarse de una manera sistemática; es
decir, se requiere que los datos sean clasificados. Esta clasificación u
organización puede muy bien hacerse antes de la recopilación de los datos.
Discretas: sólo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo:
número de hermanos (puede ser 1, 2, 3....,etc, pero, por ejemplo, nunca podrá ser
3.45).
Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo,
la velocidad de un vehículo puede ser 80.3 km/h, 94.57 km/h...etc.
Ejemplo 1.1
Medimos la altura de los niños de una clase y obtenemos los siguientes resultados
(m):
Alumno Estatura Alumno Estatura Alumno Estatura
x x x x x x
Alumno 1 1,25 Alumno 11 1,23 Alumno 21 1,21
Alumno 2 1,28 Alumno 12 1,26 Alumno 22 1,29
Alumno 3 1,27 Alumno 13 1,30 Alumno 23 1,26
Alumno 4 1,21 Alumno 14 1,21 Alumno 24 1,22
Alumno 5 1,22 Alumno 15 1,28 Alumno 25 1,28
Alumno 6 1,29 Alumno 16 1,30 Alumno 26 1,27
Alumno 7 1,30 Alumno 17 1,22 Alumno 27 1,26
Alumno 8 1,24 Alumno 18 1,25 Alumno 28 1,23
Alumno 9 1,27 Alumno 19 1,20 Alumno 29 1,22
Alumno 10 1,29 Alumno 20 1,28 Alumno 30 1,21
Si los valores que toma la variable son muy diversos y cada uno de ellos se
repite muy pocas veces, entonces conviene agruparlos por intervalos, ya que de
otra manera obtendríamos una tabla de frecuencia muy extensa que aportaría muy
poco valor a efectos de síntesis.
Ejemplo 1.2
Supongamos que medimos la estatura de los habitantes de una vivienda y
obtenemos los siguientes resultados (m):
Habitante Estatura Habitante Estatura Habitante Estatura
x x x x x x
Habitante 1 1,15 Habitante 11 1,53 Habitante 21 1,21
Habitante 2 1,48 Habitante 12 1,16 Habitante 22 1,59
Habitante 3 1,57 Habitante 13 1,60 Habitante 23 1,86
Habitante 4 1,71 Habitante 14 1,81 Habitante 24 1,52
Habitante 5 1,92 Habitante 15 1,98 Habitante 25 1,48
Habitante 6 1,39 Habitante 16 1,20 Habitante 26 1,37
Habitante 7 1,40 Habitante 17 1,42 Habitante 27 1,16
Habitante 8 1,64 Habitante 18 1,45 Habitante 28 1,73
Habitante 9 1,77 Habitante 19 1,20 Habitante 29 1,62
Habitante 10 1,49 Habitante 20 1,98 Habitante 30 1,01
En lugar de ello, preferimos agrupar los datos por intervalos, con lo que la
información queda más resumida (se pierde, por tanto, algo de información), pero
es más manejable e informativa:
0.7247 − 0.7249 2
Ejemplo 1.3
0.7250 − 0.7252 6
La siguiente tabla muestra la 0.7253 − 0.7255 8
distribución de los diámetros 0.7256 − 0.7258 15
de las cabezas de los 0.7259 − 0.7261 42
remaches fabricados por una 0.7262 − 0.7264 68
compañía. 0.7265 − 0.7267 49
0.7268 − 0.7270 25
0.7271 − 0.7273 18
0.7274 − 0.7276 12
0.7277 − 0.7279 4
0.7280 − 0.7282 1
250
Clases:
La primera clase o categoría comprende los valores de 0.7247 a 0.7249 in y
está indicada por el símbolo 0.7247-0.7249.
Intervalos de clases:
Un símbolo que define a una clase, tal como 0.7247-0.7249 se conoce
como intervalo de clase. Los números extremos 0.7247 y 0.7249 son los límites de
clase, inferior y superior respectivamente.
0.7273 0.7274
LRI 0.72735
2
0.7276 0.7277
LRS 0.72765
2
Marca de clase:
La marca de clase es el punto medio del intervalo de clase y se obtiene
sumando los límites inferior y superior de la clase y dividiendo por dos. Por
ejemplo la marca de clase del intervalo 0.7265 – 0.7267 es:
Se recomienda utilizar las funciones estadísticas del Excel para generar los
intervalos y sus correspondientes frecuencias.
1.2.4 Gráficas
Histogramas y polígonos de frecuencia.
Son representaciones gráficas de las distribuciones de frecuencia.
1) Un histograma o histograma de frecuencias consiste en un gráfico de
barras que tienen:
a) Sus bases en el eje horizontal con centros en las marcas de clase y
altura igual a las frecuencias de los intervalos de clase.
b) Superficies proporcionales a las frecuencias de clase.
2) Un polígono de frecuencias es una gráfica de línea que se obtiene mediante
la unión de los puntos (a, b) donde a son las marcas de clase y b su
respectiva frecuencia.
Ejemplo 1.4
En la producción de acero al manganeso se utiliza un horno de 4 toneladas,
en el cual se hacen 5 coladas en un turno de 8 horas. Se requiere controlar el
contenido de Manganeso por medio de adiciones finales, de acuerdo con el
análisis previo del baño, no debiendo de exceder el contenido de Mn del 1 %, pues
en caso contrario será rechazada la colada.
Como en cada turno se puede considerar que se han empleado los mismos
materiales, equipo y personal similar, la calidad dependerá de la eficiencia con que
se opere el horno.
R
# de intervalos = 1
c
3) Se recomienda que el dato menor del conjunto sea el límite inferior del
primer intervalo, a partir del valor de c, se establece el límite superior de la
clase.
0.61 0.65
Diámetro (in) Frecuencia M. de Clase Lím. Reales Frec.Acum < Frec. Acum > Frec % Frec. Ac. < % Frec. Ac. > %
0.7246 L.R.I − L.R.S
0.7247 − 0.7249 2 0.7248 0.72465 − 0.72495 < 0.72495 = 2 > 0.72465 = 250 0.8 0.8 100.0
0.7250 − 0.7252 6 0.7251 0.72495 − 0.72525 < 0.72525 = 8 > 0.72495 = 248 2.4 3.2 99.2
0.7253 − 0.7255 8 0.7254 0.72525 − 0.72555 < 0.72555 = 16 > 0.72525 = 242 3.2 6.4 96.8
0.7256 − 0.7258 15 0.7257 0.72555 − 0.72585 < 0.72585 = 31 > 0.72555 = 234 6.0 12.4 93.6
0.7259 − 0.7261 42 0.7260 0.72585 − 0.72615 < 0.72615 = 73 > 0.72585 = 219 16.8 29.2 87.6
0.7262 − 0.7264 68 0.7263 0.72615 − 0.72645 < 0.72645 = 141 > 0.72615 = 177 27.2 56.4 70.8
0.7265 − 0.7267 49 0.7266 0.72645 − 0.72675 < 0.72675 = 190 > 0.72645 = 109 19.6 76.0 43.6
0.7268 − 0.7270 25 0.7269 0.72675 − 0.72705 < 0.72705 = 215 > 0.72675 = 60 10.0 86.0 24.0
0.7271 − 0.7273 18 0.7272 0.72705 − 0.72735 < 0.72735 = 233 > 0.72705 = 35 7.2 93.2 14.0
0.7274 − 0.7276 12 0.7275 0.72735 − 0.72765 < 0.72765 = 245 > 0.72735 = 17 4.8 98.0 6.8
0.7277 − 0.7279 4 0.7278 0.72765 − 0.72795 < 0.72795 = 249 > 0.72765 = 5 1.6 99.6 2.0
0.7280 − 0.7282 1 0.7281 0.72795 − 0.72825 < 0.72825 = 250 > 0.72795 = 1 0.4 100.0 0.4
0.7283 −
250 100.0
HISTOGRAMA
80
70 68
60
49
50
FRECUENCIA
42
40 Series1
30
25
20 18
15
12
10 8
6
4
2 1
0
0.7248 0.7251 0.7254 0.7257 0.7260 0.7263 0.7266 0.7269 0.7272 0.7275 0.7278 0.7281
DIAMETRO DE CABEZA DE REMACHES (Marca de Clase) in.
POLIGONO DE FRECUENCIA
80
70
68
60
50 49
FRECUENCIA
42
40 Series1
30
25
20
18
15
12
10
8
6
4
2 1
0
0.7248 0.7251 0.7254 0.7257 0.7260 0.7263 0.7266 0.7269 0.7272 0.7275 0.7278 0.7281
DIAMETRO DE CABEZA DE REMACHE (Marca de Clase) in.
300
215
200
190
FRECUENCIA
Series1
150
141 Series2
100
73
50
31
16
8
0 2
0.72495 0.72525 0.72555 0.72585 0.72615 0.72645 0.72675 0.72705 0.72735 0.72765 0.72795 0.72825
DIAMETRO DE CABEZA DE REMACHES (Limite real superior) in.
300
200
177
FRECUENCIA
150 Series1
109
100
60
50
35
17
5 1
0
0.72465 0.72495 0.72525 0.72555 0.72585 0.72615 0.72645 0.72675 0.72705 0.72735 0.72765 0.72795
DIAMETRO DE CABEZA DE REMACHE (Limite Real Inferior) in.
HISTOGRAMA PORCENTUAL
30
27.2
25
19.6
20
FRECUENCIA %
16.8
15 Series1
10
10
7.2
6
4.8
5
3.2
2.4
1.6
0.8 0.4
0
0.7248 0.7251 0.7254 0.7257 0.7260 0.7263 0.7266 0.7269 0.7272 0.7275 0.7278 0.7281
DIAMETRO DE CABEZA DE REMACHE (Marca De Clase) in.
POLIGONO DE FRECUENCIA %
30
27.2
25
20 19.6
FRECUENCIA %
16.8
15 Series1
10 10
7.2
6
5 4.8
3.2
2.4
1.6
0.8 0.4
0
0.7248 0.7251 0.7254 0.7257 0.7260 0.7263 0.7266 0.7269 0.7272 0.7275 0.7278 0.7281
DIAMETRO DE REMACHE (Marca de Clase) in.
120
86
80
76
FRECUENCIA %
60 Series1
56.4
40
29.2
20
12.4
6.4
3.2
0 0.8
0.72495 0.72525 0.72555 0.72585 0.72615 0.72645 0.72675 0.72705 0.72735 0.72765 0.72795 0.72825
DIAMETRO DE CABEZA DE REMACHE (Limite Real Superior) in.
120
80
FRECUENCIA %
70.8
60 Series1
43.6
40
24
20
14
6.8
2 0.4
0
0.72465 0.72495 0.72525 0.72555 0.72585 0.72615 0.72645 0.72675 0.72705 0.72735 0.72765 0.72795
DIAMETRO DE CABEZA DE REMACHE (Limite Real Inferior) in.
Ejercicio 1.1
SECTOR MINERO
Volumen de Producción Minera por Principales Entidades Federativas y Municipios
Plomo Zacatecas Unidad de Medida: Toneladas.
FUENTE: INEGI. Estadística de la Industria Minerometalúrgica.
Ejercicio 1.2
SECTOR MINERO
Volumen de Producción Minera por Principales Entidades Federativas y Municipios
Zinc Zacatecas Unidad de Medida: Toneladas.
FUENTE: INEGI. Estadística de la Industria Minerometalúrgica.
Ejercicio 1.3
Sector Minero Volumen de Producción Minera por Principales Entidades Federativas y Municipios
Coque Coahuila de Zaragoza Unidad de Medida: Toneladas.
Fuente: INEGI. Estadística de la Industria Minerometalúrgica.
Posición.
Dividen un conjunto ordenado de datos en grupos con la misma
cantidad de individuos:
a) Cuartiles.
b) Deciles.
c) Percentiles.
Centralización.
Indican valores con los cuales, los datos, parecen agruparse:
a) Media.
b) Mediana.
Medidas c) Moda.
descriptivas
Dispersión.
Representan la mayor o menor concentración de los datos con
respecto a las medidas de centralización:
a) Varianza.
b) Desviación típica.
Forma.
Indicadores que describen el comportamiento gráfico de los datos:
a) Asimetría.
b) Apuntamiento o curtosis.
Cuartiles: son los tres valores que dividen al conjunto de datos ordenados en
cuatro partes iguales, son un caso particular de los percentiles:
- El primer cuartil Q1 es el menor valor que es mayor que una cuarta parte de
los datos.
Deciles: son los nueve valores que dividen al conjunto de datos ordenados en
diez partes iguales, son también un caso particular de los percentiles.
Este tipo de medidas nos permiten identificar y ubicar el punto (valor) alrededor
del cual se tienden ha reunir los datos (“Punto central”). Estas medidas aplicadas a
las características de las unidades de una muestra se les denomina estimadores o
estadígrafos; mientras que aplicadas a poblaciones se les denomina parámetros o
valores estadísticos de la población. Los principales promedios son la media, la
mediana y la moda.
1. Media.
Es la medida de posición central más utilizada, la más conocida y la más
sencilla de calcular, debido principalmente a que sus ecuaciones se prestan para
el manejo algebraico, lo cual la hace de gran utilidad. Su principal desventaja
radica en su sensibilidad al cambio de uno de sus valores o a los valores extremos
demasiado grandes o pequeños. La media se define como la suma de todos los
valores observados, dividido por el número total de observaciones.
Es importante resaltar que existe una gran variedad de medias como la Media
geométrica, la Media ponderada, la Media cuadrática, etc. Por el momento sólo
hacemos énfasis en la media aritmética ya que es la más utilizada, aunque se
recomienda a los lectores profundizar en estos temas.
2. Mediana.
Con esta medida podemos identificar el valor que se encuentra en el centro de
los datos, es decir, nos permite conocer el valor que se encuentra exactamente en
la mitad del conjunto de datos después que las observaciones se han ubicado en
serie ordenada. Esta medida nos indica que la mitad de los datos se encuentran
por debajo de este valor y la otra mitad por encima del mismo. Para determinar la
posición de la mediana se utiliza la fórmula
Para comprender este concepto vamos a suponer que tenemos la serie ordenada
de valores (2, 5, 8, 10 y 13), la posición de la mediana sería:
En conclusión la mediana nos indica el valor que separa los datos en dos
fracciones iguales con el cincuenta por ciento de los datos cada una. Para las
muestras que cuentan con un número impar de observaciones o datos, la mediana
dará como resultado una de las posiciones de la serie ordenada; mientras que
para las muestras con un número par de observaciones se debe promediar los
valores de las dos posiciones centrales.
3. Moda.
La medida modal nos indica el valor que más veces se repite dentro de los
datos; es decir, si tenemos la serie ordenada (2, 2, 5 y 7), el valor que más veces
se repite es el número 2 quien sería la moda de los datos. Es posible que en
algunas ocasiones se presente dos valores con la mayor frecuencia, lo cual se
denomina Bimodal o en otros casos más de dos valores, lo que se conoce como
multimodal.
Medidas de dispersión
Desviación Típica (S): La varianza viene dada por las mismas unidades que la
variable pero al cuadrado, para evitar este problema podemos usar como medida
Medida de Asimetría.
(g1 > 0): La curva es asimétricamente positiva por lo que los valores se
tienden a reunir más en la parte izquierda que en la derecha de la media.
(g1 < 0): La curva es asimétricamente negativa por lo que los valores se
tienden a reunir más en la parte derecha de la media.
Desde luego entre mayor sea el número (Positivo o Negativo), mayor será la
distancia que separa la aglomeración de los valores con respecto a la media.
Ejercicio 1.5
SECTOR MINERO
Volumen de Producción Minera por Principales Entidades Federativas y Municipios
Zinc Zacatecas Unidad de Medida: Toneladas.
Fuente: INEGI. Estadística de la Industria Minerometalúrgica.
Ejercicio 1.6
SECTOR MINERO
Volumen de Producción Minera por Principales Entidades Federativas y Municipios
Coque Coahuila de Zaragoza Unidad de Medida: Toneladas.
Fuente: INEGI. Estadística de la Industria Minerometalúrgica
Para cada uno de los ejercicios anteriores, obtener:
a) Cuartiles. e) Varianza.
b) Media. f) Desviación Típica.
c) Mediana. g) Coeficiente de asimetría.
d) Moda. h) Coeficiente de curtosis.