Você está na página 1de 7

MEDIDAS ESTADISTICA.

A hora trataremos de presentar otros métodos para estudiar o medir el comportamiento de los elementos que
constituyen una población. Si bien es cierto que los cuadros y graficas describen el fenómeno, no lo hacen en
forma satisfactoria, y por tanto hay necesidad de acudir a ciertas medidas denominadas parámetros de la
población, cuando se hacen sobre el total de ésta y estadígrafos, cuando corresponden a una parte de la población
o muestra. Los estadígrafos permiten hallar un valor numérico, el mismo que representa a la muestra.
Teniendo en cuenta la anterior la clasificación, los símbolos que se refieren a la población se representan
generalmente por letras griegas o por las letras mayúsculas de nuestro alfabeto y los que se refieren a la muestra,
por letras minúsculas.
Para el análisis de una variable o de una distribución unidimensional se consideran las siguientes clases de
medidas:
Medidas de tendencia central
Medidas de posición
Medidas de dispersión
Medidas de asimetría y apuntamiento

MEDIDAS DE TENDENCIA CENTRAL O DE POSICION

Al describir grupos de observaciones, con frecuencia es conveniente resumir la información con un solo número. Este número
que, para tal fin, suele situarse hacia el centro de la distribución de datos se denomina medida o parámetro de tendencia
central o de centralización.
Cuando se hace referencia únicamente a la posición de estos parámetros dentro de la distribución, independientemente de
que esta esté más o menos centrada, sirven como puntos de referencia para interpretar las valoraciones que se obtienen en
un conjunto de observaciones.
En resumen, el propósito de las medidas de tendencia central es:
Mostrar en qué lugar se ubica la persona promedio o típica del grupo.
Un método para comparar o interpretar cualquier puntaje en relación con el puntaje central o típico.
Un método para comparar el puntaje obtenido por una misma persona en dos diferentes ocasiones.
Sirve como un método para comparar los resultados medios obtenidos por dos o más grupos.
Entre las medidas de tendencia central tenemos:
Media aritmética o promedio, media ponderada, media geométrica, media armónica, Mediana, Moda.

Media aritmética o promedio


La media aritmética se obtiene al sumar todos los datos y dividir el resultado entre el número total de datos.

Para datos no agrupados


La media aritmética tiene la propiedad de asignar a cada elemento de la suma el mismo valor, o sea el valor promedio.
Si se conoce el valor de la media y el número n de elementos u observaciones, se puede conocer el valor de la suma total
multiplicando la media por el número de elementos. Esto es: ∑𝑛𝑗=1 𝑋𝑗 = 𝑁 ∗ 𝑋̅
∑ 𝑥𝑖 𝑓𝑖
Para datos agrupados: 𝑥̅ =
𝑁
Mediana
Es el valor que ocupa el lugar central de todos los datos cuando éstos están ordenados de menor a mayor.
1 Si la serie tiene un número impar de medidas la mediana es la puntuación central de la misma.
2 Si la serie tiene un número par de puntuaciones la mediana es la media entre las dos puntuaciones centrales.
Mediana para datos agrupados

N: es el numero de datos.
Li-1 es el límite inferior de la clase donde se encuentra la mitad de los datos.
Fi-1 es la frecuencia acumulada anterior a la clase mediana.
ai es la amplitud de la clase.
fi es la frecuencia absoluta de la clase mediana.
La moda, Mo, es el valor que tiene mayor frecuencia absoluta.
1º Todos los intervalos tienen la misma amplitud.

Li-1 es el límite inferior de la clase modal.


fi es la frecuencia absoluta de la clase modal.
fi--1 es la frecuencia absoluta inmediatamente inferior a la en clase modal.
fi-+1 es la frecuencia absoluta inmediatamente posterior a la clase modal.
ai es la amplitud de la clase.
También se utiliza otra fórmula de la moda que da un valor aproximado de ésta:

2º Los intervalos tienen amplitudes distintas.


En primer lugar tenemos que hallar las alturas.

La clase modal es la que tiene mayor altura.

La fórmula de la moda aproximada cuando existen distintas amplitudes es:

MEDIDAS DE DISPERSIÓN Y ASIMETRÍA


Se veía en el tema anterior la tendencia que tiene un conjunto de datos dado a agruparse hacia el centro, pero también se
descubrió que los datos extremos podían estar bastante alejados de esa tendencia central. Medir esa variación respecto a los
promedios es un cálculo importante en el tratamiento estadístico de datos, medidas a las que se les denomina de dispersión
o de variación.
La información que arrojan las medidas de tendencia central no siempre proporciona conclusiones contundentes frente al
conjunto de datos. Se estudiará a continuación cómo resolver este tipo de problemas y qué medidas de dispersión usar.

RANGO O RECORRIDO
Sobre esta medida ya se había trabajado en la construcción de las tablas de frecuencia agrupada. Se trata de la diferencia
entre el límite superior y el límite inferior de un conjunto de datos. Es la medida de dispersión más fácil de calcular, sólo
requiere que los datos estén ordenados. Pero es poco usada como medida de dispersión porque se deja afectar fácilmente
de los valores extremos de poca frecuencia.

Desviación media
Se define como la media aritmética de las desviaciones respecto a la media, tomadas en valor absoluto5. Es una de las
medidas más fáciles de calcular y por ello, muy usada. Ella toma todos los valores de la variable y es menos afectada que la
desviación estándar por los valores extremos. Su valor siempre será menor que la desviación estándar. Cuanto mayor sea el
valor de la desviación media, mayor será la dispersión de los datos; sin embargo este valor no proporciona una relación
matemática precisa con la posición de un dato dentro de la distribución y, puesto que se toman los valores absolutos, mide
la desviación de una observación sin determinar si está por encima o por debajo de la media aritmética.

Para datos no agrupados


Desviación media para datos agrupados
Varianza
Es una de las medidas más usadas en estadística, ella a su vez da origen a otra mucho más significativa: la
desviación típica o estándar. Se define como la media aritmética de los cuadrados de las desviaciones respecto a
la media aritmética de una distribución estadística. Se simboliza S2 para la varianza muestral y σ2 para la
varianza poblacional.
La varianza indica la desviación de los datos respecto a la media. Para comparar dos distribuciones, en cuanto a
su variabilidad absoluta, se pueden utilizar sus varianzas de manera que el resultado indique cuál de ellas es
más homogénea o cuál es más heterogénea.
Para datos no agrupados:

Para datos agrupados

Para simplificar el cálculo de la varianza vamos o utilizar las siguientes expresiones que son equivalentes a las
anteriores.
Para datos no agrupados:

Para datos agrupados

Las unidades de la varianza son los cuadrados de las unidades de los datos: pesos cuadrados, alumnos
cuadrados, etc., medidas difíciles de interpretar. De allí que la varianza de origen a la desviación típica o
estándar.

Desviación típica
La desviación típica es la raíz cuadrada de la varianza, tomando siempre el valor positivo. Se simboliza por s en la
muestra y σ en la población. Esta es la medida de dispersión más conocida y más utilizada en el análisis de
datos estadísticos.

Para datos agrupados

Para simplificar el cálculo vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.

Para datos agrupados

Es importante tener en cuenta las siguientes propiedades de la desviación estándar:


La desviación estándar es una medida de variación de todos los valores con respecto a la media.
El valor de la desviación estándar siempre es positivo y sólo es igual a cero cuando los valores de los
datos son iguales.
Si el valor de la desviación estándar es muy grande, este indica mayor variación en el grupo de datos.
El valor de la desviación estándar puede incrementarse drásticamente cuando se incluye uno o más datos
distantes.
Las unidades de la desviación estándar son las mismas de los datos originales (pulgadas, centímetros,
etc.)

COEFICIENTE DE VARIACIÓN Y DESVIACIÓN MEDIA


Las medidas de dispersión que se han estudiado son medidas absolutas y se expresan en las mismas unidades
con las que se mide la variable. Cuando se comparan dos o más conjuntos de datos con unidades de medida de
observación diferentes, no es posible compararlas con estas medidas absolutas, o cuando las unidades de
observación de los conjuntos de datos son iguales pero la media aritmética sea diferente, no aportarán una
buena conclusión sobre las series que se comparan.
Para efectuar comparaciones entre series de observaciones distintas, en estadística se usa medidas de variabilidad
relativa y así se puede determinar cuál serie tiene mayor o menor homogeneidad.

Coeficiente de variación
El coeficiente de variación indica la desviación relativa de los datos respecto a la media. Para comparar dos
distribuciones, en cuanto a su variabilidad relativa, se pueden utilizar de manera que el resultado indique cuál de
ellas es más homogénea o cuál es más heterogénea.
Es la relación entre la desviación típica de una muestra o población y su media.

Coeficiente de variación en tanto porcentaje Coeficiente de variación en tanto porcentaje ciento


Cuando el coeficiente de variación es muy alto. Mayor del 30%se dice que la media aritmética no es lo
suficientemente representativa en la distribución o que los datos son heterogéneos, de lo contrario se toma como
un buen estimador por la homogeneidad de los datos.

Puntuaciones diferenciales o desviaciones.


Las puntuaciones diferenciales resultan de restarles a las puntuaciones directas la media aritmética.
Xi = Xi − 𝑋̅

PUNTAJE TÍPICO O ESTANDARIZADO


Cuando se tiene una distribución simétrica, su polígono de frecuencias revelará una forma de campana muy
común en estadística. Esta curva es llamada curva normal, de error, de probabilidad o campana de Gauss.
En ella la media aritmética se localiza en la mitad de la distribución. En el eje horizontal se ubican los valores que
toma la variable y en el vertical la frecuencia absoluta o relativa. El área bajo la curva tendrá un valor del 100%
El puntaje típico o estandarizado o variable normalizada, es una medida de dispersión muy utilizada como
variable estadística en este tipo de distribución, denominada distribución normal. El puntaje estandarizado mide
la desviación de una observación con respecto a la media aritmética, en unidades de desviación estándar,
determinándose así la posición relativa de una observación dentro del conjunto de datos. Por lo general se
simboliza por Z.
Por ser adimensional, el puntaje Z es útil para comparar datos individuales de distribuciones que tienen distintas
unidades de medida, así como diferentes medias y desviaciones estándar. Dentro de sus propiedades, las más
importantes son que su media es cero y su desviación estándar y varianza es uno.
Las puntuaciones típicas son el resultado de dividir las puntuaciones diferenciales entre la desviación típica. Este
proceso se llama tipificación.

MEDIDAS DE FORMA
Comparan la forma que tiene la representación gráfica, bien sea el histograma o el diagrama de barras de la
distribución, con la distribución normal.
1) ASIMETRÍA
Es una medida de forma de una distribución que permite identificar y describir la manera como los datos tiende a
reunirse de acuerdo con la frecuencia con que se hallen dentro de la distribución. Permite identificar las
características de la distribución de datos sin necesidad de generar el gráfico.
1.1) TIPOS DE ASIMETRÍA
La asimetría presenta las siguientes formas:
Asimetría Negativa o a la Izquierda.- Se da cuando en una distribución la minoría de los datos está en la parte
izquierda de la media. Este tipo de distribución presenta un alargamiento o sesgo hacia la izquierda, es decir, la
distribución de los datos tiene a la izquierda una cola más larga que a la derecha. También se dice que una
distribución es simétrica a la izquierda o tiene sesgo negativo cuando el valor de la media aritmética es menor
que la mediana y éste valor de la mediana a su vez es menor que la moda, en símbolos
Nota: Sesgo es el grado de asimetría de una distribución, es decir, cuánto se aparta de la simetría.
Simétrica.- Se da cuando en una distribución se distribuyen aproximadamente la misma cantidad de los datos a
ambos lados de la media aritmética. No tiene alargamiento o sesgo. Se representa por una curva normal en
forma de campana llamada campana de Gauss (matemático Alemán 1777-1855) o también conocida como
de Laplace (1749-1827).También se dice que una distribución es simétrica cuando su media aritmética, su
mediana y su moda son iguales, en símbolos = Md=Mo
Asimetría Positiva o a la Derecha.- Se da cuando en una distribución la minoría de los datos está en la parte
derecha de la media aritmética. Este tipo de distribución presenta un alargamiento o sesgo hacia la derecha, es
decir, la distribución de los datos tiene a la derecha una cola más larga que a la izquierda.
También se dice que una distribución es simétrica a la derecha o tiene sesgo positivo cuando el valor de la media
aritmética es mayor que la mediana y éste a valor de la mediana a su vez es mayor que la moda, en
símbolos

1.2) MEDIDAS DE ASIMETRÍA

Existen varias medidas de la asimetría de una distribución de frecuencias. Una de ellas es el Coeficiente de
Asimetría de Pearson:

Coeficiente de Karl Pearson

= media aritmética.
Md = Mediana.
MO = moda
S = desviación típica o estándar.
El Coeficiente de Pearson varía entre -3 y 3
Si As < 0 ? la distribución será asimétrica negativa.
Si As = 0 ? la distribución será simétrica.
Si As > 0 ? la distribución será asimétrica positiva.
Medida de Fisher
Para datos sin agrupar se emplea la siguiente fórmula:

Para datos agrupados en tablas de frecuencias se emplea la siguiente fórmula:

Dónde:
= cada uno de los valores; n = número de datos; = media aritmética; f = frecuencia absoluta
= cubo de la desviación estándar poblacional; xm = marca de clase
Si As < 0 ?Indica que existe presencia de la minoría de datos en la parte izquierda de la media, aunque en
algunos casos no necesariamente indicará que la distribución sea asimétrica negativa
Si As = 0 ? la distribución será simétrica
Si As > 0 ? Indica que existe presencia de la minoría de datos en la parte derecha de la media, aunque en
algunos casos no necesariamente indicará que la distribución sea asimétrica positiva

2. MEDIDA DE APUNTAMIENTO O CURTOSIS.


Miden la mayor o menor cantidad de datos que se agrupan en torno a la moda. Es decir, el grado de agudeza o
achatamiento de una distribución con relación a la distribución normal.
2.1) TIPOS DE CURTOSIS Se definen 3 tipos de distribuciones según su grado de curtosis:
mesocúrtica: presenta un grado de concentración medio alrededor de los valores centrales de la variable (el
mismo que presenta una distribución normal). leptocúrtica: presenta un elevado grado de concentración
alrededor de los valores centrales de la variable. platicúrtica: presenta un reducido grado de concentración
alrededor de los valores centrales de la variable.

2.2) MEDIDAS DE CURTOSIS


Medida de Fisher
Para datos sin agrupar se emplea la siguiente fórmula:

Para datos agrupados en tablas de frecuencias se emplea la siguiente fórmula:

Para datos agrupados en intervalos se emplea la siguiente fórmula:

Xi = cada uno de los valores; n= número de datos; 𝑋̅= media aritmética; 𝜎 4 = Cuádruplo de la desviación
estándar poblacional; f = frecuencia absoluta; Xi = marca de clase
Nota:
Si a < 3 ? la distribución es platicútica
Si a = 3 ? la distribución es normal o mesocúrtica
Si a > 3 ? la distribución es leptocúrtica
UNIVERSIDAD POPULAR DEL CESAR SECCIONAL AGUACHICA
TALLER DE ESTADISTICA DESCRIPTIVA
PROFESOR HERMES ENRIQUE MEJIA ACONCHA

ALUMNO_______________________________FECHA __________NOTA ___

1. en la tabla que sigue se da la distribución de frecuencia de los pesos en kilogramos de los empleados de una
fábrica. Con lo cual se pide: el número de empleados con un peso que no excedan a 109,5Kg, establecer el tipo
de simetría de la distribución y la calase de curva de acuerdo con el apuntamiento. A demás establecer
comparaciones entre la media mediana y moda.

Clases alumnos
49,5 – 59,5 8
59,5 – 69,5 10
69,5 – 79,5 16
79,5 – 89,5 14
89,5 – 99,5 10
99,5 – 109,5 5
109,5 – 119,5 2

2 X f Los datos corresponden los puntajes obtenidos por un


34 3 grupo de estudiantes.
56 7 Calcule:
76 15 Media, mediana, moda, y diga qué tipo de distribución
87 25 tiene los datos
94 8 Coeficiente de variabilidad, y diga el tipo de relación
98 3 que tienen los datos.
El porcentaje de estudiantes con no más de 76 puntos

3. Los jornales por horas de los operarios de una industria (redondeados a la unidad) son:
62 44 42 39 37 32 30 47 58 40 58 50 43 30 41 52 37 43 46 44 57 49 41 43 42 36
52 49 64 45 46 43 37 38 54 46 36 45 47 54 49 51 40 52 38 42 40 50 46 57 46 47
54 55 53 52 42 43 50 51 56 60 43 38 42 55 45 56 59 49 52 47 65 59 56 58
Organice los datos en una distribución de continua de frecuencias, realice: un polígono de frecuencias y
determine el tipo de distribución de los datos

4. Un fabricante registró el número de artículos producidos diariamente, durante 10 días, por un grupo de 15
obreros, que operaban con base a un plan de salarios fijos. El fabricante introdujo un plan de incentivos
salariares para otros 15 obreros y registro la producción durante 10 días.
Primer grupo: 75 76 74 80 72 78 76 73 72 77
Segundo grupo: 86 78 86 84 81 79 78 84 88 80
Determine la dispersión absoluta y la dispersión relativa, y que grupo de empleados estuvo relativamente
mejor posicionado: el primero con 70 artículos o del segundo con 77 artículos

EXITOS HEMA

Você também pode gostar