Você está na página 1de 33

Medidas Estadísticas

Maestría en Ingeniería Industrial


Mención Gerencia de Operaciones
Características
de los Datos
Tendencia Central
(Posición)

Dispersión
(Variación)

Sesgo
Gráfica de Datos
Histograma
Es una gráfica en la que las clases se marcan en el eje
horizontal y las frecuencias en el eje vertical. Las
frecuencias de clase están representadas por las
alturas de las barras y estas se colocan adyacentes
una a otra.
Las ojivas o polígono de frecuencias es similar pero
en lugar de barras está formado por segmentos que
unen los puntos medios de clase y las frecuencias de
clase.
Tendencia
Central

Media Media Media Mediana Moda


Aritmética Pesada Geométrica
Media de la Población
• Para datos no agrupados, la media
aritmética de la población es la suma de
todos los valores en ella dividida entre el
total de valores en la población:
  x / N
– donde µ representa la media de la población.
– N es el número total de elementos en la
población.
– x representa cualquier valor en particular.
– Σ indica la operación de sumar.
Distribución de frecuencias
• Agrupamiento de datos en categorías
mutuamente excluyentes, que indican el
número de observaciones en cada
categoría.
1.Determinar el número de clases k≥
ln(número de datos)/ln(2).
2.Determinar amplitud i≥(mayor-menor)/k
3.Establecer limites en cada clase
4.Contabilizar elementos en cada clase
Media de una Muestra
• Para datos no agrupados, la media de
una muestra es la suma de todos los
valores divididos entre el número total
de los mismos:
x  x / n
x
–donde denota la media muestral
– n es el número total de valores en la
muestra.
Propiedades de la
Media Aritmética
• Todo conjunto de datos tiene un valor medio.
• Al evaluar la media se incluyen todos los
valores.
• Un conjunto de valores sólo tiene una media.

• Desventaja
– Es afectada por los valores extremos.
Media Aritmética
• Es la medida más común de tendencia
central.
• Es afectada por valores extremos.

0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14

Media = 5 Media = 6
Media pesada
• La media pesada de un conjunto de números
x1, x2, ..., xn, con las ponderaciones
correspondientes w1, w2, ...,wn, se calcula con
la fórmula:
xw  (w1 x1  w2 x2  ...  wn xn ) /(w1  w2  ...wn )
xw  (w * x) / w
Media Geométrica
• La media geométrica (MG) de un
conjunto de n números positivos se
define como la raíz n-ésima del
producto de los n valores. Su fórmula
es:
MG  n (x1)(x 2)(x3)...(xn)
– La media geométrica se usa para encontrar
el promedio de porcentajes, razones,
índices o tasas de crecimiento.
Mediana
• Mediana: es el punto medio de los
valores después de ordenarlos de
menor a mayor, o de mayor a menor.
La misma cantidad de valores se
encuentra por arriba de la mediana que
por debajo de ella.
• Nota: para un conjunto con un número
par de números, la mediana será el
promedio aritmético de los dos
números medios.
Mediana
• No es afectada por los valores extremos.

0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14

Mediana = 5 Mediana = 5

n 1
Mediana 
2
Propiedades de la mediana
• La mediana es única para cada conjunto
de datos.
• No se ve afectada por valores muy
grandes o muy pequeños.
• Puede calcularse para una distribución de
frecuencias con una clase de extremo
abierto, si la mediana no se encuentra en
una de estas clases.
Moda
• Valor que ocurre más a menudo.
• No es afectada por valores extremos.
• Puede no existir una moda.
• Pueden haber varias modas.
• Usada para datos numéricos o
categorías.

0 1 2 3 4 5 6
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14

Sin Moda
Moda = 9
Media de Datos Agrupados
• La media de una muestra de datos
agrupados se puede “estimar” con la
formula:
( f * x) ( f * x)
x 
f n

– f = frecuencia de cada clase


– x = punto medio o marca de la clase
– n = número de observaciones
Mediana de datos
agrupados
• La mediana de una muestra de datos agrupados se
calcula mediante la siguiente fórmula:

 n / 2FA 
m   Lm
 fm 
– n= número de elementos de la distribución
– FA= suma de todas las frecuencias de clase que preceden a
la clase mediana que contiene la mediana.
– fm= Frecuencia de la clase mediana
– Lm= Límite inferior del intervalo de clase mediano
MEDIANA DE DATOS AGRUPADOS
Dispersión

Varianza Desviación Estándar Coeficiente de


Variación
Alcance Varianza de Desviación
la Población Estándar de
la Población
Varianza de la
Muestra Desviación
Estándar de
Alcance Intercuartil la Muestra
Alcance o Rango
• Diferencia entre la mayor y la menor de
las observaciones
– Alcance = xmayor – xmenor

• No toma en cuenta la forma en que están


distribuidos los datos.
Alcance: 12 - 7 = 5 Alcance: 12 - 7 = 5

7 8 9 10 11 12 7 8 9 10 11 12
Cuartiles
• Los datos se ordenan de menor a mayor.
25% 25% 25% 25%

 Q1  Q2   Q3
Observación
Menor
 Observación
Mayor

• El alcance intercuartil es la distancia entre el tercer


cuartil Q3 y el primer cuartil Q1.
Promedio de
desviación de cada dato

-2
1
-1

0 1 2 3 4 5

( x   )  0
Varianza de la Población
• Desviación cuadrática promedio con
relación a la media de la Población
Desviación Estándar
de la Población
• Raíz Cuadrada de la Varianza de la
Población

( x ) 2
   2

N
x 2
   2
  2

N
Varianza de la Muestra
• Desviación cuadrática promedio (n-1) con
relación a la media de la Muestra
Desviación Estándar
de la Muestra
• Raíz Cuadrada de la Varianza de la
Muestra

(x  x) 2
s s 2

n 1

x2 2
nx
s s 2
 
n 1 n 1
Varianza de la Población
Datos Agrupados

f (x   ) 2
 2

N
fx 2
 2
   2

x  marca de clase
Desviación Estándar
de la Población
Datos Agrupados

f (x   ) 2
   2

N
fx 2
   2
   2

N
x  marca de clase
Varianza de la Muestra
Datos agrupados

f (x  x) 2
s2 
n 1
fx 2 2
nx
s 2
 
n 1 n 1
x  marca de clase
Desviación Estándar
de la Muestra
Datos Agrupados

f (x  x) 2
s s2 
n 1

fx 2 2
nx
s s 2
 
n 1 n 1
x  marca de clase
Comparación de
Desviaciones Estándar
Datos A Media = 15.5
s = 3.338
11 12 13 14 15 16 17 18 19 20 21

Datos B
Media = 15.5
11 12 13 14 15 16 17 18 19 20 21 s = .9258
Datos C
Media = 15.5
11 12 13 14 15 16 17 18 19 20 21 s = 4.57
Dispersión relativa
• El coeficiente de variación es la razón de
la desviación estándar a la media
aritmética, expresada como porcentaje:

s
CV  (100%)
x
Sesgo de una distribución

Negativamente Positivamente
Simétrica Sesgada
Sesgada

Media < Mediana < Moda Media = Mediana = Moda Moda < Mediana < Media

Você também pode gostar