Escolar Documentos
Profissional Documentos
Cultura Documentos
Estadı́stica Descriptiva
Estadı́stica
Área de Estadı́stica
Caracterı́sticas
Ejemplo
x: dinero semanal invertido en fotocopias por estudiantes de
ciencias
n = 14 estudiantes
x = 3000, 3200, 3900, 3300, 4500, 3500, 3200, 5800, 1800, 7600,
4100, 3000, 9600, 3200
n
P
xi
i=1 3000 + 3200 + 3900 + 3300 + 4500 + 3500 + 3200 + 5800 + 1800 + 7600 + 4100 + 3000 + 9600 + 3200
x = =
n 14
n
P
xi
59700 i=1
x== 4264.286 =
n 14
Los estudiantes de ciencias invierten en promedio $4264.286
por semana en fotocopias
Estadı́stica Descriptiva
Medidas de tendencia central
Promedio (Media) aritmético
Ejemplo - R
x: dinero semanal invertido en fotocopias por estudiantes de
ciencias
n = 14 estudiantes
x = 3000, 3200, 3900, 3300, 4500, 3500, 3200, 5800, 1800, 7600,
4100, 3000, 9600, 3200
copias <- c(3000, 3200, 3900, 3300, 4500, 3500, 3200, 5800, 1800, 7600,
4100, 3000, 9600, 3200)
sum(copias)
## [1] 59700
mean(copias)
## [1] 4264.286
Estadı́stica Descriptiva
Medidas de tendencia central
Mediana
Mediana (m)
Caracterı́sticas
· Fácil cálculo
· La interpretación no es inmediata
Cálculo
Cuando n es impar: m = X n + 1 !
2
X n + X n
+1
Cuando n es par: m = 2 2
2
Estadı́stica Descriptiva
Medidas de tendencia central
Mediana
Ejemplo
x: dinero semanal invertido en fotocopias por estudiantes de ciencias
n = 14 estudiantes
x = 3000, 3200, 3900, 3300, 4500, 3500, 3200, 5800, 1800, 7600, 4100,
3000, 9600, 3200
Datos ordenados
x = 1800, 3000, 3000, 3200, 3200, 3200, 3300, 3500, 3900, 4100, 4500,
5800, 7600, 9600
Como n = 14 es par entonces n ÷ 2 = 14 ÷ 2 = 7 y
n ÷ 2 + 1 = (14 ÷ 2) + 1 = 8
La mediana es el promedio de los datos en las posiciones 7 y 8, es decir:
x(7) + x(8) 3300 + 3500
= = 3400
2 2
Los mitad de los estudiantes de ciencias invierten máximo $3400
por semana en fotocopias
Estadı́stica Descriptiva
Medidas de tendencia central
Mediana
Ejemplo - R
## [1] 1800 3000 3000 3200 3200 3200 3300 3500 3900 4100 4500 5800 7600 9600
median(copias) # mediana
## [1] 3400
Estadı́stica Descriptiva
Medidas de tendencia central
Moda
Moda
· Fácil cálculo
· Puede no existir
Ejemplo
Ejemplo - R
## copias
## 1800 3000 3200 3300 3500 3900 4100 4500 5800 7600 9600
## 1 2 3 1 1 1 1 1 1 1 1
Estadı́stica Descriptiva
Medidas de dispersión
· Rango
· Varianza
· Desviación Estándar
· Coeficiente de Variación
· Teorema de Chebyshev
Estadı́stica Descriptiva
Medidas de dispersión
Rango
Rango
Ejemplo
Ejemplo - R
Varianza poblacional
N
(xi − µ)2
P
i=1
σ2 =
N
Estadı́stica Descriptiva
Medidas de dispersión
Varianza
Varianza muestral
n
(xi − x)2
P
2 i=1
s =
n−1
Caracterı́sticas
· Desconocida · Conocida
· Positiva o cero · Positiva o cero
· Unidades al cuadrado · Unidades al cuadrado
El cálculo de varianza ocasiona que las unidades de los datos
originales se alteren y pierdan sentido por estar elevadas al
cuadrado, por lo cual su interpretación no es intuitiva
Estadı́stica Descriptiva
Medidas de dispersión
Desviación estándar
Desviación estándar
Caracterı́sticas
Ejemplo - R
## [1] 10
sd(accidentes)
## [1] 3.162278
Estadı́stica Descriptiva
Medidas de dispersión
Coeficiente de variación (CV)
Ejemplo - R
## [1] 52.70463
Estadı́stica Descriptiva
Medidas de dispersión
Regla empı́rica
Definición de Intervalo
1.2 1.4 1.6 1.8 2.0 2.2 2.4 2.6 2.8 3.0 3.2 3.4 3.6 3.8 4.0 4.2 4.4 4.6 4.8
Tiempo (horas)
Los lı́mites del intervalo son 1.2 (inferior) y 4.8 (superior) horas
Estadı́stica Descriptiva
Medidas de dispersión
Regla empı́rica
Regla empı́rica
Regla empı́rica
Si las observaciones siguen una distribución en forma de campana,
entonces aproximadamente el 68%, 95% y 99% de los datos se
encuentran a 1, 2 y 3 desviaciones estándar, respectivamente.
0 1 2 3 4
*
5 6 7 8 9 10
Estadı́stica Descriptiva
Medidas de dispersión
Regla empı́rica
Ejemplo - R
En Bogotá, los predios residenciales pagan por concepto de impuesto
predial un promedio $343000 con una desviación estándar de $95000.
Esta variable tiene una distribución en forma de campana. Construya e
interprete un intervalo que abarque tres desviaciones estándar en torno a
la media e interprételo
m <- 343000 # promedio
s <- 95000 # desviación estándar
k <- 3 # valor de k
m - k * s # lı́mite inferior
## [1] 58000
m + k * s # lı́mite superior
## [1] 628000
Ejemplo 3
Estadı́stica Descriptiva
Medidas de dispersión
Teorema de Chebyshev
Teorema de Chebyshev
Teorema de Chebyshev
Teorema de Chebyshev
Estadı́stica Descriptiva
Medidas de dispersión
Teorema de Chebyshev
Ejemplo
Ejemplo
Ejemplo
1 1 1
1− 2
= 1 − 2 = 1 − = 1 − 0.25 = 0.75 × 100 = 75%
k 2 4
Como la muestra está constituida por 50 observaciones entonces:
Al menos 50 × 0.75 = 37.5 ≈ 38 observaciones se encuentran
dentro de los lı́mites 28 y 34
Estadı́stica Descriptiva
Medidas de dispersión
Teorema de Chebyshev
Ejemplo
Estadı́stica Descriptiva
Medidas de dispersión
Teorema de Chebyshev
Ejemplo - R
x: número de accidentes en un cruce por mes
x = 6, 2, 10, 4, 8
## [1] 1.256584
m + k * s # lı́mite superior
## [1] 10.74342