Escolar Documentos
Profissional Documentos
Cultura Documentos
Análisis Estadístico
incluye un conjunto de
métodos y técnicas
univariantes y
multivariantes que permiten
estudiar y tratar en bloque una
o varias variables medidas u
observadas en una colección de
individuos
Población y Muestra
POBLACIÓN
Conjunto de elementos
cuyas propiedades se
desea analizar
MUESTRA
Es un subconjunto de una población
MUESTRA REPRESENTATIVA
… cuando posee las mismas características de la
población de la cual ha sido seleccionada
Variable y Dato
VARIABLE
Característica de interés acerca de
cada elemento de una población o
muestra DATO (Observación, medición,
valor, etc.)
Valor de una variable asociado a un
elemento de una población o una
muestra
Contenedor Contenido
VARIABLE DATO
Variable
Paramétrica – No Paramétrica
Univariante - Multivariante
Estadística
Descriptiva
Gráficos Descriptivos
Gráfico de Sectores
Diagrama de Caja y Bigotes
Gráfico de Caja y Bigotes
83 86 89 92 95 98 101
Datos
Estadística
Descriptiva
Para Datos No Agrupados
Medidas de Tendencia Central
Media:
σ𝑛𝑖=1 𝑋𝑖
𝑋ത =
𝑛
Mediana:
𝑀𝑒 = 𝑋𝑛ൗ
2
Moda:
𝑀𝑜 = 𝑉𝑎𝑙𝑜𝑟 𝑚á𝑠 𝑝𝑟𝑜𝑏𝑎𝑏𝑙𝑒
Medidas de Dispersión
Rango:
𝑅 = 𝑋𝑚𝑎𝑥 − 𝑋𝑚𝑖𝑛
Varianza:
σ 𝑛 ത 2
𝑋
𝑖=1 𝑖 − 𝑋
𝑆2 =
𝑛−1
Desviación Estándar:
𝑆 = 𝑆2
Coeficiente de Variación
𝑆
𝐶𝑉 =
𝑋ത
Medidas de Forma
Momento:
σ𝑛𝑖=1 𝑋𝑖 − 𝑋ത 𝑘
𝑚𝑘 =
𝑛−1
Asimetría o Sesgo:
𝑚3
𝑎3 = 3
ൗ2
𝑚2
Apuntamiento o Curtosis:
𝑚4
𝑎4 = 4 − 3
ൗ2
𝑚2
Estadística
Descriptiva
Para Datos Agrupados
Tabla de Distribución de Frecuencias
Clase Li Ls Xm f F p P
1
2
…
m
Tabla de Distribución de Frecuencias
𝑚 = 1 + 3,3 ∗ 𝑙𝑜𝑔𝑁
𝑅
𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒 = (𝑅𝑒𝑑𝑜𝑛𝑑𝑒𝑎𝑟 𝑎 𝑢𝑛 𝑑𝑒𝑐𝑖𝑚𝑎𝑙 𝑚á𝑠 𝑞𝑢𝑒 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠)
𝑁
𝐻𝑜𝑙𝑔𝑢𝑟𝑎 = 𝐴 ∗ 𝑁 − 𝑅
𝐻
𝐿𝑖1 = 𝑋𝑚𝑖𝑛 −
2
𝐿𝑠𝑖 = 𝐿𝑖𝑖 + 𝐴
𝐿𝑖𝑖 = 𝐿𝑠𝑖−1 ∀ 𝑖 ≠ 1
𝐿𝑠 + 𝐿𝑖
𝑋𝑚 =
2
Histograma de Frecuencias
Medidas de Tendencia Central
Media:
σ𝑛𝑖=1 𝑋𝑖 ∗ 𝑓𝑖
𝑋ത =
𝑛
Mediana:
𝑁
− 𝐹𝑖−1
𝑀𝑒 = 𝐿𝑖 + 2 ∗𝐴
𝑛𝑖
Moda:
𝑓𝑖 − 𝑓𝑖−1
𝑀𝑜 = 𝐿𝑖 + ∗𝐴
𝑓𝑖 − 𝑓𝑖−1 + 𝑓𝑖 − 𝑓𝑖+1
Medidas de Dispersión
Rango:
𝑅 = 𝑋𝑚𝑎𝑥 − 𝑋𝑚𝑖𝑛
Varianza:
σ 𝑛 ത 2∗𝑓
𝑖=1 𝑖𝑋 − 𝑋 𝑖
𝑆2 =
𝑁−1
Desviación Estándar:
𝑆 = 𝑆2
Coeficiente de Variación
𝑆
𝐶𝑉 =
𝑋ത
Medidas de Forma
Momento:
σ𝑛𝑖=1 𝑋𝑖 − 𝑋ത 𝑘 ∗ 𝑓𝑖
𝑚𝑘 =
𝑁−1
Asimetría o Sesgo:
𝑚3
𝑎3 = 3
ൗ2
𝑚2
Apuntamiento o Curtosis:
𝑚4
𝑎4 = 4 − 3
ൗ2
𝑚2
Distribuciones
Estadísticas
Distribuciones Discretas
Binomial
X: Cantidad de éxitos en “n” ensayos de Bernoulli
𝑋 → 𝐵(𝑝; 𝑛)
𝑓 𝑥 = 𝑃 𝑋 = 𝑥 = 𝐶𝑥𝑛 ∗ 𝑝 𝑥 ∗ 1 − 𝑝 𝑛−𝑥
𝜇 =𝐸 𝑋 =𝑛∗𝑝
𝜎 2 = 𝑉 𝑋 = 𝑛 ∗ 𝑝 ∗ (1 − 𝑝)
Pascal (Binomial Negativa)
X: Cantidad ensayos de Bernoulli hasta completar k éxitos
𝑋 → 𝑃𝑎(𝑝; 𝑘)
𝑥−1
𝑓 𝑥 = 𝑃 𝑋 = 𝑥 = 𝐶𝑘−1 ∗ 𝑝𝑘 ∗ 1 − 𝑝 𝑥−𝑘
𝑘
𝜇=𝐸 𝑋 =
𝑝
𝑘 ∗ (1 − 𝑝)
𝜎2 = 𝑉 𝑋 =
𝑝2
Poisson
X: Cantidad ocurrencias en una muestra determinada
𝑋 → 𝑃𝑜𝑖𝑠(𝜆)
𝑒 −𝜆 ∗ 𝜆𝑥
𝑓 𝑥 =𝑃 𝑋=𝑥 =
𝑥!
𝜇=𝐸 𝑋 =𝜆
𝜎2 = 𝑉 𝑋 = 𝜆
Distribuciones
Estadísticas
Distribuciones Continuas
Uniforme
𝑋 → 𝑈(𝑎; 𝑏)
𝑎+𝑏
𝜇=𝐸 𝑋 =
2
𝑎+𝑏 2
𝜎2 =𝑉 𝑋 =
12
Exponencial
𝑋 → 𝐸𝑥𝑝(𝜆)
1
𝜇=𝐸 𝑋 =
𝜆
1
𝜎2 =𝑉 𝑋 = 2
𝜆
Normal
𝑋 → 𝑁(𝜇; 𝜎)
𝜇=𝐸 𝑋 =𝜇
𝜎2 = 𝑉 𝑋 = 𝜎2
𝑋ത − 𝜇
𝑧=𝜎
ൗ 𝑛
t-Student
𝑋 → 𝑡(𝑣)
𝜇=𝐸 𝑋 =0
𝑣
𝜎2 = 𝑉 𝑋 =
𝑣−2
𝑋ത − 𝜇
𝑡=𝜎
ൗ 𝑛
2
𝜒
𝑋 → 𝜒 2 (𝑣)
𝜇=𝐸 𝑋 =𝑣
𝜎 2 = 𝑉 𝑋 = 2𝑣
2
𝑛 − 1 ∗ 𝑆2
𝜒 =
𝜎2
F-Fisher
𝑋 → 𝐹 (𝑑1 ; 𝑑2 )
𝑑2
𝜇=𝐸 𝑋 =
𝑑2 − 2
2𝑑2 𝑑1 + 𝑑2 − 2
𝜎2 = 𝑉 𝑋 =
𝑑1 𝑑2 − 2 2 𝑑2 − 4
𝑆12
𝐹= 2
𝑆2
Inferencia Estadística
Para poblaciones Normales
(Estadística Paramétrica)
Inferencia Estadística
Para una Muestra
Inferencia para la Media con
Varianza Conocida
𝜇 = 𝑋ത ± 𝑍1−𝛼ൗ ∗ 𝜎ൗ
2 𝑛
Inferencia para la Media con
Varianza Conocida
Prueba de Hipótesis de la media para varianza conocida
𝐻0 : 𝜇 = 𝜇0
Estadístico:
𝑋ത − 𝜇0
𝑍0 = 𝜎
ൗ 𝑛
𝐻1 : 𝜇 < 𝜇0 ; 𝑍0 < 𝑍𝛼
𝑃 − 𝑣𝑎𝑙𝑜𝑟 < 𝛼
Inferencia para la Media con
Varianza Desconocida
𝜇 = 𝑋ത ± 𝑡𝑛−1;1−𝛼ൗ ∗ 𝑆ൗ
2 𝑛
Inferencia para la Media con
Varianza Desconocida
Prueba de Hipótesis para la media para varianza desconocida
𝐻0 : 𝜇 = 𝜇0
Estadístico:
𝑋ത − 𝜇0
𝑡0 =
𝑆ൗ
𝑛
𝑃 − 𝑣𝑎𝑙𝑜𝑟 < 𝛼
Inferencia para la Varianza
𝑛 − 1 ∗ 𝑆2 2
𝑛 − 1 ∗ 𝑆 2
2 ≤ 𝜎 ≤ 2
𝜒𝑛−1;1−𝛼ൗ 𝜒𝑛−1; 𝛼ൗ
2 2
Inferencia para la Varianza
Prueba de Hipótesis para la varianza
𝐻0 : 𝜎 2 = 𝜎02
Estadístico:
𝑛 − 1 ∗ 𝑆 2
𝜒02 =
𝜎02
𝑃 − 𝑣𝑎𝑙𝑜𝑟 < 𝛼
Inferencia para una Proporción
𝑝Ƹ ∗ 1 − 𝑝Ƹ
𝑝 = 𝑝Ƹ ± 𝑍1−𝛼ൗ ∗
2 𝑛
Inferencia para una Proporción
Prueba de Hipótesis para una proporción
𝐻0 : 𝑝 = 𝑝0
Estadístico:
𝑝Ƹ − 𝑝0
𝑍0 =
𝑝Ƹ ∗ 1 − 𝑝Ƹ
𝑛
𝐻1 : 𝑝 < 𝑝0 ; 𝑍0 < 𝑍𝛼
𝑃 − 𝑣𝑎𝑙𝑜𝑟 < 𝛼
Inferencia para una Tasa
𝑢ො
𝑢 = 𝑢ො ± 𝑍1−𝛼ൗ ∗
2 𝑛
Inferencia para una Tasa
Prueba de Hipótesis para una tasa
𝐻0 : 𝑢 = 𝑢0
Estadístico:
𝑢ො − 𝑢0
𝑍0 =
𝑢ො
𝑛
𝐻1 : 𝑢 < 𝑢0 ; 𝑍0 < 𝑍𝛼
𝑃 − 𝑣𝑎𝑙𝑜𝑟 < 𝛼
Inferencia Estadística
Para dos Muestras
Inferencia para la Diferencia de Dos
Medias con Varianza Conocida
𝜎12 𝜎22
𝜇1 − 𝜇2 = 𝑋ത1 − 𝑋ത2 ± 𝑍1−𝛼ൗ ∗ +
2 𝑛1 𝑛2
Inferencia para la Diferencia de Dos
Medias con Varianza Conocida
Prueba de Hipótesis para la diferencia de dos medias
𝐻0 : 𝜇1 − 𝜇2 = 𝑑0
Estadístico:
𝑋ത1 − 𝑋ത2 − 𝑑0
𝑍0 =
𝜎12 𝜎22
+
𝑛1 𝑛2
𝑃 − 𝑣𝑎𝑙𝑜𝑟. 2𝑐𝑜𝑙𝑎𝑠 = 2 ∗ (1 − 𝑃 𝑧 < 𝑍0 )
𝐻1 : 𝜇1 − 𝜇2 < 𝑑0 ; 𝑍0 < 𝑍𝛼
𝑃 − 𝑣𝑎𝑙𝑜𝑟 < 𝛼
Inferencia para la Diferencia de
Medias con Varianza Desconocida e
Iguales
1 1
𝜇1 − 𝜇2 = 𝑋ത1 − 𝑋ത2 ± 𝑡𝑛1 +𝑛2 −2;1−𝛼ൗ ∗ 𝑆𝑝 ∗ +
2 𝑛1 𝑛2
𝑛1 − 1 ∗ 𝑆1 + 𝑛2 − 1 ∗ 𝑆2
𝑆𝑝 =
𝑛1 + 𝑛2 − 2
Inferencia para la Diferencia de
Medias con Varianza Desconocida e
Iguales
Prueba de Hipótesis para la diferencia de medias
𝐻0 : 𝜇1 − 𝜇2 = 𝑑0
Estadístico:
𝑋ത1 − 𝑋ത2 − 𝑑0
𝑡0 =
1 1
𝑆𝑝 ∗ +
𝑛1 𝑛2
𝑃 − 𝑣𝑎𝑙𝑜𝑟 < 𝛼
Inferencia para la Diferencia de
Medias con Varianza Desconocida y
Diferentes
Intervalo de Confianza para la diferencia de dos medias
𝑆12 𝑆22
𝜇1 − 𝜇2 = 𝑋ത1 − 𝑋ത2 ± 𝑡𝑣;1−𝛼ൗ ∗ +
2 𝑛1 𝑛2
2 2 2
𝑆1 𝑆2
+
𝑛1 𝑛2
𝑣= 2 2
2 2
𝑆1 ൗ 𝑆2 ൗ
𝑛1 𝑛2
+
𝑛1 − 1 𝑛2
Inferencia para la Diferencia de
Medias con Varianza Desconocida y
Diferentes
Prueba de Hipótesis para la diferencia de medias
𝐻0 : 𝜇1 − 𝜇2 = 𝑑0
Estadístico:
𝑋ത1 − 𝑋ത2 − 𝑑0
𝑡0 =
𝑆12 𝑆22
+
𝑛1 𝑛2
𝑃 − 𝑣𝑎𝑙𝑜𝑟. 2𝑐𝑜𝑙𝑎𝑠 = 2 ∗ (1 − 𝑃 𝑡 < 𝑡0 )
𝑃 − 𝑣𝑎𝑙𝑜𝑟 < 𝛼
Inferencia para la Diferencia de
Medias con Datos Pareados
𝑆
𝜇𝐷 = 𝑋ത𝐷 ± 𝑡𝑛−1;1−𝛼ൗ ∗ 𝐷൘
2 𝑛
𝑋𝐷 = 𝑋1 − 𝑋2
Inferencia para la Diferencia de
Medias con Datos Pareados
Prueba de Hipótesis para la diferencia de medias
𝐻0 : 𝜇1 − 𝜇2 = 𝑑0
Estadístico:
𝑋ത𝐷 − 𝑑0
𝑡0 =
𝑆𝐷
൘
𝑛
𝑃 − 𝑣𝑎𝑙𝑜𝑟 < 𝛼
Inferencia para la Relación de
Varianzas
𝜎12 𝑛 −1
𝐻1 : ൘ 2 > 𝑟0 ; 𝐹0 > 𝐹𝑛21−1;1−𝛼
𝜎2
𝜎12 𝑛 −1
𝐻1 : ൘ 2 < 𝑟0 ; 𝐹0 < 𝐹𝑛21−1;𝛼
𝜎2
𝑃 − 𝑣𝑎𝑙𝑜𝑟 < 𝛼
Inferencia para la Diferencia de Dos
Proporciones
1 1
𝑝1 − 𝑝2 = 𝑝Ƹ1 − 𝑝Ƹ 2 ± 𝑍1−𝛼ൗ ∗ 𝑝Ƹ ∗ 1 − 𝑝Ƹ ∗ +
2 𝑛1 𝑛2
𝑋1 + 𝑋2
𝑝Ƹ =
𝑛1 + 𝑛2
Inferencia para la Diferencia de Dos
Proporciones
Prueba de Hipótesis para la diferencia de dos proporciones
𝐻0 : 𝑝1 − 𝑝2 = 𝑑0
Estadístico:
𝑝Ƹ1 − 𝑝Ƹ 2 − 𝑑0
𝑍0 =
1 1
𝑝Ƹ ∗ 1 − 𝑝Ƹ ∗ +
𝑛1 𝑛2
𝐻1 : 𝑝1 − 𝑝2 < 𝑑0 ; 𝑍0 < 𝑍𝛼
𝑃 − 𝑣𝑎𝑙𝑜𝑟 < 𝛼
Inferencia para la Diferencia de Dos
Tasas
1 1
𝑢1 − 𝑢2 = 𝑢ො1 − 𝑢ො 2 ± 𝑍1−𝛼ൗ ∗ 𝑢ො ∗ +
2 𝑛1 𝑛2
𝑋1 + 𝑋2
𝑢ො =
𝑛1 + 𝑛2
Inferencia para la Diferencia de Dos
Tasas
Prueba de Hipótesis para la diferencia de dos tasas
𝐻0 : 𝑢1 − 𝑢2 = 𝑑0
Estadístico:
𝑢ො1 − 𝑢ො 2 − 𝑑0
𝑍0 =
1 1
𝑢ො ∗ +
𝑛1 𝑛2
𝐻1 : 𝑢1 − 𝑢2 < 𝑢0 ; 𝑍0 < 𝑍𝛼
𝑃 − 𝑣𝑎𝑙𝑜𝑟 < 𝛼
Inferencia Estadística
Para poblaciones no Normales
(Estadística no Paramétrica)