Você está na página 1de 41

Análisis Bivariado

Michael Vélez, MSD


Análisis Bivariado (Definición)

 Es el análisis de la relación de una variable


independiente (posible causal) y una variable
dependiente (resultado “outcome”).

Variable
Variable
Independiente
Dependiente
[Posible
[Outcome]
Causa]
Análisis Multivariado (Definición)

 Es el análisis de la relación de más de una


variables independientes (posibles causales)
y una variable dependiente (resultado
“outcome”).
V1 V1

Variable
V1 Dependiente V1
[Outcome]

V1 V1
Tipos de Análisis Bivariados
 Coeficiente de Correlación de Person (r)
 Coeficiente de Correlación de Spearman (rho)
 Regresión Lineal
 Prueba t
 Prueba t pareada
 ANOVA (Prueba F)
 Mann-Whitnet U
 Wilcoxon
 Chi-Square
 Prueba exacta de Fisher
Tipos de Análisis Bivariados
 Coeficiente de Correlación de Person (r)
 Coeficiente de Correlación de Spearman (rho)
 Regresión Lineal
 Prueba t
 Prueba t pareada
 ANOVA (Prueba F)
 McNemar Chi-Square
 Mann-Whitnet U
 Wilcoxon
 Chi-Square 2
 Prueba exacta de Fisher
Criterios Utilizados para seleccionar
el Análisis Bivariado adecuado
 Nivel de Medición de la variable Dependiente
 Nivel de Medición de la variable Independente
 Distribución y Tamaño de muestra (prueba paramétrica
o No paramétrica)
Niveles de Medición
 Nominal
 Ordinal
 Intervalo
 Razón
Medición Nominal
 Es el nivel más bajo y comprende la asignación de números para
clasificar las características en categorías.

 Ejemplos: género, raza, religión, tipo de sangre, status vital,


diagnóstico médico.
Medición Ordinal

 Permite el ordenamiento de objetos con base en su


posición relativa respecto de otro y conforme a un atributo
específico.
 Ejemplo: Escala de satisfacción
 Ejemplo: Capacidad que tiene un paciente para realizar
actividades cotidianas:
1) completamente dependiente
2) requiere la ayuda de otra persona
3) requiere asistencia médica
4) completamente independiente
Medición de Intervalos
 Se puede especificar el orden jerarquico de los objetos con base
en un atributo y distancia entre éstos. Las escalas de intervalos
poseen valores numéricos cuya distancia intermedia representa
distancias iguales en el atributo que se mide.

 Ejemplos: temperatura
Medición de Proporciones (Razón)
 Tienen un cero racional. Estas escalas ofrecen información acerca de:
 rango (rank) de ordenamiento
 intervalos entre objetos
 magnitud absoluta del atributo en lo que al objeto se refiere.

 Ejemplos: peso, talla, niveles CD4


Nivel de Medición

 Todas las medidas deben ser tomadas en un formulario


(cuestionario) en el nivel de medición más alto. En
muchos casos se puede bajar de nivel (reclasificar la
variable) para intentar otro tipo de análisis.

Ejemplo:
Años de escuela completados se puede recodificar por
niveles educativos (elemental, intermedio, superior,
universidad).
Tipos de Variables
 Nominal
 Dicótoma (binaria)
 3+ categorías
 Ordinal
 Cuantitativa Discreta (no continua)
 Cuantitativa No Normal
 Cuantitativa Normal
Tipos de Variables
 Nominal
 Dicótoma (binaria) [enfermo/sano]
 3+ categorías [tipo de sangre]
 Ordinal [escala de satisfacción]
 Cuantitativa Discreta (No continua) [escala de satisfacción]
 Cuantitativa No Normal [ingreso]
 Cuantitativa Normal [nivel de hemoglobina]
Estadísticas Paramétricas
 Es una rama de la estadística inferencial que
comprende los procedimientos estadísticos y de
decisión que están basados en las distribuciones de
los datos reales. Estas son determinadas usando un
número finito de parámetros.
Suposiciones que subyacen a la utilización de las
pruebas paramétricas.

 El nivel de medición debe ser al menos de intervalo. Debemos tomar


una decisión a cerca de nuestra variable dependiente. ¿Es realmente
un nivel de intervalo? Si es una escala no estandarizada, o si se basa
en estimaciones o calificaciones con humanos. Frecuentemente
aparecen como intervalo pero lo reducimos a nivel ordinal al darles
rango.

 Los datos de la muestra se obtienen de una población normalmente


distribuida. Este principio suele mal entenderse como: la muestra
debe distribuirse normalmente, "no es así". La mayoría de las
muestras son demasiado pequeñas para siquiera parecerse a una
distribución normal, la cual solo obtiene su característica en forma de
campana con la acumulación de muchas puntuaciones.
Suposiciones que subyacen a la utilización de las
pruebas paramétricas.

 La varianza de las 2 muestras no son significativamente


diferentes, esto se conoce como el principio de homogeneidad
de la varianza, Los especialistas en estadística han investigado
más sobre ese requisito, el cual sabia exigir varianzas muy
similares. Estos se ignoran cuando tratamos con muestras
relacionadas sin gran riesgo de distorsionar nuestro resultado.
Para muestras no relacionadas necesitamos ser más
cuidadosos cuando los tamaños de las muestras sean bastante
diferentes.
Estadísticas No Paramétricas
 La estadística no paramétrica es una rama de la
estadística que estudia las pruebas y modelos
estadísticos cuya distribución subyacente no se
ajusta a los llamados criterios paramétricos.
Ventajas de los Métodos No Paramétricos

 Los métodos no paramétricos pueden ser aplicados a una amplia


variedad de situaciones porque ellos no tienen los requisitos rígidos
de los métodos paramétricos correspondientes. En particular, los
métodos no paramétricos no requieren poblaciones normalmente
distribuidas.

 Diferente a los métodos paramétricos, los métodos no paramétricos


pueden frecuentemente ser aplicados a datos no numéricos, tal
como el género de los que contestan una encuesta.

 Los métodos no paramétricos usualmente involucran simples


computaciones que los correspondientes en los métodos
paramétricos y son por lo tanto, más fáciles para entender y aplicar.
Choice of statistical test for independent observations
Outcome variable
Nominal Nominal Ordinal Quantitative Quantitative Quantitative
(binary) (>2 Discrete Non-Normal Normal
Categories)

Nominal (binary) Mann-Whitney Mann-Whitney or Student's t test


2 2 2 log-rank (a)

or Fisher's trend or Mann-


Whitney

Nominal Kruskal-Wallis Kruskal-Wallis Kruskal-Wallis Analysis of


(>2 categories)
2 variance

(ANOVA)

2
Ordinal (Ordered Spearman Spearman rank Spearman rank Spearman rank
categories) rank or linear
regression
Input -trend or Mann-
Whitney
Variable
Quantitative Logistic Spearman rank Spearman rank Spearman rank
Discrete regression or linear
regression

Quantitative Non- Logistic Plot data and Plot data and


Normal regression Pearson or Pearson or
Spearman rank Spearman rank
and linear
regression
Quantitative Logistic Linear regression Pearson and
Normal regression linear regression
Choice of statistical test from paired or matched observations

Variable Test

Nominal McNemar's Test

Ordinal (Ordered categories) Wilcoxon

Quantitative (Discrete or Non-Normal) Wilcoxon

Quantitative (Normal*) Paired T-test

* It is the difference between the paired observations that should be plausibly Normal.
Ji Cuadrada
Representación Gráfica

90

80

70

60
Frecuencia

50
No Fuma
40 Si Fuma

30

20

10

0
Bajo peso al nacer Peso Normal al Nacer
Peso al Nacer
Ji Cuadrada
Representación en Tablas
Ji Cuadrada
Representación Grafica
Ji Cuadrada
Representación en Tablas
Prueba t
Representación Gráfica
Prueba t
Representación Gráfica
Prueba t pareada
Representación Gráfica
Prueba t pareada
Representación Gráfica
ANOVA
Representación Gráfica
Pearson y Regresión Lineal
Representación Gráfica
Regresión Lineal
Representación Gráfica

A – Relación Lineal Positiva (fuerte)


Regresión Lineal
Representación Gráfica

X
B – Relación Lineal Positiva
Regresión Lineal
Representación Gráfica

X
C – Relación Lineal Negativa (perfecta)
Regresión Lineal
Representación Gráfica

X
D – Relación Parabólica Perfecta
Regresión Lineal
Medidas de Variación en una Regresión
Y

Unexplained
Total variation
Variation

Explained
variation

Y
(X, Y)

Yi =a + bXi
a

0 Xi X
X
Variable Variable
Independiente Dependiente Analisis

Nominal χ2
Nominal (binario)
(binario) Fisher

Nominal (3+) Nominal (binario) χ2

Nominal (3+) Nominal (3+) χ2


Variable Variable
Independiente Dependiente Analisis

Nominal (binario) Cuantitativa


t test
A & B Indep. normal

Nominal (binario) Cuantitativa


paired t test
A & B Depen. normal

Cuantitativa
Nominal (3+) ANOVA
normal
Variable Variable
Independiente Dependiente Analisis

Ordinal Ordinal Spearman (rho)

Cuantitativa
Ordinal Spearman (rho)
normal

Cuantitativa
Ordinal Spearman (rho)
normal
Variable Variable
Independiente Dependiente Analisis

Cuantitativa Cuantitativa
Normal Pearson (r)
(correlacion)
Normal

Cuantitativa Cuantitativa Regresion


Normal Normal lineal
(predecir)
Regresión Logística
Definición

La regresión logística es un modelo de regresión para


variables dependientes o de respuesta binomialmente
distribuidas. Es útil para modelar la probabilidad de un
evento ocurriendo como función de otros factores.

Você também pode gostar