XV ANIVERSARIO ESCUELA DE FORMACIN PROFESIONAL DE CIENCIAS FSICO MATEMTICAS MODELO DE SUPERVIVENCIA DE RIESGOS PROPORCIONALES DE COX Mg. YSELA AGUERO PALACIOS Docente Principal /UNMSM Recordar que el objetivo del anlisis de supervivencia es estimar las funciones de supervivencia y de riesgo para una muestra aleatoria de observaciones correspondientes a la variable aleatoria Y: Tiempo hasta la ocurrencia de un evento. Al comparar las curvas de supervivencia mediante las pruebas de hiptesis Log rank, Breslow, Tarone-Ware, se asume que las muestras de los dos grupos son aleatorias y por lo tanto son independientes.
MODELO DE REGRESIN Pero, el muestreo aleatorio no garantiza que las muestras sean homogneas con respecto a aquellas variables no controladas. Por lo tanto, puede ser importante controlar el efecto confusor de estas variables (pos estratificacin) Por otro lado, el investigador podra estar interesado en evaluar las diferencias en las curvas de supervivencia, para distintos valores de un conjunto de factores. MODELO DE REGRESIN MODELO DE REGRESION DE COX El modelo ms popular, por su sencillez y facilidad para interpretar los coeficientes | es el denominado modelo de riesgo proporcional o modelo de Cox que tiene la forma 1 1 ... 0 ( , ) ( ) k k X X h t X h t e | | + + = Este es un modelo semi paramtrico bastante popular por su sencillez y facilidad para la interpretacin de los coeficientes asociados con las variables explicativas. El trmino h 0 (t) es el riesgo cuando X 1 =X 2 =...=X k = 0, se le denomina riesgo basal y slo depende del tiempo. 1 (0) ... (0) 0 0 0 0 ( , ) ( ) ( ) ( ) k h t X h t e h t e h t | | + + = = = MODELO DE REGRESION DE COX Con la finalidad de linealizar el modelo se aplica una transformacin logartmica al cociente de riesgos, de modo que el modelo de Cox se puede expresar como: 1 1 0 ( , ) ... ( ) k k h t X Ln X X h t | | ( = + + ( (
La respuesta en este nuevo modelo corresponde a la razn de riesgos la cual se relaciona con el predictor lineal a travs de la transformacin logaritmo. Se supone, por lo tanto, que el riesgo relativo (RR), a diferencia del riesgo propiamente dicho, no depende del tiempo o, dicho de otra manera, que es constante a lo largo del tiempo. De all se deriva el nombre de modelo de riesgos proporcionales con que se le conoce. La forma anterior hace explcita la interpretacin de los coeficientes. As tenemos que : | j = ln (RRj) ; j=1,2,,K cuando X j se incrementa en una unidad, mantenindo constantes las dems variables. Luego, RR j = Exp(| j ) ; j=1,2,,K
es el riesgo relativo cuando X j aumenta una unidad, mantenindose constantes las dems variables explicativas. MODELO DE REGRESION DE COX MODELO DE REGRESION DE COX La nica asuncin que se hace al formular el modelo de Cox es que cuando cada variable se incrementa en una unidad el riesgo relativo es constante (RRj=Exp(| j ) =constante) en todo punto del tiempo. Es decir, que los riesgos deben ser proporcionales en todo el periodo de tiempo. Esta suposicin no siempre es razonable y conviene evaluarla en cada caso, por ejemplo, se pueden utilizar grficas que representen el logaritmo de los riesgos para distintos valores de las variables X i en funcin del tiempo. Si los riesgos son proporcionales estas curvas deben ser paralelas. Los datos corresponden a los tiempos sobrevivencia en remisin de 42 pacientes con leucemia a los cuales se les ha aplicado dos tipos de tratamientos (grupo). Adicionalmente se registraron los conteos de glbulos blancos para cada paciente (WBC) y se calcula su logaritmo. Las razones epidemiolgicas para registrar el logWBC es que, esta variable usualmente es considerada como un importante predictor de la sobrevivencia de pacientes con leucemia. Cuanto mayor es el nmero de WBC ms pesimista es el pronstico. Por lo tanto, la comparacin de las curvas de sobrevivencia de los dos grupos necesita ser ajustado para controlar el posible efecto confusor de esta variable. EJEMPLO REMISIN DE PACIENTES CON LEUCEMIA Grupo I Grupo II Semanas (t) Log WBC Semanas (t) Log WBC 6 2.31 1 2.80 6 4.06 1 5.00 6 3.28 2 4.91 7 4.43 2 4.48 10 2.96 3 4.01 13 2.88 4 4.36 16 3.60 4 2.42 ::: ::: ::: ::: 19+ 2.05 11 2.12 20+ 2.01 12 1.50 25+ 1.78 12 3.06 32+ 2.20. 15 2.30 32+ 2.53 17 2.95 34+ 1.47 22 2.73 35+ 1.45 23 1.97 EJEMPLO.- REMISIN DE PACIENTES CON LEUCEMIA Recuento de glbulos blancos. Pacientes con leucemia , Grupo 2 1 L n
W B C 6 5 4 3 2 1 4 El grfico muestra que los dos grupos de pacientes tienen diferentes valores para el logaritmo del conteo de glbulos blancos. Si no se tomara en cuenta estas diferencias durante el anlisis podra obtenerse resultados sesgados. Se deber ajustar un modelo controlando el efecto de LnWBC y tambin trataremos de evaluar el posible efecto de la interaccin del tratamiento y LnWBC. EJEMPLO REMISIN DE PACIENTES CON LEUCEMIA Se pueden proponer tres modelos 1 0 ( , ) ( ) grupo h t grupo h t e | = 1 2 ln 0 ( , ( , ln )) ( ) grupo WBC h t grupo WBC h t e | | + = 1 2 12 ln ln 0 ( , ( , ln , ln )) ( ) grupo WBC grupo WBC h t grupo WBC grupo WBC h t e | | | + + = Modelo 1.
Modelo 2.
Modelo 3.
EJEMPLO REMISIN DE PACIENTES CON LEUCEMIA Funciones de supervivencia. Pacientes con leucemia Tiempo 40 30 20 10 0 S u p e r v i v e n c i a
1 0 ( , ) ( ) grupo h t grupo h t e | = El grfico de las funciones de sobrevivencia para los dos tratamientos (grupos) son proporcionales EJEMPLO REMISIN DE PACIENTES CON LEUCEMIA La reduccin en la incertidumbre al incorporar el factor tratamiento (grupo) en el modelo es de 187.970 - 172.759 =15.211 El factor tratamiento contribuye significativamente para explicar la sobrevivencia (p=0.000). Pruebas omnibus sobre los coeficientes del modelo a,b 172.759 15.931 1 .000 15.211 1 .000 -2 log de la verosimilitud Chi-cuadrado gl Sig. Global (puntuacin) Chi-cuadrado gl Sig. Cambio desde el paso anterior Bloque inicial nmero 0, f uncin log de la verosimilitud inicial: -2 log de la verosimilitud: 187.970 a. Bloque inicial nmero 1. Mtodo = Introducir b. Modelo 1.
EJEMPLO REMISIN DE PACIENTES CON LEUCEMIA El coeficiente estimado indica el efecto del tratamiento sobre la probabilidad de sobrevivencia estimada. Este efecto es significativamente diferente de cero (p= 0.00). Variables en la ecuacin 1.509 .410 13.578 1 .000 GRUPO B ET Wald gl Sig. Modelo 1.
EJEMPLO REMISIN DE PACIENTES CON LEUCEMIA El riesgo relativo estimado de ocurrencia del evento (retorno de los sntomas) de los pacientes que reciben el tratamiento II es 4.523 veces mayor que para aquellos pacientes que reciben el tratamiento I. Adems este riesgo relativo estimado es significativo. Sin embargo, el Ln (conteo) promedio de glbulos blancos es distinto para ambos grupos de pacientes (para I es 2.64 y para II es 3.22), por lo que podra tratarse de una variable confusora. Modelo 1.
Riesgo r elativo estimado 4.523 2.027 10.094 GRUPO Exp(B) Inf erior Superior 95.0% IC para Exp(B) EJEMPLO REMISIN DE PACIENTES CON LEUCEMIA Globalmente el modelo es significativo. La reduccin en la incertidumbre es de 43.412 (p=0.000). Modelo 2. Incluyendo lnWBC en el modelo
1 2 ln 0 ( , ( , ln )) ( ) grupo WBC h t grupo WBC h t e | | + = Pruebas omnibus sobre los coeficientes del modelo a 144.559 42.938 2 .000 43.412 2 .000 -2 log de la verosimilitud Chi-cuadrado gl Sig. Global (puntuacin) Chi-cuadrado gl Sig. Cambio desde el paso anterior Bloque inicial nmero 0, f uncin log de la verosimilitud inicial: -2 log de la verosimilitud: 187.970 a. EJEMPLO REMISIN DE PACIENTES CON LEUCEMIA El efecto del tratamiento y de ln WBC explican significativamente la probabilidad de sobrevivencia de los pacientes. Modelo 2. Incluyendo lnWBC en el modelo
Variables en la ecuacin 1.294 .422 9.399 1 .002 1.604 .329 23.732 1 .000 GRUPO LNWBC B ET Wald gl Sig. EJEMPLO REMISIN DE PACIENTES CON LEUCEMIA Para ambas variables el riesgo relativo es significativo aunque los intervalos son bastante amplios (variacin). Modelo 2. Incluyendo lnWBC en el modelo
Riesgo r elativo estimado 3.648 1.595 8.343 4.975 2.609 9.486 GRUPO LNWBC Exp(B) Inf erior Superior 95.0% IC para Exp(B) EJEMPLO REMISIN DE PACIENTES CON LEUCEMIA Globalmente el modelo es significativo. La reduccin en la incertidumbre es de 43.412 (p=0.000). Modelo 2. Incluyendo lnWBC en el modelo
1 2 ln 0 ( , ( , ln )) ( ) grupo WBC h t grupo WBC h t e | | + = Pruebas omnibus sobre los coeficientes del modelo a 144.559 42.938 2 .000 43.412 2 .000 -2 log de la verosimilitud Chi-cuadrado gl Sig. Global (puntuacin) Chi-cuadrado gl Sig. Cambio desde el paso anterior Bloque inicial nmero 0, f uncin log de la verosimilitud inicial: -2 log de la verosimilitud: 187.970 a. EJEMPLO REMISIN DE PACIENTES CON LEUCEMIA La interaccin contribuye sobre el modelo global pero aunque es significativa, no es muy grande. Calculando tenemos
Pruebas omnibus sobre los coeficientes del modelo a 144.131 45.902 3 .000 43.839 3 .000 -2 log de la verosimilitud Chi-cuadrado gl Sig. Global (puntuacin) Chi-cuadrado gl Sig. Cambio desde el paso anterior Bloque inicial nmero 0, f uncin log de la verosimilitud inicial: -2 log de la verosimilitud: 187.970 a. 1 2 12 ln ln 0 ( , ( , ln , ln )) ( ) grupo WBC grupo WBC h t grupo WBC grupo WBC h t e | | | + + = EJEMPLO REMISIN DE PACIENTES CON LEUCEMIA Al incluir la interaccin el tratamiento deja de ser significativo (p=0.0161). Adems el p valor de la interaccin es mucho mayor de 0.05 (p=0.51), se concluira que no hay evidencia de interaccin significativa. Modelo 3. Incluyendo Tratamiento, lnWBC e interaccin
Variables en la ecuacin 2.355 1.681 1.963 1 .161 1.803 .447 16.286 1 .000 -.342 .520 .433 1 .510 GRUPO LNWBC GRUPO*LNWBC B ET Wald gl Sig. EJEMPLO REMISIN DE PACIENTES CON LEUCEMIA Pero, el RR relativo definitivamente indica que el tratamiento y la interaccin no tienen un efecto significativo. Modelo 3. Incluyendo Tratamiento, lnWBC e interaccin
Riesgo relativo estimado 10.537 .391 284.201 6.067 2.528 14.561 .710 .256 1.967 GRUPO LNWBC GRUPO*LNWBC Exp(B) Inf erior Superior 95.0% IC para Exp(B) EJEMPLO REMISIN DE PACIENTES CON LEUCEMIA (Resumen de modelos)
Coeficientes
p
RR
IC(95%)
Modelo 1
LI
LS
Grupo
1.509
0.000
4.523
2.027
10.094
Modelo 2
Grupo
1.294
0.002
3.648
1.595
8.343
lnWBC
1.604
0.000
4.975
2.609
9.486
Modelo 3
Grupo
2.355
0.101
10.537
0.391
284.201
lnWBC
1.803
0.000
6.067
2.528
14.561
Grupo*lnWBC
-0.342
0.510
0.710
0.250
2.967 EJEMPLO REMISIN DE PACIENTES CON LEUCEMIA Funcin de supervivencia segn tratamiento Tiempo 30 20 10 0 S u p e r v i v e n c i a
a c u m u l a d a 1.2 1.0 .8 .6 .4 .2 0.0 grupo B A Las curvas de supervivencia de los dos tratamientos son proporcionales Funcin de riesgo segun tratamiento Tiempo 30 20 10 0 I m p a c t o
a c u m u l a d o 5 4 3 2 1 0 -1 grupo B A EJEMPLO REMISIN DE PACIENTES CON LEUCEMIA Las curvas de supervivencia para los dos tratamientos controlando el efecto del lnWBC, muestran que con el tratamiento B el riesgo de remisin aumenta ms aceleradamente y en consecuencia la superviviencia libre de la enfermedad es menor. Funcin de supervivencia segn tratamiento controlando el efecto de lnWBC Tiempo 30 20 10 0 S u p e r v i v e n c i a
a c u m u l a d a 1.2 1.0 .8 .6 .4 .2 0.0 -.2 grupo B A Funcin de riesgo segn tratamiento Controlando el efecto de lnWBC Tiempo 30 20 10 0 I m p a c t o
a c u m u l a d o 10 8 6 4 2 0 -2 grupo B A EJEMPLO REMISIN DE PACIENTES CON LEUCEMIA Se realiz un estudio con una cohorte de pacientes con SIDA quienes a una edad determinada comienzan un programa de tratamiento con AZT . Los datos corresponden a las edades al comenzar el programa, la edad en que ocurre la muerte o la censura y un indicador de si ocurri la muerte o la censura. EJEMPLO SUPERVIVENCIA DE PACIENTES CON SIDA Variable Descripcin Codigos/unidades ID 1-100 FECHA_ENT Fecha de entrada ddmmmyr FECHA_SAL Fecha final ddmmmyr TIEMPO Tiempo de supervivencia (en meses) EDAD Edad a la que ocurre la muerte Aos DROGA Historia de uso de Drug IV 0 = No 1 = Yes 1= muerte por AIDS o causa relacionada con AIDS 0 = Vivo al finalizar el studio o perdida de seguimiento. CENSURA Censura Resumen del procesamiento de los casos 51 42 9 17,6% 49 38 11 22,4% 100 80 20 20,0% droga Uso de drogas 0 No 1 Si Global N total N de eventos N Porcentaje Censurado REPORTES Medias y medianas del tiempo de supervivencia 19,983 2,902 14,295 25,672 11,000 1,636 7,794 14,206 8,076 2,370 3,430 12,723 5,000 1,022 2,997 7,003 14,669 1,971 10,806 18,532 7,000 1,114 4,816 9,184 droga Uso de drogas 0 No 1 Si Global Estimacin Error tpico Lmite inf erior Lmite superior Intervalo de conf ianza al 95% Estimacin Error tpico Lmite inf erior Lmite superior Intervalo de conf ianza al 95% Media a Mediana La estimacin se limita al mayor tiempo de supervivencia si se ha censurado. a. Percentiles 34,000 3,005 11,000 1,636 5,000 1,231 8,000 ,891 5,000 1,022 3,000 . 15,000 7,452 7,000 1,114 3,000 ,589 droga Uso de drogas 0 No 1 Si Global Estimacin Error tpico Estimacin Error tpico Estimacin Error tpico 25,0% 50,0% 75,0% Comparaciones globales 11,856 1 ,001 10,910 1 ,001 12,336 1 ,000 Log Rank (Mantel-Cox) Breslow (Generalized Wilcoxon) Tarone-Ware Chi-cuadrado gl Sig. Prueba de igualdad de distribuciones de supervivencia para dif erentes niveles de droga Uso de drogas. Tiempo de vida 60 50 40 30 20 10 0 S u p e r v i v e n c i a
a c u m 1,0 0,8 0,6 0,4 0,2 0,0 Si-censurado No-censurado Si No Uso de drogas Funciones de supervivencia Tiempo de vida 60 50 40 30 20 10 0 I m p a c t o
a c u m 3,0 2,5 2,0 1,5 1,0 0,5 0,0 Si-censurado No-censurado Si No Uso de drogas Funcion de impacto