Escolar Documentos
Profissional Documentos
Cultura Documentos
Anlise de sobrevida
Definies: Tipo de estudo estudos de coorte ou ensaios clnicos Varivel resposta tempo transcorrido entre a entrada do indivduo no estudo e a ocorrncia de um evento a ser relacionado com a exposio ou tratamento. Evento (falha ) pode ser doena, morte, cura etc.
Anlise de Sobrevida
Tania Guilln de Torres Rejane Sobrino Pinheiro
Tempo de sobrevida: Medido para cada indivduo, desde sua entrada no estudo at a ocorrncia do "evento" (falha). Indivduos podem entrar no estudo em qualquer perodo durante o tempo do estudo. Tempo pode ser medido em qualquer unidade dias, semanas, meses, etc.
Anlise de sobrevida
Nesta seo sero apresentadas tcnicas de analise de tempos de sobrevida para o caso de um nico desfecho de interesse. Exemplos de aplicao:
Tempo de remisso, em semanas, para pacientes com Leucemia.
Tempo at a ocorrncia do evento Mtodos especiais de anlise Distribuio dos tempos no gaussiana Dados com censura
Tempo, em anos, at a ocorrncia de doena coronariana, numa corte de indivduos sem doena. Tempo, em anos, at a morte numa populao de idosos (>60 anos) Tempo (meses) at morte em pacientes transplantados.
Observao:
possvel avaliar simultaneamente a ocorrncia de vrios desfechos num nico desenho de estudo, por exemplo mortes por Cncer em mulheres (Ca. de colo uterino, Ca. Mama, etc.). Podem ser abordados como um problema de Riscos Competitivos, porem este tpico no faz parte da disciplina.
Dado censurado:
Indivduo no sofre o "evento" durante o perodo de estudo, de modo que o tempo exato de sobrevida no conhecido. Censura devida a: O indivduo no experimenta o evento antes do fim do estudo (estudo termina antes da ocorrncia do evento) Perda de follow-up (seguimento) durante o perodo do estudo Sada do estudo por causa de bito (por outra causa), ou por outra razo (reao adversa droga) Indivduos podem entrar no estudo em qualquer instante depois do incio do estudo e pode ser censurado em qualquer instante de tempo durante o estudo.
Censura
Pacientes de Leucemia em remisso
Dados censurados
Exemplo: Leucemia Comparar os tempos de remisso, de um grupo de pacientes com leucemia tratados com a droga 6-mercaptopurine com os tempos de remisso de um grupo controle no tratado. Desfecho (evento) Tempo de sobrevida Grupo controle: 1 1 2 2 3 4 4 5 5 8 8 8 8 11 11 12 12 15 17 22 23 Grupo tratado:
6* 6 6 6 7 9* 10* 10 11* 13 16 17* 19* 20* 22 23 25* 32* 32* 34* 35*
Grupo tratado:
6* 6 6 6 7 9* 10* 10 11* 13 16 17* 19* 20* 22 23 25* 32* 32* 34* 35*
1: Controle
Obs Tempo recidiva Grupo 1 1 1 1 2 1 1 1 3 2 1 1 4 2 1 1 5 3 1 1 6 4 1 1 7 4 1 1 8 5 1 1 9 5 1 1 10 8 1 1 11 8 1 1 12 8 1 1 13 8 1 1 14 11 1 1 15 11 1 1 16 12 1 1 17 12 1 1 18 15 1 1 19 17 1 1 20 22 1 1 21 23 1 1
Mdia ou mediana do tempo de remisso para cada grupo, ignorando a condio de censura ( ttrt = 17,1 e tcontrole = 8,7 ) Problema: tempos censurados podem enviesar os resultados Alternativas: 1. Excluir tempos censurados Tempo de sobrevida pelo tratamento muito baixo, por excluir os tempos de remisso mais longos (subestimar). 2. Incluir tempos censurados Ignorar a diferena entre evento e censura. Indivduos com os tempos de sobrevida censurados tem atualmente tempos de sobrevida maiores do que as semanas representadas no estudo Stata: 2 - Declarar um banco para Anlise de Sobrevida
Interpretao: 6* indivduo ainda em remisso depois de 6 semanas no estudo, e no observado aps este tempo. 6 indivduos conhecidos como em remisso por 6 semanas, mas tiveram recada entre a 6a. e a 7a. semanas.
Observar: Nenhuma censura no grupo controle (todos "falharam") Parece que o tempo de sobrevida maior para os do grupo tratado
Statistics
Comando stset vartempo varcensura Declara o banco como sendo um banco com tempos de sobrevida
Stata:
Funo de sobrevida:
S(t) = P(T > t)
T t
varivel aleatria tempo de sobrevida de um indivduo qualquer valor de interesse para a varivel aleatria T
-----------------------------------------------------------------------------42 total obs. 0 exclusions -----------------------------------------------------------------------------42 obs. remaining, representing 30 failures in single record/single failure data 541 total analysis time at risk, at risk from t = 0 earliest observed entry t = 0 last observed exit t = 35
Ex: Se estamos interessados em avaliar se uma pessoa sobrevive mais de 5 anos aps submeter-se a tratamento para cncer S(5) = P(T > 5) A funo de sobrevida d a probabilidade de uma pessoa viver mais do que um tempo especfico t = 5. Isto , S(T) d a probabilidade de um indivduo sobreviver alm do tempo t (probabilidade de uma varivel aleatria T exceder um determinado valor especificado (t).
A funo decrescente, ou seja, os valores de S(t) decrescem medida que t cresce. Para t = 0 Para t = S(t) = = S(0) = 1 S(t) = 0 1
S(t)
N total de indivduos
Sempre decrescente
S ( 22) =
1 = 0.048 21
0 S(t) 1 0
N total de indivduos
D1 (2)
2/19
S (t ) =
t
0 1 2 3 4 5 8 11 12 15 17 22 23
N de sobreviventes no instante t n
m t a c u m u la d a
0 2 4 5 7 9 13 15 17 18 19 20 21
21
P(S1)=19/21
D2 (2)
1/17
S1 (19)
17/19 P(S2| S1)
D3 (1)
2/16
mt
0 2 2 1 2 2 4 2 2 1 1 1 1
S (t)
( 2 1 - 0 ) /2 1 = 2 1 /2 1 = 1 .0 0 ( 2 1 - 2 ) /2 1 = 1 9 /2 1 = 0 .9 1 ( 2 1 - 4 ) /2 1 = 1 7 /2 1 = 0 .8 1 ( 2 1 - 5 ) /2 1 = 1 6 /2 1 = 0 .7 6 ( 2 1 - 7 ) /2 1 = 1 4 /2 1 = 0 .6 7 ( 2 1 - 9 ) /2 1 = 1 2 /2 1 = 0 .5 7 ( 2 1 - 1 3 ) /2 1 = 8 /2 1 = 0 .3 8 ( 2 1 - 1 5 ) /2 1 = 6 /2 1 = 0 .2 9 ( 2 1 - 1 7 ) /2 1 = 4 /2 1 = 0 .1 9 ( 2 1 - 1 8 ) /2 1 = 3 /2 1 = 0 .1 4 ( 2 1 - 1 9 ) /2 1 = 2 /2 1 = 0 .1 0 ( 2 1 - 2 0 ) /2 1 = 1 /2 1 = 0 .0 5 ( 2 1 - 2 1 ) /2 1 = 0 /2 1 = 0 .0 0
S2 (17)
16/17
D4 (2)
S3 (16)
14/16
t: 1 1 2 2 3 4 4 5 5 8 8 8 8 11 11 12 12 15 17 22 23 Curva de sobrevida:
a representao grfica da Funo de sobrevida S(t) no eixo vertical vs. os tempos de sobrevida (t) no eixo horizontal
S4 (15)
0.75
1.00
S(t)
h(t ) = lim
Taxa de falha condicional Taxa de falha instantnea (falha durante um intervalo de tempo bem pequeno de amplitude t, dado que um indivduo tenha sobrevivido at o incio do intervalo) / t). Funo de Hazard:
0 5 10 15 analysis time 20 25
0.00
0.25
0.50
(t)
h(t ) =
N de indivduos que morreram por unidade de tempo no intervalo (t, t + t) N sobreviventes no instante t
Stata: Statistics Survival analysis Summary statistics, test, & tables Summarize survival-time data
h ( 6) =
3 = 0.143 21
n sob risco no incio do intervalo de tempo 6
1 h(7) = = 0.059 17
n sob risco no incio do intervalo de tempo 7
| incidence no. of |------ Survival time -----| | time at risk rate subjects 25% 50% 75% ---------+--------------------------------------------------------------------total | 541 .0554529 42 6 12 23
Funo de Hazard acumulada Graphics Survival analysis graphs Survivor & cumulative hazard functions
. stsum, by(trtment)
failure _d: analysis time _t: relapse == 1 weeks
| incidence no. of |------ Survival time -----| trtment | time at risk rate subjects 25% 50% 75% ---------+--------------------------------------------------------------------0:stand | 182 .1153846 21 4 8 12 1:trt | 359 .0250696 21 13 23 . ---------+--------------------------------------------------------------------total | 541 .0554529 42 6 12 23
0.00
0.25
0.50
0.75
1.00
Funo de Hazard acumulada Graphics Survival analysis graphs Survivor & cumulative hazard functions
10
20 analysis time
30
40
0.00
0.25
0.50
0.75
1.00
10
30 trtment = 1:trt
40
10
20 analysis time
30 grupo = Tratamento
40
grupo = Controle
. sts graph, by(grupo) na failure _d: analysis time _t: recidiva == 1 tempo
21
C6 (1)
d7
1/17
(1)
S6 (17)
C7
(0)
1/16 16/17
d10
(1)
Ou: S(0) = 1 - h(0) S(1) = S(0) x [1 - h(1)] S(2) = S(1) x [1 - h(2)] S(3) = S(2) x [1 - h(3)] S(t) = S(t-1) x [1 - h(t)] Exemplo:
Grupo tratado: 6* 6 6 6 7 9* 10* 10 11* 13 16 17* 19* 20* 22 23 25* 32* 32* 34* 35*
tj [0-1) [1-2) nj 21 21 mj 0 0 qj 0 0 H(t) = mt 0 / 21 = .000 0 / 21 = .000 S(t) = S(t-1) x [1 h(t)] 1.0 x [ 1 0] = 1.00 1.0 x [ 1 0] = 1.00
1.00
S7
(16)
C10
(2)
S10
(13)
Mtodo de Kaplan-Meier
Chama-se de tabela de vida a uma tabela de probabilidades de sobrevivncia acumuladas no perodo estudado e de curva de sobrevida ao grfico destas probabilidades versus o tempo de sobrevivncia.
As probabilidades acumuladas de sobrevida nos perodos so:
P(S ao 1 ano) = P(S1) = 0,87 P(S ao 2 ano) = P(S1)*P(S2/ S1) = 0,67 P(S ao 3 ano) = P(S1)*P(S2/ S1)* P(S3/ S1 S2) = 0,60
1 1
[16-17)
11
1 / 11 = .091
0.00 0
0.25
[13-14)
12
1 / 12 = .083
0.50
21 17 16 16 15
3 1 0 0 1
1 0 0 1 1
1.0 x [ 1 0.143] = 0.857 .857 x [1 - .059] = .806 .806 x [1 0] = .806 .806 x [1 0] = .806 .806 x [1 0.067] = .752
0.75
10
20 analysis time
30
40
7 6 5
1 1 0
0 0 0
1 0.9
1 0.92
[35-36)
0 / 1 = .000
.447 x [1 0]
= .447
0.9 0.87
0.87
[1-2) = 1 semana a < 2 semanas nt = sob risco; mt = recidivas; qt = censurado Somente tem-se que calcular S(t) p/ valores de t onde 1 ou + falhas ocorram (mt).
0.8
0.8 0.7
0.77 0.71
0.7
0.67
0.67 0.6
0.6
0.6
3
0.6 0 1 2
0.5 0 1 2 3
Stata: Tabelas de Vida Tempos de sobrevida agrupados em intervalos. Statistics Survival analysis Summary statistics, test, & tables Life tables for survival data
Kaplan-Meier uma verso modificada da tabela de vida KM usa tempos exatos de "falha" ou intervalos de tempo curtos KM tem poucos ou nenhum empate nos tempos de "falha"
Survival 0.9524 0.9048 0.8810 0.8333 0.7857 0.7132 0.6886 0.5902 0.5902 0.5640 0.5090 0.4524 0.4241 0.3959 0.3676 0.3382 0.3382 0.3382 0.2630 0.1879 0.1879 0.1879 0.1879 0.1879
Error 0.0329 0.0453 0.0500 0.0575 0.0633 0.0700 0.0717 0.0765 0.0765 0.0775 0.0791 0.0798 0.0796 0.0792 0.0784 0.0775 0.0775 0.0775 0.0763 0.0706 0.0706 0.0706 0.0706 0.0706
[95% Conf. 0.8227 0.7658 0.7373 0.6819 0.6286 0.5505 0.5247 0.4258 0.4258 0.3999 0.3464 0.2934 0.2679 0.2430 0.2187 0.1939 0.1939 0.1939 0.1294 0.0744 0.0744 0.0744 0.0744 0.0744
Int.] 0.9879 0.9631 0.9486 0.9168 0.8822 0.8258 0.8059 0.7221 0.7221 0.6991 0.6504 0.5987 0.5721 0.5450 0.5174 0.4884 0.4884 0.4884 0.4180 0.3410 0.3410 0.3410 0.3410 0.3410
Beg. Std. Interval Total Deaths Lost Survival Error [95% Conf. Int.] ------------------------------------------------------------------------------Controle 1 2 21 2 0 0.9048 0.0641 0.6700 0.9753 2 3 19 2 0 0.8095 0.0857 0.5689 0.9239 3 4 17 1 0 0.7619 0.0929 0.5194 0.8933 4 5 16 2 0 0.6667 0.1029 0.4254 0.8250 5 6 14 2 0 0.5714 0.1080 0.3380 0.7492 8 9 12 4 0 0.3810 0.1060 0.1831 0.5778 11 12 8 2 0 0.2857 0.0986 0.1166 0.4818 12 13 6 2 0 0.1905 0.0857 0.0595 0.3774 15 16 4 1 0 0.1429 0.0764 0.0357 0.3212 17 18 3 1 0 0.0952 0.0641 0.0163 0.2612 22 23 2 1 0 0.0476 0.0465 0.0033 0.1970 23 24 1 1 0 0.0000 . . . Tratamento 6 7 21 3 1 0.8537 0.0781 0.6119 0.9503 7 8 17 1 0 0.8034 0.0882 0.5573 0.9213 9 10 16 0 1 0.8034 0.0882 0.5573 0.9213 10 11 15 1 1 0.7480 0.0980 0.4952 0.8870 11 12 13 0 1 0.7480 0.0980 0.4952 0.8870 13 14 12 1 0 0.6857 0.1078 0.4257 0.8464 16 17 11 1 0 0.6234 0.1146 0.3631 0.8021 17 18 10 0 1 0.6234 0.1146 0.3631 0.8021 19 20 9 0 1 0.6234 0.1146 0.3631 0.8021 20 21 8 0 1 0.6234 0.1146 0.3631 0.8021 22 23 7 1 0 0.5343 0.1283 0.2651 0.7439 23 24 6 1 0 0.4453 0.1343 0.1864 0.6773 25 26 5 0 1 0.4453 0.1343 0.1864 0.6773 32 33 4 0 2 0.4453 0.1343 0.1864 0.6773 34 35 2 0 1 0.4453 0.1343 0.1864 0.6773 35 36 1 0 1 0.4453 0.1343 0.1864 0.6773 -------------------------------------------------------------------------------
Teste Log Rank Compara 2 ou mais curvas de sobrevida (H0 as curvas so "as mesmas") Ordena os tempo de "falhas" dos indivduos em 2 (ou mais) grupos e atribui postos O nmero esperado de falhas calculado para cada intervalo para cada grupo Calcula um 2 entre as falhas esperadas vs falhas observadas. Assume intervalo de tempo pequeno (ex: 1 dia ou 1 "falha").
log rank =
Teste Log Rank Statistics Survival analysis Summary statistics, test, & tables Test equality of survivor functions
estatstica
do
Var (O 2 E 2)
(O2 E 2)2
2 (G 1)
Onde:
(O 2 E 2) = (m2 j e2 j )
k
G = 2 grupos
k = nmero de tempos de falha diferentes G = nmero de grupos diferente Teste Log Rank Exemplo (usando o Stata):
. sts test grupo, logrank
. sts test lgwbccat, logrank
j =1
recidiva == 1 tempo
| Events Events grupo | observed expected -----------+------------------------Controle | 21 10.75 Tratamento | 9 19.25 -----------+------------------------Total | 30 30.00 chi2(1) = Pr>chi2 = 16.79 0.0000
. sts test
lgwbccat, peto
0.00 0
chi2(2) = Pr>chi2 =
26.39 0.0000
0.25
0.50
0.75
| Events Events lgwbccat | observed expected ---------+------------------------Low | 4 13.06 Medium | 10 10.72 :High | 16 6.21 ---------+------------------------Total | 30 30.00
10
failure _d: relapse == 1 analysis time _t: weeks Peto-Peto test for equality of survivor functions | Events Events Sum of lgwbccat | observed expected ranks ---------+-------------------------------------Low | 4 13.06 -5.4643843 Medium | 10 10.72 -1.2203977 :High | 16 6.21 6.6847821 ---------+-------------------------------------Total | 30 30.00 0 chi2(2) = Pr>chi2 = 21.37 0.0000
20 analysis time
30 lgwbccat = Medium
40
Estgio I:
Regresso de Cox
Modelo e Pressupostos
Modela os dados usando o hazard fora de morbidade ou mortalidade instantnea Pressuposto: Para qualquer tempo t, o hazard entre aqueles expostos a certo fator de risco [h1(t)] mltiplo de algum hazard de referncia [h0(t)] (o hazard entre os no expostos)
h1 (t ) = b e h 0 (t )
Log(HR) = b
Modelo de Hazard Proporcional de Cox Seja o conjunto de variveis explanatrias: X = (X1, X2, ..., Xp) h(t,X) = funo de hazard para uma pessoa com um conjunto de X's h0(t) = funo de hazard base ou basal
Informao geral: Modelo de Cox ou de Hazard proporcional chamado de modelo no paramtrico (ou semi-paramtrico) porque as distribuies subjacentes no so conhecidas Alternativa de modelo paramtrico correta, quando h0(t) conhecida.
i i
h(t , X ) = h0 (t )e X
h0(t) = no conhecida no modelo de Cox
Ex: exponencial, Weibull, Gompertz, etc. Modelo paramtrico prefervel se o modelo correto a ser usado conhecido Modelo de Cox d aproximadamente a mesma resposta do modelo paramtrico (robusto). Modelo de Cox o mais comumente utilizado
Observao: log odds basal no conhecido na regresso logstica para estudos caso controle).
Variveis no modelo de Cox: Varivel dependente Varivel evento X1, X2, ..., Xp E's V's W's Exemplo: exposio (es) confundidores potenciais modificadores de efeito potenciais tempo (at ocorrncia do evento ou censura) 1 = evento 0 = censura
Vantagens do modelo de Cox: til para avaliar o efeito das variveis explanatrias Variveis explanatrias podem ser contnuas ou categricas Pode incluir dados censurados No necessrio conhecimento da distribuio da funo de hazard subjacente (basal)
e X
i
h(t , X ) = h0 (t )e
Fornece mais informao do que o modelo logstico, particularmente para eventos no raros e/ou longos tempos de seguimento.
Obs: No h intercepto
Razo de Hazard Caso simples: 1 fator de risco trtment: 1 = tratamento experimental 0 = tratamento padro h(t,X) = h0(t)e(trtment) trtment = 1: trtment = 0: h(t,trtment) = h0(t)e(1) h(t,trtment) = h0(t)e(0)
Razo de Hazard Caso simples: 1 covarivel age: X1 = 50 X2 = 50 h(t,X) = h0(t)e(age) age = 50: age = 60: h(t,age) = h0(t)e(50) h(t,age) = h0(t)e(60)
h(t ,1) h0 (t )e (60) = = e (60 50) = e *10 (50) h(t ,0) h0 (t )e
Razo de Hazard ( HR ) =
Caso multivariado: (Varias variveis independentes) X* = conjunto de X's para uma pessoa X = conjunto de X's para outra pessoa
HR =
h0 (t , X *) ( X X ) =e h0 (t , X )
i * i i
HR = e
* * [ 1 ( X 1* X 1 ) + 2 ( X 2 X 2 ) +...+ k ( X k X k )]
Observao: anloga regresso logstica, mas possui uma razo de densidade incidncia instantnea em vez de log odds
Varivel Sexo (masc=1, fem=0) Fumo (sim=1, no=0) Idade55 (idade55=1, Idade<55=0) Hipertenso (sim=1, no=0) Hipercolesterolemia (sim=1, no=0) Obesidade (sim=1, no=0)
Semelhanas: CHD uma doena relativamente rara OR HR As perdas de follow-up e a distribuio dos tempos at a ocorrncia do evento so provavelmente no diferenciais entre os grupos (os vieses tendem a cancelar)