Você está na página 1de 14

Universidade Federal do Rio de Janeiro

NESC- Mestrado em Epidemiologia e Bioestatstica


Disciplina: Anlise de Regresso em Sade

Anlise de Sobrevida

Anlise de sobrevida
Definies:


Tipo de estudo  estudos de coorte ou ensaios clnicos

Varivel resposta  tempo transcorrido entre a entrada do


indivduo no estudo e a ocorrncia de um evento a ser relacionado
com a exposio ou tratamento.

Evento (falha )  pode ser doena, morte, cura etc.

Tempo de sobrevida:
 Medido para cada indivduo, desde sua entrada no estudo at a
ocorrncia do "evento" (falha).
 Indivduos podem entrar no estudo em qualquer perodo
durante o tempo do estudo.

Tania Guilln de Torres


Rejane Sobrino Pinheiro

 Tempo pode ser medido em qualquer unidade


 dias, semanas, meses, etc.

Anlise de sobrevida

Nesta seo sero apresentadas tcnicas de analise de tempos de


sobrevida para o caso de um nico desfecho de interesse.
Exemplos de aplicao:
 Tempo de remisso, em semanas, para pacientes com Leucemia.

 Tempo at a ocorrncia do evento


 Mtodos especiais de anlise
 Distribuio dos tempos no gaussiana

 Tempo, em anos, at a ocorrncia de doena coronariana, numa corte de


indivduos sem doena.
 Tempo, em anos, at a morte numa populao de idosos (>60 anos)
 Tempo (meses) at morte em pacientes transplantados.

 Dados com censura


Observao:
possvel avaliar simultaneamente a ocorrncia de vrios desfechos num nico
desenho de estudo, por exemplo mortes por Cncer em mulheres (Ca. de colo
uterino, Ca. Mama, etc.). Podem ser abordados como um problema de Riscos
Competitivos, porem este tpico no faz parte da disciplina.

Dado censurado:

Censura

 Indivduo no sofre o "evento" durante o perodo de estudo, de


modo que o tempo exato de sobrevida no conhecido.

Pacientes de Leucemia em remisso

 Censura devida a:

 O indivduo no experimenta o evento antes do fim do


estudo (estudo termina antes da ocorrncia do evento)
 Perda de follow-up (seguimento) durante o perodo do
estudo
 Sada do estudo por causa de bito (por outra causa), ou por
outra razo (reao adversa droga)

Incio do
estudo

Fim do
estudo

Tempo de sobrevida censurado, observado no estudo

 Indivduos podem entrar no estudo em qualquer instante depois


do incio do estudo e pode ser censurado em qualquer instante
de tempo durante o estudo.

Dados censurados

Tempo de sobrevida verdadeiro

Exemplo: Leucemia


Comparar os tempos de remisso, de um grupo de pacientes com


leucemia tratados com a droga 6-mercaptopurine com os tempos
de remisso de um grupo controle no tratado.

Desfecho (evento)  recidiva (recada)

Tempo de sobrevida  nmero de semanas em remisso

Grupo controle:
1 1 2 2 3 4 4 5 5 8 8 8 8 11 11 12 12 15 17 22 23
Grupo tratado:
6* 6 6 6 7 9* 10* 10 11* 13 16 17* 19* 20* 22 23 25* 32* 32* 34* 35*

* = follow-up incompleto (censura)

Grupo tratado:

Como comparar os tempos:

6* 6 6 6 7 9* 10* 10 11* 13 16 17* 19* 20* 22 23 25* 32* 32* 34* 35*

1: Controle
Obs Tempo recidiva Grupo
1
1
1
1
2
1
1
1
3
2
1
1
4
2
1
1
5
3
1
1
6
4
1
1
7
4
1
1
8
5
1
1
9
5
1
1
10
8
1
1
11
8
1
1
12
8
1
1
13
8
1
1
14
11
1
1
15
11
1
1
16
12
1
1
17
12
1
1
18
15
1
1
19
17
1
1
20
22
1
1
21
23
1
1

2:Tratamento
Obs Tempo recidiva Grupo
0
2
22
6
23
6
1
2
24
6
1
2
25
6
1
2
26
7
1
2
27
9
0
2
28
10
0
2
29
10
1
2
30
11
0
2
31
13
1
2
32
16
1
2
33
17
0
2
34
19
0
2
35
20
0
2
36
22
1
2
37
23
1
2
38
25
0
2
39
32
0
2
40
32
0
2
41
34
0
2
42
35
0
2

Interpretao:
6*  indivduo ainda em remisso
depois de 6 semanas no estudo, e
no observado aps este tempo.
6  indivduos conhecidos como em
remisso por 6 semanas, mas
tiveram recada entre a 6a. e a
7a. semanas.
Observar:
 Nenhuma censura no grupo
controle (todos "falharam")
 Parece que o tempo de sobrevida
maior para os do grupo tratado

Problema: tempos censurados podem enviesar os resultados


Alternativas:
1. Excluir tempos censurados

 Tempo de sobrevida pelo tratamento muito baixo, por excluir


os tempos de remisso mais longos (subestimar).
2. Incluir tempos censurados


Ignorar a diferena entre evento e censura. Indivduos com os


tempos de sobrevida censurados tem atualmente tempos de
sobrevida maiores do que as semanas representadas no estudo

Stata:

Stata:

2 - Declarar um banco para Anlise de Sobrevida

1 Abrir o banco
File  Open..  diretrio 

 Mdia ou mediana do tempo de remisso para cada grupo,


ignorando a condio de censura ( ttrt = 17,1 e tcontrole = 8,7 )

banco

. use C:\Data\leucemia.dta"

Statistics  Survival analysis  Setups & utilities


 Declare data to be survival-time data

. desc
Contains data from E:\Regressao\Sobrevida\AulaPratica\Bancos\leucemia.dta
obs:
42
vars:
4
11 Nov 2009 10:20
size:
336 (99.9% of memory free)
----------------------------------------------------------------------------storage display
value
variable name
type
format
label
variable label
----------------------------------------------------------------------------obs
byte
%8.0g
Obs
tempo
byte
%8.0g
Tempo ate a recaida
recidiva
byte
%8.0g
recidiva
Retorno da doenca
grupo
byte
%8.0g
grp
Grupos de comparacao
----------------------------------------------------------------------------Sorted by:

Comando stset vartempo varcensura


 Declara o banco como sendo um banco com tempos de sobrevida

Funo de sobrevida:

Stata:

S(t) = P(T > t)


T  varivel aleatria  tempo de sobrevida de um indivduo
t  qualquer valor de interesse para a varivel aleatria T

. stset tempo, failure(recidiva==1)


failure event:
obs. time interval:
exit on or before:

recidiva == 1
(0, tempo]
failure

-----------------------------------------------------------------------------42 total obs.


0 exclusions
-----------------------------------------------------------------------------42 obs. remaining, representing
30 failures in single record/single failure data
541 total analysis time at risk, at risk from t =
0
earliest observed entry t =
0
last observed exit t =
35

Ex: Se estamos interessados em avaliar se uma pessoa sobrevive


mais de 5 anos aps submeter-se a tratamento para cncer
S(5) = P(T > 5)
A funo de sobrevida d a probabilidade de uma pessoa viver
mais do que um tempo especfico t = 5.
Isto , S(T) d a probabilidade de um indivduo sobreviver alm do
tempo t (probabilidade de uma varivel aleatria T exceder um
determinado valor especificado (t).

Teoricamente, como t varia de 0 a , a funo de sobrevida decai.

Grupo controle (nenhuma censura):

Se no houver censura:

1 1 2 2 3 4 4 5 5 8 8 8 8 11 11 12 12 15 17 22 23

S (t ) =

N sobreviventes alm de 10 semanas

N de indivduos que sobreviveram mais do que t


N total de indivduos

S (10) =

A funo decrescente, ou seja, os valores de S(t) decrescem


medida que t cresce.
Para t = 0  S(t) = = S(0) = 1
Para t =  S(t) = 0

8
= 0.381
21

Probabilidade de sobrevida alm de 10 semanas

N total de indivduos

N sobreviventes alm de 22 semanas

Sempre
decrescente

S(t)

0 S(t) 1
0

S ( 22) =

1
= 0.048
21

Probabilidade de sobrevida alm de 22 semanas

N total de indivduos

Probabilidade de sobrevida para o grupo controle:

Probabilidade de sobrevida para o grupo controle:

t: 1 1 2 2 3 4 4 5 5 8 8 8 8 11 11 12 12 15 17 22 23
mt = n de falhas no instante t.

S (t ) =

P(D1)=2/21

21

N de sobreviventes no instante t
n
m t a c u m u la d a

S (t)

0
1
2
3
4
5
8
11
12
15
17
22
23

0
2
2
1
2
2
4
2
2
1
1
1
1

0
2
4
5
7
9
13
15
17
18
19
20
21

( 2 1 - 0 ) /2 1 = 2 1 /2 1 = 1 .0 0
( 2 1 - 2 ) /2 1 = 1 9 /2 1 = 0 .9 1
( 2 1 - 4 ) /2 1 = 1 7 /2 1 = 0 .8 1
( 2 1 - 5 ) /2 1 = 1 6 /2 1 = 0 .7 6
( 2 1 - 7 ) /2 1 = 1 4 /2 1 = 0 .6 7
( 2 1 - 9 ) /2 1 = 1 2 /2 1 = 0 .5 7
( 2 1 - 1 3 ) /2 1 = 8 /2 1 = 0 .3 8
( 2 1 - 1 5 ) /2 1 = 6 /2 1 = 0 .2 9
( 2 1 - 1 7 ) /2 1 = 4 /2 1 = 0 .1 9
( 2 1 - 1 8 ) /2 1 = 3 /2 1 = 0 .1 4
( 2 1 - 1 9 ) /2 1 = 2 /2 1 = 0 .1 0
( 2 1 - 2 0 ) /2 1 = 1 /2 1 = 0 .0 5
( 2 1 - 2 1 ) /2 1 = 0 /2 1 = 0 .0 0

D2
(2)

S1
(19)

1/17
17/19

mt

D3
(1)

S2
(17)

P(S2| S1)

2/16
16/17

21 - 0
= 1.00
21
19 19
= 1
=
= 0.91
21 21
19 17 17
=

=
= 0.81
21 19 21
19 17 16
16
=

=
= 0.76
21 19 17
21
19 17 16 14 14
=

=
= 0.67
21
21 19 17 16

S(0) =
S(1)
S(2)
S(3)
S(4)

Curva de sobrevida:
a representao grfica da Funo de sobrevida S(t) no eixo vertical vs. os
tempos de sobrevida (t) no eixo horizontal

D4
(2)

S3
(16)
14/16

t: 1 1 2 2 3 4 4 5 5 8 8 8 8 11 11 12 12 15 17 22 23

S4
(15)

P(S4) = P(S1)P(S2| S1)P(S3| S2 S1) P(S4| S1 S2 S3)

Funo de Hazard (risco)


 Densidade instantnea de incidncia
Risco instantneo

P[t < T < (t + t ) | T > t ]


t 0
t

h(t ) = lim

Kaplan-Meier survival estimate

0.75

1.00

2/19
P(S1)=19/21

Taxa de falha condicional

0.25

0.50

Taxa de falha instantnea (falha durante um intervalo de tempo


bem pequeno de amplitude t, dado que um indivduo tenha
sobrevivido at o incio do intervalo) / t).

Funo de Hazard:

0.00

S(t)

D1
(2)

10
15
analysis time

20

25

(t)

h(t ) =

N de indivduos que morreram por unidade de tempo no intervalo (t, t + t)


N sobreviventes no instante t

Exemplo:

Stata:

h(t) para dados de leucemia (grupo tratado), com t = 1

Statistics

6* 6 6 6 7 9* 10* 10 11* 13 16 17* 19* 20* 22 23 25* 32* 32* 34* 35*





Survival analysis
Summary statistics, test, & tables
Summarize survival-time data

n de recidivas no instante de tempo 6

h ( 6) =

3
= 0.143
21
n sob risco no incio do intervalo de tempo 6

n de recidivas no instante de tempo 7


. stsum

1
h(7) = = 0.059
17

failure _d:
analysis time _t:

n sob risco no incio do intervalo de tempo 7

Calcular o hazard - Risco instantneo dos tempos

. stsum, by(trtment)
failure _d:
analysis time _t:

relapse == 1
weeks

|
incidence
no. of
|------ Survival time -----|
trtment | time at risk
rate
subjects
25%
50%
75%
---------+--------------------------------------------------------------------0:stand |
182
.1153846
21
4
8
12
1:trt |
359
.0250696
21
13
23
.
---------+--------------------------------------------------------------------total |
541
.0554529
42
6
12
23

recidiva == 1
tempo

|
incidence
no. of
|------ Survival time -----|
| time at risk
rate
subjects
25%
50%
75%
---------+--------------------------------------------------------------------total |
541
.0554529
42
6
12
23

Funo de Hazard acumulada


Graphics 
Survival analysis graphs

Survivor & cumulative hazard functions

1.00

Kaplan-Meier survival estimate

Funo de Hazard acumulada


Graphics 
Survival analysis graphs

Survivor & cumulative hazard functions

0.00

0.25

0.50

0.75

. sts graph
failure _d: relapse == 0 1
analysis time _t: weeks

10

40

0.00

0.25

0.50

0.75

failure _d: relapse == 0 1


analysis time _t: weeks

30

Kaplan-Meier survival estimates, by trtment

1.00

. sts graph, by( trtment)

20
analysis time

10

20
analysis time
trtment = 0:stand

Funo de Hazard acumulada

0.00

1.00

2.00

3.00

4.00

Nelson-Aalen cumulative hazard estimates, by grupo

10

20
analysis time

grupo = Controle

30
grupo = Tratamento

. sts graph, by(grupo) na


failure _d:
analysis time _t:

recidiva == 1
tempo

40

30
trtment = 1:trt

40

Funo de sobrevida - dados censurados

Funo de sobrevida - dados censurados

S(t) pode ser derivada de uma funo h(t) para dados censurados

d6
(3)
3/21

S(0) = 1 - h(0)
S(1) = [1-h(0)] x [1 - h(1)]
S(2) = [1-h(0)] x [1 - h(1)] x [1 - h(2)]

C6
(1)

21

d7
(1)

1/17

S(t) = [1-h(0)] x [1 - h(1)] x ... x [1 - h(t)]

C7

S6
(17)

d10

(0)

(1)

Ou:

1/16
16/17

21 - 0
P(S7| S6)
= 1.00
21
3
S(6) = 1 (1 ) = 0.86
21
3
1
S(7) = 1 (1 ) (1 - ) = 0.806
21
17

S(0) = 1 - h(0)
S(1) = S(0) x [1 - h(1)]
S(2) = S(1) x [1 - h(2)]
S(3) = S(2) x [1 - h(3)]

S(0) =

S7

C10

(16)

(2)

S10
(13)



S(t) = S(t-1) x [1 - h(t)]


Exemplo:

Mtodo de Kaplan-Meier

Grupo tratado: 6* 6 6 6 7 9* 10* 10 11* 13 16 17* 19* 20* 22 23 25* 32* 32* 34* 35*

Chama-se de tabela de vida a uma tabela de probabilidades de


sobrevivncia acumuladas no perodo estudado e de curva de
sobrevida ao grfico destas probabilidades versus o tempo de
sobrevivncia.

nj
21
21

mj
0
0

qj
0
0

H(t) = mt
0 / 21 = .000
0 / 21 = .000

S(t) = S(t-1) x [1 h(t)]


1.0 x [ 1 0]
= 1.00
1.0 x [ 1 0]
= 1.00
Kaplan-Meier survival estimate

21
17
16
16
15

3
1
0
0
1

1
0
0
1
1

3 / 21 = .143
1 / 17 = .059
0 / 16 = .000
0 / 16 = .000
1 / 15 = .067

1.0 x [ 1 0.143] = 0.857


.857 x [1 - .059] = .806
.806 x [1 0]
= .806
.806 x [1 0]
= .806
.806 x [1 0.067] = .752

[13-14)

12

1 / 12 = .083

.752 x [1 - .083] = .690

0.25

[16-17)

11

1 / 11 = .091

.690 x [1 - .091] = .627

0.75

[6-7)
[7-8)
[8-9)
[9-10)
[10-11)

0.00

1.00

tj
[0-1)
[1-2)

0.50

As probabilidades acumuladas de
sobrevida nos perodos so:

[22-23)
[23-24)
[24-25)

7
6
5

1
1
0

0
0
0

1 / 7 = .143
1 / 6 = .167
0 / 5 = .000

.627 x [1 - .143] = .537


.537 x [1 - .167] = .447
.447 x [1 0]
= .447

[35-36)

0 / 1 = .000

.447 x [1 0]

10

20
analysis time

30

P(S ao 1 ano) = P(S1) = 0,87


P(S ao 2 ano) = P(S1)*P(S2/ S1) = 0,67
P(S ao 3 ano) = P(S1)*P(S2/ S1)* P(S3/ S1 S2)
= 0,60

40

1
0.92

= .447
0.9

0.9

0.87

0.87

[1-2) = 1 semana a < 2 semanas


nt = sob risco; mt = recidivas; qt = censurado
Somente tem-se que calcular S(t) p/ valores de t onde 1 ou + falhas ocorram (mt).

0.77

0.8

0.8

0.71
0.7

0.7

0.67

0.67

0.6
0.6

0.6
0.6
0

0.5
0

Stata:
Statistics

Tabelas de Vida


Tempos de sobrevida agrupados em intervalos.

Kaplan-Meier uma verso modificada da tabela de vida





Survival analysis
Summary statistics, test, & tables
Life tables for survival data

 KM usa tempos exatos de "falha" ou intervalos de tempo


curtos
 KM tem poucos ou nenhum empate nos tempos de "falha"

. ltable tempo recidiva, survival by(grupo)

ltable tempo recidiva, survival


Interval
Total
Deaths
Lost
1
2
42
2
0
2
3
40
2
0
3
4
38
1
0
4
5
37
2
0
5
6
35
2
0
6
7
33
3
1
7
8
29
1
0
8
9
28
4
0
9 10
24
0
1
10 11
23
1
1
11 12
21
2
1
12 13
18
2
0
13 14
16
1
0
15 16
15
1
0
16 17
14
1
0
17 18
13
1
1
19 20
11
0
1
20 21
10
0
1
22 23
9
2
0
23 24
7
2
0
25 26
5
0
1
32 33
4
0
2
34 35
2
0
1
35 36
1
0
1

Survival
0.9524
0.9048
0.8810
0.8333
0.7857
0.7132
0.6886
0.5902
0.5902
0.5640
0.5090
0.4524
0.4241
0.3959
0.3676
0.3382
0.3382
0.3382
0.2630
0.1879
0.1879
0.1879
0.1879
0.1879

Error
0.0329
0.0453
0.0500
0.0575
0.0633
0.0700
0.0717
0.0765
0.0765
0.0775
0.0791
0.0798
0.0796
0.0792
0.0784
0.0775
0.0775
0.0775
0.0763
0.0706
0.0706
0.0706
0.0706
0.0706

[95% Conf.
0.8227
0.7658
0.7373
0.6819
0.6286
0.5505
0.5247
0.4258
0.4258
0.3999
0.3464
0.2934
0.2679
0.2430
0.2187
0.1939
0.1939
0.1939
0.1294
0.0744
0.0744
0.0744
0.0744
0.0744

Int.]
0.9879
0.9631
0.9486
0.9168
0.8822
0.8258
0.8059
0.7221
0.7221
0.6991
0.6504
0.5987
0.5721
0.5450
0.5174
0.4884
0.4884
0.4884
0.4180
0.3410
0.3410
0.3410
0.3410
0.3410

Beg.
Std.
Interval
Total
Deaths
Lost
Survival
Error
[95% Conf. Int.]
------------------------------------------------------------------------------Controle
1
2
21
2
0
0.9048
0.0641
0.6700
0.9753
2
3
19
2
0
0.8095
0.0857
0.5689
0.9239
3
4
17
1
0
0.7619
0.0929
0.5194
0.8933
4
5
16
2
0
0.6667
0.1029
0.4254
0.8250
5
6
14
2
0
0.5714
0.1080
0.3380
0.7492
8
9
12
4
0
0.3810
0.1060
0.1831
0.5778
11
12
8
2
0
0.2857
0.0986
0.1166
0.4818
12
13
6
2
0
0.1905
0.0857
0.0595
0.3774
15
16
4
1
0
0.1429
0.0764
0.0357
0.3212
17
18
3
1
0
0.0952
0.0641
0.0163
0.2612
22
23
2
1
0
0.0476
0.0465
0.0033
0.1970
23
24
1
1
0
0.0000
.
.
.
Tratamento
6
7
21
3
1
0.8537
0.0781
0.6119
0.9503
7
8
17
1
0
0.8034
0.0882
0.5573
0.9213
9
10
16
0
1
0.8034
0.0882
0.5573
0.9213
10
11
15
1
1
0.7480
0.0980
0.4952
0.8870
11
12
13
0
1
0.7480
0.0980
0.4952
0.8870
13
14
12
1
0
0.6857
0.1078
0.4257
0.8464
16
17
11
1
0
0.6234
0.1146
0.3631
0.8021
17
18
10
0
1
0.6234
0.1146
0.3631
0.8021
19
20
9
0
1
0.6234
0.1146
0.3631
0.8021
20
21
8
0
1
0.6234
0.1146
0.3631
0.8021
22
23
7
1
0
0.5343
0.1283
0.2651
0.7439
23
24
6
1
0
0.4453
0.1343
0.1864
0.6773
25
26
5
0
1
0.4453
0.1343
0.1864
0.6773
32
33
4
0
2
0.4453
0.1343
0.1864
0.6773
34
35
2
0
1
0.4453
0.1343
0.1864
0.6773
35
36
1
0
1
0.4453
0.1343
0.1864
0.6773
-------------------------------------------------------------------------------

Teste Log Rank


 Compara 2 ou mais curvas de sobrevida (H0  as curvas so "as
mesmas")
 Ordena os tempo de "falhas" dos indivduos em 2 (ou mais)
grupos e atribui postos
 O nmero esperado de falhas calculado para cada intervalo para
cada grupo
 Calcula um 2 entre as falhas esperadas vs falhas observadas.
 Assume intervalo de tempo pequeno (ex: 1 dia ou 1 "falha").
estatstica

do

log rank =

(O2 E 2)2

Var (O 2 E 2)

Teste Log Rank


Statistics





Survival analysis
Summary statistics, test, & tables
Test equality of survivor functions

2
(G 1)

Onde:

(O 2 E 2) = (m2 j e2 j )

G = 2 grupos

j =1

k = nmero de tempos de falha diferentes


G = nmero de grupos diferente
Teste Log Rank

Teste Log Rank

Exemplo (usando o Stata):

Exemplo (usando o Stata):

. sts test grupo, logrank


. sts test lgwbccat, logrank

recidiva == 1
tempo

failure _d: relapse == 1


analysis time _t: weeks

|
Events
Events
grupo
| observed
expected
-----------+------------------------Controle
|
21
10.75
Tratamento |
9
19.25
-----------+------------------------Total
|
30
30.00
chi2(1) =
Pr>chi2 =

16.79
0.0000

chi2(2) =
Pr>chi2 =

. sts test trtment, peto


failure _d: relapse == 1
analysis time _t: weeks

. sts test

26.39
0.0000

lgwbccat, peto

Peto-Peto test for equality of survivor functions

chi2(1) =
Pr>chi2 =

14.08
0.0002

|
Events
Events
Sum of
lgwbccat | observed
expected
ranks
---------+-------------------------------------Low
|
4
13.06
-5.4643843
Medium
|
10
10.72
-1.2203977
:High
|
16
6.21
6.6847821
---------+-------------------------------------Total
|
30
30.00
0
chi2(2) =
Pr>chi2 =

1.00
0.75
0

failure _d: relapse == 1


analysis time _t: weeks
Peto-Peto test for equality of survivor functions

|
Events
Events
Sum of
trtment | observed
expected
ranks
--------+-------------------------------------0:stand |
21
10.75
6.3622095
1:trt
|
9
19.25
-6.3622095
--------+-------------------------------------Total
|
30
30.00
0

0.50

|
Events
Events
lgwbccat | observed
expected
---------+------------------------Low
|
4
13.06
Medium
|
10
10.72
:High
|
16
6.21
---------+------------------------Total
|
30
30.00

Log-rank test for equality of survivor functions

Kaplan-Meier survival estimates, by lgwbccat

0.25

Log-rank test for equality of survivor functions

0.00

failure _d:
analysis time _t:

21.37
0.0000

10

20
analysis time

lgwbccat = Low
lgwbccat = :High

30
lgwbccat = Medium

40

Exemplo:
Sobrevida de mulheres com cncer cervical aps a data do diagnstico

Tabelas de vida
Funo de Hazard (Mtodo atuarial):
h(t ) =

Estgio I:

No. de indivduos que morrem por unidade de tempo no intervalo


1
No. sobreviventes no instante t (No. de censuras no intervalo)
2

nt = sob risco; mt = mortes ; qt = censuras

Anlise de sobrevida - Modelagem

Regresso de Cox

 Como ajustar as curvas de sobrevida do grupo de tratados


(expostos) para um ou mais fatores (confundidores)?
1 confundidor:

Modelo e Pressupostos
Modela os dados usando o hazard fora de morbidade ou
mortalidade instantnea
Pressuposto:

1. Categorizar e comparar as curvas de sobrevida.


Exemplo: tratamento = 1 e idade > 55
tratamento = 1 e idade 55
tratamento = 0 e idade > 55
tratamento = 0 e idade 55
2. Categorizar e usar o teste log rank.
3. Usar um modelo matemtico (existem vrios)

Para qualquer tempo t, o hazard entre aqueles expostos a certo


fator de risco [h1(t)] mltiplo de algum hazard de referncia
[h0(t)] (o hazard entre os no expostos)

h1(t) = h0(t) * B
h1(t) = h0(t) * e b

Mais de 1 confundidor:
Modelagem matemtica a escolha mais razovel.

Modelo de Hazard Proporcional de Cox

HR =

h1 (t ) = b
e 
h 0 (t )

Log(HR) = b

Informao geral:

Seja o conjunto de variveis explanatrias: X = (X1, X2, ..., Xp)


h(t,X) = funo de hazard para uma pessoa com um conjunto de X's

 Modelo de Cox ou de Hazard proporcional chamado de


modelo no paramtrico (ou semi-paramtrico) porque as
distribuies subjacentes no so conhecidas
 Alternativa de modelo paramtrico correta, quando h0(t)
conhecida.

h0(t) = funo de hazard base ou basal

h(t , X ) = h0 (t )e X
i

Ex: exponencial, Weibull, Gompertz, etc.

h0(t) = no conhecida no modelo de Cox

 Modelo paramtrico prefervel se o modelo correto a ser usado


conhecido

Observao: log odds basal no conhecido na regresso logstica


para estudos caso controle).

 Modelo de Cox d aproximadamente a mesma resposta do


modelo paramtrico (robusto).
 Modelo de Cox o mais comumente utilizado

Variveis no modelo de Cox:

Vantagens do modelo de Cox:

 Varivel dependente  tempo (at ocorrncia do evento ou censura)


 Varivel evento
 1 = evento
0 = censura
 X1, X2, ..., Xp

 til para avaliar o efeito das variveis explanatrias

E's  exposio (es)


V's  confundidores potenciais
W's  modificadores de efeito potenciais

 Variveis explanatrias podem ser contnuas ou categricas


 Pode incluir dados censurados
 No necessrio conhecimento da distribuio da funo de
hazard subjacente (basal)


Exemplo:

h(t , X ) = h0 (t )e

[ ( trtment ) + 1 (log wbcc )+ 2 ( idade )+ 1 ( trt x wbc )+ 2 ( trt x idade )]

e X
i

sempre 0 (apropriado para uma taxa)

 Fornece mais informao do que o modelo logstico,


particularmente para eventos no raros e/ou longos tempos de
seguimento.

Obs: No h intercepto

Razo de Hazard

Razo de Hazard

Caso simples: 1 fator de risco

Caso simples: 1 covarivel

trtment:

age:

1 = tratamento experimental
0 = tratamento padro
h(t,X) = h0(t)e(trtment)

X1 = 50
X2 = 50
h(t,X) = h0(t)e(age)

trtment = 1:

h(t,trtment) = h0(t)e(1)

age = 50:

h(t,age) = h0(t)e(50)

trtment = 0:

h(t,trtment) = h0(t)e(0)

age = 60:

h(t,age) = h0(t)e(60)

h(t ,1) h0 (t )e (1)


Razo de Hazard ( HR ) =
=
= e (10 ) = e
(0)
h(t ,0) h0 (t )e

Razo de Hazard ( HR ) =

h(t ,1) h0 (t )e (60)


=
= e (60 50) = e *10
(
50
)

h(t ,0) h0 (t )e

Caso multivariado: (Varias variveis independentes)


X* = conjunto de X's para uma pessoa
X = conjunto de X's para outra pessoa

HR =

h0 (t , X *) ( X X )
=e
h0 (t , X )

HR = e

*
i

[ 1 ( X 1* X 1 ) + 2 ( X 2* X 2 ) +...+ k ( X k* X k )]

Observao: anloga regresso logstica, mas possui uma razo de


densidade incidncia instantnea em vez de log odds

Resultado da Regresso de cox dos preditores da incidncia de doena


coronariana, 3597 indivduos entre 45 e 65 anos, 1987 a 1994. Washington1

Varivel
Sexo (masc=1, fem=0)
Fumo (sim=1, no=0)
Idade55 (idade55=1,
Idade<55=0)
Hipertenso (sim=1, no=0)
Hipercolesterolemia (sim=1,
no=0)
Obesidade (sim=1, no=0)

Coeficiente b1
1.2669
0.6803
0.1391

Hazard Ratio
3.55
1.97
1.15

0.5030
0.4552

1.65
1.58

0.1876

1.21

Semelhanas:
 CHD uma doena relativamente rara OR HR
 As perdas de follow-up e a distribuio dos tempos at a
ocorrncia do evento so provavelmente no diferenciais
entre os grupos (os vieses tendem a cancelar)

Você também pode gostar