Você está na página 1de 8

Biometrics 68, 113-120 DOI: 10,1111 / j.1541-0420.2011.01640.

x
março 2012

Ele Estimation and Survival Relativa

Maja Pohar Perm 1 * Janez Stare, 1 e Jacques Est`eve 2


1 Departamento de Bioestatística e Informática Médica, Universidade de Ljubljana, Vrazov trg 2, SI-1000 Ljubljana,

Eslovenia
2 Universit'e Claude Bernard, Hospices Civils de Lyon, Serviço de Biostatistique, 162, Avenue Lacassagne 69424

Lyon Cedex 03, França


* e-mail: maja.pohar@mf.uni-lj.si

Resumo. Estimativa de sobrevivência relativa tornou-se o primeiro e o passo mais básico Ao relatar as estatísticas de sobrevivência de câncer. Estimadores são de uso normal e
de rotina por todos os registros de câncer. No entanto, foi recentemente observado Estes estimadores que não fornecem informações sobre mortalidade por câncer, que é
independente da mortalidade nacional população em geral. Thüsen Eles não são adequados para a comparação entre os países. Além disso, a interpretação utilizada da curva
de sobrevivência relativa é vago e enganosa. O presente artigo tenta remediar estes problemas básicos. As quantidades de população dos estimadores tradicionais são
cuidadosamente descritas discutido e sua interpretação. Nós, então, propor um novo estimador da probabilidade de sobrevivência rede que permite a comparabilidade desejado
entre os países. O novo estimador não requer modelagem e é acompanhado com uma estimativa simples de variância. Os métodos são descritos em reais, bem como dados
simulados.

Palavras-chave: padronização idade; dados de registo de cancro; Competindo Riscos; sobrevivência Net; sobrevivência relativa; análise de sobrevivência.

1. Introdução perigo observado é večja que o perigo população. Partindo deste

A probabilidade de sobrevida de pacientes com câncer tem sido usada por muitos pressuposto, usamos o termo excesso de risco para o perigo devido à

anos como uma das principais ferramentas para avaliação dos avanços terapêuticos. doença e temos a relação

Com melhores tratamentos e prognóstico, estudos frequentemente agora têm longos


tempos de seguimento e é comum ter uma proporção substancial de mortes por
Observado de risco = perigo + população excesso de perigo.
causas que não o câncer Sob estudo. Na situação normal, a causa da morte não está
(1)
disponível ou não confiável. Assim o campo de sobrevivência relativa desenvolveu e
que observou mortes são comparados com os das tabelas de vida da população em
Uma função de sobrevivência derivado do excesso de perigo sozinho é
geral esperado.
denominado o sobrevivência net.

Podemos distinguir dois objetivos: Neste artigo, vamos nos concentrar em três estimadores deve e uso generalizado e
sobrevivência relativa. Nós enviamos tem essa LHES AS Ederer I (Ederer, Axtell, e
(1) Este comparar a sobrevivência Observado ( o sobre ) para a sobrevivência
Cutler, 1961), Hakulinen (Hakulinen, 1982), e Ederer II (Ederer, et al., 1961, p. 110) e
de um grupo livre de doença possuindo as mesmas características
de fi não-los e Seção 3 abaixo.
demográficas como o grupo de estudo. Se a população em geral ESPERADO
sobrevivência é o P , A comparação é feita utilizando a razão
Embora todos os três foram propostos como variantes para estimar o denominador
do rácio de sobrevivência relativa, também Eles foram interpretados como
estimadores de sobrevivência net. Vamos mostrar que este não é geralmente
o R ( t) = S sobre ( t), S P ( t) . correcta. Quando o excesso e o perigo população não são uma ff ete por qualquer
co-variáveis ​comuns, todos os métodos a serem discutidos neste artigo estimar a
Esta foi nomeado o taxa de sobrevivência relativa. mesma quantidade população. Na prática, no entanto, o excesso de perigo quase
(2) Esta sobrevivência estimativa e a situação hipotética em que sempre depende de variáveis ​demográficas (eg, idade) e um dos objetivos deste
Em estudo a doença costuma ser a única causa possível da morte. artigo é às quantidades população que os avaliadores estão estimando fi nd e tais
situações (secções 2 e 3).
Esta estimativa é possível graças a decomposição do risco observado em
perigo devido à doença e que, devido a outras causas. Esta decomposição
pode ser realizada se o tempo até a morte devido à doença eo tempo até a Embora o conceito de sobrevivência líquida pode parecer muito hipotético de
morte devido a outras causas são condicionalmente independentes dado um interesse, por si só, torna-se crucial quando se tenta comparar carga de câncer entre
conjunto conhecido de co-variáveis. Em seguida, assumir que o perigo devido os países, Porque é independente da mortalidade da população em geral. Até agora,
a outras causas é dado pela população e mortalidade, portanto, que a a maioria dos autores que produziram grandes conjuntos de estatísticas de
sobrevivência (Sant et al., 2009 e referências citadas)

©C 2011 A Sociedade Internacional Biometric 113


114 Biometrics, de março 2012

Calculamos sobrevivência relativa idade padronizada usando o método Hakulinen, Que assumem a doença é "raro", ou seja, a remoção de que a doença de interesse a partir
uma variante do método e Ederer um método ad hoc de padronização. Tem-se de tabelas de vida da população não teria insignificante Effect on λ Pi . Isso pode lançar luz
observado recentemente que esta abordagem produz preconceitos e incoerências, sobre alguns dos conceitos, devemos também mencionar o causar-especí configuração c
mas um bom método para correção destas deficiências ainda não foi proposto fi, Onde é conhecida a causa da morte.
(Pokhrel e Hakulinen, 2009). Uma solução óbvia para o problema da comparabilidade
é usar modelos multivariados que permitem a estimativa do excesso de risco e grupos o sobrevivência net é a sobrevivência associada com o O excesso de perigo (líquido) trabalhando
homogêneos e curvas de sobrevida, em seguida, a média obtida. maneiras comuns sozinho
para modelar o excesso de risco incluem assumindo riscos proporcionais ou com um
P (T <T E ≤ t + Δ t | T E > t)
paramétrico (Hakulinen e Tenkanen, 1987;. Est`eve et al, 1990;. Dickman et al, 2004;. λ E ( t) = lim . (2)
Δt→0 Δt
Nelson et al, 2007) ou não paramétrica (saxões, 1996; Pohar Perm Henderson, e Old,
2009) o excesso de risco de base, ou adotar um modelo totalmente aditivo Após Aalen Usando a relação entre o risco e função de sobrevivência, a função de rede de
sobrevivência para um indivíduo é definida como o E i ( t) = exp { - ∫ t
(Zahl e Aalen de 1998 Aalen, Borgan, e Gjessing, 2008; e Cortese Scheike, 2008).
Qualquer modelagem Essa abordagem inclui é de depende da validade das 0 λ E i ( u) du} eo geral (marginal)
suposições feitas no modelo de curso. O principal objetivo deste artigo é apresentar sobrevivência líquido iguale o E ( t) = ( 1 / N) Σ N
i=1 o E i ( t). a asso-
um novo estimador de sobrevivência rede que não requer modelagem. Fazemos isso perigo ated λ E Que corresponde a essa quantidade, ou seja,
e Secções 4 e quinto {-∫t }
o E ( t) = exp λ E ( u) du , (3)
0

é dado pela

ΣN
o E i ( t) λ E i ( t)
i=1
λ E ( t) = . (4)
2. Valores da população ΣN
Estudaremos a população de Quantidades de juros e de sobrevivência relativa. o E i ( t)
Primeiro, apresentamos alguma notação. i=1

Assumindo que o modelo de aditivo (1) para cada indivíduo e e da coorte doente,
O perigo para a sobrevivência global líquida (3) é Thüsen uma média ponderada dos
podemos de fi T Ei este era o momento de morte devido à doença de interesse, T Pi este perigos individuais, com pesos iguais à probabilidade de que um indivíduo ainda está
era o momento de morte devido a outras causas operacionais e da população em vivo eo mundo hipotético da doença ser a única causa da morte.
geral, e C e
Este foi o tempo em que a censura. Porque a morte de uma causa impede
Na prática, a sobrevivência líquido não é observável Quando não estão competindo
Observando o tempo para morte devido a outras causas, não podemos observar
causas de morte. Nós de fi não
Ambos T Ei e T Pi , mas sim observar única
T e = min {t Ei , T Pi } ( sujeito a censura por C e ). anos U e = P (T <T E ≤ t + Δ t | T> t)
λ * E ( t) = lim , (5)
min {t e , C} o dia do tempo de seguimento no indivíduo e, e de fi não indicativo de falha δ e Δt→0 Δt
igual a 0 se a morte é censurado ( T e > C e ) e uma outra forma. Além disso, anos X e dia e e stress que o condicionamento e (5) depende = T
co-variáveis ​anos D e dia de um subconjunto, que vamos descrever como variáveis min { T E , T P } em vez de T E sozinho tempo e (2). esta λ * E é o
​demográficas (geralmente idade, sexo e ano). Os dados observados no indivíduo e Está, causar-especi fi c perigo ( Tsiatis, 2005) Quando o risco da população também está presente. Da
então, ( U e , δ e , X e ). Nós, de fi nem as funções de sobrevivência o Ei ( t) = P (t Ei > t | X e ) e o mesma
Pi ( t)
forma, λ * P ( t) é definida como
= P (t Pi >
P (T <T P ≤ t + Δ t | T> t)
λ * P ( t) = lim ,
t | D e ) e anos λ Ei ( t) e λ Pi ( t) a dia das funções de risco correspondência. assumimos T E e T P Δt→0 Δt
foi dado condicionalmente Independent D. Além disso, assumimos censura e as duas quantidades suspeitos até ao perigo Observado
noninformative, λ sobre ( t) = λ * E ( t) + λ * P ( t). Ao considerar o excesso de perigo λ Ei Cada um de
IU o C = o C = P (C e > t) é comum para todos i. Usamos o Λ símbolo (subscritas conforme condicionamento individual e em Thüsen D e , independência condicional do T P e T E dado
apropriado) para o dia de uma função de risco cumulativo. Por simplicidade, assumimos D Isso implica
uma fi denominaremos população de pacientes doentes de tamanho N. O tamanho de λ * Ei = λ Ei . Pelo contrário, ele Condicionado T P > t Torna-se crucial Ao considerar uma
uma amostra a partir desta população será indicada pela n. coorte Isso ers di ff em Matéria de
D. Seguindo a definição, e (5), o fi c risco de causa específica pode ser escrito como
eo definição de sobrevivência relativa temos dois conjuntos de dados: dados sobre
tempo para a morte (por qualquer causa) e um grupo de pacientes com a doença de
ΣN ΣN
interesse ({ U e , δ e , X e }, para i = 1. . . n); e tabelas de mortalidade população que fornecem a
o Sobre i ( t) λ E i ( t) o Sobre i ( t) λ P i ( t)
população todas as causas funções de risco para vários estratos demográfica e da
i=1 i=1
população em geral. Assumimos que dentro de cada demográfica estrato definido λ * E ( t) = = λ sobre ( t) - , (6)
ΣN ΣN
pelos valores da D O conjunto de pacientes e da coorte doente é comparável à da
o Sobre i ( t) o Sobre i ( t)
população em geral com relação aos fatores de risco relacionados às causas de morte
i=1 i=1
e operar a população em geral, e usamos as tabelas para obter
ONDE Observado o perigo é dado pela λ sobre ( t) =
{ ΣN i = 1 o Sobre i ( t) λ Sobre i ( t)} / { Σ N i = 1 o Sobre i ( t)}. Como e (4), o haz-
λ Pi ( t) Os valores para cada indivíduo e em cada tempo t. Nós mais ard e (6) é calculado como a média ponderada do
Ele Estimation and Survival Relativa 115

perigos excesso individuais, mas os pesos dependem da probabilidade de sobreviver embora, como veremos ea próxima seção, Eles estavam Em vez estimar Ou a
todas as causas e não apenas o excesso de risco. A sobrevivência observado de uma sobrevivência net observável ou a taxa de sobrevivência relativa.
coorte de pacientes é
[-∫t ]
ΣN 3. Os estimadores existentes
o sobre ( t) = 1 exp { λ P i ( u) + λ E i ( u)} du
N Nesta seção, estudamos as versões de tempo contínuo dos estimadores existentes e
0
i=1
configuração de sobrevivência relativa. anos N e ( t) = I (t e ≤ t T e ≤ C e ) e Y e ( t) = I (t e ≥ t, C e ≥
{-∫t } {-∫t }
t) o dia do processo de contagem e o processo de risco para cada indivíduo e da
= exp λ * P ( u) du exp λ * E ( u) du . amostra ( i = 1. . . , n). Além disso, anos N (t) = Σ
0 0

e N e ( t) e
e o termo associado com o fi c risco de causa específica λ * E
Y (t) = Σ e Y e ( t). O processo de intensidade para cada indivíduo Seguindo o
{-∫t }
modelo aditivo (1) pode ser escrita como Y e ( t) {λ Pi ( t) + λ Ei ( t)}. Assumindo igual excesso
o *E ( t) = exp λ * E ( u) du , (7) perigo λ Ei para todos e e
0
Seguindo os mesmos argumentos que e a derivação do estimador Nelson-Aalen
Competindo risco e é muitas vezes DEL definir esta como a sobrevivência net (Aalen et al., 2008), o excesso de risco cumulativo pode ser estimado o tempo
observável ( Marubini e Valsecchi, 1995), pois é bem estimadas pelo método de (Andersen e Vaeth, 1989)
Kaplan-Meier com mortes devido a riscos população consideradas censura. No
Σn
entanto, porque tal censura devido à população Riscos é informativo (dependência
∫t Y e ( u) d Λ P i ( u)
comum covariáveis D) a interpretação da sobrevivência net observável não é clara. A dN (t), Y (U) - ∫ t
Λ * E ( t) = i=1
. (10)
sobrevivência net observável o * E ( t) não é uma função de sobrevivência adequada e não
0 0
Y (U)
pode ser escrito como a probabilidade de alguma variável aleatória superior a uma
hora escolhida t. Em particular, ele não pode ser usado como uma medida de carga do A equação (10) é a versão contínua do que tem sido chamado de Ederer II estimador
cancro, porque ela depende da mortalidade geral população através o Oi e (6). (Ederer, et al., 1961). O termo primeiro no lado da mão direita é igual ao estimador de
Nelson-Aalen da Λ risco cumulativo Observado 0 . O termo ond se- Representa o perigo
população cumulativa
Λ*P.
A proporção de sobrevivência relativa Para cada intervalo entre tempos de seguimento, d ˆ Λ * P é cal-
{-∫t } culado como a variação média e cumulativa população sobre o perigo Esse intervalo
ΣN ΣN
para pacientes que ainda estavam em risco através desse intervalo. Assumindo que
o Sobre i ( t) exp λ Sobre i ( u) du
0
censura noninformative ( o C = o C ) e observando que E {Y e ( t)} = P {Y e ( t) =
i=1 i=1
o R ( t) = = {-∫t }
Σ N
ΣN

(8) 1} = o Oi ( t), S C ( t), O termo (1 / n) Σ n Y e ( t) d Λ P i ( t) converge


o P i ( t) exp λ P i ( u) du i=1

i=1 i=1
0 este ( o C ( t) / N) Σ N i=1 o Sobre i ( t) d Λ P i ( t) e (1 / n) Σ n i=1 Y e ( t) con-
{-∫t } Verges este ( o C ( t) / N) Σ N
i = 1 o Sobre i ( t). O termo censura o C CAN
= exp λ **E ( u) du , Celsa fora e podemos ver que o Ederer II é estimador consistente para o perigo
0 cumulativa associada com (6) e estima a sobrevivência net observável (7).
Também de interesse é. Isto envolve uma terceira quantidade λ ** E( não ne-
riamente uma função de risco), que é definido por Usando a mesma notação, a I Ederer estimador (Ederer, et al., 1961) pode ser
escrita como
ΣN
o P i ( t) λ P i ( t) Σn
∫t Y e**( u) d Λ P i ( u)
i=1
λ **E ( t) = λ sobre ( t) - . (9) dN (t), Y (U) - ∫ t
Σ
N Λ ** i=1
, (11)
E( t) =
o P i ( t) 0 0
Y ** ( u)

i=1
ONDE Y ** e( t) = S Pi ( t). Porque o termo primeiro estima o risco observado cumulativos
Note-se que λ E como definido e (4) e λ * E como definido e (6) são, necessariamente, não e o segundo termo é igual a versão cumulativa do segundo mandato, e (9), este
negativo, actuando este não pode ser dito de λ ** estimador Claramente estima o risco cumulativo Associado a taxa de sobrevivência
E AS

definido e (9). Uma situação em que λ ** E Será que o resultado for negativo, e
relativa.
Aumentando a taxa de sobrevivência relativa, apesar da mortalidade e da população do
estudo ser superior, em seguida, e no fundo. A construção do Hakulinen estimador (Hakulinen,
As equações (4), (6) e (9) Os presentes três taxas de risco que levam distintas que 1982) envolve a distinção entre censura devido ao final do seguimento inicialmente
três funções distintas: a sobrevivência líquido (3), a sobrevivência líquido observável previsto e censura intercalar. Assume-se, inicialmente, que o tempo de seguimento
(7), e a taxa de sobrevivência relativa (8). Se o excesso de risco é o mesmo para planejado, o DEL como o potencial tempo de seguimento e denotado por τ e , é
todos os indivíduos ( λ Ei = λ E ) Os pesos e (4), (6) e (9) e cancelar resultar todas as três conhecido por todos os indivíduos (por exemplo, tempo de indivíduo e 'S entrada no
equações e a mesma quantidade população λ E . Se não, então a sobrevivência net é o estudo Este estudo de encerramento). individual e 'S tempo real censura é dada pela C e
único destas quantidades, que é independente dos riscos populacionais. = min ( ~
C e ; τ e ) ONDE ~ C e é o momento
Esta censura interino. Este correta estimador e a situação em que o potencial tempo
E desenvolver a metodologia de sobrevivência relativa cedo, parece que de seguimento e Thüsen o tempo censura está correlacionada com a hora do evento,
investigadores estavam tentando estimar a sobrevivência net, o estimador Hakulinen
116 Biometrics, de março 2012

estende-se a definição de Y ** e a fórmula (11) é igual Isso implica, assumindo que nós podemos fornecer um modelo ADEQUAT para o
Y **e ( t) = S Pi ( t) I (C e ≥ t) se δ e = 0 e Y ** e ( t) = S Pi ( t) I (τ e
excesso de perigo, a censura, devido ao perigo população é condicionalmente
≥ t) se δ e = 1. Desta forma, o estimador As tentativas para diminuir o enviesamento independente e sobrevivência rede pode ser como a média estimada dos valores
Causada por censura informativa, e o termo primeiro sobre o lado direito de (11) previstos para cada indivíduo.
através da introdução de um viés semelhante e o segundo termo. Se censura C é Esta estimativa (4) diretamente, sem usar um modelo, propomos o estimador de
independente de T Ambos os métodos de estimar a própria quantidade, se não houver ponderação Ederer II Seguindo a mesma lógica e (12). deixando N w
interino e todas as potencial de censura vezes de acompanhamento são todos iguais a ( t) = N e ( t) / S Pi ( t) e N w ( t) =
Σ Nw e

(ou večja que) o tempo máximo observado, o Ederer e eu Hakulinen estimador e( t), que de fi nem o novo estimador como
coincidem.
Σn
Usando o relacionamento S (t) = exp { - ∫ t
∫t Y ew ( u) d Λ P i ( u)
0 d Λ ( u)}, Ambos (10)
e (11) pode ser escrita como uma razão de sobrevivência observada e um spa que é dN w ( u) Y w ( u) - ∫ t
Λ E ( t) = i=1
. (13)
DEL esta população como sobrevivência. uma tal relação é de uma suspeita
0 0
Y w ( u)
ponderada de indivíduo o Ei ( Est`eve et al., 1990) e você nunca pode estimar a
sobrevivência net Se Estes pesos não são idênticos. Este fi nd o valor populacional do estimador acima (Quando
o C = o C para todos i) nós Fi Nota primeira Isso E {Y w e
( t)} = S C ( t)
o Oi ( t) / S Pi ( t) = S C ( t), S Ei ( t) e E {dN w e( t) | F t } = E {dN e ( t) |
4. Estimativa da Survival Net F t } / o P i ( t) = Y e ( t) d Λ Sobre i ( t) / S P i ( t), ONDE F t denota a história, ou seja, todas as
Nós primeiro explicar a idéia do estimador sobrevivência net proposto com os dados fi c informações disponíveis até o momento t. porque
causa específica e depois adaptá-lo para a configuração de sobrevivência relativa.

1 Σ Y e ( t) d Λ Sobre i ( t), S P i ( t) → o C ( t)Σ


n N
o Sobre i ( t) d Λ Sobre i ( t), S P i
Causar-especí fi configuração c. E a configuração fi c causa específica de uma
n N ( t)
solução para o problema da estimativa de sobrevivência líquida foi proposto por Robins i=1 i=1

(1993) e Satta, Datta e Robins (2001).


ΣN
Os dados observados e a configuração fi c causa-específica pode ser representada pelo
= o C ( t) N o E i ( t) d Λ Sobre i ( t),
processo de contagem N Ei ( t) = I {T e ≤ t T e ≤ C e ,
i=1
T Ei < T Pi } e o processo em risco Y (t). Se a população e o excesso de risco estão ff ete
por variáveis D censura pelo perigo população é informativo. O estimador de
Nelson-Aalen O valor da população de d ˆ Λ E ( t) e (13) é igual a (os termos o C
cancelam)
Λ * E ( t) = ∫ t
0 dN E ( u) / Y (U) Consistente é para o Cu
versão mulative de (6) e dá uma estimativa tendenciosa de (4).
Para obter uma estimativa imparcial de Λ E ( t) ea definição causa especí fi c, nós Tanto ΣN ΣN
o E i ( t) d Λ Sobre i ( t) o E i ( t) d Λ P i ( t)
o peso e o processo de contagem em risco de cada indivíduo usando seu / sua
i=1 i=1
distribuição do tempo de sobrevivência da população. Nós de fi não -
ΣN ΣN
o E i ( t) o E i ( t)
i=1 i=1
N wE i ( t) = N E i ( t), S P i ( t e -) , Y we ( t) = Y e ( t), S P i ( t -) , (12)
ΣN
o E i ( t) d Λ E i ( t)
e propor o estimador Λ wE ( t) = ∫
dN w E ( u) / Y w ( u) que
t
0 i=1
é imparcial, apesar da censura, devido ao perigo da população ( N w = = d Λ E ( t).
ΣN
E= Σ Nw Eie Y w= Σ Y w e , como é habitual). o E i ( t)
Intuitivamente, a ponderação dos Y aumenta o tamanho da amostra ainda em risco
i=1
para explicar a proporção de doentes que se espera que possam ter sido perdidos
devido ao perigo população. A ponderação de N E aumenta o número de eventos e da Temos Thüsen mostrado que o método recentemente proposto prevê um estimador
mesma maneira. Porque todas as informações necessárias para os pesos podem ser consistente de (4). Note-se que ao contrário dos estimadores tradicionais, este método
obtidas a partir de tabelas de população, a ponderação pode ser realizada sem não pode ser expresso como uma razão da sobrevivência observado e população.
modelagem e não suposições relativas a posteriores modelagem e capacidade fi identi
têm de ser feitas. Além disso, o t e - e (12) podem ser substituídos por t e , AS o Pi Assume-se
contínua.
5. Variação

A variação das curvas calculadas pelo Hakulinen e Ederer ambos os métodos é

definição de sobrevivência relativa. Uma opção para estimar a sobrevivência líquida (3) e estimado por Andersen e Vaeth (1989)

a definição de sobrevivência relativa é usar um modelo de sobrevivência relativa


multivariada. Assumindo o risco da população é completamente determinada pelas
∫t
co-variáveis ​demográficas, a suposição de independência condicional J (L), Y (U) 2 dN
σ̂ * 2 ( t) =
σ (u), (14)
0

P (T <T E ≤ t + Δ t | T P > t T E > t, D)


ONDE J (t) = I {Y (t) > 0} e J (t) / Y (t) Ele é interpretado como 0 Sempre Y (t) é 0
= P (T <T E ≤ t + Δ t | T E > t, D)
Ele Estimation and Survival Relativa 117

Após argumentos semelhantes, a variância do método proposto recentemente sexo e ano de diagnóstico (Tabela 1). Coe coeficientes FFI para a linha de base não são mostradas.

pode ser estimado por (ver anexo)


∫t Porque o Effect de idade e é a mesma direção e as mesas de populações,
J (u) Y w Σ
n
dN e ( u) S 2 indivíduos com elevado risco λ E Obter um peso menor, e (6) do que, e (4) e a
σ̂ 2 ( t) =
σ
( u) 2
0 Pi( u) sobrevivência líquido observável está acima do verdadeiro curva de sobrevivência
i=1
líquido e Figura 1. Do mesmo modo, os pesos para aqueles com alto risco de
Σn
população, e o segundo termo no lado direito de (6) você são menores do que, e (9) e
∫t J (U) dN e ( u) / S 2 Pi( u) (15)
são a I método Ederer superestima sobrevivência net ainda mais do que a curva
i=1
= {n }2. Ederer II. O Ederer e eu Hakulinen estimativas praticamente coincidem implicando que
0 Σ não há censura informativa importante devido à heterogeneidade do potencial tempo
Y e ( u) / S P i ( u)
de seguimento.
i=1

O valor de (15) é geralmente maior do que (14), que é intuitivamente razoável, porque
o estimador recentemente proposto (13) também é responsável para a informação Além disso, o modelo multivariado foi utilizado para prever a curva de
despercebido devido à censura população. sobrevivência para cada indivíduo, a média ao longo Estas curvas é representada com
uma curva de cinzento a tracejado e Figura 1a. Além do fato de que é calculado
apenas em alguns pontos de tempo (um modelo constante peça-wise), que coincide
6. Ilustração numérica
com a curva dada pelo nosso método proposto. Isso é de acordo com e verificar o
Um exemplo de dados real. Nós comparamos os estimadores descritos e as seções modelo fi t ( p = 0747 usando o velho, Pohar, e Henderson, método 2005).
anteriores usando dados franceses na macroglobulinemia câncer de Waldenstrom. A
amostra é constituída de 380 pacientes (226 machos, 154 fêmeas), com idades entre
31-97 (média de 71), diagnosticado Entre 1989 e 1997, e seguida até 2002. A Figura Um estudo de simulação. Continuamos nossa ilustração de uma simulação, com
1a mostra a estimativa de Kaplan-Meier da sobrevivência Observado (sólido curva de valores de co-variáveis ​e parâmetros de simulação definida para imitar os dados reais
preto), a sobrevivência da população esperada estimada pela eu método Ederer acima descrito ( n = 380). Em termos de excesso de perigo, consideramos duas
(pontilhado curva cinzenta), os três estimadores de sobrevivência relativa tradicionais situações: com e sem dependência de co-variáveis ​demográficas (coeficiente FFI coe
(Ederer I: sólido cinzento; Hakulinen: tracejado preto; Ederer II: tracejadas / preta para a idade 0 ou 00:05 por ano). vezes T Ei e T Pi são gerados separadamente, o líquido
pontilhada) e o recentemente proposto estimador (tracejada curva preto). Como que tanto a sobrevivência e a sobrevivência líquido observável podem ser estimados
podemos ver, a sobrevivência Observado 10 anos é muito baixa e, apesar do pouco directamente (ver figuras 2a e 2c, para a média destas curvas). Estas estimativas são
velha idade média dos pacientes, as estimativas de sobrevivência em relação implica então comparados com os resultados do estimadores de sobrevivência relativas e
que este é um tipo muito grave de câncer. Figuras 2b e 2d. Como podemos ver, todos os estimadores corresponder

Figura 1b compara a variância de bootstrap (500 repetições) para a variância da


estimado pela fórmula (15). Como podemos ver, ambas as estimativas corresponder tabela 1
muito bem. Os Effects covariáveis.
A Tabela 1 apresenta os resultados de um modelo de sobrevivência multivariada
aditivo relativa que assume Cox-tipo excesso de risco proporcional com um excesso Estimativa Std. erro Z- VALOR p
seccionalmente constante perigo de linha de base com intervalos em 1, 2, 3, 4, 5, e 10
Idade (por ano) 0054 0012 4653 < 0001
anos. O modelo foi fi enquadrados com o método da máxima probabilidade (Est`eve et
Sexo (fêmea) - 0323 0226 - 1428 0153
al., 1990). Observamos um fi forte Effect de idade, mas não signi não pode Effect of Diag. ano (por ano) 0077 0049 1.572 0116
0,9

0,9
sobrevivência relativa

sobrevivência relativa
0,7

0,7

I Hakulinen
População Ederer
0,5

0,5

Ederer II Nova
Proposta Max.
probabilidade Nova estimador
Observado fórmula Variância
Bootstrap
0,3

0,3

0 2 4 6 8 10 0 2 4 6 8 10
(A) Prazo (anos) (B) Prazo (anos)

Figura primeiro (A) Comparação dos estimadores e a sobrevivência relativa de acerto; (B) comparação da variância da fórmula e a
variância de bootstrap para o estimador proposto recentemente.
118 Biometrics, de março 2012

0,5 0,6 0,7 0,4 0,8 0,9 1,0 sobrevivência Relativa

0,5 0,6 0,7 0,4 0,8 0,9 1,0 sobrevivência Relativa


observável Net
Hakulinen Ederer
II Nova Proposta
Net observável

2 4 6 8 10 2 4 6 8 10
(A) Prazo (anos) (B) Prazo (anos)
0,5 0,6 0,7 0,4 0,8 0,9 1,0 sobrevivência Relativa

0,5 0,6 0,7 0,4 0,8 0,9 1,0 sobrevivência Relativa

observável Net
Hakulinen Ederer
II Nova Proposta
Net observável

2 4 6 8 10 2 4 6 8 10
(C) Prazo (anos) (D) Prazo (anos)

Figura 2 A comparação dos valores estimados (a) e (b) não Effect de co-variáveis ​sobre λ E ; ( c) e (d) Effect de idade (coeficiente FFI coe para idade 00:05 por ano). Veja o texto
para mais detalhes.

Entre as Figuras 2a e 2b, Uma vez que o excesso de perigo não depende de anos, mas surpreendentemente, não impediu a crença largamente aceite que as duas
co-variáveis ​demográficas. Por outro lado, as curvas, e 2c e 2d di ff er com a medidas foram as mesmas (Hakulinen, 1977;; Buckley, 1984 Est`eve et al., 1990).
estimativa Ederer II correspondentes a sobrevivência líquido observável, e a Uma das consequências desta propriedade é a inconsistência da taxa de
estimativa recentemente proposto correspondentes a sobrevivência líquido. sobrevivência relativo global e sua versão padronizada idade, que geralmente é muito
menor, mesmo se os pesos foram tomadas como os pesos da população estudada
Todos os estimadores de sobrevivência relativas descrito neste artigo fazem parte (Brenner et al., 2004).
do relsurv pacote (Antigo e Pohar, 2006) e R
( R Development Core Team, 2009) e pode ser acessado por função rs.surv ( Ederer I A culdade di FFI menos frequentemente citada é que a sobrevivência net
Ederer II Hakulinen, Nova Proposta) OR rsadd ( estimativa de máxima probabilidade, observável não tem uma interpretação clara como uma função de sobrevivência. Isto
significa que o estimador de Kaplan-Meier, e a configuração fi c causa específica (com
rs.surv.rsadd MÉDIA para as previsões individuais). as mortes população considerada como censura) não pode ser recomendada. Quando
considerado como uma estimativa da sobrevivência net este estimador é tendenciosa
7. Discussão e Conclusões porque o câncer e noncancer mortalidade ea participação influência dos mesmos
Acredita-se amplamente que taxa de sobrevivência relativa e sobrevivência líquidos co-variáveis ​demográficas. As outras principais variáveis ​que têm uma influência forte
representam a mesma quantidade. Agindo dessa detém Quando a taxa de excesso de e fl em mortes por câncer, por exemplo fase, fazer uência e noncancer mortes não fl.
não depender das variáveis ​demográficas, ele está longe de ser verdadeiro e a situação Dado este fato, segue-se, como temos mostrado que um estimador consistente pode
mais usual, quando existe essa dependência. A diferença entre os dois conceitos pode ser compensado obtidos com um ajuste para as co-variáveis ​demográficas somente,
ser grande, especialmente por causa do excesso de risco é quase sempre altamente qualquer eo contexto da definição fi c causa específica ou e no contexto de um
associada com a idade no momento do diagnóstico. Embora a sobrevivência de líquido é, modelo multivariado para a sobrevivência net.
por definição a média das curvas de sobrevida líquidas individuais, e como tal, mas a
sobrevivência função, taxa de sobrevivência relativa é uma média ponderada de
sobrevivência dos indivíduos com pesos mudando com o tempo desde o diagntico.
Porque os pesos são proporcionais à população de sobrevivência Cada indivíduo, esta
medida Últimos Abordagens a sobrevivência líquida de quem tem a melhor sobrevivência
da população. Isto tem sido conhecido para muitos Agindo taxa de sobrevivência relativa é um conceito simples e uma quantidade
observável, que tem um estimador natural com a Ederer I ou método Hakulinen, a
sobrevivência líquido não é
Ele Estimation and Survival Relativa 119

observável e requer a definição de modelo aditivo. Além disso, para fazer a Referências
sobrevivência net estimáveis ​algumas hipóteses sobre o valor da taxa de mortalidade
Aalen, OO, Borgan, O., e Gjessing, HK (2008). sobrevivência e
por "outras causas" é necessária. Tomando este valor a partir das tabelas de vida da
Evento Análise História. New York: Springer-Verlag. Andersen, PK e Vaeth, M. (1989).
população subjacente, assumimos implicitamente que a taxa de mortalidade por todas paramétrico simples e não-paramétrico
as causas e a população de pacientes é večja do que a taxa de mortalidade da modelos de métricas para excesso de mortalidade e relativas. biometria 45
população "controle". Se esta hipótese não for observado, a construção acima falha e 523-535.
sugere que as tabelas de vida não descrevem adequadamente a taxa de mortalidade Brenner, H. Arndt, V., Gefeller, O., e Hakulinen, T. (2004). um
por outras causas e da população do estudo. Tal cenário pode ser facilmente uma abordagem alternativa para ajuste de idade das taxas de sobrevivência de câncer.

reconhecido por uma curva crescente estimado pelo nosso estimador recentemente European Journal of Cancer 40 2317-2322. Buckley, JD (1984). Aditivo e modelos
multiplicativos para o parente
proposto e irá resultar e problemas de convergência ou resultados tendenciosos com
as taxas de sobrevivência. biometria 40 51-62. Coleman MP Quaresma M. Berrino, F.,
modelo ponte Abordagens fi tting.
Lutz, JM, De Angelis,
R., Capocaccia, R., Baili, P., Rachel B., Gatta, G., Hakulinen,
T., Michel, A., Sant, M. Weir, HK, Elwood, MJ, Tsukuma,
Nós mostramos que, se as mortes noncancer são avaliados corretamente pela H., Koifman, S., GA Silva, S. Francisco Santaquilani, M. Verdecchia, A., tempestade HH, e
tabela de vida da população, o método Ederer II eo método fi c causa específica Young, JL (2008). sobrevivência de câncer e cinco continentes: Um estudo de base
estimar a mesma população e têm viés igual valor. Nossos estimadores obtidos populacional em todo o mundo.
propostas e ponderando a observação individual com a sua sobrevivência à Lancet Oncology 9 730-756.
população fornecem dois estimadores imparciais de sobrevivência net. Quando a Cortese, G. e Scheike, TH (2008). haz- Regressão dinâmica

causa da morte foi atribuída a cada paciente e é conhecido do investigador, agora é modelos SDRA para a sobrevivência relativa. Estatísticas em Medicina 27
3563-3548.
possível fazer uma comparação clara entre as duas estimativas. Pelo contrário,
Dickman, PW, Sloggett, A. Hills, M., e Hakulinen, T. (2004).
quando Comparação entre a sobrevivência relativa e causar-especi fi c foi feita na
modelos de regressão para a sobrevivência relativa. Estatísticas em Medicina 23
armadilha, que tenha sido contaminado pelo viés de magnitudes di ff erent presentes e
51-64.
as duas medidas.
Ederer, F., Axtell, LM, e Cutler, SJ (1961). A sobrevivência relativa
Classificação: uma metodologia estatística, pp. 101-121. Bethesda, Maryland, US National
Câncer Institute Monograph 6 Est`eve, J, Benhamou, E., Croasdale, M., e Raymond, M.
De um ponto de vista prático, ea situação normal em que a causa da morte não é (1990).
conhecida, é aconselhável usar o método recentemente proposto para estimar a sobrevivência relativa ea estimativa de sobrevida net: Elementos para mais discussão. Estatísticas

sobrevivência net. É um método para medir a sobrevivência cancro após eliminação em Medicina 9 529-538. Hakulinen, T. (1977). Sobre as taxas de sobrevivência em relação a

do e influência de outras causas de morte e os estudos de sobrevivência longo prazo. Journal of


doença cronológica 30 431-443. Hakulinen, T. (1982). sobrevivência de câncer corrigido
multinacionais de grande escala como EUROCARE ou CONCORD (Coleman et al,
para heterogeneidade e
2008;.. Sant et al, 2009), onde a população sobrevivência di ff ers substancialmente
retirada do paciente. biometria 38 933-942. Hakulinen, T. e Tenkanen, L. (1987). A análise
entre os países. A nossa medida pode ser padronizado e a forma tradicional, sem as
de regressão de relativa
inconsistências mostrado pela razão de sobrevivência relativa, líquido porque a
as taxas de sobrevivência. Journal of Royal Statistical Society Série-C
sobrevivência da amostra é a média de probabilidades de sobrevivência líquidas 36 309-317. Marubini, E. e Valsecchi, MG (1995). Analisando Survival Dados
individuais. Isto não exclui o uso de modelagem e estudos multivariada Com dados
mais precisos sobre as variáveis ​de prognóstico disponíveis. a partir de ensaios clínicos e estudos de observação. Chichester, Reino Unido: Wiley.

Nelson, C., Lambert, PC, Squire, IB, e Jones, DR (2007).


modelos paramétricos flexíveis para sobrevivência relativa, com aplicação e doença
cardíaca coronária. Estatísticas em Medicina 26
5486-5498.
Pohar, M. and Stare, J. (2006). análise de sobrevivência relativa e R. com-
Nós não ter abordado a situação comum de potenciais dados em tempo de
Métodos e Programas em Biomedicina informáticos 81, 272-278. Pohar Perm M.,
seguimento e câncer não homogéneas. Porque Tal situação implica censura
Henderson, R., e Stare, J. (2009). Uma abordagem que
informativa, ele irá inevitavelmente levar a viés, e todos os avaliadores, exceto um estimativa e regressão de sobrevivência relativa. Bioestatística 10 136-
modelo multivariado fi cado bem específica. Este di culdade FFI foi observado por 146
Hakulinen (1982), que percebeu que o numerador da razão de sobrevivência relativa Pokhrel, A. e Hakulinen, T. (2009). Age-padronização de relativa
era parcial e tentativa para diminuir o enviesamento da razão pela introdução de um índices de sobrevivência de pacientes com câncer e uma comparação entre os países,
viés semelhante também e o denominador. Embora isso funciona bem e prática, o gêneros e períodos. European Journal of Cancer 45

desenvolvimento de estimadores Isso seria realmente remover a polarização Ao 642-647. R Development Core Team (2009). R: A Linguagem e Meio Ambiente

estimar Ou a taxa de sobrevivência relativa ou a sobrevivência net poderia ser


Estatística para computação. Viena, Áustria: Fundação R para Statistical Computing. ISBN
realizado ao longo das linhas do nosso estimador ponderado e continua a ser uma
3-900051-07-0. Robins, JM (1993). recuperação de informação e ajuste preconceito e
tarefa para o futuro.

análise de riscos de regressão proporcional de ensaios randomizados utilizando


marcadores substitutos. e Proceedings da American Statistical Association
Biopharmaceutical-Section, pp. 24-33. Alexandria, Virgnia, EUA

Agradecimentos
Sant, M., Alleman, C., Santaquilani, M., Knijn, R., Marchesi, F., e
Os autores agradecem o coeditor para muitos importantes comentários, sugestões e Capocaccia, R. (2009). EUROCARE-4 projetos. Sobrevivência de pacientes com câncer

observações, que ajudou a melhorar o artigo consideravelmente. diagnosticados e 1995-1999. Resultados e comentários. European Journal of Cancer 45 931-991.
120 Biometrics, de março 2012

Saxon, PD (1996). riscos proporcionais excesso. biometria 83 127- Integrando a fórmula acima, que Thüsen derive o estimador proposto
141
Sattel, GA, Datta, S., e Robins, J. (2001). Estimando o marginal ∫t
J (u) Y w ( u) dN w ( u)
função de sobrevivência ea presença de co-variáveis ​dependentes do tempo. Λ E ( t) =
Estatísticas e cartas de Probabilidade 54 397-403. 0

Antigo, J., Pohar, M., e Henderson, R. (2005). Bondade de fi t de


modelos de sobrevivência relativa. Estatísticas em Medicina 24 3911-3925. Tsiatis, AA (2005). Competindo Σn
Riscos. Chichester, Reino Unido: John Wiley J (U) Y ew ( u) d Λ P i ( u)
and Sons.
i=1
Zahl PH e Aalen, OO (1998). Ajuste e Comparando sobrevivência -∫t .
0
Y w ( u)
Curvas por meio de um modelo de risco aditivo. Análise Vida útil dos dados
4 149-168.
denotando Λ E ( t) = ∫ t
0 J (L) d Λ E ( u) Que podemos ver
∫t
J (u) Y w ( u) dN w ( u)
Λ E ( t) - Λ E ( t) =
recebeu novembro 2010 Revisado em abril 2011.
0
aceitado abril 2011.

apêndice Σn
J (U) Y ew ( u) d Λ P i ( u)
A derivação da nova proposta de Estimativa e sua variância (17)
i=1
-∫t
0
Y w ( u)
Damos aqui a derivação informal do estimador recém-proposto e sua variância que
segue de perto Que para o estimador de Nelson-Aalen (ver, por exemplo, Aalen et al., ∫t
J (u) Y w ( u) dM w ( u)
2008). Usando a notação descrita e o artigo, podemos escrever -∫t J (u) λ E ( u) du =
0 0

dM e ( t) = dN e ( t) - Y e ( t) d Λ P i ( t) - Y e ( t) d Λ E ( t). Isso é Λ E ( t) é um estimador imparcial de Λ E ( t).


Agora usamos as Regras para integrais estocásticos (ver,
Dividindo por as curvas de sobrevida da população indivíduo o Pi por exemplo, Aalen, et al., 2008) para derivar uma estimativa de variância. A variação
dM e ( t), S P i ( t) = dN e ( t) do processo opcional do martingala e (17) iguais

o P i ( t) - Y e ( t), S P i ( t) d Λ P i ( t) - Y e ( t)o
t)o P i ( t) d Λ E ( t),
∫t
J (u) Y w Σ
n
e usando w este é o dia em que se Processos ponderada dN e ( u) S 2
[Λ E - Λ E ] ( t) =
( u) 2
dM w e ( t) = dN w (16) 0 Pi( u) ,
e( t) - Y w e( t) d Λ P i ( t) - Y w e( t) d Λ E ( t). i=1

Resumindo sobre os indivíduos e Integrando TEMOS


e porque
Σn
M w ( t) = N w ( t) - ∫ t Y ew ( u) d Λ P i ( u)
0 var { Λ E ( t) - Λ E ( t)} = E [ ˆ Λ E - Λ E ] ( t),
i=1

-∫t Y w ( u) d Λ E ( u) A variação pode ser estimado por


0

Nota porque isso o Pi é um processo previsível, o ∫t


J (u) Y w Σ
n

processo M w é um martingala com respeito aos F t = dN e ( u) S 2


σ̂ 2 ( t) =
σ
( u) 2
σ {N e ( u), Y e ( u +), S P i ( u +): 0 ≤ u ≤ t, i = 1 . . . , N}. Apresentando a função de indicador J (t) 0 Pi( u)
i=1
= I {Y (t) > 0} Evite esta divisão por zero ( J (t) / Y (t) Ele é interpretado como 0 Sempre Y
(t) é zero) e resumo sobre os indivíduos, a equação (16) dá
Σn
∫t J (U) dN e ( u) / S 2 Pi( u)
Σn = {n
i=1
}2.
J (t) Y ew ( t) d Λ P i ( t) 0 Σ
J (t) Y w ( t) dN w ( t) - i=1 Y e ( u) / S P i ( u)
Y w ( t) i=1

= J (t), d Λ E ( t) + J (t)
Y w ( t) dM w ( t).

Você também pode gostar