Você está na página 1de 27

An alise de Sobreviv encia An alise de Dados sobre Transplante de Rins e C ancer de Mama

Trabalho Final

Professor respons avel: Juliana Cobre

Aluno: S ergio Carvalho n USP 6427466

CARLOS - SP SAO 9 de julho de 2013

Sum ario
1 Introdu c ao 2 Objetivo 3 Conceitos B asicos 4 T ecnicas N ao-Param etricas 4.1 4.2 4.3 4.4 4.5 An alise Descritiva, Explorat oria e Categ orica dos Dados . . . O Estimador de Kaplan Meier . . . . . . . . . . . . . . . . . . C ancer de Mama - An alise Descritiva e Categ orica . . . . . . (t) sem distribui Fun c ao S c ao de probabilidade . . . . . . . . Estimativas Considerando os Grupos . . . . . . . . . . . . . . 2 2 2 3 3 5 7 7 8 9 9 10 11 12 15 16 16 17 18 19 20 20

5 Modelos de Probabil sticos 5.1 5.2 5.3 5.4 Modelo Exponencial . . . . . . . . . . . . . . . . . . . . . . . Modelo Weibull . . . . . . . . . . . . . . . . . . . . . . . . . . Modelo Log-Normal . . . . . . . . . . . . . . . . . . . . . . . Comparando as densidade com a distribui c ao do tempo de sobreviv encia . . . . . . . . . . . . . . . . . . . . . . . . . . .

6 Modelos de Regress ao Param etricos 6.1 6.2 6.3 6.4 Selecionando o modelo . . . . . . . . . . . . . . . . . . . . . . Distribui c ao Gama Generalizada . . . . . . . . . . . . . . . . Teste da Raz ao de Verossimilhan ca . . . . . . . . . . . . . . . Res duos de Cox-Snell . . . . . . . . . . . . . . . . . . . . . .

7 Modelo de Regress ao de Cox A Cap tulo 4 B Cap tulo 5

Introdu c ao

Pode - se dizer que a An alise Estat stica de Sobreviv encia e conjunto de m etodos estat sticos e computacionais cujo objetivo e o estudo da inu encia do tempo sob um certo evento de interesse, por exemplo, o tempo que um indiv duo sobrevive a um determinado tratamento, o tempo at e a venda de um autom ovel, etc. De modo que existe uma grande gama de atividades nas quais podemos aplicar os conceitos da an alise de sobreviv encia, como ci encias sociais, neg ocios, medicina, conabilidade industrial entre outras. Neste contexto o tempo e a vari avel resposta denominado por tempo de falha, e tamb em denominamos por censura a observa cao parcial da resposta. Neste trabalho iremos an alisar dois banco de dados. O primeiro com dados sem censura de pacientes que sofreram transplante renal , neste faremos apenas uma abordagem n ao param etrica. O segundo banco de dados, trata - se de dados sobre mulheres com c ancer de mama que foram submetidas a duas terapias distintas. Este trabalho consiste na reprodu c ao de exemplos retirados do livro An alise de Sobreviv encia Aplicada dos autores Enrico Ant onio Colosimo e Suely Ruiz Giolo.

Objetivo

Dado o conjunto de dados, Kidney transplant data, dados transplante renal, retirado do site 1 , com informa c oes sobre transplante de rins de 863 pacientes, pretendemos aplicar os conceitos de an alise explorat oria de dados e t ecnicas n ao param etricas com o objetido de estudar o tempo de falha.

Conceitos B asicos
Seja T a vari avel aleat oria, n ao negativa, cont nua tal que:
A Fun c ao de Sobreviv encia S(t), que representa a probabilidade de um evento n ao falhar at e o tempo t, e dena por:

S (t) = P (T t) Com as seguintes propriedades:

http : //www.mcw.edu/mcw/home.htm

i) S (0) = 1 ii) S (t) 0 quanto t

iii) S (t) e n ao crescente e cont nua ` a direita


A Fun c ao de Distribuia c ao F(t), que representa a probabilidade de um evento n ao sobreviver ao tempo t, e dena por:

F (t) = 1 S (t)
A Fun c ao de Risco ou taxa de falha (t), que representa a probabilidade da falha ocorrer em [ti , ti+1 ), e dena por:

(t) = lim com

P (t T < t + t|T t) f (t) = t0 t S (t) f (t) = dF (t) dt

A Fun c ao de Risco Acumulada (t), que representa a taxa de falha acumulada em [0, t], e dena por:

(t) =
0

(u)du

T ecnicas N ao-Param etricas

Nosso meta e estimar a fun c ao de sobrevida da vari avel em estudo e uma das sa da para isso e o uso das T ecnicas N ao-Param etricas, que consiste em n ao se impor algum modelo te orico para as falhas observadas.

4.1

An alise Descritiva, Explorat oria e Categ orica dos Dados

O transplante de rim tem sido uma solu c ao eciente no tratamento de pacientes que sofrem de insuci encia renal cr onica, o transplante consiste em se retirar um rim em bom estado de um indiv duo e implanta -lo no paciente em est agio terminal. Este tratamento proporciona ao paciente um retorno as atividades habituais, de modo que a maior parte dos pacientes tem dado ` prefer encia a este tratamento. Segue abaixo a descri c ao das covari aveis.

Covari avel x1 x2 x3 x4 x5

Descri c ao Tempo de morte ou de estudo Indicador de morte Sexo Ra ca Idade

Categorias em dias (0 = vivo, 1 = morto) (1 = masculino, 2 = feminino) (1 = branco, 2 = preto) em anos

Como n ao h a censura em nossos dados podemos fazer uma an alise explorat oria usando histograma. Figura 1: Diagrama de Dispers ao Figura 2: Histograma para Tempo

Figura 3: Histograma para Idade

Na Figura 1 temos o Diagrama de disper c ao idade vs tempo, observamos que n ao h a uma rela c ao linear entre elas. Na Figura 2 e o histograma para a vari avel resposta tempo, e podemos observar que entre os per odos de 0 a 500 dias h ` a um grande n umero de indiv duos e a medida que o tempo aumenta esse n umero tende a cair. Na Figura 3 vemos que entre 20 ` a 70 anos de idade h a um grande n umeros de casos de insuci encia renal, sendo que os casos mais frequentes est ao entre 35 e 55 anos de idade. Com isso podemos criar intervalos de classes com o objetivo calcular as 4

(t). Temos que: (t) e de estimativas para as fun c oes emp ricas de S
o duos que n ao falharam at e o tempo t = ti (t) = n de indiv S n0 de indiv duos no estudo o (t) = n de falhas no periodo [ti , ti+j ) no que n ao falharam at e t = ti

Ent ao temos que: (1500) = 379 = 0.439 e S 863 ([1500, 2000)) = 116 = 0.306 379

Tabela 1: Estimativas das Taxas de Falhas e de Sobreviv encia


N ao falharam at e t = ti 863 622 494 379 263 154 67 Falharam em [ti , ti+j ) 241 128 115 116 109 87 67 Intervalo 0-500 500-1000 1000-1500 1500-2000 2000-2500 2500-3000 3000-3500 (t) Taxa de Falha 0,279 0,206 0,233 0,306 0,414 0,565 1,000

(t) Sobreviv encia S 1,000 0,721 0,572 0,439 0,305 0,178 0,078

Figura 4: Fun c ao Emp rica de Sobreviv encia

Figura 5: Fun c ao Emp rica de Taxa de Falha

4.2

O Estimador de Kaplan Meier

O Estimador n ao-param etrico de Kaplan-Meier e usado com grande frequ encia para estimar a fun c ao de sobreviv encia, em seu desenvolvimento se faz uso dos tempos de falhas para constru c ao de seus intervalos de classe, percebe se que essa constru c ao e baseada na no c ao intuitiva de estima c ao da fun c ao emp rica. Para o caso em estudo, tempos por exemplo que: (1000) = P (T 1000) = P (T 500, T 1000) S (T 500)P (T 1000|T 500) = (1)(1 =P 241 622 ) = (1)( ) = 0.721 863 863

O que signica dizer que para o paciente sobreviver a S(1000) mil dias ele primeiro tem que sobreviver aos 500 primeiros dias e depois ent ao sobreviver aos 1000 mil dias dado que tenha sobrevivido aos 500 primeiros. Generalizando, temos que o S (t) e dado por sequ encias de probabilidades condicionais, e em um estudo com n pacientes com k falhas ocorrendo em t1 < t2 <, ..., < tk tal que k n k Z. Denominando qj como a probabilidade da falha ocrrer em [tj 1 , tj ) dado que ela n ao ocorreu em tj 1 , temos que:
j

S (tj ) =
i=1

(1 qi )

Estimando qj =

dj , onde: nj

dj e o no de falhas em tj , j = 1, ..., k nj e o no de indiv duos que n ao falharam e n ao foram censurados at e tj 1 , logo a fun c ao de sobreviv encia estimada e dada por:
2S (tj )

=
j :tj <t

dj nj

Cujas propriedades

s ao:

i) e n ao-viciado para amostras grandes ii) e fracamente consistente, iii) converge assintoticamente para um processo gaussiano e iv) e o EMV de S(t). Agora podemos analisar um banco de dados com o Estimador de KaplanMeier. Ocorrem por em que nosso atual banco de dados ,Kidney transplant data, n ao possui dados censurados e desta forma somos obrigados a utilizar um outro banco de dados para os estudos que se seguem.
2 3

Consultar An alise de Sobreviv encia Aplicada, E.A. Colosimo e S.R. Giolo Fonte: An alise de Sobreviv encia Aplicada, E.A. Colosimo e S.R. Giolo

4.3
4

C ancer de Mama - An alise Descritiva e Categ orica

C ancer de mama e uma doen ca que acomete mais as mulheres. S ao fatores de risco a idade avan cada, a exposi c ao prolongada aos horm onios femininos, o excesso de peso e a hist oria familiar ou de muta c ao gen etica. Ser portadora dos genes BRCA1 e BRCA2 e um fator de risco importante. Segue abaixo a descri c ao das covari aveis. Banco de dados, Cosmetic deterioration data, retirados do site 5
Covari avel tempo rt cens Descri c ao Tempo de estudo Regime terap eutico Dados Censurados Categorias em meses (1 = radioterapia, 2 = radioterapia + quimioterapia) (0 = sem censura, 1 = com censura)

4.4

(t) sem distribui Fun c ao S c ao de probabilidade


time 1 2 3 4 5 6 7 8 9 10 12 13 14 16 22 25 26 44 n.risk 95 93 92 90 82 78 72 60 52 49 45 43 38 36 32 27 26 10 n.event 2 1 2 8 4 6 12 8 3 2 2 2 1 1 1 1 1 1 survival 0.979 0.968 0.947 0.863 0.821 0.758 0.632 0.547 0.516 0.495 0.473 0.451 0.439 0.427 0.413 0.398 0.383 0.344 std.err 0.0147 0.0179 0.0229 0.0353 0.0393 0.0439 0.0495 0.0511 0.0513 0.0513 0.0513 0.0512 0.0512 0.0512 0.0514 0.0517 0.0519 0.0592 lower 95% CI 0.951 0.934 0.904 0.797 0.747 0.676 0.542 0.456 0.424 0.404 0.382 0.361 0.349 0.337 0.324 0.309 0.293 0.246 upper 95% CI 1000 1000 993 935 902 849 736 657 627 606 585 563 552 540 527 513 499 482

Figura 6: Estimador de Kaplan-Meier

4 5

http : //drauziovarella.com.br/mulher 2/cancer de mama/cancer de mama/ http : //www.mcw.edu/biostatistics.htm

(t) estimada pelo A Figura 6 representa a fun c ao de sobreviv encia S Kaplan-Meier sem os grupos 1,2. Notemos que h a quantidade razo avel de censuras at e aproximadamente 15 meses al em de todos os indiv duos terem falhado.

4.5
time 4 5 6 7 8 9 12 14 16

Estimativas Considerando os Grupos


n.risk 46 44 43 42 35 30 29 27 25 n.event 2 1 1 7 5 1 2 1 1 radioterapia=1 survival 0.957 0.935 0.913 0.761 0.652 0.630 0.587 0.565 0.543 radioterapia+quimioterapia=2 survival 0.959 0.939 0.898 0.776 0.714 0.612 0.510 0.449 0.408 0.367 0.321 0.289 0.253 0.217 0 std.err 0.0301 0.0364 0.0415 0.0629 0.0702 0.0712 0.0726 0.0731 0.0736 lower 95% CI 0.899 0.866 0.835 0.647 0.528 0.505 0.461 0.439 0.416 upper 95% CI 1000 1000 998 895 805 787 748 728 708

time 1 2 3 4 5 6 7 8 9 10 13 22 25 26 44

n.risk 49 47 46 44 38 35 30 25 22 20 16 10 8 7 1

n.event 2 1 2 6 3 5 5 3 2 2 2 1 1 1 1

std.err 0.0283 0.0342 0.0432 0.0596 0.0645 0.0696 0.0714 0.0711 0.0702 0.0689 0.0675 0.0680 0.0684 0.0675 NaN

lower 95% CI 0.905 0.874 0.817 0.667 0.598 0.490 0.388 0.329 0.291 0.254 0.213 0.183 0.149 0.118 NA

upper 95% CI 1000 1000 987 902 853 765 671 612 572 530 485 458 430 399 NA

Considerando os dados da Tabela 4.5 notamos que as probabilidades do grupo 1 para os tempos entre 9 ` a 14 s ao signicativamente maiores do que para o mesmo per odo no grupo 2. Este fato nos indica que h a diferen cas entre os grupos, sendo que o grupo 1 possui maiores chances de sobrevivencia para per odos pr oximos comparados com o grupo 2. Figura 7: Est. KM os grupo: Radioterapia e Radioterapia+Quimioterapia

A Figura 7 nos mostra claramente que h a diferen cas entre os grupos, conrmando as interpreta c oes num ericas dadas pela Tabela 4.5. Se o tempo for referente ao tempo de vida do paciente ao fazer uso dos tratamentos com radioterapia somente ou radioterapia + quimioterapia n ao haveria d uvidas em indicar o tratamendo apenas com radioterapia, pois o tempo de falha para este grupo e maior do que comprado ao grupo 2, sendo assim o tratamento do grupo 1 e mais efetivo.

Modelos de Probabil sticos

Em an alise de sobreviv encia denomina - se por modelos probabil sticos ou param etricos a abordagem em rela c ao ao conjunto de dados utilizando alguma distribui c ao de probabilidade e no caso de se ter uma ou mais covari aveis faz - se necess ario utilizar um m etodo de regress ao am de estimar os par ametros de cada covari avel e ent ao realizar infer encias sobre os par ametros e os modelos. Os modelos que iremos utilizar para realizar um ajuste para os dados s ao: O modelo Exponecial, Weibull e o Log-normal.

5.1

Modelo Exponencial

Seja T Exp() , temos que fun c ao de densidade e dada por: f (t) = 1 exp t , t 0.

tal que E (t) = e o tempo m edio de vida e tem a mesma unidade do tempo de falha t. Com isso temos que a fun c ao de sobreviv encia e da taxa de falha s ao dadas por: S (t) = exp t e (t) = 1 , t0

Figura 8: Distribui c ao Exponecial

Na Figura 8 temos as curvas plotadas da distribui c ao Exponencial nas formas de densidade f(t), fun c ao de sobreviv encia s(t) e fun c ao da taxa de falha (t), que neste caso mantem - se constante para todo t 0.

5.2

Modelo Weibull

Seja T W eibull(, ) , temos que fun c ao de densidade e dada por: f (t) = t 1 exp t

t 0.

tal que e o par ametro de forma e o de escala com , 0, de modo que tem a mesma unidade t. Com isso temos que a fun c ao de sobreviv encia e da taxa de falha s ao dadas por: S (t) = exp t

(t) =

t0

10

Figura 9: Distribui c ao Weibull

Na Figura 9 Podemos observar que, a medida que aumentamos o par ametro de escala as probabilidade da fun c ao de sobreviv encia tamb em aumentaram, embora este fato implicou num aumento da taxa de falha. Observamos tambem que variando o valor do par ametro de forma temos algumas particularidades, como por exemplo:
= 1 ent ao T Exp() (t) = cte > 1 a fun cao (t) e estritamente crescente < 1 a fun cao (t) e estritamente decrescente

5.3

Modelo Log-Normal

Seja a vari avel aleat oria T LogN (, 2 ), cuja fun c ao de densidade e dada por: 1 1 exp 2 2t log(t)
2

f (t) =

t 0.

onde a m edia R tamb em chamado de par ametro de localiza c ao e a vari ancia 2 > 0 conhecido tamb em como par ametro de forma. Sua fun c ao de sobreviv encia e de taxa de falha s ao dadas por: S (t) = log(t) + e (t) = f (t) S (t) , t0

onde (. ) e a acumulada da normal padr ao.

11

Figura 10: Distribui c ao Log-Normal

Na Figura 10 notemos que a probabilidade da fun c ao de sobreviv encia aumentou a medida que aumentamos os valore de e , este fato fato implica uma menor taxa de talha como e poss vel observar na fun c ao da taxa de falha.

5.4

Comparando as densidade com a distribui c ao do tempo de sobreviv encia


Figura 11:

Pela Figura 11 temos a compara c ao entre a curva de dendidade da distribui c ao Exponencial com o histograma do tempo de sobreviv encia, e possivel notar que a curva de Densidade da Distribui c ao Exponencial n ao parece ser adequada para modelar o tempo de sobreviv encia de nossa amostra.

12

Figura 12:

Na Figura 12 temos a compara c ao entre a curva de densidade da distribui c ao Weibull com o histograma do tempo de sobreviv encia da amostra. Notemos que para o par ametro = 3 temos uma curva que pode ser usada para modelar o tempo de sobreviv encia. Figura 13:

J a na Figura 13 temos a compara c ao entre a curva de densidade da distribui c ao Log-Normal com o histograma do tempo de sobreviv encia da amostra. Notemos que para o par ametro (, ) = (0, 5) e (, ) = (0, 7) temos duas curvas que podem ser usadas para modelar o tempo de sobreviv encia.

13

Com isso podemos, com o aux lio do R, comparadar as estimativas para a fun c ao de sobreviv encia dos seguintes modelos: Tabela 2: Modelo exp (t) = exp {t/28.52} S w (t) = exp (t/29.62)0.85 S ln (t) = [(log (t) + 2.84)/1.36] S

Loglik(model) -252.3 -251.1 -242.5

Na Tabela 6 observamos que o modelo Log-Normal possui maior valor de v axima verossimilhan ca. com isto este modelo pode se adequar melhor aos dados. Tabela 3:
time 1 2 3 . . . 45 46 kaplan-Meier 0.9789474 0.9684211 0.9473684 . . . 0.3444766 0.3444766 Exponencial 0.9655445 0.9322761 0.9001541 . . . 0.2064205 0.1993081 Weibull 0.9454214 0.9037843 0.8669338 . . . 0.2400600 0.2336867 Log-normal 0.9816117 0.9427824 0.8998034 . . . 0.2386099 0.2336307

Figura 14: Kaplan-Meier Vs Distribui c oes Expo, Weibull, Log-Normal

Figura 15:

14

As Figuras 13 e 14 representam os gr acos das estimativas de KaplanMeier Vs Modelos Exponecial. Weilbull e Log-Normal, nela podemos observar o que os valores de verossimilhan ca dos tr es modelos j a haviam indicado, ou seja, que entre os tr es modelos, o modelo Log-Normal e mais adequado para modelar os dados de nossa amostra.

Modelos de Regress ao Param etricos

Agora incluiremos nos modelos param etricos a co-vari avel Regime Terap eutico, sendo que esta co-vari avel divide nossa amostra em dois grupos. Nosso objetivo em incluir tal co-vari avel e verticar se esta tem inu encia signicativa na vari avel resposta tempo, para isso recorremos aos modelos de regress ao. Tabela 4: Regime Terap eutico Radioterapia Radioterapia + Quimioterapia com o auxilio do R, temos: Tabela 5: Estimativas dos par ametros Regress ao Weibull Log-Normal 0 = 4.40 0 = 5.160 1 = 1.96 1 = 1.03 = 0.935 e = 174.11 = 4.39 1.03 rt e = 1.25

grupo 1 2

Exponenncial 0 = 5.08 1 = 1.16 = 1(f ixo)

Observamos que o valor de m axima verossimilhan ca para os modelos Expomencial e Weibull s ao muito pr oximos, com isso testaremos para o modelo Weibull se o par ametro = 1. H0 : =1 Vs H1 : =1

Pelo teste da raz ao de verossimilhan ca , temos que: T RV = 2 (242.69 242.89) = 0.392

15

Como P (2 vel de signi1 > T RV = 0.3918134) = 0.532, temos que ao n c ancia = 0.05 n ao rejeitamos a hip otese H0 , isto implica que ao inv es realizar compara c oes entre os tr es modelos, podemos trabalhar apenas com o modelo Exponencial e o Modelo Log-Normal.

6.1

Selecionando o modelo

Desejamos agora encontrar uma distribui c ao de probabilidade que se adeque aos dados em estudo e, para isso, usaremos o teste da raz ao de verossimilhan ca com distribui c ao de gama generalizada comparada com as distribui coes Exponencial, Weibull, Log-Normal. Seja a fun cao de verossimilhan ca dada por:
n

L() =
i=1

f (ti ; )

De modo que derivando o log(L()) obtemos os estimadores de m axima verossimilhan ca. U ( ) = log(L()) =0

6.2

Distribui c ao Gama Generalizada

Sua fun c ao de densidade e dada por: f (t) = onde:


(k ) e a fun cao gama. e o par ametro de escala. , k s ao os par ametros de forma.

tk1 exp (k )k

t>0

Propriedades:

=k=1 k=1 =1 k

tem se tem se tem se

T Exp() T W eibull(, ) T Gama(k, )

tem se

T Log normal 16

6.3

Teste da Raz ao de Verossimilhan ca

Dada a hip otese: H0 : O modelo de interesse e adequado 1 Modelo Generalizado e obten c ao do valor do logar tmo de verossimiG ) lhan ca log L( 2 Modelo de interesse e obten c ao do valor do logar tmo de sua fun c ao M ) de verossimilhan ca valor do log L(

T RV = 2 log

M ) L( G ) L(

M ) log L( G )) = 2 log L( G ) log L( M ) 2 = 2 log L( p,1

onde p e a difer en ca entre o n umero de par ametros dos dois modelos e para um n vel de signic ancia 100% rejeitamos a hip otese H0 para valores 2 T RV > p,1 Tabela 6: TRV Loglik(model) TRV -244.62 -242.90 2 (244.62 242.9) = 3.46 -242.70 2 (244.62 242.7) = 3.85 -235.80 2 (244.62 235.8) = 17.63

Modelo Gamma Exponencial Weibull Log-Normal

valor-p 0.177 0.050 0.000070

Como P (2 cao Exponencial 1,10.05 > T RV = 3.46) = 0.177 para a distribui n ao rejeitamos a hip otese H0 , ou seja, a distribui c ao Expoencial e adequada. OBs: Este fato contraria o que nossa an alise explorat oria e gr aca, por em como o resultado num erico e sempre mais forte que as interpreta c oes gr acas, passamos a fazer uso da distribui c ao exponencial para o ajuste dos dados.

17

6.4

Res duos de Cox-Snell

O resultado do teste TRV nos leva a recorrer ` a an alise de res duos Cox-Snell. ti |Xi ), e i = ( .) onde ( e a fun c ao de risco acumulada obtida do modelo ajustado. Exponencial: e i = ti e5.08+1.16rt Weibull: e i = ti e5.16+1.196rt Log-Normal: e i = log 1
0.935

log(ti ) 4.39 + 1.03 rt 1.25

Figura 16: Res duos de Cox-Snell

Figura 17: Modelos Exponencial, Weibull, Log-Normal

Pela an alise gr aca observamos n ao h a uma grande diferen ca entre os modelos tanto pelos pontos alinhados quanto pelos gr acos com as distribui coes

18

sob a surva de sobreviv encia de Kaplan-Meier, com isso seguimos com o resultado do teste TRV. Basta saber se a vari avel Regime Terap eutico rt e importante para explicar o modelo. Ent ao testaremos a seguinte hipotese: 1 = 0 e H1 : 1 = 0 H0 : Com aux lio do R, temos: ajust1<-survreg(Surv(tempo,cen)~rt, dist=exponential) summary(ajust1) Call: survreg(formula = Surv(tempo, cen) ~ rt, dist = "exponential") Value Std. Error z p (Intercept) 5.08 0.466 10.90 1.21e-27 rt -1.16 0.273 -4.23 2.32e-05 Ao n vel de signic ancia = 0.05 rejeitamos a hip otese H0 , logo , a vari avel rt e importante para explicar os dados. Portanto nosso modelo e dado por: (t|x) = exp S t exp(5.08 1.16 rt)

Modelo de Regress ao de Cox

Como j a vimos, nosso conjunto de dados possui apenas uma covari avel que por sua vez e um indicador de grupos, ou seja: rt = Sejam 1 (t) a fun ca o da taxa de falha do grupo 1 2 (t) a fun ca o da taxa de falha do grupo 2 de modo que 2 (t) = k, t com k = exp (x) 1 (t) ou seja, a raz ao entre os grupos e uma constante para todo o tempo de estudo, com isso nosso Modelo de Cox, pode ser dado por: (t) = 2 (t) = 1 (t) exp ( ) , se rt = 1 2 (t) = 1 (t) exp (2 ) , se rt = 2. 19 1, se 2, se Radioterapia (grupo 1) Radioterapia + Quimioterapia (grupo 2).

Ap endice

Cap tulo 4

Tabela 4.4 require(survival) cancro<-read.table("cancromama.txt",header = T) attach(cancro) ekm<- survfit(Surv(tempo,cens)~1) summary(ekm) Figura 6 plot(ekm,lty=c(1),main="C^ ancer de Mama ", xlab="Tempo de Tratamento (meses)",ylab="S(t) estimada") legend(30,0.98,lty=(1),c("Estimador Kaplan Meier"),bty="n") Tabela 4.5 ekmg<- survfit(Surv(tempo,cens)~rt) summary(ekmg) Figura 7 plot(ekm, lty=c(2,1), xlab="Tempo at e o Desmame (meses)", ylab="S(t) estimada") text(15,0.95, c("A Crian ca tem contato com o pai"), bty="n", cex=0.85) legend(10,0.85,lty=(1),c("Sim"),bty="n", cex=0.80) legend(15,0.85,lty=(2),c("N~ ao"),bty="n", cex=0.80)

Cap tulo 5

Figura 8 -------------- Modelo Exponencial -------------------fexp<-function(t, alpha){( 1/alpha ) * exp( -(t/alpha) ) sexp<-function(t, alpha){ exp(-(t/alpha)) } lambdaexp<-function(alpha){ 1/alpha } }

Wf1<-curve(fexp(x,1.0),0,6) 20

Wf2<-curve(fexp(x,0.7),0,6) Wf3<-curve(fexp(x,0.5),0,6) Ws1<-curve(sexp(x,1.0),0,6) Ws2<-curve(sexp(x,0.7),0,6) Ws3<-curve(sexp(x,0.5),0,6)

par(mfrow=c(1,3)) plot(Wf1$x,Wf1$y,type=n,xlab="Tempo",ylab="f(t)", main=Fun c~ ao Exponencial) lines(Wf1$x,Wf1$y ,col="black" ,lty=c(4)) lines(Wf2$x,Wf2$y ,col="blue" ,lty=c(2)) lines(Wf3$x,Wf3$y ,col="red" ,lty=c(3)) text(3.5,0.90, c("alpha = 1.0"), bty="n", cex=0.95) text(3.5,0.85, c("alpha = 0.7"), bty="n", cex=0.95) text(3.5,0.80, c("alpha = 0.5"), bty="n", cex=0.95) legend(4.2,0.921,lty=(4),c(" "),bty="n", cex=0.80) legend(4.2,0.875,lty=(2),c(" "),bty="n", cex=0.80) legend(4.2,0.825,lty=(3),c(" "),bty="n", cex=0.80)

plot(Ws1$x,Ws1$y,type=n,xlab="Tempo",ylab="s(t)",main=Fun c~ ao Sobreviv^ encia )

lines(Ws1$x,Ws1$y ,col="black" ,lty=c(1)) lines(Ws1$x,Ws2$y ,col="blue" ,lty=c(2)) lines(Ws1$x,Ws3$y ,col="red" ,lty=c(3)) text(3.5,0.90, c("alpha = 1.0"), bty="n", cex=0.95) text(3.5,0.85, c("alpha = 0.7"), bty="n", cex=0.95) text(3.5,0.80, c("alpha = 0.5"), bty="n", cex=0.95) legend(4.2,0.921,lty=(1),c(" "),bty="n", cex=0.80) legend(4.2,0.875,lty=(2),c(" "),bty="n", cex=0.80) legend(4.2,0.825,lty=(3),c(" "),bty="n", cex=0.80)

plot(c(1:6),rep(lambdaexp(1.0),6),type=n,xlab="Tempo",ylab="lambda(t)" ,xlim=c(1,6) , ylim=c(0.5,2.5), main=Fun c~ ao da Taxa de Falha)

21

lines(rep(lambdaexp(1.0),6),col="black",lty=c(1)) lines(rep(lambdaexp(0.7),6),col="blue",lty=c(2)) lines(rep(lambdaexp(0.5),6),col="red",lty=c(3)) text(3,2.4, c("alpha = 1.0"), bty="n", cex=0.95) text(3,2.3, c("alpha = 0.7"), bty="n", cex=0.95) text(3,2.2, c("alpha = 0.5"), bty="n", cex=0.95) legend(3.6,2.45,lty=(1),c(" "),bty="n", cex=0.80) legend(3.6,2.35,lty=(2),c(" "),bty="n", cex=0.80) legend(3.6,2.25,lty=(3),c(" "),bty="n", cex=0.80)

Figura 9 -------------- Modelo Weibull -------------------f_tw<-function(t, gamma,alpha){( gamma/alpha^(gamma)) * (t^(gamma-1)) *exp( -(t/alpha)^gamma )} s_tw<-function(t,gamma ,alpha){ exp( -(t/alpha)^gamma ) } lambda_tw<-function(t,gamma,alpha){ (gamma/alpha^(gamma))*(t^(gamma-1)) }

par(mfrow=c(1,3)) plot(f_tw(0:800,1,150),type=n,xlab="Tempo",ylab="f(t)", main=Fun c~ ao de Densidade Weibull) lines(f_tw(0:800,0.5,50),col="black",lty=c(1)) lines(f_tw(0:800,1,150),col="blue",lty=c(2)) lines(f_tw(0:800,3,250),col="red",lty=c(3)) lines(f_tw(0:800,4,350),col="cyan",lty=c(4)) lines(f_tw(0:800,8,600),col="green",lty=c(5)) text(400,0.0065, text(400,0.0063, text(400,0.0061, text(400,0.0059, text(400,0.0057, c("[0.5;50]"), bty="n", cex=0.95) c("[1;150]"), bty="n", cex=0.95) c("[3;250]"), bty="n", cex=0.95) c("[4;350]"), bty="n", cex=0.95) c("[8;600]"), bty="n", cex=0.95) ,c(" ,c(" ,c(" ,c(" "),bty="n", "),bty="n", "),bty="n", "),bty="n", cex=0.80) cex=0.80) cex=0.80) cex=0.80)

legend(450,0.0066,lty=(1),col="black" legend(450,0.0064,lty=(2),col="blue" legend(450,0.0062,lty=(3),col="red" legend(450,0.0060,lty=(4),col="cyan" 22

legend(450,0.0058,lty=(5),col="green" ,c(" "),bty="n", cex=0.80)

plot(s_tw(0:800,1,150),type=n,xlab="Tempo",ylab="s(t)", main=Fun c~ ao Sobreviv^ encia ) lines(s_tw(0:800,0.5,50),col="black",lty=c(1)) lines(s_tw(0:800,1,150),col="blue",lty=c(2)) lines(s_tw(0:800,3,250),col="red",lty=c(3)) lines(s_tw(0:800,4,350),col="cyan",lty=c(4)) lines(s_tw(0:800,8,600),col="green",lty=c(5)) text(550,1.0, c("[0.5;50]"), text(550,0.98, c("[1;150]"), text(550,0.96, c("[3;250]"), text(550,0.94, c("[4;350]"), text(550,0.92, c("[8;600]"), bty="n", bty="n", bty="n", bty="n", bty="n", cex=0.95) cex=0.95) cex=0.95) cex=0.95) cex=0.95)

legend(600,1.02,lty=(1),col="black" ,c(" "),bty="n", cex=0.80) legend(600,1.0,lty=(2),col="blue" ,c(" "),bty="n", cex=0.80) legend(600,0.98,lty=(3),col="red" ,c(" "),bty="n", cex=0.80) legend(600,0.96,lty=(4),col="cyan" ,c(" "),bty="n", cex=0.80) legend(600,0.94,lty=(5),col="green" ,c(" "),bty="n", cex=0.80)

plot(lambda_tw(0:800,3,250),type=n,xlab="Tempo",ylim=c(0,0.07), ylab="s(t)",main=Fun c~ ao da Taxa de Falha ) lines(lambda_tw(0:800,0.5,50),col="black",lty=c(2)) lines(lambda_tw(0:800,1,150),col="blue",lty=c(3)) lines(lambda_tw(0:800,3,250),col="red",lty=c(1)) lines(lambda_tw(0:800,4,350),col="cyan",lty=c(4)) lines(lambda_tw(0:800,8,600),col="green",lty=c(5)) text(75,0.065, text(75,0.063, text(75,0.061, text(75,0.059, text(75,0.057, c("[0.5;50]"), c("[1;150]"), c("[3;250]"), c("[4;350]"), c("[8;600]"), bty="n", bty="n", bty="n", bty="n", bty="n", cex=0.95) cex=0.95) cex=0.95) cex=0.95) cex=0.95)

legend(115,0.066,lty=(2),col="black" ,c(" "),bty="n", cex=0.80) legend(115,0.064,lty=(3),col="blue" ,c(" "),bty="n", cex=0.80) 23

legend(115,0.062,lty=(1),col="red" ,c(" "),bty="n", cex=0.80) legend(115,0.060,lty=(4),col="cyan" ,c(" "),bty="n", cex=0.80) legend(115,0.058,lty=(5),col="green" ,c(" "),bty="n", cex=0.80)

Figura 10

---------------------- Modelo Log-Normal ---------------------------search() .GlobalEnv # usar o valor pi no R fln<-function(t,u,sigma){(1/(sqrt(2*pi)*t*sigma))*exp(-((log(t)-u)/sigma )^2)/2} sln<-function(t,u ,sigma){ pnorm(((-log(t)+u)/sigma), mean=0,sd=1)} lambdaln<-function(t,u,sigma){ fln(t,u,sigma)/sln(t,u,sigma) } Wf1<-curve(fln(x,0,0.5),0,4) Wf2<-curve(fln(x,0,0.7),0,4) Wf3<-curve(fln(x,1,1.5),0,4) Wf4<-curve(fln(x,1,0.7),0,4) Wf5<-curve(fln(x,1,2.0),0,4) Ws1<-curve(sln(x,0,0.5),0,4) Ws2<-curve(sln(x,0,0.7),0,4) Ws3<-curve(sln(x,1,1.5),0,4) Ws4<-curve(sln(x,1,0.7),0,4) Ws5<-curve(sln(x,1,2.0),0,4) Wl1<-curve(lambdaln(x,0,0.5),0,4) Wl2<-curve(lambdaln(x,0,0.7),0,4) Wl3<-curve(lambdaln(x,1,1.5),0,4) Wl4<-curve(lambdaln(x,1,0.7),0,4) Wl5<-curve(lambdaln(x,1,2.0),0,4) par(mfrow=c(1,3)) plot(Wf1$x,Wf1$y,type=n, xlab="log(Tempo)",ylab="f(t)", main=Fun c~ ao de Densidade Log-Normal, ylim=c(0,0.5)) lines(Wf1$x,Wf1$y lines(Wf2$x,Wf2$y lines(Wf3$x,Wf3$y lines(Wf4$x,Wf4$y lines(Wf5$x,Wf5$y ,col="blue" ,col="red" ,col="cyan" ,col="green" ,col="black" ,lty=c(1)) ,lty=c(2)) ,lty=c(3)) ,lty=c(4)) ,lty=c(5)) 24

text(2,0.45, text(2,0.43, text(2,0.41, text(2,0.39, text(2,0.37,

c("[0;0.5]"), c("[0;0.7]"), c("[1;1.5]"), c("[1;0.7]"), c("[0;0.7]"),

bty="n", bty="n", bty="n", bty="n", bty="n",

cex=0.95) cex=0.95) cex=0.95) cex=0.95) cex=0.95) ,c(" ,c(" ,c(" ,c(" ,c(" "),bty="n", "),bty="n", "),bty="n", "),bty="n", "),bty="n", cex=0.80) cex=0.80) cex=0.80) cex=0.80) cex=0.80)

legend(2.5,0.46,lty=(1),col="black" legend(2.5,0.44,lty=(2),col="blue" legend(2.5,0.42,lty=(3),col="red" legend(2.5,0.40,lty=(4),col="cyan" legend(2.5,0.38,lty=(5),col="green"

plot(Ws1$x,Ws1$y,type=n, xlab="log(Tempo)",ylab="f(t)", main=Fun c~ ao de Sobreviv^ encia, ylim=c(0,1.2)) lines(Ws1$x,Ws1$y lines(Ws1$x,Ws2$y lines(Ws1$x,Ws3$y lines(Ws1$x,Ws4$y lines(Ws1$x,Ws5$y ,col="blue" ,col="red" ,col="cyan" ,col="green" ,col="black" ,lty=c(1)) ,lty=c(2)) ,lty=c(3)) ,lty=c(4)) ,lty=c(5))

text(2,1.2, c("[0;0.5]"), bty="n", cex=0.95) text(2,1.16, c("[0;0.7]"), bty="n", cex=0.95) text(2,1.12, c("[1;1.5]"), bty="n", cex=0.95) text(2,1.08, c("[1;0.7]"), bty="n", cex=0.95) text(2,1.04, c("[1;2.0]"), bty="n", cex=0.95) legend(2.5,1.23,lty=(1),col="black" legend(2.5,1.19,lty=(2),col="blue" legend(2.5,1.15,lty=(3),col="red" legend(2.5,1.11,lty=(4),col="cyan" legend(2.5,1.07,lty=(5),col="green" ,c(" ,c(" ,c(" ,c(" ,c(" "),bty="n", "),bty="n", "),bty="n", "),bty="n", "),bty="n", cex=0.80) cex=0.80) cex=0.80) cex=0.80) cex=0.80)

plot(Wl1$x,Wl1$y,type=n, xlab="log(Tempo)",ylab="f(t)", main=Fun c~ ao da Taxa de falha , ylim=c(0,1.0)) lines(Wl1$x,Wl1$y ,col="blue" lines(Wl2$x,Wl2$y ,col="red" lines(Wl3$x,Wl3$y ,col="cyan" ,lty=c(1)) ,lty=c(2)) ,lty=c(3)) 25

lines(Wl4$x,Wl4$y ,col="green" ,lty=c(4)) lines(Wl5$x,Wl5$y ,col="black" ,lty=c(5)) text(2,1.0, c("[0;0.5]"), bty="n", cex=0.95) text(2,0.97, c("[0;0.7]"), bty="n", cex=0.95) text(2,0.94, c("[1;1.5]"), bty="n", cex=0.95) text(2,0.91, c("[1;0.7]"), bty="n", cex=0.95) text(2,0.88, c("[1;2.0]"), bty="n", cex=0.95) legend(2.3,1.03,lty=(1),col="black" ,c(" "),bty="n", cex=0.80) legend(2.3,1.0,lty=(2),col="blue" ,c(" "),bty="n", cex=0.80) legend(2.3,0.97,lty=(3),col="red" ,c(" "),bty="n", cex=0.80) legend(2.3,0.94,lty=(4),col="cyan" ,c(" "),bty="n", cex=0.80) legend(2.3,0.91,lty=(5),col="green" ,c(" "),bty="n", cex=0.80)

Refer encias
[1] http://www.portalaction.com.br [2] http://www.wikipedia.com [3] An alise de Sobreviv encia Aplicada, E.R. Colosimo e S.R.Giolo. 1 Edi c ao [4] Material das aulas.

26

Você também pode gostar