Escolar Documentos
Profissional Documentos
Cultura Documentos
Trabalho de Licenciatura em
Estatı́stica
Trabalho de Licenciatura em
Estatı́stica
Declaro por minha honra que este trabalho é resultado da minha própria investigação, que
nunca foi submetido para outro grau que não seja o indicado de Licenciatura em Estatı́stica, na
Faculdade de Ciências da Universidade Eduardo Mondlane.
À minha noiva
À minha filha
Agradeço aos docentes do DMI em geral, pelos conhecimentos transmitidos ao longo da formação,
mesmo diante das dificuldades impostas pela pandemia de Covid-19, souberam adoptar medidas
alternativas para a continuidade do processo de ensino e aprendizagem, e agradeço em especial
aos docentes: Doutor Adelino Martins, meu docente e supervisor deste trabalho, pela forma
sábia como tem transmitido os conhecimento, pela sua paciencia e disponibilidade sempre que
eu precisasse de auxı́lio; Doutor Miranda Muaualo pelos ensinamentos que não se limitavam
apenas em ensinar a ciência, e por ter se posicionado como o verdadeiro pai, sempre disponı́vel
para prestar seu apoio;
Agradeço a minha famı́lia, colegas da turma e amigos pelo apoio incondicional, seja financeiro,
moral e espiritual proporcionados durante o perı́odo de formação;
A todos que directa ou indirectamente tenham dado qualquer tipo de apoio, o meu muito obri-
gado.
Keywords: Survival analysis; Semi-parametric model; Cure fraction; Risk of death; Expecta-
tion maximization algorithm.
EM Expectativa-Maximização
EP Erro Padrão
PH Proportional Hazards
TB Tuberculose
US Unidade Sanitária
2 Revisão de literatura 4
2.1 Definição de conceitos sobre tuberculose . . . . . . . . . . . . . . . . . . . . . 4
2.1.1 Tuberculose quanto à resistência aos fármacos . . . . . . . . . . . . . 4
2.1.2 Tuberculose quanto à localização da lesão . . . . . . . . . . . . . . . . 4
2.1.3 Tuberculose quanto à confirmação laboratorial . . . . . . . . . . . . . 5
2.1.4 Tuberculose quanto ao sero-estado de HIV . . . . . . . . . . . . . . . 5
2.2 História de tuberculose . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.3 Transmissão, factores de risco e diagnóstico da tuberculose multirresistente . . 6
2.4 Tratamento da tuberculose . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.4.1 Tratamento de tuberculose multirresistente . . . . . . . . . . . . . . . 8
2.5 Tuberculose no mundo, na África e em Moçambique . . . . . . . . . . . . . . 8
2.6 Sobrevivência de pacientes com TB-MR . . . . . . . . . . . . . . . . . . . . . 9
2.7 Análise de sobrevivência . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.7.1 Dados censurados e trancados . . . . . . . . . . . . . . . . . . . . . . 10
2.7.2 Função de sobrevivência . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.7.3 Função de risco . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.7.4 Relação entre as funções de sobrevivência . . . . . . . . . . . . . . . . 14
2.7.5 Modelos de estimação não-paraméricos . . . . . . . . . . . . . . . . . 15
2.7.6 Testes de comparação das curvas de sobrevivência . . . . . . . . . . . 18
2.7.7 Modelos de sobrevivência semi-paramétricos . . . . . . . . . . . . . . 21
2.7.8 Modelos de sobrevivência paramétricos . . . . . . . . . . . . . . . . . 23
2.7.9 Estimação dos parâmetros em modelos de sobrevivência paramétricos . 25
2.7.10 Modelos paramétricos de sobrevivência com fracção de cura . . . . . . 26
2.7.11 Estimação dos parâmetros em modelos paramétricos com fracção de cura 28
2.7.12 Modelos semi-paramétricos de sobrevivência com fracção de cura . . . 28
2.7.13 Modelo PHMC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.7.14 Modelo AFTMC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.7.15 Função de probabilidade de cura . . . . . . . . . . . . . . . . . . . . . 32
3 Material e métodos 36
3.1 Material . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.2 Métodos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
4 Resultados e discussão 38
4.1 Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
4.1.1 Descrição do tempo de sobrevivência . . . . . . . . . . . . . . . . . . 39
4.1.2 Modelos de sobrevivência . . . . . . . . . . . . . . . . . . . . . . . . 41
4.1.3 Modelo de sobrevivência - solução inicial . . . . . . . . . . . . . . . . 41
4.1.4 Curvas de sobrevivência estimadas . . . . . . . . . . . . . . . . . . . . 43
4.2 Discussão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
5 Conclusões e recomendações 50
5.1 Conclusões . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
5.2 Recomendações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
1 Introdução
1.1 Contextualização
Segundo o Programa Nacional de Combate à Tuberculose (PNCT, 2012), a tuberculose (TB) é
uma doença infecciosa, cujo agente etiológico denomina-se Micobacterium tuberculosis, uma
bactéria que se espalha de pessoa para pessoa através do ar. A tuberculose geralmente afecta os
pulmões, mas também pode afectar outras partes do corpo, como o cérebro, os rins ou a coluna
vertebral. Na maioria dos casos, a tuberculose é tratável e curável, no entanto, pessoas com
tuberculose podem morrer se não receberem tratamento adequado.
Ainda de acordo com o PNCT (2012), em 2007 Moçambique foi o 19° paı́s com elevado número
de casos de TB, entre os 22 paı́ses com maior peso da TB no mundo. O primeiro estudo no paı́s
sobre a tuberculose multirresistente (TB-MR) foi realizado entre os anos 1998 e 1999 e mostrou
uma prevalência de 3.4% e o segundo estudo realizado entre os anos 2007 e 2008, também
mostrou a manutenção da prevalência em 3.4%, sendo que a Organização Mundual de Saúde
(OMS), classifica como alta prevalência de TB-MR quando está a um nı́vel acima de 3.0% de
casos novos.
De acordo com o Centro de Controle e Prevenção de Doenças (CDC, 2012), a TB-MR é causada
por organismos resistentes a pelo menos isoniazida e rifampicina, os dois medicamentos mais
potentes contra a TB, e pode evoluir ainda para tuberculose extensivamente resistente (TB-XR),
uma condição rara de TB-MR na qual os pacientes além de oferecer resistência a isoniazida e
rifampicina, também são resistentes a qualquer fluoroquinolona e pelo menos três outros medi-
camentos da segunda linha, nomeadamente a amicacina, canamicina ou capreomicina.
Segundo o PNCT (2017), 40% dos casos de TB notificados apresentavam co-infecção de tu-
berculose e o virus de imunodeficiência humana (TB/HIV), os casos notificados de TB-MR
aumentaram em 46.4%, com uma taxa de sucesso no tratamento de 47% e taxa de óbito por
TB-MR de 26%. Conforme Ribeiro (2018), a OMS reconhece a TB como uma doença infecto-
contagiosa de maior mortalidade no mundo, superando o HIV e a Malária juntos.
De acordo com OMS (2021), a pandemia de Covid-19 causou uma redução substancial na
notificação de casos novos de TB e consequentemente um aumento no número de mortes. Sabe-
se que até 2019, a TB ocupava o 13º lugar na lista das principais causas de morte a nivel mundial,
no entanto, em 2020 a tuberculose se tornou a 2ª causa de morte, sendo que a pandemia de
Covid-19 tornou-se a 1ª causa de morte, tendo revertido os esforços dos governos mundiais e
em especial, os governos Africanos que haviam conseguido reduzir a mortalidade em 5.6% por
ano.
Segundo Coutinho (2016), o tempo mediano de sobrevivência em indivı́duos com TB-MR foi
de 1452 dias. O maior risco de morte está em indivı́duos com idade igual ou superior a 60 anos,
pacientes coinfectados com HIV, padrão de resistência extensiva ou extremamente resistente,
inı́cio de tratamento após falência, uso de drogas, resistência a etambutol e a estreptomicina.
Os estudos realizados pelos autores como Rocha (2013), Balabanova et al. (2016) e Melo et
al. (2017), chegaram à conclusões similares às dos dois autores anteriores, enfatizando menor
tempo de sobrevivência em pacientes coinfectados pelo HIV, padrão de resistência multirresis-
tente e extremamente resistente, gênero, idade e localização da lesão.
Qual é o risco associado aos diferentes factores que influênciam o tempo de sobrevivência de
pacientes com Tuberculose Multirresistente?
1.3 Objectivos
1.3.1 Objectivo geral
• Verificar a influência dos factores no tempo de sobrevivência dos pacientes com tubercu-
lose multirresistente;
1.4 Justificação
Tendo em conta a magnitude que a TB-MR representa entre as principais causas de morte em
Moçambique e em todo o mundo, o acompanhamento dos pacientes desde a data do diagnóstico
até o desfecho é importante. Assim, este estudo pretende verificar em que medida os factores
como TB/HIV, padrão de resistência, idade, sexo, tipo de entrada, etc, associados a TB-MR
influenciam o tempo que um paciente leva desde o diagnóstico até a morte por esta doença.
O entendimento do risco associado a esses factores, contribui na construção de conhecimento
e compreensão da problemática da resistência da tuberculose aos medicamentos, podendo dar
mais subsı́dios aos profissionais de saúde e a sociedade em geral, no planeamento de acções
para o controlo desses riscos e prolongar o tempo de vida dos pacientes com TB-MR.
2 Revisão de literatura
Neste capı́tulo, são definidos os conceitos e história sobre a TB, seu impacto sócio-económico
e cultural, assim como a descrição da técnica estatı́stica aplicada neste trabalho.
De acordo com Gomes (2013), a designação dos diferentes tipos de tuberculose tem haver com
a localização da lesão, isto é, o orgão acometido pela bactéria, e classifica-se em:
Tuberculose pulmonar: Consiste em uma forma comum da doença e ocorre devido à entrada
do bacilo pelas vias respiratórias superiores, alojando-se nos pulmões. É caracterizada por uma
tosse seca e constante com ou sem sangue, sendo que os bacilos espelidos ao tossir constituem a
principal forma de contágio, pois a saliva espelida contém o bacilo de Koch, o agente etiológico
da tuberculose.
Tuberculose óssea: Ocorre quando o bacilo penetra e desenvolve-se nos ossos, o que pode
provocar dor e inflamação e é uma condição de didı́cil diagnosticar.
Tuberculose miliar: É a forma mais grave da tuberculose, ocorre quando o bacilo entra na
corrente sanguı́nea e chega a todos os orgãos, havendo risco de meningite, além do pulmão,
assim como outros orgãos de corpo serem severamente acometidos.
Tuberculose ganglionar: É causado pela entrada do bacilo no sistema linfático, podendo aco-
meter os ganglios do tórax, virı́lha, abdômen ou, frequentemente no pescoço. Por ser extrapul-
monar não é contagioso e tem cura quando tradado de maneira correcta.
Tuberculose pleural: Ocorre quando o orgão acometido é a pleura, tecido que reveste os
pulmões, causando sérias dificuldades de respirar. Esse tipo de tuberculose extrapulmonar,
portanto, não é contagiante e pode ser adquirido ao entrar em contacto com um indivı́duo com
tuberculose pulmonar.
Caso Novo: Um paciente que nunca foi tratado para TB (sensı́vel ou resistente) ou fez trata-
mento por menos de 1 mês.
Recaı́da: Pacientes com tratamento prévio de TB que terminaram o último ciclo de tratamento
como curados ou tratamento completo, e voltam com novo quadro de TB.
Perda de seguimento: Pacientes previamente tratados e que foram declarados como perda de
seguimento (mais de 60 dias de ausência) no último curso de tratamento.
Contactos: São as pessoas que partilham o mesmo ambiente por perı́odo de tempo prolongado
(8 ou mais horas/dia) com pacientes que apresentam tosse e que eliminam bacilos da tuberculose
no ar (tenham ou não resultado de baciloscopia positivo).
Segundo Barreto et al. (2002), foi em 1882 que Robert Koch descobriu a existência do bacilo da
tuberculose e sua relação causal com a doença. Com esta descoberta, as pesquisas avançaram
muito rapidamente e o diagnóstico tornou-se algo menos empı́rico em que o exame clı́nico era
até então, o único meio de diagnóstico disponı́vel, desta forma, os exames clı́nicos passaram a
ter confirmação laboratorial feito com base no exame do escarro para visualização do bacilo e
na metade do século XX descobriu-se medicamentos eficazes para cura da tuberculose.
no ar por várias horas, podendo ser inaladas por outras pessoas, portanto, essas goticulas são
responsáveis pela transmissão da bactéria, sobretuto em ambientes com pouca ou nenhuma
ventilação. Em populações com maior proporção de pessoas com expectoração ou fraco con-
trolo da doença, maior será a sua disseminação e, dependendo da distribuição dos factores de
risco a disseminação da doença pode ser mais fácil.
Segundo o MISAU (2018) a epidemia da tuberculose em Moçambique tem sido influenciada
consideravelmente por factores como as condições económicas, incluindo a pobreza e o desem-
prego, as condições ambientais, incluindo bairros urbanos superlotados, a epidemia de HIV, as
condições sociais, incluindo as migrações por trabalho, as infraestruturas de saúde insuficientes,
etc. Conforme Pires (2021), os indivı́duos infectados pelo HIV, são mais susceptı́veis devido a
comprometimento imunológico, outros factores de risco para o desenvolvimento da tuberculose
activa são a subnutrição, as diabetes, o tabagismo ou o consumo de álcool.
De acordo com PNCT (2019), o diagnóstico definitivo da TB-MR, requer que o bacilo seja
detectado e determinada a resistência aos medicamentos usados para o tratamento da TB. Isso
pode ser feito isolando a bactéria pela cultura, identificando-a como Mycobacterium tubercu-
losis e submetendo ao teste de sensibilidade antibiótica (TSA) em meios sólido ou lı́quido, ou
usando ainda testes moleculares para detectar mutações associadas à resistência a rifampicina
através da tecnologia GeneXpert.
Óbito: Paciente com TB-Resistente que morre por qualquer razão antes de iniciar o tratamento
ou durante o curso do tratamento.
Fase intensiva (Estabilização): Esta fase inicial do tratamento tem como objectivo reduzir a
transmissibilidade, morbilidade e a resistência adquirida pela redução da população bacilı́fera
(carga bacilar). Esta fase dura entre três a quatro meses, sendo que no quarto mês, o paci-
ente clinicamente diagnosticado que apresenta melhorias passa para fase de manutenção, caso
contrário, o tratamento inicial prolonga à fase intensiva até um máximo de seis meses.
Fase de manutenção: Esta fase tem como objectivo eliminar os bacilos persistentes, proporci-
onando cura efectiva e duradoura da doença (esterilização e prevenção de recaı́das). No actual
regime de tratamento com medicamentos orais, esta fase geralmente consiste em continuar com
os medicamentos administrados na fase intensiva, com a excepção do Linezolide, que é descon-
tinuado.
De acordo com a OMS (2019) e o PNCT (2020), Moçambique consta da lista dos 30 paı́ses
com elevado peso de Tuberculose e dos 14 paı́ses com elevado peso da TB/HIV e TB-MR no
mundo, com uma incidência estimada de 551 casos por 100.000 habitantes, portanto, a TB-MR
continua sendo uma grande ameaça para a saúde pública. Estima-se que ocorrem anualmente,
163.000 novos casos de tuberculose em Moçambique, sendo cerca de 8.800 de TB-MR. Não
obstante, os esforços empreendidos, 5 em cada 10 casos de tuberculose permanecem não de-
tectados. A situação agrava-se ainda mais pelo surgimento de cada vez mais casos de estirpes
de Mycobacterium Tuberculosis, resistentes ao tratamento bem como ao peso da coinfecção
TB/HIV.
O primeiro estudo a utilizar a análise de sobrevivência foi publicado por John Graunt em
1662, intitulado Natural and Political Observations Made Upon the Bills of Mortality, no qual
calculou-se estatı́stica de mortalidade a partir de dados semanais que detalhavam os números e
as causas de morte no subúrbio de Londres (Guo, 2010). De acordo com Botelho et al. (2009),
na análise de sobrevivência a variável dependente é o tempo até a ocorrência de determinado
evento, ao contrário da estatı́stica clássica em que a variável de interesse é a própria ocorrência
do evento, por exemplo, desenvolver uma certa doença, cura ou um efeito colateral, etc. Na
análise de sobrevivência compara-se a rapidez com que os pacientes desenvolvem o evento de
interesse, ao fim de um certo instante de tempo.
Segundo Wienke (2011), Duchateau e Janssen (2008) e Cunha (2014), a principal caracteristica
da análise de sobrevivência é a presença de censura, que consiste na perda parcial de informação
temporal devido à interrupção de seguimento de alguns indivı́duos em observação ou devido ao
término do tempo de estudo antes da observação do evento de interesse em alguns indivı́duos
em observação.
Conforme Duchateau e Janssen (2008), nas pesquisas biomédicas, a censura pode ocorrer de-
vido à aspectos como: morte por outras causas não relacionadas com estudo; término do estudo
antes de observar o evento de interesse em alguns indivı́duos; perda de contacto; mudança de
procedimento; recusa do indivı́duo em continuar participando; abandono devido a efeitos ad-
versos de tratamento etc.
De acordo com Borges (2014), existem três tipos de censura, nomeadamente: (i) censura a es-
querda - acontece quando não se conhece o tempo de ocorrência do evento de interesse, mas
sabe-se que o evento ocorreu antes do inı́cio da observação; (ii) censura intervalar - ocorre
quando não se sabe o perı́odo exacto da ocorrência do evento de interesse, mas sabe-se que
aconteceu durante um certo intervalo de tempo, dentro do perı́odo de observação ou seguin-
mento dos indivı́duos; (iii) censura a direita - é aquela em que o tempo de observação termina
antes da ocorrência do evento de interesse em alguns indivı́duos em observação, ou seja, o
tempo provável ocorrência do evento de interesse é superior ao tempo do término de segui-
mento ou observação dos indivı́duos.
De acordo com Colosimo e Giolo (2006), a censura à direita, subdivide-se em três tipos, nome-
adamente, a censura de tipo I, ocorre quando o tempo de término do estudo é pré-estabelecido,
findo este perı́odo, todos os indivı́duos em observação que não observaram o evento de in-
teresse são censurados; censura de tipo II, ocorre quando se estabelece um número fixo de
eventos (mortes), ou seja, quando se alcança o número de ocorrências do evento de interesse
pré-estabelecido, termina o seguimento ou observação dos indivı́duos e os indivı́duos que não
observaram o evento de interesse são censurados e a censura aleatória, aquela que ocorre em
qualquer instante durante o perı́odo de observação ou seguimento dos indivı́duos.
Conforme Wienke (2011), a censura a direita do tipo I é a mais comum em aplicações de dados
reais de análise de sobrevivência. A Figura 1 mostra os diferentes mecanismos de censura,
em que os pacientes 2, 4 e 5 representam eventos completos, os pacientes 1 e 3 representam
censura devido a perda de seguimento, desistência ou riscos competitivos e os pacientes 6 e 7
representam a censura por término do tempo de estudo antes de observar o evento de interesse.
De acordo com Campos (2016), na análise de sobrevivência deve estar bem definido o tempo
de inı́cio da observação de cada indivı́duo, a escala de medida, neste caso, é quase sempre o
tempo, o tempo final, ou seja, o tempo de ocorrência do evento de interesse e a definição clara
do evento de interesse (falha, morte, reincidência, etc).
Segundo Cunha (2014), a condição para a exclusão dos indivı́duos é o trancamento, tendo em
conta que em alguns estudos relacionados às ciências biomédicas, os pacientes não são acom-
panhados no inı́cio do estudo, portanto, eles são incluı́dos na observação a partir do momento
que experimentam um certo evento em observação. Desta forma, surgem dois tipos de tranca-
mento: i. trancamento à esquerda - acontece quando o indivı́duo experimentou um certo evento
antes do inı́cio de observação, é usada quando apenas são incluı́dos na amostra indivı́duos que
sobrevivem tempo suficiente para que ocorra um determinado acontecimento antes do evento
de interesse e; ii. trancamento à direita - o critério de selecção inclui somente os indivı́duos ou
pacientes que sofreram o evento, logo o risco é superestimado, como em estudos que partem do
óbito.
De acordo com Wienke (2011), considerando uma amostra aleatótia de tamanho n, sejam
T1∗ , T2∗ , ..., Tn∗ , os tempos de sobrevivência i.i.d, com função de distribuição acumulada F e
C1 ,C2 , ...,Cn , os tempos de censura i.i.d com função de distribuição acumulada G, assumundo
que estas funções de distribuição são absolutamente contı́nua. Pode observar-se dados bivaria-
dos (T1 , ∆1 ), (T2 , ∆2 ), ..., (Tn , ∆n ), onde Ti = min{Ti∗ ,Ci }, denota o tempo de observação, e:
(
1 se Ti∗ ≤ Ci , isto é, Ti não é censurado
∆i =
0 se Ti∗ > Ci , isto é, Ti é censurado
onde ∆i é a variável indicadora de censura e assume-se neste trabalho uma censura não infor-
mativa e independência dos tempos de evento T ∗ e censura C.
Segundo Cordeiro e Demétrio (2008), o tempo de sobrevivência pode ser descrito formalmente
atravês das seguintes funções: (i) f (t), a função densidade de probabilidade do tempo de so-
brevivência; (ii) S(t), a função de sobrevivência, sendo S(t) = 1 − F(t) em que F(t) é a função
de distribuição acumulada de probabilidade; (iii) λ(t), a função de risco, que é uma medida do
risco instantâneo de morte no tempo t, sendo definida por λ(t) = F ′ (t)/{1 − F(t)}.
Segundo Wienke (2011), a função de sobrevivência S(t) define-se como sendo a probabilidade
do indivı́duo sobreviver para além do instante t.
Z ∞
S(t) = 1 − F(t) = 1 − P(T ∗ ≤ t) = f (u)du t ≥ 0, (1)
t
De acordo com Dutcheau e Janssen (2008), a função de distribuição acumulada F(t) é definida
como a probabilidade de um indivı́duo não sobreviver ao tempo t e é consequência da função
de sobrevivência.
iii. S(+∞) = lim S(t) = 0, quando o seguimento dos indivı́duos é feito por um perı́odo sufici-
t→∞
entemente longo, a função de sobrevivência é igual a zero.
Segundo Barros (2014), a função de risco, é dada pelo limite do quociente entre a probabilidade
de um indivı́duo falhar (observar o evento de interesse) num intervalo de tempo [t,t + ∆t) con-
siderando que o indivı́duo sobreviveu até o instante t e a variação do de tempo ∆t, podendo ser
monótona (crescente, decrescente) ou constante e é descrita pela seguinte expressão:
i. λ(t) > 0;
Z ∞
ii. λ(t)dt = ∞.
0
Segundo Colosimo e Giolo (2006), a função crescente indica que a taxa de risco em um in-
divı́duo aumenta com o passar do tempo, mostrando que existe um efeito gradual quando o
tempo tende ao infinito. A função constante indica que a taxa de risco não se altera com o pas-
sar do tempo, e a função decrescente mostra que a taxa de risco diminui a medida que o tempo
passa.
De acordo com Cordeiro e Demétrio (2008) Conhecendo-se apenas uma dessas funções (a
função de sobrevivência, risco ou a função densidade de probabilidade), tem-se diretamente
as outras duas. Por exemplo, para a distribuição exponencial com S(t) = exp(−λt), fica claro
que a função de risco é constante e dada por λ(t) = λ. Para a distribuição de Weibull tem-se
λ(t) = αt α−1 ; logo, S(t) = exp(−t α ). A função de risco nesse caso cresce com o tempo se
α > 1 e descresce se α < 1.
Os modelos de análise de sobrevivência visam construir estimadores das funções usadas para
especificar o tempo de vida em relação aos factores associados e estão organizadas em três
categorias, nomeadamente, modelos não-paramétricos, modelos semi-paramétricas e modelos
paramétricos, e são descritos a seguir.
Grupos
1 2
Evento d1 j d2 j dj
Não evento n1 j - d1 j n2 j - d2 j n j - d j
n1 j n2 j nj
Fonte: Colosimo e Giolo (2006)
Estimador de Kaplan-Meier
b é uma função escada com degraus nos tempos observados de ocorrência do evento de
S(t)
tamanho 1/n, em que n é o tamanho da amostra. Se exitirem empates em um certo tempo t, o
tamanho do degrau fica multiplicado pelo número de empates. O estimador de Kaplan-Meier,
na sua construção, considera tanto intervalos de tempo, quanto o número de eventos distintos.
Os limites dos intervalos de tempo são os tempos de ocorrência de evento na amostra.
Segundo Colosimo e Giolo (2006), além do estimador de Kaplan-Meyer, existem mais dois
estimadores não-paramétricos e são eles o estimador conhecido por Nelson-Aalen, proposto
por Nelson (1972) e suas propriedades estudadas por Aalen (1978) e o estimador das Tábuas de
vida.
Em cada tempo de ocorrência de evento t j , os dados podem ser dispostos em forma de uma
tabela de contingência 2 x 2 com di j eventos e ni j - di j sobreviventes na coluna i, conforme a
Tabela 1.
A expressão geral do estimador de Kaplan-Meier pode então ser apresentada após as considerações
preliminares seguintes:
• n j o número de indivı́duos sob risco em t j , ou seja, os indivı́duos que não falharam e não
foram censurados até o instante imediatamente anterior a t j .
nj −dj dj
b =
S(t) ∏ = ∏ 1− . (4)
j:t j ≤t nj j:t j ≤t nj
Para melhor entender o estimador Kaplan-Meier apresenta-se a Figura 3 onde foram estudados
os tempos de sobrevivência de dois grupos distintos, cada grupo foi submetido a um certo tipo
de tratamento médico (Esteróide e Placebo), onde é possivel observar que o grupo de esteróide
tende a morrer mais rápido do que o grupo de placebo (controlo).
De acordo com Colosimo e Giolo (2006), para construir intervalos de confiança e testar hipóteses
para S(t), faz-se necessário avaliar a precisão do estimador de Kaplan-Meier. Este estimador,
assim como outros, esta sujeito à variações que devem ser descritas em termos de estimações
intervalares.
h i h i2 dj
Var S(t) = S(t)
d b b ∑ . (5)
j:t j <t n j (n j − d j )
Segundo Alencar et al. (2019), a expressão é conhecida por fórmula de Greenwood. Tendo S(t) b
fixo para um certo instante t, uma distribuição assimptotica normal, o intervalo a 100x(1 − α)%
de confiança para S(t) é dado por:
r h i
S(t) ± zα/2 Var
b b ,
d S(t) (6)
Estimador de Nelson-Aalen
Segundo Carmes (2015), o estimador foi inicialmente proposto por Nelson (1972) e retomado
por Aalen (1978), daı́ ser denominado estimador de Nelson-Aalen. Permite estimar a função de
taxa de risco acumulado, Λ(t), sendo o estimador para esta função dado por:
b = dj
Λ(t) ∑ , (7)
j:t j <t n j
com d j e n j são defnidos do mesmo modo que no estimador de Kaplan Meier. Em con-
sequência,o estimador para S(t) é:
n o
b = exp −Λ(t)
S(t) b , (8)
h i h i2 dj
Var
d S(t)b = S(t)
b ∑ 2 . (9)
j:t j <t nj
Da mesma maneira que para o estimador de Kaplan-Meier, recomenda-se a utilização de transformações,
b = log[−log(S(t))],
tal como U(t) b a fm de se obter estimativas intervalares para S(t) restritas ao
intervalo [0,1].
Tábuas de Vida
De acordo com Susser, et al (1998) Borges (2018), o primeiro cientista a tentar construir uma
tábua de mortalidade foi John Graunt publicou em 1662 seu livro Natural and Political Ob-
servations upon the Bills of Mortality, os primeiros métodos de construção das tábuas de vida
De acordo com Colosimo e Giolo (2006), a construção de uma tábua de vida consiste em dividir
o eixo do tempo em um certo número de intervalos. Supõe-se que o eixo do tempo foi dividido
em s + 1 intervalos, defnidos pelos pontos de corte, t1 ,t2 ,t3 , ...,ts , com I j = [t j−1 ,t j ) e j =
1, 2, 3, ..., s, em que t0 = 0 e ts = +∞.
O estimador da tábua de vida apresenta a fórmula (5) do estimador de Kaplan-Meier mas utiliza
um estimador ligeiramente diferente para q j uma vez que, neste caso, tem-se para d j e n j tal
que:
Dadas duas funções de sobrevivência S1 (t) e S2 (t), pode-se testar as seguintes hipóteses:
Para o testar as hipóteses, aplicam-se os seguintes testes: Teste Logrank; Teste de Gehan; Teste
de Tarone-ware e teste de Peto - Peto.
Teste de Logrank
Segundo Colosimo e Giolo (2006), o teste Logrank possibilita a análise dos desvios entre o
número de mortes observadas e o número de mortes esperadas. É construı́do com base no
número de eventos (denotados por d2 j ) observados em um dos grupos em cada tempo de
ocorrência de evento distinto t j ( j = 1, 2, ..., k) da amostra combinada (junção das duas amos-
tras individuais) e nos respectivos valores de eventos (denotados por e2 j ) nos tempos t j sob
a hipótese nula de não haver diferenças entre grupos, conforme ilustrado na Tabela 11, e a
estatı́stica de teste é expressa pela seguinte expressão:
h i2
k
∑ j=1 (d2 j − e2 j )
T= . (12)
∑kj=1 V2 j
Supondo que a distribuição de d2 j , é condicional à ocorrência de evento e censura até o instante
t j (fxando o total marginal de coluna) e ao número de eventos no tempo t j (fxando o total
marginal da linha), d2 j tem distribuição hipergeométrica:
n1 j n2 j
d1 j d2 j
p(d2 j |d j , n j ) = . (13)
nj
dj
Desta forma, tem-se V2 j e e2 j como a variância condicional e valor esperado de d2 j , dadas pelas
equações 15 e 16 respectivamente.
V2 j = n2 j (n j − n2 j )d j (n j − d j )n−2 −1
j (n j − 1) , (14)
e
e2 j = n2 j d j n−1
j . (15)
A estatı́stica T tem uma distribuição aproximada de qui-quadrado com 1 grau de liberdade para
grandes amostras e quanto maior o valor da estatı́stica de teste T, maior é a evidência para
rejeitar H0 , isto é, rejeita-se a hipotese nula se o valor calculado for superior ao valor tabelado,
(Velho, 2015).
Teste de Gehan
utilizado para testar a hipotese nula, de que não existe diferença nas funções de sobrevivência
dos dois grupos.
+1
se (tk > t j , δ j = 1) ou (tk = t j , δk = 0, δ j = 1)
Uk j = −1 se (tk < t j , δk = 1) ou (tk = t j , δk = 1, δ j = 0) , (16)
0 caso contrário
Para cada observação, k = 1, ..., m + n e atribuı́da uma pontuação Uk′ , que é igual à diferença
entre o número das restantes m + n − 1 e o número de observações que correspondem a tempo
de vida que e de certeza que tk . A estatı́stica de teste é dada por: U = ∑m+n ′
k=1 Uk para k : tk ∈
amostra 1. A esperança e a variância são dadas por:
m+n
mxn ′ 2
E(U) = 0 e var(U) = ∑ k .
U (17)
(m + n)(m + n − 1) k=1
p
Considerando a estatı́stica Z = U/ var(U), que sob a H0 , tem distribuição assimptótica N(0, 1).
Uma forma equivalente para a estatı́stica de teste e dada por:
r
UG = ∑ n j (d2 j − e2 j ), (18)
j=1
Assim sendo a estatı́stica WG tem distribuição assimptótica qui-quadrado (χ2 ) com 1 grau de
liberdade.
Teste de Tarone-Ware
De acordo com Karadeniz e Ercan (2017), o teste de Tarone-Ware atribui grande peso aos
perigos nos primeiros perı́odos, assim como o teste de Gehan-Wilcoxon. Ele usa a raiz quadrada
p
do número de indivı́duos em risco como peso w j = n j − d j O peso usado no teste de Tarone-
Ware é maior que o peso usado no teste de logrank, mas menor que o peso usado no teste de
Gehan-Wilcoxon.
Teste de Peto-Peto
De acordo com Karadeniz e Ercan (2017), o teste Peto-Peto atribui pesos que dependem do
percentil estimado da distribuição do tempo de evento. Eventos que ocorrem precocemente,
quando a função de sobrevivência estimada é grande, recebem pesos maiores, enquanto aquelas
na cauda direita da distribuição de tempo de ocorrência de evento recebem pesos menores. Este
teste é utilizado quando a razão de risco entre os grupos não é constante.
2
b j ) d2 j − d j n2 j −d2 j
∑ j S(t n j −d j
PP = (n1 j −d1 j )(n2 j −d2 j )d j (n j −2d j )
, (21)
∑kj=1 S(t
b j )2
(n j −d j )2 (n j −d j −1)
onde:
dj
S(t j ) = ∏ 1 −
b . (22)
t j <t nj −dj +1
De acordo com Raminelli (2015), um dos modelos frequentemente utilizado na análise de dados
de sobrevivência é o modelo de regressão semi-paramétrico de Cox.
A análise de regressão de Cox é aplicada aos estudos longitudinais em que se pretende fazer
uma avaliação do prognóstico dos indivı́duos em estudo, considerando neste modelo o tempo
de sobrevivência como variável resposta e diversos factores que se consideram associados ao
tempo de sobrevivência como variáveis explanatórias, que podem ser de vários tipos, nomeada-
mente, variáveis numéricas (discretas e contı́nuas) ou categóricas (Andrade e Cabbeti, 2012).
De acordo com Raminelli (2015), o modelo semi-paramétrico considera que a função taxa de
risco em um dado instante t é dado por:
Isto significa que as caracterı́sticas de um indı́duo têm um efeito multiplicador sobre a taxa de
risco base λ0 (ti ), calculada para o perı́odo t. Uma vez que a taxa de risco não pode assumir
valores negativos, g(xi ) é definida como uma função exponencial das variáveis explicativas:
onde λ0 (ti ) é conhecido como função taxa de risco base, ou seja, a taxa de risco em um in-
divı́duo sem considerar o efeito das variáveis, β = (β1 , β2 , ..., β p ) é o vector dos coeficientes
desconhecidos e xi = (xi1 , xi2 , ..., xip ) é o vector de p covariáveis observadas no indivı́duo i.
Diz-se riscos proporcionais devido a razão entre as taxas de risco para os indivı́duos com dife-
rentes valores ou categorias das variáveis explicativas x por serem independentes do tempo, isto
é, enquanto λ0 (ti ) depende do perı́odo de tempo, os coeficientes associados às variáveis expli-
cativas, β, mantêm-se constantes ao longo do tempo, definindo apenas a magnitude da função
ao longo do tempo (Carvalho et al., 2011).
exp xTi β
S(ti |xi ) = [S0 (ti )] , (24)
em que S0 (t) representa a função de sobrevivência base para o perı́odo t e pode ser obtida pela
seguinte expressão:
De acordo com Alves (2010), para aferir sobre o pressuposto de proporcionalidade acima refe-
rido é possı́vel recorrer tanto a abordagens gráficas como a testes estatı́sticos relacionados com
o ajustamento.
Segundo Silva (2021), uma das abordagens gráficas mais comuns é através do uso da transformação
log − log na função de sobrevivência estimada para cada uma das variáveis, que consiste em
fazer a representação gráfica de log[−logS(t)]
b em função do tempo t e verificar-se essas curvas
são paralelas. Aplicando esta transformação em 24 temos:
De acordo com Alves (2010), outra forma de avaliar graficamente este pressuposto é compa-
rando a curva de sobrevivência estimada pelo estimador de Kaplan-Meier, e a curva estimada
através da regressão de Cox com proporcionalidade de risco. Uma aproximação dessas duas
curvas de sobrevivência, para uma categoria da variável analisada, sugere que o pressuposto de
proporcionalidade é razoável.
Conforme Hosmer e Lemeshow (1999), a abordagem gráfica para avaliar o pressuposto de pro-
porcionalidade é um pouco subjectiva, pelo que é conveniente recorrer a testes estatı́sticos.
Assim, uma forma mais objectiva de avaliar o pressuposto da proporcionalidade é através da
análise dos resı́duos, ou seja, se os resı́duos não estiverem correlacionados com a duração então
o pressuposto de proporcionalidade não é violado. Através dos resı́duos Schoenfeld, definidos
para cada variável explicativa no modelo estimado, é possı́vel concluir sobre a proporcionali-
dade de cada uma das variáveis.
Um modelo de risco proporcional (PH) assume uma função da taxa de risco base comum a
todos os indivı́duos, que se desloca para cima, ou para baixo, como resultado do efeito das
variáveis, semelhante à regressão de Cox, com a diferença da taxa de risco base (λ0 (ti )) seguir
uma distribuição conhecida. A função da taxa de risco base e e função de sobrevivência são
semelhantes às definidas para a regressão de Cox nas Equações (23) e (24), respectivamente. Por
Tabela 2: Distribuições para função risco base, função de sobrevivência e função densidade de
probabilidade, excluindo o efeito das variáveis
exp(α)kt k−1
f0 (t) (1+exp(α)t k )2
Loglogı́stico α ∈ R, K > 0 S0 (t) 1
1+exp(α)t k
exp(α)kt k−1
λ0 (t) 1+exp(α)t k
h i
f0 (t) √1 exp 1
− 2γ (log(t) − µ)2
t 2πγ
Lognormal µ ∈ R, γ > 0
S0 (t) 1 − FN log(t)−µ
√
γ
λ0 (t) f (t)/S(t)
Fonte: Duchateau e Janssen (2008).
seu turno, num modelo AFT as variáveis têm um feito multiplicador sobre o tempo, aumentando
ou reduzindo a duração até à ocorrência do evento. A taxa de risco resulta da seguinte fórmula:
λ(t|x) = λ0 t exp (βx) exp (βx), (26)
S(t|x) = S0 t exp (βx) . (27)
Segundo Santos (2016), o uso dos modelos paramétricos com riscos proporcionais tem sido
bastante adequado na análise estatı́stica de dados em saúde, com destaque para os modelos
exponencial, weibull, log-normal e log-logı́stica, conforme ilustra a Tabela 2.
Segundo Colosimo e Giolo (2006), os parametros são medidas desconhecidas que descrevem
os modelos de probabilidade e que precisam ser estimados a partir das observações amostrais.
O metodo de máxima verossimilhança é uma opção apropriada para dados censurados, incor-
porando as censuras e relativamente simples, e possui propriedades óptimas para grandes amos-
tras.
Seja dada uma amostra de observações t1 ,t2 , ...,tn da população, em que todas as observações
são não censuradas. A função de máxima verosimilhança para o vector de parâmetros θ é
expressa por:
n
L(θ) = ∏ f (ti , θ), (28)
i=1
Portanto, é necessário dividir as observações censuradas e as não censuradas, uma vez que os
dados considerados são dados de tempo de vida. Ou seja, sejam r observações não censuradas,
(1, 2, ..., r) e n − r observações censuradas, (r + 1, r + 2, ..., n). Assim, a expressao para a função
de máxima verossimilhança que abrange todos os tipos de censura é expressa por:
r n n
L(θ) = ∏ f (ti , θ) ∏ S(ti , θ) = ∏[ f (ti , θ)]δi [S(ti , θ)]1−δi , (29)
i=1 i=r+1 i=1
onde S(ti ) é a função de sobrevivência representada pela equação (1) e δi é a variável indicadora
de evento ou censura. É comum trabalhar com o logarı́tmo da função de verossimilhança que é
dado por:
Para maximizar L(θ) ou ℓ(θ) e encontrar os valores de θ, basta resolver a derivada parcial dadas
por:
∂ln(L(θ))
U(θ) = = 0. (31)
∂θ
Como as equações são, em sua maioria, não lineares em θ e não apresentam solução analı́tica,
a equação deve ser resolvido por um método numérico, como o método de Newton Raphson.
lim S(t|x) = 0.
t→∞
Conforme Abreu e Rocha (2006) e Paes (2007), a existência de um elevado número de observações
censuradas, pode indicar uma fracção de indivı́duos curados. Assim, um modelo com fracção de
cura, ou modelo de cura, permite considerar duas proporções de indivı́duos: (i) π é a fracção
dos não curados; e (ii) (1 − π) a fracção dos indivı́duos curados. Portanto, considera uma
variável aleatória de Bernoulli Yi latente, tal que Yi ∼ Bernoulli(π), para separar indivı́duos
curados dos não curados. Ou seja,
(
0 Se o indivı́duo i é curado
Yi = .
1 Se o indivı́duo i não é curado
De acordo com Cai et al., (2012), uma vantagem dos modelos de mistura é que a fracção dos
sujeitos curados e a função de sobrevivência dos sujeitos não curados são modeladas separada-
mente e a interpretação dos efeitos das covariáveis em z e x é directo.
Portanto, considerando (c) como a subpopulação de curados e (nc) como a subpopulação não
curados, se tem o seguinte:
Segundo Alves (2010), uma vez que os indivı́duos pertencentes ao grupo dos curados não irão
registar o evento de interesse, então lim Sc (t|x) = 1. A função de sobrevivência relativa ao
t→∞
grupo dos não curados pode ser modelada considerando uma das distribuições dos modelos
descritos anteriormente. Sendo Y uma variável binária, em que Y = 1 representa um indivı́duo
não curado e Y = 0 um indivı́duo curado, é possı́vel modelar π = P(Y = 1) através de uma
regressão logı́stica.
1
π(zi ) = , (32)
1 + exp (−βzi )
com π(zi ) ∈ (0, 1).
Outas funções de ligação aplicadas para a fracção de cura são o complementar log-log e probit.
De acordo com Paes (2007), a função de sobrevivência S(ti |xi ) para toda a população é obtida
atravês de uma mistura das duas subpopulações, formando-se duas parcelas, o modelo de sobre-
vivência da fracção dos curados Sc (ti |xi ) e o modelo de sobrevivência da fracção de não curados
Snc (ti |xi ):
(i) Se π(zi ) = 1 não há indivı́duos curados, então S(ti |xi ) = Snc (ti |xi );
(iv) lim S(ti |xi ) = 1 − π(zi ) a função de sobrevivência estabiliza na fracção de cura a partir de
ti →∞
um certo instante de tempo.
Então, a função de verossimilhança associada ao modelo com fracção de cura é dada por:
n n δi 1−δi o
L(θ, π|t) = ∏ f (ti |θ, π) S(ti |θ, π) , (36)
i=1
Substituindo f (ti |θ, π) pela equação (34) e S(ti |θ, π) pela equação (33), a equação (36) fica da
seguinte forma:
n n 1−δi o
δi δi
L(θ, π|t) = ∏ π fnc (ti |θ) (1 − π) + πSnc (ti |θ) , (37)
i=1
Logo, a função log-verossimilhança ℓ(θ, π|t) = log L(θ, π|t) é:
n n n
ℓ(θ, π|t) = ∑ δi logπ + ∑ δi log fnc (ti |θ) + ∑ (1 − δi )log (1 − π) + πSnc (ti |θ) . (38)
i=1 i=1 i=1
Para maximizar ℓ(θ, π) e encontrar os valores de θ basta resolver as derivadas parciais dadas
pela equação (31) e seguir o algorı́tmo interativo dado nesta equação, e π pode ser modelado,
por exemplo, através de uma função de ligação do tipo logit, como apresentado na equação (32).
Segundo Cai et al., (2012), a abordagem paramétrica para os modelos de cura, foram estudados
por muitos autores, no entanto, como geralmente é difı́cil verificar uma suposição paramétrica,
tem havido um interesse crescente nos modelos de misturas semi-paramétricos.
Conforme mencionado anteriormente, a parte da sobrevivência dos não curados, também desig-
nada por parte de latência, pode ser especificada pelo modelo PH ou AFT. Seja S0 (t) uma função
Seja ø = (ti , δi , zi , xi ) dados observados do i-ésimo indivı́duo com i = 1, ..., n em que ti é o tempo
de sobrevivência observado, δi = 1 indicando o tempo de ocorrência do evento e δi = 0 se for o
tempo de censura, e as possı́veis covariáveis zi da parte de fracção de cura, também designado
de parte de incidência e xi da parte de sobrevivência dos não curados, ou seja, a parte de latência.
Importa salientar que as mesmas covariáveis são permitidas para os componentes de incidência
e latência, embora usemos diferentes notações de covariáveis para esses dois componentes.
Dado y = (y1 , y2 , ..., yn ) e ø, a função de verossimilhança completa pode ser expressa como:
n
∏[1 − π(zi)]1−yi π(zi)yi λ(ti|Y = 1, xi)δiyi S(ti|Y = 1, xi)y−i, (39)
i=1
n
ℓc (b; ø, yi ) = ∑ yi log[π(zi )] + (1 − yi )log[1 − π(zi )], (40)
i=1
n
ℓnc (β; ø, yi ) = ∑ yi δi log[λ(ti |Y = 1, x1 )] + yi log[S(ti |Y = 1, xi )]. (41)
i=1
(m) (m)
do i-ésimo indivı́duo ainda não curado. Porque δi logwi = 0 e wi = δi , as expectativas de 40
e 41 podem ser escritas como:
n
(m) (m)
E(ℓc ) = ∑ wi log[π(zi )] + (1 − wi )log[1 − π(zi )], (43)
i=1
n
(m) (m)
E(ℓnc ) = ∑ δi log[wi λ(ti |Y = 1, x1 )] + wi log[S(ti |Y = 1, xi )]. (44)
i=1
Como as expressões das equações (42) e (44) dependem da suposição de latência, os pormeno-
res sobre a abordagem de estimação sob o modelo PHMC e o modelo AFTMC serão apresen-
tados separadamente.
De acordo com Taylor (1995), para encontrar as estimativas dos coeficientes β a partir da
equação (44) sem ter que especificar o risco base, é utilizado um método log-verossimilhança
parcial proposto anteriormente. A equação de estimação é dada por:
(m)
n δi exp βxi +log wi
(m)
log ∏ λ0 (t) exp βxi ) + log wi S0 (ti ) . (45)
i=1
A função (45) é semelhante à função logarı́tmica do modelo padrão PH, com uma variável
(m)
de deslocamento adicional log wi . Portanto, devido a essa similaridade, pode se usar o
modelo proporcional de Cox para estimar os parâmetros da equação (44).
Portanto, para evitar problemas de identificação, define-se Sb0 (t|Y = 1) = 0 para t > t(k) , onde
t(k) é o último tempo de evento observado. A função de sobrevivência estimada torna-se S(t|Y
b =
1) = Sb0 (t|Y = 1)exp βx . Desta forma, a restrição de cauda zero pressupõe que os indivı́duos
b
com tempos de sobrevivência maiores que o último tempo de evento observado são todos não
susceptı́veis ao risco.
De acordo com Zhang e Peng (2007) este modelo consiste em estimativa baseado em classificação
para estimar β no passo M para o modelo AFTMC semi-paramétrico, para tal é necessário
transformar a equação (44) em uma função verossimilhança logarı́tmica de um modelo AFT
(m)
semi-paramétrico padrão, exceto para o termo da constante wi , que é:
n
h iδi (m)
(m) wi
log ∏ wi λ(log(ti ) − βxi ) S(log(ti ) − βxi ) , (47)
i=1
Isto permite estimar os β do modelo AFT em passo M pelos métodos de estimação semi-
paramétrico existentes. A obtenção do estimador é feito pela maximização da função convexa
G(β), onde:
n n
(m)
G(β) = n−1 ∑ ∑ δi w j |εi − ε j |I(εi − ε j ). (48)
i=1 j=1
Portanto, a maximização da função (44) pode ser realizada maximizando a função (48) por meio
de modelos lineares.
Seja τ1 < τ2 < ... < τk , os resı́duos de eventos distintas não censuradas, que é logti − βxi ,
1, ..., n, dτ j denota o número de eventos e R(τ j ). O estimador de S0 (ε|Y = 1) é dado por:
dτ j
Sb0 (ε|Y = 1) = exp − ∑ (m)
. (49)
j:τ j <ε ∑i∈R(τ ) wi
j
Assim como o modelo semi-paramétrico PHMC, fixa-se Sb0 (ε|Y = 1) = 0 para ε > τk . Então
Sb0 (t|Y = 1) = Sb0 (ε|Y = 1).
Segundo Paes (2007), a fracção de cura 1 − π e a função de probabilidade de cura P(t) podem
ser estimadas parametricamente e não-parametricamente:
b = 1 − π,
b
P(t) (50)
S(t)
b
em que b
π e S(t)
b são os estimadores de máxima verossimilhança para π e S(t), respectivamente.
n o
PbKM = min SbKM (t) , (51)
PbKM
PbKM (t) = , (52)
SbKM (t)
em que PbKM (t) é a estimativa de Kaplan-Meyer para a função de probabilidade de cura no
instante t.
Segundo Santos (2016), a escolha do modelo que descreve de forma adequada um conjunto de
dados de sobrevivência é uma etapa muito importante da análise. Se o modelo utilizado não é
adequado aos dados, os resultados podem não retratar correctamente a realidade, invalidando
toda a análise realizada.
Segundo Colosimo e Giolo (2006) e Alves (2010), existem critérios para auxiliar na escolha
do modelo que melhor se ajusta aos dados, ou seja, indicam qual a distribuição probabilı́stica
se adequa melhor as caracterı́stcas apresentadas pelos dados. Entre estes criterios estão alguns
métodos gráficos, o teste da razão de verossimilhança, o critério de informação de Akaike (
Akaike Information Criterion-AIC) e o critério de informação Bayesiana (Bayesian Information
Criterion-BIC).
Segundo Velho (2015), a principal limitação dos modelos paramétricos tem haver com a neces-
sidade de definir a forma da função de risco. Considerando modelos não aninhados, o AIC pode
ser útil para escolher o modelo mais adequado. Este critério, irá penalizar a log-verossimilhança
de cada modelo, de forma a reflectir o número de parâmetros que estão a ser estimados, permi-
tindo a comparação de modelos. A expressão relativa ao AIC é dada por:
AIC = −2ℓ(b
θ) + 2k, (53)
onde, ℓ(b
θ) e o logaritmo da função verosimilhança do modelo e k é número de parâmetros do
modelo.
De acordo com Garcia (2013), este critério considera o número de parâmetros do modelo (k), a
log-verossimilhança [ℓ(bθ)] e o número de observações (n). Assim como o AIC, quanto menor
for o valor do BIC melhor é o ajuste do modelo. É obtido através de resultados assintóticos e
da suposição de que os dados pertencem à famı́lia exponencial, a equação é dada por:
BIC = −2ℓ(b
θ) + k log(n). (54)
De acordo com Velho (2015), os desvios residuais são componentes da estatı́stica Deviance,
que avalia a hipótese nula de que o modelo se ajusta aos dados. Pode ser testada pela estatı́stica
da função desvio (deviance), dada por:
D = −2 ℓ(b
θ)G − ℓ(b
θ)R , (55)
De acordo com Carvalho et al. (2011), o método gráfico é uma técnica auxiliar na escolha da
famı́lia de distribuições paramétricas. É portanto uma ferramenta exploratória para a escolha
de possı́veis modelos. Colosimo e Giolo (2006), sugerem dois métodos gráficos para auxiliar
na escolha dos modelos candidatos, onde o primeiro método consiste na comparação da função
de sobrevivência do modelo proposto com o estimador de Kaplan-Meier e o segundo método
consiste na linearização da função de sobrevivência.
De acordo com Carvalho et al. (2011), outra análise gráfica útil consiste em comparar as curvas
de sobrevivência geradas pelo estimador não paramétrico de Kaplan-Meier com as estimadas
parametricamente. Quanto mais próximo o modelo paramétrico estiver da curva de sobre-
vivência do estimador de Kaplan-Meier, melhor é o ajuste do modelo. Os métodos gráficos
apresentados nesta secção, devem ser usados para descartar modelos claramente inapropriados,
e não para demostrar que um modelo paramétrico é melhor, pois, para isso a análise de resı́duos
é mais apropriada.
De acordo com o velho (2015), a interpretação de resı́duos para modelos paramétricos é idêntica
à do modelo de Cox, portanto, são abordados no contexto de modelos paramétricos.
Resı́duos de Cox-Snell
ri = Λ(t β′ xi )Λ
b i , xi ) = exp(b b 0 (ti ), (56)
em que para o i-ésimo indivı́duo, se tem que ti é o instante de tempo t ∈ T , xi é o vector das
covariáveis e Λ
b é a função de risco acumulado, estimado para o modelo.
Segundo Colosimo e Giolo (2006), quando o modelo possui bom ajuste é possı́vel verifcar que
o gráfico dos resı́duos de Cox-Snell contra o logarı́tmo negativo da função de sobrevivência
empı́rica construı́da pelo estimador Kaplan-Meier gera uma recta com um angulo de 45o .
Resı́duos de Martingale
M β′ xi )Λ
bi = δi − exp(b b 0 (ti ) = δi − ri . (57)
3 Material e métodos
3.1 Material
Para este estudo, foi usada uma base de dados secundária fornecida pelo Hospital Geral da Ma-
chava, composta por oito variáveis com 406 observações, registadas num perı́odo compreendido
entre 01 de Setembro de 2016 a 31 de Agosto de 2018 e os dados foram processados através
dos pacotes estatı́sticos R versão 4.2.
As variáveis usadas são de natureza qualitativa e quantitativa, sendo que a variável dependente
(tempo decorrido até a ocorrência do evento Óbito), é de natureza quantitativa e as variáveis
género, TB/HIV, padrão de resistência, tipo de entrada, resultado do tratamento são de natureza
qualitativa. A variável idade, sendo de natureza quantitaviva, foi categorizada para facilitar sua
análise e a variável desfecho, de natureza qualitativa dicotómica, que também caracteriza-se por
ser uma variável indicadora de censura ou evento, resultou da associação de altas, abandonos,
transferências e em tratamento, que são categorias da variável resultado de tratamento, tendo
sido classificadas como censuras e a categoria óbitos classificada como evento de interesse.
A tabela 3, apresenta um breve sumário da descrição das variáveis em estudo, em que pode
observar-se que para a variável género, indivı́duoa de sexo feminino estão em maior número
com uma fracção de 55.2% do total e 44.8% para indivı́duos de sexo masculino; No que diz res-
peito a co-infecção TB e HIV, uma fracção 83.5% dos pacientes em relação ao total tinham TB
associado ao HIV; Em relação ao padrão de resistência pode verificar-se que 89.4% dos pacien-
tes apresentavam TB-MR e 10.6% apresentavam TB-XR; Do resultado do tratamento observa-
se que 31.5% foram óbitos, 56.4% tiveram alta, 4.2% foram transferidos, 0.7% abandoram o
tratamento e 7.1% ainda estavam em tratamento no fim do estudo; A idade dos pacientes varia
entre 15 a 86 anos, com uma média de 38 anos e media igual a 37 anos; A variável localização
da lesão foi descartada para o estudo visto que todos os pacientes apresentavam tuberculose pul-
monar. Mais detalhes sobre a descrição dos tempos vividos pelos elementos da amostra estão
descritos na tabela abaixo.
3.2 Métodos
Nesta subsecção faz-se a caracterização do estudo, descrição dos procedimentos usados na
análise dos dados, que inclui a análise exploratória, estimação dos modelos de sobrevivência,
comparação dos modelos estimados, selecção do melhor modelo e avaliar a qualidade do ajuste
do modelo seleccionado.
O estudo caracteriza-se por ser uma pesquisa aplicada, de natureza quantitativa e exploratória.
Quanto à análise descritiva das variáveis foi feita aplicando a tabela cruzada entre a variável
Variável Descrição Categorias Frequências (%) Tempo médio Tempo mediano Tempo máximo
1-Masculino 182 (44.8%) 38.2 26.5 178
Genero Género dos pacientes
2-Feminino 224 (55.2%) 46.7 32.0 234
A descrição do tempo de sobrevivência geral e estratificada por cada covariável, foi feita apli-
cando o estimador de Kaplan-meier e posterior aplicação de testes de Log-rank, Tarone Ware
e Gehan-Breslow para verificar a igualidade das curvas de sobrevivência para cada variável
explicativa. De seguida foram estimados os modelos semi-paramétricos de cox, modelos pa-
ramétricos e de fracção de cura. Os modelos paramétricos, assim como de fracção de cura,
foram ajustados de acordo com as seguintes distribuições de probabilidades: Log-normal, Ex-
ponencial, Weibull e Log-logı́stico. O método empregue para estimação de parâmetros é o
método de máxima verossimilhança.
A selecção do melhor modelo, foi feito atravês de comparação dos valores estimados de Log-
verossimilhança, AIC e BIC, conforme descrito no capı́tulo anterior. A inferência sobre os
parâmetros dos modelos ajustados, assim como os demais testes estatı́sticos foi feita atravês do
p.valor associado à cada estatı́stica de teste, a um nı́vel de significância de 5%.
Tendo-se verificado que o modelo semi-paramétrico com fracção de cura melhor se ajusta
aos dados, para o procedimento de análise e ajuste do modelos final foi considerado o mo-
delo PHMC, cujos procedimentos estão descritos na secção 2.7.12. A metodologia de análise
baseiou-se na observação e análise comparativa das curvas de sobrevivência estimadas pelo mo-
delo selecionado, análise comparativa das probabilidades de sobrevivência estimadas e proporções
de cura para diferentes grupos de pacientes com caracteristicas similares de doença.
4 Resultados e discussão
Nesta secção, são apresentados os resultados da análise feita aos dados descritos no Subsecção
3.1, e a descrição das variáveis de acordo com a ocorrência ou não de morte por TB-MR,
descrição do tempo de morte dos pacientes por cada covariável atravês das curvas de Kaplan-
Meier, estimação dos modelos de sobrevivência semi-paramétricos, paramétricos considerando
algumas distribuições de probabilidade, nomeadamente, a distribuição exponencial, weibull,
log-normal, log-logistico, e weibull-weibull, weibull-exponencial em alguns modelos de sobre-
vivência com fracção de cura onde é possivel aplicar distribuições complexas e posteriormente,
faz-se a comparação e selecçaõ do melhor modelo para análises subsequentes.
4.1 Resultados
A Tabela 4 mostra a descrição das variáveis em relção a ocorrência de evento (morte) ou censura
em paceintes diagnosticados com TB-MR durante o perı́odo em análise, com um total de 406
pacientes observados dos quais 68.5% foram censurados, ou sejam, sobreviveram durante o
perı́odo em análise. Neste trabalho, estes pacientes são considerados curados, embora não se
sabe do seu estado para tempo posterior ao estudo.
De um modo geral, a fracção dos eventos (mortes) em todas as variáveis é relativamente menor
em relação a fracção das censuras, no entanto, importa referenciar algumas covariáveis que
tendem a apresentar maiores proporções de mortes, como é o caso de pacientes com recaı́da e
padrão de resistência extensivamente resistente com 43.8% e 41.9% da fracção de mortes em
relação aos seus totais respectivamente. Os pacientes com TB sem HIV associado são os que
apresentam menor fracção de morte.
Em relação a sobrevivência, pode se observar que indivı́duos de sexo feminino sobrevivem por
mais tempo em relação a indivı́duos de sexo masculino, em outras palavras, pode se afirmar que
em um certo instante t, a probabilidade de sobrevivência em pacientes de sexo feminino é maior
em relação ao sexo masculino; de mesmo modo, pacientes com TB caso novo apresentam maior
probabilidade de sobrevivência em relação a pacientes com recaı́da; pacientes com associação
TB/HIV tendem a apresentar menores probabilidades de sobrevivência em relação a pacientes
sem HIV associado.
Ainda na Figura 4 pode-se observar que algumas curvas violam o princı́pio de proporciona-
lidade, tido como um importante pressuposto para aplicação do modelo semi-paramétrico de
Cox. O indı́cio da violação deste pressuposto é visı́vel atravês de curvas que se cruzam em
certos instantes t para algumas variáveis, como é o caso das variáveis género na curva (B),
associação TB/HIV na curva (D) e padrão de resistência na curva (E).
Os testes de log-rank (χ2(1;1− α ) = 0.000, p.valor = 0.992), breslow (χ2(1;1− α ) = 0.328, p.valor =
2 2
0.567) e tarone-ware (χ2(1;1− α ) = 0.140, p.valor = 0.708), não rejeitam a hipótese de igualidade
2
da probabilidade de sobrevivência em pacientes com padrões de resistência multirresistente
e extensivamente resistente. Estes teste, aplicados às demais variáveis, apresentam p.valores
inferiores ao nı́vel de significância considerada (α = 5%), portanto, existem diferenças signi-
ficativas nas probabilidade de sobrevivência para as demais variáveis em análise, e para mais
detalhes sobre esses teste, vide a Tabela I em apêndice.
Tabela 5: Valores de log-likelihood (ll), AIC e BIC dos modelos: (1) modelos paramétricos
usando distribuições; (2) modelo semi-paramétrico de Cox e (3) modelos com fracção de cura.
Modelo Paramétrico Modelo paramétrico com fracção de cura
Distribuição
ll AIC BIC ll AIC BIC
Exponencial -743.4 1500.7 1528.8 -736.4 1500.8 1556.9
Weibul -739.5 1494.9 1527.0 -752.4 1534.7 1594.8
Log-normal -728.2 1472.5 1504.5 -730.9 1491.8 1551.8
Log-logı́stica -733.1 1482.3 1514.3 NA NA NA
Weibull Weibull NA NA NA -741.2 1518.5 1590.6
Weibull Exp NA NA NA -747.9 1529.8 1597.9
Modelo semi-paramétrico de Cox Modelo semi-paramétrico com fracção de cura
-683.9 1351.7 1366.0 -196.95 415.9 422.59
O modelo ajustado com 500 amostras bootstrap, foi seleccionado de acordo com os critérios
de selecção anteriormente descritos, onde concluiu-se que o modelo semi-paramétrico com
fracção de cura ajusta-se melhor aos dados, pelo facto de ter apresentado menores valores de
ll, AIC e BIC. De acordo com a Tabela II em apêndice, verifica-se que apenas a variável idade
é significativa como preditora para a função da fracção de cura, portanto, as demais variáveis
foram removidas do modelo e o modelo final ajustado apenas com a variável Idade, conforme
a Tabela 6.
A Tabela III no apêndice apresenta valores de erro padrão para diferentes tamanhos de amostras
bootstrap, para avaliar seu impacto no erro padrão das estimativas, tendo se verificado que os
erros padrão reduzem ligeiramente à medida que o número de amostras bootstrap aumenta.
Para a função de fracção de cura pode verificar-se que quanto maior for a idade do paciente
maior é a sua probabilidade de morrer, especificamente, a probabilidade de morte aumenta em
0.032 vezes com o aumento de uma unidade na idade do paciente. Em relação a função de risco
de ocorrência do evento, os coeficientes positivos significa que a variável associada aumenta o
risco de ocorrência do evento e os coeficientes negativos, as variáveis associadas diminuem o
risco de ocorrência de evento. Portanto, pelo modelo ajustado pode observar-se que pacientes
de sexo feminino tem menor risco de morrer pela TB-MR em relação aos pacientes de sexo mas-
culino, em outras palavras, considerando o cálculo de razões de risco (Hazard Ratio), pacientes
de sexo feminino tem exp(−0.916) = 0.40 vezes menor o risco de morrer quando comparados
com pacientes de sexo masculino. Os pacientes admitidos com recaı́da têm um risco de morte
de exp(1.028) = 2.795 vezes maior quando comparados com pacientes caso novo e os pacientes
com co-infecção TB/HIV tem exp(1.126) = 3.083 vezes maior o risco de morte em relação a
pacientes sem a co-infecção TB/HIV.
onde Sbnc (t) é a probabilidade de sobrevivência dos não curados, que pode ser modelada pelos
modelos de sobrevivência semi-paramétricos descritos na subsecção 2.7.7, sendo:
h iexp(−0.916Genero+1.028T.entrada+1.126TB/HIV−0.336P.resistenc−0.004Idade)
Snc (t|xi ) = S0 (t)
b b ,
nc
h i
em que Sb0 (t) é a probabilidade de sobrevivência de base para os não curados.
nc
Por exemplo, para encontrar a probabilidade média de sobrevivência dos pacientes com carac-
terı́sticas no modelo acima, considere-se o intercepto do modelo e, sendo dado a probabilidade
condicional Sbnc (t) dos não curados, temos:
1 1
S(t) = 1 −
b + Sbnc (t),
1 + exp −(−1.14) 1 + exp −(−1.14)
Tabela 6: Resultados obtidos através do modelo semi-paramétrico com fracção de cura - solução
final
Função de fracção de cura Estimativa EP Z p.valor
Intercepto -1.14 0.607 -1.879 0.060
Idade 0.032 0.016 2.047 0.041
Função de risco de ocorrência do evento Estimativa E. P Z p.valor
Género (feminino) -0.916 0.343 -2.670 0.007
T. entrada (recaı́da) 1.028 0.429 2.395 0.016
TBHIV (tem HIV associado) 1.126 0.546 2.062 0.039
P.resistenc (XR) -0.336 0.899 -0.374 0.708
Idade -0.004 0.013 -0.297 0.767
Nota: A função de fracção de cura modela a probabilidade de um paciente morrer; a função de
risco de ocorrência do evento modela o risco associado ao tempo desde o diagnóstico até a
morte do paciente.
Nesta subsecção são apresentadas diferentes curvas de sobrevivência estimada aplicando o mo-
delo estimado na Tabela 6. Essas curvas tem por objectivo comparar as probabilidades de
sobrevivência dos pacientes por categorias em condições similares da doença e o impacto da
fracção de cura na probabilidade de sobrevivência, considerando as variáveis género, tipo de
entrada e associação TB/HIV, que foram significativas na função de risco.
De acordo com a Figura 5, a probabilidade de sobrevivência dos pacientes com TB-MR difere
de acordo com o género, tipo de entrada e a associação TB/HIV. Os pacientes de sexo masculino
apresentam menores probabilidades de sobrevivência em relação a pacientes de sexo feminino,
a sobrevivência segundo o tipo de entrada é maior em pacientes caso novo em relação aos ca-
sos de recaı́da, o mesmo se verifica para a associação TB/HIV, onde os pacientes com TB/HIV
associado apresentam menores probabilidades de sobrevivência em relação a pacientes sem
associação TB/HIV.
Atentando às curvas de sobrevivência da Figura 5 no geral, pode-se constatar que os pacientes
que apresentam as caracteristicas das curvas B, D e F, tem mais impacto nas probabilidades de
sobrevivencia em relação ao género do que o tipo de entrada e associação TB/HIV, isto por-
que a diferença nas curvas de sobrevivência é mais expressiva nas curvas A e B relacionados
ao género do paciente, isto implica que as caracteristicas dos pacientes apresentados na curva
B, influenciam para menor probabilidade de sobrevivência dos pacientes em relação às carac-
terı́sticas dos pacientes da curva A.
Embora haja ligeiras diferenças nas probabilidades de sobrevivência das curvas (C, D) e (E,
F), o comportamento das curvas das variáveis tipo de entrada e associação TB/HIV é similar.
Fazendo uma comparação visual, as curvas mostram a inexistência de diferença nas probabi-
lidades de sobrevivência para indivı́duos com caracterı́sticas tı́picas das curvas C e E quando
Tomando como exemplo o tempo t = 50 dias, considerando que o risco de morte é maior nos
primeiros 50 dias após o diagnóstico, as probabilidades de sobrevivência estimadas de acordo
com as curvas A a F são as seguintes:
• Curva A: género masculino tem S(50) = 82.5% e feminino com S(50) = 91.2%
• Curva B: género masculino tem S(50) = 69.5% e feminino com S(50) = 73.2%
• Curva C: tipo de entrada caso novo tem S(50) = 82.5% e recaı́da com S(50) = 77.2%
• Curva D: tipo de entrada caso novo tem S(50) = 88.9% e recaı́da com S(50) = 73.2%
• Curva E: Associação TB/HIV - não tem HIV associado tem S(50) = 82.5% e tem HIV
associado com S(50) = 71.6%
• Curva F: Associação TB/HIV - não tem HIV associado tem S(50) = 84.9% e tem HIV
associado com S(50) = 73.2%
De acordo com as curvas da Figura 6, associado ao modelo de cura ajustado na Tabela 6, fica evi-
dente que quanto maior for a idade do paciente, menor é a sua probabilidade de sobrevivência.
Tomando como exemplo dois pacientes com caracteristicas similares de doençe e idades dife-
rentes, considerando 10 e 40 anos, as probabilidades de sobrevivência predictas são 69.4% e
46.3% respectivamente.
Figura 7: Gráfico de sobrevivência incondicional (a), risco (b), sobrevivência dos não curados
(c) e probabilidade de cura (d)
4.2 Discussão
Dos resultados alcançados, foi possı́vel verificar que maior parte dos pacientes foi censurado e
de acordo com o gráfico A da Figura 4, a probabilidade de sobrevivência não converge a zero
a medida que o tempo tende ao infinito, isto é um indı́cio de existência de pacientes curados
durante o perı́odo de observação (fracção de cura).
Dos diversos modelos estimados, foi possivel mostrar atravês das medidas de selecção de mo-
delos que o modelo de sobrevivência semi-paramétrico com fracção de cura melhor se ajusta
aos dados, tendo sido seleccionado para análises subsequentes, esta ecolha é sustentada pelas
teorias das autoras Claudino e Oliveira, (2013), que afirmam que os modelos de fracção de cura
se apresntam como uma possibilidade bastante viável na análise do tempo de sobrevivência
dos pacientes quando são acompanhados por um perı́odo longo de tempo e observa-se uma
percentagem razoável deles que não irá experimentar o evento de interesse.
Depois da selecção do modelo, foram estimados os parâmetros para função de cura assim como
para a função de distribuição do tempo de morte, tendo se verificado que apenas a variável idade
é significativo como preditora para a função de cura e as variáveis género, tipo de entrada e a
associação TB/HIV foram significativas para a função de risco de ocorrência de evento.
Ainda segundo o mesmo autor, Pires et al., (2012) o uso de antirretrovirais foi mais frequente
nos casos que evoluı́ram para cura ou término de tratamento (80%). A letalidade foi de 11.4% e
a taxa de abandono de 22.9%, estes resultados são consensuais aos resultados deste estudo, pois
conforme os gráficos da Figura I em apêndice, pode observar-se que pacientes com co-infecção
TB/HIV, embora tenham menor probabilidade de sobrevivência, apresentam maior fracção de
No que concerne a taxa de letalidade, de acordo com a Tabela 3, constata-se que a letalidade por
tuberculose multirresistente durante o perı́odo de observação foi muito elevada, e associado aos
resultados da Tabela 4, é visivelmete claro que maior parte das mortes ocorreram em pacientes
com co-infecção TB/HIV e pacientes com TB-MR, todavia, a alta letalidade foi registada nos
casos de pacientes com recaı́da e padrão de resistência extensivamente resistente.
Constituem limitações encontradas neste estudo o perı́odo de estudo relativamente curto; des-
conheciemto do perı́odo exacto em que os pacientes foram infectados, portanto, subestima-se
o tempo desde a infecção até a data do diagnóstico; a variável padrão de resistência não cum-
pre a suposição da proporcionalidade dos riscos; de acordo com Cai, et al. (2012), uma das
limitações dos modelos semi-paramétricos com fracção de cura é que devido a complexidade
da equação de estimativa no algoritmo EM, os erros padrão dos parâmetros estimados não estão
directamente disponı́veis, por isso, quando o mesmo modelo é processado mais de uma vez
pode fornecer diferentes valores de erro padrão e consequentemente a alteração da significância
dos coeficientes do modelo estimado.
5 Conclusões e recomendações
5.1 Conclusões
Com base nos objectivos do trabalho, conclui-se que:
• O género feminino apresenta maior número de casos de TB-MR com uma fracção de
55.2% do total, isto pode ser explicado de acordo com estudo realizado por Gomes et al.,
(2007), que aponta para maior procura pelos serviços de saúde na população feminina em
relação a masculina;
• Os pacientes com co-infecção TB/HIV e o padrão de resistência TB-MR são os que apre-
sentaram maior número de mortes, enquanto que os pacientes com inı́cio do tratamento
após falência (recaı́da) e padrão de reistência TB-XR, têm maiores taxas de letalidade,
estimadas em 43.8% e 41.9% respectivamente;
• A idade dos pacientes influencia significativamente a fracção de cura, sendo que quanto
maior for a idade do paciente, menor é a sua probabilidade de ficar curado;
• O risco de morte por TB-MR é maior nos primeiros 50 dias de observação, tendendo a
estabilizar-se para tempos de vida maiores que 50 dias e a fracção de cura, independente-
mente do efeito das covariáveis varia em média entre 20% a 80%.
5.2 Recomendações
Recomenda-se que para os próximos estudos sobre a análise de sobrevivência em pacientes com
tuberculose multirresistente, aplique-se modelos de sobrevivência de riscos competitivos;
Aplicar nos próximos estudos os splines de regressão para captar o comportamento não linear
da variável idade e estender mais o tamanho da amostra assim como o perı́odo de estudo;
Considerando que os resultados deste estudo mostraram haver maior fracção de cura em pacien-
tes que fazem tratamento antiretroviral, recomenda-se que se estude a influência do tratamento
antiretroviral na fracção de cura dos pacientes com tuberculose multirresistente.
Referências
8. Barreto et al. (2002). Design of the Brazilian BCG-REVAC trial against tuberculosis.
Brazil;
13. Brown, B. W; Flood, M.M. (1947). Tumbler Mortality. Journal of the American Statisti-
cal Association;
14. Cai, C., Zou, Y., Peng, Y. e Zhang, J. (2012). smcure: An R-package for Estimating Semi-
parametric Mixture Cure Models. Comput Methods Programs Biomed. 2012 December
; 108(3): 1255–1260. doi:10.1016/j.cmpb. 2012.08.013;
15. Campos (2016). Fatores explicativos para a evasão no ensino superior atravês da análise
de sobrevivência. Dissertação (Mestrado), Universidade Federal de Pernambuco;
17. Carvalho et al. (2011). Análise de sobrevivência: teoria e aplicações em saúde. Editora
FIOCRUZ;
31. Gomes, R., Nascimento, E. F., Araújo, F. C. (2007). Por que os homens buscam menos os
serviços de saúde do que as mulheres? As explicações de homens de baixa escolaridade e
homens com ensino superior. Rio de Janeiro. 23(3):565-574. https:doi.org/10.1590/S0102-
311X2007000300015;
32. Guo, S. (2010). Survival Analysis. Oxford University Press (Pocket guide to social work
research methods);
35. Karadeniz, P. G. e Ercan, I. (2017) Testes de exame para comparar sobrevivência: Curvas
com dados censurados à direita. Estatı́stica em transição, nova série. Vol. 18;
37. Medcalf et al. (2013). Tuberculosis a short history. The New York University, USA;
38. Melo et al. (2017). Sobrevivência de pacientes com AIDS e coinfecção com bacilos da
tuberculose nas regiões sul e sudeste do Brasil. Ciênc. saúde coletiva. Vol. 22;
39. MISAU (2018). Avaliação e manejo de pacientes com TB. Protocolos Nacionais. Versão
1. Moçambique;
40. Paes, A. T., (2007) Uso de modelos com fracção de cura na análise de dados de sobre-
vivência com omissão nas covariáveis. Tese (Doutoramento), Instituto de Matemática e
Estatı́stica da Universidade de São Paulo;
41. Pires, G. M. (2021). Análise das polı́ticas de controlo da tuberculose e do perfil epide-
miológico da infecção em Moçambique (2009-2017). Dissertação de mestrado - Instituto
de Higiene e Medicina Tropical. Universidade Nova de Lisboa. Lisboa;
42. Pires Neto, R. J., Gadelha, R. R. M., Herzer, T. L., Peres, D. A., Leitão, T. M. J. S.,
Façanha, M. C., Holanda, C. N., Girão, E. S., Nogueira, C. M., Alencar, C. H., (2012).
Caracterı́sticas clı́nico-epidemiológicas de pacientes com coinfecção HIV/tuberculose
acompanhados nos serviços de referência para HIV/AIDS em Fortaleza, Ceará, entre
2004 e 2008. Caderno de saúde colectiva. Rio de Janeiro. LILACS-Express. ID: lil-
644857. BR1.1;
44. PNCT (2017). Relatório das actividades desenvolvidas durante o ano 2017;
49. Rocha, M. S. (2013). Fatores associados à sobrevivência em uma coorte de casos diag-
nosticados com tuberculose em um municı́pio de alta incidência. Dissertação de Mes-
trado. UFRJ. Rio de Janeiro;
51. Santos, R. O. (2017). Formação de doutores para atividades de caráter académico via
Modelo de Riscos Proporcionais de Cox e Regressao Logı́stica. Dissertação (Mestrado),
Universidade de Brası́lia;
52. Silva, D. P. (2016). Introdução ao modelo de Cox com aplicação a dados de pneus
11.00R22. Universidade Estadual de Paraı́ba UEPB - Brasil;
56. Susser, M., Susser, E. (1998). Um futuro para a epidemiologia. In: Almeida Filho et al.
(org) Teoria epidemiológica hoje: fundamentos, interfaces, tendências. Rio de Janeiro:
FLORCRUZ/ABRASCO;
57. Taylor J. (1995) Semi-parametric estimation in failure time mixture models. Biometrics.
51:899–907. [PubMed: 7548707];
58. Velho, S. D. F. (2015). Modelos de sobrevivência para estudo do tempo até a ocorrência
de excesso de peso em indivı́duos adultos submetidos a transplante alogénico de células
progenitoras hematopoiéticas. Dissertação de Mestrado, Universidade de Lisboa. Portu-
gal;
61. Wienke, A. (2011). Frailty models in survival analysis. Chapman & Hall/CRC Biostatics
series. New York.
62. Zhang, J., Peng Y. (2007). A new estimation method for the semiparametric accelerated
failure time mixture cure model. Statistics in medicine. 26(16):3157–3171. [PubMed:
17094075].
Apêndice
Tabela I: Comparação das curvas de sobrevivência de Kaplan-Meier
Tabela II: Estimação dos parâmetros do modelo semi-paramétrico com fracção de cura - solução
inicial
Tabela III: Avaliação do impacto de número de bootstrap no erro padrão das estimativas
Modelo de probabilidade de cura E.P (nboot=100) E.P (nboot=200) E.P (nboot=500) E.P (nboot=1000)
Intercepto 3.17 2.27 2.029 2.12
Género 0.44 0.49 0.48 0.48
T. entrada 2.40 1.76 2.19 1.34
TBHIV 0.81 1.71 0.76 0.84
P.resistenc 0.64 0.67 0.65 0.66
Idade 0.09 0.03 0.02 0.07
Modelo de sobrevivência dos não curados
Género (feminino) 0.40 0.41 0.39 0.39
T. entrada (recaı́da) 0.55 0.56 0.51 0.48
TBHIV (tem HIV associado) 0.58 0.52 0.56 0.53
P.resistenc (XR) 0.87 0.88 0.86 0.79
Idade 0.03 0.04 0.014 0.19
——–Modelo de Kaplan-Meyer————
graf.fit< −survfit(Surv(Tempo, Desfecho1) 1, data = cureSurv, conf.type=”log”, conf.int=0.95,
type=”kaplan-meier”, error = ”greenwood”)
summary(graf.fit)
——–Gráficos de Kaplan-Meyer————
fits< −list(Geral< −graf.fit, Género< −graf.fit1, Idade< −graf.fit2, TB HIV< −graf.fit3, Padrão de resist
−graf.fit4, Tipo de entrada< −graf.fit5)
legend.title< −list(”Geral: ”, ”Género: ”, ”Idade: ”, ”TB/HIV: ”, ”Padrão de resistência: ”,
”Tipo de entrada: ”)
ggsurvplot list(fits, cureSurv,legend.title=legend.title, risk.table = TRUE, ggtheme = theme minimal(),
xlab=”Tempo”, ylab=”Probabilidade de Sobrevivência”)
——–Teste Log-Rank————
Hipóteses testadas:
H0: Não há diferença entre as curvas dos grupos de sobrevivência;
H1: Ha diferença entre as curvas dos grupos de sobrevivência;
type = ”mixture”, dist = ”weiwei”, link = ”probit”, control = list(maxit = 1000), method =
”Nelder-Mead”, init = NULL, link.mix = ”probit”, covariance = TRUE)
summary(cure.fit5)
AIC(cure.fit5)
BIC(cure.fit5)
Género com as Caracteristicas: T.entrada (Recaı́da); Associação TB/HIV (tem HIV associa-
dos); Padão de resistência (XR); Idade igual 10 anos; com fracções de cura para pacientes com
10 anos.
pred-fit.smcure2< −predictsmcure(fit.smcure, newX=cbind(c(0,1), c(1,1), c(1,1), c(1,1), c(10,10)),
newZ=cbind(c(10,10)),model=”ph”) plotpredictsmcure(pred-fit.smcure2, model= ”ph”, type=”S”,
xlab=”Tempo”, ylab=”Probabilidade de sobrevivência predicta”, ylim=c(0,1))
Género com as Caracteristicas: T.entrada (caso novo); Associação TB/HIV (não tem HIV asso-
ciados); Padão de resistência (MR); Idade igual 20 anos para Género (masculino) e 40 anos para
Género (feminino); com fracções de cura para pacientes com 20 anos para Género (masculino)
e 40 anos para Género (feminino).
pred-fit.smcure3< −predictsmcure(fit.smcure, newX=cbind(c(0,1), c(0,0), c(0,0), c(0,0), c(20,40)),
newZ=cbind(c(20,40)), model=”ph”)
plotpredictsmcure(pred-fit.smcure3, model= ”ph”, type=”S”, xlab=”Tempo”, ylab=”Probabilidade
de sobrevivência predicta”)
Género com as Caracteristicas: T.entrada (Recaı́da); Associação TB/HIV (tem HIV associa-
dos); Padão de resistência (XR); Idade igual 20 anos para Género (masculino) e 40 anos para
Género (feminino); com fracções de cura para pacientes com 20 anos para Género (masculino)
e 40 anos para Género (feminino).
pred-fit.smcure5< −predictsmcure(fit.smcure, newX=cbind(c(0,1), c(1,1), c(1,1), c(1,1), c(20,40)),
newZ=cbind(c(20,40)), model=”ph”)
plotpredictsmcure(pred-fit.smcure5, model= ”ph”, type=”S”, xlab=”Tempo”, ylab=”Probabilidade
de sobrevivência predicta”)
Tipo de entrada com as Caracteristicas: Género (masculino); Associação TB/HIV (não tem
HIV associados); Padão de resistência (MR); Idade igual 10 anos; com fracções de cura para
pacientes com 10 anos.
pred-fit.smcure7< −predictsmcure(fit.smcure, newX=cbind(c(0,0), c(0,1), c(0,0), c(0,0), c(10,10)),
newZ=cbind(c(10,10)), model=”ph”)
plotpredictsmcure(pred-fit.smcure7, model= ”ph”, type=”S”, xlab=”Tempo”, ylab=”Probabilidade
de sobrevivência predicta”)
Tipo de entrada com as Caracteristicas: Género (feminino); Associação TB/HIV (tem HIV as-
sociados); Padão de resistência (XR); Idade igual 10 anos; com fracções de cura para pacientes
com 10 anos.
pred-fit.smcure8< −predictsmcure(fit.smcure, newX=cbind(c(1,1), c(0,1), c(1,1), c(1,1), c(10,10)),
newZ=cbind(c(10,10)), model=”ph”)
plotpredictsmcure(pred-fit.smcure8, model= ”ph”, type=”S”, xlab=”Tempo”, ylab=”Probabilidade
de sobrevivência predicta”)
Tipo de entrada com as Caracteristicas: Género (masculino); Associação TB/HIV (não tem
HIV associados); Padão de resistência (MR); Idade igual 10 anos para T.entrada (caso novo)
e 20 anos para T. entrada (Recaı́da); com fracções de cura para pacientes com 10 anos para
T.entrada (caso novo) e 20 anos para T. entrada (Recaı́da).
pred-fit.smcure9< −predictsmcure(fit.smcure, newX=cbind(c(0,0), c(0,1), c(0,0), c(0,0), c(10,20)),
newZ=cbind(c(10,20)), model=”ph”)
plotpredictsmcure(pred-fit.smcure9, model= ”ph”, type=”S”, xlab=”Tempo”, ylab=”Probabilidade
de sobrevivência predicta”, ggplot2::Scale(0,1))
Tipo de entrada com as Caracteristicas: Género (feminino); Associação TB/HIV (tem HIV as-
sociados); Padão de resistência (XR); Idade igual 10 anos para T.entrada (caso novo) e 20 anos
para T. entrada (Recaı́da); com fracções de cura para pacientes com 10 anos para T.entrada
(caso novo) e 20 anos para T. entrada (Recaı́da).
pred-fit.smcure11< −predictsmcure(fit.smcure, newX=cbind(c(1,1), c(0,1), c(1,1), c(1,1), c(10,20)),
newZ=cbind(c(10,20)),model=”ph”)
plotpredictsmcure(pred-fit.smcure11, model= ”ph”, type=”S”, xlab=”Tempo”, ylab=”Probabilidade
de sobrevivência predicta”, ylim=c(0,1))
Associação TB/HIV com as Caracteristicas: Género (masculino); T.entrada (caso novo); Padão
de resistência (MR); Idade igual 10 anos; com fracções de cura para pacientes com 10 anos.
pred-fit.smcure13< −predictsmcure(fit.smcure, newX=cbind(c(0,0), c(0,0), c(0,1), c(0,0), c(10,10)),
newZ=cbind(c(10,10)), model=”ph”)
plotpredictsmcure(pred-fit.smcure13, model= ”ph”, type=”S”, xlab=”Tempo”, ylab=”Probabilidade
de sobrevivência predicta”)
Associação TB/HIV com as Caracteristicas: Género (masculino); T.entrada (caso novo); Padão
de resistência (MR); Idade igual 20 anos para T.entrada (caso novo) e 40 anos para T. entrada
(Recaı́da); com fracções de cura para pacientes com 20 anos para T.entrada (caso novo) e 40
anos para T. entrada (Recaı́da).
pred-fit.smcure16< −predictsmcure(fit.smcure, newX=cbind(c(0,0), c(0,0), c(0,1), c(0,0), c(20,40)),
newZ=cbind(c(20,40)), model=”ph”)
plotpredictsmcure(pred-fit.smcure16, model= ”ph”, type=”S”, xlab=”Tempo”, ylab=”Probabilidade
de sobrevivência predicta”)
Associação TB/HIV com as Caracteristicas: Género (masculino); T.entrada (caso novo); Padão
de resistência (MR); Idade igual 20 anos; com fracções de cura para pacientes com 20 anos.
pred-fit.smcure19< −predictsmcure(fit.smcure1, newX=cbind(c(0,0), c(0,0), c(0,1), c(0,0), c(10,10)),
newZ=cbind(c(0,0), c(0,0), c(0,1), c(0,0), c(10,10)), model=”ph”)
plotpredictsmcure(pred-fit.smcure19, model= ”ph”, type=”S”, xlab=”Tempo”, ylab=”Probabilidade
de sobrevivência predicta”)