Você está na página 1de 78

FACULDADE DE CIÊNCIAS

Departamento de Matemática e Informática

Trabalho de Licenciatura em
Estatı́stica

Modelo de mistura com fracção cura: Aplicação na análise de


factores associados ao tempo de sobrevivência de pacientes com
tuberculose multirresistente no Hospital Geral da Machava

Autor: Belmiro Armando Mahita

Maputo, Janeiro de 2023


FACULDADE DE CIÊNCIAS
Departamento de Matemática e Informática

Trabalho de Licenciatura em
Estatı́stica

Modelo de mistura com fracção cura: Aplicação na análise de


factores associados ao tempo de sobrevivência de pacientes com
tuberculose multirresistente no Hospital Geral da Machava

Autor: Belmiro Armando Mahita

Supervisor: Adelino Martins, PhD, UHasselt

Maputo, Janeiro de 2023


Declaração de honra

Declaro por minha honra que este trabalho é resultado da minha própria investigação, que
nunca foi submetido para outro grau que não seja o indicado de Licenciatura em Estatı́stica, na
Faculdade de Ciências da Universidade Eduardo Mondlane.

Maputo, Janeiro de 2023

(Belmiro Armando Mahita)

Autor: Belmiro Armando Mahita Licenciatura em Estatı́stica - UEM


Dedicatória

Aos meus pais

Armando Feniasse Mahita e Maria Zefanias Mabongo

À minha noiva

Hortência Raimundo Manjaze

À minha filha

Ayane C. Belmiro Mahita.

Autor: Belmiro Armando Mahita Licenciatura em Estatı́stica - UEM


Agradecimentos

Agradeço em primeiro lugar a Deus pelo dom da vida e sustento;

Agradeço aos docentes do DMI em geral, pelos conhecimentos transmitidos ao longo da formação,
mesmo diante das dificuldades impostas pela pandemia de Covid-19, souberam adoptar medidas
alternativas para a continuidade do processo de ensino e aprendizagem, e agradeço em especial
aos docentes: Doutor Adelino Martins, meu docente e supervisor deste trabalho, pela forma
sábia como tem transmitido os conhecimento, pela sua paciencia e disponibilidade sempre que
eu precisasse de auxı́lio; Doutor Miranda Muaualo pelos ensinamentos que não se limitavam
apenas em ensinar a ciência, e por ter se posicionado como o verdadeiro pai, sempre disponı́vel
para prestar seu apoio;

Agradeço a minha famı́lia, colegas da turma e amigos pelo apoio incondicional, seja financeiro,
moral e espiritual proporcionados durante o perı́odo de formação;

A todos que directa ou indirectamente tenham dado qualquer tipo de apoio, o meu muito obri-
gado.

Autor: Belmiro Armando Mahita Licenciatura em Estatı́stica - UEM


Resumo

A tuberculose é uma doença infectocontagiosa causada pela bactéria do gênero Mycobacterium


tuberculosis, a mais comum e afecta principalmente os pulmões, mas pode afetar quase to-
dos os órgãos do corpo. A tuberculose multirresistente é causada por organismos resistentes a
pelo menos isoniazida e rifampicina, os dois medicamentos mais potentes contra a tuberculose.
Moçambique, com uma incidência de 551/100.000 habitantes, consta na lista dos 22 paı́ses
com elevado peso de tuberculose e dos 14 paı́ses com elevado peso de tuberculose associados
ao HIV e tuberculose multirresistente no mundo, portanto, ainda constitui um sério problema de
saúde pública. Este estudo propôs-se a analisar os factores que influenciam o tempo de morte
desde o diagnóstico até a morte em pacientes com tuberculose multirresistente, e os factores que
influenciam a probabilidade de um paciente não morrer por esta doença. Aplicou-se um mo-
delo semi-paramêtrico com fracção de cura (mixture cure model) para analisar o tempo desde
o diagnóstico até a morte em pacientes com tuberculose multirresistente usando uma amostra
de 406 pacientes obtida no Hospital Geral da Machava. Os resultados do estudo permitiram
verificar que o risco de morte pela tuberculose multirresistente é maior nos primeiros 50 dias
de observação, a idade dos pacientes influencia a fracção de cura, sendo que quanto maior for
a idade do paciente, a sua probabilidade de morrer aumenta. O género, tipo de entrada e a
co-infecção de tuberculose e HIV influenciam a probabilidade de sobrevivência dos pacientes.
Pacientes de género masculino, inı́cio de tratamento após recaı́da, a co-infecção de tuberculose
e HIV, aumentam o risco de morte dos pacientes com tuberculose multirresistente. Especifica-
mente, um paciente de sexo feminino tem um risco de morte 0.40 vezes menor em relação aos
pacientes de sexo masculino, pacientes com recaı́da tem um risco de morte 2.795 vezes maior
que pacientes com tuberculose multirresistente caso novo e pacientes com tuberculose associa-
dos a HIV apresentam um risco de morte 3.083 vezes maior quando comparados aos pacientes
sem associação TB/HIV.

Palavras-chave: Análise de sobrevivência; Modelo semi-paramêtrico; Fracção de cura; Risco


de morte; Algoritmo de maximização da expectativa.

Autor: Belmiro Armando Mahita Licenciatura em Estatı́stica - UEM


Abstract

Tuberculosis is an infectious disease caused by bacterium of the genus Mycobacterium tuber-


culosis, the most common and mainly affects the lungs, but can affect almost all organs of the
body. MDR-TB is caused by organisms resistant to at least isoniazid and rifampicin, the two
most potent TB drugs. Mozambique, with an incidence of 551/100,000 inhabitants, is on the list
of the 22 countries with a high burden of tuberculosis and the 14 countries with a high burden of
tuberculosis associated with HIV and multidrug-resistant tuberculosis in the world, therefore,
it still constitutes a serious public health problem. This study aimed to analyze the factors that
influence the time of death from diagnosis to death in patients with multidrug-resistant tuber-
culosis, and the factors that influence the probability of a patient not dying from this disease.
A semi-parametric model with cure fraction ((mixture cure model)) was applied to analyze the
time from diagnosis to death in patients with multiresistant tuberculosis using a sample of 406
patients obtained at Machava General Hospital. The results of the study allowed us to verify that
the risk of death from multiresistant tuberculosis is higher in the first 50 days of observation,
the age of the patients influences the cure fraction, and the greater patient’s age, increases his
probability of dying. Gender, type of entry and the co-infection of tuberculosis and HIV influ-
ence the probability of survival of patients. Male patients, initiation of treatment after relapse,
co-infection of tuberculosis and HIV, increase the risk of death in patients with multiresistant
tuberculosis. Specifically, a female patient has a risk of death 0.40 times lower compared to
male patients, patients with relapse have a risk of death 2.795 times higher than patients with
multiresistant tuberculosis (new case), and patients with tuberculosis associated with HIV have
a risk of death 3.083 times higher when compared to patients without TB/HIV association.

Keywords: Survival analysis; Semi-parametric model; Cure fraction; Risk of death; Expecta-
tion maximization algorithm.

Autor: Belmiro Armando Mahita Licenciatura em Estatı́stica - UEM


Lista de abreviaturas

AFT Accelerated Failure Time

AFTMC Accelerated Failure Time Mixture Cure

AIC Critério de Informação de Akaike

BIC Critério de Informação Bayesiana

BK+ Baciloscopia positiva

BK- Baciloscopia negativa

CDC Centers for Disease Control and Prevention

DMI Departamento de Matemática e Informática

EM Expectativa-Maximização

EP Erro Padrão

HIV Virus de Imunodeficiência Humana

MISAU Ministério de Saúde

OMS Organização Mundial de Saúde

PH Proportional Hazards

PHMC Proportional Hazard Mixture Cure

PNCT Programa Nacional de Combate a Tuberculose

TB Tuberculose

TB/HIV Co-infecção tuberculose e HIV

TB-MR Tuberculose multirresistente

TB-XR Tuberculose extensivamente resistente

TSA Teste de Sensibilidade a Antibióticos

US Unidade Sanitária

Autor: Belmiro Armando Mahita Licenciatura em Estatı́stica - UEM


Índice
1 Introdução 1
1.1 Contextualização . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Definição do problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3 Objectivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3.1 Objectivo geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3.2 Objectivos especifı́cos . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.4 Justificação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.5 Estrutura do trabalho . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

2 Revisão de literatura 4
2.1 Definição de conceitos sobre tuberculose . . . . . . . . . . . . . . . . . . . . . 4
2.1.1 Tuberculose quanto à resistência aos fármacos . . . . . . . . . . . . . 4
2.1.2 Tuberculose quanto à localização da lesão . . . . . . . . . . . . . . . . 4
2.1.3 Tuberculose quanto à confirmação laboratorial . . . . . . . . . . . . . 5
2.1.4 Tuberculose quanto ao sero-estado de HIV . . . . . . . . . . . . . . . 5
2.2 História de tuberculose . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.3 Transmissão, factores de risco e diagnóstico da tuberculose multirresistente . . 6
2.4 Tratamento da tuberculose . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.4.1 Tratamento de tuberculose multirresistente . . . . . . . . . . . . . . . 8
2.5 Tuberculose no mundo, na África e em Moçambique . . . . . . . . . . . . . . 8
2.6 Sobrevivência de pacientes com TB-MR . . . . . . . . . . . . . . . . . . . . . 9
2.7 Análise de sobrevivência . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.7.1 Dados censurados e trancados . . . . . . . . . . . . . . . . . . . . . . 10
2.7.2 Função de sobrevivência . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.7.3 Função de risco . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.7.4 Relação entre as funções de sobrevivência . . . . . . . . . . . . . . . . 14
2.7.5 Modelos de estimação não-paraméricos . . . . . . . . . . . . . . . . . 15
2.7.6 Testes de comparação das curvas de sobrevivência . . . . . . . . . . . 18
2.7.7 Modelos de sobrevivência semi-paramétricos . . . . . . . . . . . . . . 21
2.7.8 Modelos de sobrevivência paramétricos . . . . . . . . . . . . . . . . . 23
2.7.9 Estimação dos parâmetros em modelos de sobrevivência paramétricos . 25
2.7.10 Modelos paramétricos de sobrevivência com fracção de cura . . . . . . 26
2.7.11 Estimação dos parâmetros em modelos paramétricos com fracção de cura 28
2.7.12 Modelos semi-paramétricos de sobrevivência com fracção de cura . . . 28
2.7.13 Modelo PHMC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.7.14 Modelo AFTMC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.7.15 Função de probabilidade de cura . . . . . . . . . . . . . . . . . . . . . 32

Autor: Belmiro Armando Mahita Licenciatura em Estatı́stica - UEM


2.7.16 Selecção do modelo de sobrevivência . . . . . . . . . . . . . . . . . . 33
2.7.17 Diagnóstico do modelo de sobrevivência . . . . . . . . . . . . . . . . 34

3 Material e métodos 36
3.1 Material . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.2 Métodos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

4 Resultados e discussão 38
4.1 Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
4.1.1 Descrição do tempo de sobrevivência . . . . . . . . . . . . . . . . . . 39
4.1.2 Modelos de sobrevivência . . . . . . . . . . . . . . . . . . . . . . . . 41
4.1.3 Modelo de sobrevivência - solução inicial . . . . . . . . . . . . . . . . 41
4.1.4 Curvas de sobrevivência estimadas . . . . . . . . . . . . . . . . . . . . 43
4.2 Discussão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

5 Conclusões e recomendações 50
5.1 Conclusões . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
5.2 Recomendações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

Autor: Belmiro Armando Mahita Licenciatura em Estatı́stica - UEM


Lista de Tabelas
1 Tabela de contingência gerada no tempo ti . . . . . . . . . . . . . . . . . . . . 15
2 Distribuições para função risco base, função de sobrevivência e função densi-
dade de probabilidade, excluindo o efeito das variáveis . . . . . . . . . . . . . 24
3 Descrição das variáveis em estudo . . . . . . . . . . . . . . . . . . . . . . . . 37
4 Descrição das variáveis em relação a morte ou censura . . . . . . . . . . . . . 38
5 Valores de log-likelihood (ll), AIC e BIC dos modelos: (1) modelos paramétricos
usando distribuições; (2) modelo semi-paramétrico de Cox e (3) modelos com
fracção de cura. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
6 Resultados obtidos através do modelo semi-paramétrico com fracção de cura -
solução final . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
I Comparação das curvas de sobrevivência de Kaplan-Meier . . . . . . . . . . . . . . . 57
II Estimação dos parâmetros do modelo semi-paramétrico com fracção de cura - solução
inicial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
III Avaliac¸ao do impacto de número de bootstrap no erro padrão das estimativas . . 58

Autor: Belmiro Armando Mahita Licenciatura em Estatı́stica - UEM


Lista de Figuras
1 Tempo de evento e tempo de censura de pacientes em um ensaio clı́nico. . . . . 12
2 Funções de taxa de risco -·-· decrescente; — constante e - - crescente. . . . . . 14
3 Exemplo da Hepatite: Kaplan-Meier para os dois grupos: controlo e esteróide. . 16
4 Curvas de sobrevivência estimadas pelo modelo de Kaplan-Meier. . . . . . . . 40
5 Curvas de sobrevivência estimadas pelo modelo semi-paramétrico com fracção
de cura apresentado na Tabela 6. Com excepção da variável de comparação
em cada curva, as curvas estimadas têm as seguintes caracterı́sticas: Painel es-
querdo (curvas A, C e E) com género (masculino), tipo de entrada (caso novo),
TB/HIV (não tem hiv associado), padrão de resistência (MR) e; Painel direito
(curvas B, D e F) com género (feminino), tipo de entrada (recaı́da), TB/HIV
(tem hiv associado), padrão de resistência (XR), antendo constante a idade de
10 anos para a fracção de cura. Curvas de sobrevivência em relação ao género
do paciente (curvas A e B), tipo de enrtrada (curvas C e D) e associação TB/HIV
(curvas E e F). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
6 Curvas de sobrevivência estimadas pelo modelo semi-paramétrico com fracção
de cura apresentado na Tabela 6. Com excepção da variável de comparação
em cada curva, as curvas estimadas têm as seguintes caracterı́sticas: Painel es-
querdo (curvas G, I e K) com género (masculino), tipo de entrada (caso novo),
TB/HIV (não tem hiv associado), padrão de resistência (MR) e; Painel direito
(curvas H, J e L) com género (feminino), tipo de entrada (recaı́da), TB/HIV
(tem hiv associado), padrão de resistência (XR), variando a idade para a fracção
de cura. Curvas de sobrevivência em relação ao género do paciente (curvas G e
H), tipo de enrtrada (curvas I e J) e associação TB/HIV (curvas K e L). . . . . . 46
7 Gráfico de sobrevivência incondicional (a), risco (b), sobrevivência dos não
curados (c) e probabilidade de cura (d) . . . . . . . . . . . . . . . . . . . . . . 47
I Curvas de sobrevivência com as seguintes caracteristicas: M = pacientes de
género (masculino), T. entrada (caso novo), P.resistenc (MR); N = pacientes de
género (feminino), T. entrada (recaı́da), P.resistenc (XR); Idade igual a 20 anos . . 58

Autor: Belmiro Armando Mahita Licenciatura em Estatı́stica - UEM


Capı́tulo 1: Introdução

1 Introdução

1.1 Contextualização
Segundo o Programa Nacional de Combate à Tuberculose (PNCT, 2012), a tuberculose (TB) é
uma doença infecciosa, cujo agente etiológico denomina-se Micobacterium tuberculosis, uma
bactéria que se espalha de pessoa para pessoa através do ar. A tuberculose geralmente afecta os
pulmões, mas também pode afectar outras partes do corpo, como o cérebro, os rins ou a coluna
vertebral. Na maioria dos casos, a tuberculose é tratável e curável, no entanto, pessoas com
tuberculose podem morrer se não receberem tratamento adequado.

Ainda de acordo com o PNCT (2012), em 2007 Moçambique foi o 19° paı́s com elevado número
de casos de TB, entre os 22 paı́ses com maior peso da TB no mundo. O primeiro estudo no paı́s
sobre a tuberculose multirresistente (TB-MR) foi realizado entre os anos 1998 e 1999 e mostrou
uma prevalência de 3.4% e o segundo estudo realizado entre os anos 2007 e 2008, também
mostrou a manutenção da prevalência em 3.4%, sendo que a Organização Mundual de Saúde
(OMS), classifica como alta prevalência de TB-MR quando está a um nı́vel acima de 3.0% de
casos novos.

De acordo com o Centro de Controle e Prevenção de Doenças (CDC, 2012), a TB-MR é causada
por organismos resistentes a pelo menos isoniazida e rifampicina, os dois medicamentos mais
potentes contra a TB, e pode evoluir ainda para tuberculose extensivamente resistente (TB-XR),
uma condição rara de TB-MR na qual os pacientes além de oferecer resistência a isoniazida e
rifampicina, também são resistentes a qualquer fluoroquinolona e pelo menos três outros medi-
camentos da segunda linha, nomeadamente a amicacina, canamicina ou capreomicina.

Segundo o PNCT (2017), 40% dos casos de TB notificados apresentavam co-infecção de tu-
berculose e o virus de imunodeficiência humana (TB/HIV), os casos notificados de TB-MR
aumentaram em 46.4%, com uma taxa de sucesso no tratamento de 47% e taxa de óbito por
TB-MR de 26%. Conforme Ribeiro (2018), a OMS reconhece a TB como uma doença infecto-
contagiosa de maior mortalidade no mundo, superando o HIV e a Malária juntos.

De acordo com OMS (2021), a pandemia de Covid-19 causou uma redução substancial na
notificação de casos novos de TB e consequentemente um aumento no número de mortes. Sabe-
se que até 2019, a TB ocupava o 13º lugar na lista das principais causas de morte a nivel mundial,
no entanto, em 2020 a tuberculose se tornou a 2ª causa de morte, sendo que a pandemia de
Covid-19 tornou-se a 1ª causa de morte, tendo revertido os esforços dos governos mundiais e
em especial, os governos Africanos que haviam conseguido reduzir a mortalidade em 5.6% por
ano.

Conforme Balabanova et al. (2011), a média de anos de sobrevivência em indivı́duos com

Autor: Belmiro Armando Mahita 1 Licenciatura em Estatı́stica - UEM


Capı́tulo 1: Introdução

TB-MR e TB-XR é de 4 e 3 anos respectivamente. Em pacientes co-infectados com HIV tem


tempo de sobrevivência de 1.9 anos e 4.9 anos em pacientes com HIV negativos, sendo que
as menores taxas de sobrevivência foram encontradas em pacientes mais velhos, aqueles que
consomem alcool, pacientes que vivem em zona rural, desempregados, pacientes com cavidade
em seus pulmões e baciloscopia positiva.

Segundo Coutinho (2016), o tempo mediano de sobrevivência em indivı́duos com TB-MR foi
de 1452 dias. O maior risco de morte está em indivı́duos com idade igual ou superior a 60 anos,
pacientes coinfectados com HIV, padrão de resistência extensiva ou extremamente resistente,
inı́cio de tratamento após falência, uso de drogas, resistência a etambutol e a estreptomicina.

Os estudos realizados pelos autores como Rocha (2013), Balabanova et al. (2016) e Melo et
al. (2017), chegaram à conclusões similares às dos dois autores anteriores, enfatizando menor
tempo de sobrevivência em pacientes coinfectados pelo HIV, padrão de resistência multirresis-
tente e extremamente resistente, gênero, idade e localização da lesão.

1.2 Definição do problema


Não obstante haver incrementos no sucesso de tratamento de casos, a TB-MR tem vindo a
aumentar cada vez mais peso na epidemia de TB devido à fraca suspeita de casos e meios de
diagnóstico insuficientes no mundo e em Moçambique em particular.

Conforme descrito na secção anterior, a pandemia de Covid-19 retrodeceu os padrões alcançados


no combate à TB-MR, tendo resultado no aumento de número de morte causadas por esta
doença e considerando o tempo de sobrevivência que varia de acordo com os factores asso-
ciados, a TB-MR constitui um sério problema de saúde pública que merece antenção de todos.
Perante estas constatações, surge a seguinte questão:

Qual é o risco associado aos diferentes factores que influênciam o tempo de sobrevivência de
pacientes com Tuberculose Multirresistente?

1.3 Objectivos
1.3.1 Objectivo geral

Analisar os factores associados ao tempo de sobrevivência em pacientes com tuberculose mul-


tirresistente.

1.3.2 Objectivos especifı́cos

• Descrever os factores associados ao tempo de sobrevivência em pacientes com tubercu-


lose multirresistente;

Autor: Belmiro Armando Mahita 2 Licenciatura em Estatı́stica - UEM


Capı́tulo 1: Introdução

• Verificar a influência dos factores no tempo de sobrevivência dos pacientes com tubercu-
lose multirresistente;

• Verificar a influência dos factores associados a tuberculose multirresistente na probabili-


dade de um paciente não morrer por esta doença.

1.4 Justificação
Tendo em conta a magnitude que a TB-MR representa entre as principais causas de morte em
Moçambique e em todo o mundo, o acompanhamento dos pacientes desde a data do diagnóstico
até o desfecho é importante. Assim, este estudo pretende verificar em que medida os factores
como TB/HIV, padrão de resistência, idade, sexo, tipo de entrada, etc, associados a TB-MR
influenciam o tempo que um paciente leva desde o diagnóstico até a morte por esta doença.
O entendimento do risco associado a esses factores, contribui na construção de conhecimento
e compreensão da problemática da resistência da tuberculose aos medicamentos, podendo dar
mais subsı́dios aos profissionais de saúde e a sociedade em geral, no planeamento de acções
para o controlo desses riscos e prolongar o tempo de vida dos pacientes com TB-MR.

1.5 Estrutura do trabalho


O trabalho é composto por cinco capı́tulos em que, no primeiro capı́tulo consta a contextualização
do tema em estudo, apresentação do problema, os objectivos e a relevância do trabalho. O se-
gundo capı́tulo contém a revisão da literatura, onde se faz o referêncial teórico e conceitual
sobre a TB e as técnicas de análise de sobrevivência. O terceiro capı́tulo contém informação
relativa a base de dados usada, local de estudo e os métodos usados na análise de dados. No
quarto capı́tulo apresentam-se os resultados e sua discussão e o quinto capı́tulo apresenta as
conclusões, recomendações de acordo com os objectivos e a pergunta de pesquisa estabeleci-
dos.

Autor: Belmiro Armando Mahita 3 Licenciatura em Estatı́stica - UEM


Capı́tulo 2: Revisão de literatura

2 Revisão de literatura
Neste capı́tulo, são definidos os conceitos e história sobre a TB, seu impacto sócio-económico
e cultural, assim como a descrição da técnica estatı́stica aplicada neste trabalho.

2.1 Definição de conceitos sobre tuberculose


Tuberculose: Segundo Massabni e Bonini (2019), a tuberculose é uma doença infectoconta-
giosa causada pela micobactéria do gênero Mycobacterium, sendo a espécie Mycobacterium
tuberculosis (Mtb) a mais comum. A TB afeta principalmente os pulmões, mas pode afetar pra-
ticamente todos os órgãos do corpo. De acordo com o PNCT (2019), a TB é classificada com
base na resistência aos fármacos, localização da doença, confirmação laboratorial, e seroestado
de HIV.

2.1.1 Tuberculose quanto à resistência aos fármacos

TB Monorresistente: Resistente a apenas um medicamento anti-tuberculose, excepto Rifam-


picina.

TB Poli-resistente: Resistência a mais de um medicamento anti-TB, mas que não seja à


combinação de Isoniazida e Rifampicina.

Tuberculose multirresistente: Resistência a pelo menos Isoniazida e Rifampicina.

Tuberculose Extensivamente Resistente: Resistência a pelo menos Isoniazida e Rifampicina,


a qualquer fluoroquinolona e a pelo menos um dos 3 medicamentos injectáveis de segunda linha
(Amikamicina, Kanamicina ou Capreomicina).

2.1.2 Tuberculose quanto à localização da lesão

De acordo com Gomes (2013), a designação dos diferentes tipos de tuberculose tem haver com
a localização da lesão, isto é, o orgão acometido pela bactéria, e classifica-se em:

Tuberculose pulmonar: Consiste em uma forma comum da doença e ocorre devido à entrada
do bacilo pelas vias respiratórias superiores, alojando-se nos pulmões. É caracterizada por uma
tosse seca e constante com ou sem sangue, sendo que os bacilos espelidos ao tossir constituem a
principal forma de contágio, pois a saliva espelida contém o bacilo de Koch, o agente etiológico
da tuberculose.

Tuberculose óssea: Ocorre quando o bacilo penetra e desenvolve-se nos ossos, o que pode
provocar dor e inflamação e é uma condição de didı́cil diagnosticar.

Autor: Belmiro Armando Mahita 4 Licenciatura em Estatı́stica - UEM


Capı́tulo 2: Revisão de literatura

Tuberculose miliar: É a forma mais grave da tuberculose, ocorre quando o bacilo entra na
corrente sanguı́nea e chega a todos os orgãos, havendo risco de meningite, além do pulmão,
assim como outros orgãos de corpo serem severamente acometidos.

Tuberculose ganglionar: É causado pela entrada do bacilo no sistema linfático, podendo aco-
meter os ganglios do tórax, virı́lha, abdômen ou, frequentemente no pescoço. Por ser extrapul-
monar não é contagioso e tem cura quando tradado de maneira correcta.

Tuberculose pleural: Ocorre quando o orgão acometido é a pleura, tecido que reveste os
pulmões, causando sérias dificuldades de respirar. Esse tipo de tuberculose extrapulmonar,
portanto, não é contagiante e pode ser adquirido ao entrar em contacto com um indivı́duo com
tuberculose pulmonar.

2.1.3 Tuberculose quanto à confirmação laboratorial

TB-Resistente bacteriologicamente confirmada: refere-se aos casos com resultados labora-


toriais de Teste de Sensibilidade à Antibióticos - TSA (fenotı́picos ou moleculares) para TB-
Resistente, ou resistência à Rifampicina.

TB-Resistente clinicamente diagnosticada: refere-se a casos com alta suspeita de TB-Resistente


porque houve falência a algum regime de tratamento, ou é contacto próximo de um caso re-
sistente mas sem resultado de TSA documentado, em que o clı́nico decidiu tratar o paciente
empiricamente com medicamentos de segunda linha baseado em critérios clı́nicos.

2.1.4 Tuberculose quanto ao sero-estado de HIV

Paciente TB/HIV positivo: Paciente com TB bacteriologicamente confirmada ou clinicamente


diagnosticada que tenha um teste de HIV positivo na altura do diagnóstico ou em qualquer outra
altura durante o tratamento de TB.

Paciente TB/HIV negativo: Paciente com TB bacteriologicamente confirmada ou clinicamente


diagnosticada que tenha um resultado do teste de HIV negativo na altura do diagnóstico ou em
qualquer outra altura durante o tratamento de TB.

Paciente com sero-estado desconhecido: Refere-se a qualquer paciente com TB bacteriologi-


camente confirmada ou clinicamente diagnosticada sem um resultado do teste de HIV.

Outros conceitos sobre a TB, incluem:

Caso Novo: Um paciente que nunca foi tratado para TB (sensı́vel ou resistente) ou fez trata-
mento por menos de 1 mês.

Autor: Belmiro Armando Mahita 5 Licenciatura em Estatı́stica - UEM


Capı́tulo 2: Revisão de literatura

Recaı́da: Pacientes com tratamento prévio de TB que terminaram o último ciclo de tratamento
como curados ou tratamento completo, e voltam com novo quadro de TB.

Perda de seguimento: Pacientes previamente tratados e que foram declarados como perda de
seguimento (mais de 60 dias de ausência) no último curso de tratamento.

Caso-ı́ndice (paciente-ı́ndice): Geralmente é o caso identificado inicialmente, embora pode


não ser o caso-fonte. Poderia ser uma pessoa de qualquer idade em um agregado familiar ou
outro local comparável em que outros possam ter estado expostos. O caso-ı́ndice é o caso em
torno do qual uma investigação de contactos é centrada.

Contactos: São as pessoas que partilham o mesmo ambiente por perı́odo de tempo prolongado
(8 ou mais horas/dia) com pacientes que apresentam tosse e que eliminam bacilos da tuberculose
no ar (tenham ou não resultado de baciloscopia positivo).

2.2 História de tuberculose


Segundo Sousa (2014), a tuberculose é uma doença que existe a milénios e é responsável por
causar grandes impactos na humanidade. Algumas pesquisas arqueológicas revelaram indı́cios
da doença em múmias egı́pcias, de cerca de 3.700 a.c. De acordo com Medcalf et al. (2013),
até o final do século XIX, a tuberculose era conhecida como tı́sica pulmonar, peste branca
ou doença de peito, tı́sica é uma palavra de origem grega (phthisikos) que significa declı́nio,
a tuberculose era assim designada porque o corpo da vı́tima parecia consumir-se a partir de
dentro.

Segundo Barreto et al. (2002), foi em 1882 que Robert Koch descobriu a existência do bacilo da
tuberculose e sua relação causal com a doença. Com esta descoberta, as pesquisas avançaram
muito rapidamente e o diagnóstico tornou-se algo menos empı́rico em que o exame clı́nico era
até então, o único meio de diagnóstico disponı́vel, desta forma, os exames clı́nicos passaram a
ter confirmação laboratorial feito com base no exame do escarro para visualização do bacilo e
na metade do século XX descobriu-se medicamentos eficazes para cura da tuberculose.

2.3 Transmissão, factores de risco e diagnóstico da tuberculose multirre-


sistente
Conforme Pires (2021), a tuberculose classifica-se em pulmonar e extrapulmonar, sendo que
a TB pulmonar é a forma mais comum de TB entre os infectados e a via aérea é o principal
meio de transmissão. Um doente com tuberculose pulmonar com baciloscopia positiva (BK+)
pode originar em cada episódio de tosse cerca de 3500 gotı́culas de aerossóis contendo baci-
los, as gotı́culas de maior dimensão podem cair no solo e as gotı́culas leves ficam suspensas

Autor: Belmiro Armando Mahita 6 Licenciatura em Estatı́stica - UEM


Capı́tulo 2: Revisão de literatura

no ar por várias horas, podendo ser inaladas por outras pessoas, portanto, essas goticulas são
responsáveis pela transmissão da bactéria, sobretuto em ambientes com pouca ou nenhuma
ventilação. Em populações com maior proporção de pessoas com expectoração ou fraco con-
trolo da doença, maior será a sua disseminação e, dependendo da distribuição dos factores de
risco a disseminação da doença pode ser mais fácil.
Segundo o MISAU (2018) a epidemia da tuberculose em Moçambique tem sido influenciada
consideravelmente por factores como as condições económicas, incluindo a pobreza e o desem-
prego, as condições ambientais, incluindo bairros urbanos superlotados, a epidemia de HIV, as
condições sociais, incluindo as migrações por trabalho, as infraestruturas de saúde insuficientes,
etc. Conforme Pires (2021), os indivı́duos infectados pelo HIV, são mais susceptı́veis devido a
comprometimento imunológico, outros factores de risco para o desenvolvimento da tuberculose
activa são a subnutrição, as diabetes, o tabagismo ou o consumo de álcool.

De acordo com PNCT (2019), o diagnóstico definitivo da TB-MR, requer que o bacilo seja
detectado e determinada a resistência aos medicamentos usados para o tratamento da TB. Isso
pode ser feito isolando a bactéria pela cultura, identificando-a como Mycobacterium tubercu-
losis e submetendo ao teste de sensibilidade antibiótica (TSA) em meios sólido ou lı́quido, ou
usando ainda testes moleculares para detectar mutações associadas à resistência a rifampicina
através da tecnologia GeneXpert.

2.4 Tratamento da tuberculose


Segundo Ferreira (2014), o tratamento da tuberculose tem como objectivo matar os bacilos
extracelulares das cavidades pulmonares metabolicamente activos e de crescimento contı́nuo,
resultando na conversão do escarro para BK- e interrupção da transmissão da doença. De acordo
com o PNCT (2019) em Moçambique existem 2 regimes de tratamento para TB-MR em vigor,
um de curta duração (9 - 11 meses) e outro de longa duração (20 meses). A avaliação dos paci-
entes é feita no fim de cada coorte de tratamento, sendo que os pacientes podem ser enquadrados
nas seguintes classificações:

Curado: Quando um ciclo de tratamento é completado como recomendam as normas do pro-


grama, sem evidência de falência e 3 ou mais culturas consecutivas negativas, colhidas com um
intervalo de 30 dias, após a fase intensiva.

Tratamento completo: Um ciclo de tratamento completo como recomendado pelas normas


do programa, sem evidência de falência, mas, sem registos de três ou mais culturas negativas
consecutivas colhidas com intervalo de 30 dias após a fase intensiva.

Falência de tratamento: Tratamento terminado por necessidade de mudança de regime de pelo


menos dois medicamentos anti-TB devido a:

Autor: Belmiro Armando Mahita 7 Licenciatura em Estatı́stica - UEM


Capı́tulo 2: Revisão de literatura

• Não conversão no fim da fase intensiva;

• Reversão bacteriológica na fase de manutenção após conversão para negativo;

• Evidência de resistência adquirida às fluoroquinolonas ou injectáveis de segunda linha;

• Reacções adversas a medicamentos, que obrigam a mudança de dois ou mais medicamen-


tos.

Óbito: Paciente com TB-Resistente que morre por qualquer razão antes de iniciar o tratamento
ou durante o curso do tratamento.

2.4.1 Tratamento de tuberculose multirresistente

Segundo Coutinho (2016), o tratamento da tuberculose multirresistente é feito com medica-


metos menos eficazes, mais carros e tóxicos durante longo perı́odo quando comparado com
o tratamento de tuberculose sensı́vel, e recomenda-se a utilização de pelo menos quatro me-
dicamentos da segunda linha, nomeadamente a fluoroquinolona, pirazinamida, etionamida ou
protionamida. De acordo com PNCT (2019), as doses dos medicamentos devem ser adminis-
tradas sob Directa Observação ao Tratamento (DOT) e deve ser feito na Unidade Sanitária (US)
ou na residência do paciente sob supervisão de um padrinho ou activista do DOT, obedecendo
as duas fases do tratamento:

Fase intensiva (Estabilização): Esta fase inicial do tratamento tem como objectivo reduzir a
transmissibilidade, morbilidade e a resistência adquirida pela redução da população bacilı́fera
(carga bacilar). Esta fase dura entre três a quatro meses, sendo que no quarto mês, o paci-
ente clinicamente diagnosticado que apresenta melhorias passa para fase de manutenção, caso
contrário, o tratamento inicial prolonga à fase intensiva até um máximo de seis meses.

Fase de manutenção: Esta fase tem como objectivo eliminar os bacilos persistentes, proporci-
onando cura efectiva e duradoura da doença (esterilização e prevenção de recaı́das). No actual
regime de tratamento com medicamentos orais, esta fase geralmente consiste em continuar com
os medicamentos administrados na fase intensiva, com a excepção do Linezolide, que é descon-
tinuado.

2.5 Tuberculose no mundo, na África e em Moçambique


De acordo com PNCT (2020) a tuberculose continua sendo um sério problema de saúde pública
no mundo. Em 2019, a doença afectou cerca de 10 milhões de pessoas e matou 1.4 milhões de
pessoas em todo mundo, tornando-a numa doença infecciosa que mais mata por via de um único
agente causal, acima mesmo do HIV/SIDA. A região da África tem o maior peso per capita de
TB no mundo, e dentro do continente, a África Austral é a mais afectada pela doença.

Autor: Belmiro Armando Mahita 8 Licenciatura em Estatı́stica - UEM


Capı́tulo 2: Revisão de literatura

Segundo a OMS (2021), a pandemia de COVID-19 reverteu anos de progresso na prestação


de serviços essenciais de TB e na redução da magnitude da doença. O impacto mais óbvio da
Covid-19, é uma grande queda global no número de pessoas recém-diagnosticadas e notificadas
com TB, tendo registado uma redução de 7,1 milhões em 2019 para 5,8 milhões em 2020, um
declı́nio de 18% em relação ao nı́vel de 2012. A redução no acesso ao diagnóstico e tratamento
da TB resultou em um aumento nas mortes por TB. As estimativas para 2020 estão em cerca
de 1,3 milhão de mortes por tuberculose entre pessoas HIV negativas (acima de 1,2 milhão
em 2019) e mais 214.000 entre pessoas seropositivas (acima de 209.000 em 2019). Outros
impactos incluem reduções entre 2019 e 2020 no número de pessoas em tratamento para TB-
MR (-15%, de 177.100 a 150.359) e tratamento preventivo de TB (-21%, de 3,6 milhões para
2,8 milhões). Importa salientar que depois da Covid-19, a tuberculose tornou-se a segunda
causa de morte a nı́vel mundial, portanto, requer o esforço conjugado de todos para restaurar os
padrões alcançados nos anteriores antes da pandemia de Covid-19.

De acordo com a OMS (2019) e o PNCT (2020), Moçambique consta da lista dos 30 paı́ses
com elevado peso de Tuberculose e dos 14 paı́ses com elevado peso da TB/HIV e TB-MR no
mundo, com uma incidência estimada de 551 casos por 100.000 habitantes, portanto, a TB-MR
continua sendo uma grande ameaça para a saúde pública. Estima-se que ocorrem anualmente,
163.000 novos casos de tuberculose em Moçambique, sendo cerca de 8.800 de TB-MR. Não
obstante, os esforços empreendidos, 5 em cada 10 casos de tuberculose permanecem não de-
tectados. A situação agrava-se ainda mais pelo surgimento de cada vez mais casos de estirpes
de Mycobacterium Tuberculosis, resistentes ao tratamento bem como ao peso da coinfecção
TB/HIV.

2.6 Sobrevivência de pacientes com TB-MR


Segundo Coutinho (2016) em um estudo sobre factores associados a morte por tuberculose
multirresistente no perı́odo de 2005 a 2012, constatou que o tempo mediano de sobrevivência
foi de 1452 dias (4 anos). Os fatores associados com maior risco de morte foram: idade igual
ou superior a 60 anos (60% mais risco), presença de HIV/SIDA (46% mais risco), padrão de
resistência XR com 74% mais risco, inı́cio de tratamento após falência (72% mais risco), uso
de drogas (64% mais), resistência a etambutol (30% mais), e resistência a estreptomicina (24%
mais). Os fatores protetores foram a escolaridade mais de 7 anos de estudo (32% menos risco
de óbito), presença de doença pulmonar exclusiva (43% menos risco), e uso de quinolona de
última geração, sendo a moxifloxacina apresentando efeito de 56% menos risco de morrer, e a
levofloxacin 25% menos risco. As principais caracterı́sticas preditoras de morte no paciente TB-
MR foram o padrão de resistência XR, tratamento após falência, idade avançada, uso de drogas
e HIV/SIDA. As quinolonas de última geração apresentam efeito importante na melhoria da
sobrevivência no TB-MR.

Autor: Belmiro Armando Mahita 9 Licenciatura em Estatı́stica - UEM


Capı́tulo 2: Revisão de literatura

De acordo com Balabanova et al (2011), um estudo observacional de longo prazo realizado


em Samara na Rússia, para avaliar a sobrevivência e os factores de risco para morte de uma
coorte de pacientes com TB e TB-MR, mostrou que 50% dos pacientes com TB-MR e 71%
de pacientes com TB sensı́vel ainda estavam vivos em 5 anos de observação. Mais da metade
(58%) dos pacientes com TB-XR, morreram dentro de dois anos após o diagnóstico, e no que
diz respeito ao tipo de entrada, pacientes com recaida tiveram maior risco de morte em relação
aos casos novos. O efeito da idade sobre a sobrevivência foi relativamente pequena e o tempo
médio de sobrevivência para pacientes HIV positivo e HIV negativo entre pacientes com TB-XR
foi de 185 e 496 dias respectivamente.

2.7 Análise de sobrevivência


De acordo com Barros (2014), a análise de sobrevivência é formada por um conjunto de técnicas
estatı́sticas para analisar dados, que consistem no tempo até a ocorrência de um evento de
interesse (falha, morte, reincidência de uma doença, etc), comumente chamado de tempo de
sobrevivência ou tempo de vida, dependendo da área de aplicação o tempo de sobrevivência
pode referir-se ao tempo desde o diagnóstico até a morte por uma doença na área de saúde, na
indústria ou em outras áreas similares, pode referir-se ao tempo de utilização de uma peça ou ob-
jecto desde a produção até a avaria etc. Segundo Duo (2010), o termo análise de sobrevivência
surgiu a partir de pesquisas biomédicas, uma vez que o método teve origem no interesse de
pesquisadores em estudar a mortalidade, levando em consideração o tempo transcorrido entre o
diagnóstico de uma doença e a morte do paciente.

O primeiro estudo a utilizar a análise de sobrevivência foi publicado por John Graunt em
1662, intitulado Natural and Political Observations Made Upon the Bills of Mortality, no qual
calculou-se estatı́stica de mortalidade a partir de dados semanais que detalhavam os números e
as causas de morte no subúrbio de Londres (Guo, 2010). De acordo com Botelho et al. (2009),
na análise de sobrevivência a variável dependente é o tempo até a ocorrência de determinado
evento, ao contrário da estatı́stica clássica em que a variável de interesse é a própria ocorrência
do evento, por exemplo, desenvolver uma certa doença, cura ou um efeito colateral, etc. Na
análise de sobrevivência compara-se a rapidez com que os pacientes desenvolvem o evento de
interesse, ao fim de um certo instante de tempo.

2.7.1 Dados censurados e trancados

Segundo Wienke (2011), Duchateau e Janssen (2008) e Cunha (2014), a principal caracteristica
da análise de sobrevivência é a presença de censura, que consiste na perda parcial de informação
temporal devido à interrupção de seguimento de alguns indivı́duos em observação ou devido ao
término do tempo de estudo antes da observação do evento de interesse em alguns indivı́duos
em observação.

Autor: Belmiro Armando Mahita 10 Licenciatura em Estatı́stica - UEM


Capı́tulo 2: Revisão de literatura

Conforme Duchateau e Janssen (2008), nas pesquisas biomédicas, a censura pode ocorrer de-
vido à aspectos como: morte por outras causas não relacionadas com estudo; término do estudo
antes de observar o evento de interesse em alguns indivı́duos; perda de contacto; mudança de
procedimento; recusa do indivı́duo em continuar participando; abandono devido a efeitos ad-
versos de tratamento etc.

De acordo com Borges (2014), existem três tipos de censura, nomeadamente: (i) censura a es-
querda - acontece quando não se conhece o tempo de ocorrência do evento de interesse, mas
sabe-se que o evento ocorreu antes do inı́cio da observação; (ii) censura intervalar - ocorre
quando não se sabe o perı́odo exacto da ocorrência do evento de interesse, mas sabe-se que
aconteceu durante um certo intervalo de tempo, dentro do perı́odo de observação ou seguin-
mento dos indivı́duos; (iii) censura a direita - é aquela em que o tempo de observação termina
antes da ocorrência do evento de interesse em alguns indivı́duos em observação, ou seja, o
tempo provável ocorrência do evento de interesse é superior ao tempo do término de segui-
mento ou observação dos indivı́duos.

De acordo com Colosimo e Giolo (2006), a censura à direita, subdivide-se em três tipos, nome-
adamente, a censura de tipo I, ocorre quando o tempo de término do estudo é pré-estabelecido,
findo este perı́odo, todos os indivı́duos em observação que não observaram o evento de in-
teresse são censurados; censura de tipo II, ocorre quando se estabelece um número fixo de
eventos (mortes), ou seja, quando se alcança o número de ocorrências do evento de interesse
pré-estabelecido, termina o seguimento ou observação dos indivı́duos e os indivı́duos que não
observaram o evento de interesse são censurados e a censura aleatória, aquela que ocorre em
qualquer instante durante o perı́odo de observação ou seguimento dos indivı́duos.

Conforme Wienke (2011), a censura a direita do tipo I é a mais comum em aplicações de dados
reais de análise de sobrevivência. A Figura 1 mostra os diferentes mecanismos de censura,
em que os pacientes 2, 4 e 5 representam eventos completos, os pacientes 1 e 3 representam
censura devido a perda de seguimento, desistência ou riscos competitivos e os pacientes 6 e 7
representam a censura por término do tempo de estudo antes de observar o evento de interesse.

De acordo com Campos (2016), na análise de sobrevivência deve estar bem definido o tempo
de inı́cio da observação de cada indivı́duo, a escala de medida, neste caso, é quase sempre o
tempo, o tempo final, ou seja, o tempo de ocorrência do evento de interesse e a definição clara
do evento de interesse (falha, morte, reincidência, etc).

Segundo Cunha (2014), a condição para a exclusão dos indivı́duos é o trancamento, tendo em
conta que em alguns estudos relacionados às ciências biomédicas, os pacientes não são acom-
panhados no inı́cio do estudo, portanto, eles são incluı́dos na observação a partir do momento
que experimentam um certo evento em observação. Desta forma, surgem dois tipos de tranca-
mento: i. trancamento à esquerda - acontece quando o indivı́duo experimentou um certo evento

Autor: Belmiro Armando Mahita 11 Licenciatura em Estatı́stica - UEM


Capı́tulo 2: Revisão de literatura

Figura 1: Tempo de evento e tempo de censura de pacientes em um ensaio clı́nico.


Fonte: Wienke (2011).

antes do inı́cio de observação, é usada quando apenas são incluı́dos na amostra indivı́duos que
sobrevivem tempo suficiente para que ocorra um determinado acontecimento antes do evento
de interesse e; ii. trancamento à direita - o critério de selecção inclui somente os indivı́duos ou
pacientes que sofreram o evento, logo o risco é superestimado, como em estudos que partem do
óbito.

2.7.2 Função de sobrevivência

De acordo com Wienke (2011), considerando uma amostra aleatótia de tamanho n, sejam
T1∗ , T2∗ , ..., Tn∗ , os tempos de sobrevivência i.i.d, com função de distribuição acumulada F e
C1 ,C2 , ...,Cn , os tempos de censura i.i.d com função de distribuição acumulada G, assumundo
que estas funções de distribuição são absolutamente contı́nua. Pode observar-se dados bivaria-
dos (T1 , ∆1 ), (T2 , ∆2 ), ..., (Tn , ∆n ), onde Ti = min{Ti∗ ,Ci }, denota o tempo de observação, e:
(
1 se Ti∗ ≤ Ci , isto é, Ti não é censurado
∆i =
0 se Ti∗ > Ci , isto é, Ti é censurado

onde ∆i é a variável indicadora de censura e assume-se neste trabalho uma censura não infor-
mativa e independência dos tempos de evento T ∗ e censura C.

Segundo Silva (2016), considerando que o tempo de sobrevivência de indivı́duos é influenciado


por diversos factores, em algum momento, há necessidade de incorporar variáveis preditoras no
modelo para avaliar a sua influência no tempo de sobrevivência. Seja xTi = (xi1 , xi2 , ..., xip ) o
vetor das covariáveis no modelo, então os dados observados do indivı́duo são representados por
(ti , δi , xiT ), onde i = 1, 2, ..., n representa os indivı́duos e j = 1, 2, ..., p representa a quantidade
das covariáveis contidas no modelo.

Segundo Cordeiro e Demétrio (2008), o tempo de sobrevivência pode ser descrito formalmente
atravês das seguintes funções: (i) f (t), a função densidade de probabilidade do tempo de so-

Autor: Belmiro Armando Mahita 12 Licenciatura em Estatı́stica - UEM


Capı́tulo 2: Revisão de literatura

brevivência; (ii) S(t), a função de sobrevivência, sendo S(t) = 1 − F(t) em que F(t) é a função
de distribuição acumulada de probabilidade; (iii) λ(t), a função de risco, que é uma medida do
risco instantâneo de morte no tempo t, sendo definida por λ(t) = F ′ (t)/{1 − F(t)}.

Segundo Wienke (2011), a função de sobrevivência S(t) define-se como sendo a probabilidade
do indivı́duo sobreviver para além do instante t.
Z ∞
S(t) = 1 − F(t) = 1 − P(T ∗ ≤ t) = f (u)du t ≥ 0, (1)
t

e a função de distribuição acumulada (f.d.a) é dada por:


Z t

F(t) = 1 − S(t) = P(T ≤ t) = f (u)du t ≥ 0. (2)
0

De acordo com Dutcheau e Janssen (2008), a função de distribuição acumulada F(t) é definida
como a probabilidade de um indivı́duo não sobreviver ao tempo t e é consequência da função
de sobrevivência.

A função S(t) tem as seguintes propriedades:

i. S(t), é uma função monótona não crescente;

ii. S(0) = 1, a probabilidade de sobreviver pelo menos no tempo t = 0 é um;

iii. S(+∞) = lim S(t) = 0, quando o seguimento dos indivı́duos é feito por um perı́odo sufici-
t→∞
entemente longo, a função de sobrevivência é igual a zero.

2.7.3 Função de risco

Segundo Barros (2014), a função de risco, é dada pelo limite do quociente entre a probabilidade
de um indivı́duo falhar (observar o evento de interesse) num intervalo de tempo [t,t + ∆t) con-
siderando que o indivı́duo sobreviveu até o instante t e a variação do de tempo ∆t, podendo ser
monótona (crescente, decrescente) ou constante e é descrita pela seguinte expressão:

P(t ≤ T ∗ ≤ t + ∆t|T ∗ ≥ t) f (t)


λ(t) = lim = , (3)
∆t→0+ ∆t 1 − F(t)

e a função de risco acumulado é dada pela seguinte expressão:


Z t
Λ(t) = λ(u)du.
0

Autor: Belmiro Armando Mahita 13 Licenciatura em Estatı́stica - UEM


Capı́tulo 2: Revisão de literatura

Figura 2: Funções de taxa de risco -·-· decrescente; — constante e - - crescente.


Fonte: Colosimo e Giolo (2006).

onde ∆t é o incremento infinitesimal de tempo t, sendo que:

i. λ(t) > 0;
Z ∞
ii. λ(t)dt = ∞.
0

Segundo Colosimo e Giolo (2006), a função crescente indica que a taxa de risco em um in-
divı́duo aumenta com o passar do tempo, mostrando que existe um efeito gradual quando o
tempo tende ao infinito. A função constante indica que a taxa de risco não se altera com o pas-
sar do tempo, e a função decrescente mostra que a taxa de risco diminui a medida que o tempo
passa.

2.7.4 Relação entre as funções de sobrevivência

De acordo com Cordeiro e Demétrio (2008) Conhecendo-se apenas uma dessas funções (a
função de sobrevivência, risco ou a função densidade de probabilidade), tem-se diretamente
as outras duas. Por exemplo, para a distribuição exponencial com S(t) = exp(−λt), fica claro
que a função de risco é constante e dada por λ(t) = λ. Para a distribuição de Weibull tem-se
λ(t) = αt α−1 ; logo, S(t) = exp(−t α ). A função de risco nesse caso cresce com o tempo se
α > 1 e descresce se α < 1.

Os modelos de análise de sobrevivência visam construir estimadores das funções usadas para
especificar o tempo de vida em relação aos factores associados e estão organizadas em três
categorias, nomeadamente, modelos não-paramétricos, modelos semi-paramétricas e modelos
paramétricos, e são descritos a seguir.

Autor: Belmiro Armando Mahita 14 Licenciatura em Estatı́stica - UEM


Capı́tulo 2: Revisão de literatura

Tabela 1: Tabela de contingência gerada no tempo ti

Grupos
1 2
Evento d1 j d2 j dj
Não evento n1 j - d1 j n2 j - d2 j n j - d j
n1 j n2 j nj
Fonte: Colosimo e Giolo (2006)

2.7.5 Modelos de estimação não-paraméricos

Estimador de Kaplan-Meier

Conforme Colosimo e Giolo (2006), o estimador não-paramétrico de Kaplan-Meier, proposto


por Kaplan e Meier (1958) para estimar a função de sobrevivência, é também chamado de esti-
mador limite-produto. É uma adaptação da função de sobrevivência empı́rica que, na ausência
de censuras, é definida como:

b = nr. de observações que não falharam até o tempo t .


S(t)
nr. total de observações no estudo

b é uma função escada com degraus nos tempos observados de ocorrência do evento de
S(t)
tamanho 1/n, em que n é o tamanho da amostra. Se exitirem empates em um certo tempo t, o
tamanho do degrau fica multiplicado pelo número de empates. O estimador de Kaplan-Meier,
na sua construção, considera tanto intervalos de tempo, quanto o número de eventos distintos.
Os limites dos intervalos de tempo são os tempos de ocorrência de evento na amostra.

Segundo Colosimo e Giolo (2006), além do estimador de Kaplan-Meyer, existem mais dois
estimadores não-paramétricos e são eles o estimador conhecido por Nelson-Aalen, proposto
por Nelson (1972) e suas propriedades estudadas por Aalen (1978) e o estimador das Tábuas de
vida.

Em cada tempo de ocorrência de evento t j , os dados podem ser dispostos em forma de uma
tabela de contingência 2 x 2 com di j eventos e ni j - di j sobreviventes na coluna i, conforme a
Tabela 1.
A expressão geral do estimador de Kaplan-Meier pode então ser apresentada após as considerações
preliminares seguintes:

• t1 < t2 < ... < tk , os k tempos distintos e ordenados de ocorrência de evento;

• d j o número de eventos em t j , j = 1, 2, ..., k, e

Autor: Belmiro Armando Mahita 15 Licenciatura em Estatı́stica - UEM


Capı́tulo 2: Revisão de literatura

Figura 3: Exemplo da Hepatite: Kaplan-Meier para os dois grupos: controlo e esteróide.


Fonte: Colosimo e Giolo (2006).

• n j o número de indivı́duos sob risco em t j , ou seja, os indivı́duos que não falharam e não
foram censurados até o instante imediatamente anterior a t j .

O estimador de Kaplan-Meyer é dado por:

   
nj −dj dj
b =
S(t) ∏ = ∏ 1− . (4)
j:t j ≤t nj j:t j ≤t nj

De acordo com Colosimo e Giolo (2006), as principais propriedades do estimador de Kaplan-


Meier são: (i) é não viciado para amostras grandes; (ii) é fracamente consistente; (iii) converge
assintoticamente para um processo gaussiano; (iv) é estimador de máxima verossimilhança de
S(t).

Para melhor entender o estimador Kaplan-Meier apresenta-se a Figura 3 onde foram estudados
os tempos de sobrevivência de dois grupos distintos, cada grupo foi submetido a um certo tipo
de tratamento médico (Esteróide e Placebo), onde é possivel observar que o grupo de esteróide
tende a morrer mais rápido do que o grupo de placebo (controlo).
De acordo com Colosimo e Giolo (2006), para construir intervalos de confiança e testar hipóteses
para S(t), faz-se necessário avaliar a precisão do estimador de Kaplan-Meier. Este estimador,
assim como outros, esta sujeito à variações que devem ser descritas em termos de estimações
intervalares.

Autor: Belmiro Armando Mahita 16 Licenciatura em Estatı́stica - UEM


Capı́tulo 2: Revisão de literatura

Segundo A expressão para a variância assimptótica do estimador de Kaplan-Meier é dada por:

h i h i2 dj
Var S(t) = S(t)
d b b ∑ . (5)
j:t j <t n j (n j − d j )

Segundo Alencar et al. (2019), a expressão é conhecida por fórmula de Greenwood. Tendo S(t) b
fixo para um certo instante t, uma distribuição assimptotica normal, o intervalo a 100x(1 − α)%
de confiança para S(t) é dado por:

r h i
S(t) ± zα/2 Var
b b ,
d S(t) (6)

onde zα/2 é o quantil de ordem 100x( α2 ) da distribuição normal.

Estimador de Nelson-Aalen

Segundo Carmes (2015), o estimador foi inicialmente proposto por Nelson (1972) e retomado
por Aalen (1978), daı́ ser denominado estimador de Nelson-Aalen. Permite estimar a função de
taxa de risco acumulado, Λ(t), sendo o estimador para esta função dado por:

b = dj
Λ(t) ∑ , (7)
j:t j <t n j

com d j e n j são defnidos do mesmo modo que no estimador de Kaplan Meier. Em con-
sequência,o estimador para S(t) é:

n o
b = exp −Λ(t)
S(t) b , (8)

e a variância assimptótica de S(t)


b dada por:

h i h i2 dj
Var
d S(t)b = S(t)
b ∑ 2 . (9)
j:t j <t nj
Da mesma maneira que para o estimador de Kaplan-Meier, recomenda-se a utilização de transformações,
b = log[−log(S(t))],
tal como U(t) b a fm de se obter estimativas intervalares para S(t) restritas ao
intervalo [0,1].

Tábuas de Vida

De acordo com Susser, et al (1998) Borges (2018), o primeiro cientista a tentar construir uma
tábua de mortalidade foi John Graunt publicou em 1662 seu livro Natural and Political Ob-
servations upon the Bills of Mortality, os primeiros métodos de construção das tábuas de vida

Autor: Belmiro Armando Mahita 17 Licenciatura em Estatı́stica - UEM


Capı́tulo 2: Revisão de literatura

começaram a ser desenvolvidas, atravês do estudo de dados de mortalidade da cidade de Lon-


dres. Mesmo sendo um estudo simples, representou um avanço na forma de expôr dados de
mortalidade da população. O método atuarial (tábua de vida) para dados incompletos calcula
as probabilidades de sobrevivência em intervalos fixados previamente, e o número dos expostos
ao risco corresponde aos pacientes vivos no inı́cio de cada intervalo x.

De acordo com Colosimo e Giolo (2006), a construção de uma tábua de vida consiste em dividir
o eixo do tempo em um certo número de intervalos. Supõe-se que o eixo do tempo foi dividido
em s + 1 intervalos, defnidos pelos pontos de corte, t1 ,t2 ,t3 , ...,ts , com I j = [t j−1 ,t j ) e j =
1, 2, 3, ..., s, em que t0 = 0 e ts = +∞.

O estimador da tábua de vida apresenta a fórmula (5) do estimador de Kaplan-Meier mas utiliza
um estimador ligeiramente diferente para q j uma vez que, neste caso, tem-se para d j e n j tal
que:

• d j = nº de eventos no intervalo [t j−1 ,t j );

• n j = [nº de indivı́duos sob risco em t j−1 ] - [ 12 x(nº de censuras em [t j−1 ,t j ))].

Assim, a estimativa para q j na tabela de vida e dada por:

nº de eventos no intervalo [t j−1 ,t j )


qbj = . (10)
[nº sob risco em t j−1 ] − [ 12 x(nº de censuras em [t j−1 ,t j ))]

A explicação para o segundo termo do denominador da expressão 10 é que observações para as


quais a censura ocorreu no intervalo [t j−1 ,t j) são tratadas como se estivessem sob risco durante
a metade do intervalo considerado.

O estimador da tábua de vida e expresso por:


(
b I )= 1; j=1
S(t j  . (11)
Sb tI( j−1) (1 − qbj−1 ); j=2, 3, ..., s

2.7.6 Testes de comparação das curvas de sobrevivência

Dadas duas funções de sobrevivência S1 (t) e S2 (t), pode-se testar as seguintes hipóteses:

H0 : S1 (t) = S2 (t) vs H1 : S1 (t) ̸= S2 (t)

Para o testar as hipóteses, aplicam-se os seguintes testes: Teste Logrank; Teste de Gehan; Teste
de Tarone-ware e teste de Peto - Peto.

Autor: Belmiro Armando Mahita 18 Licenciatura em Estatı́stica - UEM


Capı́tulo 2: Revisão de literatura

Teste de Logrank

Segundo Colosimo e Giolo (2006), o teste Logrank possibilita a análise dos desvios entre o
número de mortes observadas e o número de mortes esperadas. É construı́do com base no
número de eventos (denotados por d2 j ) observados em um dos grupos em cada tempo de
ocorrência de evento distinto t j ( j = 1, 2, ..., k) da amostra combinada (junção das duas amos-
tras individuais) e nos respectivos valores de eventos (denotados por e2 j ) nos tempos t j sob
a hipótese nula de não haver diferenças entre grupos, conforme ilustrado na Tabela 11, e a
estatı́stica de teste é expressa pela seguinte expressão:

h i2
k
∑ j=1 (d2 j − e2 j )
T= . (12)
∑kj=1 V2 j
Supondo que a distribuição de d2 j , é condicional à ocorrência de evento e censura até o instante
t j (fxando o total marginal de coluna) e ao número de eventos no tempo t j (fxando o total
marginal da linha), d2 j tem distribuição hipergeométrica:

  
n1 j n2 j
d1 j d2 j
p(d2 j |d j , n j ) =   . (13)
nj
dj
Desta forma, tem-se V2 j e e2 j como a variância condicional e valor esperado de d2 j , dadas pelas
equações 15 e 16 respectivamente.

V2 j = n2 j (n j − n2 j )d j (n j − d j )n−2 −1
j (n j − 1) , (14)

e
e2 j = n2 j d j n−1
j . (15)

A estatı́stica T tem uma distribuição aproximada de qui-quadrado com 1 grau de liberdade para
grandes amostras e quanto maior o valor da estatı́stica de teste T, maior é a evidência para
rejeitar H0 , isto é, rejeita-se a hipotese nula se o valor calculado for superior ao valor tabelado,
(Velho, 2015).

Teste de Gehan

Conforme Velho (2015), o teste de Gehan e generalização do teste de Mann-Whitney-Wilcoxon


para dados censurados. Este teste também é conhecido por teste de Wilcoxon generalizado e é

Autor: Belmiro Armando Mahita 19 Licenciatura em Estatı́stica - UEM


Capı́tulo 2: Revisão de literatura

utilizado para testar a hipotese nula, de que não existe diferença nas funções de sobrevivência
dos dois grupos.

Sejam m e n as dimensões das amostras correspondentes aos grupos 1 e 2 respectivamente.


Considere-se uma amostra conjunta com m + n tempos de observação ordenados por ordem
crescente e δi uma variável indicadora de censura. Seja Uk j = U(tk ,t j ) a pontuação atribuı́da ao
comparar um tempo fixo tk , com os tempos observados. Entao:


 +1
 se (tk > t j , δ j = 1) ou (tk = t j , δk = 0, δ j = 1)
Uk j = −1 se (tk < t j , δk = 1) ou (tk = t j , δk = 1, δ j = 0) , (16)

0 caso contrário

Seja Uk′ = ∑m+n


j=1 Uk j para k = 1, 2, ..., m + n para ( j ̸= k).

Para cada observação, k = 1, ..., m + n e atribuı́da uma pontuação Uk′ , que é igual à diferença
entre o número das restantes m + n − 1 e o número de observações que correspondem a tempo
de vida que e de certeza que tk . A estatı́stica de teste é dada por: U = ∑m+n ′
k=1 Uk para k : tk ∈
amostra 1. A esperança e a variância são dadas por:

m+n
mxn ′ 2

E(U) = 0 e var(U) = ∑ k .
U (17)
(m + n)(m + n − 1) k=1
p
Considerando a estatı́stica Z = U/ var(U), que sob a H0 , tem distribuição assimptótica N(0, 1).
Uma forma equivalente para a estatı́stica de teste e dada por:

r
UG = ∑ n j (d2 j − e2 j ), (18)
j=1

onde e2 j = n2 j d j /n j . A variância da estatı́stica UG é dada por VG = ∑rj=1 n2j v2 j , e a estatı́stica


de teste de Gehan é dada por:

WG = UG2 /VG . (19)

Assim sendo a estatı́stica WG tem distribuição assimptótica qui-quadrado (χ2 ) com 1 grau de
liberdade.

Teste de Tarone-Ware

De acordo com Karadeniz e Ercan (2017), o teste de Tarone-Ware atribui grande peso aos
perigos nos primeiros perı́odos, assim como o teste de Gehan-Wilcoxon. Ele usa a raiz quadrada
p
do número de indivı́duos em risco como peso w j = n j − d j O peso usado no teste de Tarone-

Autor: Belmiro Armando Mahita 20 Licenciatura em Estatı́stica - UEM


Capı́tulo 2: Revisão de literatura

Ware é maior que o peso usado no teste de logrank, mas menor que o peso usado no teste de
Gehan-Wilcoxon.

A estatı́stica do teste Tarone-Ware é dada pela Equação 20.


 2
n2 j −d2 j 
∑ j w j d2 j − d j n j −d j
TW = (n1 j −d1 j )(n2 j −d2 j )d j (n j −2d j )
. (20)
∑kj=1 (n j − d j ) (n j −d j )2 (n j −d j −1)

Teste de Peto-Peto

De acordo com Karadeniz e Ercan (2017), o teste Peto-Peto atribui pesos que dependem do
percentil estimado da distribuição do tempo de evento. Eventos que ocorrem precocemente,
quando a função de sobrevivência estimada é grande, recebem pesos maiores, enquanto aquelas
na cauda direita da distribuição de tempo de ocorrência de evento recebem pesos menores. Este
teste é utilizado quando a razão de risco entre os grupos não é constante.

O teste de Peto-Peto usa a estimativa da função de sobrevivência como peso w j = S(t).


b A função
de sobrevivência aqui é uma versão modificada do estimador K-M (Allison, 2010). A estatı́stica
de teste é dada na Equação 21.

 2
 
b j ) d2 j − d j n2 j −d2 j
∑ j S(t n j −d j
PP = (n1 j −d1 j )(n2 j −d2 j )d j (n j −2d j )
, (21)
∑kj=1 S(t
b j )2
(n j −d j )2 (n j −d j −1)

onde:

 
dj
S(t j ) = ∏ 1 −
b . (22)
t j <t nj −dj +1

De acordo Karadeniz e Ercan (2017), existem outros teste não-paramétricos, nomeadamente, o


teste Peto-Peto Modificado e a famı́lia de testes Fleming-Harrington.

2.7.7 Modelos de sobrevivência semi-paramétricos

De acordo com Raminelli (2015), um dos modelos frequentemente utilizado na análise de dados
de sobrevivência é o modelo de regressão semi-paramétrico de Cox.

Segundo Alves (2010), os modelos não paramétricos e semi-paramétricos (modelo de riscos


proporcionais), não assumem qualquer pressuposto sobre a distribuição da taxa de risco. Mas
assumem alguns pressupostos sobre o efeito das covariáveis em relação à taxa de risco, onde
considera-se que as taxas de risco devem ser proporcionais entre os grupos para todo o espaço
temporal.

Autor: Belmiro Armando Mahita 21 Licenciatura em Estatı́stica - UEM


Capı́tulo 2: Revisão de literatura

A análise de regressão de Cox é aplicada aos estudos longitudinais em que se pretende fazer
uma avaliação do prognóstico dos indivı́duos em estudo, considerando neste modelo o tempo
de sobrevivência como variável resposta e diversos factores que se consideram associados ao
tempo de sobrevivência como variáveis explanatórias, que podem ser de vários tipos, nomeada-
mente, variáveis numéricas (discretas e contı́nuas) ou categóricas (Andrade e Cabbeti, 2012).

De acordo com Raminelli (2015), o modelo semi-paramétrico considera que a função taxa de
risco em um dado instante t é dado por:

λ(ti |xi ) = λ0 (ti )g(xi ),

Isto significa que as caracterı́sticas de um indı́duo têm um efeito multiplicador sobre a taxa de
risco base λ0 (ti ), calculada para o perı́odo t. Uma vez que a taxa de risco não pode assumir
valores negativos, g(xi ) é definida como uma função exponencial das variáveis explicativas:

λ(ti |xi ) = λ0 (ti ) exp xTi β .



(23)

onde λ0 (ti ) é conhecido como função taxa de risco base, ou seja, a taxa de risco em um in-
divı́duo sem considerar o efeito das variáveis, β = (β1 , β2 , ..., β p ) é o vector dos coeficientes
desconhecidos e xi = (xi1 , xi2 , ..., xip ) é o vector de p covariáveis observadas no indivı́duo i.

Diz-se riscos proporcionais devido a razão entre as taxas de risco para os indivı́duos com dife-
rentes valores ou categorias das variáveis explicativas x por serem independentes do tempo, isto
é, enquanto λ0 (ti ) depende do perı́odo de tempo, os coeficientes associados às variáveis expli-
cativas, β, mantêm-se constantes ao longo do tempo, definindo apenas a magnitude da função
ao longo do tempo (Carvalho et al., 2011).

e a probabilidade de sobrevivência acima do perı́odo t resulta da seguinte fórmula:


exp xTi β
S(ti |xi ) = [S0 (ti )] , (24)

em que S0 (t) representa a função de sobrevivência base para o perı́odo t e pode ser obtida pela
seguinte expressão:

S0 (ti ) = exp {−Λ0 (ti )}. (25)

De acordo com Alves (2010), para aferir sobre o pressuposto de proporcionalidade acima refe-
rido é possı́vel recorrer tanto a abordagens gráficas como a testes estatı́sticos relacionados com
o ajustamento.

Segundo Silva (2021), uma das abordagens gráficas mais comuns é através do uso da transformação

Autor: Belmiro Armando Mahita 22 Licenciatura em Estatı́stica - UEM


Capı́tulo 2: Revisão de literatura

log − log na função de sobrevivência estimada para cada uma das variáveis, que consiste em
fazer a representação gráfica de log[−logS(t)]
b em função do tempo t e verificar-se essas curvas
são paralelas. Aplicando esta transformação em 24 temos:

log[− log S(ti |xi )] = β′ xi + log[− log S0 (ti )].

De acordo com Alves (2010), outra forma de avaliar graficamente este pressuposto é compa-
rando a curva de sobrevivência estimada pelo estimador de Kaplan-Meier, e a curva estimada
através da regressão de Cox com proporcionalidade de risco. Uma aproximação dessas duas
curvas de sobrevivência, para uma categoria da variável analisada, sugere que o pressuposto de
proporcionalidade é razoável.

Conforme Hosmer e Lemeshow (1999), a abordagem gráfica para avaliar o pressuposto de pro-
porcionalidade é um pouco subjectiva, pelo que é conveniente recorrer a testes estatı́sticos.
Assim, uma forma mais objectiva de avaliar o pressuposto da proporcionalidade é através da
análise dos resı́duos, ou seja, se os resı́duos não estiverem correlacionados com a duração então
o pressuposto de proporcionalidade não é violado. Através dos resı́duos Schoenfeld, definidos
para cada variável explicativa no modelo estimado, é possı́vel concluir sobre a proporcionali-
dade de cada uma das variáveis.

Caso não se verifique o pressuposto de proporcionalidade relativamente a uma variável ca-


tegórica com k categorias, esta pode ser utilizada como uma variável de estratificação, dando
origem a k taxas de risco base (baseline hazards), mantendo-se porém os pesos β constantes em
todos os k nı́veis de estratificação (Hosmer e Lemeshow, 1999).

2.7.8 Modelos de sobrevivência paramétricos

Segundo Alves (2010), um modelo paramétrico de sobrevivência, pressupõe-se que a duração


segue uma determinada distribuição de probabilidade com função densidade de probabilidade
f (t), aplicando-se a Equação 1 para calcular a função de sobrevivência e a Equação 3 para cal-
cular a taxa de risco. Relativamente ao modo como as covariáveis afectam a taxa de risco pode
assumir-se dois tipos de efeitos: (i) que as covariáveis têm um efeito multiplicador sobre uma
taxa de risco (riscos proporcionais - PH); (ii) ou que as covariáveis têm um efeito multiplicador
sobre o tempo (modelos de tempo de risco acelerado - AFT).

Um modelo de risco proporcional (PH) assume uma função da taxa de risco base comum a
todos os indivı́duos, que se desloca para cima, ou para baixo, como resultado do efeito das
variáveis, semelhante à regressão de Cox, com a diferença da taxa de risco base (λ0 (ti )) seguir
uma distribuição conhecida. A função da taxa de risco base e e função de sobrevivência são
semelhantes às definidas para a regressão de Cox nas Equações (23) e (24), respectivamente. Por

Autor: Belmiro Armando Mahita 23 Licenciatura em Estatı́stica - UEM


Capı́tulo 2: Revisão de literatura

Tabela 2: Distribuições para função risco base, função de sobrevivência e função densidade de
probabilidade, excluindo o efeito das variáveis

Distribuição Parâmetros Função Expressão


f0 (t) α exp(−αt)
Exponencial α>0 S0 (t) exp(−αt)
λ0 (t) α

f0 (t) ραt ρ−1 exp(−αt ρ )


Weibull ρ, α > 0 S0 (t) exp(−αt ρ )
λ0 (t) αρt ρ−1

f0 (t) α exp(γt) exp[−αγ−1 (exp(γt) − 1)]


Gompertz γ, α > 0 S0 (t) exp[−αγ−1 (exp(γt) − 1)]
λ0 (t) α exp(γt)

exp(α)kt k−1
f0 (t) (1+exp(α)t k )2
Loglogı́stico α ∈ R, K > 0 S0 (t) 1
1+exp(α)t k
exp(α)kt k−1
λ0 (t) 1+exp(α)t k
h i
f0 (t) √1 exp 1
− 2γ (log(t) − µ)2
t 2πγ
Lognormal µ ∈ R, γ > 0
 
S0 (t) 1 − FN log(t)−µ

γ
λ0 (t) f (t)/S(t)
Fonte: Duchateau e Janssen (2008).

seu turno, num modelo AFT as variáveis têm um feito multiplicador sobre o tempo, aumentando
ou reduzindo a duração até à ocorrência do evento. A taxa de risco resulta da seguinte fórmula:

 
λ(t|x) = λ0 t exp (βx) exp (βx), (26)

e a probabilidade de sobrevivência acima do perı́odo t é dada pela seguinte fórmula:

 
S(t|x) = S0 t exp (βx) . (27)

Segundo Santos (2016), o uso dos modelos paramétricos com riscos proporcionais tem sido
bastante adequado na análise estatı́stica de dados em saúde, com destaque para os modelos
exponencial, weibull, log-normal e log-logı́stica, conforme ilustra a Tabela 2.

Autor: Belmiro Armando Mahita 24 Licenciatura em Estatı́stica - UEM


Capı́tulo 2: Revisão de literatura

2.7.9 Estimação dos parâmetros em modelos de sobrevivência paramétricos

Segundo Colosimo e Giolo (2006), os parametros são medidas desconhecidas que descrevem
os modelos de probabilidade e que precisam ser estimados a partir das observações amostrais.
O metodo de máxima verossimilhança é uma opção apropriada para dados censurados, incor-
porando as censuras e relativamente simples, e possui propriedades óptimas para grandes amos-
tras.

Seja dada uma amostra de observações t1 ,t2 , ...,tn da população, em que todas as observações
são não censuradas. A função de máxima verosimilhança para o vector de parâmetros θ é
expressa por:

n
L(θ) = ∏ f (ti , θ), (28)
i=1

onde f (ti ) é a função densidade de probabilidade.

Portanto, é necessário dividir as observações censuradas e as não censuradas, uma vez que os
dados considerados são dados de tempo de vida. Ou seja, sejam r observações não censuradas,
(1, 2, ..., r) e n − r observações censuradas, (r + 1, r + 2, ..., n). Assim, a expressao para a função
de máxima verossimilhança que abrange todos os tipos de censura é expressa por:

r n n
L(θ) = ∏ f (ti , θ) ∏ S(ti , θ) = ∏[ f (ti , θ)]δi [S(ti , θ)]1−δi , (29)
i=1 i=r+1 i=1

onde S(ti ) é a função de sobrevivência representada pela equação (1) e δi é a variável indicadora
de evento ou censura. É comum trabalhar com o logarı́tmo da função de verossimilhança que é
dado por:

ℓ(θ) = ∑ ln[ f (ti )] ∑ ln[S(ti )]. (30)


i∈r i∈n−r

onde r denota o conjunto de observações não censuradas e n − r o conjunto de observações


censuradas.

Para maximizar L(θ) ou ℓ(θ) e encontrar os valores de θ, basta resolver a derivada parcial dadas
por:

∂ln(L(θ))
U(θ) = = 0. (31)
∂θ
Como as equações são, em sua maioria, não lineares em θ e não apresentam solução analı́tica,
a equação deve ser resolvido por um método numérico, como o método de Newton Raphson.

Autor: Belmiro Armando Mahita 25 Licenciatura em Estatı́stica - UEM


Capı́tulo 2: Revisão de literatura

Segundo Colosimo e Giolo (2006), o método interativo de Newton-Raphson é um método


numérico, usado para resolver um sistema de equações não lineares, baseado na expansão de
U(b θ(k) ) em série de Taylor. Para mais detalhes sobre o método interativo de Newton Raphson e
série de Taylor consulte Colosimo e Giolo (2006, pag: 43).

2.7.10 Modelos paramétricos de sobrevivência com fracção de cura

De acordo com Wienke (2011) os tipos de modelos de análise de sobrevivência anteriormente


apresentados não permitem considerar a existência de um grupo de indivı́duos curados, ou seja,
para os quais não se regista o acontecimento em estudo. Uma suposição frequentemente não
declarada desse modelo é que todos os indivı́duos são suscetı́veis a experimentar o evento de
interesse. Consequentemente, se o acompanhamento for longo o suficiente, todos os indivı́duos
vivenciarão o evento. No entanto, em algumas situações faz sentido supor a existência de uma
fracção de indivı́duos que não se espera que experimentem o evento. Esses indivı́duos não são
susceptı́veis ou são curados, portanto, existe uma fracção na população do estudo que se re-
cuperou da doença e agora está protegida. Os modelos de cura são modelos de sobrevivência
que permitem uma fracção de indivı́duos curados. Esses modelos ampliam a compreensão dos
dados de tempo até a ocorrência do evento, permitindo a formulação de conclusões mais preci-
sas e informativas do que as feitas anteriormente. De outra forma, essas conclusões não seriam
obtidas de uma análise que não leva em conta uma fracção da população curada. Se não haver
indivı́duos curados, a análise é reduzida a abordagem padrão de análise de sobrevivência. Uma
caracterı́stica chave dos dados modelados por modelos de cura é que precisa haver tempo de
acompanhamento suficiente para determinar que uma fração de cura está presente na população
de estudo. Para a proporção de indivı́duos na população que vivenciam o evento em estudo,
existem muitas maneiras de modelar a distribuição de seus tempos de evento. Os modelos an-
teriormente estudados assumem que:

lim S(t|x) = 0.
t→∞

Conforme Abreu e Rocha (2006) e Paes (2007), a existência de um elevado número de observações
censuradas, pode indicar uma fracção de indivı́duos curados. Assim, um modelo com fracção de
cura, ou modelo de cura, permite considerar duas proporções de indivı́duos: (i) π é a fracção
dos não curados; e (ii) (1 − π) a fracção dos indivı́duos curados. Portanto, considera uma
variável aleatória de Bernoulli Yi latente, tal que Yi ∼ Bernoulli(π), para separar indivı́duos
curados dos não curados. Ou seja,

(
0 Se o indivı́duo i é curado
Yi = .
1 Se o indivı́duo i não é curado

com P(Yi = 0) = 1 − π e P(Yi = 1) = π.

Autor: Belmiro Armando Mahita 26 Licenciatura em Estatı́stica - UEM


Capı́tulo 2: Revisão de literatura

De acordo com Cai et al., (2012), uma vantagem dos modelos de mistura é que a fracção dos
sujeitos curados e a função de sobrevivência dos sujeitos não curados são modeladas separada-
mente e a interpretação dos efeitos das covariáveis em z e x é directo.

Portanto, considerando (c) como a subpopulação de curados e (nc) como a subpopulação não
curados, se tem o seguinte:

Segundo Alves (2010), uma vez que os indivı́duos pertencentes ao grupo dos curados não irão
registar o evento de interesse, então lim Sc (t|x) = 1. A função de sobrevivência relativa ao
t→∞
grupo dos não curados pode ser modelada considerando uma das distribuições dos modelos
descritos anteriormente. Sendo Y uma variável binária, em que Y = 1 representa um indivı́duo
não curado e Y = 0 um indivı́duo curado, é possı́vel modelar π = P(Y = 1) através de uma
regressão logı́stica.

1
π(zi ) = , (32)
1 + exp (−βzi )
com π(zi ) ∈ (0, 1).

Outas funções de ligação aplicadas para a fracção de cura são o complementar log-log e probit.

De acordo com Paes (2007), a função de sobrevivência S(ti |xi ) para toda a população é obtida
atravês de uma mistura das duas subpopulações, formando-se duas parcelas, o modelo de sobre-
vivência da fracção dos curados Sc (ti |xi ) e o modelo de sobrevivência da fracção de não curados
Snc (ti |xi ):

S(ti |xi , zi ) = [1 − π(zi )] + π(zi )Snc (ti |xi ), (33)

as funções de densidade de probabilidade e de risco são dados por:

f (ti |xi , zi ) = π(zi ) fnc (ti |xi ), (34)

π(zi ) fnc (ti |xi )


λ(ti |xi , zi ) = . (35)
[1 − π(zi )] + π(zi )Snc (ti |xi )

Propriedades do modelo de Sobrevivência com fracção de cura

(i) Se π(zi ) = 1 não há indivı́duos curados, então S(ti |xi ) = Snc (ti |xi );

(ii) S(0) = 1, todos os indivı́duos estão vivos no instante t=0;

Autor: Belmiro Armando Mahita 27 Licenciatura em Estatı́stica - UEM


Capı́tulo 2: Revisão de literatura

(iii) S(ti |xi ) é uma função monótona não crescente;

(iv) lim S(ti |xi ) = 1 − π(zi ) a função de sobrevivência estabiliza na fracção de cura a partir de
ti →∞
um certo instante de tempo.

2.7.11 Estimação dos parâmetros em modelos paramétricos com fracção de cura

Conforme Silva (2017), considera θ um vector de parâmetros associados a f.d.p., do tempo


de evento T , e t = [(t1 , δ1 ), (t2 , δ2 ), ..., (tn , δn )], os pares de observações de uma amostra de n
indivı́duos com ti representando o tempo observado (evento ou censura) do indivı́duo i e δi a
variável indicadora de evento ou censura, onde i = 1, 2, ..., n.

Então, a função de verossimilhança associada ao modelo com fracção de cura é dada por:

n n δi  1−δi o
L(θ, π|t) = ∏ f (ti |θ, π) S(ti |θ, π) , (36)
i=1

Substituindo f (ti |θ, π) pela equação (34) e S(ti |θ, π) pela equação (33), a equação (36) fica da
seguinte forma:

n n  1−δi o
δi δi
L(θ, π|t) = ∏ π fnc (ti |θ) (1 − π) + πSnc (ti |θ) , (37)
i=1
 
Logo, a função log-verossimilhança ℓ(θ, π|t) = log L(θ, π|t) é:

n n   n  
ℓ(θ, π|t) = ∑ δi logπ + ∑ δi log fnc (ti |θ) + ∑ (1 − δi )log (1 − π) + πSnc (ti |θ) . (38)
i=1 i=1 i=1

Para maximizar ℓ(θ, π) e encontrar os valores de θ basta resolver as derivadas parciais dadas
pela equação (31) e seguir o algorı́tmo interativo dado nesta equação, e π pode ser modelado,
por exemplo, através de uma função de ligação do tipo logit, como apresentado na equação (32).

2.7.12 Modelos semi-paramétricos de sobrevivência com fracção de cura

Segundo Cai et al., (2012), a abordagem paramétrica para os modelos de cura, foram estudados
por muitos autores, no entanto, como geralmente é difı́cil verificar uma suposição paramétrica,
tem havido um interesse crescente nos modelos de misturas semi-paramétricos.

Conforme mencionado anteriormente, a parte da sobrevivência dos não curados, também desig-
nada por parte de latência, pode ser especificada pelo modelo PH ou AFT. Seja S0 (t) uma função

Autor: Belmiro Armando Mahita 28 Licenciatura em Estatı́stica - UEM


Capı́tulo 2: Revisão de literatura

de sobrevivência de base para os sujeitos não curados quando x = 0. Se S(t|x) = S0 (t)exp(βx) , o


modelo de mistura de cura é chamado de PHMC (sigla em inglês que significa modelo de cura

de misturas de riscos proporcionais), e se S(t|x) = S0 t exp (βx) é chamada de AFTMC (sigla
em inglês que significa modelo de cura de mistura com tempo de evento acelerado).

Seja ø = (ti , δi , zi , xi ) dados observados do i-ésimo indivı́duo com i = 1, ..., n em que ti é o tempo
de sobrevivência observado, δi = 1 indicando o tempo de ocorrência do evento e δi = 0 se for o
tempo de censura, e as possı́veis covariáveis zi da parte de fracção de cura, também designado
de parte de incidência e xi da parte de sobrevivência dos não curados, ou seja, a parte de latência.
Importa salientar que as mesmas covariáveis são permitidas para os componentes de incidência
e latência, embora usemos diferentes notações de covariáveis para esses dois componentes.

Considera Φ = (b, β, S0 (t)) denotando os parâmetros desconhecidos. O algorı́tmo de maximização


de expectativa (algorı́tmo EM) é usado para estimar os parâmetros de interesse nos modelos
PHMC e AFTMC. Tomando Y como indicador de que um indivı́duo eventualmente (Y = 1) ou
nunca (Y = 0) vivencie o evento, com a probabilidade de π(z).

Dado y = (y1 , y2 , ..., yn ) e ø, a função de verossimilhança completa pode ser expressa como:

n
∏[1 − π(zi)]1−yi π(zi)yi λ(ti|Y = 1, xi)δiyi S(ti|Y = 1, xi)y−i, (39)
i=1

onde λ(.) é a função de risco correspondente a S(.). O logarı́tmo da função de verossimilhança


completa pode ser escrito como ℓ(b, β, ø, yi ) = ℓc (b; ø, yi ) + ℓnc (β; ø, yi ), onde:

n
ℓc (b; ø, yi ) = ∑ yi log[π(zi )] + (1 − yi )log[1 − π(zi )], (40)
i=1

n
ℓnc (β; ø, yi ) = ∑ yi δi log[λ(ti |Y = 1, x1 )] + yi log[S(ti |Y = 1, xi )]. (41)
i=1

O E-passo no algorı́tmo EM calcula a expectativa condicional da probabilidade logarı́tmica


completa em relação a yi dado os dados observados ø e estimativas atuais de parâmetros Θ(m) =
(m)
(b(m) , β(m) , S0 (t)). A expectativa condicional de yi será suficiente para concluir o E-passo,
desde que ambas as funções (40) e (41) sejam funções lineares de yi . A expectativa de E(yi |ø, Θ(m) )
pode ser escrito como:

(m) π(zi )S(ti |Y = 1, xi )


= E(yi |ø, Θ(m) ) = δi + (1 − δi )

wi (m) . (42)
1 − π(zi ) + π(zi )S(ti |Y = 1, xi ) (ø,Θ )
(m) (m)
É fácil ver que wi = 1 se δi = 1 e wi é a probabilidade de pacientes não curados se δi = 0.
Assim, a segunda parte do E(yi |ø, Θ(m) ) pode ser interpretado como a probabilidade condicional

Autor: Belmiro Armando Mahita 29 Licenciatura em Estatı́stica - UEM


Capı́tulo 2: Revisão de literatura

(m) (m)
do i-ésimo indivı́duo ainda não curado. Porque δi logwi = 0 e wi = δi , as expectativas de 40
e 41 podem ser escritas como:

n
(m) (m)
E(ℓc ) = ∑ wi log[π(zi )] + (1 − wi )log[1 − π(zi )], (43)
i=1

n
(m) (m)
E(ℓnc ) = ∑ δi log[wi λ(ti |Y = 1, x1 )] + wi log[S(ti |Y = 1, xi )]. (44)
i=1

O passo M no algorı́tmo EM é maximizar as equações (43) e (44) em relação aos parâmetros


desconhecidos. Utiliza-se modelos lineares generalizados para estimar os parâmetros na equação
(43) e as funções de ligação logit, clog-log ou probit conforme descrito anteriormente.

Como as expressões das equações (42) e (44) dependem da suposição de latência, os pormeno-
res sobre a abordagem de estimação sob o modelo PHMC e o modelo AFTMC serão apresen-
tados separadamente.

2.7.13 Modelo PHMC

De acordo com Taylor (1995), para encontrar as estimativas dos coeficientes β a partir da
equação (44) sem ter que especificar o risco base, é utilizado um método log-verossimilhança
parcial proposto anteriormente. A equação de estimação é dada por:

  
(m)
n    δi exp βxi +log wi
(m)
log ∏ λ0 (t) exp βxi ) + log wi S0 (ti ) . (45)
i=1

A função (45) é semelhante à função logarı́tmica do modelo padrão PH, com uma variável
(m)
de deslocamento adicional log wi . Portanto, devido a essa similaridade, pode se usar o
modelo proporcional de Cox para estimar os parâmetros da equação (44).

Para a etapa E do algorı́tmo EM, é necessário actualizar a função de sobrevivência estimada.


Considera-se t(1) < t(2) < ... < t(k) os tempos distintos de ocorrência de evento não censurados,

dt( j) o número de eventos e R t( j) o risco no tempo t( j) . A equação (46) fornece um estimador
de tipo Breslow para S0 (t|Y = 1)
 
dt( j)
Sb0 (t|Y = 1) = exp − . (46)
 
∑  w(m)

j:t( j) ≤t ∑ i exp β
b x
m i
i∈R t( j)

Devido a fracção da cura, Sb0 (t|Y = 1) pode não aproximar-se a 0 quando t → ∞.

Portanto, para evitar problemas de identificação, define-se Sb0 (t|Y = 1) = 0 para t > t(k) , onde

Autor: Belmiro Armando Mahita 30 Licenciatura em Estatı́stica - UEM


Capı́tulo 2: Revisão de literatura

t(k) é o último tempo de evento observado. A função de sobrevivência estimada torna-se S(t|Y
b =

1) = Sb0 (t|Y = 1)exp βx . Desta forma, a restrição de cauda zero pressupõe que os indivı́duos
b

com tempos de sobrevivência maiores que o último tempo de evento observado são todos não
susceptı́veis ao risco.

2.7.14 Modelo AFTMC

De acordo com Zhang e Peng (2007) este modelo consiste em estimativa baseado em classificação
para estimar β no passo M para o modelo AFTMC semi-paramétrico, para tal é necessário
transformar a equação (44) em uma função verossimilhança logarı́tmica de um modelo AFT
(m)
semi-paramétrico padrão, exceto para o termo da constante wi , que é:

n
h iδi  (m)

(m) wi
log ∏ wi λ(log(ti ) − βxi ) S(log(ti ) − βxi ) , (47)
i=1

Isto permite estimar os β do modelo AFT em passo M pelos métodos de estimação semi-
paramétrico existentes. A obtenção do estimador é feito pela maximização da função convexa
G(β), onde:

n n
(m)
G(β) = n−1 ∑ ∑ δi w j |εi − ε j |I(εi − ε j ). (48)
i=1 j=1

Portanto, a maximização da função (44) pode ser realizada maximizando a função (48) por meio
de modelos lineares.

Seja τ1 < τ2 < ... < τk , os resı́duos de eventos distintas não censuradas, que é logti − βxi ,
1, ..., n, dτ j denota o número de eventos e R(τ j ). O estimador de S0 (ε|Y = 1) é dado por:

 
dτ j
Sb0 (ε|Y = 1) = exp − ∑ (m)
. (49)
j:τ j <ε ∑i∈R(τ ) wi
j

Assim como o modelo semi-paramétrico PHMC, fixa-se Sb0 (ε|Y = 1) = 0 para ε > τk . Então
Sb0 (t|Y = 1) = Sb0 (ε|Y = 1).

Segundo Cai, et al. (2012), Devido à complexidade da equação de estimativa no algorı́tmo


EM, os erros padrão dos parâmetros estimados não estão diretamente disponı́veis. Para obter
a variância de b
βebb, os pacotes aplicados nos software estatı́sticos, desenham aleatoriamente
amostras de bootstrap, de forma a encontrar estimativas ótimas de variância mı́nima.

Autor: Belmiro Armando Mahita 31 Licenciatura em Estatı́stica - UEM


Capı́tulo 2: Revisão de literatura

2.7.15 Função de probabilidade de cura

Segundo Paes (2007), a função de probabilidade de cura indica a probabilidade de que um


indivı́duo seja curado, dado que ele tenha sobrevivido até um certo tempo t > 0, isto é:

P(Yi = 0, T > t) P(T > t|Yi = 0)P(Yi = 0) 1 − π


P(t) = P(Yi = 0|T > t) = = = .
P(T > t) P(T > t) S(t)

Propriedades da função de probabilidade de cura


i) P(t) é monótona não-descrescente (quanto mais passa o tempo, maior é a probabilidade de
que o indivı́duo fique curado);

ii) P(0) = 1 − π, como S(t) = 1 no instante t = 0, então 1 − π/S(0) = 1 − π;

iii) lim P(t) = 1, portanto, (1 − π) ≤ P(t) ≤ 1;


t→∞

Segundo Paes (2007), a fracção de cura 1 − π e a função de probabilidade de cura P(t) podem
ser estimadas parametricamente e não-parametricamente:

Estimação paramétrica: Escolhe-se uma distribuição de probabilidade para a variável aleatória


T e os parâmetros do modelo são estimados pelos seus respectivos estimadores de máxima
verossimilhança, dada pelo estimador P(t):
b

b = 1 − π,
b
P(t) (50)
S(t)
b

em que b
π e S(t)
b são os estimadores de máxima verossimilhança para π e S(t), respectivamente.

Estimação não-paramétrica: Considerando SbKM (t) o estimador de Kaplan-Meyer para S(t),


temos:

n o
PbKM = min SbKM (t) , (51)

PbKM
PbKM (t) = , (52)
SbKM (t)
em que PbKM (t) é a estimativa de Kaplan-Meyer para a função de probabilidade de cura no
instante t.

Autor: Belmiro Armando Mahita 32 Licenciatura em Estatı́stica - UEM


Capı́tulo 2: Revisão de literatura

2.7.16 Selecção do modelo de sobrevivência

Segundo Santos (2016), a escolha do modelo que descreve de forma adequada um conjunto de
dados de sobrevivência é uma etapa muito importante da análise. Se o modelo utilizado não é
adequado aos dados, os resultados podem não retratar correctamente a realidade, invalidando
toda a análise realizada.

Segundo Colosimo e Giolo (2006) e Alves (2010), existem critérios para auxiliar na escolha
do modelo que melhor se ajusta aos dados, ou seja, indicam qual a distribuição probabilı́stica
se adequa melhor as caracterı́stcas apresentadas pelos dados. Entre estes criterios estão alguns
métodos gráficos, o teste da razão de verossimilhança, o critério de informação de Akaike (
Akaike Information Criterion-AIC) e o critério de informação Bayesiana (Bayesian Information
Criterion-BIC).

Critério de informação de Akaike (AIC)

Segundo Velho (2015), a principal limitação dos modelos paramétricos tem haver com a neces-
sidade de definir a forma da função de risco. Considerando modelos não aninhados, o AIC pode
ser útil para escolher o modelo mais adequado. Este critério, irá penalizar a log-verossimilhança
de cada modelo, de forma a reflectir o número de parâmetros que estão a ser estimados, permi-
tindo a comparação de modelos. A expressão relativa ao AIC é dada por:

AIC = −2ℓ(b
θ) + 2k, (53)

onde, ℓ(b
θ) e o logaritmo da função verosimilhança do modelo e k é número de parâmetros do
modelo.

Critério de informação Bayesiana (BIC)

De acordo com Garcia (2013), este critério considera o número de parâmetros do modelo (k), a
log-verossimilhança [ℓ(bθ)] e o número de observações (n). Assim como o AIC, quanto menor
for o valor do BIC melhor é o ajuste do modelo. É obtido através de resultados assintóticos e
da suposição de que os dados pertencem à famı́lia exponencial, a equação é dada por:

BIC = −2ℓ(b
θ) + k log(n). (54)

Teste de razão de verossimilhança

De acordo com Velho (2015), os desvios residuais são componentes da estatı́stica Deviance,
que avalia a hipótese nula de que o modelo se ajusta aos dados. Pode ser testada pela estatı́stica
da função desvio (deviance), dada por:

Autor: Belmiro Armando Mahita 33 Licenciatura em Estatı́stica - UEM


Capı́tulo 2: Revisão de literatura

 
D = −2 ℓ(b
θ)G − ℓ(b
θ)R , (55)

onde ℓ(bθ)G e ℓ(b


θ)R são o logarı́tmo da função verossimilhança do modelo reduzido nas estima-
tivas de máxima verossimilhança e o logarı́tmo da função de verosimilhança do modelo geral.
Quanto maior for amdeviance do modelo, pior é a qualidade do ajuste.

Segundo Carvalho et al. (2011), a estatı́stica D segue assimptoticamente, a distribuição qui-


quadrado (χ2 ) com n − p − 1 graus de liberdade, ou seja, o número de observações menos o
número de covariáveis do modelo menos um. Nesse caso, quanto menor a estatı́stica, maior
p-valor melhor é a qualidade de ajuste do modelo.

Análise gráfica do ajuste

De acordo com Carvalho et al. (2011), o método gráfico é uma técnica auxiliar na escolha da
famı́lia de distribuições paramétricas. É portanto uma ferramenta exploratória para a escolha
de possı́veis modelos. Colosimo e Giolo (2006), sugerem dois métodos gráficos para auxiliar

na escolha dos modelos candidatos, onde o primeiro método consiste na comparação da função
de sobrevivência do modelo proposto com o estimador de Kaplan-Meier e o segundo método
consiste na linearização da função de sobrevivência.

De acordo com Carvalho et al. (2011), outra análise gráfica útil consiste em comparar as curvas
de sobrevivência geradas pelo estimador não paramétrico de Kaplan-Meier com as estimadas
parametricamente. Quanto mais próximo o modelo paramétrico estiver da curva de sobre-
vivência do estimador de Kaplan-Meier, melhor é o ajuste do modelo. Os métodos gráficos
apresentados nesta secção, devem ser usados para descartar modelos claramente inapropriados,
e não para demostrar que um modelo paramétrico é melhor, pois, para isso a análise de resı́duos
é mais apropriada.

2.7.17 Diagnóstico do modelo de sobrevivência

Segundo Frazão (2012), em qualquer análise estatı́stica é de extrema importância proceder a


uma análise residual, visando verificar se o modelo escolhido se ajusta bem ao conjunto de
dados a serem estudados. Tal anáse deve ser feito basicamente como forma de forma a rejeitar
modelos claramente inapropriados e não para demonstrar que um particular modelo está certo.

De acordo com o velho (2015), a interpretação de resı́duos para modelos paramétricos é idêntica
à do modelo de Cox, portanto, são abordados no contexto de modelos paramétricos.

Autor: Belmiro Armando Mahita 34 Licenciatura em Estatı́stica - UEM


Capı́tulo 2: Revisão de literatura

Resı́duos de Cox-Snell

Os resı́duos de Cox-Snell são usualmente utilizados para averiguar o ajustamento global do


modelo de Cox, no entanto, são igualmente aplicáveis nos modelos de tempos de vida acelerado,
e são definidos pela seguinte expressão:d

ri = Λ(t β′ xi )Λ
b i , xi ) = exp(b b 0 (ti ), (56)

em que para o i-ésimo indivı́duo, se tem que ti é o instante de tempo t ∈ T , xi é o vector das
covariáveis e Λ
b é a função de risco acumulado, estimado para o modelo.

Segundo Colosimo e Giolo (2006), quando o modelo possui bom ajuste é possı́vel verifcar que
o gráfico dos resı́duos de Cox-Snell contra o logarı́tmo negativo da função de sobrevivência
empı́rica construı́da pelo estimador Kaplan-Meier gera uma recta com um angulo de 45o .

Resı́duos de Martingale

De acordo com Velho (2015), os residuos de Martingale Mi são baseados em processos de


contagem no inı́cio do estudo quando todas as covariáveis estão fixas. A fórmula para o cálculo
é dada por:

M β′ xi )Λ
bi = δi − exp(b b 0 (ti ) = δi − ri . (57)

Assim, Mi é a diferença entre o número de acontecimentos observados no i-ésimo indivı́duo e o


esperado de acordo com o modelo ajustado (resı́duos de Cox-Snell), δi é a variável indicadora
de censura e ri são os resı́duos de Cox-Snell. Esses resı́duos, são vistos como uma estimativa
do número de eventos em excesso observadas nos dados mas não preditas pelo modelo. São
usados, em geral, para examinar a melhor forma funcional por exemplo linear, quadrática, etc,
para uma dada covariável em um modelo de regressão assumido para os dados sob estudo. Se
a curva suavizada obtida no gráfico: resı́duo x variável for linear, nenhuma transformação na
variável é necessária, caso contrário pode-se fazer a inclusão de um termo quadrático da variável
no modelo ou sugerir alguma transformação da mesma como por exemplo a transformação log-
log.

Autor: Belmiro Armando Mahita 35 Licenciatura em Estatı́stica - UEM


Capı́tulo 3: Material e métodos

3 Material e métodos

3.1 Material
Para este estudo, foi usada uma base de dados secundária fornecida pelo Hospital Geral da Ma-
chava, composta por oito variáveis com 406 observações, registadas num perı́odo compreendido
entre 01 de Setembro de 2016 a 31 de Agosto de 2018 e os dados foram processados através
dos pacotes estatı́sticos R versão 4.2.

As variáveis usadas são de natureza qualitativa e quantitativa, sendo que a variável dependente
(tempo decorrido até a ocorrência do evento Óbito), é de natureza quantitativa e as variáveis
género, TB/HIV, padrão de resistência, tipo de entrada, resultado do tratamento são de natureza
qualitativa. A variável idade, sendo de natureza quantitaviva, foi categorizada para facilitar sua
análise e a variável desfecho, de natureza qualitativa dicotómica, que também caracteriza-se por
ser uma variável indicadora de censura ou evento, resultou da associação de altas, abandonos,
transferências e em tratamento, que são categorias da variável resultado de tratamento, tendo
sido classificadas como censuras e a categoria óbitos classificada como evento de interesse.

A tabela 3, apresenta um breve sumário da descrição das variáveis em estudo, em que pode
observar-se que para a variável género, indivı́duoa de sexo feminino estão em maior número
com uma fracção de 55.2% do total e 44.8% para indivı́duos de sexo masculino; No que diz res-
peito a co-infecção TB e HIV, uma fracção 83.5% dos pacientes em relação ao total tinham TB
associado ao HIV; Em relação ao padrão de resistência pode verificar-se que 89.4% dos pacien-
tes apresentavam TB-MR e 10.6% apresentavam TB-XR; Do resultado do tratamento observa-
se que 31.5% foram óbitos, 56.4% tiveram alta, 4.2% foram transferidos, 0.7% abandoram o
tratamento e 7.1% ainda estavam em tratamento no fim do estudo; A idade dos pacientes varia
entre 15 a 86 anos, com uma média de 38 anos e media igual a 37 anos; A variável localização
da lesão foi descartada para o estudo visto que todos os pacientes apresentavam tuberculose pul-
monar. Mais detalhes sobre a descrição dos tempos vividos pelos elementos da amostra estão
descritos na tabela abaixo.

3.2 Métodos
Nesta subsecção faz-se a caracterização do estudo, descrição dos procedimentos usados na
análise dos dados, que inclui a análise exploratória, estimação dos modelos de sobrevivência,
comparação dos modelos estimados, selecção do melhor modelo e avaliar a qualidade do ajuste
do modelo seleccionado.

O estudo caracteriza-se por ser uma pesquisa aplicada, de natureza quantitativa e exploratória.
Quanto à análise descritiva das variáveis foi feita aplicando a tabela cruzada entre a variável

Autor: Belmiro Armando Mahita 36 Licenciatura em Estatı́stica - UEM


Capı́tulo 3: Material e métodos

Tabela 3: Descrição das variáveis em estudo

Variável Descrição Categorias Frequências (%) Tempo médio Tempo mediano Tempo máximo
1-Masculino 182 (44.8%) 38.2 26.5 178
Genero Género dos pacientes
2-Feminino 224 (55.2%) 46.7 32.0 234

0-Não tem TB/HIV 67 (16.5%) 44.7 36.0 149


TBHIV Associaçã TB/HIV
1-Tem TB/HIV 339 (83.5%) 42.5 28 234

1-Caso novo 326 (80.3%) 45.5 31.0 234


T.entrada Tipo de entrada do paciente
2-Recaı́da 80 (19.7%) 32.1 21.5 138

1-MR 363 (89.4%) 40.4 28.0 189


P.resistencia Padrão de resistência de TB-MR
2-XR 43 (10.6%) 63.7 43.0 234

1-Óbito 128 (31.5%) 29.6 16.0 189


2-Alta 229 (56.4%) 42.8 31.0 234
R.tratamento Resultado do tratamento no final do estudo 3-Abandono 3 (0.7%) 19.0 17.0 33
4-Transferido 17 (4.2%) 26.5 17.0 76
5-Em tratamento 29 (7.1%) 113.8 115.0 178

0-Censura 278 (68.5%) 49.0 33.0 234


Desfecho Indicador de ocorrência do evento
1-Evento 128 (31.5%) 29.6 16.0 189

Idade Idade dos pacientes — — — — —


Geral ... ... 406 (100.0%) 42.9 30.0 234

indicadora de censura e as covariáveis no modelo, com objectivo de verificar quantos elementos


da amostra em cada categoria, experimetaram o evento de interesse (morte) ou censurados.

A descrição do tempo de sobrevivência geral e estratificada por cada covariável, foi feita apli-
cando o estimador de Kaplan-meier e posterior aplicação de testes de Log-rank, Tarone Ware
e Gehan-Breslow para verificar a igualidade das curvas de sobrevivência para cada variável
explicativa. De seguida foram estimados os modelos semi-paramétricos de cox, modelos pa-
ramétricos e de fracção de cura. Os modelos paramétricos, assim como de fracção de cura,
foram ajustados de acordo com as seguintes distribuições de probabilidades: Log-normal, Ex-
ponencial, Weibull e Log-logı́stico. O método empregue para estimação de parâmetros é o
método de máxima verossimilhança.

A selecção do melhor modelo, foi feito atravês de comparação dos valores estimados de Log-
verossimilhança, AIC e BIC, conforme descrito no capı́tulo anterior. A inferência sobre os
parâmetros dos modelos ajustados, assim como os demais testes estatı́sticos foi feita atravês do
p.valor associado à cada estatı́stica de teste, a um nı́vel de significância de 5%.

Tendo-se verificado que o modelo semi-paramétrico com fracção de cura melhor se ajusta
aos dados, para o procedimento de análise e ajuste do modelos final foi considerado o mo-
delo PHMC, cujos procedimentos estão descritos na secção 2.7.12. A metodologia de análise
baseiou-se na observação e análise comparativa das curvas de sobrevivência estimadas pelo mo-
delo selecionado, análise comparativa das probabilidades de sobrevivência estimadas e proporções
de cura para diferentes grupos de pacientes com caracteristicas similares de doença.

Autor: Belmiro Armando Mahita 37 Licenciatura em Estatı́stica - UEM


Capı́tulo 4: Resultados e discussão

4 Resultados e discussão
Nesta secção, são apresentados os resultados da análise feita aos dados descritos no Subsecção
3.1, e a descrição das variáveis de acordo com a ocorrência ou não de morte por TB-MR,
descrição do tempo de morte dos pacientes por cada covariável atravês das curvas de Kaplan-
Meier, estimação dos modelos de sobrevivência semi-paramétricos, paramétricos considerando
algumas distribuições de probabilidade, nomeadamente, a distribuição exponencial, weibull,
log-normal, log-logistico, e weibull-weibull, weibull-exponencial em alguns modelos de sobre-
vivência com fracção de cura onde é possivel aplicar distribuições complexas e posteriormente,
faz-se a comparação e selecçaõ do melhor modelo para análises subsequentes.

4.1 Resultados
A Tabela 4 mostra a descrição das variáveis em relção a ocorrência de evento (morte) ou censura
em paceintes diagnosticados com TB-MR durante o perı́odo em análise, com um total de 406
pacientes observados dos quais 68.5% foram censurados, ou sejam, sobreviveram durante o
perı́odo em análise. Neste trabalho, estes pacientes são considerados curados, embora não se
sabe do seu estado para tempo posterior ao estudo.

De um modo geral, a fracção dos eventos (mortes) em todas as variáveis é relativamente menor
em relação a fracção das censuras, no entanto, importa referenciar algumas covariáveis que
tendem a apresentar maiores proporções de mortes, como é o caso de pacientes com recaı́da e
padrão de resistência extensivamente resistente com 43.8% e 41.9% da fracção de mortes em
relação aos seus totais respectivamente. Os pacientes com TB sem HIV associado são os que
apresentam menor fracção de morte.

Tabela 4: Descrição das variáveis em relação a morte ou censura


Variável Categorias Evento Censura Total
Masculina 62 (34.1%) 120 (65.9%) 182
Gênero
Feminino 66 (29.5%) 158 (70.5%) 224

Caso novo 93 (28.5%) 233 (71.5%) 326


T. entrada
Recaida 35 (43.8%) 45 (56.2%) 80

Não tem HIV associado 14 (20.9%) 53 (79.1%) 67


TBHIV
Tem HIV associado 114 (33.6%) 225 (66.4%) 339

MR 110 (30.3%) 253 (69.7%) 363


P. resistência
XR 18 (41.9%) 25 (58.1%) 43

Total ... 128 (31.5%) 278 (68.5%) 406

Autor: Belmiro Armando Mahita 38 Licenciatura em Estatı́stica - UEM


Capı́tulo 4: Resultados e discussão

4.1.1 Descrição do tempo de sobrevivência

A Figura 4 apresenta as curvas de sobrevivência, estimadas pelo estimador de Kaplan-Meier.


A curva geral em (A), representa a probabilidade de um indivı́duo sobreviver até um certo
instante t > T , em geral, sem considerar qualquer covariável. O facto desta curva não alcançar
a probabilidade zero, é um indı́cio da existência de uma fracção de cura, isto é, uma fracção
considerável (parte cinzenta da curva A) de indivı́duos em estudo que não observaram o evento
de interesse (morte) durante o perı́odo em análise. As curvas B até E, também estimadas pelo
estimador de Kaplan-Meier, fazem a comparação das probabilidades de sobrevivência entre
categorias por cada variável em análise onde, a partir delas, é possı́vel observar diferenças
significativas nas probabilidades de sobrevivência em diferentes categorias da mesma variável,
como é o caso da curva (C), no entanto, nas curvas (B), (D) e (E), é possı́vel verificar que em
certos instantes t, as diferentes categorias das variáveis descritas por essas curvas apresentam
as mesmas probabilidades de sobrevivências. No geral, todas as curvas apresentam maior risco
de morte durante os primeiros 50 dias de observação, sendo que o risco tendem a prolongar-se
de acordo com o género e o tipo de entrada.

Em relação a sobrevivência, pode se observar que indivı́duos de sexo feminino sobrevivem por
mais tempo em relação a indivı́duos de sexo masculino, em outras palavras, pode se afirmar que
em um certo instante t, a probabilidade de sobrevivência em pacientes de sexo feminino é maior
em relação ao sexo masculino; de mesmo modo, pacientes com TB caso novo apresentam maior
probabilidade de sobrevivência em relação a pacientes com recaı́da; pacientes com associação
TB/HIV tendem a apresentar menores probabilidades de sobrevivência em relação a pacientes
sem HIV associado.

Ainda na Figura 4 pode-se observar que algumas curvas violam o princı́pio de proporciona-
lidade, tido como um importante pressuposto para aplicação do modelo semi-paramétrico de
Cox. O indı́cio da violação deste pressuposto é visı́vel atravês de curvas que se cruzam em
certos instantes t para algumas variáveis, como é o caso das variáveis género na curva (B),
associação TB/HIV na curva (D) e padrão de resistência na curva (E).

Os testes de log-rank (χ2(1;1− α ) = 0.000, p.valor = 0.992), breslow (χ2(1;1− α ) = 0.328, p.valor =
2 2
0.567) e tarone-ware (χ2(1;1− α ) = 0.140, p.valor = 0.708), não rejeitam a hipótese de igualidade
2
da probabilidade de sobrevivência em pacientes com padrões de resistência multirresistente
e extensivamente resistente. Estes teste, aplicados às demais variáveis, apresentam p.valores
inferiores ao nı́vel de significância considerada (α = 5%), portanto, existem diferenças signi-
ficativas nas probabilidade de sobrevivência para as demais variáveis em análise, e para mais
detalhes sobre esses teste, vide a Tabela I em apêndice.

Autor: Belmiro Armando Mahita 39 Licenciatura em Estatı́stica - UEM


Capı́tulo 4: Resultados e discussão

Figura 4: Curvas de sobrevivência estimadas pelo modelo de Kaplan-Meier.

Autor: Belmiro Armando Mahita 40 Licenciatura em Estatı́stica - UEM


Capı́tulo 4: Resultados e discussão

Tabela 5: Valores de log-likelihood (ll), AIC e BIC dos modelos: (1) modelos paramétricos
usando distribuições; (2) modelo semi-paramétrico de Cox e (3) modelos com fracção de cura.
Modelo Paramétrico Modelo paramétrico com fracção de cura
Distribuição
ll AIC BIC ll AIC BIC
Exponencial -743.4 1500.7 1528.8 -736.4 1500.8 1556.9
Weibul -739.5 1494.9 1527.0 -752.4 1534.7 1594.8
Log-normal -728.2 1472.5 1504.5 -730.9 1491.8 1551.8
Log-logı́stica -733.1 1482.3 1514.3 NA NA NA
Weibull Weibull NA NA NA -741.2 1518.5 1590.6
Weibull Exp NA NA NA -747.9 1529.8 1597.9
Modelo semi-paramétrico de Cox Modelo semi-paramétrico com fracção de cura
-683.9 1351.7 1366.0 -196.95 415.9 422.59

4.1.2 Modelos de sobrevivência

Foram ajustados modelos de sobrevivência paramétricos e semi-paramétricos conforme ilus-


trado na Tabela 5 e posteriormente esses modelos foram comparados de acordo com os seus
valores de ll, AIC e BIC. O modelo semi-paramétrico com fracção de cura apresenta melhor
ajuste pois tem menores valores associadas aos critérios de selecção previamente mencionados
com os seguintes resultados, ll = −196.95, AIC = 415.9 e BIC = 422.59.

4.1.3 Modelo de sobrevivência - solução inicial

O modelo ajustado com 500 amostras bootstrap, foi seleccionado de acordo com os critérios
de selecção anteriormente descritos, onde concluiu-se que o modelo semi-paramétrico com
fracção de cura ajusta-se melhor aos dados, pelo facto de ter apresentado menores valores de
ll, AIC e BIC. De acordo com a Tabela II em apêndice, verifica-se que apenas a variável idade
é significativa como preditora para a função da fracção de cura, portanto, as demais variáveis
foram removidas do modelo e o modelo final ajustado apenas com a variável Idade, conforme
a Tabela 6.

A Tabela III no apêndice apresenta valores de erro padrão para diferentes tamanhos de amostras
bootstrap, para avaliar seu impacto no erro padrão das estimativas, tendo se verificado que os
erros padrão reduzem ligeiramente à medida que o número de amostras bootstrap aumenta.

Interpretação dos coeficientes de modelo ajustado

Para a função de fracção de cura pode verificar-se que quanto maior for a idade do paciente
maior é a sua probabilidade de morrer, especificamente, a probabilidade de morte aumenta em
0.032 vezes com o aumento de uma unidade na idade do paciente. Em relação a função de risco
de ocorrência do evento, os coeficientes positivos significa que a variável associada aumenta o
risco de ocorrência do evento e os coeficientes negativos, as variáveis associadas diminuem o
risco de ocorrência de evento. Portanto, pelo modelo ajustado pode observar-se que pacientes

Autor: Belmiro Armando Mahita 41 Licenciatura em Estatı́stica - UEM


Capı́tulo 4: Resultados e discussão

de sexo feminino tem menor risco de morrer pela TB-MR em relação aos pacientes de sexo mas-
culino, em outras palavras, considerando o cálculo de razões de risco (Hazard Ratio), pacientes
de sexo feminino tem exp(−0.916) = 0.40 vezes menor o risco de morrer quando comparados
com pacientes de sexo masculino. Os pacientes admitidos com recaı́da têm um risco de morte
de exp(1.028) = 2.795 vezes maior quando comparados com pacientes caso novo e os pacientes
com co-infecção TB/HIV tem exp(1.126) = 3.083 vezes maior o risco de morte em relação a
pacientes sem a co-infecção TB/HIV.

Aplicação do modelo ajustado


A fracção dos não curados é calculada atravês das estimativas apresentadas no modelo de pro-
babilidade de morte, conforme apresentado na Tabela 6, por exemplo a fracção dos não curados
considerando o efeito das variáveis é:

exp(−1.140 + 0.032 ∗ Idade)


π=
1 + exp(−1.140 + 0.032 ∗ Idade)

aplicando a fórmula 33 nos dados do modelo estimado na Tabela 6, a probabilidade de sobre-


vivência incondicional S(t)
b é:
   
exp(−1.140 + 0.032 ∗ Idade) exp(−1.140 + 0.032 ∗ Idade)
b = 1−
S(t) + ∗ Sbnc (t|xi ).
1 + exp(−1.140 + 0.032 ∗ Idade) 1 + exp(−1.140 + 0.032 ∗ Idade)

onde Sbnc (t) é a probabilidade de sobrevivência dos não curados, que pode ser modelada pelos
modelos de sobrevivência semi-paramétricos descritos na subsecção 2.7.7, sendo:
h iexp(−0.916Genero+1.028T.entrada+1.126TB/HIV−0.336P.resistenc−0.004Idade)
Snc (t|xi ) = S0 (t)
b b ,
nc
h i
em que Sb0 (t) é a probabilidade de sobrevivência de base para os não curados.
nc

Por exemplo, para encontrar a probabilidade média de sobrevivência dos pacientes com carac-
terı́sticas no modelo acima, considere-se o intercepto do modelo e, sendo dado a probabilidade
condicional Sbnc (t) dos não curados, temos:

 
1 1
S(t) = 1 −
b + Sbnc (t),
1 + exp −(−1.14) 1 + exp −(−1.14)

b = 0.758 + 0.242 Sbnc (t).


S(t)

Autor: Belmiro Armando Mahita 42 Licenciatura em Estatı́stica - UEM


Capı́tulo 4: Resultados e discussão

Tabela 6: Resultados obtidos através do modelo semi-paramétrico com fracção de cura - solução
final
Função de fracção de cura Estimativa EP Z p.valor
Intercepto -1.14 0.607 -1.879 0.060
Idade 0.032 0.016 2.047 0.041
Função de risco de ocorrência do evento Estimativa E. P Z p.valor
Género (feminino) -0.916 0.343 -2.670 0.007
T. entrada (recaı́da) 1.028 0.429 2.395 0.016
TBHIV (tem HIV associado) 1.126 0.546 2.062 0.039
P.resistenc (XR) -0.336 0.899 -0.374 0.708
Idade -0.004 0.013 -0.297 0.767
Nota: A função de fracção de cura modela a probabilidade de um paciente morrer; a função de
risco de ocorrência do evento modela o risco associado ao tempo desde o diagnóstico até a
morte do paciente.

4.1.4 Curvas de sobrevivência estimadas

Nesta subsecção são apresentadas diferentes curvas de sobrevivência estimada aplicando o mo-
delo estimado na Tabela 6. Essas curvas tem por objectivo comparar as probabilidades de
sobrevivência dos pacientes por categorias em condições similares da doença e o impacto da
fracção de cura na probabilidade de sobrevivência, considerando as variáveis género, tipo de
entrada e associação TB/HIV, que foram significativas na função de risco.

De acordo com a Figura 5, a probabilidade de sobrevivência dos pacientes com TB-MR difere
de acordo com o género, tipo de entrada e a associação TB/HIV. Os pacientes de sexo masculino
apresentam menores probabilidades de sobrevivência em relação a pacientes de sexo feminino,
a sobrevivência segundo o tipo de entrada é maior em pacientes caso novo em relação aos ca-
sos de recaı́da, o mesmo se verifica para a associação TB/HIV, onde os pacientes com TB/HIV
associado apresentam menores probabilidades de sobrevivência em relação a pacientes sem
associação TB/HIV.

Atentando às curvas de sobrevivência da Figura 5 no geral, pode-se constatar que os pacientes
que apresentam as caracteristicas das curvas B, D e F, tem mais impacto nas probabilidades de
sobrevivencia em relação ao género do que o tipo de entrada e associação TB/HIV, isto por-
que a diferença nas curvas de sobrevivência é mais expressiva nas curvas A e B relacionados
ao género do paciente, isto implica que as caracteristicas dos pacientes apresentados na curva
B, influenciam para menor probabilidade de sobrevivência dos pacientes em relação às carac-
terı́sticas dos pacientes da curva A.

Embora haja ligeiras diferenças nas probabilidades de sobrevivência das curvas (C, D) e (E,
F), o comportamento das curvas das variáveis tipo de entrada e associação TB/HIV é similar.
Fazendo uma comparação visual, as curvas mostram a inexistência de diferença nas probabi-
lidades de sobrevivência para indivı́duos com caracterı́sticas tı́picas das curvas C e E quando

Autor: Belmiro Armando Mahita 43 Licenciatura em Estatı́stica - UEM


Capı́tulo 4: Resultados e discussão

Figura 5: Curvas de sobrevivência estimadas pelo modelo semi-paramétrico com fracção de


cura apresentado na Tabela 6. Com excepção da variável de comparação em cada curva, as
curvas estimadas têm as seguintes caracterı́sticas: Painel esquerdo (curvas A, C e E) com género
(masculino), tipo de entrada (caso novo), TB/HIV (não tem hiv associado), padrão de resistência
(MR) e; Painel direito (curvas B, D e F) com género (feminino), tipo de entrada (recaı́da),
TB/HIV (tem hiv associado), padrão de resistência (XR), antendo constante a idade de 10 anos
para a fracção de cura. Curvas de sobrevivência em relação ao género do paciente (curvas A e
B), tipo de enrtrada (curvas C e D) e associação TB/HIV (curvas E e F).

Autor: Belmiro Armando Mahita 44 Licenciatura em Estatı́stica - UEM


Capı́tulo 4: Resultados e discussão

comparados com os pacientes que apresentam as caracteristicas das curvas D e F. As carac-


terı́sticas das curvas estão descritas na Figura 5

Tomando como exemplo o tempo t = 50 dias, considerando que o risco de morte é maior nos
primeiros 50 dias após o diagnóstico, as probabilidades de sobrevivência estimadas de acordo
com as curvas A a F são as seguintes:

• Curva A: género masculino tem S(50) = 82.5% e feminino com S(50) = 91.2%

• Curva B: género masculino tem S(50) = 69.5% e feminino com S(50) = 73.2%

• Curva C: tipo de entrada caso novo tem S(50) = 82.5% e recaı́da com S(50) = 77.2%

• Curva D: tipo de entrada caso novo tem S(50) = 88.9% e recaı́da com S(50) = 73.2%

• Curva E: Associação TB/HIV - não tem HIV associado tem S(50) = 82.5% e tem HIV
associado com S(50) = 71.6%

• Curva F: Associação TB/HIV - não tem HIV associado tem S(50) = 84.9% e tem HIV
associado com S(50) = 73.2%

A fracção de cura considerada na estimação das curvas de sobrevivência, segundo mostram as


curvas da Figura 5 é igual a 69.4%, correspondente a pacientes com 10 anos para a função de
cura.

As curvas da Figura 6, apresentam o impacto da fracção de cura na probabilidade de sobre-


vivência de pacientes, variando a idade no modelo de cura. As curvas G, H, K e L foram
ajustadas considerando uma idade de 20 anos com uma fracção de cura correspondente a esta
idade igual a 62.2% considerando as variáveis género (masculino), associação TB/HIV para a
curva K (não tem hiv associado) e associação TB/HIV para a curva L (tem hiv associado), e 40
anos com uma fracção de cura correspondente a esta idade igual a 46.3% para género (femi-
nino), associação TB/HIV para a curva K (tem hiv associado) e associação TB/HIV para a curva
L (não tem hiv associado). As curvas I e J foram ajustadas tendo em conta a idade de 10 anos
para pacientes com tipo de entrada (caso novo), com uma fracção de cura correspondente de
69.4% e 20 anos para pacientes com tipo de entrada (recaı́da) com uma fracção de cura 62.2%.

De acordo com as curvas da Figura 6, associado ao modelo de cura ajustado na Tabela 6, fica evi-
dente que quanto maior for a idade do paciente, menor é a sua probabilidade de sobrevivência.
Tomando como exemplo dois pacientes com caracteristicas similares de doençe e idades dife-
rentes, considerando 10 e 40 anos, as probabilidades de sobrevivência predictas são 69.4% e
46.3% respectivamente.

Autor: Belmiro Armando Mahita 45 Licenciatura em Estatı́stica - UEM


Capı́tulo 4: Resultados e discussão

Figura 6: Curvas de sobrevivência estimadas pelo modelo semi-paramétrico com fracção de


cura apresentado na Tabela 6. Com excepção da variável de comparação em cada curva, as
curvas estimadas têm as seguintes caracterı́sticas: Painel esquerdo (curvas G, I e K) com género
(masculino), tipo de entrada (caso novo), TB/HIV (não tem hiv associado), padrão de resistência
(MR) e; Painel direito (curvas H, J e L) com género (feminino), tipo de entrada (recaı́da),
TB/HIV (tem hiv associado), padrão de resistência (XR), variando a idade para a fracção de
cura. Curvas de sobrevivência em relação ao género do paciente (curvas G e H), tipo de enrtrada
(curvas I e J) e associação TB/HIV (curvas K e L).

Autor: Belmiro Armando Mahita 46 Licenciatura em Estatı́stica - UEM


Capı́tulo 4: Resultados e discussão

Figura 7: Gráfico de sobrevivência incondicional (a), risco (b), sobrevivência dos não curados
(c) e probabilidade de cura (d)

Em suma, a Figura 7, apresenta as principais funções de análise de sobrevivência estimadas


pelo modelo de mistura com fracção de cura, nomeadamente, a função de sobrevivência incon-
dicional (S(t)) em (a), a função de risco (λ(t)) em (b), a função de sobrevivência condicional,
ou seja, a função de sobrevivência para os pacientes não curados (Snc (t)) em (c) e a função da
probabilidade estimada de cura ( pb(t)) em (d). Destas funções pode observar-se que o risco de
morte pela tuberculose multirresistente é elevado nos primeiros dias de observação e tende a
estabilizar-se ao longo do tempo, a probabilidade de sobrevivência em pacientes não curados
converge a zero até o fim da observação e a probabilidade de cura varia no intervalo de 20% a
80% como foi evidenciado nas curvas se sobrevivência estimadas anteriormente.

Autor: Belmiro Armando Mahita 47 Licenciatura em Estatı́stica - UEM


Capı́tulo 4: Resultados e discussão

4.2 Discussão
Dos resultados alcançados, foi possı́vel verificar que maior parte dos pacientes foi censurado e
de acordo com o gráfico A da Figura 4, a probabilidade de sobrevivência não converge a zero
a medida que o tempo tende ao infinito, isto é um indı́cio de existência de pacientes curados
durante o perı́odo de observação (fracção de cura).

Dos diversos modelos estimados, foi possivel mostrar atravês das medidas de selecção de mo-
delos que o modelo de sobrevivência semi-paramétrico com fracção de cura melhor se ajusta
aos dados, tendo sido seleccionado para análises subsequentes, esta ecolha é sustentada pelas
teorias das autoras Claudino e Oliveira, (2013), que afirmam que os modelos de fracção de cura
se apresntam como uma possibilidade bastante viável na análise do tempo de sobrevivência
dos pacientes quando são acompanhados por um perı́odo longo de tempo e observa-se uma
percentagem razoável deles que não irá experimentar o evento de interesse.

Depois da selecção do modelo, foram estimados os parâmetros para função de cura assim como
para a função de distribuição do tempo de morte, tendo se verificado que apenas a variável idade
é significativo como preditora para a função de cura e as variáveis género, tipo de entrada e a
associação TB/HIV foram significativas para a função de risco de ocorrência de evento.

De acordo com as curvas de sobrevivência apresentadas nas Figuras 5 a 6, constitui o grupo


de maior risco de morte, pacientes com co-infecção TB/HIV, entrada em estado de recaı́da,
pacientes com TB-XR, a idade não foi significativa para a função de risco, todavia, verificou-se
que a idade é mais significativa para a fracção de cura, ou seja, quanto maior for a idade do
paciente maior é o sua probabilidade de morte. Estes resultados corroboram com as conclusões
dos autores Coutinho (2016) e Balabanova (2011), conforme descrito na subsecção 2.6, onde
apontam para maior risco de morte em pacientes com recaı́da, padrão de resistência XR, co-
infecção TB/HIV, como as principais caracterı́sticas preditoras de morte em pacientes com TB-
MR, no entando, esses autores afirmam que a idade foi menos expressiva na função de risco,
assim como apontam os resultados deste estudo.

A probabilidade de sobrevivência em pacientes de sexo masculino é relativamente menor que


a probabilidade de pacientes de sexo feminino, contrariando os resultados do estudo feito em
Brasil por Pires et al., (2012) que afirma que os pacientes de sexo masculino apresentam maior
probabilidade de cura.

Ainda segundo o mesmo autor, Pires et al., (2012) o uso de antirretrovirais foi mais frequente
nos casos que evoluı́ram para cura ou término de tratamento (80%). A letalidade foi de 11.4% e
a taxa de abandono de 22.9%, estes resultados são consensuais aos resultados deste estudo, pois
conforme os gráficos da Figura I em apêndice, pode observar-se que pacientes com co-infecção
TB/HIV, embora tenham menor probabilidade de sobrevivência, apresentam maior fracção de

Autor: Belmiro Armando Mahita 48 Licenciatura em Estatı́stica - UEM


Capı́tulo 4: Resultados e discussão

cura, o que pode ser devido a influência de tratamento antirretroviral.

No que concerne a taxa de letalidade, de acordo com a Tabela 3, constata-se que a letalidade por
tuberculose multirresistente durante o perı́odo de observação foi muito elevada, e associado aos
resultados da Tabela 4, é visivelmete claro que maior parte das mortes ocorreram em pacientes
com co-infecção TB/HIV e pacientes com TB-MR, todavia, a alta letalidade foi registada nos
casos de pacientes com recaı́da e padrão de resistência extensivamente resistente.

Constituem limitações encontradas neste estudo o perı́odo de estudo relativamente curto; des-
conheciemto do perı́odo exacto em que os pacientes foram infectados, portanto, subestima-se
o tempo desde a infecção até a data do diagnóstico; a variável padrão de resistência não cum-
pre a suposição da proporcionalidade dos riscos; de acordo com Cai, et al. (2012), uma das
limitações dos modelos semi-paramétricos com fracção de cura é que devido a complexidade
da equação de estimativa no algoritmo EM, os erros padrão dos parâmetros estimados não estão
directamente disponı́veis, por isso, quando o mesmo modelo é processado mais de uma vez
pode fornecer diferentes valores de erro padrão e consequentemente a alteração da significância
dos coeficientes do modelo estimado.

Autor: Belmiro Armando Mahita 49 Licenciatura em Estatı́stica - UEM


Capı́tulo 5: Conclusões e recomendações

5 Conclusões e recomendações

5.1 Conclusões
Com base nos objectivos do trabalho, conclui-se que:

• O género feminino apresenta maior número de casos de TB-MR com uma fracção de
55.2% do total, isto pode ser explicado de acordo com estudo realizado por Gomes et al.,
(2007), que aponta para maior procura pelos serviços de saúde na população feminina em
relação a masculina;

• Os pacientes com co-infecção TB/HIV e o padrão de resistência TB-MR são os que apre-
sentaram maior número de mortes, enquanto que os pacientes com inı́cio do tratamento
após falência (recaı́da) e padrão de reistência TB-XR, têm maiores taxas de letalidade,
estimadas em 43.8% e 41.9% respectivamente;

• O tempo de sobrevivência mediano é de 30 dias, tempo médio de 43 dias aproximada-


mente, com tempo mı́nimo e máximo de 1 dia e 234 dias respectivamente;

• A idade dos pacientes influencia significativamente a fracção de cura, sendo que quanto
maior for a idade do paciente, menor é a sua probabilidade de ficar curado;

• O género, o tipo de entrada e a co-infecção TB/HIV influenciam significativamente o


tempo de morte dos pacientes.
Os pacientes de género feminino apresentam um risco de morte 0.40 vezes menor em
relação aos pacientes de género masculino, enquanto que pacientes com co-infecção
TB/HIV apresentam um risco de morte 3.083 vezes maior em relação aos pacientes TB-
MR sem HIV associado e os pacientes admitidos com recaı́da, apresentam um risco de
morrer 2.795 vezes maior em relação a pacientes TB caso novo;

• De um modo geral, o género masculino, inı́cio de tratamento após recaı́da, a associação


TB/HIV, são factores que reduzem a probabilidade de sobrevivência dos pacientes em
estudo;

• O risco de morte por TB-MR é maior nos primeiros 50 dias de observação, tendendo a
estabilizar-se para tempos de vida maiores que 50 dias e a fracção de cura, independente-
mente do efeito das covariáveis varia em média entre 20% a 80%.

Autor: Belmiro Armando Mahita 50 Licenciatura em Estatı́stica - UEM


Capı́tulo 5: Conclusões e recomendações

5.2 Recomendações
Recomenda-se que para os próximos estudos sobre a análise de sobrevivência em pacientes com
tuberculose multirresistente, aplique-se modelos de sobrevivência de riscos competitivos;

Aplicar nos próximos estudos os splines de regressão para captar o comportamento não linear
da variável idade e estender mais o tamanho da amostra assim como o perı́odo de estudo;

Considerando que os resultados deste estudo mostraram haver maior fracção de cura em pacien-
tes que fazem tratamento antiretroviral, recomenda-se que se estude a influência do tratamento
antiretroviral na fracção de cura dos pacientes com tuberculose multirresistente.

Autor: Belmiro Armando Mahita 51 Licenciatura em Estatı́stica - UEM


Referências

Referências

1. Abreu, A. M. e Rocha, C. S. (2006), Um novo modelo de cura paramétrico, Ciência


Estatı́stica, Edições SPE;

2. Alencar et al. (2019). Análise de sobrevivência;

3. Alves, B. C. (2010). Modelos heterogéneos do sobrevivência: Uma aplicação ao Risco


de crédito. Tese de Mestrado em Prospecção e Análise de Dados. Instituto Universitário
de Lisboa;

4. Allison, P. D. (2010). Análise de sobrevivência usando SAS: um guia prático. 2º edição.


SAS Press. Carolina do Norte;

5. Andrade, A. B. e Cabete, B. (2012). Analise de sobrevivência com acontecimentos


múltiplos: Aplicação ao estudo do tempo até a ocorrência de enfarte do miocárdio.
Dissertação (Mestrado), Universidade de Lisboa;

6. Balabanova et al. (2011). Survival of Civilian and Prisoner Drug-Sensitive, Multiand


Extensive Drug- Resistant Tuberculosis Cohorts Prospectively Followed in Russia. PLo-
Sone. Rússia;

7. Balabanova et al. (2016). Survival of patients with multidrug resistant TB in Eastern


Europe: what makes a difference Thorax;

8. Barreto et al. (2002). Design of the Brazilian BCG-REVAC trial against tuberculosis.
Brazil;

9. Barros, T. V. S. (2014). Uma Introdução à Análise de Sobrevivência com Fração de Cura.


Monografia (Graduação), Departamento de Estatı́stica da Universidade Federal do Rio de
Janeiro Grande do Norte. Natal - RN;

10. Borges, A. I. M. (2014). Análise de Sobrevivência com o R. Dissertação de mestrado,


Universidade da Madeira. A nossa Universidade;

11. Borges, L. R. C. (2018). Tábuas de Mortalidade e Métodos de Provisão de Sinistros.


FCUP;

12. Botelho et al. (2009). Epidemiologia Explicada - Análise de Sobrevivência. Porto -


Portugal;

13. Brown, B. W; Flood, M.M. (1947). Tumbler Mortality. Journal of the American Statisti-
cal Association;

Autor: Belmiro Armando Mahita 52 Licenciatura em Estatı́stica - UEM


Referências

14. Cai, C., Zou, Y., Peng, Y. e Zhang, J. (2012). smcure: An R-package for Estimating Semi-
parametric Mixture Cure Models. Comput Methods Programs Biomed. 2012 December
; 108(3): 1255–1260. doi:10.1016/j.cmpb. 2012.08.013;

15. Campos (2016). Fatores explicativos para a evasão no ensino superior atravês da análise
de sobrevivência. Dissertação (Mestrado), Universidade Federal de Pernambuco;

16. Carmes, E. R. (2015). Análise de dados de sobrevivência na presença de riscos competi-


tivos;

17. Carvalho et al. (2011). Análise de sobrevivência: teoria e aplicações em saúde. Editora
FIOCRUZ;

18. CDC. (2012). TB Elimination: Multidrug-Resistant Tuberculosis (MR TB). Disponı́vel


em: http://www.cdc.gov/tb, consultado a 16 de Agosto de 2022;

19. Claudino, J. E. e Oliveira, R. H., (2013).Modelo de fracção de cura na anális de sobrevida


de pacientes com câncer de pele. Trabalho de Licenciatura (Graduação) em Estatı́stica
na Universidade Federal do Panamá. Curitiba;

20. Colosimo, E. A. e Giolo, S. R. (2006). Análise de Sobrevivênci Aplicada. Editora Edgard


Blucher;

21. Cordeiro, G. M. e Demétrio, C. G. B. (2008). Modelos Lineares Generalizados e Ex-


tensões. Piracicaba;

22. Coutinho, R. C. G. A. (2016). Factores associados ao óbito em pacientes com tuberculose


multirresistente tratados nos centros de referência brasileiros de 2005 a 2012: análise de
sobrevivência. Rio de Janeiro. FlorCruz;

23. Cunha, F. F. (2014). Análise de sobrevivência (módulo II). Bacharelado, Universidade


Federal do Pará. Brasil;

24. Duchateau, L. e Janssen, P. (2008). The frailty model. Springer, USA;

25. Ferreira, K. R. (2014). A adesão ao tratamento no caso da tuberculose multirresistente.


Tese (Doutoramento), Escola da Enfermagem da Universidade de São Paulo. Brasil;

26. Fidelis, C. R. (2019). Resı́duos em Modelos de Sobrevivência em Fracção de Cura.


Dissertação (Mestrado), Universidade Federal do Rio Grande do Norte. Natal-RN;

27. Frazão, I. M. M. (2012). Modelos de sobrevivência de longa duração paramétricos e


semi-paramétricos aplicados a um clı́nico aleatorizado. Dissertação (Mestrado), Univer-
sidade de São Paulo, Escola Superior de Agricultura Luı́s de Queiroz. Brasil;

Autor: Belmiro Armando Mahita 53 Licenciatura em Estatı́stica - UEM


Referências

28. Garcia, P. N. A. (2013). Aplicação de técnicas de análise de sobrevivência em pacientes


submetidos à intervenção coronária percutânea. Relatório de estágio supervisionado,
curso de graduação em Estatı́stica, grau de Bacharel. Brası́lia;

29. Gonçlves, D. O. (2020). Modelos paramétricos de sobrevivência aplicados a dados de


Cancer. Dissertação (Mestrado), Universidade Federal de Alfenas;

30. Gomes, T. (2013). Tuberculose Extrapulmonar: Uma abordagem epidemiológica e mo-


lecular. Dissertação (Mestrado), Universidade Federal de Espı́rito Santo. Brasil;

31. Gomes, R., Nascimento, E. F., Araújo, F. C. (2007). Por que os homens buscam menos os
serviços de saúde do que as mulheres? As explicações de homens de baixa escolaridade e
homens com ensino superior. Rio de Janeiro. 23(3):565-574. https:doi.org/10.1590/S0102-
311X2007000300015;

32. Guo, S. (2010). Survival Analysis. Oxford University Press (Pocket guide to social work
research methods);

33. Herrmann, L. (2011). Estimação de curvas de sobrevivência para estudos de custo-


efetividade. Dissertação (Mestrado), Universidade Federal do Rio Grande do Sul;

34. Hosmer, D. W. e Lemeshow, S. (1999). Applied Survival Analysis – Regression modeling


of time to event data. John Wiley & Sons. New York;

35. Karadeniz, P. G. e Ercan, I. (2017) Testes de exame para comparar sobrevivência: Curvas
com dados censurados à direita. Estatı́stica em transição, nova série. Vol. 18;

36. Massabni, A. C. e Bonini, E. H. (2019). Tuberculose: história e evolução dos tratamentos


da doença. ReBraM. Vol. 22;

37. Medcalf et al. (2013). Tuberculosis a short history. The New York University, USA;

38. Melo et al. (2017). Sobrevivência de pacientes com AIDS e coinfecção com bacilos da
tuberculose nas regiões sul e sudeste do Brasil. Ciênc. saúde coletiva. Vol. 22;

39. MISAU (2018). Avaliação e manejo de pacientes com TB. Protocolos Nacionais. Versão
1. Moçambique;

40. Paes, A. T., (2007) Uso de modelos com fracção de cura na análise de dados de sobre-
vivência com omissão nas covariáveis. Tese (Doutoramento), Instituto de Matemática e
Estatı́stica da Universidade de São Paulo;

41. Pires, G. M. (2021). Análise das polı́ticas de controlo da tuberculose e do perfil epide-
miológico da infecção em Moçambique (2009-2017). Dissertação de mestrado - Instituto
de Higiene e Medicina Tropical. Universidade Nova de Lisboa. Lisboa;

Autor: Belmiro Armando Mahita 54 Licenciatura em Estatı́stica - UEM


Referências

42. Pires Neto, R. J., Gadelha, R. R. M., Herzer, T. L., Peres, D. A., Leitão, T. M. J. S.,
Façanha, M. C., Holanda, C. N., Girão, E. S., Nogueira, C. M., Alencar, C. H., (2012).
Caracterı́sticas clı́nico-epidemiológicas de pacientes com coinfecção HIV/tuberculose
acompanhados nos serviços de referência para HIV/AIDS em Fortaleza, Ceará, entre
2004 e 2008. Caderno de saúde colectiva. Rio de Janeiro. LILACS-Express. ID: lil-
644857. BR1.1;

43. PNCT (2012). Manual de Diagnóstico e Tratamento de TB-MR e TB-XR;

44. PNCT (2017). Relatório das actividades desenvolvidas durante o ano 2017;

45. PNCT (2019) Manual de Manejo Clı́nico e Programático da Tuberculose Multirresis-


tente. Maputo;

46. PNCT (2020) Relatório Anual do Programa. Maputo;

47. Raminelli, J. A. (2015). Métodos de adequação e diagnóstico em modelos de sobre-


vivência dinâmicos. Tese (Doutorado), Escola Superior de Agricultura Luı́s de Queiroz.
Brazil;

48. Ribeiro, A. C. S. (2018). Factores associados à tuberculose drogarresistente no estado


do Maranhão, no perı́odo de 2010 a 2015. São Luı́s;

49. Rocha, M. S. (2013). Fatores associados à sobrevivência em uma coorte de casos diag-
nosticados com tuberculose em um municı́pio de alta incidência. Dissertação de Mes-
trado. UFRJ. Rio de Janeiro;

50. Santos, I. P. (2016). Introdução a análise de confabilidade. Uma aplicação ao sector de


transportes. Licenciatura (Graduação), Universidade Estadual da Paraiba;

51. Santos, R. O. (2017). Formação de doutores para atividades de caráter académico via
Modelo de Riscos Proporcionais de Cox e Regressao Logı́stica. Dissertação (Mestrado),
Universidade de Brası́lia;

52. Silva, D. P. (2016). Introdução ao modelo de Cox com aplicação a dados de pneus
11.00R22. Universidade Estadual de Paraı́ba UEPB - Brasil;

53. Silva, E. R. F. (2017). Monitoramento de tempos de sobrevivência com fracção de cura:


Aplicação a portadores de câncer de boca e orofaringe no RN. Natal-RN. Monografia
(Graduação), Universidade Federal do Rio Grande do Norte;

54. Silva, S. M. P. (2021). Análise de sobrevivência aplicada à educação. Dissertação de


mestrado. UM;

Autor: Belmiro Armando Mahita 55 Licenciatura em Estatı́stica - UEM


Referências

55. Sousa, C. M. (2014). Sobrevida de Portadores de HIV/TB em Goias: Um estudo de corte.


Programa de Pos - Graduação em Enfermagem - Universidade Federal de Goiás;

56. Susser, M., Susser, E. (1998). Um futuro para a epidemiologia. In: Almeida Filho et al.
(org) Teoria epidemiológica hoje: fundamentos, interfaces, tendências. Rio de Janeiro:
FLORCRUZ/ABRASCO;

57. Taylor J. (1995) Semi-parametric estimation in failure time mixture models. Biometrics.
51:899–907. [PubMed: 7548707];

58. Velho, S. D. F. (2015). Modelos de sobrevivência para estudo do tempo até a ocorrência
de excesso de peso em indivı́duos adultos submetidos a transplante alogénico de células
progenitoras hematopoiéticas. Dissertação de Mestrado, Universidade de Lisboa. Portu-
gal;

59. OMS. (2019). Relatório global da tuberculose;

60. OMS. (2021). Relatório global da tuberculose;

61. Wienke, A. (2011). Frailty models in survival analysis. Chapman & Hall/CRC Biostatics
series. New York.

62. Zhang, J., Peng Y. (2007). A new estimation method for the semiparametric accelerated
failure time mixture cure model. Statistics in medicine. 26(16):3157–3171. [PubMed:
17094075].

Autor: Belmiro Armando Mahita 56 Licenciatura em Estatı́stica - UEM


Apêndice

Apêndice
Tabela I: Comparação das curvas de sobrevivência de Kaplan-Meier

Covariáveis Tipo de teste χ2 gl p.valor


Log-rank 3.998 1 0.049
Género Breslow 8.967 1 0.003
Tarone-Ware 7.127 1 0.008
Log-rank 14.331 1 0.000
T. entrada Breslow 18.786 1 0.000
Tarone-Ware 17.097 1 0.000
Log-rank 4.171 1 0.041
TBHIV Breslow 8.596 1 0.003
Tarone-Ware 6.824 1 0.009
Log-rank 0.000 1 0.992
P. resistência Breslow 0.328 1 0.567
Tarone-Ware 0.140 1 0.708
Log-rank 8.152 2 0.017
Idade Breslow 6.675 2 0.036
Tarone-Ware 7.497 2 0.024

Tabela II: Estimação dos parâmetros do modelo semi-paramétrico com fracção de cura - solução
inicial

Função de fracção de cura Estimativa E. P Z p.valor


Intercepto -1.264 2.029 -1.228 0.219
Género 0.268 0.482 0.556 0.578
T. entrada 1.642 2.198 0.747 0.455
TBHIV -0.614 0.766 -0.801 0.423
P.resistenc -0.589 0.659 -0.894 0.371
Idade 0.041 0.018 2.295 0.022
Função de distribuição do tempo de morte Estimativa E. P Z p.valor
Género (feminino) -0.970 0.398 -2.439 0.015
T. entrada (recaı́da) 0.747 0.511 1.463 0.143
TBHIV (tem HIV associado) 1.353 0.559 2.420 0.015
P.resistenc (XR) -0.102 0.861 -0.119 0.905
Idade -0.008 0.014 -0.579 0.562

Autor: Belmiro Armando Mahita 57 Licenciatura em Estatı́stica - UEM


Apêndice

Figura I: Curvas de sobrevivência com as seguintes caracteristicas: M = pacientes de género


(masculino), T. entrada (caso novo), P.resistenc (MR); N = pacientes de género (feminino), T.
entrada (recaı́da), P.resistenc (XR); Idade igual a 20 anos

Tabela III: Avaliação do impacto de número de bootstrap no erro padrão das estimativas

Modelo de probabilidade de cura E.P (nboot=100) E.P (nboot=200) E.P (nboot=500) E.P (nboot=1000)
Intercepto 3.17 2.27 2.029 2.12
Género 0.44 0.49 0.48 0.48
T. entrada 2.40 1.76 2.19 1.34
TBHIV 0.81 1.71 0.76 0.84
P.resistenc 0.64 0.67 0.65 0.66
Idade 0.09 0.03 0.02 0.07
Modelo de sobrevivência dos não curados
Género (feminino) 0.40 0.41 0.39 0.39
T. entrada (recaı́da) 0.55 0.56 0.51 0.48
TBHIV (tem HIV associado) 0.58 0.52 0.56 0.53
P.resistenc (XR) 0.87 0.88 0.86 0.79
Idade 0.03 0.04 0.014 0.19

Autor: Belmiro Armando Mahita 58 Licenciatura em Estatı́stica - UEM


Apêndice

Códigos em R, usados no processamento de dados

pacman::p load(survival, muhaz,survminer, haven, SurvRegCensCov, flexsurv, gfcure, ggplot2,


lattice, latticeExtra, MASS, flexsurvcure, penPHcure, smcure, nltm, spduration, cuRe, rstpm2,
lmtest); carregar os pacotes usados

cureSurv < − read sav(”BaseMac.sav”) carregar a base de dados


View(cureSurv) visualizar a base de dados
attach(cureSurv)

——–Modelo de Kaplan-Meyer————
graf.fit< −survfit(Surv(Tempo, Desfecho1) 1, data = cureSurv, conf.type=”log”, conf.int=0.95,
type=”kaplan-meier”, error = ”greenwood”)
summary(graf.fit)

graf.fit1< −survfit(Surv(Tempo, Desfecho1) Genero, data = cureSurv, conf.type=”log”, conf.int=0.95,


type=”kaplan-meier”, error = ”greenwood”)
summary(graf.fit1, t=seq(from=0,to=260,by=10), type=”survival”, tidy=TRUE)

graf.fit2< −survfit(Surv(Tempo, Desfecho1) Idade, data = cureSurv, conf.type=”log”, conf.int=0.95,


type=”kaplan-meier”, error = ”greenwood”)
summary(graf.fit2, t=seq(from=0,to=260,by=10), type=”survival”, tidy=TRUE)

graf.fit3< −survfit(Surv(Tempo, Desfecho1) TBHIV, data = cureSurv, conf.type=”log”, conf.int=0.95,


type=”kaplan-meier”, error = ”greenwood”)
summary(graf.fit3, t=seq(from=0,to=260,by=10), type=”survival”, tidy=TRUE)

graf.fit4< −survfit(Surv(Tempo, Desfecho1) P.resistenc, data = cureSurv, conf.type=”log”, conf.int=0.95,


type=”kaplan-meier”, error = ”greenwood”)
summary(graf.fit4, t=seq(from=0,to=260,by=10), type=”survival”, tidy=TRUE)

graf.fit5< −survfit(Surv(Tempo, Desfecho1) T.entrada, data = cureSurv, conf.type=”log”, conf.int=0.95,


type=”kaplan-meier”, error = ”greenwood”)
summary(graf.fit5, t=seq(from=0,to=260,by=10), type=”survival”, tidy=TRUE)

——–Gráficos de Kaplan-Meyer————
fits< −list(Geral< −graf.fit, Género< −graf.fit1, Idade< −graf.fit2, TB HIV< −graf.fit3, Padrão de resist
−graf.fit4, Tipo de entrada< −graf.fit5)
legend.title< −list(”Geral: ”, ”Género: ”, ”Idade: ”, ”TB/HIV: ”, ”Padrão de resistência: ”,

Autor: Belmiro Armando Mahita 59 Licenciatura em Estatı́stica - UEM


Apêndice

”Tipo de entrada: ”)
ggsurvplot list(fits, cureSurv,legend.title=legend.title, risk.table = TRUE, ggtheme = theme minimal(),
xlab=”Tempo”, ylab=”Probabilidade de Sobrevivência”)

——–Teste Log-Rank————
Hipóteses testadas:
H0: Não há diferença entre as curvas dos grupos de sobrevivência;
H1: Ha diferença entre as curvas dos grupos de sobrevivência;

survdiff(Surv(Tempo, Desfecho1) Genero, rho = 0, data = cureSurv)


survdiff(Surv(Tempo, Desfecho1) T.entrada, rho = 0, data = cureSurv)
survdiff(Surv(Tempo, Desfecho1) TBHIV, rho = 0, data = cureSurv)
survdiff(Surv(Tempo, Desfecho1) P.resistenc, rho = 0, data = cureSurv)
survdiff(Surv(Tempo, Desfecho1) Idade, rho = 0, data = cureSurv)

——–Modelos de sobrevivência paramétricos————


reg.mod1< −survreg(Surv(Tempo, Desfecho1) Genero+T.entrada+ TBHIV+ P.resistenc+Idade,
data = cureSurv, dist = ”lognormal”)
summary(reg.mod1)

reg.mod2< −survreg(Surv(Tempo, Desfecho1) Genero+T.entrada+ TBHIV+ P.resistenc+Idade,


data = cureSurv, dist = ”exponential”)
summary(reg.mod2)

reg.mod3< −survreg(Surv(Tempo, Desfecho1) Genero+T.entrada+ TBHIV+ P.resistenc+Idade,


data = cureSurv, dist = ”weibull”)
summary(reg.mod3)

reg.mod4< −survreg(Surv(Tempo, Desfecho1) Genero+T.entrada+ TBHIV+ P.resistenc+Idade,


data = cureSurv, dist = ”loglogistic”)
summary(reg.mod4)

——–Selecção do melhor modelo pelo AIC e BIC————


AIC(reg.mod1, reg.mod2, reg.mod3, reg.mod4)
BIC(reg.mod1, reg.mod2, reg.mod3, reg.mod4)

——–Selecçao de variaveis para o modelo final————


stepAIC(reg.mod2, trace = FALSE)

Autor: Belmiro Armando Mahita 60 Licenciatura em Estatı́stica - UEM


Apêndice

——–Modelo paramétrico final————


reg.mod5< −survreg(Surv(Tempo, Desfecho1) Genero+T.entrada+ TBHIV+Idade, data = cu-
reSurv, dist = ”lognormal”)
summary(reg.mod5)

——–Modelo paramétrico com fracção de cura————


cure.fit1 < − fit.cure.model(Surv(Tempo, Desfecho1) Genero+T.entrada+TBHIV+ P.resistenc+
Idade, data = cureSurv, formula.surv = list( Genero+T.entrada+TBHIV+ P.resistenc+ Idade),
type = ”mixture”, dist = ”lognormal”, link = ”logit”, control = list(maxit = 1000))
summary(cure.fit1)
AIC(cure.fit1)
BIC(cure.fit1)

cure.fit2 < − fit.cure.model(Surv(Tempo, Desfecho1) Genero+T.entrada+TBHIV+ P.resistenc+


Idade, data = cureSurv, formula.surv = list( Genero+T.entrada+TBHIV+ P.resistenc+ Idade),
type = ”mixture”, dist = ”exponential”, link = ”logit”, control = list(maxit = 1000), method =
”Nelder-Mead”, init = NULL)
summary(cure.fit2)
AIC(cure.fit2)
BIC(cure.fit2)

cure.fit3 < − fit.cure.model(Surv(Tempo, Desfecho1) Genero+T.entrada+TBHIV+ P.resistenc+


Idade, data = cureSurv, formula.surv = list( Genero+T.entrada+TBHIV+ P.resistenc+ Idade),
type = ”mixture”, dist = ”weibull”, link = ”logit”, control = list(maxit = 1000), method =
”Nelder-Mead”, init = NULL)
summary(cure.fit3)
AIC(cure.fit3)
BIC(cure.fit3)

cure.fit4 < − fit.cure.model(Surv(Tempo, Desfecho1) Genero+T.entrada+TBHIV+P.resistenc+


Idade, data = cureSurv, formula.surv = list( Genero+T.entrada+TBHIV+ P.resistenc+ Idade),
type = ”mixture”, dist = ”weiwei”, link = ”logit”, control = list(maxit = 1000), method =
”Nelder-Mead”, init = NULL, link.mix = ”logit”, covariance = TRUE)
summary(cure.fit4)
AIC(cure.fit4)
BIC(cure.fit4)

cure.fit5 < − fit.cure.model(Surv(Tempo, Desfecho1) Genero+T.entrada+TBHIV+P.resistenc+


Idade, data = cureSurv, formula.surv = list( Genero+T.entrada+TBHIV+ P.resistenc+ Idade),

Autor: Belmiro Armando Mahita 61 Licenciatura em Estatı́stica - UEM


Apêndice

type = ”mixture”, dist = ”weiwei”, link = ”probit”, control = list(maxit = 1000), method =
”Nelder-Mead”, init = NULL, link.mix = ”probit”, covariance = TRUE)
summary(cure.fit5)
AIC(cure.fit5)
BIC(cure.fit5)

cure.fit6 < − fit.cure.model(Surv(Tempo, Desfecho1) Genero+T.entrada+TBHIV+P.resistenc+


Idade, data = cureSurv, formula.surv = list( Genero+T.entrada+TBHIV+ P.resistenc+ Idade),
type = ”mixture”, dist = ”weiwei”, link = ”loglog”, control = list(maxit = 1000), method =
”Nelder-Mead”, init = NULL, link.mix = ”loglog”, covariance = TRUE)
summary(cure.fit6)
AIC(cure.fit6)
BIC(cure.fit6)

cure.fit7 < − fit.cure.model(Surv(Tempo, Desfecho1) Genero+T.entrada+TBHIV+P.resistenc+


Idade, data = cureSurv, formula.surv = list( Genero+T.entrada+TBHIV+ P.resistenc+ Idade),
type = ”mixture”, dist = ”weiexp”, link = ”logit”, control = list(maxit = 1000), method =
”Nelder-Mead”, init = NULL, link.mix = ”logit”, covariance = TRUE)
summary(cure.fit7)
AIC(cure.fit7)
BIC(cure.fit7)

cure.fit8 < − fit.cure.model(Surv(Tempo, Desfecho1) Genero+T.entrada+TBHIV+P.resistenc+


Idade, data = cureSurv, formula.surv = list( Genero+T.entrada+TBHIV+ P.resistenc+ Idade),
type = ”mixture”, dist = ”weiexp”, link = ”probit”, control = list(maxit = 1000), method =
”Nelder-Mead”, init = NULL, link.mix = ”probit”, covariance = TRUE)
summary(cure.fit8)
AIC(cure.fit8)
BIC(cure.fit8)

cure.fit9 < − fit.cure.model(Surv(Tempo, Desfecho1) Genero+T.entrada+TBHIV+P.resistenc+


Idade, data = cureSurv, formula.surv = list( Genero+T.entrada+TBHIV+ P.resistenc+ Idade),
type = ”mixture”, dist = ”weiexp”, link = ”loglog”, control = list(maxit = 1000), method =
”Nelder-Mead”, init = NULL, link.mix = ”loglog”, covariance = TRUE)
summary(cure.fit9)
AIC(cure.fit9)
BIC(cure.fit9)

——–Modelo semi-paramétrico de Cox————

Autor: Belmiro Armando Mahita 62 Licenciatura em Estatı́stica - UEM


Apêndice

cox.modelo< −coxph(Surv(Tempo, Desfecho1) Genero+T.entrada+P.resistenc+TBHIV+ Idade,


ties=”breslow”, singular.ok=TRUE)
cox.modelo
plot(cox.modelo)
AIC(cox.modelo)
BIC(cox.modelo)

——–Modelo semi-paramétrico com fracção de cura————

——–Modelo inicial estimado————


fit.smcure < − smcure(Surv(Tempo, Desfecho1) Genero+ T.entrada+ TBHIV+P.resistenc+ Idade,
cureform= Genero+ T.entrada+ TBHIV+ P.resistenc+Idade, data=cureSurv, na.action = na.omit,
model=”ph”, link=”logit”,Var=TRUE, nboot=500)

——–Modelo final ajustado————


fit.smcure < − smcure(Surv(Tempo, Desfecho1) Genero+ T.entrada+ TBHIV+P.resistenc+ Idade,
cureform= Idade, data=cureSurv, na.action = na.omit, model=”ph”, link=”logit”,Var=TRUE,
nboot=500)

——–Aplicação do modelo final————


Género com as Caracteristicas: T.entrada (caso novo); Associação TB/HIV (não tem HIV asso-
ciados); Padão de resistência (MR); Idade igual 10 anos; com fracções de cura para pacientes
com 10 anos.
pred-fit.smcure1< −predictsmcure(fit.smcure, newX=cbind(c(0,1), c(0,0), c(0,0), c(0,0), c(10,10)),
newZ=cbind(c(10,10)), model=”ph”)
plotpredictsmcure(pred-fit.smcure1, model= ”ph”, type=”S”, xlab=”Tempo”, ylab=”Probabilidade
de sobrevivência predicta”)

Género com as Caracteristicas: T.entrada (Recaı́da); Associação TB/HIV (tem HIV associa-
dos); Padão de resistência (XR); Idade igual 10 anos; com fracções de cura para pacientes com
10 anos.
pred-fit.smcure2< −predictsmcure(fit.smcure, newX=cbind(c(0,1), c(1,1), c(1,1), c(1,1), c(10,10)),
newZ=cbind(c(10,10)),model=”ph”) plotpredictsmcure(pred-fit.smcure2, model= ”ph”, type=”S”,
xlab=”Tempo”, ylab=”Probabilidade de sobrevivência predicta”, ylim=c(0,1))
Género com as Caracteristicas: T.entrada (caso novo); Associação TB/HIV (não tem HIV asso-
ciados); Padão de resistência (MR); Idade igual 20 anos para Género (masculino) e 40 anos para
Género (feminino); com fracções de cura para pacientes com 20 anos para Género (masculino)
e 40 anos para Género (feminino).
pred-fit.smcure3< −predictsmcure(fit.smcure, newX=cbind(c(0,1), c(0,0), c(0,0), c(0,0), c(20,40)),

Autor: Belmiro Armando Mahita 63 Licenciatura em Estatı́stica - UEM


Apêndice

newZ=cbind(c(20,40)), model=”ph”)
plotpredictsmcure(pred-fit.smcure3, model= ”ph”, type=”S”, xlab=”Tempo”, ylab=”Probabilidade
de sobrevivência predicta”)

Género com as Caracteristicas: T.entrada (Recaı́da); Associação TB/HIV (tem HIV associa-
dos); Padão de resistência (XR); Idade igual 20 anos para Género (masculino) e 40 anos para
Género (feminino); com fracções de cura para pacientes com 20 anos para Género (masculino)
e 40 anos para Género (feminino).
pred-fit.smcure5< −predictsmcure(fit.smcure, newX=cbind(c(0,1), c(1,1), c(1,1), c(1,1), c(20,40)),
newZ=cbind(c(20,40)), model=”ph”)
plotpredictsmcure(pred-fit.smcure5, model= ”ph”, type=”S”, xlab=”Tempo”, ylab=”Probabilidade
de sobrevivência predicta”)

Tipo de entrada com as Caracteristicas: Género (masculino); Associação TB/HIV (não tem
HIV associados); Padão de resistência (MR); Idade igual 10 anos; com fracções de cura para
pacientes com 10 anos.
pred-fit.smcure7< −predictsmcure(fit.smcure, newX=cbind(c(0,0), c(0,1), c(0,0), c(0,0), c(10,10)),
newZ=cbind(c(10,10)), model=”ph”)
plotpredictsmcure(pred-fit.smcure7, model= ”ph”, type=”S”, xlab=”Tempo”, ylab=”Probabilidade
de sobrevivência predicta”)

Tipo de entrada com as Caracteristicas: Género (feminino); Associação TB/HIV (tem HIV as-
sociados); Padão de resistência (XR); Idade igual 10 anos; com fracções de cura para pacientes
com 10 anos.
pred-fit.smcure8< −predictsmcure(fit.smcure, newX=cbind(c(1,1), c(0,1), c(1,1), c(1,1), c(10,10)),
newZ=cbind(c(10,10)), model=”ph”)
plotpredictsmcure(pred-fit.smcure8, model= ”ph”, type=”S”, xlab=”Tempo”, ylab=”Probabilidade
de sobrevivência predicta”)

Tipo de entrada com as Caracteristicas: Género (masculino); Associação TB/HIV (não tem
HIV associados); Padão de resistência (MR); Idade igual 10 anos para T.entrada (caso novo)
e 20 anos para T. entrada (Recaı́da); com fracções de cura para pacientes com 10 anos para
T.entrada (caso novo) e 20 anos para T. entrada (Recaı́da).
pred-fit.smcure9< −predictsmcure(fit.smcure, newX=cbind(c(0,0), c(0,1), c(0,0), c(0,0), c(10,20)),
newZ=cbind(c(10,20)), model=”ph”)
plotpredictsmcure(pred-fit.smcure9, model= ”ph”, type=”S”, xlab=”Tempo”, ylab=”Probabilidade
de sobrevivência predicta”, ggplot2::Scale(0,1))

Tipo de entrada com as Caracteristicas: Género (feminino); Associação TB/HIV (tem HIV as-

Autor: Belmiro Armando Mahita 64 Licenciatura em Estatı́stica - UEM


Apêndice

sociados); Padão de resistência (XR); Idade igual 10 anos para T.entrada (caso novo) e 20 anos
para T. entrada (Recaı́da); com fracções de cura para pacientes com 10 anos para T.entrada
(caso novo) e 20 anos para T. entrada (Recaı́da).
pred-fit.smcure11< −predictsmcure(fit.smcure, newX=cbind(c(1,1), c(0,1), c(1,1), c(1,1), c(10,20)),
newZ=cbind(c(10,20)),model=”ph”)
plotpredictsmcure(pred-fit.smcure11, model= ”ph”, type=”S”, xlab=”Tempo”, ylab=”Probabilidade
de sobrevivência predicta”, ylim=c(0,1))

Associação TB/HIV com as Caracteristicas: Género (masculino); T.entrada (caso novo); Padão
de resistência (MR); Idade igual 10 anos; com fracções de cura para pacientes com 10 anos.
pred-fit.smcure13< −predictsmcure(fit.smcure, newX=cbind(c(0,0), c(0,0), c(0,1), c(0,0), c(10,10)),
newZ=cbind(c(10,10)), model=”ph”)
plotpredictsmcure(pred-fit.smcure13, model= ”ph”, type=”S”, xlab=”Tempo”, ylab=”Probabilidade
de sobrevivência predicta”)

Associação TB/HIV com as Caracteristicas: Género (feminino); T.entrada (Recaı́da); Padão de


resistência (XR); Idade igual 10 anos; com fracções de cura para pacientes com 10 anos.
pred-fit.smcure14< −predictsmcure(fit.smcure, newX=cbind(c(1,1), c(1,1), c(0,1), c(1,1), c(10,10)),
newZ=cbind(c(10,10)), model=”ph”)
plotpredictsmcure(pred-fit.smcure14, model= ”ph”, type=”S”, xlab=”Tempo”, ylab=”Probabilidade
de sobrevivência predicta”)

Associação TB/HIV com as Caracteristicas: Género (masculino); T.entrada (caso novo); Padão
de resistência (MR); Idade igual 20 anos para T.entrada (caso novo) e 40 anos para T. entrada
(Recaı́da); com fracções de cura para pacientes com 20 anos para T.entrada (caso novo) e 40
anos para T. entrada (Recaı́da).
pred-fit.smcure16< −predictsmcure(fit.smcure, newX=cbind(c(0,0), c(0,0), c(0,1), c(0,0), c(20,40)),
newZ=cbind(c(20,40)), model=”ph”)
plotpredictsmcure(pred-fit.smcure16, model= ”ph”, type=”S”, xlab=”Tempo”, ylab=”Probabilidade
de sobrevivência predicta”)

Associação TB/HIV com as Caracteristicas: Género (feminino); T.entrada (Recaı́da); Padão


de resistência (XR); Idade igual 40 anos para T.entrada (caso novo) e 20 anos para T. entrada
(Recaı́da); com fracções de cura para pacientes com 40 anos para T.entrada (caso novo) e 20
anos para T. entrada (Recaı́da).
pred-fit.smcure18< −predictsmcure(fit.smcure, newX=cbind(c(1,1), c(1,1), c(0,1), c(1,1), c(40,20)),
newZ=cbind(c(40,20)), model=”ph”)
plotpredictsmcure(pred-fit.smcure18, model= ”ph”, type=”S”, xlab=”Tempo”, ylab=”Probabilidade
de sobrevivência predicta”, ylim=c(0,1))

Autor: Belmiro Armando Mahita 65 Licenciatura em Estatı́stica - UEM


Apêndice

——–Modelo paramétrico com fracção de cura sem variáveis————


fit < − GenFlexCureModel(Surv(Tempo, Desfecho1) 1, data = cureSurv, df = 3)

——–Gráficos do modleo GenFlexCureModel————


par(mfrow=c(2,3))
plot(fit, time = seq(0.001, 406, length.out = 100), main=”a”) Modelo de sobrevivência geral
plot(fit, type = ”hazard”, main=”b”) Gráfico da função de risco
plot(fit, type = ”survuncured”, time = seq(0.001, 406, length.out = 100), main=”c”) Modelo de
sobrevivência dos não curados
plot(fit, type = ”probcure”, time = seq(0.001, 406, length.out = 100), main=”d”) Modelo de
probabilidade de cura

——–fracção de cura predicta————


predict(fit, type = ”curerate”)

Associação TB/HIV com as Caracteristicas: Género (masculino); T.entrada (caso novo); Padão
de resistência (MR); Idade igual 20 anos; com fracções de cura para pacientes com 20 anos.
pred-fit.smcure19< −predictsmcure(fit.smcure1, newX=cbind(c(0,0), c(0,0), c(0,1), c(0,0), c(10,10)),
newZ=cbind(c(0,0), c(0,0), c(0,1), c(0,0), c(10,10)), model=”ph”)
plotpredictsmcure(pred-fit.smcure19, model= ”ph”, type=”S”, xlab=”Tempo”, ylab=”Probabilidade
de sobrevivência predicta”)

Associação TB/HIV com as Caracteristicas: Género (feminino); T.entrada (Recaı́da); Padão de


resistência (XR); Idade igual 20 anos; com fracções de cura para pacientes com 20 anos.
pred-fit.smcure20< −predictsmcure(fit.smcure1, newX=cbind(c(1,1), c(1,1), c(0,1), c(1,1), c(10,10)),
newZ=cbind(c(1,1), c(1,1), c(0,1), c(1,1), c(10,10)), model=”ph”)
plotpredictsmcure(pred-fit.smcure20, model= ”ph”, type=”S”, xlab=”Tempo”, ylab=”Probabilidade
de sobrevivência predicta”)

Autor: Belmiro Armando Mahita 66 Licenciatura em Estatı́stica - UEM

Você também pode gostar