Você está na página 1de 14

MÉTODOS PARAMÉTRICOS PARA A

ANÁLISE DE DADOS DE SOBREVIVÊNCIA

 Nesta abordagem paramétrica, para estimar as funções


básicas da análise de sobrevida, assume-se que o tempo de
falha T segue uma distribuição conhecida de probabilidade.
PERGUNTA: Que tipo de distribuição de probabilidade
poderia representar T?
 LEMBRANDO:
I. T é uma V.A. contínua não-negativa.
II. T apresenta forte assimetria.

Dessa forma, a distribuição normal, que permite valores


negativos, não é adequada para modelar o tempo de
sobrevida.
 Alguns modelos mais utilizados, por se adaptarem a uma
grande variedade de situações, são: exponencial, weibull e
lognormal.
DISTRIBUIÇÕES BÁSICAS EM
SOBREVIVÊNCIA
1. DISTRIBUIÇÃO EXPONENCIAL

 Em termos matemáticos, a distribuição exponencial é um dos modelos


probabilísticos mais simples para descrever o tempo de vida .

 Esta distribuição apresenta um único parâmetro e é a única que se


caracteriza por ter uma função de risco constante.

 É bastante utilizada para descrever o tempo de vida de certos produtos,


bem como, o tempo de vida e remissão em doenças crônicas e infecciosas.

A função densidade de probabilidade é dada por:

f (t )   exp(t ),   0.

Em que o parâmetro  tem a mesma unidade do tempo de vida T.


 A função de sobrevivência é dada por:

S (t )  e  ( t )
 As funções de risco é dada por:

f (t )  e  t
h(t )    t  
S (t ) e

ILUSTRAÇÃO DAS FUNÇÕES DE SOBREVIVÊNCIA


SEGUNDO O MODELO EXPONENCIAL.
 O fato da taxa de falha (função de risco) ser constante significa que tanto
uma unidade velha, quanto uma nova, que ainda não falharam, tem o
mesmo risco de falhar em um intervalo futuro.

 Esta propriedade é chamada de falta de memória da distribuição


exponencial.

 Apesar da simplicidade matemática, a suposição de risco constante é


pouco plausível na maioria dos fenômenos da saúde e engenharia.

 A distribuição exponencial pode ser uma boa aproximação quando o


tempo de acompanhamento é curto o suficiente para que o risco naquele
período possa ser considerado constante.

 Por exemplo, o risco de óbito de crianças entre dois e cinco anos pode ser
considerado constante nesse intervalo.
DISTRIBUIÇÕES BÁSICAS EM
SOBREVIVÊNCIA

2. DISTRIBUIÇÃO WEIBULL

 A distribuição Weibull é uma generalização da distribuição exponencial.

 É bastante utilizada em aplicações práticas por apresentar uma grande


variedade de formas: a sua função de risco é monótona, isto é, ela é
crescente, decrescente ou constante.

 A distribuição Weibull é uma das mais utilizada para modelar tempos de


sobrevida, particularmente em estudos nas áreas biomédica e industrial.

Alguns exemplos: tempo até a ocorrência de tumores, estudo de


mortalidade por causas específicas e tempo de incubação do HIV.
 A f.d.p. de uma V.A. T com distribuição de Weibull é dada por:

 ( t )
f (t )   (t )  1
e

 O parâmetro de forma,  e o de escala,  são ambos positivos.

 O parâmetro  tem a mesma unidade de medida do tempo e  não tem


unidade de medida.

 Função de sobrevivência: S (t )  exp( (t ) )

 Função de risco: h(t )   (t ) 1

 Observe que para  > 1: A função de risco é estritamente crescente.


 < 1: A função de risco é estritamente decrescente.
 = 1: A função de risco é constante, equivalendo
ao modelo exponencial.
ILUSTRAÇÃO DAS FUNÇÕES DE SOBREVIVÊNCIA
SEGUNDO O MODELO WEIBULL.
3. DISTRIBUIÇÃO LOGNORMAL

 É muito utilizada para caracterizar tempos de vida de


produtos e indivíduos.

 Alguns exemplos: fadiga de metal, semicondutores e


pacientes com leucemia.

 Existe uma relação entre as distribuições lognormal e normal


que facilita a apresentação e análise de dados.

 O logaritmo de uma variável com distribuição lognormal


segue uma distribuição normal com parâmetros  e  2 .

 A f.d.p. de uma variável aleatória T com distribuição


lognormal é dada por:
1 
 1  ln(t )    
2

f (t )  exp    , t  0
t 2 
 2   
 A função de sobrevivência de uma variável lognormal não apresenta
uma forma analítica explícita e é representada por:
 ln(t )   
S (t )  1  F (t )  1    
  
em que  (.) é a função de distribuição acumulada de uma normal padrão.

h(t )  f (t )
S (t )
 A função de risco apresenta uma forma analítica explícita e é
representada por:

 A popularidade dessa distribuição é em parte devido ao fato de que o


valor acumulado de ln(t) pode ser obtido da tabela da distribuição
normal padrão e o correspondente valor de t é então encontrado pela
aplicação de antilogaritmo.
ILUSTRAÇÃO DAS FUNÇÕES DE SOBREVIVÊNCIA
SEGUNDO O MODELO LOGNORMAL.

 Observe que as funções de risco não são monótonas como as da


distribuição Weibull. Elas crescem, atingem um valor máximo e depois
decrescem.
ESTIMAÇÃO DOS PARÂMETROS
 Os modelos probabilísticos apresentados são caracterizados
por quantidades desconhecidas, denominadas parâmetros, que
conferem uma forma geral aos modelos.

 Em estudos de sobrevivência os parâmetros devem ser


estimados a partir das observações amostrais para que o
modelo fique determinado e, assim, seja possível responder às
perguntas de interesse.

 Existem alguns métodos para estimar os parâmetros das


funções básicas de sobrevivência assumindo uma distribuição
para a variável tempo.

 O método de mínimos quadrados é inapropriado para estudos


deste tipo devido a sua incapacidade de incorporar censuras no
seu processo de estimação.
 O método de máxima verossimilhança é adequado, pois além de
incorporar as censuras, é relativamente simples de ser entendido e possui
propriedades ótimas para grandes amostras.
 O MÉTODO DE MÁXIMA VEROSSIMILHANÇA
 IDEIA DO MÉTODO: Baseado nos resultados obtidos pela amostra,
qual é a distribuição, entre todas aquelas definidas pelos possíveis valores
de seus parâmetros, com maior probabilidade de ter gerado tal amostra?

 Por exemplo, se a distribuição do tempo de falha é a de Weibull, o


estimador de máxima verossimilhança escolhe aquele par de  e  que
melhor explique a amostra observada.

 Considere primeiramente a situação onde todos os tempos de


sobrevivência de uma amostra de tamanho n são não-censurados.

 Se a f.d.p. da V.A. associada com o tempo de sobrevivência é f(t), a função


de verossimilhança das n observações t1,t2,...,tn, para um parâmetro
genérico  desta população é, então, expressa por
 A tradução em termos matemático para a frase “a
distribuição que melhor explica a amostra observada” é
encontrar o valor de  que maximiza a função L().

 Isto é, encontrar o valor de  que maximize a probabilidade


da amostra observada ocorrer.

 A função de verossimilhança mostra que a contribuição de


cada observação não-censurada é a sua função de densidade.

 As observações censuradas nos informam que o tempo de


falha é maior que o tempo de censura observado, ou seja, a
probabilidade deste evento é P(T >t), que é a função de
sobrevivência.

 Dessa forma, a contribuição de cada observação censurada


para L() é a sua função de sobrevivência, S(t).
 As observações podem ser divididas em dois conjuntos.

 As r primeiras ordenadas são as não-censuradas (1, 2,...,r) e as n-r


seguintes são as censuradas (r + 1,r + 2,...,n).

 IMPORTANTE: No processo de construção da verossimilhança para


dados censurados é necessário supor que os tempos em que há
censura são independentes dos tempos de ocorrência do evento.

Você também pode gostar