Você está na página 1de 60

Modelo Destrutivo com Varivel Terminal em

Experimentos Quimiopreventivos de Tumores


em Animais
Katherine Elizabeth Coaguila Zavaleta
Universidade Federal de So Carlos
Centro de Cincias Exatas e de Tecnologia
Departamento de Estatstica
Modelo Destrutivo com Varivel Terminal em
Experimentos Quimiopreventivos de Tumores
em Animais
Katherine Elizabeth Coaguila Zavaleta
Orientador: Prof. Dr. Josemar Rodrigues
Dissertao apresentada ao Departamento de
Estatstica da Universidade Federal de So
Carlos - DEs/UFSCar como parte dos requi-
sitos para obteno do ttulo de Mestre em
Estatstica.
UFSCar - So Carlos - SP
Abril de 2012


































Ficha catalogrfica elaborada pelo DePT da
Biblioteca Comunitria da UFSCar



C652md

Coaguila Zavaleta, Katherine Elizabeth.
Modelo destrutivo com varivel terminal em experimentos
quimiopreventivos de tumores em animais / Katherine
Elizabeth Coaguila Zavaleta. -- So Carlos : UFSCar, 2012.
50 f.

Dissertao (Mestrado) -- Universidade Federal de So
Carlos, 2012.

1. Estatstica. 2. Modelo destrutivo. 3. Distribuio de
Poisson. 4. Distribuio binomial negativa. 5. Modelos
inflacionados de zeros. I. Ttulo.


CDD: 519.5 (20
a
)


Agradecimentos
Deus pela minha vida, por cada dia que amanheo viva, por minha sade, por minha famlia,
por meus estudos, por me iluminar durante os momentos difceis e me dar foras para superar os
obstculos quando se apresentam.
Ao meu orientador de mestrado, Josemar Rodrigues, pelas orientaes valiosas, pela disponibili-
dade de tempo, pelos esclarecimentos das minhas duvidas, pela conana, compreenso, pacincia e
incentivo na elaborao e conduo deste trabalho. Tambm pelos conhecimentos que me transmitiu
incentivaram-me a aprofundar os meus estudos e aspirar um alto nvel de procincia nesta rea.
Ao professor Vicente Cancho, pela explanao de ideias, ajuda na elaborao dos programas
computacionais e pela disposio em me ajudar, sempre que necessrio, na realizao deste trabalho.
professora Estela Pereira Bereta, pelo carinho, solidariedade e apoio prestado.
Aos professores membros da banca pelas crticas e sugestes para o melhoramento deste trabalho.
Aos professores do Departamento de Estatstica da Universidade Federal de So Carlos, em
especial Galvo Leite, Carlos Diniz, Vera Tomazella, Luis Milan, Josemar Rodrigues, Marcio Diniz,
pelas aulas ministradas do mestrado. Isabel uma excelente secretria, por todas as informaes
e servios oferecidos. Em geral, a todas as pessoas que me abriram as portas, me oferecendo um
ambiente acolhedor e sadio para que eu pudesse realizar o meu mestrado nesta Universidade.
Coordenao de Aperfeioamento de Pessoal de Nvel Superior (CAPES) pelo auxlio nan-
ceiro concedido durante o perodo de mestrado.
todas as pessoas que colaboraram para minha vinda ao Brasil, que acreditaram em mim para
que eu pudesse realizar este trabalho.
s minhas amigas muito queridas, Patricia Tacuri que me acolheu quando cheguei ao Brasil
me dando muito apoio e exemplo de estudo, Angelica Ribeiro, verdadeira companheira de pesquisa,
sempre gentil, alegre e presente, Vernica Quispe, pelos nimos, conselhos de vida e sincera amizade,
Eveline Soares Costa e famlia pela amizade e contribuio incondicional para minha estadia aqui
no Brasil.
todos os meus amigos peruanos por compartilhar momentos como em famlia em So Carlos,
fazendo nossas reunies inesquecveis e divertidas.
todos os meus colegas do departamento de Estatstica, Silvia Maria Prado, Katiane Concei-
o, pelas correes de redao em portugus, Rubiane Maria Pires, Vinicius cokin, Jhon Bernedo,
Patrick Borges, Victor Fossaluza, Vitor Marchi, Hugo Kegler dos Santos, Adriano Kamimura, Paulo
Henrique Ferreira, Thiago Arrabal, todos eles sempre estiveram carinhosamente presentes contri-
buindo com sugestes, tirando minhas duvidas, alm da amizade incondicional.
E com muito amor,
toda minha famlia, que sempre me apoiaram em tudo, em particular aos meus pais Jos Luis
e Carolin e a minha irm Karla, por todo amor que me dedicaram, porque nunca mediram esforos
para os sucesso das suas lhas, pelo incentivo, pelas oraes desde Per e pelas palavras de apoio
neste perodo de trabalho. Este sucesso tambm vosso.
Abstract
The chemical induction of carcinogens in chemopreventive animal experiments is becoming increa-
singly frequent in biological research. The purpose of these biological experiments is to evaluate the
eect of a particular treatment on the rate of tumors incidence in animals. In this work, the num-
ber of promoted tumors per animal will be parametrically modeled following the suggestions given
by Kokoska (1987) and Freedman et al. (1993). The study of these chemopreventive experiments
will be presented in the context of the destructive model proposed by Rodrigues et al. (2010) with
terminal variable that allows or censures the experiment at time of the animal death. Since the
data analyzed in this eld are subject to excess of zeros (Freedman et al. (1993)), we propose for
the number of promoted tumors a negative binomial distribution (NB), a zero-inated Poisson dis-
tribution (ZIP), and a zero-inated Negative Binomial distribution (ZINB). The selection of these
models will be made through the likelihood ratio test and the AIC, BIC criteria. The estimation of
its parameters will be obtained by using the method of maximum likelihood, and further simula-
tion studies will also be realized. As a future proposition to nalize this project, it is suggested the
Bayesian methodology as an alternative to the method of maximum likelihood via the EM algorithm.
Keywords: Destructive Model, Poisson Model, Negative Binomial Model, Zero-Inated Poisson
Model, Zero-Inated Negative Binomial Model, Chemopreventive Experiments.
i
Resumo
A induo qumica de substncias cancergenas em experimentos quimiopreventivos em animais
cada vez mais frequente em pesquisas biolgicas. O objetivo destes experimentos biolgicos
avaliar o efeito de um determinado tratamento na taxa de incidncia de tumores em animais. Neste
trabalho o nmero de tumores promovidos por animal ser modelado parametricamente seguindo
as sugestes dadas por Kokoska (1987) e por Freedman et al. (1993). O estudo desses experimentos
quimiopreventivos ser apresentado no contexto do modelo destrutivo proposto por Rodrigues et al.
(2010) com varivel terminal que condiciona ou censura o experimento no instante de morte do ani-
mal. Os dados analisados possuem uma grande quantidade de zeros, portanto ser proposto para
o nmero de tumores promovidos as seguintes distribuies: binomial negativa, a distribuio de
Poisson com zeros inacionados e a distribuio binomial negativa com zeros inacionados. A sele-
o destes modelos ser feita atravs do teste da razo de verossimilhana e os critrios AIC, BIC.
As estimativas dos respectivos parmetros sero obtidas utilizando o mtodo de mxima verossimi-
lhana e sero feitos estudos de simulao. Para continuar este projeto, a proposta futura utilizar
a metodologia Bayesiana como alternativa ao mtodo de mxima verossimilhana via algoritmo EM.
Palavras-chave: Modelo destrutivo, Modelo de Poisson, Modelo binomial negativo, Modelo de
Poisson zero inacionada, Modelo binomial negativa zero inacionada, Experimentos quimiopre-
ventivos.
ii
Sumrio
Lista de Tabelas v
1 Introduo 1
1.1 Modelo destrutivo (Rodrigues et al.(2010)) . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 Motivao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3 Propostas do trabalho . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.4 Apresentao dos captulos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2 Reviso de literatura 7
2.1 Distribuio de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2 Distribuio binomial negativa (BN) . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.3 Nmero excessivo de zeros nos dados . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.3.1 Distribuio inacionada de zeros (DIZ) . . . . . . . . . . . . . . . . . . . . . 9
2.3.2 Distribuio de Poisson com zeros inacionados (PZI) . . . . . . . . . . . . . 10
2.3.3 Distribuio binomial negativa com zeros inacionados (BNZI) . . . . . . . . 11
2.4 Inferncia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.4.1 Estimao de mxima verossimilhana . . . . . . . . . . . . . . . . . . . . . . 12
2.4.2 Mtodos numricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.5 Teste de hipteses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.6 Intervalos de conana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.7 Critrios de seleo do modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3 Modelo destrutivo com varivel terminal 17
3.1 Formulao do modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
3.1.1 Observaes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
3.1.2 Distribuio de probabilidades com varivel terminal . . . . . . . . . . . . . . 19
3.1.3 Funo de verossimilhana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
3.2 Casos especiais do modelo destrutivo com varivel terminal . . . . . . . . . . . . . . 21
3.2.1 Modelo destrutivo de Poisson com varivel terminal . . . . . . . . . . . . . . 21
3.2.2 Modelo destrutivo binomial negativo com varivel terminal . . . . . . . . . . 22
3.2.3 Modelo destrutivo Poisson com zeros inacionados e varivel terminal . . . . 23
3.2.4 Modelo destrutivo binomial negativo com zeros inacionados e varivel terminal 27
3.2.5 Estudo de simulao para o modelo destrutivo PZI com varivel terminal . . 31
4 Aplicao com Dados Reais 34
5 Consideraes Finais 38
A 40
A.1 Cncer, Carcinognese (INCA, 2011) . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
A.2 Esperana e Varincia do modelo destrutivo com varivel terminal . . . . . . . . . . 41
A.3 condies de 1
a
e 2
a
ordem do modelo destrutivo de Poisson com varivel terminal . 41
A.4 Distribuio da varivel destrutiva BN dada a varivel terminal . . . . . . . . . . . . 43
iii
A.4.1 Condies de 1
a
e 2
a
ordem do modelo destrutivo BN com varivel terminal . 43
A.5 Distribuio da varivel destrutiva PZI dada a varivel terminal . . . . . . . . . . . . 45
A.5.1 Funo de verossimilhana ampliada do modelo destrutivo PZI com varivel
terminal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
A.6 Distribuio da varivel destrutiva BNZI com varivel terminal . . . . . . . . . . . . 46
A.6.1 Funo de verossimilhana ampliada do modelo destrutivo BNZI com varivel
terminal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
Referncias 49
Lista de Tabelas
1.1 Tabela de dados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.1 Tipos de zeros em dados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
3.1 Modelos Paramtricos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3.2 Mdia, Vis, EQM das estimativas de mxima verossimilhana para 1000 rplicas
com alta proporo de zeros aleatrios = 0, 7. . . . . . . . . . . . . . . . . . . . . . 32
3.3 Mdia, Vis, EQM das estimativas de mxima verossimilhana para 1000 rplicas
com baixa proporo de zeros aleatrios = 0, 4. . . . . . . . . . . . . . . . . . . . . 32
3.4 Mdia, Vis, EQM das estimativas de mxima verossimilhana para 1000 rplicas,
estimando com o modelo destrutivo de Poisson para dados gerados com = 0.7
(proporo de zeros aleatrios). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.5 Mdia, Vis, EQM das estimativas de mxima verossimilhana para 1000 rplicas,
estimando com o modelo destrutivo de Poisson para dados gerados com = 0.4
(proporo de zeros aleatrios). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
4.1 Resultados do modelo destrutivo de Poisson. . . . . . . . . . . . . . . . . . . . . . . . 35
4.2 Resultados do modelo destrutivo binomial negativo. . . . . . . . . . . . . . . . . . . . 35
4.3 Resultados do modelo destrutivo de Poisson com zeros inacionados. . . . . . . . . . 35
4.4 Resultados do modelo destrutivo binomial negativo com zeros inacionados. . . . . . 36
4.5 Seleo de modelo para o grupo controle. . . . . . . . . . . . . . . . . . . . . . . . . . 36
4.6 Seleo de modelo para o grupo com agente A. . . . . . . . . . . . . . . . . . . . . . 36
4.7 Freqncias esperadas de cada modelo . . . . . . . . . . . . . . . . . . . . . . . . . . 37
v
Captulo 1
Introduo
Os experimentos quimiopreventivos de cncer em animais tm como objetivo a avaliao do
efeito de um determinado tratamento no combate de tumores. Neste sentido, a pesquisa para es-
tudar melhores alternativas de tratamento dos tumores cancergenos tm promovido um grande
desenvolvimento na rea biomdica. O uso de animais em experimentos de laboratrio uma pode-
rosa ferramenta para as descobertas cientcas com benefcios diretos na medicina. As contribuies
signicativas fornecidas pelos experimentos ajudam no desenvolvimento de diversos tratamentos,
novas drogas, novos mtodos cirrgicos, vacinas, terapia gnica etc., que tm como nalidade curar
a doena e melhorar a qualidade de vida do paciente.
O desenvolvimento destes experimentos gera prs e contras dos testes em animais (experimen-
tao animal). Os cientistas fundamentam que sem os testes, as prateleiras das farmcias estariam
vazias e no haveria como criar novos remdios sem experiment-los antes em animais de laborat-
rio. Os cientistas ressaltam tambm que seguem rgidos protocolos e cdigos de tica que garantem
o bem-estar e impedem o sofrimento dos animais. Os defensores dos direitos dos animais repudiam
esses testes, armando que so cruis e inteis, mas os cientistas argumentam que, sem eles, os
avanos da medicina seriam fortemente prejudicados.
A quimiopreveno uma estratgia para lutar contra o cncer baseada na utilidade de agentes
qumicos, naturais ou sintticos, para reverter, suprimir ou prevenir uma progresso carcinognica.
Essa estratgia realizada em experimentos com animais que servem como cobaias e consiste em
administrar um agente quimiopreventivo durante as etapas iniciais da carcinognese, ou seja, an-
tes do estabelecimento do estgio de progresso (ver Apndice A.1), a m de testar o efeito ou o
potencial da substncia quimiopreventiva. Camundongos e ratos, por terem um ciclo de vida curto
e fcil reproduo, so utilizados nestes experimentos. Antes de tudo, estes animais so infectados
com substncias cancergenas para produzir tumores, aps aplica-se o agente quimiopreventivo para
depois avaliar a sua eccia e toxicidade. Finalizado o experimento segue um estudo histolgico dos
animais aps serem sacricados, dependendo dos resultados, o tratamento com agente quimiopre-
ventivo descartado. Se o teste for bem sucedido segue-se uma ltima fase, quando ser testado o
tratamento em pacientes.
Neste trabalho realizado um estudo estatstico para testar o efeito de uma substncia quimi-
opreventiva na taxa de incidncia de tumores em animais.
Estudos feitos por Thompson et al. (1984), em que foi estudado a inibio de tumores mamrios
em ratos fmeas, dois experimentos quimiopreventivos foram realizados: no primeiro experimento
foi testado duas substncias compostas quimiopreventivas, selnio com sodium selenite (a) e sel-
1
INTRODUO 2
nio com selenometrionide (b) para eliminar o efeito do carcingeno 1-Methyl-1-nitrosourea (MNU)
que foi inicialmente induzido nos animais. No segundo experimento foram utilizadas as substn-
cias quimiopreventivas anteriores contra um outro tipo de carcingeno chamado 7-12-dimethylbenz-
anthraceno (DMBA). A substncia (a) foi um agente quimiopreventivo com mais eccia no combate
ao cncer, mostrando signicativamente que houve uma reduo no nmero de tumores por rato nos
dois experimentos. No entanto, a substncia (b) causou leses graves e srios danos vitais nos ani-
mais. Na anlise estatstica, os efeitos das substncias selnio foram testadas via anlise de regresso
e a incidncia do tumor foi testado usando o teste
2
.
No estudo de Kokoska (1987), o experimento foi primordialmente designado pesquisa do efeito
do tratamento quimiopreventivo sobre a taxa de incidncia de tumores mamrios em animais.
Como variveis respostas foram considerados o nmero de tumores e as respectivas taxas. O mo-
delo matemtico usado para caracterizar o experimento foi baseado nos dois primeiros estgios da
carcinognese, iniciao e promoo, que so resultados da exposio carcinognica em que tumores
malignos localizados nas glndulas mamrias so observados quando eles evoluem para um tamanho
detectvel por apalpao. Neste experimento os tempos de deteco dos tumores so censurados
pelo tempo de laboratrio pr-estabelecido. Muitos desses ratos morrem durante o experimento e
so eliminados gerando concluses viciadas (vide Kokoska (1988)). Foi utilizada a distribuio de
Poisson para modelar o nmero de tumores, e a distribuio Gama para os tempos de deteco. Os
parmetros das distribuies descritas foram estimados atravs do mtodo de mxima verossimi-
lhana e foram construdos os seus respectivos intervalos de conana. Para comparar os efeitos de
dois tratamentos diferentes utilizaram o teste da razo de verossimilhana.
Boone et al. (1990) trabalhou na identicao de agentes quimiopreventivos em diferentes tipos
de cncer: pele (papilomas), mama, bexiga, clon e pulmo. Os cnceres de pele, mama, bexiga e c-
lon foram estudados em ratos e o cncer de pulmo em hamsters. Algumas avaliaes de ensaios cl-
nicos foram feitos em humanos. Boone et al. (1990) testou 16 agentes quimiopreventivos de 105 com-
binaes de compostos. No artigo foi apresentada a substncia DFMO (diuorometilornitina) como
agente quimiopreventivo contra a substncia carcinognica DMBA (7-12-dimetilbenzantraceno) na
avaliao de tumores de mama em ratos fmeas. Foram realizadas trs formas de testar o efeito do
agente quimiopreventivo. O agente DFMO aplicado aos animais durante a induo do carcingeno
DMBA; DFMO aplicado somente depois do carcingeno DMBA e DFMO administrado durante
e depois do DMBA. Destas trs formas, o ltimo caso resultou a forma mais eciente de administrar
um agente de quimiopreveno contra um carcingeno, apresentando uma reduo do nmero de
mutaes (clulas iniciadas). Por outro lado, a administrao depois do DMBA, retardou o desen-
volvimento desses tumores. No segundo caso, o agente DFMO atua como um agente de bloqueio da
promoo dos tumores e no primeiro caso DMFO atua como um agente de bloqueio das mutaes.
Foi questionado se o agente quimiopreventivo DFMO possui ambos mecanismos de bloqueio, um
s, ou nenhum deles. Esta questo direcionada a uma anlise estatstica que possa distinguir entre
estes mecanismos para avaliar o efeito de um determinado tratamento quimiopreventivo. Cabe res-
saltar que o estudo est baseado no nmero de tumores desenvolvidos durante o experimento e no
tempo de aparecimento de cada tumor em cada animal. Estes dados podem ser observados apenas
em alguns tipos de cncer como mama e pele, entretanto em outros tipos de cncer as informaes
so obtidas somente no nal do experimento quando o animal sacricado.
Freedman et al. (1993) estendeu o modelo de Kokoska (1987) correspondente ao nmero de
INTRODUO 3
tumores e seus tempos de deteco. Eles descobriram que os resultados so sensveis aos modelos
paramtricos em particular a distribuio do nmero de tumores promovidos por animal. Para a
escolha das distribuies utilizaram o teste
2
. Nesse trabalho considerado que os tempos de
deteco so independentes entre eles e so identicamente distribudos dentro de um grupo de
animais em tratamento, uma suposio que no realista devido variabilidade alta entre animais.
As estimativas dos parmetros foram obtidas pelo mtodo de mxima verossimilhana.
Dado que os animais podem morrer antes de todos os tumores induzidos chegarem a um tamanho
detectvel, a separao desses efeitos do tratamento pode ser difcil. Dunson & Dinse (2000), inte-
resados em distinguir estes efeitos em multiplicidade tumoral e taxa de crescimento dos tumores em
experimentos de quimiopreveno, desenvolveram uma metodologia bayesiana, via algoritmo Gibbs
sampling , para a estimativa dos parmetros. Os mtodos foram ilustrados atravs da aplicao de
dados de um experimento de quimiopreveno do cncer de mama.
Trabalhos de Kodell & Chen (2001) e Molefe et al. (2005) tambm foram baseados no trabalho
de Kokoska (1987), todos esses trabalhos dos autores mencionados tm em comum o estudo de
modelos paramtricos para a anlise dos dados. Foram consideradas as distribuies de Poisson e
binomial negativa para o nmero de tumores promovidos e as distribuies Gama e Weibull para os
tempos de deteco dos tumores. Cabe ressaltar que nesse tipo de experimentos comum encontrar
uma grande quantidade de zeros nos conjuntos de dados, pois existe uma grande quantidade de
animais que no apresentam tumores aps a induo e o tratamento quimiopreventivo, at o instante
de morte. Portanto uma das propostas deste trabalho considerar a presena excessiva de zeros,
que no foi abordado pelos esses autores.
1.1 Modelo destrutivo (Rodrigues et al.(2010))
O trabalho de Rodrigues et al. (2010) foi uma extenso da proposta de Yakovlev & Tsodikov
(1996), em que as clulas iniciadas ou contaminadas passam por um processo destrutivo, e apenas
parte delas sobreviveu a uma interveno. Portanto, o modelo destrutivo foi formulado para des-
crever matematicamente um processo carcinognico ao nvel de clulas. Existem fatores de risco
que interatuam nas clulas de um indivduo resultando uma quantidade de clulas "iniciadas" dis-
postas a virar clulas malignas (cncer). Estas clulas entram em um processo de destruio aps
um tratamento ou sistema de imunidade capaz de reparar as clulas. Como consequncia, tm-se
a formao ou no de leses pr-cancerosas no genoma das clulas que so clulas danicadas ou
malignas que sobreviveram ao tratamento contra o cncer.
Seja M = m uma varivel aleatria latente representando o nmero de clulas "iniciadas" e
X
j
, j = 1, . . . , m variveis aleatrias independentes, independentes de M, seguindo uma distribuio
de Bernoulli com probabilidade de sucesso p, indicando se a jsima clula iniciada est ou no
danicada (ou seja se foi ou no reparada). A varivel J representa o nmero total entre as M
clulas iniciadas que no foram eliminadas pelo sistema imunolgico ou tratamento, denida como:
J =
_
X
1
+X
2
+. . . +X
M
, para M > 0,
0 , para M = 0.
(1.1)
Devido destruio ou no reparo das clulas, temos que J M. O processo destrutivo (me-
canismo de destruio) caracterizado pela distribuio condicional de J = a dado M = m, dada
INTRODUO 4
por:
P[J = a|M = m] =
_
m
a
_
p
a
(1 p)
ma
, (1.2)
em que 0 < p < 1.
A distribuio do nmero total de clulas danicadas que no foram eliminadas pelo tratamento
pode ser calculada por:
P[J = a] =

m=0
P[J = a|M = m]P[M = m], (1.3)
em que P[M = m] a funo de probabilidade da varivel latente M.
A proposta deste trabalho ser utilizar o modelo proposto Kokoska (1987) e Freedman et al.
(1993), no contexto do modelo destrutivo formulado por Rodrigues et al. (2010), para experimentos
quimiopreventivos em animais.
A principal diferena entre a nossa proposta de trabalho e a do modelo destrutivo formulado
por Rodrigues et al. (2010) que a modelagem ser desenvolvida para variveis observveis e no
com variveis latentes. Como exemplo de aplicao ser utilizado o banco de dados fornecido por
Freedman et al. (1993) (ver Tabela 1.1), em que os dados so:
i ) O nmero de tumores detectados em cada animal,
ii ) o tempo de deteco do tumor gerado,
iii ) o tempo de morte do animal, varivel terminal.
INTRODUO 5
T
a
b
e
l
a
1
.
1
:
T
a
b
e
l
a
d
e
d
a
d
o
s
.
T
r
a
t
a
m
e
n
t
o
c
o
n
t
r
o
l
e
T
r
a
t
a
m
e
n
t
o
a
g
e
n
t
e
A
T
e
m
p
o
d
o
s
t
u
m
o
r
e
s
(
d
i
a
s
)
t
i
T
e
m
p
o
s
d
o
s
t
u
m
o
r
e
s
(
d
i
a
s
)
t
i
0
9
2
0
1
3
5
0
1
8
5
0
2
0
6
0
1
9
1
0
2
1
7
0
2
0
0
0
2
4
7
0
2
0
3
0
2
6
0
0
2
0
8
0
2
6
8
0
2
1
4
0
2
7
2
0
2
7
6
0
2
8
0
0
2
7
9
0
2
8
0
0
2
7
9
4
8
2
0
4
0
2
7
9
7
0
1
8
6
0
2
7
9
1
1
3
2
1
2
0
2
7
9
1
2
0
1
4
5
3
4
6
6
1
3
5
2
3
0
5
8
2
3
2
1
7
6
2
8
0
8
5
2
3
4
2
8
0
a
2
8
0
9
2
2
7
9
2
8
0
a
2
8
0
1
5
5
2
7
9
3
4
2
8
0
a
2
8
0
2
7
9
a
2
7
9
9
8
2
4
6
2
5
3
2
8
0
a
2
8
0
1
4
8
2
3
1
2
3
7
2
8
0
a
2
8
0
1
5
5
2
3
0
a
2
3
0
6
2
6
2
7
8
2
2
5
2
5
5
a
2
5
5
8
5
2
0
5
2
7
9
1
4
1
1
5
5
2
1
9
a
2
1
9
1
8
3
2
7
9
a
2
7
9
1
4
8
2
3
1
2
3
9
2
7
2
2
3
1
2
7
9
a
2
7
9
7
0
8
5
8
5
1
7
8
a
1
7
8
6
2
7
0
1
7
0
a
1
0
7
9
8
1
2
6
1
4
8
2
3
3
2
5
5
a
2
5
5
9
2
1
1
3
1
4
4
1
9
1
a
1
9
1
9
2
1
4
8
1
7
6
2
1
1
2
1
1
2
8
0
a
2
8
0
1
2
0
1
5
5
2
2
5
2
4
6
2
8
0
5
8
5
8
6
4
9
8
9
8
1
2
6
a
1
2
6
a
1
2
6
1
1
3
1
3
5
1
6
9
2
6
6
2
7
9
a
2
7
9
7
3
8
5
8
5
9
8
1
5
5
1
6
2
1
6
2
1
9
0
1
9
0
2
0
5
2
8
0
9
2
1
1
3
1
2
0
1
2
6
1
9
7
2
0
3
a
2
0
3
9
2
9
2
1
1
3
1
1
3
1
3
5
1
5
9
1
6
2
1
6
9
1
6
9
2
3
1
2
6
7
a
2
6
7
a
2
6
7
a
2
6
7
a
i
n
d
i
c
a
q
u
a
n
d
o
o
t
u
m
o
r
f
o
i
d
e
s
c
o
b
e
r
t
o
n
a
n
e
c
r
o
p
s
i
a
,
e
t
i

o
t
e
m
p
o
d
e
m
o
r
t
e
d
o
a
n
i
m
a
l
.
INTRODUO 6
1.2 Motivao
A principal motivao para a realizao deste trabalho a reformulao do modelo destrutivo
Rodrigues et al. (2010) para experimentos com animais censurados ou condicionados na varivel
terminal que o instante de morte durante o experimento. Usualmente, os dados deste tipo de
experimentos apresentam excesso de zeros e o modelo de Poisson no apropriado. Portanto, ser
introduzido os modelos alternativos, conhecidos como modelo de Poisson com zeros inacionados e
binomial negativo com zeros inacionados, para levar em considerao a disperso e o excesso de
zeros.
1.3 Propostas do trabalho
Os objetivos desta pesquisa so:
1. Formular o modelo proposto por Kokoska (1987) e Freedman et al. (1993) do ponto de vista
do modelo destrutivo (Rodrigues et al. (2010)).
2. Estudar o comportamento das distribuies Poisson, binomial negativa, Poisson com zeros
inacionados (PZI) e binomial negativa com zeros inacionados (BNZI) na anlise de experi-
mentos quimiopreventivos de cncer em animais.
3. Desenvolver um algoritmo computacional para simular dados de acordo com o modelo pro-
posto.
4. Avaliar, utilizando dados simulados, as propriedades dos estimadores de mxima verossimi-
lhana.
5. Aplicar a metodologia desenvolvida em um conjunto de dados reais.
Para atingir estes objetivos utilizaremos o mtodo de mxima verossimilhana via algoritmo EM.
1.4 Apresentao dos captulos
O Captulo 2 traz uma reviso de literatura, envolvendo alguns tpicos necessrios para o desen-
volvimento do nosso trabalho. O Captulo 3 apresenta o modelo destrutivo com varivel terminal e
alguns casos particulares. Tambm ser mostrado um estudo de simulao do modelo proposto, em
que o algoritmo computacional mostrou-se consistente. O Captulo 4 apresenta os resultados de uma
aplicao do modelo destrutivo com varivel terminal com dados reais. Finalmente, no Captulo 5
so discutidas as concluses e algumas perspectivas futuras.
Captulo 2
Reviso de literatura
Em muitas aplicaes envolvendo dados de contagens so utilizados modelos discretos que foram
largamente desenvolvidos na literatura. Os modelos mais utilizados so Poisson e binomial negativo
(ver Kokoska (1987) e Freedman et al. (1993)). Estes modelos no consideram a possibilidade de
excesso de zeros. Portanto, sero introduzidas as distribuies inacionadas, Poisson com zeros
inacionados e binomial negativa com zeros inacionados, que levam em considerao a disperso
e o excesso de zeros nos dados. Sero apresentados conceitos bsicos de inferncia clssica.
2.1 Distribuio de Poisson
O modelo de Poisson amplamente utilizado na modelagem de dados discretos e foi introduzido
pelo matemtico francs Simon Denis Poisson (17811840). Segundo Johnson (1969), uma varivel
aleatria M tem distribuio de Poisson com parmetro se sua funo de probabilidade dada
por:
P(M = m; ) =
e

m
m!
, m = 0, 1, 2, . . . , (2.1)
em que > 0. A mdia e a varincia da distribuio de Poisson so dadas por:
E(M) = V ar(M) = . (2.2)
A varivel aleatria M o nmero de ocorrncias de um evento em um intervalo de tempo ou
espao especico, em que o parmetro que corresponde ao nmero mdio de eventos ocorrendo
nesse intervalo. Um exemplo tpico de aplicao da distribuio de Poisson o nmero de chamadas
recebidas por uma central telefnica num intervalo de tempo xo. Entretanto, existem diversas
outras aplicaes envolvendo dados de contagem, como o controle de qualidade (contagem de defeitos
de um produto), demograa (nmero de lhos por casal), medicina (nmero de recorrncias de um
determinado tipo de doena), ecologia (nmero de ovos do mosquito), estudos sociais (nmero de
parceiros de indivduos homossexuais), etc.
A distribuio de Poisson apresenta as seguintes caractersticas:
1. O parmetro a mdia e varincia da distribuio.
2. Em dados reais, muitas variveis de contagens tm uma varincia maior do que a mdia, o
que chamado de superdisperso. Neste caso a distribuio de Poisson no recomendvel.
7
REVISO DE LITERATURA 8
3. Quando aumenta, a distribuio de Poisson aproxima-se de uma distribuio Normal.
2.2 Distribuio binomial negativa (BN)
A distribuio binomial negativa conhecida na literatura como distribuio de Pascal ou distri-
buio de Polya. Por exemplo, considere um experimento estatstico com dois resultados possveis,
sucesso ou fracasso, em que o sucesso ocorre com probabilidade e o fracasso com probabilidade
1 . Se o experimento repetido indenidamente e os ensaios so independentes, a varivel alea-
tria M indica o nmero de tentativas necessrias para obter N sucessos, sendo a ltima tentativa
um sucesso. A distribuio binomial negativa pode ser escrita de diversas maneiras dependendo
da parametrizao utilizada. Nesta seo a distribuio binomial negativa ser utilizada na verso
paramtrica de Nelder & Wedderburn (1972) dada por:
P(M = m; N, ) =
(N +m)
(N)m!

N
(1 )
m
. (2.3)
A mdia e a varincia so dadas pelas seguintes expresses:
E(M) = N(1 )/ = ,
V ar(M) = +
2
, (2.4)
em que = 1/N e N o parmetro de disperso, para N > 0, e 0 < < 1.
Observa-se que a varincia da distribuio binomial negativa tem um termo adicional
2
quando
comparado com a varincia da Poisson, que ser til para ter um melhor ajuste quando existe
superdisperso nos dados.
2.3 Nmero excessivo de zeros nos dados
Silva (2009) mostra que o nmero excessivo de zeros nos dados diculta a elaborao de uma
anlise estatstica para o problema, pois os modelos usuais no conseguem modelar a presena
excessiva de zeros. Por exemplo, em uma linha de produo em que se aplica controle de qualidade,
a contagem de defeitos de um produto apresenta-se cada vez menor, ou seja, h um grande nmero
de zeros, isto ocorre devido a melhoria da qualidade e controle dos processos de fabricao. Logo
os zeros correspondem a zeros verdadeiros ou chamados tambm de determinsticos. Na rea de
ecologia, os zeros podem ocorrer devido espcie estando presente ou ausente na rea amostrada
e que no foi observada pelo pesquisador, logo, os zeros so aleatrios (falsos). Portanto, em um
processo de contagem os zeros podem ser obtidos de forma determinstica ou aleatria. Na grande
maioria de situaes prticas, no possvel separar estes dois tipos de zeros.
Os zeros inacionados ocorrem de duas formas para cada tipo. O primeiro tipo de zero (deter-
minstico) surge de uma baixa frequncia de ocorrncia ou ser o resultado de um efeito que conduz
para locais que no tm nenhum indivduo presente. O segundo tipo de zero (aleatrio) causado
por: apesar de existir, ocupar o local, no estava presente na hora da pesquisa. ou acontece quando
a unidade de estudo ocupa o local e est presente na hora de amostrar; mas o pesquisador no o
encontra.(Silva (2009) apud Martin et al. (2005))
A Tabela 2.1 apresenta um resumo sobre os tipos de zeros e suas respectivas denies.
REVISO DE LITERATURA 9
Tabela 2.1: Tipos de zeros em dados.
Tipo de zero Descrio
Zero determinstico Baixa frequncia de ocorrncia.
Realmente no existe nenhum indivduo presente.
Zero aleatrio Apesar de existir e ocupar o local,
no estava presente na hora da pesquisa.
Acontece quando ocupa o local e est presente
na hora de amostrar, mas o pesquisador no o encontra.
Como exemplo, podemos supor que para os tumores cancergenos em animais, os zeros determi-
nsticos surgem devido baixa ocorrncia de tumores aps um tratamento eciente, ou os tumores
esto temporariamente ausentes e no surgiram durante o tempo do experimento. Tambm pode-
mos supor que se o tempo de perodo fosse grande a ausncia dos tumores constituiria um zero
aleatrio.
Em um conjunto de dados possvel ocorrer diferentes tipos de zeros: as informaes podem no
conter nenhum zero inacionado, ou ter zeros inacionados devido a zeros verdadeiros ou devido a
aleatrios; ou ainda, devido a excesso de ambos os casos, verdadeiros e aleatrios. Concluindo, existe
uma incerteza sobre a fonte dos zeros inacionados. A seguir apresentamos algumas sugestes:
1. Em um conjunto de dados, quando os zeros so determinsticos, recomendvel a utilizao
de uma media ponderada de duas distribuies, ou seja, usa uma distribuio degenerada no
ponto zero e uma distribuio discreta adequada aos no zeros.
2. Se os zeros aleatrios esto presentes nos dados, a modelagem tambm pode ser feita atravs
de misturas de modelos. Em muitas aplicaes as distribuies zero inacionadas so solues
possveis.
2.3.1 Distribuio inacionada de zeros (DIZ)
Muitos autores propuseram modelos diferentes, mas semelhantes para a anlise de dados com
zeros inacionados, baseando-se no uso de mistura de distribuies. Estes modelos so capazes
de incorporar o excesso de zeros nos dados. Os modelos inacionados de zeros tm sido usados
para modelagem de dados nas mais diversas reas, tais como Epidemiologia, Sociologia, Medicina,
Odontologia, Agricultura, Econometria dentre outras.
Lambert (1992), foi a pioneira no uso de modelos de regresso para contagens com distribuio
inacionada de zeros. A autora props uma mistura nita das distribuies Bernoulli e Poisson para
modelar o excesso de dados de contagem envolvendo defeitos de fabricao de placas de circuito
impresso. Essa metodologia, aplicada a dados de contagem, mostrou-se de grande utilidade devido
ao fato de ser possvel associar regressores que inuenciam no parmetro de mistura.
Um conjunto de dados, s vezes, apresenta variabilidade maior do que a esperada pelos modelos
probabilsticos padres. Esse fenmeno conhecido como superdisperso, podendo ocorrer devido a
REVISO DE LITERATURA 10
uma variabilidade da mdia, excessos de zeros, correlao entre indivduos e/ou omisso de variveis
no observadas. Exemplos interessantes sobre esse tipo de dados com zeros inacionados podem ser
encontrados em Lambert (1992), Gupta et al. (1996), Ridout et al. (1998), Bohning et al. (2000)
Kumara & Chin (2003), Borgatto (2004) entre outros. Rodrigues (2003) e Saito (2005) abordam o
tema do ponto de vista bayesiano.
As motivaes para usar os modelos com zeros inacionados so a simplicidade para indicar
alguma heterogeneidade no observada nos dados. A funo de probabilidade de uma varivel
discreta com zeros inacionados pode ser representada pela seguinte expresso (Saito (2005)):
P(M; , ) = (1 )I
{0}
(M) +P(M; ) M = 0, 1, 2, . . . , (2.5)
em que
I
{0}
(M = m) =
_
1 , m = 0
0 , m = 0
,
e 0 1 e P(M; ) uma distribuio de probabilidade discreta, com vetor de parmetros
que teoricamente se adequaria aos dados caso no houvesse a presena excessiva de zeros nos dados.
O parmetro a proporo de zeros aleatrios gerados pela distribuio P(M; ) e 1 a
proporo de zeros de forma determinstica. Na equao (2.5) apresenta uma mistura, da distribuio
degenerada no zero e a distribuio da funo de probabilidade P(M; ).
2.3.2 Distribuio de Poisson com zeros inacionados (PZI)
Seja M uma varivel aleatria representando o nmero de tumores promovidos no animal. A
distribuio de Poisson com zeros inacionados denida como
P(M = m; , ) = (1 )I
{0}
(m) +
e

m
m!
m = 0, 1, 2, . . . , (2.6)
em que
I
{0}
(m) =
_
1 , m = 0
0 , m = 0
,
0 1, > 0 e (1 ) a proporo de zeros no explicada pelo modelo de Poisson. A partir
da funo de probabilidade do modelo PZI temos que a mdia dada por
E(M) =

m=0
mP(M, , ) =

m=1
m
e

m
m!
,
= e

m=1
m

m
m!
= e

= . (2.7)
REVISO DE LITERATURA 11
Como,
E(M
2
) =

m=0
m
2
P(M, , ) =

m=1
m
2

m
m!
,
= e

m=1
m
2

m
m!
= e

( + 1),
= (
2
+) = ( + 1), (2.8)
em que 0 < < 1, a varincia da varivel M dada por:
V ar(M) = E(M
2
) (E(M))
2
= [(
2
+)] []
2
,
=
2
+
2

2
,
= [1 +(1 )]. (2.9)
Quando = 1, o modelo PZI corresponde ao modelo de Poisson com E(M) = V ar(M) = .
2.3.3 Distribuio binomial negativa com zeros inacionados (BNZI)
Seja M uma varivel aleatria latente (no observvel) representando o nmero de tumores
promovidos no animal. A distribuio binomial negativa com zeros inacionados denida como:
P(M = m; , N, ) = (1 )I
{0}
(m) +
(N +m)
(N)m!

N
(1 )
m
m = 0, 1, 2, . . . , (2.10)
em que
I
{0}
(m) =
_
1 , m = 0
0 , m = 0
,
0 1, 0 < < 1 e N > 0 o parmetro de disperso. A partir do modelo binomial negativo
com zeros inacionados temos que a mdia dada por:
E(M) =

m=0
mP(M; , N, ) =

N
(N)

m=1
m
(N +m)
m!
(1
N
),
=

N
(1 )
(N)

m1=0
(N + 1 +m1)
(m1)!
(1 )
m1
,
=

N
(1 )
(N)
(N + 1)

N+1
,
=
N(1 )

= . (2.11)
REVISO DE LITERATURA 12
Como,
E(M
2
) =

m=0
m
2
P(M; , N, ),
=

N
(1 )
(N)

m1=0
m
(N + 1 +m1)
(m1)!
(1 )
m1
,
=

N
(1 )
(N)
(N + 1)(N N + 1)

N+2
,
=
N(1 )

_
N(1 )

+
1

_
,
= (1 + +),
em que e so denidas em (2.4), a varincia da varivel M dada por:
V ar(M) = E(M
2
) (E(M))
2
,
= (1 + +)
2

2
,
= (1 +(1 ) +). (2.12)
Se = 1, o modelo BNZI corresponde ao modelo binomial negativo com E(M) = e V ar(M) =
+
2
.
2.4 Inferncia
2.4.1 Estimao de mxima verossimilhana
Pelo mtodo de mxima verossimilhana (Bolfarine & Sandoval (2001)), as estimativas dos pa-
rmetros sero obtidas a partir da maximizao da funo de verossimilhana.
Seja L(; D) a funo de verossimilhana, em que = (
1
,
2
, . . . ,
k
) o vetor de parmetros
do modelo e D os dados. O estimador de mxima verossimilhana de o valor

que maximiza
a funo de verossimilhana L(; D). O logaritmo da funo de verossimilhana de dada por:
l(; D) = log L(; D). (2.13)
O estimador de mxima verossimilhana pode ser encontrado seguindo as condies maximizao
de 1
a
e 2
a
ordem dadas por:
1. Condio de 1
a
ordem
l

(; D) =
l(; D)

= 0, (2.14)
sendo que a soluo da equao de verossimilhana pode ser obtida explicitamente ou, em
situaes mais complicadas, a soluo (estimativas) de (2.14),

= (

1
,

2
, . . . ,

k
), ser em
geral obtida por procedimentos numricos.
2. Condio de 2
a
ordem
REVISO DE LITERATURA 13
A condio de 2
a
ordem consiste em vericar se a matriz hessiana dada por:
H() =
_

2
l

2
1

2
l

2


2
l

2
l

2
l

2
2


2
l

k
.
.
.
.
.
.
.
.
.
.
.
.

2
l

2
l

2


2
l

2
k
_

_
=
_

_
h
11
h
12
h
1k
h
21
h
22
h
2k
.
.
.
.
.
.
.
.
.
.
.
.
h
k1
h
k2
h
kk
_

_
(2.15)
negativa denida. Uma matriz simtrica negativa denida se
|h
11
| < 0,

h
11
h
12
h
21
h
22

> 0, , (1)
n

h
11
h
1k
.
.
.
.
.
.
.
.
.
h
k1
h
kk

> 0,
em que |A| denota o determinante da matriz A.
2.4.2 Mtodos numricos
Mtodo de Newton-Raphson
Vamos a denotar por U() a funo escore, ou seja,
U() =
l(; D)

, (2.16)
com U(

) = 0. Expandindo U(

) = 0 em srie de Taylor em torno de um ponto
0
, obtemos:


=
0

U(
0
)
U

(
0
)
. (2.17)
De (2.17), obtemos o procedimento iterativo de Newton-Raphson dado por

K+1
=
K

U(
K
)
U

(
K
)
, (2.18)
em que
0
o valor inicial de um novo valor
1
obtido a partir de (2.18) e assim por diante,
at que o processo se estabiliza, ou seja, para um dado pequeno, |
K+1

K
| < . Nesse
caso, o ponto

em que o processo se estabiliza o estimador de mxima verossimilhana de
(vide Bolfarine & Sandoval (2001)).
Algoritmo EM
A maximizao da log-verossimilhana dos dados observados l(; D) pode ser obtida atravs
do algoritmo EM (vide Dempster et al. (1977)). um algoritmo iterativo, utilizado para
maximizar probabilidades complexas e aplicado em problemas de dados incompletos. Os dados
incompletos so denidos pela falta de dados, elementos desconhecidos, variveis latentes,
tipos de censura de observaes, e assim por diante. Seja D
a
os dados ampliados em que
l(; D
a
) o logaritmo da funo de mxima verossimilhana dos dados ampliados. A seguir
apresentamos os passos do algoritmo EM.
Seja
(0)
o valor inicial para = (
1
, . . . ,

), onde o nmero de parmetros a ser


estimado. A obteno da K-sima iterao o algoritmo formado pelos seguintes passos:
REVISO DE LITERATURA 14
1. Passo E. Primeiro calcula-se a esperana condicional do logaritmo da funo de mxima
verossimilhana para dados ampliados
Q(,
(K)
) = E

(K) [log L(; D


a
)|D]
2. Passo M. Maximizao de Q(,
(K)
) para obter o valor
(K+1)
, i.e,
Q(
(K+1)
,
(K)
) Q(,
(K)
)
As estimativas de mxima verossimilhana so ento obtidas com a convergncia do algo-
ritmo, segundo o critrio de parada estabelecido. Consideramos aqui como critrio a condio

(K+1)

(K)

< ,
para um > 0.
2.5 Teste de hipteses
Neste tipo de experimentos, geralmente so testadas diferentes substncias quimiopreventivas
por grupos de animais, gerando diferentes amostras independentes. A seguir formularemos pri-
meiramente um teste de hipteses que ser utilizado para comparar a ecincia das substncias
quimiopreventivas de cada tratamento (vide Kokoska (1988)).
Seja G 2 os tratamentos aplicados em diferentes grupos de animais, suponhamos que deseja-
mos testar as seguintes hipteses
_
H
0
: o vetor de parmetros de interesse, todos ou alguns, so iguais para todos os tratamentos;
H
a
: ao menos dois vetores de parmetros so diferentes.
(2.19)
Seja
i
,

i
, 1 i G as estimativas de mxima verossimilhana de cada grupo de animais com
diferentes tratamentos, em que se refere a estimativa do vetor de parmetros da distribuio do
nmero de tumores,

a estimativa do vetor de parmetros da distribuio do tempo de deteco
dos tumores e
c
,

c
as estimativas de mxima verossimilhana dos dados combinados.
A funo verossimilhana sob H
0
dada por L
H
0
= L(
c
,

c
). A funo verossimilhana sob H
a
dada por:
L
H
a
=
G

i=1
L(
i
,

i
). (2.20)
Teste da razo de verossimilhana (TRV)
O teste da razo de verossimilhana consiste em comparar os valores maximizados do logaritmo
da funo de verossimilhana sem restrio e sob a hiptese nula H
0
. O TRV denido pela
estatstica:
TRV =
2
= 2 log(r), em que r = L
H
0
/L
H
a
.
Se
2

2
k(G1)
(

), rejeita-se a hiptese nula a um nvel de signicncia

em que k(G1)
o nmero de graus de liberdade e k o nmero de parmetros sob a hiptese H
0
.
REVISO DE LITERATURA 15
Se o teste resulta signicativo, isto , a hiptese nula ser rejeitada ento tem-se aqueles trata-
mentos que fazem efeito no experimento.
2.6 Intervalos de conana
A ideia de estimao por intervalos construir um intervalo em torno da estimativa pontual tal
que tenha uma probabilidade conhecida de conter o verdadeiro valor do parmetro. Neste trabalho
utilizaremos as distribuies amostrais das estimativas dos parmetros desconhecidos baseado na
teoria assinttica. A seguir, introduzimos as ferramentas principais para o clculo de intervalos de
conana. Seja D a varivel que representa os dados observados com funo de densidade f(D; ),
onde = (
1
, . . . ,

). A matriz de informao esperada de Fisher do vetor paramtrico , atravs


de D, denida por:
I() = E
_

2
log f(; D)

_
. (2.21)
A denio acima uma medida de informao global, enquanto na prtica trabalha-se com uma
medida de informao local, chamada de matriz de informao observada de Fisher, denida como:
J() = H() =

2
log f(; D)

, (2.22)
onde H() uma matriz hessiana dada em (2.15). A inversa da matriz de informao observada
denida como:
J
1
() =
_

_
V ar(

1
) Cov(

1
,

2
) Cov(

1
,

)
Cov(

2
,

1
) V ar(

2
) Cov(

2
,

)
.
.
.
.
.
.
.
.
.
.
.
.
Cov(

1
) Cov(

2
) V ar(

)
_

_
, (2.23)
conhecida tambm como a matriz de varincia-covarincia. Usando este resultado podemos fazer in-
ferncia aproximada sobre cada parmetro estimado e assim os intervalos de conana aproximados
de 100(1

)% so obtidos fazendo, i = 1, . . . , :
IC(
i
; 100(1

)%) =

i
z

/2
_
V ar(

i
). (2.24)
no qual z

/2
o quantil da distribuio normal padro e

o nvel de conana.
2.7 Critrios de seleo do modelo
Os critrios de seleo so regras que permitem comparar modelos atravs de medidas escalares,
que medem a qualidade do ajuste do modelo. Neste trabalho sero utilizadas algumas medidas de
ajuste, tais como:
1. DEV
A deviance calculada atravs da expresso:
Dev = 2logL(

; D) (2.25)
REVISO DE LITERATURA 16
2. AIC
O critrio de informao de Akaike (1973) conhecido como AIC denido como:
AIC = 2 log L(

; D) + 2, (2.26)
em que o nmero de parmetros no modelo em questo.
3. BIC
O critrio de informao bayesiano BIC foi proposto por Schwarz (1978) e dado por:
BIC = 2 log L(

; D) +(log n), (2.27)
em que o nmero de parmetros e n o nmero de observaes, neste caso ser o nmero
de animais.
Os trs critrios que foram apresentados, apesar de ser diferentemente denidos, utilizam o
mesmo critrio estatstico, o valor mximo da funo de verossimilhana como medida do ajusta-
mento, entretanto, denem valores crticos diferentes. Esta a diferena fundamental entre esses
critrios. Portanto, para modelos em avaliao com o mesmo conjunto de dados, ser selecionado o
melhor modelo, aquele que possui o menor valor de critrio de seleo.
Captulo 3
Modelo destrutivo com varivel terminal
Neste captulo apresentamos a modelagem matemtica dos experimentos estudados e utilizados
para avaliar o efeito de um determinado tratamento sobre a taxa de incidncia de tumores. Para
caracterizar os experimentos quimiopreventivos ser realizado uma reformulao do modelo proposto
por Kokoska (1987) e Freedman et al. (1993) no contexto do modelo de Rodrigues et al. (2010) que
envolve dois estgios.
3.1 Formulao do modelo
O modelo destrutivo com varivel terminal caracterizado pelos seguintes estgios:
1. Estgio de iniciao
Neste estgio de iniciao o animal foi exposto aos agentes cancergenos, para produzir tumores
malignos, isto , clulas normais sofrem o efeito dos agentes cancergenos ou carcingenos que
provocam mutao na estrutura gentica das clulas fazendo elas se transformarem em clulas
geneticamente alteradas, clulas "iniciadas". Estas clulas encontram-se "preparadas", ou seja,
"iniciadas", para transformar-se em clulas malignas gerando os tumores. Neste trabalho
supomos que o desenvolvimento dos tumores de forma independente um de outro.
Seja M
i
a varivel aleatria latente (no observvel) que representa o nmero de tumores
promovidos gerados pelas clulas malignas, no i-simo animal.
2. Estgio de destruio
No estgio de destruio o animal foi submetido ao tratamento quimiopreventivo, podendo
ou no eliminar os tumores promovidos. Consequentemente, os tumores que sobreviveram ao
tratamento podem ser detectados mediante a tcnica de apalpao feita no corpo do animal.
Esta tcnica consiste na apalpao contnua para identicar a existncia ou no de tumores
com tamanho detectvel. A observao desses tumores possvel somente durante a vida do
animal sujeito a um tempo pr-estabelecido para o experimento.
Espera-se que o tratamento quimiopreventivo diminua o nmero de tumores malignos gerados
pelas clulas malignas e/ou reduza a taxa de crescimento do tumor. Neste trabalho estamos
interessados nos tumores que sobreviveram ao tratamento ou que no foram destrudos e que
aps o tratamento foram detectados.
17
MODELO DESTRUTIVO COM VARIVEL TERMINAL 18
Seja d a durao do experimento quimiopreventivo e t

i
, i = 1, 2, . . . , n, uma varivel alea-
tria, observvel que chamaremos de varivel terminal, referida ao instante de morte devido
aos tumores do i-simo animal. Consideremos tambm X
ij
como uma varivel aleatria (in-
dependente de M
i
), com distribuio de Bernoulli que indica se foi ou no detectado o j-simo
tumor promovido no i-simo animal antes do tempo terminal t

i
, isto ,
X
ij
=
_
1 , tumor detectado no i-simo animal antes do tempo t

i
;
0 , caso contrario,
(3.1)
com probabilidade de sucesso F(t

i
; ), em que o parmetro de interesse. fundamental
enfatizar que a identicao do tumor est condicionada ao instante de morte do animal.
Os tempos em que foram detectados os tumores sero representados pelas variveis T
(ij)
, i =
1, 2, . . . , n, j = 1, . . . , M

i
que so variveis aleatrias observveis, independentes das vari-
veis M
i
, identicamente distribudas e estatisticamente ordenadas geradas pela distribuio de
probabilidade acumulada F(t; ).
Seja M

i
uma varivel aleatria discreta que representa o nmero de tumores detectados entre
os M
i
tumores promovidos, que no foram destrudos pelo tratamento no i-simo animal
condicionado ou censurado no instante de morte t

i
, i = 1, 2, . . . , n. Portanto a varivel M

i
pode ser expressada como:
M

i
=
_

_
m
i

j=1
X
ij
, para M
i
> 0,
0 , para M
i
= 0.
(3.2)
Dado M
i
= m
i
e t

i
, i = 1, 2, . . . , n, a distribuio de probabilidade da varivel aleatria
discreta, M

i
, uma distribuio Binomial com parmetros m
i
e F(t

i
; ), neste caso conhe-
cida como mecanismo de destruio dos tumores, condicionado ao instante de morte t

i
(vide
Rodrigues et al. (2010)). importante enfatizar que a probabilidade de encontrar um tumor
antes do instante t

i
depende (probabilidade de sucesso) do tempo de vida do animal, diferen-
temente do modelo que foi formulado por Rodrigues et al. (2010), em que a probabilidade de
sucesso constante.
3.1.1 Observaes
1. Se t

i
< d, i = 1, 2, . . . , n, temos que o animal morreu antes de nalizar o experimento, isto ,
o animal foi censurado aleatoriamente no instante t

i
.
2. Se t

i
= d, i = 1, 2, . . . , n, temos que o animal sobreviveu at nalizar o experimento, ou
seja, foi sacricado para permitir a conrmao histolgica dos tumores observados aps o
tratamento quimiopreventivo.
3. As variveis destrutivas M

i
so observadas enquanto que no modelo destrutivo (Rodrigues et al.
(2010)) so latentes.
4. Se M

i
< M
i
, temos que houve destruio dos tumores pelo agente quimiopreventivo.
MODELO DESTRUTIVO COM VARIVEL TERMINAL 19
5. O experimento em estudo, no ser considerada a possibilidade de reparao das clulas
iniciadas que so feitas pelo mecanismo de reparo do animal.
6. Se M

i
= M
i
, temos que no houve destruio, isto , o tratamento quimiopreventivo no fez
nenhum efeito no animal.
3.1.2 Distribuio de probabilidades com varivel terminal
A distribuio de probabilidades da varivel destrutiva com varivel terminal, t

i
, para o i-simo
animal pode ser obtida a partir da expresso (3.2) e dada por:
P[M

i
= m

i
|t

i
; , ] =

m
i
=m

i
P[M

i
= m

i
|M
i
= m
i
; ]P[M
i
= m
i
; ],
=

m
i
=m

i
Modelo destrutivo com varivel terminal
..
_
m
i
m

i
_
F(t

i
; )
m

i
(1 F(t

i
; ))
m
i
m

i
P[M
i
= m
i
; ],
(3.3)
em que P[M
i
= m
i
; ] a distribuio de probabilidade do nmero de tumores promovidos com
parmetro . Portanto, a varivel M
i
atualizada pelo mecanismo de destruio anteriormente
denido. A esperana e varincia da varivel destrutiva, M

i
, dado a varivel terminal, t

i
, so dadas
por (ver Apndice A.2):
E[M

i
|t

i
] = E[M
i
]F(t

i
; ), (3.4)
V ar[M

i
|t

i
] = (V ar[M
i
] E[M
i
])F(t

i
; )
2
+E[M
i
]F(t

i
; ). (3.5)
3.1.3 Funo de verossimilhana
A funo de verossimilhana proposta por Freedman et al. (1993), para o i-simo animal ser
reformulada na seguinte forma.
L
i
(, ) = f(t
(i1)
, . . . , t
(im

i
)
|t

i
; )P[M

i
= m

i
|t

i
; , ], (3.6)
em que t
(ij)
o tempo de deteco do j-simo tumor no i-simo animal, m

i
o nmero de tumores
detectados no i-simo animal e t

i
o tempo de morte (varivel terminal) do i-simo animal. A funo
densidade de probabilidade conjunta das observaes ordenadas t
(ij)
, dada a varivel terminal, t

i
,
para i = 1, 2, . . . , n, j = 1, . . . , m

i
, dada por (Casella & Berger (2001)):
f(t
(i1)
, . . . , t
(im

i
)
|t

i
; ) =
_

_
m

i
!f(t
i1
|t

i
; ) f(t
im

i
|t

i
; ) , 0 < t
i1
< < t
i,m

i
< t

i
< ;
0 , caso contrrio.
(3.7)
Logo, a distribuio conjunta para o i-simo animal dada por:
L
i
(, ) = m

i
!
m

j=1
f(t
ij
|t

i
; )P[M

i
= m

i
|t

i
; , ], (3.8)
MODELO DESTRUTIVO COM VARIVEL TERMINAL 20
em que f(t
ij
|t

i
; ) =
f(t
ij
;)
F(t

i
;)
a distribuio truncada no instante t

i
e (, ) so os parmetros
envolvidos no modelo destrutivo com varivel terminal. O parmetro identica a distribuio de
probabilidade do tempo de deteco do tumor e identica a distribuio de probabilidade da
varivel M.
Portanto, a funo de verossimilhana do modelo destrutivo com varivel terminal, t

i
, i =
1, 2, . . . , n, para n animais dada por:
L(, ) =
n

i=1
L
i
(, ) =
n

i=1
_
_
_
m

i
!
m

j=1
f(t
ij
; )
F(t

i
; )
P[M

i
= m

i
|t

i
; , ]
_
_
_
. (3.9)
Como usual encontrar excesso de zeros nos dados dos experimentos com animais, sero consi-
derados os modelos Poisson, binomial negativo, Poisson com zeros inacionados e binomial negativo
com zeros inacionados. A seguir apresentamos a Tabela 3.1 das distribuies a serem utilizadas
neste trabalho.
Tabela 3.1: Modelos Paramtricos.
Distribuio de prob. de M P(M = m; ) Parmetro
Poisson() e

m
/m! =
NB(N, )
_
N+m1
m
_

N
(1 )
m
= (N, )
PZI(, ) (1 )I
{0}
(m) +
e

m
m!
= (, )
BNZI(, , ) (1 )I
{0}
(m) +
(N+m)
(N)m!

N
(1 )
m
= (, , )
I
{0}
(m) =
_
1 , m = 0;
0 , m = 0,
Distribuio de prob. de T
ij
f(t; ) Parmetro
Gama(, )
t
1

()
e
t/
= (, )
MODELO DESTRUTIVO COM VARIVEL TERMINAL 21
3.2 Casos especiais do modelo destrutivo com varivel terminal
Nesta seo, apresentamos alguns casos especiais do modelo destrutivo com varivel terminal,
t

i
, proposto na seo anterior.
3.2.1 Modelo destrutivo de Poisson com varivel terminal
A distribuio de probabilidade da varivel destrutiva Poisson com varivel terminal pode ser
obtida da expresso (3.3), dada por:
P[M

i
= m

i
|t

i
; , ] =

m
i
=m

i
P[M

i
= m

i
|M
i
= m
i
; ]P[M
i
= m
i
; ],
=

m
i
=m

i
_
m
i
m

i
_
F(t

i
; )
m

i
(1 F(t

i
; ))
m
i
m

i
e

m
i
m
i
!
,
=

m
i
=m

i
m
i
!
m

i
(m
i
m

i
)!
F(t

i
; )
m

i
(1 F(t

i
; ))
m
i
m

i
e

m
i
m

i
+m

i
m
i
!
,
=
[F(t

i
; )]
m

i
m

i
!
e

m
i
=m

i
[(1 F(t

i
; ))]
m
i
m

i
(m
i
m

i
)!
,
=
[F(t

i
; )]
m

i
m

i
!
e

e
(1F(t

i
;))
,
= e
(F(t

i
;))
[F(t

i
; )]
m

i
m

i
!
, (3.10)
em que > 0 e > 0. Portanto, a varivel destrutiva M

i
, dada a varivel terminal, t

i
, tem uma
distribuio de Poisson com parmetro F(t

i
; ), i = 1, . . . , n. Assim
E[M

i
|t

i
] = F(t

i
; ) = V ar[M

i
|t

i
]. (3.11)
De (3.9) a funo verossimilhana com varivel terminal, t

i
, i = 1, . . . , n, para o modelo destrutivo
de Poisson, em que F(t; ) a funo distribuio acumulada de uma distribuio Gama com
parmetro = (, ), dada por:
L(, , ) =
n

i=1
_
_
_
m

i
!
m

j=1
f(t
ij
; , )
F(t

i
; , )
e
F(t

i
;,)
(F(t

i
; , ))
m

i
m

i
!
_
_
_
,
=
n

i=1
m

j=1
f(t
ij
; , )e

i=1
F(t

i
; , )

i=1
m

i
.
MODELO DESTRUTIVO COM VARIVEL TERMINAL 22
O logaritmo da funo de verossimilhana associada aos animais no necessariamente sacricados,
que so todos os animais do conjunto de dados, dada por:
log L(, , ) =
_
_

i=1
F(t

i
; , ) +
n

i=1
m

i
log + ( 1)
n

i=1
m

j=1
log(t
ij
)
1
n

i=1
m

j=1
t
ij
_
_

i=1
m

i
log +
n

i=1
m

i
log ()
_
,
em que s
1
=
n

i=1
m

i
, s
2
=
n

i=1
m

j=1
log t
ij
e s
3
=
n

i=1
m

j=1
t
ij
.
Aps algumas simplicaes do logaritmo da funo de verossimilhana obtemos:
log[L(, , )] =
n

i=1
F(t

i
; , ) +s
1
(log log log ()) +s
2
( 1)
s
3

. (3.12)
A seguir apresentamos as seguintes equaes para a obteno dos estimadores de mxima verossi-
milhana

, e

(obtidos no Apndice A.3):

= s
1
/
n

i=1
F(t

i
; ,

), (3.13)
( ) log( ) + log(s
3
/s
1
) s
2
/s
1
= 0, (3.14)

= s
3

1
/s
1
. (3.15)
3.2.2 Modelo destrutivo binomial negativo com varivel terminal
Supondo a varivel M
i
com distribuio binomial negativa, apresentamos a distribuio de
probabilidade da varivel destrutiva, M

i
, com varivel terminal, t

i
, para o modelo binomial negativo
dada por (Apndice A.4):
P[M

i
= m

i
|t

i
; N, , ] =

m
i
=m

i
_
m
i
m

i
_
F(t

i
; )
m

i
(1 F(t

i
; ))
m
i
m

i
(N +m
i
)
(N)m
i
!

N
(1 )
m
i
,
=
(N +m

i
)
(N)m

i
!
_

+ (1 )F(t

i
; )
_
N
_
1

+ (1 )F(t

i
; )
_
m

i
,
(3.16)
onde 0 < < 1, N = 1, 2, . . . e > 0.
Portanto, a distribuio de probabilidade da varivel destrutiva M

i
uma atualizao da dis-
tribuio binomial negativa com varivel terminal, t

i
, i = 1, 2, . . . , n, dada por:
M

i
|t

i
Binomial Neg.
_
N,

+ (1 )F(t

i
; )
_
.
MODELO DESTRUTIVO COM VARIVEL TERMINAL 23
A esperana e varincia podem ser obtidas de (2.4), isto ,
E[M

i
|t

i
] =
N(1 )F(t

i
; )

, (3.17)
V ar[M

i
|t

i
] = N(1 )F(t

i
; )
+ (1 )F(t

i
; )

2
. (3.18)
Para simplicar os algoritmos computacionais a serem desenvolvidos e evitar futuros problemas de
convergncia, vamos introduzir as seguintes reparametrizaes: = 1/(1 +) e N = 1/, em que
a mdia da distribuio binomial negativa. A funo de verossimilhana com varivel terminal
t

i
, i = 1, . . . , n, para o modelo destrutivo binomial negativo, em que F(t; ) uma distribuio
gama com parmetro = (, ), dada por:
L(, , , ) =
n

i=1
_
_
_
m

i
!
m

j=1
f(t
ij
; , )
F(t

i
; , )
(1/ +m

i
)
(1/)m

i
!
_
1
1 +F(t

i
; , )
_1

_
F(t

i
; , )
1 +F(t

i
; , )
_
m

i
_
_
_
.
(3.19)
Fazendo as devidas simplicaes em (3.19), temos que o logaritmo da funo de verossimilhana
dado por:
log L(, , , ) =
n

i=1
log (1/ +m

i
)
n

i=1
[(1/ +m

i
) log(1 +F(t

i
; , ))] s
3
/
+s
2
( 1) +s
1
(log() log log ()) nlog (1/),
sendo s
1
=
n

i=1
m

i
, s
2
=
n

i=1
m

j=1
log(t
ij
) e s
3
=
n

i=1
m

j=1
(t
ij
).
As condies de 1
a
e 2
a
ordem so apresentadas no Apndice A.4.1.
3.2.3 Modelo destrutivo Poisson com zeros inacionados e varivel terminal
Supondo a varivel M
i
com distribuio de Poisson com zeros inacionados, a distribuio de
probabilidade da varivel destrutiva, M

i
, com varivel terminal, t

i
, i = 1, . . . , n, para o modelo
Poisson com zeros inacionados dada por (ver Apndice A.5):
P[M

i
= m

i
|t

i
; , , ] = (1 )I
{0}
(m

i
) +
e
F(t

i
;)
(F(t

i
; ))
m

i
m

i
!
, (3.20)
tal que
I
{0}
(m

i
) =
_
1 , m

i
= 0;
0 , m

i
1.
Portanto, a varivel destrutiva, M

i
, dado t

i
, tem uma distribuio de Poisson com zeros inacio-
nados, com parmetros 0 < 1 e F(t

i
; ) para > 0 e > 0. A mdia e a varincia so obtidas
MODELO DESTRUTIVO COM VARIVEL TERMINAL 24
de (2.7) e (2.9) respectivamente. Logo temos,
E[M

i
|t

i
] = F(t

i
; ) (3.21)
V ar[M

i
|t

i
] = F(t

i
; )[1 +F(t

i
; )(1 )] (3.22)
Supondo que F(t; ) uma distribuio gama com parmetro = (, ), a funo de verossimilhana
baseada em dados ampliados para o i-simo animal com varivel terminal, t

i
, i = 1, . . . , n dada
por:
L
i
(, , , |t

i
) = m

i
!
m

j=1
f(t
ij
; , )
F(t

i
; , )
_
(1 )I
{0}
(m

i
) +
e
F(t

i
;,)
(F(t

i
; , ))
m

i
m

i
!
_
, (3.23)
em que m

i
e t

i
o nmero de tumores observados e o tempo de vida do i-simo animal para
j = 1, . . . , m

i
e i = 1, . . . , n, respectivamente. Logo, para os n animais a funo de verossimilhana
expressa como:
L(, , , |t

i
) =
n
0

i=1
_
1 +e
F(t

i
;,)
_

i:M

i
/ A
_
_
_
m

i
!
m

j=1
f(t
ij;,
)
F(t

i
; , )
e
F(t

i
;,)
(F(t

i
; , ))
m

i
m

i
!
_
_
_
,
=
n
0

i=1
[1 +e
F(t

i
;,)
]
nn
0

i:M

i
/ A
L
i
(, , ), (3.24)
em que A = {M

i
: M

i
= 0} e n
0
o nmero de elementos do conjunto A. Quando = 1, a funo de
verossimilhana em (3.24) reduz-se funo de verossimilhana correspondente ao modelo destrutivo
de Poisson. Os elementos do conjunto A so gerados de duas formas diferentes: alguns elementos
so gerados pela distribuio degenerada em zero (forma determinstica) e outros pela distribuio
de Poisson (forma aleatria). Como o modelo PZI uma mistura de duas distribuies, a funo de
verossimilhana em (3.24) ser simplicada utilizando o procedimento baseado em dados ampliados
introduzido por Tanner (1996). Neste caso, vamos introduzir a seguinte varivel latente:
Z
i
=
_
1, com probabilidade
i
;
0, com probabilidade 1
i
,
(3.25)
no qual

i
=
1
1 +e
F(t

i
;,)
i = 1, . . . , n
0
,
a probabilidade de o zero ser determinstico. A funo de verossimilhana baseada nos dados
ampliados D
a
= {D, Z
1
, . . . , Z
n
0
}, em que D = {M

, T, t

i
}, dada por (Apndice A.5.1):
L(, , , ; D
a
) = L(, , , )
n
0

i=1
_
(
i
)
Z
i
(1
i
)
1Z
i

, (3.26)
=
nZ
(1 )
Z
. .
zeros inacionados
exp {
n
0

i=1
[(1 Z
i
)F(t

i
; , )]}

i:M

i
/ A
L
i
(, , )
. .
dados do modelo original
,
(3.27)
MODELO DESTRUTIVO COM VARIVEL TERMINAL 25
em que Z =
n
0

i=1
Z
i
. O logaritmo da funo de verossimilhana ampliada em (3.27) dado por:
log L(, , , ; D
a
) = (n Z) log +Z log(1 )
n
0

i=1
(1 Z
i
)F(t

i
; , ) +

i:M

i
/ A
log L
i
(, , ),
= (n
n
0

i=1
Z
i
) log + log(1 )
n
0

i=1
Z
i
+
n
0

i=1
Z
i
F(t

i
; , )
n
0

i=1
F(t

i
; , ),
+[log log log ()]s
1
+ ( 1)s
2

s
3

i:M

i
/ A
F(t

i
; , ),
= (n
n
0

i=1
Z
i
) log + log(1 )
n
0

i=1
Z
i
+
n
0

i=1
Z
i
F(t

i
; , )
n

i=1
F(t

i
; , )
+(log log log ())s
1
+ ( 1)s
2
s
3
/,
(3.28)
em que s
1
=

i:M

i
/ A
m

i
, s
2
=

i:M

i
/ A
m

j=1
log(t
ij
) e s
3
=

i:M

i
/ A
m

j=1
t
ij
.
Devido presena da varivel aleatria latente Z
i
, os estimadores de mxima verosimilhana
sero obtidos atravs da maximizao de (3.28) utilizando o algoritmo EM (vide Dempster et al.
(1977)) com os seguintes passos:
Passo E: A esperana condicional do logaritmo da funo de verossimilhana ampliada
dada por:
E[log L(, , , ; D
a
)|D] = (n
n
0

i=1
E[Z
i
|D
a
]) log + log(1 )
n
0

i=1
E[Z
i
|D
a
]
+
n
0

i=1
E[Z
i
|D
a
]F(t

i
; , )
n

i=1
F(t

i
; , )
+(log log log ())s
1
+ ( 1)s
2
s
3
/,
no qual
E[Z
i
|D
a
] = 0 (1
i
) + 1
i
,
=
i
,
=
1
1 +e
F(t

i
;,)
.
Passo M: Maximizao da esperana.
Q(, , , |
(K)
,
(K)
,
(K)
,
(K)
) = E[log L(
(K)
,
(K)
,
(K)
,
(K)
; D
a
)|D], (3.29)
logo a esperana na K-sima iterao dada por:
MODELO DESTRUTIVO COM VARIVEL TERMINAL 26
Q(, , , |
(K)
,
(K)
,
(K)
,
(K)
) = (n
n
0

i=1

(K)
i
) log + log(1 )
n
0

i=1

(K)
i
+
n
0

i=1

(K)
i
F(t

i
; , )
n

i=1
F(t

i
; , )
+(log log log ())s
1
+ ( 1)s
2
s
3
/.
(3.30)
As derivadas em relao aos parmetros em (3.30), so apresentadas:

E[log L(
(K)
|D
a
)] =
n
n
0

i=1

(K)
i


n
0

i=1

(K)
i
1
= 0, (3.31)

E[log L(
(K)
|D
a
)] =
n
0

i=1

(K)
i
F(t

i
; , )
n

i=1
F(t

i
; , ) +
s
1

= 0, (3.32)

E[log L(
(K)
|D
a
)] =
n
0

i=1

(K)
i
F(t

i
; , )
n

i=1

F(t

i
; , ) (log() + ())s
1
+s
2
= 0,
(3.33)

E[log L(
(K)
|D
a
)] =
n
0

i=1

(K)
i
F(t

i
; , )
n

i=1

F(t

i
; , ) s
1
/ +s
3
/
2
= 0, (3.34)
em que ( ) =

ln ( ) a funo digama. A seguir apresentamos um procedimento para resolver


o sistema de equaes em (3.31):(3.34).
De (3.31) temos que:
(1 )(n
n
0

i=1

(K)
i
)
n
0

i=1

(K)
i
= 0,
(n
n
0

i=1

(K)
i
) (n
n
0

i=1

(K)
i
+
n
0

i=1

(K)
i
) = 0,
= 1
n
0

i=1

(K)
i
n
.
De (3.32) temos que:
s
1

=
n
0

i=1

(K)
i
F(t

i
; , )
n

i=1
F(t

i
; , ),

= s
1
/(
n

i=1
F(t

i
; , )
n
0

i=1

(K)
i
F(t

i
; , )).
MODELO DESTRUTIVO COM VARIVEL TERMINAL 27
Derivando (3.32) em relao de e obtemos o seguinte:
n
0

i=1

(K)
i
F(t

i
; , )
n

i=1

F(t

i
; , ) = 0,
n
0

i=1

(K)
i
F(t

i
; , )
n

i=1

F(t

i
; , ) = 0.
Logo substituindo as expresses anteriores em (3.33) e (3.34), respectivamente, obtemos:
(log + ())s
1
+s
2
= 0, (3.35)

s
1
+
s
3

2
= 0. (3.36)
Resolvendo o sistema de equaes (3.35) e (3.36), obtemos a seguinte expresso:
(log(s
3
/s
1
) log + ())s
1
+s
2
= 0. (3.37)
Consequentemente, as estimativas de mxima verossimilhana so solues das seguintes equaes:

K+1
= s
1
/(
n

i=1
F(t

i
; , )
n
0

i=1

(K)
i
F(t

i
; , )), (3.38)

K+1
= 1
n
0

i=1

(K)
i
/n, (3.39)
( ) log + log(s
3
/s
1
) s
2
/s
1
= 0, (3.40)

=
1
s
3
/s
1
. (3.41)
As estimativas dos parmetros foram obtidas utilizando rotinas de maximizao do pacote R. As
condies de 1
a
e 2
a
ordenes foram vericadas computacionalmente.
3.2.4 Modelo destrutivo binomial negativo com zeros inacionados e varivel
terminal
Supondo a varivel M
i
com distribuio binomial negativa com zeros inacionados, apresentamos
a distribuio de probabilidade da varivel destrutiva, M

i
, com varivel terminal, t

i
, i = 1, . . . , n
para o modelo binomial negativo com zeros inacionados dada por (ver Apndice A.6):
P[M

i
= m

i
|t

i
; , , , ] = (1 )I
{0}
(m

i
) +
(
1

+m

i
)
(
1

)m

i
!
_
1
1 +F(t

i
; )
_1

_
F(t

i
; )
1 +F(t

i
; )
_
m

i
, (3.42)
em que
I
{0}
(m

i
) =
_
1 , m

i
= 0;
0 , m

i
1.
Portanto, a varivel destrutiva, M

i
, dado t

i
, tem uma distribuio binomial negativa com zeros
MODELO DESTRUTIVO COM VARIVEL TERMINAL 28
inacionados com parmetros 0 < 1, > 0 e F(t

i
; ) para > 0 e > 0. A mdia e a
varincia so obtidas de (2.11) e (2.12) respectivamente. Logo temos,
E[M

i
|t

i
] = F(t

i
; ), (3.43)
V ar[M

i
|t

i
] = F(t

i
; )[F(t

i
; )(1 ) + 1 +F(t

i
; )]. (3.44)
Supondo que F(t

i
; ) uma distribuio gama com parmetro = (, ), a funo de ve-
rossimilhana baseada em dados ampliados sob o modelo destrutivo binomial negativo com zeros
inacionados e varivel terminal, t

i
, dada por (ver Apndice A.6.1):
L(, , , , ) =
n
0

i=1
_
1 +
_
1
1 +F(t

i
; )
_1

_

nn
0

i:M

i
/ A
L
i
(, , , ), (3.45)
onde A = {M

i
: M

i
= 0} e n
0
o nmero de elementos do conjunto A. Para = 1, a funo de
verossimilhana em (3.45) reduz-se funo de verossimilhana correspondente ao modelo destrutivo
binomial negativo com varivel terminal dada em (3.19). O modelo destrutivo binomial negativo com
zeros inacionados e varivel terminal, tambm uma mistura de duas distribuies: distribuio
degenerada em zero e a distribuio binomial negativa. O procedimento similar, como apresentado
na Seo (3.2.3). A funo de verossimilhana em (3.45) ser simplicada, utilizando o procedimento
baseado em dados ampliados introduzido por Tanner (1996), com a seguinte varivel latente.
Y
i
=
_
1 , com probabilidade
i
;
0 , com probabilidade 1
i
,
(3.46)
no qual

i
=
1
1 +[1 +F(t

i
; )]

i = 1, . . . , n
0
,
a probabilidade do zero ser determinstico para o modelo destrutivo BNZI com varivel terminal.
A funo de verossimilhana baseada nos dados ampliados U
a
= {D, Y
1
, . . . , Y
n
0
}, em que D =
{M

, T, t

i
}, dada por (ver Apndice A.6.1):
L(, , , , ; U
a
) = L(, , , , )
n
0

i=1
_
(
i
)
Y
i
(1
i
)
1Y
i

,
=
nY
(1 )
Y
. .
zeros inacionados
n
0

i=1
(1 +F(t

i
; ))
Y
i
1

i:M

i
/ A
L
i
(, , , )
. .
dados do modelo original
,
(3.47)
onde Y =
n
0

i=1
Y
i
. O logaritmo da funo de verossimilhana ampliada em (3.47) :
l(, ; U
a
) = log L(, , , , ; U
a
)
MODELO DESTRUTIVO COM VARIVEL TERMINAL 29
em que = (, , ) e = (, ), temos que:
l(, ; U
a
) = (n Y ) log +Y log(1 ) +
n
0

i=1
(Y
i
1)

log(1 +F(t

i
; , )) +

i:M

i
/ A
log L
i
(, , , ),
= (n
n
0

i=1
Y
i
) log +Y log(1 )
n
0

i=1
(Y
i
1)

log(1 +F(t

i
; , ))
+

i:M

i
/ A
log (1/ +m

i
)

i:M

i
/ A
[(
1

+m

i
) log(1 +F(t

i
; , ))] s
3
/
+s
2
( 1) +s
1
(log() log log ()) (n n
0
) log (1/),
onde s
1
=

i:M

i
/ A
m

i
, s
2
=

i:M

i
/ A
m

j=1
log(t
ij
) e s
3
=

i:M

i
/ A
m

j=1
t
ij
.
Devido presena da varivel aleatria latente Y
i
os estimadores de mxima verosimilhana
sero obtidos atravs da maximizao de (3.48) utilizando o algoritmo EM (ver Dempster et al.
(1977)) com os seguintes passos:
Passo E: A esperana condicional do logaritmo da funo de verossimilhana ampliada
dada por:
E[l(, ; U
a
)|D] = (n
n
0

i=1
E[Y
i
|U
a
]) log + log(1 )
n
0

i=1
E[Y
i
|U
a
]
+
n
0

i=1
(E[Y
i
|U
a
] 1) log(1 +F(t

i
; , ))/ +

i:M

i
/ A
log (
1

+m

i
)

i:M

i
/ A
[(
1

+m

i
) log(1 +F(t

i
; , ))] s
3
/ +s
2
( 1)
+s
1
(log() log log ()) (n n
0
) log (1/),
onde
E[Y
i
|U
a
] = 0 (1
i
) + 1
i
,
=
i
,
=
1
1 +[1 +F(t

i
; )]

.
Passo M: Maximizao da esperana.
Q(, , , , |
(K)
,
(K)
,
(K)
,
(K)
,
(K)
) = E[l(
(K)
,
(K)
,
(K)
,
(K)
,
(K)
; U
a
)|D], (3.48)
logo a esperana na K-sima iterao dada por:
MODELO DESTRUTIVO COM VARIVEL TERMINAL 30
Q(, , , , |
(K)
,
(K)
,
(K)
,
(K)
,
(K)
) = (n
n
0

i=1

(K)
i
) log + log(1 )
n
0

i=1

(K)
i
+
n
0

i=1
(
(K)
i
1) log(1 +F(t

i
; , ))/ +

i:M

i
/ A
log (
1

+m

i
)

i:M

i
/ A
[(
1

+m

i
) log(1 +F(t

i
; , ))] s
3
/ +s
2
( 1)
+s
1
(log() log log ()) (n n0) log (1/),
(3.49)
As derivadas em relao aos parmetros em (3.49), so apresentadas:

E[l(
(K)
|U
a
)] =
n
n
0

i=1

(K)
i


n
0

i=1

(K)
i
1
= 0, (3.50)

E[l(
(K)
|U
a
)] =
n
0

i=1
(
(K)
i
1)F(t

i
; , )
1 +F(t

i
; , )

i:M

i
/ A
(1 +m

i
)F(t

i
; , )
1 +F(t

i
; , )
+
s
1

= 0, (3.51)

E[l(
(K)
|U
a
)] =
n
0

i=1
(
(K)
i
1)
_
F(t

i
; , )/
1 +F(t

i
; , )

log(1 +F(t

i
; , ))

2
_
+

i:M

i
/ A

log (1/ +m

i
)

i:M

i
/ A
(1/ +m

i
)F(t

i
; , )
1 +F(t

i
; , )

log(1 +F(t

i
; , ))

2
+
s
1

(n n
0
)
(1/)

= 0 (3.52)

E[l(
(K)
|U
a
)] =
n
0

i=1
(
(K)
i
1)
1 +F(t

i
; , )
F(t

i
; , )

i:M

i
/ A
(1/ +m

i
)
1 +F(t

i
; , )
F(t

i
; , )

+s
2
s
1

log () = 0
(3.53)

E[l(
(K)
|U
a
)] =
n
0

i=1
(
(k)
i
1)
1 +F(t

i
; , )
F(t

i
; , )

i:M

i
/ A
(1/ +m

i
)
1 +F(t

i
; , )
F(t

i
; , )

+
s
3

2

s
1

(3.54)
De (3.50) temos que:
(1 )(n
n
0

i=1

(K)
i
)
n
0

i=1

(K)
i
= 0,
(n
n
0

i=1

(K)
i
) (n
n
0

i=1

(K)
i
+
n
0

i=1

(K)
i
) = 0,
= 1
1
n
n
0

i=1

(K)
i
.
Das equaes (3.51): (3.54), no foi possvel expressar de maneira explcita os parmetros , ,
e . Portanto as estimativas dos parmetros sero obtidas utilizando rotinas de maximizao do
pacote R e as condies de 1
a
e 2
a
ordem sero vericadas computacionalmente.
MODELO DESTRUTIVO COM VARIVEL TERMINAL 31
3.2.5 Estudo de simulao para o modelo destrutivo PZI com varivel terminal
Um estudo de simulao foi realizado com objetivo de estudar as propriedades dos estimadores
de mxima verossimilhana do modelo destrutivo PZI com varivel terminal (dada na equao
(3.20)), com a distribuio Gama para os tempos de deteco.
A simulao foi realizada com a gerao de 1000 rplicas dos dados da seguinte forma:
Passo 1 : Gerar a varivel terminal t

i
de uma distribuio exponencial com taxa de 0, 002 sendo que os
valores gerados maiores que d = 280 (durao do experimento) so censurados em d = 280.
Nesta gerao de dados est sendo considerada a censura no tempo d.
Passo 2 : Gerar o nmero dos tumores, M

i
, da distribuio destrutiva Poisson com zeros inacionados
dada em (3.20) com parmetros = 0, 7 (proporo de zeros aleatrios) e F(t

i
, , ), onde
F() uma distribuio Gama de parmetros = 3, = 30 e = 5.
Passo 3 : Gerar os tempos de deteco t
(ij)
, de uma distribuio Gama truncada, isto 0 t
(ij)
t

i
.
Geramos amostras de tamanho n = 20, 30, 50, 100, 200. Para cada amostra so estimados os
parmetros da funo de verossimilhana atravs do algoritmo EM implementado no Sistema R.
Foram replicadas 1000 vezes cada amostra, foram calculados a mdia, o vis e o erro mdio qua-
drtico das estimativas dos parmetros , e , . Foi obtido o intervalo de conana de 95% para
cada parmetro baseado na teoria assinttica e vericou-se a sua probabilidade de cobertura (PC).
Analogamente foram gerados os dados com uma proporo de zeros aleatrios mais baixa, isto
, para = 0, 4; = 5 e = 3, = 30. Os resultados desta simulao so apresentados nas
Tabelas 3.2 e 3.3 e mostram que o procedimento de estimao pontual e os intervalos de conana
so consistentes assintoticamente, isto , a medida que aumentamos o tamanho da amostra as
estimativas cam cada vez mais prximas dos valores reais e a cobertura intervalar de conana
mais prxima dos valores nominais.
Neste estudo de simulao para o modelo destrutivo PZI com varivel terminal, surge uma
questo interessante: Se os dados gerados apresentam excesso de zeros, qual seria o impacto em
utilizar um modelo que ignora a proporo desses zeros?.
A soluo desta pergunta comea na gerao dos dados seguindo os passos do algoritmo de uma
distribuio destrutiva PZI com = 0, 7; = 5 e = 3, = 30, e no momento da estimao
adota-se o modelo destrutivo de Poisson. Os resultados da simulao so apresentados nas Tabelas
3.4 e 3.5, que mostram claramente que, utilizando o modelo destrutivo de Poisson, o impacto sobre
as estimativas e probabilidade de cobertura do parmetro muito grande. O mesmo no ocorre
com os demais parmetros.
MODELO DESTRUTIVO COM VARIVEL TERMINAL 32
Tabela 3.2: Mdia, Vis, EQM das estimativas de mxima verossimilhana para 1000 rplicas com alta
proporo de zeros aleatrios = 0, 7.
n parmetros Mdia Vis EQM PC
20 0, 7045139 0, 0045139 0, 0127141 0, 920

4, 9949257 0, 0050743 0, 4838406 0, 945


3, 1566124 0, 1566124 0, 4081186 0, 951

29, 6606835 0, 3393165 44, 9315619 0, 913


30 0, 7064255 0, 006426 0, 0073830 0, 937

4, 9712719 0, 0287281 0, 2959103 0, 952


3, 0949310 0, 094931 0, 2541409 0, 948

29, 8567982 0, 1432018 32, 3748227 0, 925


50 0, 6989514 0, 0010486 0, 0044365 0, 947

5, 0112842 0, 0112842 0, 1880805 0, 953


3, 0520857 0, 0520857 0, 1370806 0, 947

29, 9313482 0, 0686518 16, 8934158 0, 934


100 0, 700371 0, 0003709 0, 0024832 0, 945

4, 993700 0, 0063000 0, 0876725 0, 953


3, 024720 0, 0247199 0, 0659668 0, 948

30, 009251 0, 0092508 8, 8252368 0, 941


200 0, 7000351 0, 0000351 0, 0010687 0, 966

4, 9990479 0, 0000952 0, 0441467 0, 958


3, 0132447 0, 0132448 0, 0292417 0, 954

29, 9339954 0, 0660046 3, 9832379 0, 951


Tabela 3.3: Mdia, Vis, EQM das estimativas de mxima verossimilhana para 1000 rplicas com baixa
proporo de zeros aleatrios = 0, 4.
n parmetros Mdia Vis EQM PC
20 0, 4017424 0, 0017424 0, 0127812 0, 931

5, 0207547 0, 0207547 1, 254357 0, 942


3, 3298874 0, 3298874 1, 1758167 0, 958

29, 8280784 0, 1719216 196, 776984 0, 873


30 0, 4049084 0, 0049083 0, 0083819 0, 936

4, 9815571 0, 01844294 0, 5545584 0, 955


3, 1906962 0, 1906962 0, 5214549 0, 958

29, 6977165 0, 30228351 54, 882946 0, 914


50 0, 3995461 0, 0004538 0, 0052149 0, 943

5, 0181623 0, 0181623 0, 2980737 0, 965


3, 1118545 0, 1118545 0, 2798006 0, 955

29, 7798639 0, 2201361 32, 555758 0, 921


100 0, 3991638 0, 0008362 0, 0026213 0, 950

4, 9880804 0, 0119196 0, 1540574 0, 955


3, 0457961 0, 045796 0, 1179760 0, 959

30, 0250010 0, 025001 14, 9516759 0, 940


200 0, 3986471 0, 0013529 0, 0012638 0, 960

4, 9991332 0, 0008668 0, 0854705 0, 944


3, 0202925 0, 020293 0, 0557506 0, 954

30, 0007716 0, 000772 7, 3388651 0, 960


MODELO DESTRUTIVO COM VARIVEL TERMINAL 33
Tabela 3.4: Mdia, Vis, EQM das estimativas de mxima verossimilhana para 1000 rplicas, estimando
com o modelo destrutivo de Poisson para dados gerados com = 0.7 (proporo de zeros aleatrios).
n parmetros Mdia Vis EQM PC
20

3, 503274 1, 4967258 2, 725266 0, 221
3, 156974 0, 156974 0, 408142 0, 952

29, 624621 0, 3753789 44, 064460 0, 914


30

3, 506881 1, 49311947 2, 5324332 0, 112
3, 096573 0, 0965731 0, 2544574 0, 948

29, 830636 0, 16936363 32, 5697685 0, 926


50

3, 499384 1, 50061620 2, 4499523 0, 030
3, 054785 0, 0547855 0, 1386691 0, 947

29, 893469 0, 10653051 17, 0479867 0, 928


100

3, 496602 1, 5033980 2, 3609845 0, 003
3, 028388 0, 0283881 0, 0663408 0, 951

29, 960163 0, 0398372 8, 8678034 0, 940


200

3, 498318 1, 5016820 2, 3033004 0, 000
3, 014575 0, 014575 0, 0291785 0, 957

29, 913907 0, 0860930 3, 9977442 0, 958


Tabela 3.5: Mdia, Vis, EQM das estimativas de mxima verossimilhana para 1000 rplicas, estimando
com o modelo destrutivo de Poisson para dados gerados com = 0.4 (proporo de zeros aleatrios).
n parmetros Mdia Vis EQM PC
20

2, 006636 2, 993364 9, 407521 0, 000
3, 335323 0, 33532 1, 176453 0, 958

29, 408389 0, 591611 93, 51392 0, 865


30

1, 988324 3, 011676 9, 365486 0, 000
3, 214872 0, 21487 0, 570726 0, 952

29, 477966 0, 522034 59, 46436 0, 895


50

1, 998077 3, 001923 9, 178324 0, 000
3, 115483 0, 11548 0, 285386 0, 955

29, 731764 0, 268236 33, 479471 0, 919


100

1, 991451 3, 008549 9, 141515 0, 000
3, 053069 0, 05307 0, 119221 0, 955

29, 926103 0, 073897 15, 018572 0, 931


200

1, 992111 3, 007889 9.091372 0, 000
3, 025773 0, 02577 0.055429 0, 955

29, 927710 0, 072290 7.276706 0, 946


Captulo 4
Aplicao com Dados Reais
Mesmo com o avano do desenvolvimento de novas drogas preventivas sobre o cncer, o ndice
de mortalidade vem crescendo de forma assustadora. Nos ltimos anos, tem havido um aumento
no nmero experimentos que envolvem a induo qumica de tumores em animais, cujo objetivo
avaliar o efeito de tratamentos quimiopreventivos. O interesse em tais experimentos so duas
variveis respostas, nmero de tumores observados em cada animal e os tempos de deteco dos
tumores, variveis que dependem do tempo de vida do animal (varivel terminal). Como ilustrao
iremos aplicar em animais os resultados obtidos no Captulo 3, onde os dados reais podem ser
encontrados em Freedman et al. (1993). A implementao de todos os programas computacionais
necessrios para obter estes resultados esto disponveis em linguagem R. Neste captulo, o modelo
destrutivo com varivel terminal ser utilizado em um conjunto de dados reais sobre a reincidncia
de tumores em ratos aps um tratamento quimiopreventivo.
O conjunto de dados utilizado foi obtido em um experimento realizado na Universidade do
Alabama, Birmingham. Nestes dados o tratamento experimental de preveno conhecido como
agente A. O experimento foi planejado da seguinte forma: primeiro foi aplicado uma substncia
qumica cancergena em dois grupos de 30 ratos fmeas para produzir tumores. Um grupo foi
submetido no tratamento controle em que receberam uma dieta placebo e o outro no tratamento
com agente A. Os animais receberam os tratamentos antes, durante e aps a induo cancergena.
Para obter os dados desses experimentos, os animais foram apalpados semanalmente, registrando
o tempo de promoo destes tumores. Os ratos que sobreviveram aps 280 dias foram sacricados
e vericou-se a existncia de tumores ou conrmaram-se os tumores identicados. Os tumores que
foram encontrados na necropsia no foram considerados no experimento. Os dados so apresentados
na Tabela 1.1.
Considerando os modelos de Poisson, binomial negativo, Poisson com zeros inacionados e bi-
nomial negativo com zeros inacionados apresentados na Tabela 3.1, os estimadores de mxima
verossimilhana sero obtidos para cada grupo e um teste de hiptese via razo de verossimilhana
ser utilizado para selecionar um desses modelos e vericar se existe efeito do agente A. O teste de
hiptese formulado da seguinte forma:
_
H
0
: os parmetros correspondentes a M so iguais para os dois tratamentos;
H
a
: os parmetros so diferentes.
(4.1)
Se H
0
for rejeitada, o tratamento com agente quimiopreventivo diferente do tratamento controle.
34
APLICAO COM DADOS REAIS 35
Caso contrrio, no existe diferena entre os efeitos dos dois tratamentos aplicados nos animais.
Os resultados do ajuste dos modelos so apresentados nas Tabelas 4.1 a 4.4, que foram obtidos de
seguir as metodologias dadas nas Sees 2.4, 2.5 e 2.6. Prefermo-nos s estimativas com sub-ndice
1 como pertencente ao tratamento de controle e as outras com sub-ndice 2 para o tratamento com
agente A.
Tabela 4.1: Resultados do modelo destrutivo de Poisson.
Estimativa Intervalos TRV P-valor
P(m)/f(t) (Erro padro) de conana 2logL
H
a
(
1
=
2
)
Poisson/Gama

1
= 1, 265 (0, 279) [0, 718 1, 812] 997, 34 7, 151 0, 007

2
= 2, 323 (0, 396) [1, 547 3, 099]

1
= 3, 585 (1, 168) [1, 296 5, 874]

2
= 4, 119 (1, 036) [2, 088 6, 151]

1
= 44, 108 (20, 147) [4, 621 83, 595]

2
= 40, 608 (14.208) [12, 759 68, 456]
Tabela 4.2: Resultados do modelo destrutivo binomial negativo.
Estimativa Intervalos TRV P-valor
P(m)/f(t) (Erro padro) de conana 2logL
H
a
(
1
=
2
)
(
1
=
2
)
BN/Gama
1
= 1, 556 (0, 582) [0, 414 2, 695] 945, 584 1, 168 0, 56

2
= 2, 417 (0, 679) [1, 087 3, 747]

1
= 1, 871 (1, 030) [0, 147 3, 889]

2
= 1, 413 (0, 579) [0, 277 2, 55]

1
= 3, 721 (1, 214) [1, 342 6, 099]

2
= 4, 239 (1, 055) [2, 172 6, 308]

1
= 44, 701 (21, 353) [2, 847 86, 555]

2
= 39, 593 (13, 665) [12, 809 66, 376]
Tabela 4.3: Resultados do modelo destrutivo de Poisson com zeros inacionados.
Estimativa Intervalos TRV P-valor
P(m)/f(t) (Erro padro) de conana 2logL
H
a
(
1
=
2
)
(
1
=
2
)
PZI/Gama
1
= 0, 548 (0, 113) [0, 327 0, 769] 964, 438 2, 678 0, 26

2
= 0, 676 (0, 095) [0, 489 0, 861]

1
= 2, 448 (0, 624) [1, 225 3, 672]

2
= 3, 656 (0, 735) [2, 216 5, 095]

1
= 3, 706 (1, 192) [1, 369 6, 044]

2
= 3, 956 (1, 029) [1, 938 5, 974]

1
= 42, 664 (19, 186) [5, 06 80, 268]

2
= 44, 135 (16, 824) [11, 161 77, 109]
APLICAO COM DADOS REAIS 36
Tabela 4.4: Resultados do modelo destrutivo binomial negativo com zeros inacionados.
Estimativa Intervalos TRV P-valor
P(m)/f(t) (Erro padro) de conana 2logL
H
a
(
1
=
2
)
(
1
=
2
)
(
1
=
2
)
BNZI/Gama
1
= 0, 976 (1, 164) [1, 305 3, 256] 945, 5838 1, 1692 0, 76

2
= 1, 000 (0, 332) [0, 3490 1, 650]

1
= 1, 590 (1, 844) [2, 023 5, 204]

2
= 2, 418 (1, 021) [0, 4160 4, 420]

1
= 1, 780 (4, 419) [6, 880 10, 441]

2
= 1, 414 (1, 092) [0, 727 3, 554]

1
= 3, 719 (1, 214) [1, 3400 6, 099]

2
= 4, 239 (1, 056) [2, 1700 6, 309]

1
= 44, 686 (21, 348) [2, 8450 86, 527]

2
= 39, 597 (13, 679) [0, 3490 66, 407]
Os resultados do teste da razo de verossimilhana apresentados nas Tabelas 4.2, 4.3 e 4.4
mostram que o modelo binomial negativo, modelo PZI e o modelo BNZI so preferidos em relao
ao modelo de Poisson, quando = 0, 56, = 0, 26, e = 0, 76, respectivamente. Esses resultados
conrmam que no houve signicncia, isto , o tratamento com agente A no teve efeito no
experimento. A seguir so apresentados os resultados dos critrios de seleo do modelo para cada
grupo de tratamento.
Tabela 4.5: Seleo de modelo para o grupo controle.
Modelo N
o
de parmetros DEV AIC BIC
destrutivo no modelo
Poisson 3 365, 578 371, 578 375, 782
BN 4 353, 045 361, 045 366, 650
PZI 4 355, 367 363, 367 368, 971
BNZI 5 353, 045 363, 045 370, 051
Tabela 4.6: Seleo de modelo para o grupo com agente A.
Modelo N
o
de parmetros DEV AIC BIC
destrutivo no modelo
Poisson 3 624, 611 630, 611 634, 815
BN 4 592, 539 600, 539 606, 144
PZI 4 609, 072 617, 072 622, 677
BNZI 5 592.539 602, 539 609, 545
As Tabelas 4.5 e 4.6 mostram que o modelo BN e o modelo BNZI so os mais indicados para
ajustar os dados. A seguir apresentamos uma tabela de frequncias esperadas onde podemos observar
o ajuste em relao ao nmero de tumores.
APLICAO COM DADOS REAIS 37
Tabela 4.7: Freqncias esperadas de cada modelo
M

O Poisson BN PZI BNZI


0 27 14, 80 24, 22 26, 95 28, 06
1 16 20, 71 11, 24 7, 89 12, 01
2 6 14, 50 7, 01 9, 49 6, 91
3-4 5 9, 13 8, 10 12, 17 7, 12
5 4 0, 86 7, 69 3, 50 5, 24
A Tabela 4.7 apresenta as frequncias observadas, O, e as frequncias esperadas segundo os
modelos de Poisson, binomial negativo, PZI e BNZI. Para este conjunto de dados os modelos PZI e
BNZI so superiores em distinguir zeros porque estas distribuies foram formuladas para justicar
o excesso de zeros. O modelo destrutivo PZI o modelo que mais se ajusta ao nmeros de zeros,
mais a um custo muito alto j que o ajuste para valores diferentes de zero no satisfatrio em
relao aos resultados apresentados pelos modelos destrutivos BN e BNZI.
Captulo 5
Consideraes Finais
Neste trabalho foi apresentado o modelo destrutivo com varivel terminal, o qual uma adap-
tao do modelo proposto por Rodrigues et al. (2010) onde foram utilizados os modelos discretos
de Poisson, binomial negativo, Poisson com zeros inacionados e binomial negativo com zeros in-
acionados.
No Captulo 3 os procedimentos de estimao dos parmetros de interesse, foram desenvolvidos
utilizando o mtodo de mxima verossimilhana via algoritmo EM os quais produziram resultados
satisfatrios.
Foi apresentado um algoritmo e o programa computacional de simulao dos dados, para o
modelo destrutivo de Poisson com zeros inacionados e varivel terminal. De acordo com os resul-
tados observados no estudo de simulao, observou-se que o procedimento de estimao puntual e
probabilidade de cobertura foram consistentes assintoticamente.
Na aplicao com dados reais os modelos destrutivos propostos Poisson com zeros inacionados
e binomial negativo com zeros inacionados se mostraram capazes de incorporar o excesso de zeros
nos dados.
O teste da razo de verossimilhana dos modelos destrutivos binomial negativo, Poisson com
zeros inacionados e binomial negativo com zeros inacionados, mostraram que o efeito do agente A
no foi estatisticamente signicativo, enquanto, o modelo destrutivo de Poisson mostrou o contrrio,
ao nvel de signicncia de 5%.
Entre os quatro modelos mencionados o modelo binomial negativo com zeros inacionados foi
o mais adequado para o ajuste dos dados, de acordo com o teste da razo de verossimilhana e os
critrios AIC e BIC.
importante mencionar que os quatro modelos envolvidos, no foram analisados na presena
de covariveis. Portanto, a incluso de covariveis na modelagem do modelo destrutivo com varivel
terminal faz parte de pesquisas futuras.
Considerar o modelo destrutivo com varivel terminal, na anlise de dados forneceu resulta-
dos mais prximos da realidade, pois considera na anlise, o processo de destruio dos tumores
promovidos pelo tratamento avaliado.
Como pesquisas futuras enfatizamos os seguintes tpicos:
Uma das propostas futuras para nalizar este trabalho de mestrado implementar a simula-
o do modelo destrutivo com varivel terminal para o modelo binomial negativo com zeros
inacionados.
38
39
Aplicar a metodologia do modelo destrutivo de Poisson com zeros inacionados e varivel ter-
minal, para dados reais com covariveis. Podemos estudar o trabalho recente de Chin-Chang
(2011), no tema de identicabilidade que foi feito para o modelo de Poisson com zeros ina-
cionados.
Formular um procedimento Bayesiano para o modelo destrutivo com varivel terminal .
Tentativas para modelar a carcinognese foram feitas do ponto de vista da anlise de sobre-
vivncia para ensaios clnicos humanos. Entre os pesquisadores existe o interesse em propor
modelos de sobrevivncia para carcinognese que incorporam a possibilidade de indivduos
no serem susceptveis ao cncer, ou seja, existe uma proporo da populao que devido a
certa interveno (tratamento e/ou defesas naturais do organismo) pode vir a no ser suscep-
tvel ao cncer. Nesta rea, existem pesquisas na literatura tais como: Berkson & Gage (1952),
Farewell (1986), Yang & Chen (1991), Yakovlev & Tsodikov (1996), Chen & Ibrahim (2001),
assim como modelos mais recentes Yin & Ibrahim (2005), Chen & Liu (2006), Cooner et al.
(2007), Rodrigues et al. (2009), Rodrigues et al. (2010), entre muitos outros. Uma proposta
abordar este problema do ponto de vista do modelo destrutivo proposto por Rodrigues et al.
(2010) com varivel terminal, via anlise de sobrevivncia de longa durao, onde o nmero
de tumores e os respectivos tempos de deteco, por animal so observados.
O trabalho de Wang et al. (2001) apresenta uma anlise de eventos recurrentes de dados
que possuem censura informativa para pacientes com AIDS. Outra proposta seria adaptar o
modelo destrutivo com varivel terminal no contexto do trabalho de Wang et al. (2001) em
relao recorrncia dos tumores de animais, onde a varivel terminal comporta-se como um
mecanismo de censura informativo.
Apndice A
A.1 Cncer, Carcinognese (INCA, 2011)
Cncer o nome dado a um conjunto de mais de 100 doenas que tm em comum o crescimento
desordenado de clulas, que invadem tecidos e rgos. Dividindo-se rapidamente, estas clulas ten-
dem a ser incontrolveis, determinando a formao de tumores malignos, que podem espalhar-se
para outras regies do corpo. Pesquisas sobre o cncer indicam uma alta incidncia de mortalidade
no mundo todo. Fatores como cigarro, lcool, exposio excessiva ao sol, etc. atuam como agentes
cancergenos ou carcingenos alterando a estrutura gentica (DNA) das clulas chamado processo
de carcinognese. O surgimento do cncer depende da intensidade e durao da exposio das c-
lulas aos agentes cancergenos. Por exemplo, o risco de uma pessoa desenvolver cncer de pulmo
diretamente proporcional ao nmero de cigarros fumados por dia e ao nmero de anos que ela vem
fumando. A formao do cncer ou processo de carcinognese um processo que passa por vrios
estgios antes de chegar ao tumor visvel. Os estgios so:
1. Estgio de iniciao: O estgio de iniciao o primeiro estgio da carcinognese. Nele as
clulas sofrem o efeito dos agentes cancergenos ou carcingenos que provocam mutao na
estrutura gentica das clulas. Nesta fase um nmero inicial de clulas se encontram geneti-
camente alteradas ou danicadas, porm ainda no possvel clinicamente detectar o tumor.
Estas clulas encontram-se "preparadas", ou seja, "iniciadas", para transformar-se em clulas
malignas gerando os tumores.
2. Estgio de promoo: O estgio de promoo o estgio intermedirio da carcinognese.
Nele, as clulas geneticamente alteradas, ou seja, "iniciadas", sofrem o efeito dos agentes
cancergenos classicados como oncopromotores. A clula iniciada transformada em clula
maligna, de forma lenta e gradual. Para que ocorra essa transformao, necessrio um longo
e continuado contato com o agente cancergeno promotor. Esse estgio caracterizado pela
reversibilidade, ao contrario da iniciao e progresso. Clulas malignas podem regredir com
a descontinuao dos agentes cancergenos, porm elas s podem reaparecer com a restituio
do agente cancergeno. A suspenso do contato com agentes promotores muitas vezes inter-
rompe o processo nesse estgio. Alguns componentes da alimentao e a exposio excessiva
e prolongada a hormnios so exemplos de fatores que promovem a transformao de clulas
iniciadas em malignas.
3. Estgio de progresso: Este o ltimo estgio e se caracteriza pela multiplicao descon-
trolada e irreversvel das clulas alteradas. Nesse estgio o cncer j est instalado, evoluindo
at o surgimento das primeiras manifestaes clnicas da doena.
40
41
A.2 Esperana e Varincia do modelo destrutivo com varivel ter-
minal
Usando as propriedades de esperana condicional, a esperana da varivel destrutiva, M

i
, com
varivel terminal, t

i
, dada por:
E[M

i
|t

i
] = E{E[M

i
= m

i
|M
i
= m
i
; ]},
= E{m
i
F(t

i
; )},
= E[M
i
]F(t

i
; ), (A.1)
com as mesmas propriedades, a varincia da varivel destrutiva, M

i
, com varivel terminal, t

i
,
dada por:
V ar[M

i
|t

i
] = E{V ar[M

i
= m

i
|M
i
= m
i
; ]} +V ar{E[M

i
= m

i
|M
i
= m
i
; ]},
= E{m
i
F(t

i
; )(1 F(t

i
; ))} +V ar{m
i
F(t

i
; )},
= E[M
i
]F(t

i
; ) F(t

i
; )
2
+F(t

i
; )
2
V ar[M
i
].
= (V ar[M
i
] E[M
i
])F(t

i
; )
2
+E[M
i
]F(t

i
; ). (A.2)
A.3 condies de 1
a
e 2
a
ordem do modelo destrutivo de Poisson
com varivel terminal
Condies de 1
a
ordem.

log[L(, , |t

i
)] =
n

i=1
F(t

i
; , ) +
s
1

= 0, (A.3)

log[L(, , |t

i
)] =

i=1
F(t

i
; , ) s
1
(log +

log ()) +s
2
= 0, (A.4)

log[L(, , |t

i
)] =

i=1
F(t

i
; , ) s
1
/ +s
3
/
2
= 0. (A.5)
Os estimadores de mxima verossimilhana

, e

sero obtidos derivando a equao A.3 em
relao a e , obtendo-se

i=1
F(t

i
; , ) =

i=1
F(t

i
; , ) = 0.
42
Substituindo esta ltima expresso nas equaes A.4 e A.5 obtemos que
( ) + log(

) = s
2
/s
1
, (A.6)

= s
3

1
/s
1
, (A.7)
onde ( ) =

log ( ) a funo digama.


Logo, substituindo (A.6) em (A.7) obtemos as seguintes equaes aps algumas simplicaes

= s
1
/
n

i=1
F(t

i
; ,

), (A.8)
( ) log( ) + log(s
3
/s
1
) s
2
/s
1
= 0, (A.9)
A equao (A.9) ser resolvida via mtodo Newton-Raphson. Assim, substituindo em (A.7) ob-
temos

e de (A.8) obtemos

. Como as estimativas no so obtidas explicitamente, vericaremos
que o ponto estimado (

, ,

) seja um ponto mximo da funo de verossimilhana atravs das
condies de 2
a
ordem dada no Captulo 2.
Condies de 2
a
ordem.

2
l(

, ,

) = s
1
/

2
(A.10)

2
l(

, ,

) =

i=1

2
F(t

i
, ,

) s
1

2
log(( )) (A.11)

2
l(

, ,

) =

i=1

2
F(t

i
, ,

) +
s
1

2
+
2s
3

3
(A.12)
as derivadas cruzadas em relao a , e so dadas por:

l(

, ,

) =

2

l(

, ,

) =
n

i=1

F(t

i
, ,

) (A.13)

l(

, ,

) =

2

l(

, ,

) =
n

i=1

F(t

i
, ,

) (A.14)

l(

, ,

) =

2

l(

, ,

) =

i=1

F(t

i
, ,

)
s
1

(A.15)
Todas as derivadas parciais de segunda ordem so calculados computacionalmente para vericar
que o ponto de estimativas um ponto mximo, seguindo a denio dada em (2.15) denido no
Captulo 2.
43
A.4 Distribuio da varivel destrutiva BN dada a varivel termi-
nal
P[M

i
= m

i
|t

i
; N, , ] =

m
i
=m

i
P[M

i
= m

i
|M
i
= m
i
; ]P[M
i
= m
i
; N, ]
=

m
i
=m

i
_
m
i
m

i
_
F(t

i
; )
m

i
(1 F(t

i
; ))
m
i
m

i
_
N +m
i
1
m
i
_

N
(1 )
m
i
=

m
i
=m

i
m
i
!F(t

i
; )
m

i
(1 F(t

i
; ))
m
i
m

i
m

i
!(m
i
m

i
)!
(N +m
i
)
(N)m
i
!

N
(1 )
m
i
m

i
+m

i
=

N
[(1 )F(t

i
; )]
m

i
(N)m

i
!

m
i
=m

i
(N +m
i
)
[(1 )(1 F(t

i
; ))]
m
i
m

i
(m
i
m

i
)!
=

N
[(1 )F(t

i
; )]
m

i
(N)m

i
!
(N +m

i
)
[F(t

i
; ) + F(t

i
; )]
N+m

i
=
(N +m

i
)
(N)m

i
!
_

+ (1 )F(t

i
; )
_
N
_
(1 )F(t

i
; )
+ (1 )F(t

i
; )
_
m

i
=
_
N +m

i
1
m

i
__

+ (1 )F(t

i
; )
_
N
_
1

+ (1 )F(t

i
; )
_
m

i
.
A.4.1 Condies de 1
a
e 2
a
ordem do modelo destrutivo BN com varivel ter-
minal
Condies de 1
a
ordem

log[L(, , )] =
n

i=1
_
(1/ +m

i
)F(t

i
; , )
1 +F(t

i
; , )
_
= 0 (A.16)

log[L(, , )] =
n

i=1
_
1
(1/ +m

i
)
(1/ +m

i
)

n
(1/)
(1/)

+s
1
/

i=1
_
(1/ +m

i
)F(t

i
; , )
1 +F(t

i
; , )

log(1 +F(t

i
; , ))

2
_
= 0 (A.17)

log[L(, , )] =
n

i=1
_
(1/ +m

i
)
1 +F(t

i
; , )

F(t

i
; , )
_
+s
2
s
1
(log +

log ()) = 0
(A.18)

log[L(, , )] =
n

i=1
_
(1/ +m

i
)
1 +F(t

i
; , )

F(t

i
; , )
_
+
s
3

2

s
1

= 0 (A.19)
44
Condies de 2
a
ordem

2
l( , , ,

) =
n

i=1
(1/ +m

i
)
2
F(t

i
; ,

)
2
(1 + F(t

i
; ,

))
2
(A.20)

2
l( , , ,

) =
n

i=1

2
log (1/ +m

i
)
n

i=1
_
(1/ +m

i
)

2

2
log(1 + F(t

i
; ,

))

log(1 + F(t

i
; ,

))
F(t

i
; ,

)

2
(1 + F(t

i
; ,

))
+
2 log(1 + F(t

i
; ,

))

3
_
n

2

2
log (1/ ) (A.21)

2
l( , , ,

) =
n

i=1
_
(1/ +m

i
)
1 + F(t

i
; ,

)

2
F(t

i
; ,

) +
_

F(t

i
; ,

)
_
2
_
s
1

2
log ( )
(A.22)

2
l( , , ,

) =
n

i=1
_
(1/ +m

i
)
1 + F(t

i
; ,

)

2
F(t

i
; ,

) +
_

F(t

i
; ,

)
_
2
_

2s
3

3
+
s
1

2
(A.23)
as derivadas cruzadas em relao a , , , so dadas por:

l( , , ,

) =

2

l( , , ,

) =
n

i=1
_
(m

i
F(t

i
; ,

))F(t

i
; ,

)
(1 + F(t

i
; ,

))
2
_
(A.24)

l( , , ,

) =

2

l( , , ,

) =
n

i=1
_
(1/ +m

i
)
(1 + F(t

i
; ,

))
2

F(t

i
; ,

)
_
(A.25)

l( , , ,

) =

2

l( , , ,

) =
n

i=1
_
(1/ +m

i
)
(1 + F(t

i
; ,

))
2

F(t

i
; ,

)
_
(A.26)

l( , , ,

) =

2

l( , , ,

) =
n

i=1
_
(m

i
F(t

i
; ,

))
(1 + F(t

i
; ,

))
2

F(t

i
; ,

)
_
(A.27)

l( , , ,

) =

2

l( , , ,

) =
n

i=1
_
(m

i
F(t

i
; ,

))
(1 + F(t

i
; ,

))
2

F(t

i
; ,

)
_
(A.28)

l( , , ,

) =

2

l( , , ,

) =
n

i=1
_

2

2
(1/ +m

i
)
(1 + F(t

i
; ,

))
2

F(t

i
; ,

)

F(t

i
; ,

)
+
(1/ +m

i
)
1 + F(t

i
; ,

)

F(t

i
; ,

)
s
1

_
(A.29)
Todas as derivadas parciais de segunda ordem so calculados computacionalmente para vericar
que o ponto de estimativas um ponto mximo, seguindo a denio dada em (2.15).
45
A.5 Distribuio da varivel destrutiva PZI dada a varivel termi-
nal
P[M

i
= m

i
|t

i
; , , ] =

m
i
=m

i
_
m
i
m

i
_
F(t

i
; )
m

i
(1 F(t

i
; ))
m
i
m

i
_
(1 )I
{0}
(m
i
) +
e

m
i
m
i
!
_
,
onde
I
{0}
(m
i
) =
_
1 , m
i
= 0;
0 , m
i
= 0.
1. m

i
= 0
P[M

i
= 0|t

i
; , , ] =

m
i
=0
(1 F(t

i
; ))
m
i
_
(1 )I
{0}
(m
i
) +
e

m
i
m
i
!
_
= 1 +e

m
i
=1
(1 F(t

i
; ))
m
i

m
i
m
i
!
= 1 +e

m
i
=1
[(1 F(t

i
; ))]
m
i
m
i
!
+ 1
_
= 1 +e
F(t

i
;)
.
2. m

i
= 1, 2, 3, . . .
P[M

i
= m

i
|t

i
; , , ] =

m
i
=m

i
_
m
i
m

i
_
F(t

i
; )
m

i
(1 F(t

i
; ))
m
i
m

m
i
m

i
+m

i
m
i
!
= e

[F(t

i
; )]
m

i
m

i
!

m
i
=m

i
[(1 F(t

i
; ))]
m
i
m

i
(m
i
m

i
)!
=
e
F(t

i
;)
[F(t

i
; )]
m

i
m

i
!
.
Logo, de 1 e 2 obtemos:
P[M

i
= m

i
|t

i
, , ] = (1 )I
{0}
(m

i
) +
e
F(t

i
;)
(F(t

i
; ))
m

i
m

i
!
,
onde
I
{0}
(m

i
) =
_
1 , m

i
= 0;
0 , m

i
1.
46
A.5.1 Funo de verossimilhana ampliada do modelo destrutivo PZI com va-
rivel terminal
L(, , , ; D) = L(, , , )
n
0

i=1
_
(
i
)
Z
i
(1
i
)
1Z
i

=
n
0

i=1
_
1 +e
F(t

i
;,)
_

nn
0

i
/ A
L
i
(, , )
n
0

i=1
_
(
i
)
Z
i
(1
i
)
1Z
i
_
,
=
n
0

i=1
(1 +e
F(t

i
;,)
)
nn
0

i
/ A
L
i
(, , )
n
0

i=1
_
1
1 +e
F(t

i
;,)
_
Z
i
_
e
F(t

i
;,)
1 +e
F(t

i
;,)
_
1Z
i
,
=
n
0

i=1
(1 +e
F(t

i
;,)
)

i
/ A
L
i
(, , )
nn
0

(1 )
n
0

i=1
Z
i

n
0

n
0

i=1
Z
i
e

n
0

i=1
[(1 Z
i
)F(t

i
; , )]

n
0
i=1
(1 +e
F(t

i
;,)
)
,
=
n
n
0

i=1
Z
i
(1 )
n
0

i=1
Z
i
e

n
0

i=1
[(1 Z
i
)F(t

i
; , )]

i
/ A
L
i
(, , ),
=
nZ
(1 )
Z
exp {
n
0

i=1
[(1 Z
i
)F(t

i
)]}

i
/ A
L
i
(, , ),
onde Z =
n
0

i=1
Z
i
.
A.6 Distribuio da varivel destrutiva BNZI com varivel terminal
P[M

i
= m

i
|t

i
; , , ] =

m
i
=m

i
_
m
i
m

i
_
F(t

i
; )
m

i
(1F(t

i
; ))
m
i
m

i
_
(1 )I
{0}
(m
i
) +
(N +m
i
)
(N)m
i
!

N
(1 )
m
i
_
,
onde = (, , ) e = , e
I
{0}
(m

i
) =
_
1 , m

i
= 0;
0 , m

i
1.
47
1. m

i
= 0
P[M

i
= 0|t

i
; , ] =

m
i
=0
(1 F(t

i
; ))
m
i
_
(1 )I
{0}
(m
i
) +
(N +m
i
)
(N)m
i
!

N
(1 )
m
i
_
= 1 +
N
+

m
i
=1
(1 F(t

i
; ))
m
i

(N +m
i
)
(N)m
i
!

N
(1 )
m
i
= 1 +

N
(N)
_

m
i
=1
(N +m
i
)
[(1 F(t

i
; ))(1 )]
m
i
m
i
!
+ (N)
_
= 1 +

N
(N)
_

m
i
=0
(N +m
i
)
[(1 F(t

i
; ))(1 )]
m
i
m
i
!
_
= 1 +

N
(N)
(N)
+ (1 )F(t

i
; )
N
,
= 1 +
_

+ (1 )F(t

i
; )
_
N
.
2. m

i
= 1, 2, 3, . . .
P[M

i
= m

i
|t

i
; , ] =

m
i
=m

i
_
m
i
m

i
_
F(t

i
; )
m

i
(1 F(t

i
; ))
m
i
m

(N +m
i
)
(N)m
i
!

N
(1 )
m
i
,
=

N
[(1 )F(t

i
; )]
m

i
(N)m

i
!

m
i
=m

i
(N +m
i
)
[(1 )(1 F(t

i
; ))]
m
i
m

i
(m
i
m

i
)!
,
=

N
[(1 )F(t

i
; )]
m

i
(N)m

i
!
(N +m

i
)
[ + (1 )F(t

i
; )]
N+m

i
,
=
_

+ (1 )F(t

i
; )
_
N
_
1

+ (1 )F(t

i
; )
_
m

i
,
Logo, de 1 e 2 obtemos:
P[M

i
= m

i
|t

i
, , ] = (1)I
{0}
(m

i
)+
(N +m

i
)
(N)m

i
!
_

+ (1 )F(t

i
; )
_
N
_
1

+ (1 )F(t

i
; )
_
m

i
,
onde
I
{0}
(m

i
) =
_
1 , m

i
= 0;
0 , m

i
1.
A.6.1 Funo de verossimilhana ampliada do modelo destrutivo BNZI com
varivel terminal
A funo de verossimilhana baseada em dados ampliados para o i-simo animal do modelo
destrutivo Binomial Negativo com zeros inacionados e varivel terminal, t

i
, dada por:
L
i
(, , , , ) = m

i
!
m

j=1
f(t
ij
; , )
F(t

i
; , )
_
(1 )I
{0}
(m

i
) +
(
1

+m

i
)
(
1

)m

i
!
_
1
1 +F(t

i
; )
_ 1

_
F(t

i
; )
1 +F(t

i
; )
_
m

i
_
.
48
Logo, para os n animais a funo de verossimilhana expressa como:
L(, , , , ) =
n
0

i=1
L
i
(, , , , )

i
/ A
L
i
(, , , , )
segue
=
n
0

i=1
_
1 +
_
1
1 +F(t

i
; )
_ 1

_

M

i
/ A
_
_
_
m

i
!
m

j=1
f(t
ij;,
)
F(t

i
; , )
(
1

+m

i
)
(
1

)m

i
!
_
1
1 +F(t

i
; )
_ 1

_
F(t

i
; )
1 +F(t

i
; )
_
m

i
_
_
_
,
=
n
0

i=1
_
1 +
_
1
1 +F(t

i
; )
_ 1

_

nn
0

i
/ A
L
i
(, , , ),
Com uso da varivel latente
Y
i
=
_
1 , com probabilidade
i
;
0 , com probabilidade 1
i
,
os procedimentos da funo de verossimilhana baseada em dados ampliados so mostrados a seguir:
L(, , , , ; H
a
) = L(, , , , )
n
0

i=1
_
(
i
)
Y
i
(1
i
)
1Y
i

,
=
n
0

i=1
_
1 + [1 +F(t

i
; )]

nn
0

i
/ A
L
i
(, , , )

n
0

i=1
_
1
1 +[1 +F(t

i
; )]

_
Y
i
_
[1 +F(t

i
; )]

1 +[1 +F(t

i
; )]

_
1Y
i
,
=
n
0

i=1
_
1 + [1 +F(t

i
; )]

nn
0

i
/ A
L
i
(, , , )

(1 )
n
0

i=1
Y
i

n
0

n
0

i=1
Y
i

n
0
i=1
(1 +F(t

i
; ))
Y
i
1

n
0
i=1
[1 +(1 +F(t

i
; ))

]
,
=
n
n
0

i=1
Y
i
(1 )
n
0

i=1
Y
i

n
0

i=1
(1 +F(t

i
; ))
Y
i
1

i
/ A
L
i
(, , , ),
=
nY
(1 )
Y

n
0

i=1
(1 +F(t

i
; ))
Y
i
1

i
/ A
L
i
(, , , ),
em que Y =
n
0

i=1
Y
i
.
Referncias
Akaike, H. (1973). Information theory and an extension of the maximum likelihood principle, volume 1,
pages 267281. Akademiai Kiado. 16
Berkson, J. & Gage, R. P. (1952). Survival curve for cancer patients following treatment. Journal of the
American Statistical Association, 47(259), 501515. 39
Bohning, D., Dietz, E., Schlattmann, P., Mendona, L. & Kirchner, U. (2000). The zero-inated poisson
model and the decayed, missing and lled teeth index in dental epidemiology. Journal of the Royal
Statistical Society: Series A (Statistics in Society), 163(1), 121122. 10
Bolfarine, H. & Sandoval, M. (2001). Introduo inferncia estatstica. SBM. 12, 13
Boone, C. W., Kello, G. J. & Malone, W. E. (1990). Identication of candidate cancer chemopreventive
agents and their evaluation in animal models and human clinical trials: A review. 50(1), 29. 2
Borgatto, A. F. (2004). Modelos para propores com superdispero e excesso de zeros - Um procedimento
bayesiano. Tese (Doutorado em Agronoma). Universidade Federal de So Paulo - Piracicaba. 10
Casella, G. & Berger, R. L. (2001). Statistical Inference. Duxbury/Thomson Learning, Pacic Grove, CA,
second edition. 19
Chen, M.-H. & Ibrahim, J. G. (2001). Maximum likelihood methods for cure rate models with missing
covariates. Biometrics, 57(1), 4352. 39
Chen, Y. H. J. & Liu, G. H. F. (2006). A note on the estimate of treatment eect from a Cox regression model
when the proportionality assumption is violated. Communications in Statistics Theory and Methods,
35(1-3), 521526. 39
Chin-Chang (2011). Identiability of zero-inated poisson models. Brazilian Journal of Probability and
Statistics. 39
Cooner, F., Banerjee, S., Carlin, B. P. & Sinha, D. (2007). Flexible cure rate modeling under latent activation
schemes. Journal of the American Statistical Association, 102, 560572. 39
Dempster, A., Laird, N. & Rubin, D. (1977). Maximum likelihood from incomplete data via the EM
algorithm. Journal of the Royal Statistical Society, Series B,, 39, 138. 13, 25, 29
Dunson, D. B. & Dinse, G. E. (2000). Distinguishing eects on tumor multiplicity and growth rate in
chemoprevention experiments. Biometrics, 56(4), 10681075. 3
Farewell, V. (1986). Mixture models in survival analysis: Are they worth the risk. Can. J. Statist., 14,
257262. 39
Freedman, L., Midthune, D., Brown, C., Steele, V. & Kello, G. (1993). Statistical analysis of cancer
chemoprevention experiments. JSTOR: Biometrics, 49, 259268. i, ii, 2, 4, 6, 7, 17, 19, 34
Gupta, P. L., Ramesh C., G. & T., R. C. (1996). Analysis of zero-adjusted count data. Computational
Statistics & Data Analysis, 23(2), 207 218. 10
Johnson, N. L.; Kotz, S. (1969). Discrete Distributions: distribution in statistics . John Wiley and Sons Inc.
7
49
50
Kodell, R. L. & Chen, J. J. (2001). Inferring eects on tumor frequencies and times to observation in the
analysis of tumor multiplicity data. Biometrical Journal , 43(4), 447460. 3
Kokoska, S. M. (1987). The analysis of cancer chemoprevention experiments. Biometrics, 43, 525534. i, ii,
2, 3, 4, 6, 7, 17
Kokoska, S. M. (1988). Including data from early deaths in the analysis of cancer chemoprevention experi-
ments. Applied Mathematics Letters, 1(2), 197 201. 2, 14
Kumara, S. S. P. & Chin, H. C. (2003). Modeling accident occurrence at signalized tee intersections with
special emphasis on excess zeros. Trac Injury Prevention, 4(1), 5357. 10
Lambert, D. (1992). Zero-inated poisson regression with an application to defects in manufacturing. Te-
chnometrics, 34(1), 114. 9, 10
Molefe, D. F., Chen, J. J., Howard, P. C., Miller, B. J., Sambuco, C. P., Forbes, P. D. & Kodell, R. L. (2005).
Tests for eects on tumor frequency and latency in multiple dosing photococarcinogenicity experiments.
Journal of Statistical Planning and Inference, 129(1-2), 39 58. 3
Nelder, J. A. & Wedderburn, R. W. M. (1972). Generalized linear models. Journal of the Royal Statistical
Society. Series A (General), 135(3), 370384. 8
Ridout, M., Demetrio, C. G. B. & Hinde, J. (1998). Models for Count Data with Many Zeros. pages 179192.
10
Rodrigues, J. (2003). Bayesian analysis of zero-inated distributions. Communications in Statistics Theory
and Methods, 32(2), 281289. 10
Rodrigues, J., Cancho, V. G., de Castro, M. & Louzada-Neto, F. (2009). On the unication of the long-term
survival models. Statistics and Probability Letters, 79, 753759. 39
Rodrigues, J., de Castro, M., Balakrishnan, N. & Cancho, V. (2010). Destructive weighted Poisson cure rate
models. Lifetime Data Analysis. i, ii, 3, 4, 6, 17, 18, 38, 39
Saito, M. (2005). Inferencia Bayesiana para dados disretos com excesso de zeros . Dissertao (Mestrado
em Estatstica). Universidade Federal de So Carlos. 10
Schwarz, G. (1978). Estimating the dimension of a model. Annals of Statistics, 6, 461464. 16
Silva, D. D. (2009). Classe de distribues serie de potencias inacionadas com aplicaes . Dissertao
(Mestrado em Estatstica). Universidade Federal de So Carlos. 8
Tanner, M. A. (1996). Tools for Statistical Inference: Methods for the Exploration of Posterior Distributions
and Likelihood Functions. Springer, New York, NY, third edition. 24, 28
Thompson, H. J., Meeker, L. D. & Kokoska, S. (1984). Eect of an inorganic and organic form of dietary
selenium on the promotional stage of mammary carcinogenesis in the rat. Cancer Research, 44(7), 2803
2806. 1
Wang, M.-C., Qin, J. & Chiang, C.-T. (2001). Analyzing recurrent event data with informative censoring.
Journal of the American Statistical Association, 96(455), pp. 10571065. 39
Yakovlev, A. Y. & Tsodikov, A. D. (1996). Stochastic Models of Tumor Latency and Their Biostatistical
Applications. World Scientic, Singapore. 3, 39
Yang, G. L. & Chen, C. W. (1991). A stochastic two-stage carcinogenesis model: a new approach to
computing the probability of observing tumor in animal bioassays. Mathematical Biosciences, 104, 247
258. 39
Yin, G. & Ibrahim, J. G. (2005). Cure rate models: a unied approach. The Canadian Journal of Statistics,
33(4), 559570. 39

Você também pode gostar