Escolar Documentos
Profissional Documentos
Cultura Documentos
m=0
P[J = a|M = m]P[M = m], (1.3)
em que P[M = m] a funo de probabilidade da varivel latente M.
A proposta deste trabalho ser utilizar o modelo proposto Kokoska (1987) e Freedman et al.
(1993), no contexto do modelo destrutivo formulado por Rodrigues et al. (2010), para experimentos
quimiopreventivos em animais.
A principal diferena entre a nossa proposta de trabalho e a do modelo destrutivo formulado
por Rodrigues et al. (2010) que a modelagem ser desenvolvida para variveis observveis e no
com variveis latentes. Como exemplo de aplicao ser utilizado o banco de dados fornecido por
Freedman et al. (1993) (ver Tabela 1.1), em que os dados so:
i ) O nmero de tumores detectados em cada animal,
ii ) o tempo de deteco do tumor gerado,
iii ) o tempo de morte do animal, varivel terminal.
INTRODUO 5
T
a
b
e
l
a
1
.
1
:
T
a
b
e
l
a
d
e
d
a
d
o
s
.
T
r
a
t
a
m
e
n
t
o
c
o
n
t
r
o
l
e
T
r
a
t
a
m
e
n
t
o
a
g
e
n
t
e
A
T
e
m
p
o
d
o
s
t
u
m
o
r
e
s
(
d
i
a
s
)
t
i
T
e
m
p
o
s
d
o
s
t
u
m
o
r
e
s
(
d
i
a
s
)
t
i
0
9
2
0
1
3
5
0
1
8
5
0
2
0
6
0
1
9
1
0
2
1
7
0
2
0
0
0
2
4
7
0
2
0
3
0
2
6
0
0
2
0
8
0
2
6
8
0
2
1
4
0
2
7
2
0
2
7
6
0
2
8
0
0
2
7
9
0
2
8
0
0
2
7
9
4
8
2
0
4
0
2
7
9
7
0
1
8
6
0
2
7
9
1
1
3
2
1
2
0
2
7
9
1
2
0
1
4
5
3
4
6
6
1
3
5
2
3
0
5
8
2
3
2
1
7
6
2
8
0
8
5
2
3
4
2
8
0
a
2
8
0
9
2
2
7
9
2
8
0
a
2
8
0
1
5
5
2
7
9
3
4
2
8
0
a
2
8
0
2
7
9
a
2
7
9
9
8
2
4
6
2
5
3
2
8
0
a
2
8
0
1
4
8
2
3
1
2
3
7
2
8
0
a
2
8
0
1
5
5
2
3
0
a
2
3
0
6
2
6
2
7
8
2
2
5
2
5
5
a
2
5
5
8
5
2
0
5
2
7
9
1
4
1
1
5
5
2
1
9
a
2
1
9
1
8
3
2
7
9
a
2
7
9
1
4
8
2
3
1
2
3
9
2
7
2
2
3
1
2
7
9
a
2
7
9
7
0
8
5
8
5
1
7
8
a
1
7
8
6
2
7
0
1
7
0
a
1
0
7
9
8
1
2
6
1
4
8
2
3
3
2
5
5
a
2
5
5
9
2
1
1
3
1
4
4
1
9
1
a
1
9
1
9
2
1
4
8
1
7
6
2
1
1
2
1
1
2
8
0
a
2
8
0
1
2
0
1
5
5
2
2
5
2
4
6
2
8
0
5
8
5
8
6
4
9
8
9
8
1
2
6
a
1
2
6
a
1
2
6
1
1
3
1
3
5
1
6
9
2
6
6
2
7
9
a
2
7
9
7
3
8
5
8
5
9
8
1
5
5
1
6
2
1
6
2
1
9
0
1
9
0
2
0
5
2
8
0
9
2
1
1
3
1
2
0
1
2
6
1
9
7
2
0
3
a
2
0
3
9
2
9
2
1
1
3
1
1
3
1
3
5
1
5
9
1
6
2
1
6
9
1
6
9
2
3
1
2
6
7
a
2
6
7
a
2
6
7
a
2
6
7
a
i
n
d
i
c
a
q
u
a
n
d
o
o
t
u
m
o
r
f
o
i
d
e
s
c
o
b
e
r
t
o
n
a
n
e
c
r
o
p
s
i
a
,
e
t
i
o
t
e
m
p
o
d
e
m
o
r
t
e
d
o
a
n
i
m
a
l
.
INTRODUO 6
1.2 Motivao
A principal motivao para a realizao deste trabalho a reformulao do modelo destrutivo
Rodrigues et al. (2010) para experimentos com animais censurados ou condicionados na varivel
terminal que o instante de morte durante o experimento. Usualmente, os dados deste tipo de
experimentos apresentam excesso de zeros e o modelo de Poisson no apropriado. Portanto, ser
introduzido os modelos alternativos, conhecidos como modelo de Poisson com zeros inacionados e
binomial negativo com zeros inacionados, para levar em considerao a disperso e o excesso de
zeros.
1.3 Propostas do trabalho
Os objetivos desta pesquisa so:
1. Formular o modelo proposto por Kokoska (1987) e Freedman et al. (1993) do ponto de vista
do modelo destrutivo (Rodrigues et al. (2010)).
2. Estudar o comportamento das distribuies Poisson, binomial negativa, Poisson com zeros
inacionados (PZI) e binomial negativa com zeros inacionados (BNZI) na anlise de experi-
mentos quimiopreventivos de cncer em animais.
3. Desenvolver um algoritmo computacional para simular dados de acordo com o modelo pro-
posto.
4. Avaliar, utilizando dados simulados, as propriedades dos estimadores de mxima verossimi-
lhana.
5. Aplicar a metodologia desenvolvida em um conjunto de dados reais.
Para atingir estes objetivos utilizaremos o mtodo de mxima verossimilhana via algoritmo EM.
1.4 Apresentao dos captulos
O Captulo 2 traz uma reviso de literatura, envolvendo alguns tpicos necessrios para o desen-
volvimento do nosso trabalho. O Captulo 3 apresenta o modelo destrutivo com varivel terminal e
alguns casos particulares. Tambm ser mostrado um estudo de simulao do modelo proposto, em
que o algoritmo computacional mostrou-se consistente. O Captulo 4 apresenta os resultados de uma
aplicao do modelo destrutivo com varivel terminal com dados reais. Finalmente, no Captulo 5
so discutidas as concluses e algumas perspectivas futuras.
Captulo 2
Reviso de literatura
Em muitas aplicaes envolvendo dados de contagens so utilizados modelos discretos que foram
largamente desenvolvidos na literatura. Os modelos mais utilizados so Poisson e binomial negativo
(ver Kokoska (1987) e Freedman et al. (1993)). Estes modelos no consideram a possibilidade de
excesso de zeros. Portanto, sero introduzidas as distribuies inacionadas, Poisson com zeros
inacionados e binomial negativa com zeros inacionados, que levam em considerao a disperso
e o excesso de zeros nos dados. Sero apresentados conceitos bsicos de inferncia clssica.
2.1 Distribuio de Poisson
O modelo de Poisson amplamente utilizado na modelagem de dados discretos e foi introduzido
pelo matemtico francs Simon Denis Poisson (17811840). Segundo Johnson (1969), uma varivel
aleatria M tem distribuio de Poisson com parmetro se sua funo de probabilidade dada
por:
P(M = m; ) =
e
m
m!
, m = 0, 1, 2, . . . , (2.1)
em que > 0. A mdia e a varincia da distribuio de Poisson so dadas por:
E(M) = V ar(M) = . (2.2)
A varivel aleatria M o nmero de ocorrncias de um evento em um intervalo de tempo ou
espao especico, em que o parmetro que corresponde ao nmero mdio de eventos ocorrendo
nesse intervalo. Um exemplo tpico de aplicao da distribuio de Poisson o nmero de chamadas
recebidas por uma central telefnica num intervalo de tempo xo. Entretanto, existem diversas
outras aplicaes envolvendo dados de contagem, como o controle de qualidade (contagem de defeitos
de um produto), demograa (nmero de lhos por casal), medicina (nmero de recorrncias de um
determinado tipo de doena), ecologia (nmero de ovos do mosquito), estudos sociais (nmero de
parceiros de indivduos homossexuais), etc.
A distribuio de Poisson apresenta as seguintes caractersticas:
1. O parmetro a mdia e varincia da distribuio.
2. Em dados reais, muitas variveis de contagens tm uma varincia maior do que a mdia, o
que chamado de superdisperso. Neste caso a distribuio de Poisson no recomendvel.
7
REVISO DE LITERATURA 8
3. Quando aumenta, a distribuio de Poisson aproxima-se de uma distribuio Normal.
2.2 Distribuio binomial negativa (BN)
A distribuio binomial negativa conhecida na literatura como distribuio de Pascal ou distri-
buio de Polya. Por exemplo, considere um experimento estatstico com dois resultados possveis,
sucesso ou fracasso, em que o sucesso ocorre com probabilidade e o fracasso com probabilidade
1 . Se o experimento repetido indenidamente e os ensaios so independentes, a varivel alea-
tria M indica o nmero de tentativas necessrias para obter N sucessos, sendo a ltima tentativa
um sucesso. A distribuio binomial negativa pode ser escrita de diversas maneiras dependendo
da parametrizao utilizada. Nesta seo a distribuio binomial negativa ser utilizada na verso
paramtrica de Nelder & Wedderburn (1972) dada por:
P(M = m; N, ) =
(N +m)
(N)m!
N
(1 )
m
. (2.3)
A mdia e a varincia so dadas pelas seguintes expresses:
E(M) = N(1 )/ = ,
V ar(M) = +
2
, (2.4)
em que = 1/N e N o parmetro de disperso, para N > 0, e 0 < < 1.
Observa-se que a varincia da distribuio binomial negativa tem um termo adicional
2
quando
comparado com a varincia da Poisson, que ser til para ter um melhor ajuste quando existe
superdisperso nos dados.
2.3 Nmero excessivo de zeros nos dados
Silva (2009) mostra que o nmero excessivo de zeros nos dados diculta a elaborao de uma
anlise estatstica para o problema, pois os modelos usuais no conseguem modelar a presena
excessiva de zeros. Por exemplo, em uma linha de produo em que se aplica controle de qualidade,
a contagem de defeitos de um produto apresenta-se cada vez menor, ou seja, h um grande nmero
de zeros, isto ocorre devido a melhoria da qualidade e controle dos processos de fabricao. Logo
os zeros correspondem a zeros verdadeiros ou chamados tambm de determinsticos. Na rea de
ecologia, os zeros podem ocorrer devido espcie estando presente ou ausente na rea amostrada
e que no foi observada pelo pesquisador, logo, os zeros so aleatrios (falsos). Portanto, em um
processo de contagem os zeros podem ser obtidos de forma determinstica ou aleatria. Na grande
maioria de situaes prticas, no possvel separar estes dois tipos de zeros.
Os zeros inacionados ocorrem de duas formas para cada tipo. O primeiro tipo de zero (deter-
minstico) surge de uma baixa frequncia de ocorrncia ou ser o resultado de um efeito que conduz
para locais que no tm nenhum indivduo presente. O segundo tipo de zero (aleatrio) causado
por: apesar de existir, ocupar o local, no estava presente na hora da pesquisa. ou acontece quando
a unidade de estudo ocupa o local e est presente na hora de amostrar; mas o pesquisador no o
encontra.(Silva (2009) apud Martin et al. (2005))
A Tabela 2.1 apresenta um resumo sobre os tipos de zeros e suas respectivas denies.
REVISO DE LITERATURA 9
Tabela 2.1: Tipos de zeros em dados.
Tipo de zero Descrio
Zero determinstico Baixa frequncia de ocorrncia.
Realmente no existe nenhum indivduo presente.
Zero aleatrio Apesar de existir e ocupar o local,
no estava presente na hora da pesquisa.
Acontece quando ocupa o local e est presente
na hora de amostrar, mas o pesquisador no o encontra.
Como exemplo, podemos supor que para os tumores cancergenos em animais, os zeros determi-
nsticos surgem devido baixa ocorrncia de tumores aps um tratamento eciente, ou os tumores
esto temporariamente ausentes e no surgiram durante o tempo do experimento. Tambm pode-
mos supor que se o tempo de perodo fosse grande a ausncia dos tumores constituiria um zero
aleatrio.
Em um conjunto de dados possvel ocorrer diferentes tipos de zeros: as informaes podem no
conter nenhum zero inacionado, ou ter zeros inacionados devido a zeros verdadeiros ou devido a
aleatrios; ou ainda, devido a excesso de ambos os casos, verdadeiros e aleatrios. Concluindo, existe
uma incerteza sobre a fonte dos zeros inacionados. A seguir apresentamos algumas sugestes:
1. Em um conjunto de dados, quando os zeros so determinsticos, recomendvel a utilizao
de uma media ponderada de duas distribuies, ou seja, usa uma distribuio degenerada no
ponto zero e uma distribuio discreta adequada aos no zeros.
2. Se os zeros aleatrios esto presentes nos dados, a modelagem tambm pode ser feita atravs
de misturas de modelos. Em muitas aplicaes as distribuies zero inacionadas so solues
possveis.
2.3.1 Distribuio inacionada de zeros (DIZ)
Muitos autores propuseram modelos diferentes, mas semelhantes para a anlise de dados com
zeros inacionados, baseando-se no uso de mistura de distribuies. Estes modelos so capazes
de incorporar o excesso de zeros nos dados. Os modelos inacionados de zeros tm sido usados
para modelagem de dados nas mais diversas reas, tais como Epidemiologia, Sociologia, Medicina,
Odontologia, Agricultura, Econometria dentre outras.
Lambert (1992), foi a pioneira no uso de modelos de regresso para contagens com distribuio
inacionada de zeros. A autora props uma mistura nita das distribuies Bernoulli e Poisson para
modelar o excesso de dados de contagem envolvendo defeitos de fabricao de placas de circuito
impresso. Essa metodologia, aplicada a dados de contagem, mostrou-se de grande utilidade devido
ao fato de ser possvel associar regressores que inuenciam no parmetro de mistura.
Um conjunto de dados, s vezes, apresenta variabilidade maior do que a esperada pelos modelos
probabilsticos padres. Esse fenmeno conhecido como superdisperso, podendo ocorrer devido a
REVISO DE LITERATURA 10
uma variabilidade da mdia, excessos de zeros, correlao entre indivduos e/ou omisso de variveis
no observadas. Exemplos interessantes sobre esse tipo de dados com zeros inacionados podem ser
encontrados em Lambert (1992), Gupta et al. (1996), Ridout et al. (1998), Bohning et al. (2000)
Kumara & Chin (2003), Borgatto (2004) entre outros. Rodrigues (2003) e Saito (2005) abordam o
tema do ponto de vista bayesiano.
As motivaes para usar os modelos com zeros inacionados so a simplicidade para indicar
alguma heterogeneidade no observada nos dados. A funo de probabilidade de uma varivel
discreta com zeros inacionados pode ser representada pela seguinte expresso (Saito (2005)):
P(M; , ) = (1 )I
{0}
(M) +P(M; ) M = 0, 1, 2, . . . , (2.5)
em que
I
{0}
(M = m) =
_
1 , m = 0
0 , m = 0
,
e 0 1 e P(M; ) uma distribuio de probabilidade discreta, com vetor de parmetros
que teoricamente se adequaria aos dados caso no houvesse a presena excessiva de zeros nos dados.
O parmetro a proporo de zeros aleatrios gerados pela distribuio P(M; ) e 1 a
proporo de zeros de forma determinstica. Na equao (2.5) apresenta uma mistura, da distribuio
degenerada no zero e a distribuio da funo de probabilidade P(M; ).
2.3.2 Distribuio de Poisson com zeros inacionados (PZI)
Seja M uma varivel aleatria representando o nmero de tumores promovidos no animal. A
distribuio de Poisson com zeros inacionados denida como
P(M = m; , ) = (1 )I
{0}
(m) +
e
m
m!
m = 0, 1, 2, . . . , (2.6)
em que
I
{0}
(m) =
_
1 , m = 0
0 , m = 0
,
0 1, > 0 e (1 ) a proporo de zeros no explicada pelo modelo de Poisson. A partir
da funo de probabilidade do modelo PZI temos que a mdia dada por
E(M) =
m=0
mP(M, , ) =
m=1
m
e
m
m!
,
= e
m=1
m
m
m!
= e
= . (2.7)
REVISO DE LITERATURA 11
Como,
E(M
2
) =
m=0
m
2
P(M, , ) =
m=1
m
2
m
m!
,
= e
m=1
m
2
m
m!
= e
( + 1),
= (
2
+) = ( + 1), (2.8)
em que 0 < < 1, a varincia da varivel M dada por:
V ar(M) = E(M
2
) (E(M))
2
= [(
2
+)] []
2
,
=
2
+
2
2
,
= [1 +(1 )]. (2.9)
Quando = 1, o modelo PZI corresponde ao modelo de Poisson com E(M) = V ar(M) = .
2.3.3 Distribuio binomial negativa com zeros inacionados (BNZI)
Seja M uma varivel aleatria latente (no observvel) representando o nmero de tumores
promovidos no animal. A distribuio binomial negativa com zeros inacionados denida como:
P(M = m; , N, ) = (1 )I
{0}
(m) +
(N +m)
(N)m!
N
(1 )
m
m = 0, 1, 2, . . . , (2.10)
em que
I
{0}
(m) =
_
1 , m = 0
0 , m = 0
,
0 1, 0 < < 1 e N > 0 o parmetro de disperso. A partir do modelo binomial negativo
com zeros inacionados temos que a mdia dada por:
E(M) =
m=0
mP(M; , N, ) =
N
(N)
m=1
m
(N +m)
m!
(1
N
),
=
N
(1 )
(N)
m1=0
(N + 1 +m1)
(m1)!
(1 )
m1
,
=
N
(1 )
(N)
(N + 1)
N+1
,
=
N(1 )
= . (2.11)
REVISO DE LITERATURA 12
Como,
E(M
2
) =
m=0
m
2
P(M; , N, ),
=
N
(1 )
(N)
m1=0
m
(N + 1 +m1)
(m1)!
(1 )
m1
,
=
N
(1 )
(N)
(N + 1)(N N + 1)
N+2
,
=
N(1 )
_
N(1 )
+
1
_
,
= (1 + +),
em que e so denidas em (2.4), a varincia da varivel M dada por:
V ar(M) = E(M
2
) (E(M))
2
,
= (1 + +)
2
2
,
= (1 +(1 ) +). (2.12)
Se = 1, o modelo BNZI corresponde ao modelo binomial negativo com E(M) = e V ar(M) =
+
2
.
2.4 Inferncia
2.4.1 Estimao de mxima verossimilhana
Pelo mtodo de mxima verossimilhana (Bolfarine & Sandoval (2001)), as estimativas dos pa-
rmetros sero obtidas a partir da maximizao da funo de verossimilhana.
Seja L(; D) a funo de verossimilhana, em que = (
1
,
2
, . . . ,
k
) o vetor de parmetros
do modelo e D os dados. O estimador de mxima verossimilhana de o valor
que maximiza
a funo de verossimilhana L(; D). O logaritmo da funo de verossimilhana de dada por:
l(; D) = log L(; D). (2.13)
O estimador de mxima verossimilhana pode ser encontrado seguindo as condies maximizao
de 1
a
e 2
a
ordem dadas por:
1. Condio de 1
a
ordem
l
(; D) =
l(; D)
= 0, (2.14)
sendo que a soluo da equao de verossimilhana pode ser obtida explicitamente ou, em
situaes mais complicadas, a soluo (estimativas) de (2.14),
= (
1
,
2
, . . . ,
k
), ser em
geral obtida por procedimentos numricos.
2. Condio de 2
a
ordem
REVISO DE LITERATURA 13
A condio de 2
a
ordem consiste em vericar se a matriz hessiana dada por:
H() =
_
2
l
2
1
2
l
2
2
l
2
l
2
l
2
2
2
l
k
.
.
.
.
.
.
.
.
.
.
.
.
2
l
2
l
2
2
l
2
k
_
_
=
_
_
h
11
h
12
h
1k
h
21
h
22
h
2k
.
.
.
.
.
.
.
.
.
.
.
.
h
k1
h
k2
h
kk
_
_
(2.15)
negativa denida. Uma matriz simtrica negativa denida se
|h
11
| < 0,
h
11
h
12
h
21
h
22
> 0, , (1)
n
h
11
h
1k
.
.
.
.
.
.
.
.
.
h
k1
h
kk
> 0,
em que |A| denota o determinante da matriz A.
2.4.2 Mtodos numricos
Mtodo de Newton-Raphson
Vamos a denotar por U() a funo escore, ou seja,
U() =
l(; D)
, (2.16)
com U(
) = 0. Expandindo U(
) = 0 em srie de Taylor em torno de um ponto
0
, obtemos:
=
0
U(
0
)
U
(
0
)
. (2.17)
De (2.17), obtemos o procedimento iterativo de Newton-Raphson dado por
K+1
=
K
U(
K
)
U
(
K
)
, (2.18)
em que
0
o valor inicial de um novo valor
1
obtido a partir de (2.18) e assim por diante,
at que o processo se estabiliza, ou seja, para um dado pequeno, |
K+1
K
| < . Nesse
caso, o ponto
em que o processo se estabiliza o estimador de mxima verossimilhana de
(vide Bolfarine & Sandoval (2001)).
Algoritmo EM
A maximizao da log-verossimilhana dos dados observados l(; D) pode ser obtida atravs
do algoritmo EM (vide Dempster et al. (1977)). um algoritmo iterativo, utilizado para
maximizar probabilidades complexas e aplicado em problemas de dados incompletos. Os dados
incompletos so denidos pela falta de dados, elementos desconhecidos, variveis latentes,
tipos de censura de observaes, e assim por diante. Seja D
a
os dados ampliados em que
l(; D
a
) o logaritmo da funo de mxima verossimilhana dos dados ampliados. A seguir
apresentamos os passos do algoritmo EM.
Seja
(0)
o valor inicial para = (
1
, . . . ,
(K+1)
(K)
< ,
para um > 0.
2.5 Teste de hipteses
Neste tipo de experimentos, geralmente so testadas diferentes substncias quimiopreventivas
por grupos de animais, gerando diferentes amostras independentes. A seguir formularemos pri-
meiramente um teste de hipteses que ser utilizado para comparar a ecincia das substncias
quimiopreventivas de cada tratamento (vide Kokoska (1988)).
Seja G 2 os tratamentos aplicados em diferentes grupos de animais, suponhamos que deseja-
mos testar as seguintes hipteses
_
H
0
: o vetor de parmetros de interesse, todos ou alguns, so iguais para todos os tratamentos;
H
a
: ao menos dois vetores de parmetros so diferentes.
(2.19)
Seja
i
,
i
, 1 i G as estimativas de mxima verossimilhana de cada grupo de animais com
diferentes tratamentos, em que se refere a estimativa do vetor de parmetros da distribuio do
nmero de tumores,
a estimativa do vetor de parmetros da distribuio do tempo de deteco
dos tumores e
c
,
c
as estimativas de mxima verossimilhana dos dados combinados.
A funo verossimilhana sob H
0
dada por L
H
0
= L(
c
,
c
). A funo verossimilhana sob H
a
dada por:
L
H
a
=
G
i=1
L(
i
,
i
). (2.20)
Teste da razo de verossimilhana (TRV)
O teste da razo de verossimilhana consiste em comparar os valores maximizados do logaritmo
da funo de verossimilhana sem restrio e sob a hiptese nula H
0
. O TRV denido pela
estatstica:
TRV =
2
= 2 log(r), em que r = L
H
0
/L
H
a
.
Se
2
2
k(G1)
(
em que k(G1)
o nmero de graus de liberdade e k o nmero de parmetros sob a hiptese H
0
.
REVISO DE LITERATURA 15
Se o teste resulta signicativo, isto , a hiptese nula ser rejeitada ento tem-se aqueles trata-
mentos que fazem efeito no experimento.
2.6 Intervalos de conana
A ideia de estimao por intervalos construir um intervalo em torno da estimativa pontual tal
que tenha uma probabilidade conhecida de conter o verdadeiro valor do parmetro. Neste trabalho
utilizaremos as distribuies amostrais das estimativas dos parmetros desconhecidos baseado na
teoria assinttica. A seguir, introduzimos as ferramentas principais para o clculo de intervalos de
conana. Seja D a varivel que representa os dados observados com funo de densidade f(D; ),
onde = (
1
, . . . ,
2
log f(; D)
_
. (2.21)
A denio acima uma medida de informao global, enquanto na prtica trabalha-se com uma
medida de informao local, chamada de matriz de informao observada de Fisher, denida como:
J() = H() =
2
log f(; D)
, (2.22)
onde H() uma matriz hessiana dada em (2.15). A inversa da matriz de informao observada
denida como:
J
1
() =
_
_
V ar(
1
) Cov(
1
,
2
) Cov(
1
,
)
Cov(
2
,
1
) V ar(
2
) Cov(
2
,
)
.
.
.
.
.
.
.
.
.
.
.
.
Cov(
1
) Cov(
2
) V ar(
)
_
_
, (2.23)
conhecida tambm como a matriz de varincia-covarincia. Usando este resultado podemos fazer in-
ferncia aproximada sobre cada parmetro estimado e assim os intervalos de conana aproximados
de 100(1
)% so obtidos fazendo, i = 1, . . . , :
IC(
i
; 100(1
)%) =
i
z
/2
_
V ar(
i
). (2.24)
no qual z
/2
o quantil da distribuio normal padro e
o nvel de conana.
2.7 Critrios de seleo do modelo
Os critrios de seleo so regras que permitem comparar modelos atravs de medidas escalares,
que medem a qualidade do ajuste do modelo. Neste trabalho sero utilizadas algumas medidas de
ajuste, tais como:
1. DEV
A deviance calculada atravs da expresso:
Dev = 2logL(
; D) (2.25)
REVISO DE LITERATURA 16
2. AIC
O critrio de informao de Akaike (1973) conhecido como AIC denido como:
AIC = 2 log L(
; D) + 2, (2.26)
em que o nmero de parmetros no modelo em questo.
3. BIC
O critrio de informao bayesiano BIC foi proposto por Schwarz (1978) e dado por:
BIC = 2 log L(
; D) +(log n), (2.27)
em que o nmero de parmetros e n o nmero de observaes, neste caso ser o nmero
de animais.
Os trs critrios que foram apresentados, apesar de ser diferentemente denidos, utilizam o
mesmo critrio estatstico, o valor mximo da funo de verossimilhana como medida do ajusta-
mento, entretanto, denem valores crticos diferentes. Esta a diferena fundamental entre esses
critrios. Portanto, para modelos em avaliao com o mesmo conjunto de dados, ser selecionado o
melhor modelo, aquele que possui o menor valor de critrio de seleo.
Captulo 3
Modelo destrutivo com varivel terminal
Neste captulo apresentamos a modelagem matemtica dos experimentos estudados e utilizados
para avaliar o efeito de um determinado tratamento sobre a taxa de incidncia de tumores. Para
caracterizar os experimentos quimiopreventivos ser realizado uma reformulao do modelo proposto
por Kokoska (1987) e Freedman et al. (1993) no contexto do modelo de Rodrigues et al. (2010) que
envolve dois estgios.
3.1 Formulao do modelo
O modelo destrutivo com varivel terminal caracterizado pelos seguintes estgios:
1. Estgio de iniciao
Neste estgio de iniciao o animal foi exposto aos agentes cancergenos, para produzir tumores
malignos, isto , clulas normais sofrem o efeito dos agentes cancergenos ou carcingenos que
provocam mutao na estrutura gentica das clulas fazendo elas se transformarem em clulas
geneticamente alteradas, clulas "iniciadas". Estas clulas encontram-se "preparadas", ou seja,
"iniciadas", para transformar-se em clulas malignas gerando os tumores. Neste trabalho
supomos que o desenvolvimento dos tumores de forma independente um de outro.
Seja M
i
a varivel aleatria latente (no observvel) que representa o nmero de tumores
promovidos gerados pelas clulas malignas, no i-simo animal.
2. Estgio de destruio
No estgio de destruio o animal foi submetido ao tratamento quimiopreventivo, podendo
ou no eliminar os tumores promovidos. Consequentemente, os tumores que sobreviveram ao
tratamento podem ser detectados mediante a tcnica de apalpao feita no corpo do animal.
Esta tcnica consiste na apalpao contnua para identicar a existncia ou no de tumores
com tamanho detectvel. A observao desses tumores possvel somente durante a vida do
animal sujeito a um tempo pr-estabelecido para o experimento.
Espera-se que o tratamento quimiopreventivo diminua o nmero de tumores malignos gerados
pelas clulas malignas e/ou reduza a taxa de crescimento do tumor. Neste trabalho estamos
interessados nos tumores que sobreviveram ao tratamento ou que no foram destrudos e que
aps o tratamento foram detectados.
17
MODELO DESTRUTIVO COM VARIVEL TERMINAL 18
Seja d a durao do experimento quimiopreventivo e t
i
, i = 1, 2, . . . , n, uma varivel alea-
tria, observvel que chamaremos de varivel terminal, referida ao instante de morte devido
aos tumores do i-simo animal. Consideremos tambm X
ij
como uma varivel aleatria (in-
dependente de M
i
), com distribuio de Bernoulli que indica se foi ou no detectado o j-simo
tumor promovido no i-simo animal antes do tempo terminal t
i
, isto ,
X
ij
=
_
1 , tumor detectado no i-simo animal antes do tempo t
i
;
0 , caso contrario,
(3.1)
com probabilidade de sucesso F(t
i
; ), em que o parmetro de interesse. fundamental
enfatizar que a identicao do tumor est condicionada ao instante de morte do animal.
Os tempos em que foram detectados os tumores sero representados pelas variveis T
(ij)
, i =
1, 2, . . . , n, j = 1, . . . , M
i
que so variveis aleatrias observveis, independentes das vari-
veis M
i
, identicamente distribudas e estatisticamente ordenadas geradas pela distribuio de
probabilidade acumulada F(t; ).
Seja M
i
uma varivel aleatria discreta que representa o nmero de tumores detectados entre
os M
i
tumores promovidos, que no foram destrudos pelo tratamento no i-simo animal
condicionado ou censurado no instante de morte t
i
, i = 1, 2, . . . , n. Portanto a varivel M
i
pode ser expressada como:
M
i
=
_
_
m
i
j=1
X
ij
, para M
i
> 0,
0 , para M
i
= 0.
(3.2)
Dado M
i
= m
i
e t
i
, i = 1, 2, . . . , n, a distribuio de probabilidade da varivel aleatria
discreta, M
i
, uma distribuio Binomial com parmetros m
i
e F(t
i
; ), neste caso conhe-
cida como mecanismo de destruio dos tumores, condicionado ao instante de morte t
i
(vide
Rodrigues et al. (2010)). importante enfatizar que a probabilidade de encontrar um tumor
antes do instante t
i
depende (probabilidade de sucesso) do tempo de vida do animal, diferen-
temente do modelo que foi formulado por Rodrigues et al. (2010), em que a probabilidade de
sucesso constante.
3.1.1 Observaes
1. Se t
i
< d, i = 1, 2, . . . , n, temos que o animal morreu antes de nalizar o experimento, isto ,
o animal foi censurado aleatoriamente no instante t
i
.
2. Se t
i
= d, i = 1, 2, . . . , n, temos que o animal sobreviveu at nalizar o experimento, ou
seja, foi sacricado para permitir a conrmao histolgica dos tumores observados aps o
tratamento quimiopreventivo.
3. As variveis destrutivas M
i
so observadas enquanto que no modelo destrutivo (Rodrigues et al.
(2010)) so latentes.
4. Se M
i
< M
i
, temos que houve destruio dos tumores pelo agente quimiopreventivo.
MODELO DESTRUTIVO COM VARIVEL TERMINAL 19
5. O experimento em estudo, no ser considerada a possibilidade de reparao das clulas
iniciadas que so feitas pelo mecanismo de reparo do animal.
6. Se M
i
= M
i
, temos que no houve destruio, isto , o tratamento quimiopreventivo no fez
nenhum efeito no animal.
3.1.2 Distribuio de probabilidades com varivel terminal
A distribuio de probabilidades da varivel destrutiva com varivel terminal, t
i
, para o i-simo
animal pode ser obtida a partir da expresso (3.2) e dada por:
P[M
i
= m
i
|t
i
; , ] =
m
i
=m
i
P[M
i
= m
i
|M
i
= m
i
; ]P[M
i
= m
i
; ],
=
m
i
=m
i
Modelo destrutivo com varivel terminal
..
_
m
i
m
i
_
F(t
i
; )
m
i
(1 F(t
i
; ))
m
i
m
i
P[M
i
= m
i
; ],
(3.3)
em que P[M
i
= m
i
; ] a distribuio de probabilidade do nmero de tumores promovidos com
parmetro . Portanto, a varivel M
i
atualizada pelo mecanismo de destruio anteriormente
denido. A esperana e varincia da varivel destrutiva, M
i
, dado a varivel terminal, t
i
, so dadas
por (ver Apndice A.2):
E[M
i
|t
i
] = E[M
i
]F(t
i
; ), (3.4)
V ar[M
i
|t
i
] = (V ar[M
i
] E[M
i
])F(t
i
; )
2
+E[M
i
]F(t
i
; ). (3.5)
3.1.3 Funo de verossimilhana
A funo de verossimilhana proposta por Freedman et al. (1993), para o i-simo animal ser
reformulada na seguinte forma.
L
i
(, ) = f(t
(i1)
, . . . , t
(im
i
)
|t
i
; )P[M
i
= m
i
|t
i
; , ], (3.6)
em que t
(ij)
o tempo de deteco do j-simo tumor no i-simo animal, m
i
o nmero de tumores
detectados no i-simo animal e t
i
o tempo de morte (varivel terminal) do i-simo animal. A funo
densidade de probabilidade conjunta das observaes ordenadas t
(ij)
, dada a varivel terminal, t
i
,
para i = 1, 2, . . . , n, j = 1, . . . , m
i
, dada por (Casella & Berger (2001)):
f(t
(i1)
, . . . , t
(im
i
)
|t
i
; ) =
_
_
m
i
!f(t
i1
|t
i
; ) f(t
im
i
|t
i
; ) , 0 < t
i1
< < t
i,m
i
< t
i
< ;
0 , caso contrrio.
(3.7)
Logo, a distribuio conjunta para o i-simo animal dada por:
L
i
(, ) = m
i
!
m
j=1
f(t
ij
|t
i
; )P[M
i
= m
i
|t
i
; , ], (3.8)
MODELO DESTRUTIVO COM VARIVEL TERMINAL 20
em que f(t
ij
|t
i
; ) =
f(t
ij
;)
F(t
i
;)
a distribuio truncada no instante t
i
e (, ) so os parmetros
envolvidos no modelo destrutivo com varivel terminal. O parmetro identica a distribuio de
probabilidade do tempo de deteco do tumor e identica a distribuio de probabilidade da
varivel M.
Portanto, a funo de verossimilhana do modelo destrutivo com varivel terminal, t
i
, i =
1, 2, . . . , n, para n animais dada por:
L(, ) =
n
i=1
L
i
(, ) =
n
i=1
_
_
_
m
i
!
m
j=1
f(t
ij
; )
F(t
i
; )
P[M
i
= m
i
|t
i
; , ]
_
_
_
. (3.9)
Como usual encontrar excesso de zeros nos dados dos experimentos com animais, sero consi-
derados os modelos Poisson, binomial negativo, Poisson com zeros inacionados e binomial negativo
com zeros inacionados. A seguir apresentamos a Tabela 3.1 das distribuies a serem utilizadas
neste trabalho.
Tabela 3.1: Modelos Paramtricos.
Distribuio de prob. de M P(M = m; ) Parmetro
Poisson() e
m
/m! =
NB(N, )
_
N+m1
m
_
N
(1 )
m
= (N, )
PZI(, ) (1 )I
{0}
(m) +
e
m
m!
= (, )
BNZI(, , ) (1 )I
{0}
(m) +
(N+m)
(N)m!
N
(1 )
m
= (, , )
I
{0}
(m) =
_
1 , m = 0;
0 , m = 0,
Distribuio de prob. de T
ij
f(t; ) Parmetro
Gama(, )
t
1
()
e
t/
= (, )
MODELO DESTRUTIVO COM VARIVEL TERMINAL 21
3.2 Casos especiais do modelo destrutivo com varivel terminal
Nesta seo, apresentamos alguns casos especiais do modelo destrutivo com varivel terminal,
t
i
, proposto na seo anterior.
3.2.1 Modelo destrutivo de Poisson com varivel terminal
A distribuio de probabilidade da varivel destrutiva Poisson com varivel terminal pode ser
obtida da expresso (3.3), dada por:
P[M
i
= m
i
|t
i
; , ] =
m
i
=m
i
P[M
i
= m
i
|M
i
= m
i
; ]P[M
i
= m
i
; ],
=
m
i
=m
i
_
m
i
m
i
_
F(t
i
; )
m
i
(1 F(t
i
; ))
m
i
m
i
e
m
i
m
i
!
,
=
m
i
=m
i
m
i
!
m
i
(m
i
m
i
)!
F(t
i
; )
m
i
(1 F(t
i
; ))
m
i
m
i
e
m
i
m
i
+m
i
m
i
!
,
=
[F(t
i
; )]
m
i
m
i
!
e
m
i
=m
i
[(1 F(t
i
; ))]
m
i
m
i
(m
i
m
i
)!
,
=
[F(t
i
; )]
m
i
m
i
!
e
e
(1F(t
i
;))
,
= e
(F(t
i
;))
[F(t
i
; )]
m
i
m
i
!
, (3.10)
em que > 0 e > 0. Portanto, a varivel destrutiva M
i
, dada a varivel terminal, t
i
, tem uma
distribuio de Poisson com parmetro F(t
i
; ), i = 1, . . . , n. Assim
E[M
i
|t
i
] = F(t
i
; ) = V ar[M
i
|t
i
]. (3.11)
De (3.9) a funo verossimilhana com varivel terminal, t
i
, i = 1, . . . , n, para o modelo destrutivo
de Poisson, em que F(t; ) a funo distribuio acumulada de uma distribuio Gama com
parmetro = (, ), dada por:
L(, , ) =
n
i=1
_
_
_
m
i
!
m
j=1
f(t
ij
; , )
F(t
i
; , )
e
F(t
i
;,)
(F(t
i
; , ))
m
i
m
i
!
_
_
_
,
=
n
i=1
m
j=1
f(t
ij
; , )e
i=1
F(t
i
; , )
i=1
m
i
.
MODELO DESTRUTIVO COM VARIVEL TERMINAL 22
O logaritmo da funo de verossimilhana associada aos animais no necessariamente sacricados,
que so todos os animais do conjunto de dados, dada por:
log L(, , ) =
_
_
i=1
F(t
i
; , ) +
n
i=1
m
i
log + ( 1)
n
i=1
m
j=1
log(t
ij
)
1
n
i=1
m
j=1
t
ij
_
_
i=1
m
i
log +
n
i=1
m
i
log ()
_
,
em que s
1
=
n
i=1
m
i
, s
2
=
n
i=1
m
j=1
log t
ij
e s
3
=
n
i=1
m
j=1
t
ij
.
Aps algumas simplicaes do logaritmo da funo de verossimilhana obtemos:
log[L(, , )] =
n
i=1
F(t
i
; , ) +s
1
(log log log ()) +s
2
( 1)
s
3
. (3.12)
A seguir apresentamos as seguintes equaes para a obteno dos estimadores de mxima verossi-
milhana
, e
(obtidos no Apndice A.3):
= s
1
/
n
i=1
F(t
i
; ,
), (3.13)
( ) log( ) + log(s
3
/s
1
) s
2
/s
1
= 0, (3.14)
= s
3
1
/s
1
. (3.15)
3.2.2 Modelo destrutivo binomial negativo com varivel terminal
Supondo a varivel M
i
com distribuio binomial negativa, apresentamos a distribuio de
probabilidade da varivel destrutiva, M
i
, com varivel terminal, t
i
, para o modelo binomial negativo
dada por (Apndice A.4):
P[M
i
= m
i
|t
i
; N, , ] =
m
i
=m
i
_
m
i
m
i
_
F(t
i
; )
m
i
(1 F(t
i
; ))
m
i
m
i
(N +m
i
)
(N)m
i
!
N
(1 )
m
i
,
=
(N +m
i
)
(N)m
i
!
_
+ (1 )F(t
i
; )
_
N
_
1
+ (1 )F(t
i
; )
_
m
i
,
(3.16)
onde 0 < < 1, N = 1, 2, . . . e > 0.
Portanto, a distribuio de probabilidade da varivel destrutiva M
i
uma atualizao da dis-
tribuio binomial negativa com varivel terminal, t
i
, i = 1, 2, . . . , n, dada por:
M
i
|t
i
Binomial Neg.
_
N,
+ (1 )F(t
i
; )
_
.
MODELO DESTRUTIVO COM VARIVEL TERMINAL 23
A esperana e varincia podem ser obtidas de (2.4), isto ,
E[M
i
|t
i
] =
N(1 )F(t
i
; )
, (3.17)
V ar[M
i
|t
i
] = N(1 )F(t
i
; )
+ (1 )F(t
i
; )
2
. (3.18)
Para simplicar os algoritmos computacionais a serem desenvolvidos e evitar futuros problemas de
convergncia, vamos introduzir as seguintes reparametrizaes: = 1/(1 +) e N = 1/, em que
a mdia da distribuio binomial negativa. A funo de verossimilhana com varivel terminal
t
i
, i = 1, . . . , n, para o modelo destrutivo binomial negativo, em que F(t; ) uma distribuio
gama com parmetro = (, ), dada por:
L(, , , ) =
n
i=1
_
_
_
m
i
!
m
j=1
f(t
ij
; , )
F(t
i
; , )
(1/ +m
i
)
(1/)m
i
!
_
1
1 +F(t
i
; , )
_1
_
F(t
i
; , )
1 +F(t
i
; , )
_
m
i
_
_
_
.
(3.19)
Fazendo as devidas simplicaes em (3.19), temos que o logaritmo da funo de verossimilhana
dado por:
log L(, , , ) =
n
i=1
log (1/ +m
i
)
n
i=1
[(1/ +m
i
) log(1 +F(t
i
; , ))] s
3
/
+s
2
( 1) +s
1
(log() log log ()) nlog (1/),
sendo s
1
=
n
i=1
m
i
, s
2
=
n
i=1
m
j=1
log(t
ij
) e s
3
=
n
i=1
m
j=1
(t
ij
).
As condies de 1
a
e 2
a
ordem so apresentadas no Apndice A.4.1.
3.2.3 Modelo destrutivo Poisson com zeros inacionados e varivel terminal
Supondo a varivel M
i
com distribuio de Poisson com zeros inacionados, a distribuio de
probabilidade da varivel destrutiva, M
i
, com varivel terminal, t
i
, i = 1, . . . , n, para o modelo
Poisson com zeros inacionados dada por (ver Apndice A.5):
P[M
i
= m
i
|t
i
; , , ] = (1 )I
{0}
(m
i
) +
e
F(t
i
;)
(F(t
i
; ))
m
i
m
i
!
, (3.20)
tal que
I
{0}
(m
i
) =
_
1 , m
i
= 0;
0 , m
i
1.
Portanto, a varivel destrutiva, M
i
, dado t
i
, tem uma distribuio de Poisson com zeros inacio-
nados, com parmetros 0 < 1 e F(t
i
; ) para > 0 e > 0. A mdia e a varincia so obtidas
MODELO DESTRUTIVO COM VARIVEL TERMINAL 24
de (2.7) e (2.9) respectivamente. Logo temos,
E[M
i
|t
i
] = F(t
i
; ) (3.21)
V ar[M
i
|t
i
] = F(t
i
; )[1 +F(t
i
; )(1 )] (3.22)
Supondo que F(t; ) uma distribuio gama com parmetro = (, ), a funo de verossimilhana
baseada em dados ampliados para o i-simo animal com varivel terminal, t
i
, i = 1, . . . , n dada
por:
L
i
(, , , |t
i
) = m
i
!
m
j=1
f(t
ij
; , )
F(t
i
; , )
_
(1 )I
{0}
(m
i
) +
e
F(t
i
;,)
(F(t
i
; , ))
m
i
m
i
!
_
, (3.23)
em que m
i
e t
i
o nmero de tumores observados e o tempo de vida do i-simo animal para
j = 1, . . . , m
i
e i = 1, . . . , n, respectivamente. Logo, para os n animais a funo de verossimilhana
expressa como:
L(, , , |t
i
) =
n
0
i=1
_
1 +e
F(t
i
;,)
_
i:M
i
/ A
_
_
_
m
i
!
m
j=1
f(t
ij;,
)
F(t
i
; , )
e
F(t
i
;,)
(F(t
i
; , ))
m
i
m
i
!
_
_
_
,
=
n
0
i=1
[1 +e
F(t
i
;,)
]
nn
0
i:M
i
/ A
L
i
(, , ), (3.24)
em que A = {M
i
: M
i
= 0} e n
0
o nmero de elementos do conjunto A. Quando = 1, a funo de
verossimilhana em (3.24) reduz-se funo de verossimilhana correspondente ao modelo destrutivo
de Poisson. Os elementos do conjunto A so gerados de duas formas diferentes: alguns elementos
so gerados pela distribuio degenerada em zero (forma determinstica) e outros pela distribuio
de Poisson (forma aleatria). Como o modelo PZI uma mistura de duas distribuies, a funo de
verossimilhana em (3.24) ser simplicada utilizando o procedimento baseado em dados ampliados
introduzido por Tanner (1996). Neste caso, vamos introduzir a seguinte varivel latente:
Z
i
=
_
1, com probabilidade
i
;
0, com probabilidade 1
i
,
(3.25)
no qual
i
=
1
1 +e
F(t
i
;,)
i = 1, . . . , n
0
,
a probabilidade de o zero ser determinstico. A funo de verossimilhana baseada nos dados
ampliados D
a
= {D, Z
1
, . . . , Z
n
0
}, em que D = {M
, T, t
i
}, dada por (Apndice A.5.1):
L(, , , ; D
a
) = L(, , , )
n
0
i=1
_
(
i
)
Z
i
(1
i
)
1Z
i
, (3.26)
=
nZ
(1 )
Z
. .
zeros inacionados
exp {
n
0
i=1
[(1 Z
i
)F(t
i
; , )]}
i:M
i
/ A
L
i
(, , )
. .
dados do modelo original
,
(3.27)
MODELO DESTRUTIVO COM VARIVEL TERMINAL 25
em que Z =
n
0
i=1
Z
i
. O logaritmo da funo de verossimilhana ampliada em (3.27) dado por:
log L(, , , ; D
a
) = (n Z) log +Z log(1 )
n
0
i=1
(1 Z
i
)F(t
i
; , ) +
i:M
i
/ A
log L
i
(, , ),
= (n
n
0
i=1
Z
i
) log + log(1 )
n
0
i=1
Z
i
+
n
0
i=1
Z
i
F(t
i
; , )
n
0
i=1
F(t
i
; , ),
+[log log log ()]s
1
+ ( 1)s
2
s
3
i:M
i
/ A
F(t
i
; , ),
= (n
n
0
i=1
Z
i
) log + log(1 )
n
0
i=1
Z
i
+
n
0
i=1
Z
i
F(t
i
; , )
n
i=1
F(t
i
; , )
+(log log log ())s
1
+ ( 1)s
2
s
3
/,
(3.28)
em que s
1
=
i:M
i
/ A
m
i
, s
2
=
i:M
i
/ A
m
j=1
log(t
ij
) e s
3
=
i:M
i
/ A
m
j=1
t
ij
.
Devido presena da varivel aleatria latente Z
i
, os estimadores de mxima verosimilhana
sero obtidos atravs da maximizao de (3.28) utilizando o algoritmo EM (vide Dempster et al.
(1977)) com os seguintes passos:
Passo E: A esperana condicional do logaritmo da funo de verossimilhana ampliada
dada por:
E[log L(, , , ; D
a
)|D] = (n
n
0
i=1
E[Z
i
|D
a
]) log + log(1 )
n
0
i=1
E[Z
i
|D
a
]
+
n
0
i=1
E[Z
i
|D
a
]F(t
i
; , )
n
i=1
F(t
i
; , )
+(log log log ())s
1
+ ( 1)s
2
s
3
/,
no qual
E[Z
i
|D
a
] = 0 (1
i
) + 1
i
,
=
i
,
=
1
1 +e
F(t
i
;,)
.
Passo M: Maximizao da esperana.
Q(, , , |
(K)
,
(K)
,
(K)
,
(K)
) = E[log L(
(K)
,
(K)
,
(K)
,
(K)
; D
a
)|D], (3.29)
logo a esperana na K-sima iterao dada por:
MODELO DESTRUTIVO COM VARIVEL TERMINAL 26
Q(, , , |
(K)
,
(K)
,
(K)
,
(K)
) = (n
n
0
i=1
(K)
i
) log + log(1 )
n
0
i=1
(K)
i
+
n
0
i=1
(K)
i
F(t
i
; , )
n
i=1
F(t
i
; , )
+(log log log ())s
1
+ ( 1)s
2
s
3
/.
(3.30)
As derivadas em relao aos parmetros em (3.30), so apresentadas:
E[log L(
(K)
|D
a
)] =
n
n
0
i=1
(K)
i
n
0
i=1
(K)
i
1
= 0, (3.31)
E[log L(
(K)
|D
a
)] =
n
0
i=1
(K)
i
F(t
i
; , )
n
i=1
F(t
i
; , ) +
s
1
= 0, (3.32)
E[log L(
(K)
|D
a
)] =
n
0
i=1
(K)
i
F(t
i
; , )
n
i=1
F(t
i
; , ) (log() + ())s
1
+s
2
= 0,
(3.33)
E[log L(
(K)
|D
a
)] =
n
0
i=1
(K)
i
F(t
i
; , )
n
i=1
F(t
i
; , ) s
1
/ +s
3
/
2
= 0, (3.34)
em que ( ) =
i=1
(K)
i
)
n
0
i=1
(K)
i
= 0,
(n
n
0
i=1
(K)
i
) (n
n
0
i=1
(K)
i
+
n
0
i=1
(K)
i
) = 0,
= 1
n
0
i=1
(K)
i
n
.
De (3.32) temos que:
s
1
=
n
0
i=1
(K)
i
F(t
i
; , )
n
i=1
F(t
i
; , ),
= s
1
/(
n
i=1
F(t
i
; , )
n
0
i=1
(K)
i
F(t
i
; , )).
MODELO DESTRUTIVO COM VARIVEL TERMINAL 27
Derivando (3.32) em relao de e obtemos o seguinte:
n
0
i=1
(K)
i
F(t
i
; , )
n
i=1
F(t
i
; , ) = 0,
n
0
i=1
(K)
i
F(t
i
; , )
n
i=1
F(t
i
; , ) = 0.
Logo substituindo as expresses anteriores em (3.33) e (3.34), respectivamente, obtemos:
(log + ())s
1
+s
2
= 0, (3.35)
s
1
+
s
3
2
= 0. (3.36)
Resolvendo o sistema de equaes (3.35) e (3.36), obtemos a seguinte expresso:
(log(s
3
/s
1
) log + ())s
1
+s
2
= 0. (3.37)
Consequentemente, as estimativas de mxima verossimilhana so solues das seguintes equaes:
K+1
= s
1
/(
n
i=1
F(t
i
; , )
n
0
i=1
(K)
i
F(t
i
; , )), (3.38)
K+1
= 1
n
0
i=1
(K)
i
/n, (3.39)
( ) log + log(s
3
/s
1
) s
2
/s
1
= 0, (3.40)
=
1
s
3
/s
1
. (3.41)
As estimativas dos parmetros foram obtidas utilizando rotinas de maximizao do pacote R. As
condies de 1
a
e 2
a
ordenes foram vericadas computacionalmente.
3.2.4 Modelo destrutivo binomial negativo com zeros inacionados e varivel
terminal
Supondo a varivel M
i
com distribuio binomial negativa com zeros inacionados, apresentamos
a distribuio de probabilidade da varivel destrutiva, M
i
, com varivel terminal, t
i
, i = 1, . . . , n
para o modelo binomial negativo com zeros inacionados dada por (ver Apndice A.6):
P[M
i
= m
i
|t
i
; , , , ] = (1 )I
{0}
(m
i
) +
(
1
+m
i
)
(
1
)m
i
!
_
1
1 +F(t
i
; )
_1
_
F(t
i
; )
1 +F(t
i
; )
_
m
i
, (3.42)
em que
I
{0}
(m
i
) =
_
1 , m
i
= 0;
0 , m
i
1.
Portanto, a varivel destrutiva, M
i
, dado t
i
, tem uma distribuio binomial negativa com zeros
MODELO DESTRUTIVO COM VARIVEL TERMINAL 28
inacionados com parmetros 0 < 1, > 0 e F(t
i
; ) para > 0 e > 0. A mdia e a
varincia so obtidas de (2.11) e (2.12) respectivamente. Logo temos,
E[M
i
|t
i
] = F(t
i
; ), (3.43)
V ar[M
i
|t
i
] = F(t
i
; )[F(t
i
; )(1 ) + 1 +F(t
i
; )]. (3.44)
Supondo que F(t
i
; ) uma distribuio gama com parmetro = (, ), a funo de ve-
rossimilhana baseada em dados ampliados sob o modelo destrutivo binomial negativo com zeros
inacionados e varivel terminal, t
i
, dada por (ver Apndice A.6.1):
L(, , , , ) =
n
0
i=1
_
1 +
_
1
1 +F(t
i
; )
_1
_
nn
0
i:M
i
/ A
L
i
(, , , ), (3.45)
onde A = {M
i
: M
i
= 0} e n
0
o nmero de elementos do conjunto A. Para = 1, a funo de
verossimilhana em (3.45) reduz-se funo de verossimilhana correspondente ao modelo destrutivo
binomial negativo com varivel terminal dada em (3.19). O modelo destrutivo binomial negativo com
zeros inacionados e varivel terminal, tambm uma mistura de duas distribuies: distribuio
degenerada em zero e a distribuio binomial negativa. O procedimento similar, como apresentado
na Seo (3.2.3). A funo de verossimilhana em (3.45) ser simplicada, utilizando o procedimento
baseado em dados ampliados introduzido por Tanner (1996), com a seguinte varivel latente.
Y
i
=
_
1 , com probabilidade
i
;
0 , com probabilidade 1
i
,
(3.46)
no qual
i
=
1
1 +[1 +F(t
i
; )]
i = 1, . . . , n
0
,
a probabilidade do zero ser determinstico para o modelo destrutivo BNZI com varivel terminal.
A funo de verossimilhana baseada nos dados ampliados U
a
= {D, Y
1
, . . . , Y
n
0
}, em que D =
{M
, T, t
i
}, dada por (ver Apndice A.6.1):
L(, , , , ; U
a
) = L(, , , , )
n
0
i=1
_
(
i
)
Y
i
(1
i
)
1Y
i
,
=
nY
(1 )
Y
. .
zeros inacionados
n
0
i=1
(1 +F(t
i
; ))
Y
i
1
i:M
i
/ A
L
i
(, , , )
. .
dados do modelo original
,
(3.47)
onde Y =
n
0
i=1
Y
i
. O logaritmo da funo de verossimilhana ampliada em (3.47) :
l(, ; U
a
) = log L(, , , , ; U
a
)
MODELO DESTRUTIVO COM VARIVEL TERMINAL 29
em que = (, , ) e = (, ), temos que:
l(, ; U
a
) = (n Y ) log +Y log(1 ) +
n
0
i=1
(Y
i
1)
log(1 +F(t
i
; , )) +
i:M
i
/ A
log L
i
(, , , ),
= (n
n
0
i=1
Y
i
) log +Y log(1 )
n
0
i=1
(Y
i
1)
log(1 +F(t
i
; , ))
+
i:M
i
/ A
log (1/ +m
i
)
i:M
i
/ A
[(
1
+m
i
) log(1 +F(t
i
; , ))] s
3
/
+s
2
( 1) +s
1
(log() log log ()) (n n
0
) log (1/),
onde s
1
=
i:M
i
/ A
m
i
, s
2
=
i:M
i
/ A
m
j=1
log(t
ij
) e s
3
=
i:M
i
/ A
m
j=1
t
ij
.
Devido presena da varivel aleatria latente Y
i
os estimadores de mxima verosimilhana
sero obtidos atravs da maximizao de (3.48) utilizando o algoritmo EM (ver Dempster et al.
(1977)) com os seguintes passos:
Passo E: A esperana condicional do logaritmo da funo de verossimilhana ampliada
dada por:
E[l(, ; U
a
)|D] = (n
n
0
i=1
E[Y
i
|U
a
]) log + log(1 )
n
0
i=1
E[Y
i
|U
a
]
+
n
0
i=1
(E[Y
i
|U
a
] 1) log(1 +F(t
i
; , ))/ +
i:M
i
/ A
log (
1
+m
i
)
i:M
i
/ A
[(
1
+m
i
) log(1 +F(t
i
; , ))] s
3
/ +s
2
( 1)
+s
1
(log() log log ()) (n n
0
) log (1/),
onde
E[Y
i
|U
a
] = 0 (1
i
) + 1
i
,
=
i
,
=
1
1 +[1 +F(t
i
; )]
.
Passo M: Maximizao da esperana.
Q(, , , , |
(K)
,
(K)
,
(K)
,
(K)
,
(K)
) = E[l(
(K)
,
(K)
,
(K)
,
(K)
,
(K)
; U
a
)|D], (3.48)
logo a esperana na K-sima iterao dada por:
MODELO DESTRUTIVO COM VARIVEL TERMINAL 30
Q(, , , , |
(K)
,
(K)
,
(K)
,
(K)
,
(K)
) = (n
n
0
i=1
(K)
i
) log + log(1 )
n
0
i=1
(K)
i
+
n
0
i=1
(
(K)
i
1) log(1 +F(t
i
; , ))/ +
i:M
i
/ A
log (
1
+m
i
)
i:M
i
/ A
[(
1
+m
i
) log(1 +F(t
i
; , ))] s
3
/ +s
2
( 1)
+s
1
(log() log log ()) (n n0) log (1/),
(3.49)
As derivadas em relao aos parmetros em (3.49), so apresentadas:
E[l(
(K)
|U
a
)] =
n
n
0
i=1
(K)
i
n
0
i=1
(K)
i
1
= 0, (3.50)
E[l(
(K)
|U
a
)] =
n
0
i=1
(
(K)
i
1)F(t
i
; , )
1 +F(t
i
; , )
i:M
i
/ A
(1 +m
i
)F(t
i
; , )
1 +F(t
i
; , )
+
s
1
= 0, (3.51)
E[l(
(K)
|U
a
)] =
n
0
i=1
(
(K)
i
1)
_
F(t
i
; , )/
1 +F(t
i
; , )
log(1 +F(t
i
; , ))
2
_
+
i:M
i
/ A
log (1/ +m
i
)
i:M
i
/ A
(1/ +m
i
)F(t
i
; , )
1 +F(t
i
; , )
log(1 +F(t
i
; , ))
2
+
s
1
(n n
0
)
(1/)
= 0 (3.52)
E[l(
(K)
|U
a
)] =
n
0
i=1
(
(K)
i
1)
1 +F(t
i
; , )
F(t
i
; , )
i:M
i
/ A
(1/ +m
i
)
1 +F(t
i
; , )
F(t
i
; , )
+s
2
s
1
log () = 0
(3.53)
E[l(
(K)
|U
a
)] =
n
0
i=1
(
(k)
i
1)
1 +F(t
i
; , )
F(t
i
; , )
i:M
i
/ A
(1/ +m
i
)
1 +F(t
i
; , )
F(t
i
; , )
+
s
3
2
s
1
(3.54)
De (3.50) temos que:
(1 )(n
n
0
i=1
(K)
i
)
n
0
i=1
(K)
i
= 0,
(n
n
0
i=1
(K)
i
) (n
n
0
i=1
(K)
i
+
n
0
i=1
(K)
i
) = 0,
= 1
1
n
n
0
i=1
(K)
i
.
Das equaes (3.51): (3.54), no foi possvel expressar de maneira explcita os parmetros , ,
e . Portanto as estimativas dos parmetros sero obtidas utilizando rotinas de maximizao do
pacote R e as condies de 1
a
e 2
a
ordem sero vericadas computacionalmente.
MODELO DESTRUTIVO COM VARIVEL TERMINAL 31
3.2.5 Estudo de simulao para o modelo destrutivo PZI com varivel terminal
Um estudo de simulao foi realizado com objetivo de estudar as propriedades dos estimadores
de mxima verossimilhana do modelo destrutivo PZI com varivel terminal (dada na equao
(3.20)), com a distribuio Gama para os tempos de deteco.
A simulao foi realizada com a gerao de 1000 rplicas dos dados da seguinte forma:
Passo 1 : Gerar a varivel terminal t
i
de uma distribuio exponencial com taxa de 0, 002 sendo que os
valores gerados maiores que d = 280 (durao do experimento) so censurados em d = 280.
Nesta gerao de dados est sendo considerada a censura no tempo d.
Passo 2 : Gerar o nmero dos tumores, M
i
, da distribuio destrutiva Poisson com zeros inacionados
dada em (3.20) com parmetros = 0, 7 (proporo de zeros aleatrios) e F(t
i
, , ), onde
F() uma distribuio Gama de parmetros = 3, = 30 e = 5.
Passo 3 : Gerar os tempos de deteco t
(ij)
, de uma distribuio Gama truncada, isto 0 t
(ij)
t
i
.
Geramos amostras de tamanho n = 20, 30, 50, 100, 200. Para cada amostra so estimados os
parmetros da funo de verossimilhana atravs do algoritmo EM implementado no Sistema R.
Foram replicadas 1000 vezes cada amostra, foram calculados a mdia, o vis e o erro mdio qua-
drtico das estimativas dos parmetros , e , . Foi obtido o intervalo de conana de 95% para
cada parmetro baseado na teoria assinttica e vericou-se a sua probabilidade de cobertura (PC).
Analogamente foram gerados os dados com uma proporo de zeros aleatrios mais baixa, isto
, para = 0, 4; = 5 e = 3, = 30. Os resultados desta simulao so apresentados nas
Tabelas 3.2 e 3.3 e mostram que o procedimento de estimao pontual e os intervalos de conana
so consistentes assintoticamente, isto , a medida que aumentamos o tamanho da amostra as
estimativas cam cada vez mais prximas dos valores reais e a cobertura intervalar de conana
mais prxima dos valores nominais.
Neste estudo de simulao para o modelo destrutivo PZI com varivel terminal, surge uma
questo interessante: Se os dados gerados apresentam excesso de zeros, qual seria o impacto em
utilizar um modelo que ignora a proporo desses zeros?.
A soluo desta pergunta comea na gerao dos dados seguindo os passos do algoritmo de uma
distribuio destrutiva PZI com = 0, 7; = 5 e = 3, = 30, e no momento da estimao
adota-se o modelo destrutivo de Poisson. Os resultados da simulao so apresentados nas Tabelas
3.4 e 3.5, que mostram claramente que, utilizando o modelo destrutivo de Poisson, o impacto sobre
as estimativas e probabilidade de cobertura do parmetro muito grande. O mesmo no ocorre
com os demais parmetros.
MODELO DESTRUTIVO COM VARIVEL TERMINAL 32
Tabela 3.2: Mdia, Vis, EQM das estimativas de mxima verossimilhana para 1000 rplicas com alta
proporo de zeros aleatrios = 0, 7.
n parmetros Mdia Vis EQM PC
20 0, 7045139 0, 0045139 0, 0127141 0, 920
1
= 1, 265 (0, 279) [0, 718 1, 812] 997, 34 7, 151 0, 007
2
= 2, 323 (0, 396) [1, 547 3, 099]
1
= 3, 585 (1, 168) [1, 296 5, 874]
2
= 4, 119 (1, 036) [2, 088 6, 151]
1
= 44, 108 (20, 147) [4, 621 83, 595]
2
= 40, 608 (14.208) [12, 759 68, 456]
Tabela 4.2: Resultados do modelo destrutivo binomial negativo.
Estimativa Intervalos TRV P-valor
P(m)/f(t) (Erro padro) de conana 2logL
H
a
(
1
=
2
)
(
1
=
2
)
BN/Gama
1
= 1, 556 (0, 582) [0, 414 2, 695] 945, 584 1, 168 0, 56
2
= 2, 417 (0, 679) [1, 087 3, 747]
1
= 1, 871 (1, 030) [0, 147 3, 889]
2
= 1, 413 (0, 579) [0, 277 2, 55]
1
= 3, 721 (1, 214) [1, 342 6, 099]
2
= 4, 239 (1, 055) [2, 172 6, 308]
1
= 44, 701 (21, 353) [2, 847 86, 555]
2
= 39, 593 (13, 665) [12, 809 66, 376]
Tabela 4.3: Resultados do modelo destrutivo de Poisson com zeros inacionados.
Estimativa Intervalos TRV P-valor
P(m)/f(t) (Erro padro) de conana 2logL
H
a
(
1
=
2
)
(
1
=
2
)
PZI/Gama
1
= 0, 548 (0, 113) [0, 327 0, 769] 964, 438 2, 678 0, 26
2
= 0, 676 (0, 095) [0, 489 0, 861]
1
= 2, 448 (0, 624) [1, 225 3, 672]
2
= 3, 656 (0, 735) [2, 216 5, 095]
1
= 3, 706 (1, 192) [1, 369 6, 044]
2
= 3, 956 (1, 029) [1, 938 5, 974]
1
= 42, 664 (19, 186) [5, 06 80, 268]
2
= 44, 135 (16, 824) [11, 161 77, 109]
APLICAO COM DADOS REAIS 36
Tabela 4.4: Resultados do modelo destrutivo binomial negativo com zeros inacionados.
Estimativa Intervalos TRV P-valor
P(m)/f(t) (Erro padro) de conana 2logL
H
a
(
1
=
2
)
(
1
=
2
)
(
1
=
2
)
BNZI/Gama
1
= 0, 976 (1, 164) [1, 305 3, 256] 945, 5838 1, 1692 0, 76
2
= 1, 000 (0, 332) [0, 3490 1, 650]
1
= 1, 590 (1, 844) [2, 023 5, 204]
2
= 2, 418 (1, 021) [0, 4160 4, 420]
1
= 1, 780 (4, 419) [6, 880 10, 441]
2
= 1, 414 (1, 092) [0, 727 3, 554]
1
= 3, 719 (1, 214) [1, 3400 6, 099]
2
= 4, 239 (1, 056) [2, 1700 6, 309]
1
= 44, 686 (21, 348) [2, 8450 86, 527]
2
= 39, 597 (13, 679) [0, 3490 66, 407]
Os resultados do teste da razo de verossimilhana apresentados nas Tabelas 4.2, 4.3 e 4.4
mostram que o modelo binomial negativo, modelo PZI e o modelo BNZI so preferidos em relao
ao modelo de Poisson, quando = 0, 56, = 0, 26, e = 0, 76, respectivamente. Esses resultados
conrmam que no houve signicncia, isto , o tratamento com agente A no teve efeito no
experimento. A seguir so apresentados os resultados dos critrios de seleo do modelo para cada
grupo de tratamento.
Tabela 4.5: Seleo de modelo para o grupo controle.
Modelo N
o
de parmetros DEV AIC BIC
destrutivo no modelo
Poisson 3 365, 578 371, 578 375, 782
BN 4 353, 045 361, 045 366, 650
PZI 4 355, 367 363, 367 368, 971
BNZI 5 353, 045 363, 045 370, 051
Tabela 4.6: Seleo de modelo para o grupo com agente A.
Modelo N
o
de parmetros DEV AIC BIC
destrutivo no modelo
Poisson 3 624, 611 630, 611 634, 815
BN 4 592, 539 600, 539 606, 144
PZI 4 609, 072 617, 072 622, 677
BNZI 5 592.539 602, 539 609, 545
As Tabelas 4.5 e 4.6 mostram que o modelo BN e o modelo BNZI so os mais indicados para
ajustar os dados. A seguir apresentamos uma tabela de frequncias esperadas onde podemos observar
o ajuste em relao ao nmero de tumores.
APLICAO COM DADOS REAIS 37
Tabela 4.7: Freqncias esperadas de cada modelo
M
i
, com
varivel terminal, t
i
, dada por:
E[M
i
|t
i
] = E{E[M
i
= m
i
|M
i
= m
i
; ]},
= E{m
i
F(t
i
; )},
= E[M
i
]F(t
i
; ), (A.1)
com as mesmas propriedades, a varincia da varivel destrutiva, M
i
, com varivel terminal, t
i
,
dada por:
V ar[M
i
|t
i
] = E{V ar[M
i
= m
i
|M
i
= m
i
; ]} +V ar{E[M
i
= m
i
|M
i
= m
i
; ]},
= E{m
i
F(t
i
; )(1 F(t
i
; ))} +V ar{m
i
F(t
i
; )},
= E[M
i
]F(t
i
; ) F(t
i
; )
2
+F(t
i
; )
2
V ar[M
i
].
= (V ar[M
i
] E[M
i
])F(t
i
; )
2
+E[M
i
]F(t
i
; ). (A.2)
A.3 condies de 1
a
e 2
a
ordem do modelo destrutivo de Poisson
com varivel terminal
Condies de 1
a
ordem.
log[L(, , |t
i
)] =
n
i=1
F(t
i
; , ) +
s
1
= 0, (A.3)
log[L(, , |t
i
)] =
i=1
F(t
i
; , ) s
1
(log +
log ()) +s
2
= 0, (A.4)
log[L(, , |t
i
)] =
i=1
F(t
i
; , ) s
1
/ +s
3
/
2
= 0. (A.5)
Os estimadores de mxima verossimilhana
, e
sero obtidos derivando a equao A.3 em
relao a e , obtendo-se
i=1
F(t
i
; , ) =
i=1
F(t
i
; , ) = 0.
42
Substituindo esta ltima expresso nas equaes A.4 e A.5 obtemos que
( ) + log(
) = s
2
/s
1
, (A.6)
= s
3
1
/s
1
, (A.7)
onde ( ) =
= s
1
/
n
i=1
F(t
i
; ,
), (A.8)
( ) log( ) + log(s
3
/s
1
) s
2
/s
1
= 0, (A.9)
A equao (A.9) ser resolvida via mtodo Newton-Raphson. Assim, substituindo em (A.7) ob-
temos
e de (A.8) obtemos
. Como as estimativas no so obtidas explicitamente, vericaremos
que o ponto estimado (
, ,
) seja um ponto mximo da funo de verossimilhana atravs das
condies de 2
a
ordem dada no Captulo 2.
Condies de 2
a
ordem.
2
l(
, ,
) = s
1
/
2
(A.10)
2
l(
, ,
) =
i=1
2
F(t
i
, ,
) s
1
2
log(( )) (A.11)
2
l(
, ,
) =
i=1
2
F(t
i
, ,
) +
s
1
2
+
2s
3
3
(A.12)
as derivadas cruzadas em relao a , e so dadas por:
l(
, ,
) =
2
l(
, ,
) =
n
i=1
F(t
i
, ,
) (A.13)
l(
, ,
) =
2
l(
, ,
) =
n
i=1
F(t
i
, ,
) (A.14)
l(
, ,
) =
2
l(
, ,
) =
i=1
F(t
i
, ,
)
s
1
(A.15)
Todas as derivadas parciais de segunda ordem so calculados computacionalmente para vericar
que o ponto de estimativas um ponto mximo, seguindo a denio dada em (2.15) denido no
Captulo 2.
43
A.4 Distribuio da varivel destrutiva BN dada a varivel termi-
nal
P[M
i
= m
i
|t
i
; N, , ] =
m
i
=m
i
P[M
i
= m
i
|M
i
= m
i
; ]P[M
i
= m
i
; N, ]
=
m
i
=m
i
_
m
i
m
i
_
F(t
i
; )
m
i
(1 F(t
i
; ))
m
i
m
i
_
N +m
i
1
m
i
_
N
(1 )
m
i
=
m
i
=m
i
m
i
!F(t
i
; )
m
i
(1 F(t
i
; ))
m
i
m
i
m
i
!(m
i
m
i
)!
(N +m
i
)
(N)m
i
!
N
(1 )
m
i
m
i
+m
i
=
N
[(1 )F(t
i
; )]
m
i
(N)m
i
!
m
i
=m
i
(N +m
i
)
[(1 )(1 F(t
i
; ))]
m
i
m
i
(m
i
m
i
)!
=
N
[(1 )F(t
i
; )]
m
i
(N)m
i
!
(N +m
i
)
[F(t
i
; ) + F(t
i
; )]
N+m
i
=
(N +m
i
)
(N)m
i
!
_
+ (1 )F(t
i
; )
_
N
_
(1 )F(t
i
; )
+ (1 )F(t
i
; )
_
m
i
=
_
N +m
i
1
m
i
__
+ (1 )F(t
i
; )
_
N
_
1
+ (1 )F(t
i
; )
_
m
i
.
A.4.1 Condies de 1
a
e 2
a
ordem do modelo destrutivo BN com varivel ter-
minal
Condies de 1
a
ordem
log[L(, , )] =
n
i=1
_
(1/ +m
i
)F(t
i
; , )
1 +F(t
i
; , )
_
= 0 (A.16)
log[L(, , )] =
n
i=1
_
1
(1/ +m
i
)
(1/ +m
i
)
n
(1/)
(1/)
+s
1
/
i=1
_
(1/ +m
i
)F(t
i
; , )
1 +F(t
i
; , )
log(1 +F(t
i
; , ))
2
_
= 0 (A.17)
log[L(, , )] =
n
i=1
_
(1/ +m
i
)
1 +F(t
i
; , )
F(t
i
; , )
_
+s
2
s
1
(log +
log ()) = 0
(A.18)
log[L(, , )] =
n
i=1
_
(1/ +m
i
)
1 +F(t
i
; , )
F(t
i
; , )
_
+
s
3
2
s
1
= 0 (A.19)
44
Condies de 2
a
ordem
2
l( , , ,
) =
n
i=1
(1/ +m
i
)
2
F(t
i
; ,
)
2
(1 + F(t
i
; ,
))
2
(A.20)
2
l( , , ,
) =
n
i=1
2
log (1/ +m
i
)
n
i=1
_
(1/ +m
i
)
2
2
log(1 + F(t
i
; ,
))
log(1 + F(t
i
; ,
))
F(t
i
; ,
)
2
(1 + F(t
i
; ,
))
+
2 log(1 + F(t
i
; ,
))
3
_
n
2
2
log (1/ ) (A.21)
2
l( , , ,
) =
n
i=1
_
(1/ +m
i
)
1 + F(t
i
; ,
)
2
F(t
i
; ,
) +
_
F(t
i
; ,
)
_
2
_
s
1
2
log ( )
(A.22)
2
l( , , ,
) =
n
i=1
_
(1/ +m
i
)
1 + F(t
i
; ,
)
2
F(t
i
; ,
) +
_
F(t
i
; ,
)
_
2
_
2s
3
3
+
s
1
2
(A.23)
as derivadas cruzadas em relao a , , , so dadas por:
l( , , ,
) =
2
l( , , ,
) =
n
i=1
_
(m
i
F(t
i
; ,
))F(t
i
; ,
)
(1 + F(t
i
; ,
))
2
_
(A.24)
l( , , ,
) =
2
l( , , ,
) =
n
i=1
_
(1/ +m
i
)
(1 + F(t
i
; ,
))
2
F(t
i
; ,
)
_
(A.25)
l( , , ,
) =
2
l( , , ,
) =
n
i=1
_
(1/ +m
i
)
(1 + F(t
i
; ,
))
2
F(t
i
; ,
)
_
(A.26)
l( , , ,
) =
2
l( , , ,
) =
n
i=1
_
(m
i
F(t
i
; ,
))
(1 + F(t
i
; ,
))
2
F(t
i
; ,
)
_
(A.27)
l( , , ,
) =
2
l( , , ,
) =
n
i=1
_
(m
i
F(t
i
; ,
))
(1 + F(t
i
; ,
))
2
F(t
i
; ,
)
_
(A.28)
l( , , ,
) =
2
l( , , ,
) =
n
i=1
_
2
2
(1/ +m
i
)
(1 + F(t
i
; ,
))
2
F(t
i
; ,
)
F(t
i
; ,
)
+
(1/ +m
i
)
1 + F(t
i
; ,
)
F(t
i
; ,
)
s
1
_
(A.29)
Todas as derivadas parciais de segunda ordem so calculados computacionalmente para vericar
que o ponto de estimativas um ponto mximo, seguindo a denio dada em (2.15).
45
A.5 Distribuio da varivel destrutiva PZI dada a varivel termi-
nal
P[M
i
= m
i
|t
i
; , , ] =
m
i
=m
i
_
m
i
m
i
_
F(t
i
; )
m
i
(1 F(t
i
; ))
m
i
m
i
_
(1 )I
{0}
(m
i
) +
e
m
i
m
i
!
_
,
onde
I
{0}
(m
i
) =
_
1 , m
i
= 0;
0 , m
i
= 0.
1. m
i
= 0
P[M
i
= 0|t
i
; , , ] =
m
i
=0
(1 F(t
i
; ))
m
i
_
(1 )I
{0}
(m
i
) +
e
m
i
m
i
!
_
= 1 +e
m
i
=1
(1 F(t
i
; ))
m
i
m
i
m
i
!
= 1 +e
m
i
=1
[(1 F(t
i
; ))]
m
i
m
i
!
+ 1
_
= 1 +e
F(t
i
;)
.
2. m
i
= 1, 2, 3, . . .
P[M
i
= m
i
|t
i
; , , ] =
m
i
=m
i
_
m
i
m
i
_
F(t
i
; )
m
i
(1 F(t
i
; ))
m
i
m
m
i
m
i
+m
i
m
i
!
= e
[F(t
i
; )]
m
i
m
i
!
m
i
=m
i
[(1 F(t
i
; ))]
m
i
m
i
(m
i
m
i
)!
=
e
F(t
i
;)
[F(t
i
; )]
m
i
m
i
!
.
Logo, de 1 e 2 obtemos:
P[M
i
= m
i
|t
i
, , ] = (1 )I
{0}
(m
i
) +
e
F(t
i
;)
(F(t
i
; ))
m
i
m
i
!
,
onde
I
{0}
(m
i
) =
_
1 , m
i
= 0;
0 , m
i
1.
46
A.5.1 Funo de verossimilhana ampliada do modelo destrutivo PZI com va-
rivel terminal
L(, , , ; D) = L(, , , )
n
0
i=1
_
(
i
)
Z
i
(1
i
)
1Z
i
=
n
0
i=1
_
1 +e
F(t
i
;,)
_
nn
0
i
/ A
L
i
(, , )
n
0
i=1
_
(
i
)
Z
i
(1
i
)
1Z
i
_
,
=
n
0
i=1
(1 +e
F(t
i
;,)
)
nn
0
i
/ A
L
i
(, , )
n
0
i=1
_
1
1 +e
F(t
i
;,)
_
Z
i
_
e
F(t
i
;,)
1 +e
F(t
i
;,)
_
1Z
i
,
=
n
0
i=1
(1 +e
F(t
i
;,)
)
i
/ A
L
i
(, , )
nn
0
(1 )
n
0
i=1
Z
i
n
0
n
0
i=1
Z
i
e
n
0
i=1
[(1 Z
i
)F(t
i
; , )]
n
0
i=1
(1 +e
F(t
i
;,)
)
,
=
n
n
0
i=1
Z
i
(1 )
n
0
i=1
Z
i
e
n
0
i=1
[(1 Z
i
)F(t
i
; , )]
i
/ A
L
i
(, , ),
=
nZ
(1 )
Z
exp {
n
0
i=1
[(1 Z
i
)F(t
i
)]}
i
/ A
L
i
(, , ),
onde Z =
n
0
i=1
Z
i
.
A.6 Distribuio da varivel destrutiva BNZI com varivel terminal
P[M
i
= m
i
|t
i
; , , ] =
m
i
=m
i
_
m
i
m
i
_
F(t
i
; )
m
i
(1F(t
i
; ))
m
i
m
i
_
(1 )I
{0}
(m
i
) +
(N +m
i
)
(N)m
i
!
N
(1 )
m
i
_
,
onde = (, , ) e = , e
I
{0}
(m
i
) =
_
1 , m
i
= 0;
0 , m
i
1.
47
1. m
i
= 0
P[M
i
= 0|t
i
; , ] =
m
i
=0
(1 F(t
i
; ))
m
i
_
(1 )I
{0}
(m
i
) +
(N +m
i
)
(N)m
i
!
N
(1 )
m
i
_
= 1 +
N
+
m
i
=1
(1 F(t
i
; ))
m
i
(N +m
i
)
(N)m
i
!
N
(1 )
m
i
= 1 +
N
(N)
_
m
i
=1
(N +m
i
)
[(1 F(t
i
; ))(1 )]
m
i
m
i
!
+ (N)
_
= 1 +
N
(N)
_
m
i
=0
(N +m
i
)
[(1 F(t
i
; ))(1 )]
m
i
m
i
!
_
= 1 +
N
(N)
(N)
+ (1 )F(t
i
; )
N
,
= 1 +
_
+ (1 )F(t
i
; )
_
N
.
2. m
i
= 1, 2, 3, . . .
P[M
i
= m
i
|t
i
; , ] =
m
i
=m
i
_
m
i
m
i
_
F(t
i
; )
m
i
(1 F(t
i
; ))
m
i
m
(N +m
i
)
(N)m
i
!
N
(1 )
m
i
,
=
N
[(1 )F(t
i
; )]
m
i
(N)m
i
!
m
i
=m
i
(N +m
i
)
[(1 )(1 F(t
i
; ))]
m
i
m
i
(m
i
m
i
)!
,
=
N
[(1 )F(t
i
; )]
m
i
(N)m
i
!
(N +m
i
)
[ + (1 )F(t
i
; )]
N+m
i
,
=
_
+ (1 )F(t
i
; )
_
N
_
1
+ (1 )F(t
i
; )
_
m
i
,
Logo, de 1 e 2 obtemos:
P[M
i
= m
i
|t
i
, , ] = (1)I
{0}
(m
i
)+
(N +m
i
)
(N)m
i
!
_
+ (1 )F(t
i
; )
_
N
_
1
+ (1 )F(t
i
; )
_
m
i
,
onde
I
{0}
(m
i
) =
_
1 , m
i
= 0;
0 , m
i
1.
A.6.1 Funo de verossimilhana ampliada do modelo destrutivo BNZI com
varivel terminal
A funo de verossimilhana baseada em dados ampliados para o i-simo animal do modelo
destrutivo Binomial Negativo com zeros inacionados e varivel terminal, t
i
, dada por:
L
i
(, , , , ) = m
i
!
m
j=1
f(t
ij
; , )
F(t
i
; , )
_
(1 )I
{0}
(m
i
) +
(
1
+m
i
)
(
1
)m
i
!
_
1
1 +F(t
i
; )
_ 1
_
F(t
i
; )
1 +F(t
i
; )
_
m
i
_
.
48
Logo, para os n animais a funo de verossimilhana expressa como:
L(, , , , ) =
n
0
i=1
L
i
(, , , , )
i
/ A
L
i
(, , , , )
segue
=
n
0
i=1
_
1 +
_
1
1 +F(t
i
; )
_ 1
_
M
i
/ A
_
_
_
m
i
!
m
j=1
f(t
ij;,
)
F(t
i
; , )
(
1
+m
i
)
(
1
)m
i
!
_
1
1 +F(t
i
; )
_ 1
_
F(t
i
; )
1 +F(t
i
; )
_
m
i
_
_
_
,
=
n
0
i=1
_
1 +
_
1
1 +F(t
i
; )
_ 1
_
nn
0
i
/ A
L
i
(, , , ),
Com uso da varivel latente
Y
i
=
_
1 , com probabilidade
i
;
0 , com probabilidade 1
i
,
os procedimentos da funo de verossimilhana baseada em dados ampliados so mostrados a seguir:
L(, , , , ; H
a
) = L(, , , , )
n
0
i=1
_
(
i
)
Y
i
(1
i
)
1Y
i
,
=
n
0
i=1
_
1 + [1 +F(t
i
; )]
nn
0
i
/ A
L
i
(, , , )
n
0
i=1
_
1
1 +[1 +F(t
i
; )]
_
Y
i
_
[1 +F(t
i
; )]
1 +[1 +F(t
i
; )]
_
1Y
i
,
=
n
0
i=1
_
1 + [1 +F(t
i
; )]
nn
0
i
/ A
L
i
(, , , )
(1 )
n
0
i=1
Y
i
n
0
n
0
i=1
Y
i
n
0
i=1
(1 +F(t
i
; ))
Y
i
1
n
0
i=1
[1 +(1 +F(t
i
; ))
]
,
=
n
n
0
i=1
Y
i
(1 )
n
0
i=1
Y
i
n
0
i=1
(1 +F(t
i
; ))
Y
i
1
i
/ A
L
i
(, , , ),
=
nY
(1 )
Y
n
0
i=1
(1 +F(t
i
; ))
Y
i
1
i
/ A
L
i
(, , , ),
em que Y =
n
0
i=1
Y
i
.
Referncias
Akaike, H. (1973). Information theory and an extension of the maximum likelihood principle, volume 1,
pages 267281. Akademiai Kiado. 16
Berkson, J. & Gage, R. P. (1952). Survival curve for cancer patients following treatment. Journal of the
American Statistical Association, 47(259), 501515. 39
Bohning, D., Dietz, E., Schlattmann, P., Mendona, L. & Kirchner, U. (2000). The zero-inated poisson
model and the decayed, missing and lled teeth index in dental epidemiology. Journal of the Royal
Statistical Society: Series A (Statistics in Society), 163(1), 121122. 10
Bolfarine, H. & Sandoval, M. (2001). Introduo inferncia estatstica. SBM. 12, 13
Boone, C. W., Kello, G. J. & Malone, W. E. (1990). Identication of candidate cancer chemopreventive
agents and their evaluation in animal models and human clinical trials: A review. 50(1), 29. 2
Borgatto, A. F. (2004). Modelos para propores com superdispero e excesso de zeros - Um procedimento
bayesiano. Tese (Doutorado em Agronoma). Universidade Federal de So Paulo - Piracicaba. 10
Casella, G. & Berger, R. L. (2001). Statistical Inference. Duxbury/Thomson Learning, Pacic Grove, CA,
second edition. 19
Chen, M.-H. & Ibrahim, J. G. (2001). Maximum likelihood methods for cure rate models with missing
covariates. Biometrics, 57(1), 4352. 39
Chen, Y. H. J. & Liu, G. H. F. (2006). A note on the estimate of treatment eect from a Cox regression model
when the proportionality assumption is violated. Communications in Statistics Theory and Methods,
35(1-3), 521526. 39
Chin-Chang (2011). Identiability of zero-inated poisson models. Brazilian Journal of Probability and
Statistics. 39
Cooner, F., Banerjee, S., Carlin, B. P. & Sinha, D. (2007). Flexible cure rate modeling under latent activation
schemes. Journal of the American Statistical Association, 102, 560572. 39
Dempster, A., Laird, N. & Rubin, D. (1977). Maximum likelihood from incomplete data via the EM
algorithm. Journal of the Royal Statistical Society, Series B,, 39, 138. 13, 25, 29
Dunson, D. B. & Dinse, G. E. (2000). Distinguishing eects on tumor multiplicity and growth rate in
chemoprevention experiments. Biometrics, 56(4), 10681075. 3
Farewell, V. (1986). Mixture models in survival analysis: Are they worth the risk. Can. J. Statist., 14,
257262. 39
Freedman, L., Midthune, D., Brown, C., Steele, V. & Kello, G. (1993). Statistical analysis of cancer
chemoprevention experiments. JSTOR: Biometrics, 49, 259268. i, ii, 2, 4, 6, 7, 17, 19, 34
Gupta, P. L., Ramesh C., G. & T., R. C. (1996). Analysis of zero-adjusted count data. Computational
Statistics & Data Analysis, 23(2), 207 218. 10
Johnson, N. L.; Kotz, S. (1969). Discrete Distributions: distribution in statistics . John Wiley and Sons Inc.
7
49
50
Kodell, R. L. & Chen, J. J. (2001). Inferring eects on tumor frequencies and times to observation in the
analysis of tumor multiplicity data. Biometrical Journal , 43(4), 447460. 3
Kokoska, S. M. (1987). The analysis of cancer chemoprevention experiments. Biometrics, 43, 525534. i, ii,
2, 3, 4, 6, 7, 17
Kokoska, S. M. (1988). Including data from early deaths in the analysis of cancer chemoprevention experi-
ments. Applied Mathematics Letters, 1(2), 197 201. 2, 14
Kumara, S. S. P. & Chin, H. C. (2003). Modeling accident occurrence at signalized tee intersections with
special emphasis on excess zeros. Trac Injury Prevention, 4(1), 5357. 10
Lambert, D. (1992). Zero-inated poisson regression with an application to defects in manufacturing. Te-
chnometrics, 34(1), 114. 9, 10
Molefe, D. F., Chen, J. J., Howard, P. C., Miller, B. J., Sambuco, C. P., Forbes, P. D. & Kodell, R. L. (2005).
Tests for eects on tumor frequency and latency in multiple dosing photococarcinogenicity experiments.
Journal of Statistical Planning and Inference, 129(1-2), 39 58. 3
Nelder, J. A. & Wedderburn, R. W. M. (1972). Generalized linear models. Journal of the Royal Statistical
Society. Series A (General), 135(3), 370384. 8
Ridout, M., Demetrio, C. G. B. & Hinde, J. (1998). Models for Count Data with Many Zeros. pages 179192.
10
Rodrigues, J. (2003). Bayesian analysis of zero-inated distributions. Communications in Statistics Theory
and Methods, 32(2), 281289. 10
Rodrigues, J., Cancho, V. G., de Castro, M. & Louzada-Neto, F. (2009). On the unication of the long-term
survival models. Statistics and Probability Letters, 79, 753759. 39
Rodrigues, J., de Castro, M., Balakrishnan, N. & Cancho, V. (2010). Destructive weighted Poisson cure rate
models. Lifetime Data Analysis. i, ii, 3, 4, 6, 17, 18, 38, 39
Saito, M. (2005). Inferencia Bayesiana para dados disretos com excesso de zeros . Dissertao (Mestrado
em Estatstica). Universidade Federal de So Carlos. 10
Schwarz, G. (1978). Estimating the dimension of a model. Annals of Statistics, 6, 461464. 16
Silva, D. D. (2009). Classe de distribues serie de potencias inacionadas com aplicaes . Dissertao
(Mestrado em Estatstica). Universidade Federal de So Carlos. 8
Tanner, M. A. (1996). Tools for Statistical Inference: Methods for the Exploration of Posterior Distributions
and Likelihood Functions. Springer, New York, NY, third edition. 24, 28
Thompson, H. J., Meeker, L. D. & Kokoska, S. (1984). Eect of an inorganic and organic form of dietary
selenium on the promotional stage of mammary carcinogenesis in the rat. Cancer Research, 44(7), 2803
2806. 1
Wang, M.-C., Qin, J. & Chiang, C.-T. (2001). Analyzing recurrent event data with informative censoring.
Journal of the American Statistical Association, 96(455), pp. 10571065. 39
Yakovlev, A. Y. & Tsodikov, A. D. (1996). Stochastic Models of Tumor Latency and Their Biostatistical
Applications. World Scientic, Singapore. 3, 39
Yang, G. L. & Chen, C. W. (1991). A stochastic two-stage carcinogenesis model: a new approach to
computing the probability of observing tumor in animal bioassays. Mathematical Biosciences, 104, 247
258. 39
Yin, G. & Ibrahim, J. G. (2005). Cure rate models: a unied approach. The Canadian Journal of Statistics,
33(4), 559570. 39