Escolar Documentos
Profissional Documentos
Cultura Documentos
Assinatura do Orientador
15 de Janeiro de 2018
Presidente Prudente
2018
Paulo Roberto de Lima Gianfelice
Presidente Prudente
2018
Ficha Catalográca
119 f.: il
Presidente Prudente
2018
À Olézia Gianfelice!
AGRADECIMENTOS
Agradeço, sobretudo a Deus, pela saúde, sabedoria, proteção, ânimo e paciência, sem estes
itens eu não teria conseguido nem mesmo me vencer. Não é possível para o homem, sozinho,
sair do lugar mais improvável, superar todos os obstáculos, ir contra todas as expectativas
Agradeço aos meus pais por me conceber, como o primeiro e com o máximo de amor.
Sem seus cuidados, exemplos e feitos eu jamais teria tomado esta direção, chegado onde
estou e tomado as decisões que tomei. Agradecerei até o m da minha vida pelos meus três
lindos irmão, eles são inspiração e razão primordiais das minhas conquistas.
Agradeço do fundo do meu coração à toda minha família, pela compreensão, apoio e
incentivo, sem o amparo e os conselhos deles eu teria me perdido no curso desta jornada.
sempre se lembrar e acreditar em mim e a segunda por todo o carinho, amparo, ajuda,
compreensão e valor. Estes dois literalmente investiram em mim nesta fase e tudo o que
faço aqui é para compensá-los. Embora não saberei como, pois seus carinhos, orientações e
Ivanildo Silvestre Bezerra. Ambos pela inclinação e assiduidade docente! A primeira por me
ensinar a disciplina mais importante na academia, a ter disciplina perante meus estudos,
Aos meus colegas de curso, Nadal e Chico, que acreditaram em minhas capacidades, e
aos experimentadores do extinto DFQB, Bruno e André, que iniciaram a vida acadêmica
comigo.
Agradeço por m a todos os envolvidos de forma direta e indireta na realização deste
Reginaldo, Clóvis, Jonas, Gustavo, Yugi, Léo, Vinícius, Laison, Letícia e Rafael. Estes foram
(Raimundo Correia)
RESUMO
necessária para cumpri-los. O terceiro busca justicar os resultados obtidos para as proprie-
dades do modelo Inverso de Chen e propor uma caracterização para o mesmo destacando as
demonstrações necessárias. O quarto capítulo segue a mesma linha, porém, com o suporte
métodos clássico e bayesiano, ressaltando uma avaliação dos estimadores do modelo através
conjunto de dados de tempo de vida completo e censurado e o sexto capítulo, por m, naliza
o trabalho apresentando uma discussão sobre as conclusões dos resultados obtidos ao longo
dos capítulos 3, 4 e 5.
1 INTRODUÇÃO 1
2 CONCEITOS BÁSICOS 4
2.1 Análise de Sobrevivência e Conabilidade . . . . . . . . . . . . . . . . . . . . 4
2.1.7 Censura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
ix
2.5.1 O Estimador de Kaplan-Meier . . . . . . . . . . . . . . . . . . . . . . 37
5 CONCLUSÕES PARCIAIS 99
REFERÊNCIA BIBLIOGRÁFICA 101
APÊNDICE 103
CAPÍTULO 1
INTRODUÇÃO
o tempo que decorre até que o evento de interesse se verique. Sobretudo, foram as áreas da
onde técnicas estatísticas são aplicadas para estudos médicos envolvendo doenças incuráveis
ou casos de pacientes terminais cujo interesse é, literalmente, medir o tempo em que estes
engenharia são postos em observação, sendo de interesse conhecer sua qualidade ou tempo
itens observados (unidades experimentais) onde eventos bem denidos (falha, sobrevivência)
cia).
de um sintoma ou doença, ou como na maior parte dos estudos em Biomedicina, a cura para
1
Introdução
posta é, geralmente, o tempo até a ocorrência de um evento de interesse analisado nos dados
cidas.
categorias de dados são comumente caracterizadas pelo tempo de falha e pela censura, am-
modelos paramétricos (ou probabilísticos) que se mostram muito ecientes para descrever
cos é realizada através da simples observação das informações disponíveis sobre o sistema
parâmetros (constantes), que são intrínsecos ao sistema a ser estudado e as variáveis que o
afeta, a partir dos dados disponíveis e o conhecimento das variáveis do sistema, através da
estimação dos parâmetros é possível descrever este fenômeno através do modelo estatístico
ou fenômeno, não é uma escolha trivial e deve ser efetuada de modo a satisfazer todas as
Com este objetivo, os resultados até agora obtidos à cerca do modelo proposto no pre-
sente estudo caracteriza-se em três etapas e em cada caso busca destacar minuciosamente
A primeira etapa, intitulada por Conceitos Básicos, fornece a descrição teórica dos con-
ceitos que serão abordados neste trabalho, como a linha de aplicação do trabalho, o conceito
tudo, na seção O Modelo Inverso de Chen Com Dois Parâmetros, e por m o ferramental
2
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
mação.
detalhadas dos pontos considerados na obtenção de uma pré caracterização para a distri-
ordem 1 e 2 para garantir que a hipótese da média e variância nitas são aceitas para a apli-
Limite.
objetivo principal nesta etapa do trabalho é realizar um estudo de simulação para avaliar os
lação necessários para investigar, avaliar e descrever o comportamento deste modelo para
possível a realização de uma analise preliminar de dados, modelagem, estimação dos parâ-
espera-se que a probabilidade obtida esteja o mais próximo possível do nível de conança
primeiro com dados referentes a tempos de falha completos e o segundo com tempo de falha
Em ambos os casos de estudo com dados reais, busca-se modelar o curso de tempo do
parte do trabalho é, com base nos resultados, constatar que o modelo probabilístico Inverso
de Chen fornece um excelente ajuste aos dados de sobrevivência, quando eles apresentam
função de risco unimodal, também mostrar que em uma comparação com outros modelos
propostos pela literatura, o modelo em questão é o mais adequado para analisar e descrever
3
CAPÍTULO 2
CONCEITOS BÁSICOS
aplicação deste trabalho, e são denidas como métodos estatísticos usados para análise de
(Teoria de Conabilidade).
observado. O nome genérico para este tempo é o tempo de sobrevivência, ou tempo de vida,
estatística seria aplicável. Uma que é fortemente favorecida para analisar as variáveis em
torno deste evento, e que merece destaque, é análise estatística multivariada. No entanto, é
muito comum que ao nal do acompanhamento do evento alguns indivíduos não manifestam
Além disso, os dados de sobrevivência raramente são distribuídos normalmente, são envi-
fora do contexto da análise. São estas as características dos dados que tornam os métodos
aqui abordados primordiais para a análise estatística de dados e indispensáveis para a ob-
terminado tratamento, e tais estimativas são obtidas através do método EKM (estimador
4
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
de Kaplan - Meyer), onde a análise preliminar e a visualização das curvas empíricas são im-
portantes para fazer suposições adequadas sobre um modelo estatístico especíco que busca
cia estatística, ou de modo mais renado, com o embasamento da Inferência Bayesiana para
tica para os dados de tempo de vida para posteriormente aplicá-los efetivamente em áreas
No presente trabalho, para os tópicos subsequentes desta área de estudo, devido a ex-
tensão e a gama de assuntos que se podem abordar na área de estudo da Teoria de Cona-
bilidade, será abordada, em particular, a partir deste ponto, apenas o campo de estudo de
Análise de Sobrevivência, de modo que, dois elementos básicos e intrínsecos a este conceito:
Tempo de Falha e Dados de Sobrevivência; devem, necessariamente, ser denidos para dis-
Estes elementos devem ser claramente denidos e, juntamente com Função de Sobrevi-
vência, Função Densidade de Risco e Função de Risco Acumulado, são discutidos em detalhes
como segue.
... ,n) sob estudo, são representados pelo par ordenado (ti ; δi ), onde:
(
1 ou + se ti é um tempo de falha;
δi =
0 ou 'nenhum simbolo' se ti é um tempo censurado;
5
Conceitos Básicos
onde a variável aleatória resposta, ou seja, o banco de dados, é representado por pelo menos
especicada em Análise de Sobrevivência pela sua função de sobrevivência, que será denida
na sequência.
não falhar até certo tempo t, ou seja, a probabilidade de que um evento de interesse não
por mais do que 365 dias (valor t da variável aleatória T) a partir da conclusão de seu di-
S(t) = P (T ≥ t) (2.1)
6
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
logo
cada uma representando um grupo distinto, o grupo 1, o grupo 2 e o grupo 3, onde se observa
que o tempo de vida do grupo 1 é superior aos outros 2 grupos na maior parte do tempo.
evento de interesse não ocorra até o tempo t=1 ano é 0 para no grupo 1, 0.38 para o grupo
2 e 0.48 no grupo 3.
evento, que pode ou não ser pré-estabelecido no início da pesquisa. Em geral, uma falha pode
ser a morte de um ser ou uma unidade experimental em estudo, a recaída de uma doença,
mas pode também ser considerado como a melhora no quadro clínico de um paciente (Cesar,
2005).
7
Conceitos Básicos
De acordo com esta denição observa-se que o conjunto de tempo de falha compõe o que
Consideremos, por exemplo, dados que representam o tempo em dias até a morte (tempo
Note que neste exemplo o evento de interesse é a morte causada pelo câncer e que o
dado de interesse é o tempo em dias até a ocorrência da morte. Comumente, pela literatura,
como descrito na seção 2.1.1 o símbolo (0) indica um tempo de observação incompleto em
um certo paciente no processo, o que é tratado como censura e o simbolo (1) indica que o
O tempo de falha é geralmente medido em horas, dias, semanas ou até mesmo anos
dependendo do estudo a ser realizado, é ainda constituído por três elementos, tais como o
• tempo inicial: é o tempo de início de estudo que deve ser precisamente denido de modo
pesquisa;
• evento de interesse: na maioria dos casos é dado como indesejável e, como denido
origem do estudo.
Além disso, podem surgir outras escalas de medidas, como o número de ciclos de um
medida de carga, desde que possa ser relacionada ao tempo de falha, de vida ou de trata-
mento.
8
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
O evento de interesse pode ainda ocorrer devido a uma única causa ou devido a duas ou
mais. Quando causas de falha competem entre si ocorre o que se denomina riscos competi-
tivos.
Quando se pretende saber ao certo qual é a probabilidade de um paciente com uma deter-
minada doença incurável vir a óbito depois de sobreviver por 365 dias após ser diagnosticado
intervalo [t1 ; t2 ).
A Função Taxa de Falha, ou Função Densidade de Risco (Função de Risco), λ(t), é a
e uma decrescente.
Figura 2.2: Representação gráca da Função Taxa de Falha para 3 grupos distintos.
Supondo que as funções representem o tempo de vida humano, observa-se que a função
crescente indica que a taxa de falha aumenta à medida que o tempo aumenta, este efeito
A função constante indica que a taxa de falha não se altera com o passar do tempo, um
9
Conceitos Básicos
A função decrescente, por sua vez, mostra que a taxa de falha diminui com o transcorrer
P (t1 ≤ T ≤ t2 |T ≥ t1 )
Como a taxa de falha no intervalo [t1 ; t2 ) é denida como a probabilidade de que a falha
ocorra neste intervalo, dado que não ocorreu antes de t1 , dividida pelo comprimento do in-
tervalo, temos:
De modo geral, redenindo o intervalo [t1 ; t2 ) como [t; t + ∆t) podemos assumir que a
P (t ≤ T ≤ t + ∆t)
λ(t) = (2.3)
∆t · P (T ≥ t)
f dr de T é denida como:
Teorema 2.1 Seja T uma variável aleatória que representa o tempo de falha de uma unidade
experimental de um dado estudo. Sendo f (t) uma função densidade de probabilidade e S(t)
a função de sobrevivência, ambos no tempo T = t. Então teremos que
f (t)
λ(t) = (2.5)
S(t)
P (t ≤ T ≤ t + ∆t|P (T ≥ t))
λ(t) = lim =
∆t→0 ∆t
P (t ≤ T ≤ t + ∆t)
= lim =
∆t→0 ∆t · P (T ≥ t)
P (t ≤ T ≤ t + ∆t)
= lim =
∆t→0 ∆t · S(t)
10
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
1 P (t ≤ T ≤ t + ∆t) f (t)
= · lim =
S(t) ∆t→0 ∆t S(t)
Teorema 2.2 Seja T a variável aleatória que representa o tempo de falha de uma unidade
experimental de um dado estudo. Sendo f (t) uma função densidade de probabilidade e S(t)
a função de sobrevivência, ambos no tempo T = t, então teremos que a função densidade de
risco de T , expressa em termos da derivada do log[S(t)], é dada por:
d
λ(t) = − log[S(t)] (2.6)
dt
f (t) 1 d 1 d 1 d
λ(t) = = · F (t) = · [1 − S(t)] = · [−S(t)] =
S(t) S(t) dt S(t) dt S(t) dt
1 d d
= − · [S(t)] = − log[S(t)]
S(t) dt dt
Zx
F (u) = f (u)du
−∞
Neste contexto, outra, sem dúvida uma das mais úteis em estudos de Análise de Sobre-
vivência, é a Função de Risco Acumulado (f ra), que como o próprio nome sugere, fornece a
Zt
Λ(u) = λ(u)du (2.7)
11
Conceitos Básicos
Teorema 2.3 Seja T uma variável aleatória que representa o tempo de falha de uma unidade
experimental em um dado estudo. Sendo S(t) a função de sobrevivência no tempo T = t,
então a função de risco acumulado em termos do log[S(t)] é dado por
Zt Zt Zt
d 1
Λ(t) = λ(u)du = − log[S(u)] du = − du =
du S(u)
0 0 0
= −log[S(t)] + log[S(0)] =
= −log[S(t)] + log[P (T ≥ 0)] =
do tempo pode ser representada por uma curva cujo gráco possui os formatos, além da
12
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
A partir de uma análise das funções ciclo de vida observa-se três comportamentos dis-
útil, conforme Wuttke (2008) assume em sua abordagem para Teoria de Conabilidade,
o valor da taxa de falha é praticamente constante, nesta fase as falhas que ocorrem são,
3. Na fase de crescimento, onde t ≥ t2 , a taxa de falha tende a ser alta e crescente, o que
observação.
Funções de risco com este comportamento são chamadas de funções ciclo de vida e seu
Figura 2.3: Representação gráca da Curva da Banheira e suas três fases distintas.
De modo similar, o gráco convexo-côncavo representa também três fases da vida ca-
modo que a medida que se avança no tempo, a curva representa o crescimento, constância
13
Conceitos Básicos
São curvas conhecidas na literatura por representar a maior taxa de risco, ou simples-
mente uma moda para as unidades experimentais sobre risco, daí o título de função unimodal
2. Na fase de taxa de risco extremo, o valor da taxa de falha são os mais altos e repre-
3. Na fase de crescimento a taxa de falha tende a ser baixa e decrescente, o que sugere
Na gura a seguir são apresentados quatro curvas de risco: EMPÍRICA, M1, M2 e M3. A
primeira representa um modelo de função de risco empírico, onde o gráco resultante mostra
uma distribuição de probabilidade que melhor se ajuste aos dados do tempo de vida do
14
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
indivíduo e que represente, sobretudo, taxa de risco bathtub (banheira) ou risco unimodal.
modelos Normal, Log-Normal, Gama, Exponencial e Weibull, porém, existem vários estudos
que apontam a origem de novas distribuições e que garantem um ajuste mais graticante.
2.1.7 Censura
um tempo não previsto no estudo (Cesar, 2005, p.1). Comumente, na literatura, os dados
de estudo, em geral, a censura ocorre quando o tempo de falha de um dos pacientes não
é observado, neste contexto, o paciente deixa de ser observado ou o experimento deve ser
encerrado.
interesse, ou seja, quando ocorre por outras causas além da estudada, também é dada como
censura.
Figura 2.5: Gráco de Censura e falha no tempo dos pacientes do estudo do câncer de ovário.
15
Conceitos Básicos
encontra, pois na prática, é feita a utilização de resultados assintóticos para realizar a análise
estatística destes dados, resultados que não exigem o reconhecimento do mecanismo de cen-
sura de modo que as mesmas técnicas estatísticas são utilizadas na análise de dados oriundos
dos três mecanismos de censura (Colosimo Giolo, 2006, p.11-12) que veremos a seguir.
Colosimo e Giolo (2006) defendem que alguns mecanismos de censura são diferenciados
até um tempo limite L, pré-xado e a unidade experimental que ainda não sofreu o
• Censura Tipo II é a que se caracteriza no estudo encerrado após ter ocorrido o evento de
2007).
estudo sem que a falha tenha ocorrido ou se a falha ocorre por razões diferentes da
estudada (Colosimo e Giolo, 2006, p.8). Quando uma unidade experimental é incorpo-
rada ao estudo de maneira aleatória, neste caso também ocorre uma censura aleatória
(Fogo, 2007).
Estes três mecanismos de censura são conhecidos como Censura à Direita, ou Censura
Anterior ao Tempo, pois o tempo de ocorrência observado do evento de interesse ocorre antes
do tempo registrado.
Outra ilustração para dados censurados (Colosimo e Giolo, 2006, p.51) considera os tem-
pos de reincidência de 10 pacientes com tumor sólido, onde 6 deles reincidem nos tempo 3,
nos tempos 4, 5.7 e 10, e um deles deixou de fazer parte do estudo aos 8.4 meses de acom-
panhamento, assumindo que o experimento foi elaborado para durar 18 meses, o esquema a
registrado é maior do que o tempo de falha, ou seja, o evento de interesse ocorre anteri-
sobrevivência não são exatamente conhecidos e sabe-se apenas que eles ocorreram dentro de
16
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
Supondo um estudo com nal previsto no tempo t = 25, a gura a seguir ilustra os
a censura, sendo os três últimos mecanismos com censura anterior ao tempo, segundo Colo-
Note que a gura poderá ser interpretada como um gráco dividido em quatro quadrantes
onde:
17
Conceitos Básicos
◦
• o 1 quadrante: representa os Dados com Censura Tipo I, onde nem todas as unidades
observada no tempo t = 5;
◦
• o 2 quadrante: representa os Dados Completos, onde todas as unidades experimentais
de algumas unidades experimentais foi interrompido de modo que elas não experimen-
Surge assim algumas questões inerentes a qualquer pesquisa cientíca quando o interesse
não for?
útil e indispensável quando o pesquisador não dispõe de um rol de dados signicantes para
do caso com a posse de alguns dados permite obter uma medida quantitativa da certeza
• existem razões para se acreditar que alguns fatos são mais propensos do que outros
18
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
notado por f (x|(θ), são usados para modicar a condição anterior p(θ), com o conhecimento
atualizado que se resume em uma densidade posterior, p(θ|x).
A relação entre essas densidades resulta em uma função de atualizações, conhecida como
nesta probabilidade que não sejam funções de x se tornem parte de uma constante de pro-
e para maiores detalhes, sugere-se consultar Gamerman e Migon (2006) ou Congdon (2003).
Pr (B|A)Pr (A)
Pr (A|B) = (2.11)
Pr (B)
p(x|Θ)p(Θ)
p(Θ|x) = (2.12)
p(x)
19
Conceitos Básicos
Z
p(x) = p(x|Θ)p(Θ)dΘ (2.13)
p(x|Θ)p(Θ)
p(Θ|x) = (2.14)
c
Quando uma informação prévia está disponível sobre o vetor de parâmetro Θ ela deve
Desta maneira, um modelo não está partindo do risco baseado somente nos dados dispo-
níveis, mas também nos efeitos cumulativos de todos os dados, assim, os dados passados e
a priori.
Para assegurar que dados atuais não oprimem a informação prévia, Ibrahim e Chen
(2000) introduziram a técnica power prior que consiste em uma classe de distribuição à
pronta para ser usada, como quando parte da opinião de um perito. Neste caso, segundo
Penha (2014) a opinião pessoal sobre a probabilidade do evento deve ser eliciada para uma
função de densidade apropriada, isto é, deve ser processada sobre a forma de uma distribui-
ção de probabilidade.
Paulino, Turkman e Murteira (2003) eles se dividem basicamente em três classes: os proce-
20
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
prioris conjugadas: é a situação que mais facilita a análise pois a ideia é considerar as
que o conhecimento que se tem sobre os parâmetros envolva apenas sua representação
• Famílias Conjugadas;
prioris não informativa: é a situação na qual não existe uma informação a priori palpá-
• Bayes-Laplace;
• Jefreys;
• Box-Tiao;
• Método Hierárquico;
bayesiana pelo pretexto de uma inuência tão limitada da distribuição à priori quanto possí-
vel. Isso pode ser conseguido escolhendo priores que têm um impacto mínimo na distribuição
à posteriori.
Tais priores são chamadas de priores não informativas e são populares para algumas
21
Conceitos Básicos
aplicações, embora nem sempre sejam fáceis de construir. Uma priori informativa domina a
Uma distribuição a priori é não-informativa quando se espera que a informação dos dados
à posteriori, isto é, tenha um efeito mínimo, relativamente aos dados, na inferência nal.
No entanto, a medida que um histórico não informativo apresenta-se mais objetivo, em-
bora exista algum grau de subjetividade em qualquer que seja a priori escolhida, a distribui-
ção à priori não representa ignorância completa sobre o parâmetro em questão. Além disso,
o uso de priores não informativas pode levar ao que é conhecido como priori imprópria, a
densidade à posteriori não integrável com a qual não se pode fazer inferências.
Sobretudo, priores não informativas também podem ser tomadas como prioris inovado-
ras, o que signica que elas podem ser não informativas em uma parametrização, mas são
informativas se uma transformação for aplicada. Por outro lado, uma distribuição à priori
inadequada pode ser apropriada à posteriori, tanto que distribuições prévias inadequadas
são frequentemente usadas nas abordagens bayesianas, pois elas produzem priores não in-
escolher distribuições de forma que o parâmetro de interesse possua uma variância bastante
Jefreys sitados anteriormente em 2.2.2, permite constatar que estas são distribuições a priori
frequentemente imprórias.
Contudo, é de interesse comum que uma distribuição a priori seja denida como própria,
Z
p(x|θ)dθ = +∞ (2.15)
reita, é uma distribuição a priori imprópria pois θ ∼ U (−∞; +∞), p(θ) ∝ k e k constante,
ou seja:
Z+∞ Z+∞
p(x|θ)dθ ∝ kdθ = +∞ (2.16)
−∞ −∞
22
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
Segundo Paulino, Turkman e Murteira (2003), o problema consiste em que, para tais
Paulino e Pereira (1994) atribuem este efeito aos casos de não identicabilidade (inidenti-
bayesiano, pois, embora com exceções, os fatores de Bayes não podem ser aplicados.
Mouchart (1976) e Paulino (1993) chamam a atenção para natureza imprópria da distri-
buição à posteriori tornando-a também imprópria, isto é, dada uma distribuição de probabili-
dade X não identicável, é certo que suas distribuições à posteriori e priori, respectivamente,
p(Θ|x) e p(Θ), serão também não identicáveis.
Ehlers (2011) propõe uma denição para intervalos de credibilidade e arma que é possí-
vel construir uma innidade de intervalos através dela, porém, o autor enfatiza que o objetivo
é, dentre todos intervalos obtidos, tomar o de menor comprimento possível. A denição pro-
23
Conceitos Básicos
e tais que
δ
θ(1−
Z 2)
δ δ
P (θ( 2 ) < θ < θ(1− 2 ) |x) = p(θ|x)dθ = 1 − δ (2.18)
δ
θ( 2 )
O autor destaca também que, se Θ = (−∞; +∞), uma forma indicada de construir um
δ
θ( 2 )
Z Z+∞
δ
p(θ|x)dθ = p(θ|x)dθ = (2.19)
2
−∞ δ
θ(1− 2 )
metros são quantidades aleatórias que possuem distribuições, em oposição aos parâmetros do
modelo xo da estatística clássica e, toda a inferência estatística de uma análise bayesiana,
intervalo de credibilidade.
fornecem estimativas pontuais para o parâmetro θ em estudo, enquanto que os seus quantis
análogos aos intervalos de conança da inferência clássica, e existem dois tipos de inter-
com 100(1 − δ)% de credibilidade para descrever o intervalo entre os pontos de corte, e o
HPD (Highest Posterior Density - Máxima Densidade à Posteriori) pois a densidade mínima
de qualquer ponto nesse intervalo é igual ou maior do que a densidade de qualquer ponto
fora dele, e isso o torna o de menor amplitude. Porém, alguns estatísticos ainda preferem o
intervalo de credibilidade central porque é invariante sob transformações, mas outros prefe-
Um intervalo de conança bayesiano é dito ser HPD quando satisfaz as duas seguintes
propriedades:
24
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
• A densidade para qualquer ponto dentro desse intervalo é igual ou maior do que a
Vale ressaltar que, para uma dada credibilidade, o intervalo HPD é o intervalo que apre-
Contudo, como se busca obter intervalos com o menor comprimento (ou volume) pos-
que os estudos destes eventos envolvem variáveis que podem ser planejadas, e consequente-
mente, é possível manter as fontes de perturbações sob controle, de modo que, em termos
crever as variáveis clínicas e embora exista uma série de modelos utilizados para este m,
alguns se destacam entre todos devido suas comprovadas adequações a várias aplicações
práticas.
Dentre todos os possíveis modelos a se adotar em uma análise, é facilmente citado o mo-
25
Conceitos Básicos
O método de máxima verossimilhança por exemplo, só pode ser aplicado após de se de-
nir o modelo probabilístico que se adeque aos dados em análise. No caso da escolha do
modelo Normal para representar os dados, o método é aplicado para estimar os parâmetros
Entretanto, se o modelo Normal não for o adequado ao ajuste dos dados, os resultados,
consequência de uma análise estatística mal sucedida em virtude de parâmetros mal estima-
Enm, a diculdade em obter o modelo de melhor ajuste aos dados da análise é comu-
mente justicado pelo fato de que a escolha do modelo é, na maioria dos casos, baseada em
informações que não estão disponíveis, entretanto, é possível que em alguns casos encontra-se
é basicamente empírica.
Nestas condições, dada a innidade de casos clínicos e industriais que se pode tomar,
é provável que se deseje estudar um evento no qual os dados exijam uma distribuição de
bilidade.
de variáveis aleatórias que mapeiam um conjunto de variáveis alvo (entrada) em outro con-
junto de variáveis em análise (saídas), e esta transformação é descrita como uma relação de
é um caso de uma transformação linear que converte uma variável aleatória X ∼ Chen(α; β)
−1 −1
para uma variável Y ∼ Chen (α; β) através da transformação Y =X .
Inicialmente, citado por Srivastava e Srivastava (2014), Chen (2000) propôs uma distri-
buição de probabilidade com dois parâmetros a m de estudar tempos de vida cuja função
26
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
dizemos que Y tem uma distribuição Inversa de Chen cuja fda é dada por:
Detalhes mais especícos, bem como a justicativa matemática sobre sua obtenção atra-
X com função de densidade de probabilidade qualquer dada por f (x|θ), com θ ∈ Θ, onde
n
L(θ|x) =
Y
f (xi |θ) (2.25)
i=1
27
Conceitos Básicos
Não é por acaso que esta técnica é a primeira considerada neste capítulo, pois a estimação
de um valor de θ, a sua estimativa, e dentre todos os métodos possíveis para este m, este
Uma justicativa para isso é que este método não considera restrições signicantes sobre
sua aplicação, e por mais que a função l(θ|x) seja complexa, o método considera que a tarefa
de maximar l(θ|x) através de θ , é a mesmo que maximar L(θ|x) também através de θ , sendo
" n
#
l(θ|x) = ln[L(θ|x)] = ln
Y
f (xi |θ) (2.26)
i=1
pondente a amostra aleatória observada e é denida de duas formas como mostrado em 2.25
e 2.26.
∂L(α; β|y)
L (θ|x) =
0
=0 (2.27)
∂θ
θ=θ̂
∂L(α; β|y)
L (θ|x) =
0
=0 (2.28)
∂θ
θ=θ̂
n
( n )
L(α; β|y) = (αβ)n
Y X
(yi )−(β+1) exp yi −β + α[1 − exp(yi −β )] (2.29)
i=1 i=1
n
α̂ = n (2.30)
X
−β̂
exp(yi )−n
i=1
28
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
n n
n X X
−β̂ yi −β̂ exp(yi −β̂ )ln(yi )
− ln(yi ) + yi + n =0 (2.31)
β̂ i=1 i=1
X
−β̂
exp(yi )
i=1
Como um dos métodos de estimação mais simples da literatura, o método dos momentos,
segundo Bolfarine e Sandoval (2010) é também um dos métodos mais antigos conhecidos,
Z+∞
Mr = E(X r ) = xr f (x|θ)dx, ∀x ∈ < (2.32)
−∞
Por ser um cálculo de valor esperado, o cálculo dos momentos varia ligeiramente depen-
Note que em geral, quando r = 1, o primeiro momento central, tem-se M10 = 0 e para
e curtose.
Z+∞ Z+∞
r
E(Y |α; β) = r
y f (y|α; β)dy = αβy r−(β+1) exp{y −β }exp{α[1 − exp(y −β )]}dy (2.34)
0 0
29
Conceitos Básicos
variável aleatória X está associada a modelos não elementares a expressão 2.34 é não linear e
portanto não apresenta uma solução analítica explícita, ou seja, fornece uma solução fechada
Sendo assim, estes casos exigem uma solução numérica para a obtenção destes estimado-
res e métodos numéricos são executados para a realização de tal tarefa, ou seja, o valor de
x
∂l(θ| )
l0 (θ̂|x) = =0 (2.35)
∂θ
θ=θ̂
quanto se queira.
∂l(θ|x)
U (X|θ) = U (θ) = l0 (θ|x) = (2.36)
∂θ
No entanto, sendo então U (θ̂) = 0 o estimador de maxima verossimilhança de θ, para o
U (θ0 )
U (θ̂) ∼
= U (θ0 ) + (θ̂ − θ0 )U 0 (θ0 ) = 0 ⇒ U (θ0 ) + (θ̂ − θ0 )U 0 (θ0 ) = 0 ⇒ θ̂ ∼
= θ0 − 0
U (θ0 )
U (θj )
θj+1 = θj −
U 0 (θj )
máxima verossimilhança de θ.
De maneira oportuna, será vericado no presente estudo que para o modelo paramétrico
n
n X
U (Y |α̂) = + n − exp(yi −β̂ ) (2.37)
α̂ i=1
30
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
n n n
n X X
−β̂
X
U (Y |β̂) = − ln(yi ) + exp(yi ) + α̂ yi −β̂ exp(yi −β̂ )ln(yi ) (2.38)
β̂ i=1 i=1 i=1
como:
−U 0 (X|θ1 )
−U 0 (X|θ1 ; θ2 )
I(α; β) = E (2.40)
−U 0 (X|θ2 ; θ1 ) −U 0 (X|θ2 )
onde
trocado. Além disso, observa-se também que a esperança matemática é tomada em relação
aplicável quando certas condições de regularidade não são satisfeitas, o que segundo Bolfa-
rine e Sandoval (2010), se dene resumidamente como E[U (X|θ)] = 0, pois o valor esperado
da função escore é sempre igual a 0.
Nestes casos, em que E[U (X|θ)] 6= 0, dene-se uma medida de informação local que
é obtida quando não se toma o valor esperado como denido em 2.40. Assim, dene-se a
31
Conceitos Básicos
−U 0 (X|θ1 ) −U 0 (X|θ1 ; θ2 )
J(θ1 ; θ2 ) = (2.41)
−U 0 (X|θ2 ; θ1 ) 0
−U (X|θ2 )
dida de informação do vetor θ̂ = (α̂; β̂) e que, em decorrência de sua caracterização, dene-se
apenas a medida de informação apresentada em 2.41.
tacar que esta estatística depende apenas da distribuição dos dados e não de qualquer valor
cada uma das observações, neste caso, se uma amostra aleatoria é independente e identica-
mente distribuída, temos por m que I(θ) = nI(θ), isto é, a informação contida em uma
Por isso, é importante denir um limite inferior para a variância de cada estimador θ̂
obtido no estudo, uma vez que, este limite permite dizer que a variância de qualquer esti-
Seja então X1 , X2 , X3 , ..., Xn uma amostra aleatória Xf (x|θ), uma função de den-
com
sidade de probabilidade com função de verossimilhança dada por l(θ|X), onde θ ∈ Θ, com
Θ ∈ <. Além disso, seja T (θ|X) = t(X1 , X2 , X3 , ..., Xn ) um estimador não viciado de X .
Nestas condições, segundo Mood, Graybill e Boes (1974), xamos como condições de
∂l(θ|x)
i) Existe ∀ x e θ;
∂θ
Z Z Z Z
∂ ∂
ii) ... [l(θ|x)] dx1 ...dxn = ... [l(θ|x)] dx1 ...dxn
∂θ ∂θ
Z Z Z Z
∂ ∂
iii) ... [T (θ|x)l(θ|x)] dx1 ...dxn = ... [T (θ|x)l(θ|x)] dx1 ...dxn
∂θ ∂θ
∂ l(θ|x)
2
iv) 0 < E − < +∞
∂θ2
32
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
como o Limite Inferior da variância dos estimadores não viciados de θ a estatística dada por:
Note que estas duas estatísticas são denidas sobre a medida de informação global dos
dados, pois considera a informação esperada de Fisher, assim, tomando a medida de infor-
mação local, através da informação observada de Fisher, J(θ), temos similarmente que
sugestivo que o leitor consulte Mood, Graybill e Boes (1974) ou Bolfarine e Sandoval (2010).
Neste sentido, o problema de estimar o valor de α e β pode ser visto como o de selecionar
por inferência a particular distribuição geradora de α̂ e β̂ .
No entanto, a distribuição exata dos parâmetros α̂ e β̂ não pode ser obtida de forma
explícita, por isso, as propriedades dos intervalos de conança aproximados para os parâme-
Podemos então assumir que, segundo as teorias assintóticas válidas para o processo de
inferência estatística:
onde 0 = [0 0]t é a matriz coluna 2×1 de médias nula e I(θ) = I(α; β) é a matriz de
33
Conceitos Básicos
Daí, de acordo com 2.46, em consequência do Teorema Central do Limite resulta que
θ̂ − θ
Q(X ; θ) = p ≈ N (0; I) (2.47)
[nI(θ)]−1
∂ L(θ|x)
2
I(θ) = E − (2.48)
∂θ2
onde
∂ 2 L(θ|x)
= U 0 (X|θ) = U 0 (X|α; β) (2.49)
∂θ2
e xado a partir daqui o vetor de parâmetros θ = (α; β), temos consequentemente, uma
matriz esperada de Fisher dada por I(α; β), em que α e β são dois parâmetros desconhecidos.
obtém-se uma matriz esperada de Fischer das estimativas, I(α̂; β̂), denida por:
e, equivalentemente, uma matriz observada de Fischer das estimativas, J(α̂; β̂), denida
como:
substituída pelo seu estimador [nI(θ̂)]−1 apresenta as variâncias estimadas para os estimado-
34
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
V ˆar(α̂) ˆ
Corr(α̂; β̂)
[nI(α̂; β̂)]−1 = (2.52)
ˆ β̂; α̂)
Corr( V ˆar(β̂)
V ˆar(α̂) ˆ
Corr(α̂; β̂)
[nJ(α̂; β̂)]−1 = (2.53)
ˆ β̂; α̂)
Corr( V ˆar(β̂)
" #
θ̂ − θ
P [|Q(X ; θ)| < z δ ] = P −z δ < p < zδ =
2 2
[nJ(θ)]−1 2
(2.54)
h i
= P θ̂ − z δ [nJ(θ)] < θ < θ̂ + z δ [nJ(θ)] ∼
p p
2
=1−δ
2
Portanto, de 2.52 e 2.53, segue que um intervalo de 100(1 − δ)% de conança para os
q q
IC[α; 100(1 − δ)%] = [α̂ − z δ V ar(α̂); α̂ + z δ V ˆar(α̂)]
ˆ (2.55)
2 2
q q
IC[β; 100(1 − δ)%] = [β̂ − z δ V ar(β̂); β̂ + z δ V ˆar(β̂)]
ˆ (2.56)
2 2
tiva visa, sobretudo, determinar medidas de tendência central e variabilidade para um rol de
dados em estudo. Em uma análise estatística envolvendo dados de sobrevivência, por mais
vivência observados com censura é, sobretudo, um problema para a aplicação das técnicas
35
Conceitos Básicos
box-plot e o histograma, este último, item indispensável para se descrever a distribuição dos
dados são censurados a construção do histograma é impossível pois não se pode observar a
Nesta situação, segundo Colosimo e Giolo (2006), o procedimento usual para o tratamento
maneira que as estatísticas de interesse, geralmente o tempo médio e mediano, bem como
ção, quer no campo estatístico como em literatura biomédicas, devido ao fato de não assumir
nenhuma suposição sobre a distribuição de probabilidade do tempo de vida, razão pela qual
de taxa de falha como sendo a variação de uma função acumulada, contudo, para amostras
Este último, proposto por Kaplan e Meier em 1958, foi desde então considerado como um
método padrão para a obtenção de sínteses estatísticas para dados censurados em Análise
No entanto, é possível que métodos paramétricos sejam adotados para realizar a análise
e descrição dos dados de tempo de vida e também estimar uma função de sobrevivência, tais
Porém, é necessário obter um modelo paramétrico para isso e este modelo é, de certa
forma, também estimado, seja através de seus parâmetros ou através da classe ou família a
qual pertence.
Segundo Colosimo e Giolo (2006), o uso do modelo paramétrico exige, sobretudo, satisfa-
modelo é ajustável aos dados disponíveis e a solução disponível é recorrer a situações em-
Tais métodos são também técnicas de estimação, porém, estimam modelos paramétricos
que serão ajustados aos dados para fornecer as estimativas pertinentes a análise, e assim
36
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
Seja D uma variável aleatória discreta que representa o número de observações que não
falham até um tempo t em um dado experimento e seja (d1 , d2 , d3 , ..., dk ) uma amostra
k
Y
S(t) = (1 − qj ) (2.57)
j=1
onde qj é a probabilidade de falha no intervalo [t( i − 1); ti ) dado que a falha não ocorreu,
termos de dj e nj como:
dj
qj = (2.59)
nj
Convêm destacar que neste caso S(t) é uma função de distribuição do tipo discreto as-
sociado a uma particular amostra, cuja representação gráca se assemelha a uma escada e é
empates. Este estimador considera tantos intervalos de tempo quantos forem o número de
falhas distintas.
• os tempos dos eventos, T, são obtidos de modo que t1 < t2 < t3 < ... < tk ;
37
Conceitos Básicos
anterior a ti ;
k
Y
ŜEKM (t) = P (T ≥ ti |T ≥ ti−1 ) (2.60)
i=1,ti <t
De acordo com Colosimo e Giolo (2006, p.38), Kaplan e Meier justicam que a validade
do estimador ŜEKM (ti ) é atribuída devido ao fato de este estimador ser um estimador de
máxima verossimilhança para S(t) generalizado pelo conceito usual utilizado em modelos
teremos que, para os k tempos distintos e ordenados de falha, ou seja, ∀ti ∈ T de modo que
t1 < t2 < t3 < ... < tk , o EMV (estimador de máxima verossimilhança) de S(t) é dado por
k
Y di
ŜEKM (t) = 1− (2.62)
i=1,ti <t
ni
04) e Colosimo e Giolo (2006, p.37-38). No Apêndice A (seção 5) deste trabalho é mostrada
em detalhes!
Convém destacar que as principais propriedades do EsKM são apontadas como sendo:
2. é fracamente consistente;
38
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
Como ocorre para os demais estimadores estatísticos, o EsKM se sujeita a variações que
trução de intervalos de conança e testes de hipóteses para S(t), uma avaliação da precisão
Neste contexto, uma expressão para a variância assintótica do EsKM é sugerida como
sendo:
k
X di
V ˆar[ŜEKM (t)] = [ŜEKM (ti )]2 (2.63)
n (ni − di )
i=1,t <t i
i
Esta variância estimada é conhecida como Equação de Greenwood e sua dedução é su-
gerida por Kalbeisch e Prentice (1980) e pode ser melhor abordada por Rodríguez (2005,
p. 04-05).
Assim, como para um t xo, ŜEKM (t) tem uma distribuição assintótica gaussiana (Nor-
mal), segue que um intervalo de conança de aproximadamente 100(1 − δ)% para S(t) é
proposto como:
q
ŜEKM (t) ± z δ V ˆar[ŜEKM (t)] (2.64)
2
k
−1 X di
V ˆar[U (t)] = (2.65)
Λ̂(t) i=1,t <t ni (ni − di )
i
Segundo Campus (1983), um teste não paramétrico é entendido como aquele cujo modelo
não especica condições sobre os parâmetros da população da qual a amostra foi retirada e
39
Conceitos Básicos
seu emprego, desde que respeitadas certas pressuposições, constitui uma vasta e importan-
Dentre todas as possíveis razões para o uso de um teste não paramétrico, Campus (1983)
destaca a utilidade de testes não paramétrico em casos em que é difícil estabelecer uma
escala de valores quantitativos para os dados em análise. Em geral, o analista pode apenas
armar que um dado especíco tem mais ou menos, melhor ou pior e maior ou menor da
característica que está sendo analisada, sem poder analisar ou quanticar com precisão as
Neste sentido, quando os dados observados se posicionam de forma dispersa mas ad-
possivel assumir uma distinção de tratamento quando comparado a outro grupo, verica-se
Exige-se assim um teste não paramétrico para a comparação desta distribuições acumu-
especíca e bem conhecida distribuição F (x) aos dados provenientes de uma distribuição
Em geral, como os problemas encontrados em análise de dados são tratados com a hipó-
tese estatística de que os dados são provenientes de uma população correspondente a uma
observados) com uma especíca distribuição teórica, ou seja, no estudo que considera um
(
H0 : Os dados seguem uma distribuição F0 (x);
HA : Os dados não seguem a distribuição F0 (x);
estatísticas de teste
40
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
(
H0 : F = F0
HA : F 6= F0
em que H0 é rejeitado se D ≥ d.
(
H0 : F = F0
HA : F > F0
em que H0 é rejeitado se D + ≥ d1 .
(
H0 : F = F0
HA : F < F0
em que H0 é rejeitado se D − ≥ d1 .
Como o objetivo do teste é vericar se o conjunto de dados segue uma distribuição
nulidade de modo que qualquer um dos testes apresentem o mesmo resultado sob H0 .
dado conjunto dados, o método gráco conhecido como Tempo Total Em Teste (Gráco
Segundo Ramos (1990), este conceito foi introduzido por Epstein e Sobel em 1953 e
explorado de forma signicativa por Barlow e Campo em 1975 onde, através de diferentes
generalizações do conceito original proposto por Epstein e Sobel, é primordial como a base
r
X
(n − r)Tr + Ti
r
i=1
G = r (2.67)
n X
Ti
i=1
41
Conceitos Básicos
em estudo.
Em geral, como se observa na gura 2.8, a reta diagonal (curva1) como resultado do
gráco TTT-plot indica que a função de risco é constante, se a curva resultante for côncava
(curva2) tem-se que a função de risco é crescente e no caso de uma curva convexa (curva3)
vamente.
No caso contínuo, segundo Ramos (1990), Barlow, et. al. propuseram em 1972 o processo
de transformação do TTT-Plot para uma dada função de distribuição
r F associada a um
−1
tempo de vida X e indicada por Hn , como
n
r Z Xr:n
Hn−1 = [1 − Fu (u)]du (2.68)
n 0
em que 1 ≤ r ≤ n, 0 = X0:n , X1:n , X2:n , X3:n , ..., Xn:n são estatísticas de ordem relativas a
uma amostra de tamanho n da distribuição F e Fn (u) é a distribuição da amostra denida,
empiricamente, como:
0, se u < X1:n ;
i
Fn (u) = , se X1:n ≤ u < X1+1:n para 1 ≤ i ≤ n;
n
1, se u ≥ Xn:n ;
42
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
Note que o caso contínuo mescla um processo discreto com o contínuo, porém, a grande
diculdade neste caso é o critério de decisão da distribuição F, o que torna o caso discreto
ção do modelo a ser adotado como gerador do conjunto de dados, este método pode não ser
Contudo, Ramos (1990) esclarece que a comparação do gráco TTT com as várias classes
de distribuições tem por base as proposições construídas por Barlow e Proschan (1966).
gráco formado pelos dados da amostra se comportam como uma das cinco curvas apresenta-
das na gura 2.8. Tal gráco domina, estocasticamente, o gráco correspondente baseado no
completamente acima da reta diagonal, temos evidências de que é possível rejeitar qualquer
Para maiores detalhes sobre o método gráco TTT-Plot, sugere-se consultar o trabalho
Em geral, quando as pressuposições de uma teoria estatística são atendidas pelos dados
resse.
Por outro lado, quando os dados violam as pressuposições, a validade das estimativas
áveis.
trar uma distribuição de importância que seja simultaneamente uma boa aproximação para
Carlo tornam-se muito útil para o pesquisador, porque a abordagem de Monte Carlo baseia-
43
Conceitos Básicos
kovianas.
ricos esperados.
Gamerman (1997) aborda a aplicação no contexto de re-amostrar dados para uma dis-
f (θ)
π(θ|x) = Z (2.69)
f (θ)dθ
priori p(θ), também chamada de função de referência ou proposta, e de que a função π(θ|x)
deve ser positiva e dependente do estado atual de uma cadeia markoviana homogênea, ir-
Nesta condição, é possível gerar qualquer amostra de π(θ|x), tendo apenas o conheci-
Outros casos consistem de que para muitos modelos, os quais não admitem um trata-
mento analítico, é requerido a aplicação numérica para a aproximação de sua integral que,
problemas matemáticos ou físicos. Dentre todas as técnicas até então desenvolvidas, a mais
de Monte Carlo.
Especialmente, quando a intenção é obter uma gama de valores, onde cada um dos quais
as condições de uma cadeia markoviana, e então, a técnica MCMC (Monte Carlo via Ca-
deias de Markov) surge como um algoritmo que permite a extração de amostras de uma
os estudos propostos neste trabalho, sujere-se consultar Fan, et al. (2002) ou Gamerman
44
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
(1997).
O Amostrador Metropolis-Hasting
Para os casos em que a distribuição à priori p(θ) é conhecida, uma derivação formal do
cido como mecanismo de correção. Este mecanismo de correção garante que a convergência
da cadeia para a distribuição de equilibrio, que neste caso é a distribuição a posteriori π(θ|x).
Para descrever este algoritmo, consideremos que a distribuição de interesse seja a distri-
π(θt+1 |xt )p(θt |θt+1 )
k(θt ; θt+1 ) = min 1; (2.70)
π(θt |xt )p(θt+1 |θt )
guintes passos:
2. Gerar o novo valor θt+1 da distribuição p(θ|Xt−1 ), isto é, p(θ|Xt−1 ) = p(θt+1 |Xt−1 );
4. Se:
(
u ≤ k(θt ; θt+1 ), aceitar θt+1 e fazer θ(t+1) = θt+1
(t+1)
caso contrário, rejeitar θt+1 e fazer θ = θt
45
Conceitos Básicos
O Amostrador de Gibbs
O amostrador de Gibbs por sua vez, é também um algoritmo derivado da técnica MCMC,
A diferença entre estes dois mecanismos de amostragem é que este não exige um critério
iterações deste amostrador a cadeia sempre se moverá para um novo valor, razão pela qual,
Ehlers (2011) arma que as transições entre os estados da cadeia markoviana em pro-
cesso acontecem de acordo com distribuições condicionais completas, que são baseadas na
Então, seja Θ−i = (θ1 , θ2 , ..., θi−1 , θi+1 , ..., θd ) o vetor com as d − 1 componentes θi . A
distribuição condicional completa θi de componentes θi dado o vetor Θ−i , é denida pela
π(θi )
π(θi |Θ−i ) = Z (2.71)
π(θi )dθi
3. Obter o novo vetor Θ(t) a partir de Θ(t−1) através da sequência de gerações dos valores
(t)
θi ∼ π(θi |Θ−i ), isto é
processo.
46
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
O Critério de Convergência
sugerindo uma analogia com a análise de correlação efetuada com a da metodologia de séries
temporais.
O autor ainda arma que em uma cadeia de Markov, espera-se que os valores gerados
sejam correlacionados ao longo das iterações. Neste sentido nos remetemos ao cuidado com
através de diagnósticos grácos, via gráco das iterações, autocorrelação e densidade Kernel
à posteriori, mas a adoção deste tipo de diagnóstico é viável para os casos de aplicações em
diga-se 100, 500 ou 1000 cadeias por exemplo, a adoção de diagnósticos grácos são com-
pletamente inviáveis, pois para cada cadeia processada existirá um gráco de iterações,
Para estes casos o diagnóstico viável é realizado através de medidas descritivas para os
valores simulados no processo, tais como o Tamanho Amostral Efetivo, o Tempo de Auto-
Uma vez congurado as condições de execução do método MCMC, diga-se pelo número
de Densidade Espectral em Frequência Zero proposta por Heidelberger & Welch (1981).
A relevância desta estimativa é atribuída pela obtenção da medida ESS (Eetive Sample
Size), o Tamanho Amostral Efetivo, recomendado por Radford Neal no painel de discussão
ESS é uma função univariada que é frequentemente aplicada a cada distribuição à poste-
riori gerada no processo MCMC e usada para estimar o tamanho de amostras que é reduzido
Sobretudo, uma discussão muito ampla se realiza em torno de testes estatísticos como
problema de diagnósticos grácos pois, embora sejam estatisticamente ecientes sobre a de-
tecção, será necessário também avaliar cada uma das cadeias markovianas executadas.
vez que é possível tomar, para cada uma das cadeias executadas, cada uma destas medidas
47
Conceitos Básicos
como uma amostra especíca da cadeia e calcular uma estatística que resumirá todos os
processos executados fornecendo uma única medida para avaliar o estado de equilíbrio para
cia serão apresentados na seção 4.2.4 e sobre os amostradores abordados nesta seção e outros
algoritmos baseados na técnica MCMC podem ser obtidos em Sorensen e Gianola (2002),
SAS Studio
software estatístico
R , para a realização da inferência, com o auxilio do software
R para a manipulação dos dados.
M icrosof t Excel
A planilha Excel que, muito embora não inuenciará nos resultados do estudo proposto, é
indispensável para hospedar, organizar e visualizar os dados das análises que serão realizadas
no software
R.
SAS Studio
O software SAS Studio
R,
por sua vez, fornece as ferramentas que desenvolverão e
48
CAPÍTULO 3
Proposta por Z. Chen, Chen (2000), esta distribuição considera dois parâmetros para
em forma de banheira, ou seja, a função taxa de falha para estes produtos apresentou uma
fase de decrescimento, seguida de uma fase de utilização satisfatória até atingir a fase de
crescimento, por isso, foi necessário a adoção de modelos que permitissem descrever dados
dados reais gerados pelos produtos eletro mecânicos com taxas de insucesso com represen-
tação gráca em forma de banheira. Os modelos convexos e/ou côncavos já eram adotados
para estudar alguns produtos eletrônicos e mecânicos, bem como o tempo de vida dos seres
monótona, como funções em forma de banheira e funções de risco unimodal, com isso, no-
49
Propriedades da Distribuição Proposta
nótona decrescente, banheira ou taxa de falha unimodal, dependendo das diferentes gamas
de parâmetros.
Com o mesmo propósito, Chen (2000) propôs uma distribuição de probabilidade da vida
útil em dois parâmetros, com função de risco de forma convexa e côncava (forma de ba-
Teorema 3.1 Seja X uma variável aleatória com distribuição de Chen, ou seja, X ∼
Chen(α; β), tal que x > 0, α > 0 e β > 0 e com função de distribuição acumulada dada
como em 3.1. Então X tem função densidade de probabilidade dada como em 3.2 e é tal que
Z +∞
f (x|α; β)dx = 1 (3.3)
0
Demonstração: Com efeito! Note que o resultado 3.2 é decorrente da aplicação da regra
∂ ∂
f (x|α; β) = F (x|α; β) = (1 − exp{α[1 − exp(xβ )]}) =
∂x ∂x
= αβxβ−1 exp{xβ + α[1 − exp(xβ )]}
de modo que, ao tomar a mudança de variável u = αexp(xβ ) ⇒ αβxβ−1 exp(xβ )dx = du,
resulta que:
x −→ 0 ⇒ u −→ αexp(0) = α
(3.5)
x −→ +∞ ⇒ u −→ αexp(+∞) = +∞
50
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
Então, substituindo u, du e 3.5 na integral de Riemann de f (x|α, β) dada por 3.4, resulta
que:
Z +∞ Z +∞
f (x|α; β)dx = αβxβ−1 exp(xβ )exp(α)exp[−αexp(xβ )]dx =
0 0 +∞
Z +∞
exp(α) exp(α)
= exp(α)exp(−u)du = − = =1
exp(u) exp(α)
α
α
Sarhan e Smith (2011) abordam esta distribuição de forma mais rigorosa apresentando
metros desconhecidos.
Gama, que as formas explícitas dos estimadores de Bayes não podem ser obtidas e apre-
ticas de ordem censuradas de tipo II, progressivo e os de ordem k. No artigo, através do uso
Da seção 3.1, segue mais especicamente que, seX tem uma distribuição de Chen com
parâmetros α e β , podemos denotar X ∼ Chen(α; β), e tomando a variável auxiliar Y
−1 −1
como descrita em 2.3.2, onde é denida por Y = X , fazendo a transformação X = Y ,
dizemos que Y tem uma distribuição Inversa de Chen com parâmetros α e β , ou seja,
51
Propriedades da Distribuição Proposta
Figura 3.1: Gráco ilustrativo para a fda de Y ∼ Chen−1 (α; β) com diferentes parâmetros.
Teorema 3.2 Se X é uma variável aleatória tal que X ∼ Chen(α; β), onde x, α, β > 0
e com função de distribuição acumulada dada como em 3.1, tomando a variável aleatória
Y denida como Y = X −1 e fazendo a transformação X = Y −1 , então Y tem função de
densidade acumulada dada como em 3.7, isto é
1 1 1
F (y|α; β) = P (Y ≤ y) = P ≤y =P ≤X =1−P X < =
X y y
1
= 1 − 1 + exp α 1 − exp = exp{α[1 − exp(y −β )]}
yβ
Teorema 3.3 Se Y é uma variável aleatória com distribuição Inversa de Chen, ou seja,
Y ∼ Chen−1 (α; β), tal que y, α, β > 0 e com função de distribuição acumulada dada como
em 3.7, então Y tem função densidade de probabilidade dada por
∂ ∂
f (y|α; β) = F (y|α; β) = exp{α[1 − exp(y −β )]} =
∂y ∂y
52
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
No artigo "Two Parameter Inverse Chen Distribution as Survival Model", Srivastava &
No entanto, o trabalho não apresenta nenhuma vericação e nem sugerem uma caracte-
este modelo e estudar alguns estimadores para o trato da inferência estatística, abordados no
contexto clássico e com rigor matemático. Damos início ao proposto vericando que f (y|α; β)
é de fato uma distribuição de probabilidade.
Teorema 3.4 Se Y é uma variável aleatória Y ∼ Chen−1 (α; β) e com função de densidade
de probabilidade dada como em 3.8, então para todo y , α, β > 0, f (y|α; β) é tal que
Z +∞
f (y|α; β)dx = 1 (3.9)
0
Demonstração: Com efeito! Note que y, α, β > 0, e como o núcleo de f (y|α, β) é também
uma função exponencial, resulta que f (y|α, β) > 0. Daí, reescrevendo f (y|α, β) como
de modo que tomando a mudança de variável u = −αexp(y −β ) ⇒ αβy −(β+1) exp(y −β )dy =
−du, resulta que:
y −→ 0 ⇒ u −→ −αexp(0) = −α
(3.11)
y −→ +∞ ⇒ u −→ −αexp(+∞) = −∞
Z +∞ Z +∞
f (y|α; β)dy = αβy −(β+1) exp(x−β )exp(α)exp[−αexp(x−β )]dx =
0 0 −α
Z −∞ exp(α)
= − exp(α + u)du = exp(α)exp(u) = =1
−α exp(α)
−∞
53
Propriedades da Distribuição Proposta
Figura 3.2: Gráco ilustrativo para a fdp de Y ∼ Chen−1 (α; β) com diferentes parâmetros.
Meyer (1965) considera que os parâmetros são os itens que caracterizam um modelo pro-
babilístico em estudo, e que não somente atribuem uma particular relação com o modelo,
mas que para diferentes escolhas de valores destes parâmetros se obtém um modelo especí-
co.
um modelo através de seus parâmetros, não somente de posse dos valores dos parâmetros de
um modelo, que na maioria dos modelos paramétricos são identicados como parâmetros de
metros de posição e escala, podem ser caracterizadas por não possuírem uma expressão
determinística que atribua seus valores esperado e variância, respectivamente, obtidos atra-
patológica, muito embora o termo 'patologia' seja diretamente ligado às áreas biológicas e
médicas devido a seu signicado etimológico (estudo gramatical da origem e história das
palavras), do grego phátos - doença e lógos - estudo, uma patologia pode ser considerada,
objeto ou fenômeno físico, como por exemplo em arquitetura e engenharia civil no estudo
54
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
aquilo que fere o senso comum, que na prática não é intuitivamente esperado ou expõe limi-
tações.
Contudo, a distribuição Inversa de Chen ainda não possui uma característica denida,
seja ela paramétrica ou patológica e um passo primordial e crucial nesta direção é vericar
caracterização apropriada.
Neste sentido, uma vez constatado que a variável aleatória contínua Y com distri-
parâmetros.
Da mesma forma, quando constatado a divergência, E(Y r |α; β) −→ +∞, não faz sentido
a aplicação das técnicas usuais para a obtenção de uma função determinística em termos
dos parâmetros, pois o modelo não possuirá esperança denida, já que não converge para
patológica.
O que temos até o presente momento em relação ao modelo proposto é simplesmente sua
Mundança de Variável
Z
A aplicação da mudança de variável em uma integral do tipo f (y)dy , dada a natureza
de f (y) ao seu domínio, consiste em um método que, além de fornecer uma solução para o
integrando f (y) em seu domínio, quando este for primitivável, simplica a integral permi-
Z+∞
E(Y r ) = y r f (y)dy (3.12)
Então, se
Z+∞ Z+∞
r
y f (y)dy = y r αβy −(β+1) exp{y −β }exp{α[1 − exp(y −β )]}dy (3.13)
0 0
55
Propriedades da Distribuição Proposta
α−u 1
u = α − αexp(y −β ) ⇔ exp(y −β ) = ⇔ y = [ln(α − u) − ln(α)]− β (3.14)
α
Além disso, como Ii : u = α[1 − exp(y −β ) ⇒ du = αβy −(β+1) exp{y −β }dy , resulta que:
y −→ 0 ⇒ u −→ −∞
(3.15)
y −→ +∞ ⇒ u −→ 0
Nestas condições, substituindo I, 3.14, Ii e 3.15 em 3.12 através de 3.13, segue que:
Z+∞ Z0
r
E(Y r ) = y r f (y)dy = [ln(α − u) − ln(α)]− β exp(u)du =
0 −∞
(3.16)
Z0
exp(u)
= du
[ln(α − u) − ln(α)]λ
−∞
r
onde, se r ∈ ℵ∗ e β ∈ <∗+ , então λ= ∈ <∗+ .
β
E ainda, tomando a mudança II : z = ln(α − u) − ln(α) de modo que:
α−u α−u
z = ln ⇔ exp(z) = ⇔ u = α − αexp(z) (3.17)
α α
u −→ −∞ ⇒ z −→ +∞
(3.18)
u −→ 0 ⇒ z −→ 0
de modo que, substituindo II , 3.17, IIi e 3.18 em 3.16, através de 3.13, 3.12 se reduz a
Z0 Z0
exp(u) exp[α − αexp(z)]
E(Y r ) = du = [−αexp(z)]dz =
[ln(α − u) − ln(α)]λ zλ
−∞ +∞
(3.19)
Z+∞
exp[z − αexp(z)]
= αexp(α) dz
zλ
0
Z+∞ Z0
r r exp(u)
E(Y ) = y f (y)dz = du =
[ln(α − u) − ln(α)]λ
0 −∞
(3.20)
Z+∞ Z+∞
exp[z − αexp(z)]
= αexp(α) dz = αexp(α) g(z)dz
zλ
0 0
56
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
integração. Porém, é uma função transcendente que não admite primitiva elementar, e assim
Com efeito!
Note que exp[z − Λ(z)] = 1 ⇔ z − Λ(z) = 0 ⇔ z = Λ(z). Então, xando z ≤ Λ(z) para
• Para z ≥ 1:
Logo, z ≤ Λ(z) ⇒ 0 < exp[z − Λ(z)] ≤ 1, e se z≥1 segue que 0 < exp[z − Λ(z)] ≤ 1 ≤
z ⇒ g(z) ∈ (0; 1], pois z λ ≥ 1.
• Para 0 < z ≤ 1:
Logo, z ≥ Λ(z) ⇒ exp[z − Λ(z)] > 1, e se 0 < z ≤ 1 segue que 0 < z ≤ 1 <
exp[z − Λ(z)] ⇒ g(z) ∈ (1; +∞), pois 0 < z λ ≤ 1.
Observe que, embora α > 0, é possível que ele exista tão pequeno quanto se queira de
modo que Λ(z) ' z , isto é, como Λ(z) = αexp(z), também resulta de z − Λ(z) = 0 que
z
α= , e consequentemente dois casos particulares para o parâmetro α:
exp(z)
z
no caso 1: z ≤ Λ(z) = αexp(z) ⇒ α ≥
exp(z)
z (3.22)
no caso 2: z ≥ Λ(z) = αexp(z) ⇒ α ≤
exp(z)
r z z
ou seja, ∀ λ = > 0, g(z) ∈ (0; 1] se α ≥ e g(z) ∈ [1; +∞) se α ≤ .
β exp(z) exp(z)
Pretendemos com isso mostrar que ∀ λ > 0, e mais especicamente ∀ r > 0, se g(z)
57
Propriedades da Distribuição Proposta
divergir nos dois casos acima existirá y , α e β tais que E(Y r ) diverge, daí não existirá
−1
E(Y r ) e consequentemente a distribuição Y ∼ Chen (α; β) será patológica em relação
aos parâmetros α e β, do contrário, caso convirja, diz-se que a distribuição possui uma
r, α e β para atribuir uma caracterização geral para a distribuição Y ∼ Chen−1 (α; β).
Assim, pelo critério de convergência de integrais, se existir a função ∆(z), tal que 0 <
Z+∞
g(z) ≤ ∆(z), se ∆(z) for integrável e ∆(z)dz for convergente, concluiremos que E(Y r ) =
0
Z+∞
αexp(α) g(z)dz também o é, ou seja, existe a integral E(Y r ) e Y ∼ Chen−1 (α; β) pode
0
ser caracterizada em termos paramétricos gerais desde que obtida a função determinística
em termos de r, α e β.
Z+∞
Caso contrário, para 0 < ∆(z) ≤ g(z), se ∆(z)dz for divergente, pelo critério de
0
comparação, não existe a integral E(Y r ) e o modelo é patológico.
z
• Avaliação 1: quando α≥ , sobre z − Λ(z) ≤ 0, para i = 1 se 0 < z ≤ 1 e i=2
exp(z)
se z ≥ 1, tomemos 0 ≤ exp[z − Λ(z)] ≤ πi (z) para vericarmos que
z
• Avaliação 2: quando α≤ , sobre z − Λ(z) ≥ 0 tomemos 1 ≤ exp[z − Λ(z)] para
exp(z)
vericarmos também que:
58
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
1 exp[z − Λ(z)]
1 ≤ exp[z − Λ(z)] ⇔ ∆(z) = λ
≤ = g(z)
z zλ
Z+∞ Z+∞
(a) Quando 0 < g(z) ≤ ∆(z), se ∆(z)dz é convergente, então g(z)dz também o é;
0 0
Z+∞ Z+∞
(b) Quando 0 < ∆(z) ≤ g(z), se ∆(z)dz é divergente, então g(z)dz também o é;
0 0
Sendo então que o interesse é avaliar g(z), temos portanto dois resultados distintos:
(a) Na avaliação 1, como mostrado em 5.13, sendo ∆(z) = ∆i (z), para i = 1, 2 convergente,
z
conclui-se que g(z) também o é para todo z > 0, λ > 0 e α ≥ .
exp(z)
(b) Na avaliação 2, como mostrado em 5.8, sendo ∆(z) divergente conclui-se que g(z) tam-
z
bém o é para todo z > 0, λ > 0 e α≤ .
exp(z)
Observa-se então que, embora o parâmetro α seja generalizado através das desigualdades
r
z − Λ(z) ≤ 0 e z − Λ(z) ≥ 0, nada se pode armar sobre E(Y ) em decorrência da conver-
z 1
lim α(z) = lim = lim =0
z→+∞ z→+∞ exp(z) z→+∞ exp(z)
59
Propriedades da Distribuição Proposta
Logo, como α é denido em <∗+ é razoável considerar o resultado da avaliação pela qual
α ≥ lim α(z), ou seja, existe α tal que para todo z, λ > 0 a função comparativa ∆(z) é
z→+∞
convergente e consequentemente g(z) também o é pelo critério de comparação de integrais,
Z
pois 0 < g(z) ≤ ∆(z). Deste modo, verica-se que g(y)dy é convergente. Então
Z+∞ Z+∞
r exp[z − αexp(z)]
E(Y ) = αexp(α) g(z)dz = αexp(α) dz −→ K (3.23)
zλ
0 0
Os casos 3.21, como dito, são particulares. É possível estender a avaliação de g(y),
por exemplo, para os casos 3 e 4 tais que
z
caso 3: g(z) ∈ (0; 1], se 1 ≤ exp[z − Λ(z)] < z λ , para α≤
exp(z)
λ z
caso 4: g(z) ∈ [1; +∞), se 0 < z ≤ exp[z − Λ(z)] ≤ 1, para α ≥
exp(z)
porém julga-se desnecessário a extensão, pois o resultado da avaliação de g(z) para os casos
1 e 2 apenas, é suciente.
Outra situação que vale discutir é a avaliação 2 desenvolvida. Como 0 < exp[z−Λ(z)] ≤ 1,
a busca de uma função π(z) tal que π(z) ≤ exp[z − Λ(z)] é uma
Z tarefa tentadora, uma vez
π(z) exp[z − Λ(z)]
que a obtenção de ∆(z) =
λ
≤ = g(z) com ∆(y)dy −→ +∞ atribuiria
z zλ
−1
uma caracterização geral imediata para Y ∼ Chen (α; β).
Esta caracterização seria a patologia do modelo, porém anularia qualquer aplicação as-
sintótica ao que se refere a inferência estatística, pois não existiria os momentos de ordem
r=1 e r=2 tais que E(Y ) e E(Y 2 ) − [E(Y )]2 = V ar(Y ) existam no Teorema Central do
Limite.
A busca de π(z) neste caso nos remete às funções trigonométricas denidas sobre o cir-
culo trigonométrico de raio 1, mas outro obstáculo que se obtém são os intervalos de domínio
e imagem destas funções, que no caso do seno e cosseno, embora possam ser denidas em
<∗+ possuem imagem em [−1; 1] para este domínio, e para as demais, tangente, cotangente,
secante e cossecante, apesar de também poderem ser denidas com domínio em <∗+ , tem
π
imagem descontínua em kπ + 2
para um k -ésimo ciclo qualquer.
Somos ainda tentados a considerar os seno e cosseno hiperbólicos, pois através de-
les obtém-se a tangente hiperbólica que apesar de possuir domínio em <, imagem em
[−1; 1] e poder ser reescrita em termos de exponenciais, o núcleo z − Λ(z) ≤ 0 fornece
60
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
−1 < tgh[z −Λ(z)] ≤ 0 < exp[z −Λ(z)] ≤ 1, isto é, com domínio em <− e imagem em [−1; 0],
e mais que isso, para um núcleo z > 0 apenas, resulta que 0 < exp[z − Λ(z)] ≤ tgh(z) ≤ 1,
Z+∞
tgh(z)
tal que dz −→ +∞ e nenhuma conclusão pode ser tomada sobre g(z).
zλ
0
Portanto, a saída para a solução do problema na avaliação 1 foi, de fato, buscar um ∆(z)
convergente e tal que ∆(z) > g(z).
Nessa avaliação a principal conclusão que se obtém é de que a distribuição terá média
Logo, este resultado é a garantia de que para amostras sucientemente grandes, resul-
tados limites como as Leis Fracas e Fortes dos Grandes Números e o Teorema Central do
µY = E(Y ), uma vez que a Lei dos Grandes Números arma que quando n −→ +∞ a média
amostral µˆY converge para µY e de tal modo que µˆY − µY −→ 0, e o segundo resultado é
2 2 2 2
satisfeito em virtude da existência de E(Y ), uma vez que σY = E(Y ) − µY e o teorema
µˆY − nµY
diz que p ' N (0; 1).
nσY2
Além dos resultados limites descritos acima, a convergência do momento de ordem r
também garante a validade dos métodos assintóticos pertinentes a Teoria Assintótica, que
babilidade da variável aleatória Y ∼ Chen−1 (α; β). Então, uma vez obtido os dados de
−1
Y ∼ Chen (α; β), é possível obter um estimador que pode ser entendido como uma função
de α e β para as n observações de Y .
valores f (y|α; β) e tal função é denotada por l(α; β|y) como denida em 2.25.
este método para estimar estes dois parâmetros que, mesmo que conhecida as observações
61
Propriedades da Distribuição Proposta
n
Y
L(α; β|y) = f (yi |α; β)
i=1
Então, sendo a expressão 3.8 a fdp de Y ∼ Chen−1 (α; β), segue que a função de verossi-
∂L(α; β|y)
=0
∂α
(α=α̂;β=β̂)
∂L(α; β|y)
=0
∂β
(α=α̂;β=β̂)
Na prática, L(α; β|y) e ln[L(α; β|y)] têm seus pontos de máximo no mesmo valor de
máximo deln[L(α; β|y)] devido a sua propriedade multiplicativa, assim, no caso da fdp de
−1
Y ∼ Chen (α; β) cuja função de verossimilhança é dada pela expressão 3.24, seu logaritmo
natural é dado por
n n
l(α; β|y) = n[ln(α) + ln(β)] − (β + 1)
X X
ln(yi ) + {yi −β + α[1 − exp(yi −β )]} (3.25)
i=1 i=1
Daí, aplicando a derivada em relação a cada um dos dois parâmetros da expressão 3.25
∂L(α; β|y)
n
n X
= +n− exp(yi −β̂ ) = 0 (3.26)
∂α α̂
(α=α̂;β=β̂) i=1
62
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
∂L(α; β|y)
n n
n X X
= − log(yi ) + exp(yi −β̂ ) +
∂β
(α=α̂;β=β̂)
β̂ i=1 i=1
n (3.27)
X
+ α̂ yi −β̂ exp(yi −β̂ )log(yi ) = 0
i=1
n
α̂ = n (3.28)
X
−β̂
exp(yi )−n
i=1
n
X
n n
n yi −β̂ exp(yi −β̂ )log(yi )
n X X i=1
− log(yi ) + yi −β̂ + n =0 (3.29)
β̂ i=1 i=1
X
−β̂
exp(yi )−n
i=1
Observe que a obtenção da solução de forma fechada para a equação não linear 3.29 não
é possível, por isso, para qualquer conjunto amostral de Y ∼ Chen−1 (α; β), um método
daí surge a justicativa para o uso do software SAS com o procedimento NLMIXED para
resultados necessários.
Devemos considerar que I(α; β) é uma medida de informação global e é tomada em rela-
ção a distribuição amostral de f (y|α; β), ou seja, é denida a partir da esperança da variável
aleatória Y .
63
Propriedades da Distribuição Proposta
Y é uma única observação com fdp f (y|Θ) e denida a medida de informação esperada de
Fisher, para um vetor de parâmetros quaisquer Θ, tem-se:
∂ 2 L(Θ|y)
Z +∞
2
I(Θ) = E − 2
= E{[U (Θ)] } = [U (Θ)]2 f (y|Θ)dy (3.31)
∂Θ 0
onde a quantidade U (Θ) é a função escore para o vetor de parametros Θ e é tal que
∂L(Θ|y) 2 ∂ 2 L(Θ|y)
U (Θ) = ⇒ [U (Θ)] = − (3.32)
∂Θ ∂Θ2
isto é, para Θ = (α; β)), em decorrência de 3.26 e 3.27, verica-se facilmente que:
∂ L(α; β|y)
2
n
− = = [U (α̂)]2 (3.33)
∂α2 α̂ 2
(α=α̂;β=β̂)
∂ 2 L(α; β|y)
n
n X
− = − yi −β̂ [ln(yi )]2 [1 − α̂(1 + yi −β̂ )exp(yi −β̂ )] =
∂β 2
(α=α̂;β=β̂)
β̂ 2 i=1 (3.34)
2
= [U (β̂)]
de informação esperada de Fisher para α e β, dada por I(α; β), substituindo os parâmetros
[U (α̂)]2 [U (α̂; β̂)]2 E{[U (α̂)]2 } E{[U (α̂; β̂)]2 }
I(α̂; β̂) = E = =
64
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
não foram obtidos e esta não é a proposta para este trabalho, as condições de regularidade
não podem ser vericadas para o limite inferior da variância dos estimadores α̂ e β̂ .
Portanto, não é válido considerar a medida de informação esperada de Fisher, pois nos
observada de Fisher para α̂ e β̂ , a matriz J(α̂; β̂), com medidas de informação local que
[U (α̂)]2 [U (α̂; β̂)]2
J(α̂; β̂) = (3.37)
2 2
[U (β̂; α̂)] [U (β̂)]
e consequentemente:
V ˆar(α̂) ˆ
Corr(α̂; β̂)
[J(α̂; β̂)]−1 = [nJ(α̂; β̂)]−1 = (3.38)
ˆ β̂; α̂)
Corr( V ˆar(β̂)
onde é facilmente vericável que [J(α̂; β̂)]−1 = [nJ(α̂; β̂)]−1 com LI(α̂; β̂)] = [nJ(α̂; β̂)]−1
como denido na seção 2.4.6.
inversa na matriz J(α̂; β̂), de modo que os elementos da diagonal principal de [nJ(α̂; β̂)]−1
fornecem a variância assintótica para os parâmetros α̂ e β̂ .
Nestas condições, portanto, de acordo com a distribuição denida pela expressão 3.25,
respectivamente como:
q q
IC[α; 100(1 − δ)%] = (α̂ − z δ V ˆar(α̂); α̂ + z δ V ˆar(α̂)) (3.39)
2 2
q q
IC[β; 100(1 − δ)%] = (β̂ − z δ V ˆar(β̂); β̂ + z δ V ˆar(β̂)) (3.40)
2 2
65
Propriedades da Distribuição Proposta
do evento T no instante t.
Figura 3.3: Grácos para a função de sobrevivência de T ∼ Chen−1 (α; β) de diferentes parâmetros.
R(t).
No entanto, a função de sobrevivência é caracterizada como a distribuição de probabili-
é a função de sobrevivência de T ∼ Chen−1 (α; β) com gráco como mostrado na gura 3.3
66
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
A função de risco, convencionalmente denotada por λ(t), ou h(t), é denida como a taxa
de eventos no tempo t condicionada à sobrevivência até, ou posteriormente, o tempo t, isto
f (t)
é, para a variável aleatória T ≥ t, λ(t) = .
S(t)
Neste caso, segue então o seguinte teorema:
Teorema 3.5 Sejam f (t), a fdp da variável aleatória T ∼ Chen−1 (α; β), similarmente dada
como na expressão 3.8, e S(t) a função de sobrevivência dada pela expressão 3.41. Então, a
função de risco para a vaiável aleatória T é dada por:
αβt−(β+1) exp(t−β )
λ(t) = (3.42)
exp{α[exp(t−β ) − 1]} − 1
da demograa e ciências atuariais, onde é denotado por µ, Srivastava & Srivastava (2014).
A taxa prazo de risco,h(t), é outro sinônimo para λ(t), ou seja, λ(t) = h(t) = µ.
−1
Contudo, o modelo T ∼ Chen (α; β), ∀ T ≥ t, apresenta funções de risco unimodal e
monótona, isto é, para todo t, α, β a função λ(t) não assume os formatos constante e de
banheira, de modo que, este modelo é predominantemente côncavo, o que signica que em
sua forma mais geral é útil para modelar dados com taxa de falha unimodal.
O formato não constante da função λ(t) é justicado pela denição da variável aleatória
T e dos parâmetros do modelo, pois, uma vez que a expressão deλ(t) existe em função de
t, α, β > 0, como dada em 3.42, e sempre se mantém variando sobre t e λ(t).
−1
E mais, a partir da denição da variável aleatória T ∼ Chen (α; β), observa-se que em
sua forma unimodal λ(t) aumenta sem limite até a sua moda quando t tende ao innito, e
consequentemente, dada a denição de S(t), tem-se também que S(t) tende a zero.
Isto implica que λ(t), conforme sua denição é dada, não diminui rapidamente, uma
vez que, por denição, o risco cumulativo Λ(t) tem que divergir, e por isso assume a forma
unimodal. Similarmente, à medida que t tende a zero, S(t) tende ao innito e λ(t) diminui
67
Propriedades da Distribuição Proposta
Este mesmo comportamento se observa na expressão 3.42, onde é evidente que o denomi-
Figura 3.4: Formas da função de risco para o modelo T ∼ Chen−1 (α; β).
para qualquer β > 0 o gráco de λ(t) tende para a forma decrescente, como é mostrado à
esquerda na gura 3.5 a seguir, e similarmente, quando se tem (α; β) → (0; 0), o gráco de
λ(t) tende também a 0 mantendo-se decrescente como se observa à direita na gura 3.6.
Figura 3.5: Forma descrescente com α xo. Figura 3.6: Forma descrescente com β xo.
Alguns casos especiais de λ(t) unimodal são apresentados nas guras 3.7 e 3.8 a seguir.
68
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
Figura 3.7: Forma unimodal com α xo. Figura 3.8: Forma unimodal com β xo.
As guras 3.7 e 3.8 sugerem que a medida que os parâmetros do modelo diminuem, a
função de risco tendem para a forma monótona decrescente. Isso é evidente na gura 3.8
onde se observa que a curva se aproxima de t=0 assumindo uma forma achatada perdendo
Porém, é possível obter para as mesmas funções de risco sua forma monótona crescente
quando assume-se t ∈ (1; 1.2], como mostra o gráco 3.10, pois neste intervalo só se obtém
os valores crescentes para as mesmas funções de risco apresentadas no gráco 3.9 como se
observa.
Figura 3.9: Modelos em t ∈ (0; 50]. Figura 3.10: Modelos em t ∈ (0; 2].
o intervalo de tempo no qual esta função é crescente, ou seja, destacando o intervalo cres-
risco que se queira analisar, como nos casos especicados nas guras 3.11 e 3.12 a seguir.
69
Propriedades da Distribuição Proposta
Figura 3.11: Crescente em t ∈ [0.25; 1.5]. Figura 3.12: Crescente em t ∈ [0.5; 0.95].
risco exibidas.
Como se pode observar nas guras 3.5 e 3.7, xado o parâmetro α, a menos da escala,
A inuência de α sobre a forma da função é ainda mais evidente na gura 3.9, onde a
medida que α aumenta, a função sofre um achatamento signicante sugerindo uma tendência
para a forma decrescente do modelo de risco.
para os parâmetros α e β sobre a função de risco do modelo proposto. Isso é evidente nas
guras 3.6 e 3.8 onde a redução dos valores do parâmetro α atribui alteração signicativa
modelo proposto, veremos posteriormente, na seção 4.3, o quanto a elevação deste parâmetro
inuência na eciência de seu estimador, bem como na variação da amplitude de seu intervalo
de conança.
70
CAPÍTULO 4
estudo, inicialmente no contexto básico da estatística com sua função de densidade acu-
e por m, denido suas características em congruência com os conceitos de análise de so-
brevivência, com destaque para a função de sobrevivência e função de risco, bem como um
Neste capítulo o interesse é abordar o método clássico e bayesiano para a construção dos
HPD, de modo que várias amostras de diferentes tamanhos e diferentes parâmetros foram
Atualmente existem várias técnicas para a geração de variáveis aleatórias. Elas avançam
71
Probabilidade de Cobertura dos Parâmetros
lidade, a geração de uma amostra aleatória a partir dessa distribuição é trivial com auxílio
computacional, uma vez que a técnica consiste em gerar variáveis aleatórias uniforme sobre
em [0; 1], os valores resultantes seguirão o mesmo modelo probabilístico da fda de interesse,
dados de uma distribuição contínua e invertível, ou seja, que permita a obtenção da função
F −1 . Porém, mesmo que não seja possível inverter a fda F, pode-se usar o algoritmo da
transformação inversa através de resolução numérica, uma vez que a expressão resultante
não é exata e métodos para a obtenção da raíz desta expressão, como o Método da Bissecção,
Método de Newton, Regula Falsi dentre outros, possibilitam uma solução razoável para a
F −1 não exata.
consiste em:
1. Gerar n valores aleatórios u de um modelo uniforme distribuído em [0; 1], U ∼ unif [0; 1];
distribuição F;
Teorema 4.1 Seja F (y), ∀ y ∈ <∗+ , a FDA da distribuição Inversa de Chen. Considerando
que F (y) : <∗+ 7−→ (0; 1], isto é, F (y) é uma função não-negativa e monótona em (0; 1],
verica-se para y > 0 que F (y) possui limites laterais em 0 e 1, mesmo que seja indenida
à direita, isto é, verica-se que F (0+ ) −→ 0 e F (+∞) −→ 1.
72
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
Proposição 4.1 Se 3.7 é a fda de Y ∼ Chen−1 (α; β) e monótona não-negativa, existe uma
relação de ordem entre y ∈ <∗+ e u ∈ (0; 1], tais que F (y) = u e F (y) é bijetora. Então
y = F −1 (u) de modo que
1
F −1 (u) = 1 (4.1)
{ln[1 − α−1 ln(u)]} β
de Y ∼ Chen−1 (α; β), tomemos os valores u ∈ (0; 1] e de acordo com a fda denida em 3.7,
−1
tomando F (y) = u, os n valores de y = F (u) são obtidos através de 4.1.
−1
Portanto, a expressão 4.1 resultante é a função inversa da fda de Y ∼ Chen (α; β), isto
No que segue, mesmo que a fda F (y) da distribuição inversa de Chen seja invertível,
−1
a geração dos n valores através de F (u) é realizada via processo computacional em de-
corrência dos valores de U ∼ unif (0; 1] e, sob demanda, assume-se que as realizações são
ção de intervalos de conança. O intuito é descrever uma avaliação para os estimadores dos
parâmetros do modelo Y ∼ Chen−1 (α; β), bem como comparar os dois métodos utilizados.
apresentado na seção 2.2.5 como uma classe de intervalos de credibilidade para uma amostra
73
Probabilidade de Cobertura dos Parâmetros
proposta.
primeiro para gerar as amostras necessárias e segundo para realizar as estimações pretendi-
das.
Vale ressaltar que os cálculos das estimativas em ambos os casos foram computados via
software e linguagem SAS onde, em particular foi utilizada o procedimento NLMIXED para
o levantamento das estimativas dos parâmetros e seus respectivos intervalos de conança as-
caso bayesiano, tal qual o método de Monte Carlo foi primordial para calcular os intervalos
de credibilidade.
Vale relembrar que um intervalo de conança é uma estimativa intervalar que contém um
do parâmetro da população.
amostragem o intervalo de conança para uma determinada amostra pode não conter o pa-
Logo, um intervalo de conança é denido como uma estimativa que contém o verdadeiro
74
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
de um intervalo de conança é de 0.95. A literatura mostra que isso é muito comum quando
uma população é normalmente distribuída ou quando o tamanho amostral é grande o su-
ciente para que o Teorema Central do Limite seja aplicado, o que remete a convergência da
variável aleatória em estudo para uma distribuição Normal de modo que todas as suposições
Em aplicações com dados reais, oriundas de amostras de tamanho pequeno ou com dados
tria e curtose sobre os resultados obtidos, no sentido de afeta-los drasticamente, o que gera
conclusões precipitadas sobre o sistema e atribui intervalos de conança que não contêm os
Assim, assume-se como estudo preliminar a prática da simulação estatística e esta abor-
intervalo de conança conter o seu respectivo verdadeiro parâmetro do sistema, o que é co-
Esta prática permite concluir se um modelo adotado é efetivo para um dado tamanho
metros de interesse têm suas precisões resumidas em intervalos de 100(1 − δ)% de conança,
diga-se na aplicação de técnicas de inferência clássica, mas uma prática que vem se tornando
cada vez mais comum é a construção de intervalos com 100(1 − δ)% de credibilidade para
O principal motivo para isso, segundo Chen e Shao (1998), é que os intervalos de credibi-
Como dito no início deste capítulo, o intervalo de conança bayesiano considerado neste
em estudo. Uma vez que os parâmetros da distribuição Y ∼ Chen−1 (α; β) são denidos em
75
Probabilidade de Cobertura dos Parâmetros
que a informação prévia sobre estes parâmetros satisfaçam suas condições de existência, isto
é, α>0 e β > 0.
Como no contexto bayesiano entende-se por informação prévia a distribuição a priori,
resse em estudo, além disso, com base no conhecimento a respeito destes parâmetros, uma
distribuição à priori deve então representar a informação possuída sobre eles, no caso que
α>0 e β>0 de modo que o impacto sobre a distribuição à posteriori seja mínimo.
Como visto na seção 2.2.2, temos um grande leque de opções para a escolha do tipo de
priori. No entanto, a maioria delas são descartadas em virtude de custosos processos com-
estudo, onde o fato de não existir uma Esperança Matemática denida, impede a adoção
de prioris objetivas, tais como as de Jefreys e Laplace, por exemplo, pois são derivados do
Assim sendo, a distribuição à priori cabível a este contexto é uma não informativa, isto
a densidade da distribuição Beta é denida no aberto (0; 1), é suciente considerar a dis-
tribuição Gama, uma vez que ela é denida em <∗+ e à medida que sua variável aleatória
como a distribuição à priori considerada não são simétricas, respectivamente, o modelo In-
verso de Chen e Gama. Por isso, segundo Chen e Shao (1998), no cálculo da estimativas
da inferência é desejável um intervalo HPD, que requer apenas amostras MCMC geradas a
grações bayesianas à posteriori e, em contra partida para este conceito, a literatura sobre as
Enm, a adoção do intervalo HPD no presente estudo considera dois objetivos especícos:
de interesse; e
de métodos numéricos para construí-los, bem como o próprio MCMC, tanto que, para o
76
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
escopo deste capítulo o método MCMC será aplicado para o cálculo dos intervalos HPD em
um estudo de simulação de pequena escala que conduzirá uma avaliação aos estimadores
do modelo Y ∼ Chen−1 (α; β) bem como servirá de peça central em uma comparação de
Assim, tomando o parâmetro θi para i = 1, 2 do modelo Y ∼ Chen−1 (α; β), tal que
ritmo:
2. Obter uma amostra aleatória de tamanho η para θi;j onde j = 1, 2, 3, ..., η , a distribui-
(k) (k)
onde, em cada um dos η − (1 − δ)η intervalos Ri (η), θi é o k -ésimo menor limite
(k+[1−δ]η)
inferior e θi é o [k + (1 − δ)η]-ésimo menor limite superior de θi;j ;
(k+(1−δ)η) (k)
Disso, resulta apenas uma diferença θi − θi que será a menor amplitude dentre
(k)
toda a sequência k = 1, 2, 3, ..., η − (1 − δ)η de intervalos, e é tal que R̂1 (y) = θ̂i e R̂2 (y) =
(k+[1−δ]η) (0)
θ̂i são os quantis da posteriori p(θi |y), e tais que o conjunto R̂i (1 − δ) = {θi ∈ Θi |
p(θi |y) ≥ K(δ)} = [R̂1 (y); R̂2 (y)], como similarmente denido em 2.2.5, é um intervalo de
(0)
credibilidade HPD em que K(δ) é a maior constante tal que P (θi ∈ R̂i (1 − δ)|y) ≥ 1 − δ .
−1
E ainda, embora a distribuição marginal Y ∼ Chen (α; β) e a distribuição à priori
posteriori de um determinado parâmetro é 1−δ , tal intervalo é dito ser de máxima densidade
a posteriori (HPD) com 100(1 − δ)% de credibilidade se
Z
p(θi |y)dθi = 1 − δ (4.3)
(0)
R̂i (1−δ)
77
Probabilidade de Cobertura dos Parâmetros
Embora as observações 4.4 e 4.5, conforme discutido e justicado por Chen e Shao (1998),
são resultados obtidos através do desenvolvido do método MCMC sob a suposição unimodal,
é possível ainda estender esses resultados aos casos multimodais, resultando da união de
Por m, Paulino, Turkman e Murteira (2003), inserem R̂j (1−δ) = [θ̂ j ; θ̂1− j+[1−δ]n ] como a
n n
notação de um intervalo HPD para uma amostra de tamanho n de um parâmetro θ qualquer,
rência estatística e seu propósito é derivar uma relação empírica entre a probabilidade de
xadas e busca-se uma medida p que representa a proporção de amostras cujos intervalos
dibilidade, no caso bayesiano, para estimar os parâmetros do modelo nas N amostras pré
78
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
interesse em saber a presença (ou ausência) do atributo que é conter (ou não) o parâmetro do
de Bernoulli.
elementos que têm o atributo sob estudo, numa amostra de N elementos observados em que
cada um dos N ensaios admite apenas um dentre dois possíveis resultados com probabili-
dade P = 1 − δ , isto é, assumindo que Φ é a variável aleatória que representa o sucesso do
experimento e tal que:
(
1, se o intervalo contém o parâmetro ;
Φ=
0, caso contrário ;
ser aceito através de seu respectivo intervalo de conança utilizando apenas valores amos-
trais da variável aleatória e a determinação das condições operacionais que resultam em uma
Em geral, a técnica também permite vericar que quanto maior o tamanho de uma amos-
tra mais próximo os valores estimados dos parâmetros do modelo se aproximam dos valores
tabelecida.
interesse;
babilidade teórica P = 1 − δ.
79
Probabilidade de Cobertura dos Parâmetros
esta aplicação é viável no caso clássico, uma vez que o teste da proporção considera a teo-
ria assintótica para normalidade dos dados do experimento binomial e como proposto neste
Entretanto, sendo de interesse avaliar esta estimativa, medidas de distância serão consi-
seja, para os parâmetros xados do modelo, à medida que o tamanho da amostra é alterado,
de interesse;
80
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
seus respectivos intervalos com 100(1 − δ)% de conança, isto é, com probabilidade 1−δ de
cobertura.
Em m, um teste de hipótese para a aceitação desta proporção será aplicada para aceitar
a simulação para amostras de tamanhos n = {10, 20, 50, 100} para 4 duplas de parâmetros
{(α; β)} = {(0.3; 0.9); (0.5; 1.5); (1.5; 0.5); (1.5; 2.0)}.
A escolha destes valores para (α; β) se justica pela avaliação do modelo Inverso de Chen
mesmo modo quando α < 1 com β > 1 e α > 1 com β < 1, respectivamente com os valores
a estimação foi realizada pelo método da máxima verossimilhança, com a ressalva de que,
realizado pelo método de Newton (ou Newton-Raphson) através do cálculo das raízes dos
estimadores do modelo que, como mostrado na seção 3.3.1 são não lineares.
Já o processo computacional sobre a abordagem bayesiana, como até aqui descrito, foi
realizada através do método MCMC que foi implementado para N M C = 40000 iterações,
Nos dois casos as estimativas foram obtidas através do método de Newton, que foi im-
plementado para 3000 iterações em cada uma das N = 500 amostras consideradas.
que os intervalos para os parâmetros na simulação foram estimados com 95% de conança
Frequência de cobertura (F rθ̂ ): o número de intervalos que contém seu respectivo parâ-
metro estimado, e como denido em 4.2.3 para a variável Φ, denimos F rθ̂ , para θ̂ = α̂
81
Probabilidade de Cobertura dos Parâmetros
ou θ̂ = β̂ , como:
N
X
F rθ̂ = Φi (4.6)
i=1
N
1 X F rθ̂
pθ̂ = Φi = (4.7)
N i=1 N
Amplitude Média dos intervalos de θ (hIC{θ;1−δ } ): é a média das diferenças entre o li-
mite superior e inferior dos N intervalos gerados para θ̂, isto é, se hIC{θi ;1−δ } é a am-
N
1 X
hIC{θ;1−δ } = hIC{θi ;1−δ } (4.11)
N i=1
82
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
(k+[1−δ]η) (k)
onde hIC{θi ;1−δ } = 2z δ σ̂θˆi no caso clássico e hIC{θi ;1−δ } = θˆi − θˆi no caso
2
bayesiano.
Média Amostral das Estimativas (µ̂θ̂ ): é a média das estimativas θ̂ na simulação para
N
1 X
µ̂θ̂ = θ̂i (4.12)
N i=1
Intervalo de Conança Assintótico para µθ̂ (IC{µθ̂ ;1−δ} ): em busca da precisão para a
estimação da média da estimativa µ̂θ̂ resultante, estabelece-se também limites para µθ̂
que, assumindo variância desconhecida, é denido por:
Sµ̂
onde σ̂µ̂θ̂ = √ θ̂ e zδ é o quantil normal padrão com nível δ de signicância.
n 2
Erro quadrático médio (EQMθ ): é a soma quadrática da diferença entre uma estimativa
N
1 X
EQMθ = (θ − θ̂i )2 (4.14)
N i=1
luta entre o verdadeiro valor do parâmetro e a sua i-ésima estimativa e é denida por:
N
1 X
Vθ = |θ − θ̂i | (4.15)
N i=1
elevado, diga-se para as N = 500 amostras consideradas, a exibição gráca de todo o pro-
cesso de iteração para o cálculo das estimativas de todas as amostras é quase impossível, em
MCMC, e mesmo que dispensada a abordagem gráca destes resultados, ainda é desejável o
resumo adequado das informações sobre estes processos e, portanto, uma alternativa alcan-
gência e solucionam o problema gráco encontrado de forma adequada. Tais medidas são
83
Probabilidade de Cobertura dos Parâmetros
então somadas até esse ponto, ou seja, τ̂ρ̂θ é o somatório de k − 1 correlações ρ̂θi (h) ge-
i
radas até o ponto de corte k , que comumente é xado como ρ̂θi (k) < 0.01 e denida por:
k−1
X
τ̂ρ̂θi = 1 + 2 ρ̂θi (h) (4.16)
h=1
onde ρ̂θi (h) é a autocorrelação de lag h para as η estimativas θˆi de interesse e é denida
em termos da função de autocovariância γ̂θi (k) = Cov(θ̂i;j ; θ̂i;j−k ) da amostra, tal
Tamanho Amostral Efetivo (ESSθi ) : ESS (Eective Sample Size - Tamanho Amostral
Efetivo) é uma medida de quão bem uma dada cadeia está convergindo e embora a
η η
ESSθi = k−1
= (4.17)
X τ̂ρ̂θ
1+2 ρ̂θ (h)
h=1
Efetividade da Cadeia Markoviana (ef fθi ) : tomaremos aqui como efetividade a razão
ESSθi
ef fθi = (4.18)
η
1
ef fθi = (4.19)
τ̂ρ̂θi
Vale ressaltar que, no processo de execução do método MCMC, obteve-se η = 1000 ob-
servações reamostradas e que o alvo principal, dentre as três medidas anteriores de avaliação
das N = 500 amostras iniciais, isto é, as N = 500 medidas para ef fθi , neste trabalho consi-
84
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
N
1 X
ef f θ = ef fθi (4.20)
N i=1
e
v
u N
u 1 X
DP (ef fθ ) = t [ef fθi − ef f θ ]2 (4.21)
N − 1 i=1
Deste modo, ef f θ é uma estimativa para a avaliação da convergência de cada uma das
N = 500 execuções do método MCMC sob o desvio padrão DP (ef fθ ) e pode ser considerado
com precisão em seu intervalo de conança assintótico.
resumir todos estas medidas descritas em cada um dos casos de parâmetros e para os n
tamanhos amostrais.
Além da síntese numérica será também apresentado os resultados grácos, como o que
amostral.
das 500 estimativas obtidas. Ele irá mostrar a linha sobre o valor do verdadeiro parâmetro
em estudo da população, de modo que os IC's que contêm este valor são mostrados em azul
O gráco histograma, por sua vez, é adotado para descrever o comportamento das 500
estimativas calculadas para apontar que, assintoticamente, a distribuição amostral é apro-
ximadamente normal com média µθ . A distribuição amostral irá evidenciar como as estima-
Tais resultados serão apresentados tanto sob a abordagem da inferência clássica quanto
será descrita, partindo da premissa inicial ao processo que é a geração dos dados amostrais,
expondo o método adotado para a geração de dados para a variável aleatória, como descrito
no tópico 4.1.1, e especicando seu item primordial, a expressão 4.1 como deduzida no tópico
4.1.2.
85
Probabilidade de Cobertura dos Parâmetros
estudo, fato pelo qual as aplicações assintóticas que seguem são validadas tornando incon-
que tange sua temática principal, como proposto na fase inicial com o projeto, busca-se aqui
Y ∼ Chen−1 (α; β) para evidenciar seu comportamento e precisão sob diferentes amostras.
No que segue, é realizado através dos resultados obtidos da simulação uma vericação
mativas geradas e avaliadas através de sua média em seu respectivo intervalo de conança
teórica e empírica, a amplitude média dos intervalos gerados, o estimador de máxima veros-
conforme descrito.
Como o nível de conança e credibilidade para os intervalos de cada uma das amostras
foram calculados com 95%, a probabilidade de cobertura teórica para cada um dos 4 casos
e para cada um dos parâmetros deve ser 0.95, ou seja, Pθ = 0.95 é a probabilidade de co-
Vale ressaltar que, como descrito na seção 4.2.3, leva-se em consideração que a estimativa
pθ é uma proporção binomial, mas não usaremos o conceito de que a cobertura verdadeira
86
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
Note que, de acordo com a denição de distância entre dois pontos, d{Pθ ;pθ } = 0 somente
Além disso, observa-se que, dada a variabilidade de pθ em [0; 0.95], existe um grau de
similaridade para τ e como é de interesse obter d{Pθ ;pθ } = 0, vamos tratar τ como uma
medida de similaridade com variação unitária e, consequentemente, pode ser interpretada
como uma analogia ao conceito de coeciente de correlação, pois varia em [0; 1] e atinge seu
pθ = 0.95±d{Pθ ;pθ } está de Pθ = 0.95, através da distância d{Pθ ;pθ } . Nesta condição, mantendo
a analogia ao conceito de coeciente de correlação, podemos interpretar τ como:
• τ = 1: a similaridade é perfeita;
É evidente que, se pθ > 0.95 então 1 < τ ≤ 1.0526, mas avaliar d{Pθ ;pθ } quando pθ > 0.95
é equivalente a avaliar d{Pθ ;pθ } quando 0.90 ≤ pθ < 0.95, isto é, como τ = 1 é ponto médio
Sendo assim, para avaliar o quão próximo pθ está de Pθ e dizer se são, ou não, similares, é
necessário xar τ2 ≥ 0.65 de modo que para a probabilidade pθ = 0.95 ± d{Pθ ;pθ } é necessário
∗
um erro δ > d{Pθ ;pθ } , ou <, obtido através de A com a seguinte armação:
τ2 ≥ 0.65 .
A δ τ1 0.05 1
⇒ ∗ = ⇒ ∗ = (4.22)
B δ τ2 δ 0.65
87
Probabilidade de Cobertura dos Parâmetros
ou seja, δ ∗ = 0.0325 é tal que, se δ ∗ = 0.0325 < d{Pθ ;pθ } , ou equivalentemente, 0.95±d{Pθ ;pθ } ∈
[0.9175; 0.9825], pθ é similar a Pθ e uma medida aceitável para a probabilidade de cobertura
do estimador do parâmetro θ de interesse.
Portanto, em vez do IC{Pθ ;95%} toma-se as medidas de proximidade d{Pθ ;pθ } e hIC{θ;95% } ,
drático médio e o vício para os estimadores para avaliá-los e reforçar as armações sobre a
amostras nos casos descritos anteriormente e segundo as abordagens clássica (C) e bayesiana
(B).
Neste subtópico descreve-se os resultados para um caso particular em que 0 < α < β < 1.
A tabela 4.1 a seguir resume os valores obtidos nas condições descritas para os parâmetros
do modelo, onde a coluna n indica o tamanho da amostra, ou seja, a descrição dos resultados
ao caso especíco para a amostra de tamanho n dos parâmetros α e β segundo as técnicas
Tabela 4.1: Resultados da simulação para os parâmetros no caso que α = 0.3 e β = 0.9.
A coluna µ̂θ̂ , mostra tanto no caso clássico como no bayesiano, que as estimativas para α
e β , em média, correspondem ao esperado e são aceitas sob 5% de signicância como mostra
88
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
a coluna IC{µθ̂ ;95%} , pois o verdadeiro valor destes parâmetros estão contidos em seus res-
pectivos IC's.
Além disso, em decorrência da frequência calculada, como exibida na coluna F rθ̂ , obtém-
se a probabilidade de cobertura que é exibida na coluna pθ com suas respectivas medidas de
tamanho n = 10 e n = 20, respectivamente, d{Pα ;pα } = 0.0420 e d{Pα ;pα } = 0.0360, evidenci-
Vale destacar que, como xado anteriormente um limite máximo de 0.0325, temos que
valores como 4.2% e 3.6% são demasiados elevados em comparação a 3.25%, e em virtude
subestimadas.
Para os demais casos verica-se proximidade satisfatória, uma vez que tanto d{Pα ;pα }
como d{Pβ ;pβ } são menores ou iguais a 1.6%.
Logo, das 8 coberturas clássicas e bayesianas calculadas, no caso em que n = 10 as
probabilidades de cobertura clássicas encontram-se distantes do valor teórico nos dois casos
paramétricos, por isso arma-se que neste caso de parâmetros a cobertura no caso bayesiano
Além disso, avaliando a amplitude média verica-se que, a medida que o tamanho da
amostral, são menores no caso bayesiano, embora sejam de mesma grandeza que o parâme-
tro de interesse.
Isso evidencia que os intervalos de credibilidade são os mais precisos, pois ao longo de
para os resultados mostram que os erros obtidos foram também baixos, em todos os casos
Por m, a coluna Vθ apresenta resultados similares ao EQMθ , no sentido de que o viés
para os estimadores são todos baixos e destacando que as distâncias entre cada uma das
Verica-se que, em geral, as cadeias do processo MCMC não produziram amostras inde-
pendentes, isto é, que cada ponto de reamostragem dependeu do ponto anterior pois, como
em 4.19. Isso signica que, em média, foi necessário uma única observação da saída MCMC
para fazer inferências sobre os parâmetros de interesse com a mesma precisão de uma amos-
tra independente.
89
Probabilidade de Cobertura dos Parâmetros
Como é exibido, nota-se que os grácos seguem em dupla coluna, linha de referência
observa-se uma convergência quase perfeita para uma distribuição amostral Normal.
destes intervalos são equivalentes e aumentam a medida que o tamanho n da amostra au-
menta. Esta observação também é realizada sobre a amplitude média hIC{θ;95% } evidenciando
90
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
uma elevada estimativa, esse fato pode ser justicado pelo seu valor real, que neste caso é
β = 1.5 > 1, enquanto que os erros EQMθ elevados são de grandeza (0; 1), baixos em relação
ao valor teórico e, por serem baixos, permite a aceitação de Vθ elevado.
As estimativas para a simulação deste caso são apresentadas na tabela que segue.
Tabela 4.3: Resultados da simulação para os parâmetros no caso que α = 0.5 e β = 1.5.
bayesiano, observa-se que para a amostra de tamanho n = 100 obteve-se a maior distância
entre as coberturas teórica e empírica entre todos os 16 casos simulados. Porém, menor que
o limite 0.0325.
Como este é o caso de maior tamanho amostral espera-se que o valor para o índice pα
seja o mais próximo possível de 0.95, porém, mesmo ele se mostrando o mais distante entre
verica-se neste caso a menor amplitude média entre todos os possíveis casos simulados, bem
o mais eciente neste tamanho amostral, pois dentre as estimativas α e β no caso clássico
e bayesiano, seu estimador possui os menores hIC{θ;95% } , EQMβ e Vβ , isto é, hIC{β;95% } <
hIC{α;95% } , EQMβ < EQMα e Vβ < Vα .
Sobretudo, os dados da tabela 4.3 mostram que a medida o tamanho da amostra aumenta
0.95 na probabilidade de cobertura e 0 para d{Pθ ;pθ } , hIC{θ;95% } , EQMθ e Vθ , destacando que
91
Probabilidade de Cobertura dos Parâmetros
As estimativas mostram que o processo MCMC teve uma rápida convergência, uma vez
que a eciência média de cada um dos 8 processos é relativamente alta, pela qual também se
conclui que existiu baixa autocorrelação entre as amostras em virtude do tempo de correlação
bayesiana. Os histogramas evidenciam que a medida que o tamanho das amostras aumentam,
do verdadeiro valor do parâmetro xado, e nos grácos dos histogramas, verica-se também
Esta simulação evidencia que, nos casos em que 0 < α < 1 < β, para n > 20 os
Este é um caso particular das classes do modelo Inverso de Chen onde 0 < β < 1 < α.
Partindo da análise dos resultados sobre α, quando n = 10 no caso clássico, a média ob-
tida para estas estimativas, bem como seu intervalo de conança, sugerem superestimação
sobre o parâmetro em questão, dado que µ̂α̂ = 1.9576 com IC{µα̂ ;95%} = (0.8885; 4.9828).
No entanto, neste caso paramétrico ca constatado que os estimadores do modelo, no
caso clássico, apresentam bons resultados apenas para as grandes amostras, dado os valores
metro α é eciente.
92
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
Tabela 4.5: Resultados da simulação para os parâmetros no caso que α = 1.5 e β = 0.5.
Isso reforça, ou é reforçado, pelo resultado obtido na cobertura empírica que, neste
caso de tamanho amostral indica que este estimador superestima a estimativa α, pois
que este estimador é impreciso em virtude de que, para o valor teórico α = 1.5, a amplitude
média obtida é de hIC{α;95% } = 3.5640, mais que o dobro de seu valor teórico.
embora os valores para EQMβ e Vβ sejam toleráveis, é obtido os valores hIC{β;95% } = 3.5650,
pβ = 0.9840 e d{Pβ ;pβ } = 0.0340 > 0.0325, que são os mais altos neste caso da simulação,
onde n = 10 observações por amostra. Note que hIC{β;95% } é mais que 7 vezes o valor real do
parâmetro, xado por β = 0.5, evidenciando uma imprecisão mais grave do que a do caso α.
desempenho do estimador de α melhora, com a queda de EQMα e Vα , bem como suas es-
estimadores do modelo no caso clássico não são ecientes para amostras de qualquer tama-
93
Probabilidade de Cobertura dos Parâmetros
aceitáveis, entre seus valores, uma vez que EQMα > 0 e Vθ > 0 não indica que um estimador
é, necessariamente, ineciente pois na prática um pequeno erro e vicio é permitido.
Visto que, considerando estimativas para α, tal que α̂ ∈ α ± EQMα , resulta que α̂ ∈
(1.0632; 1.9368) ⊆ IC{µα̂ ;95%} sendo por isso aceitável já que EQMα é uma medida de erro
senta, essencialmente, o vício para o estimador de α por ser relativamente pequeno, diga-se
que o vício para o estimador deste caso é fraco com EQMα aceitável e, por isso, Vα = 0.4628
Pela mesma razão que se armou a eciência anterior, no caso bayesiano para o tamanho
amostraln = 10, arma-se que o estimador de β também o é, dado que EQMβ = 0.0242
e Vβ = 0.1171, e no caso clássico, e do mesmo modo a eciência, no caso clássico para o
Em m, para todos os demais casos de tamanho amostral não descritos, clássico e baye-
siano, temos que a eciência é imediata, visto que EQMθ e Vθ diminuem a medida que n
aumenta.
mostra que o processo, em média, teve uma rápida convergência visto que a eciência média
é aproximadamente igual a 1.
1 < α < β, e para os 4 conjuntos de amostras estes resultados são apresentados na tabela a
seguir.
É evidente aqui o mesmo comportamento para o caso particular anterior, onde o estima-
n = 10, ajustando-se para um bom desempenho à medida que o tamanho amostral aumenta.
94
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
Tabela 4.7: Resultados da simulação para os parâmetros no caso que α = 1.5 e β = 2.0.
anterior tínhamos β < 1 e logo α > β , aqui temos também β > 1 e ainda α < β . E mais, os
amplitudes discrepantes em alguns IC's nos 2 casos e isso nos remete a um problema de
variância nestes intervalos, uma vez que eles variam entre amplitudes curtas e longas ao
riância na amplitude dos IC's calculados que chegam a medir de 35 a 90 unidades como se
no apêndice 5.
não cabe a este trabalho provar tal armação de maneira que esta característica mantem-se
95
Probabilidade de Cobertura dos Parâmetros
portamento irregular diante de amostras pequenas pois, apesar de pβ = 0.0280 < 0.0325 ser
perfeitamente aceitável, verica-se que EQMβ = 0.9411 e Vβ = 0.6821, relativamente altos
em comparação ao valor esperado de 0.
As armações sobre β tornam-se evidentes com a visualização do gráco 5.15, onde nos
Uma ressalva para o caso bayesiano do parâmetro β estimado sobre a amostra de ta-
manho n = 10 se faz em relação aos erros EQMβ = 0.4974 e Vβ = 0.5286, uma vez que o
vício é razoavelmente elevado, porém o erro quadrático médio é baixo, visto que β = 2.0.
No entanto, o estimador de α e β são ecientes para pequenas amostras neste caso pa-
ramétrico.
Os grácos da linha de referência e histograma dos resultados para o caso bayesiano são
mostra que o processo teve uma rápida convergência diante dos valores mostrados e espera-
dos.
96
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
Observa-se que apenas nestes 4 casos paramétricos a simulação gerou uma extensa gama
de saídas que consistem em 2 tipos de tabelas e 2 tipos de grácos, totalizando 16 tabelas, 8
mativas dos processos MCMC e 128 grácos, 64 em cada caso de inferência com 32 grácos
Esta quantidade de saídas forçou a limitação dos casos de α e β , de modo que alguns
casos não foram investigados, tais como as combinações de valores extrapolados para α e β ,
tanto em (0; 1) para baixos valores como em (1; +∞) para grandes valores, e especicamente
cluir que o EMV dos parâmetros do modelo Inverso de Chen não funcionam com eciência
Um agravante para este EMV, no caso clássico, é notável nos casos em que α > 1, pois
−1 −1
como mostrado nas análises dos resultados para os modelos Chen (1.5; 0.5) e Chen (1.5; 2.0),
além de a probabilidade de cobertura empírica ser superestimada, o erro e o vício deste es-
delo Inverso de Chen está habilitado para fornecer estimativas para α e β para amostras
grandes, diga-se n ≥ 20, mais especicamente nos casos em que α > 1 e independente da
grandeza de β.
Especicamente para o caso em que α < 1 < β, os EMV apresentaram eciência para
amostras de qualquer tamanho, inclusive para tamanhos n = 10, diferente dos demais casos
97
Probabilidade de Cobertura dos Parâmetros
observados.
Para os casos em que 0 < α < 1, para qualquer β considerado e em conjuntos de amostras
de qualquer tamanho, o EMV de β mostrou-se, além de adequado em virtude da probabi-
lidades de cobertura empírica, eciente em decorrência dos baixos valores de erro e vício
98
CAPÍTULO 5
CONCLUSÕES PARCIAIS
mento do modelo Inverso de Chen, torna evidente a existência dos momentos de ordem r
−1
para Y ∼ Chen (α; β).
Particularmente, a convergência de E(Y r ) permite concluir que existem os momentos de
2
ordem r = 1 e r = 2, o que implica que existe uma média µY e uma variância σY para o mo-
delo proposto denidos através de seus parâmetros α e β , o que valida e torna incontestável
qualquer um dos resultados assintóticos que se pode obter a cerca do modelo em questão.
Z+∞
E(Y ) =r
αβy r−(β+1) exp{y −β + α[1 − exp(y −β )]}dy −→ K
0
lhança dos parâmetros não apresentam um bom desempenho para a maioria dos casos de
n é pequeno e os valores atribuídos aos parâmetros α e β são elevados, resulta que a estima-
tiva para a probabilidade de abrangência do parâmetro não é boa, pois seu verdeiro valor é
rejeitado.
Além disso, conclui-se que ambos os estimadores são ecazes para grandes amostras,
especicamente para n ≥ 100, pois como observado é inevitável a obtenção de baixos desem-
penhos para estes estimadores para algum caso de α e β , como por exemplo, em amostras
αeβ advém do fato de que para baixos valores de α com valores elevados para β , os estima-
dores mostram-se, além de ecientes, fornecendo resultados incontestáveis sobre a amostra
99
CONCLUSÕES PARCIAIS
observa na seção 4.3, para as amostras pequenas na simulação realizada foi notável o fato
para Pα são subestimados enquanto que nos casos em que α > 1 são superestimadas, como é
mostrado na tabela 5.1 a seguir. Esta é outra evidência para a característica de forma deste
parâmetro.
IC's nos resultados da seção 4.3 permite concluir que α contempla um parâmetro de forma
Estes resultados, sobretudo, permitiram concluir que à medida que o tamanho amostral
da inferência bayesiana proposta, uma vez que seus conceitos permitem a avaliação dos parâ-
dagem bayesiana e comparar seu desempenho, isto é, confrontar os resultados para a proba-
100
REFERÊNCIA BIBLIOGRÁFICA
5. FIGUEIREDO, D. G.. Análise I. 2th Edição. Rio de Janeiro: LTC, 1996. 256 páginas.
6. KHAN, M. J. S.; SHARMA, A.. Generalized Order Statistics From Chen Distribution
and Its Characterization. Journal of Statistics Applications & Probability, India,
v. 1, p. 6, 2016.
7. LIMA, E. L.. Análise Real: Funções de Uma Variável. 12th Edição. Rio de Ja-
neiro: SBM, 2014. 198 páginas.
101
CONCLUSÕES PARCIAIS
11. SRIVASTAVA, P. K.; SRIVASTAVA R. S.. Two Parameter Inverse Chen Distribu-
tion as Survival Model. International Journal of Statistika and Mathematika ,
bro de 2016.
13. WICKLIN, R.. Simulating Data with SAS. 1th Edição. Carolina do Norte: SAS
102
APÊNDICE
logl[S(t)], então S(t) é o EMV de S(t). Nesta condição, segue pela expressão 2.61 que:
Como S(t) é uma função discreta com probabilidade maior que 0 (zero) somente nos
i
Y i
Y
S(t) = (1 − qj ) = πi
j=1 j=1
k
Y
L[SEKM (t)] = [S(ti−1 ) − S(ti )]di [S(ti )]ci =
i=1,ti <t
103
CONCLUSÕES PARCIAIS
k i−1 i
!di i
!c i
Y Y Y Y
= πj − πj πj =
i=1,ti <t j=1 j=1 j=1
k i−1 i−1
!di i−1
!c i
Y Y Y Y
= πj − πj π j π j πj =
i=1,ti <t j=1 j=1 j=1
k i−1
!di i−1
!ci
Y Y di
Y
= (1 − πj )
πj πj πjci =
i=1,ti <t j=1 j=1
" k # k i−1
!di +ci
Y Y Y
= (1 − πj )di πjci πj
i=1,ti <t i=1,ti <t j=1
dj
qj = →0
nj
de modo que:
k i−1
!di +ci k
" i−1 #ni k
" i−1 #ni
Y Y Y Y Y Y dj
πj = (1 − qj ) = (1 − ) =
i=1,ti <t j=1 i=1,ti <t j=1 i=1,ti <t j=1
nj
k
" i−1 #ni
Y Y
= (1) =1
i=1,ti <t j=1
" k
# k i−1
!di +ci
Y Y Y
L[SEKM (t)] = (1 − πj )di πjci πj =
"i=1,tk i <t #i=1,ti <t j=1
Y
= (1 − πj )di πjni −di (1) =
i=1,ti <t
Y k k
Y
di
= (1 − πj ) πjni −di = φi
i=1,ti <t i=1
104
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
k
Y
Logo, L[SEKM (t)] = φi e observe agora que, considerando a função φ de L[SEKM (t)],
i=1
teremos por ela que:
e consequentemente
∂ ∂ ni − di di
log(φi ) = di log(1 − πj ) + (ni − di )log(πj ) = −
∂πj ∂πj πj 1 − πj
∂
Como o πj = π̂j máximo é solução para equação log(φi ) = 0, segue ainda que:
∂πj
∂ ni − di di
log(π̂j ) = 0 =⇒ − = 0 =⇒ (1 − π̂j )(ni − di ) − π̂j di = 0 =⇒
∂ π̂j π̂j 1 − π̂j
ni − di di
=⇒ π̂j di + π̂j (ni − di ) = ni − di =⇒ π̂j = =1−
ni ni
di
Logo, se π̂j = 1 − é o ponto que maximiza a função φ, consequentemente, dada a
ni
k
Y
função de verossimilhança l[SEKM (t)] = φi , teremos que:
i=1
" k
# k
Y Y di
log[SEKM (t)] = log φi =⇒ ŜEKM (t) = 1−
i=1 i=1
ni
k
di Y di
ou seja, se π̂j = 1− maximiza a função de verossimilhança φ, então ŜEKM (t) = 1−
ni i=1
ni
minimiza a função de verossimilhança de SEKM (t).
e um caso particular considera os casos de funções denidas em < e com restrições em seu
intervalo de denição.
105
CONCLUSÕES PARCIAIS
como no caso da g(z) obtida em 3.20 e que além de tudo é não elementar. Deste modo,
temos que a g(z) obtida é uma função não elementar com integral indenida.
estudo.
Com isso, em relação a divergência, uma alternativa para avaliar g(z) consiste em consi-
derar 0 < ∆(z) ≤ g(z) no caso em que g(z) ∈ (0; +∞), isto é, obter uma função comparativa
∆(z) que seja aplicada aos casos 1 e 2 apresentados em 3.21 e 3.22, necessariamente cons-
truída de modo que ∆(z) ∈ (0; +∞) e que satisfaça o seguinte resultado
onde é necessário e suciente que pelo menos um dos três casos a seguir ocorram:
Z1 Z+∞
∆(y)dy −→ +∞ e ∆(y)dy −→ L (5.1)
0 1
ou
Z1 Z+∞
∆(y)dy −→ L e ∆(y)dy −→ +∞ (5.2)
0 1
ou
Z1 Z+∞
∆(y)dy −→ +∞ e ∆(y)dy −→ +∞ (5.3)
0 1
isto é,∆(z) é restringido para antiderivadas diferentes mas permanece o mesmo integrando
em (0; +∞), de modo a se obter a divergência em pelo menos um dos intervalos de restrição
Do mesmo modo esta estratégia se aplica para mostrar a convergência de g(z), para isso
106
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
Z
basta que a função ∆(z) seja construída de tal modo que ∆(z)dz −→ L e
0 0 1 0 1 0
ou seja, as condições 5.1 e 5.2 resumem-se em 5.3, onde em vez de se obter −→ +∞ nas
restrições, verica-se −→ L. Z
Contudo, supondo que o interesse seja vericar a divergência de g(z), como g(z)dz é
zendo pelo menos uma das condições 5.1, 5.2 e 5.3 descritas.
O intuito também é realizar uma comparação das integrais através da obtenção da função
∆(z), mas aqui restringida em intervalos para∆1 (z) e ∆2 (z), de modo que o descrito em
5.4 seja atendido com g(z) ≤ ∆1 (z) e g(z) ≤ ∆2 (z), respectivamente quando g(z) ∈ (0; 1] e
z z
g(z) ∈ [1; +∞), no caso 1 para α ≤ e no caso 2 para α ≥ .
exp(z) exp(z)
Logo, o objetivo principal em avaliar g(z) é obter a convergência nos 2 casos para consta-
r
tar que existem z , α e λ tais que g(z) é convergente, para consequentemente E(Y ) também
Vale ressaltar que a segunda estratégia, no caso da busca de divergência, para as con-
dições 5.1 e 5.2, não somente obtendo a divergência de um dos intervalos de restrição, é
necessário porém avaliar a segunda de modo a vericar que este apresente convergência para
+∞ − ∞, por isso é necessário xar que em uma das duas restrições postas se verique
−→ L.
Assim, ainda na segunda estratégia, para simplicar a avaliação de E(Y r ) é requerido que
∆(z) seja denido em dois intervalos distintos, de modo a se restringir ∆1 (z) em g(z) ∈ (0; 1]
e ∆2 (z) em g(z) ∈ [1; +∞), isto é, denir para os casos i = 1; 2 que:
(
∆1 (z), para 0 < z ≤ 1;
∆(z) =
∆2 (z), para z ≥ 1;
107
CONCLUSÕES PARCIAIS
Portanto, uma vez constatado que ∆(z) é convergente de acordo com 5.4, ou divergente
segundo 5.1, 5.2 ou 5.3, o critério da comparação de integrais garante que para todo z, α e
r
λ, g(z) também o é, e através dele E(Y ) também e a caracterização pode ser denida.
Como segue, será avaliado cada um dos casos 3.21 seguindo então as imposições para α
como apresentado em 3.22. Estes casos resumem-se nas seguintes avaliações:
z
Avaliação 1: quando α≥ e z − Λ(z) ≤ 0 < exp[z − Λ(z)] ≤ 1;
exp(z) (5.5)
z
Avaliação 2: quando α≤ e z − Λ(z) ≥ 0 e 1 ≤ exp[z − Λ(z)];
exp(z)
Vale ressaltar que embora xa-se as avaliações em que 0 < exp[z − Λ(z)] ≤ 1 e 1 ≤
exp[z − Λ(z)], ambas serão desenvolvidas para g(z) ∈ (0; +∞) e ∆(z) ∈ (0; +∞), tais que
z ∈ (0; +∞).
Mais especicamente, xemos λ > 0 e tal que λ ∈ (0; +∞). Seja também g : (0; 1] 7−→
<∗+ , então, segundo Lima (1989), pela técnica de integral imprópria para limitantes descon-
tínuos, teremos que:
Z1 Z1 +∞, se λ ≥ 1,
1 −λ
dz = lim+ z dz = 1 (5.6)
zλ →0 , se λ < 1
0 1−λ
particular se comporta de forma oposta a quando z ∈ (0; 1], pois é convergente se λ > 1 e
divergente se λ ≤ 1.
∗
Então, seja também g : (1; +∞] 7−→ <+ , para λ > 0 xado e tal que λ ∈ (0; +∞), isto
108
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
é, pelos mesmos motivos de 5.6, porém pela técnica de integral imprópria para limitantes
1
Z∞ Zk
1 −λ
, se λ > 1,
dz = lim z dz = 1−λ (5.7)
zλ k→∞ +∞, se λ ≤ 1
1 1
1
Contudo, de 5.6 e 5.7, sobre a função abordada, tomando ∆(z) = , é evidente que
zλ
extrema importância para avaliarmos g(z) no caso em que seu numerador é maior que 1, ou
seja, estritamente na condição em que 1 ≤ exp[z − Λ(z)].
Fazendo π(z) = 1, veremos que é trivial obter 0 < ∆(z) ≤ g(z) observando que
π(z)
∆(z) = λ ≤ g(z) em decorrência de π(z) ≤ exp[z − Λ(z)]. No entanto, posteriormente
z
será necessário avaliar g(z) quando 0 < exp[z − Λ(z)] ≤ 1, e a diculdade será obter para
π(z)
∆(z) um π(z) tal que ∆(z) = λ e 0 < ∆(z) ≤ g(z).
z
A condição mais trivial para o estudo da integral em questão é a em que se pode conside-
rar funções maiores que exp[z − Λ(z)] e obtê-las de modo que seja convergente, e nenhuma
c
é melhor do que as próprias funções exponenciais, tais como exp(cz n ) e exp( ), respecti-
zn
vamente, e maiores que exp[z − Λ(z)].
109
CONCLUSÕES PARCIAIS
1
Seja então c = n = 1 e tais que π1 (z) = exp(z) e π2 (z) = exp . Observa-se que π1 (z)
z
e π2 (z) são funções da mesma família que exp[z − Λ(z)] e tais que:
◦ ◦
onde z − Λ(z) ≤ 0 e z > 0, ou seja, as desigualdades do 1 e 2 itens são verdadeiras.
πi (z)
Nestas condições, tomando ∆i (z) = λ , resulta que:
z
π (z) exp(z)
∆1 (z) = 1
= , para i = 1 e 0 < z ≤ 1;
z λ zλ 1
∆(z) = (5.9)
∆2 (z) = π2 (z) = exp z , para i = 2 e z ≥ 1;
zλ zλ
+∞ n
X z
Então, assumindo a expansão de Taylor de exp(z), isto é, exp(z) = , resulta que:
n=0
n!
exp(z)
i = 1) Para 0<z≤1 e ∆1 (z) = :
zλ
Z1 Z1 Z1 +∞ +∞ 1 +∞ 1
1 X zn
Z n Z
exp(z) X 1 z X 1
∆1 (z)dz = dz = dz = dz = z n−λ dz =
zλ z λ n=0 n! n=0
n! z λ
n=0
n!
0 0 0 0 0
+∞ Z 1
+∞ n−λ+1 1 X +∞ +∞
X 1 n−λ
X 1 z 1 X
= z dy = = = an
n=0
n! n=0
n! n − λ + 1 0 n=0 (n − λ + 1)n! n=0
0
1
E mais, dada a série resultante onde n ∈ ℵ, xando que cn = 2 e sabendo esta ser
n
convergente, pois é uma série-p com expoente p = 2 > 1, temos que
1 1 1 1 1
≤ 2 ⇔ 2 λ 1
≤ 2 ⇔ λ
≤1 (5.10)
(n − λ + 1)n! n n (1 − n
+ n )(n − 1)! n (1 − n
+ n1 )(n − 1)!
110
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
Assim
Z1 +∞
X 1
∆1 (z)dz = −→ L1 (5.11)
n=0
(n − λ + 1)n!
0
exp( z1 )
i = 2) Para z≥1 e ∆2 (z) = :
zλ
1 1 1
Seja agora a mudança de variável v= tal que z= ⇒ dz = − 2 dv , então
z v v
Z+∞ Z+∞ Z0 Z1
exp( z1 )
exp(v) 1 exp(v)
∆2 (z)dz = λ
dz = 1 − 2 dv = dv =
z vλ
v v 2−λ
1 1 1 0
+∞ Z1 +∞ n+λ−1
1 +∞ +∞
X 1 n+λ−2
X 1 v X 1 X
= v dv = = = bn
n=0
n! n=0
n! n + λ − 1 0 n=0
(n + λ − 1)n! n=0
0
1
E pelo mesmo motivo anterior, sendo bn ≤ c n = , resulta que
n2
Z+∞ +∞
X 1
∆2 (z)dy = −→ L2 (5.12)
n=0
(n + λ − 1)n!
1
Z+∞ Z1 Z∞
∆(z)dz = ∆1 dz + ∆2 dz −→ L1 + L2 = L (5.13)
0 0 1
Z
O resultado 5.13 mostra que existe um ∆(z) > 0 tal que ∆(z)dz −→ L e denido
em z ∈ (0; +∞] para qualquer λ > 0, ou seja, um integrando convergente da mesma família
de g(z).
111
CONCLUSÕES PARCIAIS
Figura 5.1: Linha de referência e histograma das estimativas clássicas para α = 0.3.
112
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
Figura 5.2: Linha de referência e histograma das estimativas bayesianas para α = 0.3.
113
CONCLUSÕES PARCIAIS
Figura 5.3: Linha de referência e histograma das estimativas clássicas para β = 0.9.
114
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
Figura 5.4: Linha de referência e histograma das estimativas bayesianas para β = 0.9.
115
CONCLUSÕES PARCIAIS
Figura 5.5: Linha de referência e histograma das estimativas clássicas para α = 0.5.
116
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
Figura 5.6: Linha de referência e histograma das estimativas bayesianas para α = 0.5.
117
CONCLUSÕES PARCIAIS
Figura 5.7: Linha de referência e histograma das estimativas clássicas para β = 1.5.
118
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
Figura 5.8: Linha de referência e histograma das estimativas bayesianas para β = 1.5.
119
CONCLUSÕES PARCIAIS
Figura 5.9: Linha de referência e histograma das estimativas clássicas para α = 1.5.
120
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
Figura 5.10: Linha de referência e histograma das estimativas bayesianas para α = 1.5.
121
CONCLUSÕES PARCIAIS
Figura 5.11: Linha de referência e histograma das estimativas clássicas para β = 0.5.
122
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
Figura 5.12: Linha de referência e histograma das estimativas bayesianas para β = 0.5.
123
CONCLUSÕES PARCIAIS
Figura 5.13: Linha de referência e histograma das estimativas clássicas para α = 1.5.
124
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
Figura 5.14: Linha de referência e histograma das estimativas bayesianas para α = 1.5.
125
CONCLUSÕES PARCIAIS
Figura 5.15: Linha de referência e histograma das estimativas clássicas para β = 2.0.
126
Uma Abordagem Bayesiana Para a Distribuição Inversa de Chen
Figura 5.16: Linha de referência e histograma das estimativas bayesianas para β = 2.0.
127