Você está na página 1de 8

Error: Reference source not found Ministério da Educação

Universidade Federal de São João Del Rei


Departamento de Zootecnia

COMPARAÇÃO DE CURVAS DE SOBREVIVÊNCIA COM CENSURA


INTERVALAR ATRAVÉS DA ANÁLISE SEQUENCIAL

Prof. Orientador
Carla Regina Guimarães Brighenti

Projeto enviado ao Programa Institucional de


Bolsas de Iniciação Científica do –
PIBIC/FAPEMIG/UFSJ conforme Edital nº
009/2017/PROPE.

São João Del Rei


Setembro

1- INTRODUÇÃO

Em estudos de análise de sobrevivência, a variável resposta é, geralmente, o tempo até a


ocorrência de um evento de interesse que pode ser a morte de um indivíduo ou tempo até atingir o peso
de abate, por exemplo. Assim, a sobrevivência é definida como a probabilidade de uma observação
“sobreviver” ao tempo t. Em termos probabilísticos isto é, S(t) = P (T ≥ t ), em que T= variável aleatória
e t valor observado para o valor T. Para a função de distribuição acumulada temos que F(t) =1- S(t)

0
(Lawless, 1982). Dentre as diversas distribuições que descrevem de forma mais adequada a variável
“tempo de falha” estão as distribuições de Weibull e Log-Normal.
A principal característica de dados de sobrevivência é a presença de censura que é a observação
parcial da resposta. Isto se refere a situação em que, por alguma razão o experimento foi interrompido
ou não obteve uma resposta exata (Brighenti et al., 2017). De acordo com o tipo de experimento
desenvolvido pode-se, classificar a censura como (i) Tipo I: quando o estudo é terminado após um
período pré-estabelecido de tempo; (ii) Tipo II: quando o estudo é terminado após ter ocorrido um
evento de interesse em um numero pré-estabelecido de indivíduos; (iii) Aleatória: o individuo é retirado
no decorrer do estudo sem ter ocorrido a falha; (iv) Censura à direita: o tempo de ocorrência do evento
de interesse esta a direita do tempo registrado; (v) Censura à esquerda: ocorre quando o tempo
registrado é maior do que o tempo de falha. Isto é, o evento de interesse já aconteceu quando o
“individuo” foi observado; (vi) Censura intervalar: o evento de interesse ocorreu em um determinado
intervalo de tempo, ou seja, o tempo de falha T não é conhecido exatamente e sim pertence a um
intervalo, isto é T ∈ (I, S] (Colosimo e Giolo, 2006).
É importante ressaltar que, mesmo censurados todos os resultados provenientes de um estudo de
sobrevivência devem ser usados na análise estatística, pois mesmo sendo incompletas as observações
censuradas fornecem informações importantes sobre o tempo de vida. A omissão das censuras no
cálculo das estatísticas de interesse pode acarretar conclusões viciadas.
Dados de tempo de vida são comuns em bioensaios, como por exemplo, testes de sobrevivência
de abelhas. Nestes casos, não há um critério bem definido para a interrupção do experimento Brighenti
(2017). Nagelkerke & Hart (1980) recomendam que os experimentos não ultrapassem 10 dias de
confinamento para bioensaios com Apis mellifera, visto que há fatores biológicos que podem interferir
nos resultados.
Um tipo de amostragem que pode ser útil se aliado aos dados de sobrevivência é a amostragem
sequencial que se caracteriza por envolver amostras de tamanho variável ao contrário da amostragem
convencional que tem um número fixo. Outra diferença é que enquanto a amostragem convencional
procura estimar os parâmetros populacionais para depois, eventualmente testar uma hipótese a respeito
dos mesmos, na amostragem sequencial é testada uma hipótese desses parâmetros sem a preocupação
inicial de estimá-los (Souza et al, 2014). Na amostragem sequencial valores resultantes de cada
observação são examinados sequencialmente até que os resultados acumulados são comparadas com
limites previamente determinados a partir dos erros tipo I e II. Assim, com base em cada observação
pode-se chegar a uma das três seguintes decisões: (1) aceitar a hipótese nula; (2) rejeitar a hipótese nula;
ou (3) continuar a amostragem (Nagelkerke & Hart, 1980). Se for tomada a decisão (3) outra unidade
amostral é examinada e o processo continua até que a decisão (1) ou a decisão (2) seja tomada.

1
A grande vantagem da amostragem sequencial consiste na considerável economia de tempo ela
proporciona por evitar a excessiva amostragem quando o parâmetro populacional é muito maior ou
muito menor que o valor determinado para a comparação (xxxxx).

2. OBJETIVOS
2.1. Objetivo geral

Utilizar técnicas de amostragem sequencial para comparar modelos de sobrevivência


proveniente de bioensaios com abelhas Apis mellifera.

2.2. Objetivos específicos

a) Desenvolver um script para utilizar a análise sequencial na seleção de modelos de sobrevivência

b) Aplicar a modelagem avaliada em um conjunto de dados reais de apicultura.

c) Elaborar rotinas computacionais que permita selecionar os modelos apropriados para discriminar os
efeitos de diferentes dietas para abelhas.

d) Representar graficamente as curvas de sobrevivência.

e) Explorar a interpretação dos efeitos dos parâmetros dos modelos Weibull e Log-normal.

3. METODOLOGIA

3.1 Geração de dados simulados

Para estudos entomológicos em bioensaios na qual envolve uma resposta temporal, os


insetos são acompanhados em coletas periódicas de dados e sabe-se apenas que a morte ocorreu em
certo intervalo de tempo não sabendo exatamente o momento exato da ocorrência. Desta forma,
inicialmente, para realização dos testes de adaptação do script na determinação da longevidade, será
simulado o número de abelhas mortas a cada 12 horas por 15 dias, considerando 5 diferentes
tratamentos, alterando para tal, os parâmetros do modelo simulado.

Será organizada uma tabela com os dados da mortalidade das abelhas em um período de 360
horas. Após a obtenção do ajuste, utilizando os parâmetros sugeridos por Sgrillo (1982), Hutchinson
(2000), Moncharmont et al.(2003) e Brighenti(2017), o efeito de cada tratamento será analisado pela
estimação de máxima verossimilhança dos parâmetros da função de sobrevivência.

3.2 Modelos em Análise de Sobrevivência

2
Para realizar a abordagem sequencial em dados de sobrevivência inicialmente serão
avaliadas duas funções de distribuição de probabalidade: Weibull e Log- Linear.
A distribuição de Weibull apresenta uma grande variedade de formas, todas com uma
propriedade básica: a sua função de taxa de falha é monótona, isto é, ela é crescente, decrescente ou
constante. Sua função de densidade probabilidade é dada por:
b -1 �t -g �b
b �t - g � -��a

S (t ) = � � e

a �a �
b é o parâmetro de forma, a é o parâmetro de escala e g é o parâmetro de posição que não será
utilizado, seu valor é zero.
Outra forma de parametrizar a distribuição Weibull é:
S (t ) = abt b -1 exp �
- at b �
� �, onde a é o parâmetro de escala e b o de forma.
A distribuição Log-Normal, assim como a distribuição Weibull, é muito utilizada para
caracterizar tempos de vida de produtos e indivíduos. Sua função de densidade de uma variável
aleatória T é dada por:

1 �
� 1 �log(t ) - m ��
2

S (t ) = exp �- � ��, t > 0
2p ts � 2� s ��

A probabilidade de a falha ocorrer em um intervalo de tempo [t1,t2) é expressa em termos da


função : S(t1)- S(t2).
A taxa de falha no intervalo [t1,t2) é expressada por :
P (t �T < t + Dt | T �t )
l (t ) =
Dt
S (t ) - S (t + Dt )
Que assume a seguinte forma: l (t ) =
Dt
Onde Dt assume-se um intervalo bem pequeno, l (t ) representa a taxa de falha instantânea
no tempo t condicional à sobrevivência ate o tempo t. Essa função descreve a forma em que a taxa
de falha muda com o tempo. A função de taxa de falha de T é então definida como:

P (t �T < t + Dt | T �t )
l (t ) = lim (Colosimo & Giolo, 2006).
Dt �0 Dt
Posteriormente a obtenção dos parâmetros das distribuições Weibull( b , g ) e Log-normal(
 , l ), serão plotados os gráficos de sobrevivências por Kaplan-Meier versus as sobrevivências

estimadas pelos modelos weibull e log-normal, tempo versus –log(S(t)), log(t) versus log(-
log(S(t))), log(t) versus  -1 ( S (t )) e as curvas de sobrevivências estimadas pelos modelos de

3
Weibull e Log-normal versus a curva de sobrevivência estimada por Kaplan-Meier. Será calculado o
logaritmo da função L(  ) para os dois modelos.
Será construída em cada caso a função de sobrevivência e a respectiva curva de
sobrevivência.
O calculo das estimativas de sobrevivência das abelhas será feito utilizando o software R (R
Core Team, 2017), com o pacote survival, comparando os modelos Weibull e Log-normal.

3.3 Teste da Razão de Verossimilhanças Sequencial

Sendo T uma variável aleatória e S(t;θ) distribuição dessa variável, com parâmetros θ, H0
será a hipótese que θ=θ0 e H1 a hipótese θ=θ1.
A estatística do teste de comparação das curvas é obtida por meio da razão de
verossimilhanças entre o modelo completo, isto é, aquele com todos os parâmetros e o modelo
pesquisa, em que se emprega um número reduzido de parâmetros (Tabela 1) (Nelson, 1982).

Tabela 1 - Hipóteses na comparação de parâmetros de forma e escala por meio da razão de


verossimilhanças.
Hipóteses H0 Razão de verossimilhanças
Parâmetros
a1 = ...a i = a
�a ,..., a i , b1 ,...b i ; S (t ) �
e L�1 �
Escala e forma iguais b1 = ...b i = b � L(a , b ; S (t )) �

�a ,..., a i , b1 ,...b i ; S (t ) �
Escala iguais a1 = ...a i = a L�1 �
� L(a , b1 ,...b 6 ; S (t )) �
�a ,..., a i , b1 ,...b i ; S (t ) �
Forma iguais b1 = ...b i = b L�1 �
�L(a1 ,..., a i , b ; S (t )) �

O Teste Sequencial da Razão de verossimilhança consiste em comparar a razão de


probabilidade com valores A e B, ou no que é feito mais comumente, comparar o logaritmo da razão
de verossimilhança com o logaritmo natural dos valores A e B (Tang et al, 2008). Esta comparação
é feita em cada estágio da amostragem. As duas constantes A e B são escolhidas, sendo A< B. Os
valores A e B dependem das probabilidades de erro α (tipo I) e β (tipo II), sendo α a probabilidades
de rejeitas a hipótese H0 quando ela for verdadeira e β a probabilidade de aceitar H 0 ela for falsa, de

1-a 1-a
tal forma que A= e B= .
b b

4
Será então desenvolvido um script para realização sequencial da comparação entre os dois
modelos ajustados considerando o conjunto de dados referente aos cinco diferentes tratamentos
(parâmetros) simulados.
Os resultados serão comparados e avaliadas as características dos modelos ajustados e
respectivos parâmetros, de acordo com o tamanho amostral obtido.

3.4 Aplicação a dados entomológicos

Com o propósito de ilustrar a metodologia proposta, serão considerados dados provenientes


de tempos de sobrevivência de experimento em que, em cada unidade experimental serão colocados
dez adultos de abelhas com até 24 horas de idade e mantidos em câmara climatizada a 29 ± 2º C,
UR 70 ± 10% e fotoperíodo de 12 horas. O experimento será conduzido em delineamento
inteiramente casualizado com cinco tratamentos representados por dietas contendo composições de
milho e soja variando entre 15 a 35% de proteína bruta, com cinco repetições cada. Para o
tratamento testemunha será utilizado o “pão da abelha” (pólen modificado obtido da colônia
experimental). Todos os tratamentos receberam água e mel ad libitum e as dietas proteicas foram
oferecidas em recipiente com capacidade de 5 g.
Para se determinar a longevidade será realizada a contagem do número de insetos mortos a
cada 12 horas, durante quinze dias.
Após os ajustes das curvas de sobrevivência, serão realizadas comparações por meio da
identidade dos modelos (Drapper & Smith, 1988), permitindo que as diferentes dietas sejam
comparadas simultaneamente. A vantagem deste método é que, caso os resultados não sejam
significativos, isto é, os coeficientes sejam estatisticamente iguais, pode-se reduzir o número de
curvas a serem avaliadas (Lawles, 1982).
As curvas serão comparadas utilizando-se o teste da razão de verossimilhanças (TRV), que
utiliza a comparação dos valores do logaritmo da função de verossimilhança maximizada sem

( ) ( )
restrição H1 e sob H0, ou seja, a comparação de log L ˆ1 e log L ˆ0 (Nelson, 1982). A estatística

( )
�L ˆ0 �
( ) ( )
log L ˆ1 - log L ˆ0 �, que, sob H0:  = 0, segue
para esse teste é dada por: TRV = -2 log � ˆ �= 2 �
� ( )
�L 1 � �

aproximadamente uma distribuição qui-quadrado com p graus de liberdade, onde p é a diferença do


número de parâmetros dos modelos sendo comparados, isto é, aquele sem restrição e o modelo em
que se emprega um número reduzido de parâmetros (H 0). A hipótese H0 é rejeitada, a 5% de

5
significância, se o valor observado para o TRV for maior que o valor tabelado para a distribuição 2,

isto é, TRV >  p;0,95 (Colosimo & Giolo, 2006).


2

Os valores registrados serão comparados com a rotina sequencial elaborada em 3.3,


permitindo comparar os resultados com numero diferentes de amostras, identificando um critério de
parada para a avaliação do experimento, ou seja, redução do tempo de execução.

4. PLANO DE TRABALHO

O bolsista selecionado para o projeto realizará as seguintes atividades:

1- Estudo de conceitos básicos da Análise de Sobrevivência


2- Estudo de conceitos básicos da Análise Sequencial
3- Aprendizado do pacote “survival” do software R
4- Apoio no desenvolvimento do script para análise sequencial no software R
5- Avaliação das principais características da distribuição de Weibull e seleção de modelos a partir da
comparação de parâmetros
6- Aplicação da modelagem avaliada em um conjunto de dados reais de apicultura.
7- Preparação de resumo para congresso
8- Produção e apresentação de trabalhos em congressos e/ou similares
9- Preparo de relatório final

5. CRONOGRAMA

O tempo de execução para as etapas necessárias a obtenção dos resultados encontra-se no


cronograma seguinte.

2018 2019
Etapas Mar Abr Mai Jun Jul Ago Set Out Nov Dez Jan Fev
(1) X X X
(2) X X
(3) X X
(4) X X
(5) X X
(6) X X
(7) X X
(8) X X X
(9) X X
6
6. REFERÊNCIAS BIBLIOGRÁFICAS

BRIGHENTI, D. M.; BRIGHENTI, C. R. G.; CARVALHO, C. F. Life spans of Africanized honey bees
fed sucrose diets enhanced with citric acid or lemon juice. Journal of Apicultural Research, v.56, p.91
- 99, 2017.

COLOSIMO, E.A; GIOLO, S. R. Análise de sobrevivência aplicada. Editora Edgar Blucher, 2006,
216p.

HUTCHINSON, T. Graphing the survivorship of bees. Insectes Sociaux. V.47, p.292-296. 2000.

LAWLESS, J. F. Statistical models and methods for lifetime data. New York: Willey. 1982.

MONCHARMONT, F. X. D; DECOURT, A; HANTIER, C. H; PONS, O; PHAMDELEGUE, M.


Statistical analysis of honeybee survival after chronic exposure to insecticides. Environmental
toxicology and chemistry, v.22, n.12, p.3088-3094, 2003.

NAGELKERKE, N. J. D; HART; A. A. M. The sequential comparison of survival curves. Biometrika,


67, p.247-249, 1980.

R Core Team. R: A Language and Environment for Statistical Computing. R Foundation for Statistical
Computing, Vienna, Austria. URL http://www.R-project.org, 2017.

SGRILLO, R. B. A distribuição de Weibull como modelo de sobrevivência de insetos. Ecossistema, v.


7, p.9- 13, 1982.

SOUZA, L. A. et al. Sequential sampling of Euschistus heros (Heteroptera: Pentatomidae) in


soybean. Scientia Agricola, v. 71, n. 6, p. 464-471, 2014.

TANG, L; EMERSON, S S.; ZHOU, X. Nonparametric and semiparametric group sequential


methods for comparing accuracy of diagnostic tests. Biometrics, v. 64, n. 4, p. 1137-1145, 2008.

Você também pode gostar