Você está na página 1de 13

Universidade Estadual Paulista ”Júlio de Mesquita Filho”

Câmpus de Botucatu

PPG
Biometria

MODELOS DE SOBREVIVÊNCIA
APLICADOS A DADOS DE GERMINAÇÃO
DE SEMENTES

Carolina Aparecida da Silva


Gustavo Guerra Geraldini

Docente: Profª Drª Liciana Vaz de Arruda Siqueira

2021
1 Introdução
A germinação é o processo de retomada do crescimento ativo do eixo embrionário. Consiste da
sequência ordenada de atividades metabólicas, que inicia com a embebição das sementes, estabe-
lece a retomada do desenvolvimento do embrião até a formação de uma plântula normal, depende
de umidade, temperatura e oxigênio.

As variações de temperatura afetam não só o total de germinação, como também a velocidade
e a uniformidade do processo. A temperatura ótima para a germinação das sementes é aquela
em que o maior número de sementes germina no mais curto perı́odo, para a maioria das espécies
cultivadas, encontra-se entre 20 e 30°C. Ao se reduzir a temperatura, a partir da ótima, reduz-se a
velocidade de germinação, enquanto o aumento, em direção aos valores máximos suportados pela
espécie, proporciona redução tanto na velocidade quanto no percentual de germinação.

2 Objetivos
Descrever qual a temperatura mais adequada para a germinação de sementes por meio dos modelos
não paramétricos e paramétricos com o propósito de selecionar o que melhor descreve o conjunto
de dados.As variáveis do estudo são: semente, tempo, falha, temperatura e repetição.

3 Metodologia
3.1 Dados
Este dados referem-se a um estudo piloto realizado, no Departamento de Botânica, com o objetivo
de escolher qual a temperatura mais adequada para a germinação de sementes. O Experimento
foi realizado colocando 25 sementes em cada placa de Petri, sendo que 2 placas foram colocadas a
20°C e outras 2 placas a 25°C.O acompanhamento foi feito diariamente (de 23 a 28 de janeiro de
2002).

3.2 Análise de Sobrevivência


Foram construı́dos as estimativas, os gráficos e intervalos de confiança das estimativas de Kaplan-
Meier e de Nelson-Aalen para as funções de sobrevivência (S(t)) dos dados de germinação e aplicado
o teste logrank para as curvas obtidas. Além disso, foram ajustados os modelos paramétricos e
verificado sua qualidade do ajuste. Logo, foi realizado o ajuste do modelo de Cox.Toda a teoria
utilizada, encontra-se no livro do Colosimo (2006).

Os cálculos foram realizados utilizando-se os software R.

4 Resultados
As estimativas da função de sobrevivência S(t) e seus respectivos intervalos de 95% de confiança
para cada variável, obtidos utilizando-se o estimador Kaplan-Meier, encontra-se na Tabela 1, 2 e

1
3, respectivamente; e suas respectivas representações gráficas e apresentada na Figura 1, 2 e 3.

Tabela 1: Estimativa obtida por meio do estimador de kaplan Meier para falha.

time n.risk n.event survival std.err I.C.(Ŝ(t))95%


lower upper
2 100 3 0.97 0.0171 0.910 0.990
3 97 18 0.79 0.0407 0.696 0.858
4 79 22 0.57 0.0495 0.467 0.660
5 57 15 0.42 0.0494 0.323 0.514

Figura 1

## survfit(formula = Surv(tempo, falha) ~ 1, conf.type = "log-log")


##
## n events rmean* se(rmean) median 0.95LCL 0.95UCL
## [1,] 100 58 4.33 0.0872 5 4 NA
## * restricted mean with upper limit = 5

2
Tabela 2: Estimativas obtidas por meio do estimador de Kaplan-Meier para variável temperatura.

time n.risk n.event survival std.err I.C.(Ŝ(t))95%


lower upper
Dicotomica1=20
4 50 7 0.86 0.0491 0.729 0.931
5 43 14 0.58 0.0698 0.432 0.702
Dicotomica1=25
2 50 3 0.94 0.0336 0.825 0.980
3 47 18 0.58 0.0698 0.432 0.702
4 29 15 0.28 0.0635 0.164 0.407
5 14 1 0.26 0.0620 0.149 0.386

Figura 2

##
## survfit(formula = Surv(tempo, falha) ~ Dicotomica1, conf.type = "log-log")
##
## n events rmean* se(rmean) median 0.95LCL 0.95UCL
## Dicotomica1=20 50 21 4.86 0.0491 NA 5 NA

3
## Dicotomica1=25 50 37 3.80 0.1296 4 3 4
## * restricted mean with upper limit = 5

##
## survdiff(formula = Surv(tempo, falha) ~ Dicotomica1, rho = 0)
##
## N Observed Expected (O-E)^2/E (O-E)^2/V
## Dicotomica1=20 50 21 36 6.26 22
## Dicotomica1=25 50 37 22 10.26 22
##
## Chisq= 22 on 1 degrees of freedom, p= 3e-06

Tabela 3: Estimativas obtidas por meio do estimador de Kaplan-Meier para variável repetição.

time n.risk n.event survival std.err I.C.(Ŝ(t))95%


lower upper
Dicotomica2=1
2 50 1 0.98 0.0198 0.866 0.997
3 49 10 0.78 0.0586 0.638 0.872
4 39 8 0.62 0.0686 0.471 0.738
5 31 8 0.46 0.0705 0.319 0.590
Dicotomica2=2
2 50 2 0.96 0.0277 0.849 0.980
3 48 8 0.80 0.0566 0.660 0.887
4 40 14 0.52 0.0707 0.374 0.647
5 26 7 0.38 0.0686 0.248 0.511

4
Figura 3

## survfit(formula = Surv(tempo, falha) ~ Dicotomica2, conf.type = "log-log")


##
## n events rmean* se(rmean) median 0.95LCL 0.95UCL
## Dicotomica2=1 50 27 4.38 0.123 5 4 NA
## Dicotomica2=2 50 31 4.28 0.123 5 4 NA
## * restricted mean with upper limit = 5

## TESTE LONK-RANK ##
## survdiff(formula = Surv(tempo, falha) ~ Dicotomica2, rho = 0)
##
## N Observed Expected (O-E)^2/E (O-E)^2/V
## Dicotomica2=1 50 27 29.6 0.23 0.606
## Dicotomica2=2 50 31 28.4 0.24 0.606
##
## Chisq= 0.6 on 1 degrees of freedom, p= 0.4

4.1 Modelos Paramétricos


Modelo Exponencial

5
## survreg(formula = Surv(tempo, falha) ~ 1, dist = "exponential")
##
## Coefficients:
## (Intercept)
## 2.010295
##
## Scale fixed at 1
##
## Loglik(model)= -174.6 Loglik(intercept only)= -174.6
## n= 100

## (Intercept)
## 7.465517

Modelo Weibull

## flexsurvreg(formula = Surv(tempo, falha) ~ 1, dist = "weibull")


##
## Estimates:
## est L95% U95% se
## shape 4.097 3.248 5.167 0.485
## scale 5.200 4.868 5.554 0.175
##
## N = 100, Events: 58, Censored: 42
## Total time at risk: 433
## Log-likelihood = -131.0643, df = 2
## AIC = 266.1285

## gama_Weibull alpha_Weibull
## shape 4.097014 5.199963

Modelo Log-normal

## flexsurvreg(formula = Surv(tempo, falha) ~ 1, dist = "lnorm")


##
## Estimates:
## est L95% U95% se
## meanlog 1.5517 1.4718 1.6316 0.0408
## sdlog 0.3557 0.2917 0.4337 0.0360
##
## N = 100, Events: 58, Censored: 42
## Total time at risk: 433
## Log-likelihood = -130.6687, df = 2
## AIC = 265.3374

## mediaLN desvioLN
## meanlog 1.551716 0.3557024

Modelo Gama

6
## flexsurvreg(formula = Surv(tempo, falha) ~ 1, dist = "gengamma")
##
## Estimates:
## est L95% U95% se
## mu 1.5842 1.4342 1.7342 0.0765
## sigma 0.3280 0.2121 0.5073 0.0730
## Q 0.2852 -0.9152 1.4857 0.6125
##
## N = 100, Events: 58, Censored: 42
## Total time at risk: 433
## Log-likelihood = -130.5592, df = 3
## AIC = 267.1184

4.2 Teste de verossimilhança para comparação dos modelos paramétricos


Teste de Hipóteses para o modelo Exponencial e Weibull.

## Likelihood ratio test


##
## Model 1: Surv(tempo, falha) ~ 1
## Model 2: Surv(tempo, falha) ~ 1
## #Df LogLik Df Chisq Pr(>Chisq)
## 1 1 -174.60
## 2 2 -131.06 1 87.066 < 2.2e-16 ***
## ---
## Signif. codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1

Teste de Hipóteses para o modelo Exponencial e Gama.

## Likelihood ratio test


##
## Model 1: Surv(tempo, falha) ~ 1
## Model 2: Surv(tempo, falha) ~ 1
## #Df LogLik Df Chisq Pr(>Chisq)
## 1 1 -174.60
## 2 3 -130.56 2 88.076 < 2.2e-16 ***
## ---
## Signif. codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1

Teste de Hipóteses para o modelo Weibull e Gama.

## Likelihood ratio test


##
## Model 1: Surv(tempo, falha) ~ 1
## Model 2: Surv(tempo, falha) ~ 1
## #Df LogLik Df Chisq Pr(>Chisq)
## 1 2 -131.06
## 2 3 -130.56 1 1.0101 0.3149

7
Teste de Hipóteses para o modelo Log-normal e Gama

## Likelihood ratio test


##
## Model 1: Surv(tempo, falha) ~ 1
## Model 2: Surv(tempo, falha) ~ 1
## #Df LogLik Df Chisq Pr(>Chisq)
## 1 2 -130.67
## 2 3 -130.56 1 0.219 0.6398

Figura 4: Gráfico de comparação entre modelo paramétrico e não-paramétrico

4.3 Modelo Ajustado de Cox


Ao utilizar o modelo de Cox obtemos resultados muito próximos dos obtidos através de modelos
paramétricos, assim é possı́vel estimar os coeficientes na parte exponencial do modelo, assim avaliar
o efeito das variáveis explicativas. Utilizamos este modelo pois nosso tempo de sobrevivência é
conhecido e temos censuras.

Suposiç~
oes (adequaç~
ao do modelo)

8
## [1] 20 25
## Levels: 20 25
## [1] 1 2
## Levels: 1 2

Figura 5: Gráficos dos tempos versus log(lambda(t)) para as covariáveis selecionadas.

4.4 Modelo Ajustado


Variável temperatura
## coxph(formula = Surv(tempo, falha) ~ Dicotomica1, x = T, method = "breslow")
##
## n= 100, number of events= 58
##
## coef exp(coef) se(coef) z Pr(>|z|)
## Dicotomica125 1.1048 3.0186 0.2788 3.963 7.39e-05 ***
## ---
## Signif. codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1
##
## exp(coef) exp(-coef) lower .95 upper .95

9
## Dicotomica125 3.019 0.3313 1.748 5.213
##
## Concordance= 0.701 (se = 0.029 )
## Likelihood ratio test= 16.54 on 1 df, p=5e-05
## Wald test = 15.71 on 1 df, p=7e-05
## Score (logrank) test = 17.17 on 1 df, p=3e-05

## [1] -252.9339 -244.6663

## chisq df p
## Dicotomica1 18.4 1 1.8e-05
## GLOBAL 18.4 1 1.8e-05

Figura 6

Variável repetiç~
ao
## Call:
## coxph(formula = Surv(tempo, falha) ~ Dicotomica1, x = T, method = "breslow")
##
## n= 100, number of events= 58

10
##
## coef exp(coef) se(coef) z Pr(>|z|)
## Dicotomica125 1.1048 3.0186 0.2788 3.963 7.39e-05 ***
## ---
## Signif. codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1
##
## exp(coef) exp(-coef) lower .95 upper .95
## Dicotomica125 3.019 0.3313 1.748 5.213
##
## Concordance= 0.701 (se = 0.029 )
## Likelihood ratio test= 16.54 on 1 df, p=5e-05
## Wald test = 15.71 on 1 df, p=7e-05
## Score (logrank) test = 17.17 on 1 df, p=3e-05

## [1] -252.9339 -244.6663

## chisq df p
## Dicotomica1 18.4 1 1.8e-05
## GLOBAL 18.4 1 1.8e-05

11
Figura 7

5 Referências
COLOSIMO, Enrico Antonio; GIOLO, Suely Ruiz. Análise de sobrevivência aplicada. Editora
Blucher, 2006.

12

Você também pode gostar