Escolar Documentos
Profissional Documentos
Cultura Documentos
Sarah Emmylle
07/07/2023
Bibliotecas utilizadas
library(MASS)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following object is masked from 'package:MASS':
##
## select
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(ggplot2)
library(stats)
Variáveis
Toxicidade de três concentrações (R-rotenine, D-deguelin e M-mistura) As concentrações foram testadas em
insetos e observado para cada dose o número de insetos mortos.
1
Análise descritiva
summary(morgan$Dose)
## # A tibble: 4 x 4
## Concentração Média Desvio_Padrão CV
## <chr> <chr> <chr> <chr>
## 1 D 1.3017 0.3812 0.2929
## 2 M 1 0.3828 0.3828
## 3 R 0.72 0.2392 0.3322
## 4 Geral 1.0241 0.4044 0.3948
Esses resultados indicam as medidas estatísticas relacionadas às concentrações (R-rotenine, D-deguelin e
M-mistura) e seu efeito tóxico. A concentração média para a rotenina (R) é de 0.72, para deguelin (D) é
de 1.3017 e para a mistura (M) é de 1. O desvio padrão, que indica a dispersão dos dados em torno da
média, é de 0.2392 para R, 0.3812 para D e 0.3828 para M. O coeficiente de variação (CV), uma medida de
variabilidade relativa em relação à média, é de 0.3322 para R, 0.2929 para D e 0.3828 para M. No geral, a
média de todas as concentrações é de 1.0241, com um desvio padrão de 0.4044 e um coeficiente de variação de
0.3948. Isso indica uma variabilidade considerável nos efeitos tóxicos das diferentes concentrações testadas.
# Média , Desvio_Padrão e Coeficiente_de_variaçãoa dos mortos por concentração
Tabela1<-morganBD %>% group_by(Concentração) %>%summarise(Média=round(mean(Mortos),4),
Desvio_Padrão= round(sd(Mortos),4),
CV=round((sd(Mortos)/mean(Mortos)),4))
Tabela1 <- rbind(Tabela1,c("Geral",
2
round(mean(morgan$Mortos),4),
round(sd(morgan$Mortos),4),
round((sd(Mortos))/mean(Mortos),4)))
Tabela1
## # A tibble: 4 x 4
## Concentração Média Desvio_Padrão CV
## <chr> <chr> <chr> <chr>
## 1 D 35 14.8862 0.4253
## 2 M 30.8333 15.1976 0.4929
## 3 R 26.4 16.456 0.6233
## 4 Geral 31 14.8913 0.4804
A média de insetos mortos para a concentração deguelin (D) é de 35, para a mistura (M) é de 30.8333 e para
a rotenina (R) é de 26.4. O desvio padrão, que indica a dispersão dos dados em torno da média, é de 14.8862
para D, 15.1976 para M e 16.456 para R. O coeficiente de variação (CV), uma medida de variabilidade relativa
em relação à média, é de 0.4253 para D, 0.4929 para M e 0.6233 para R. No geral, a média de insetos mortos
para todas as concentrações é de 31, com um desvio padrão de 14.8913 e um coeficiente de variação de 0.4804.
Isso indica uma variabilidade considerável no número de insetos mortos em diferentes concentrações.
# Média e Variância das Doses por concentração
TabelaCorr <- morganBD %>% group_by(Concentração) %>% summarise(correlações=round(cor(Dose,Mortos),4))
TabelaCorr <- rbind(TabelaCorr,c("Geral",
round(cor(morganBD$Dose,morganBD$Mortos),4)))
TabelaCorr
## # A tibble: 4 x 2
## Concentração correlações
## <chr> <chr>
## 1 D 0.9649
## 2 M 0.9898
## 3 R 0.9884
## 4 Geral 0.8865
A correlação entre as doses e a concentração é de 0.9649 para D, 0.9898 para M e 0.9884 para R. Essas
correlações indicam uma forte relação positiva entre as doses e as concentrações, ou seja, quanto maior a
concentração, maior a dose aplicada. No geral, a correlação média entre doses e concentração é de 0.8865, o
que também indica uma relação positiva entre essas variáveis.
boxplot(morganBD$Mortos~morganBD$Concentração,xlab = "Concentração" ,ylab = "Mortos")
3
40
30
Mortos
20
10
D M R
Concentração
A partir dos boxplots, observamos assimetrias à esquerda e à direita, respectivamente, nas concentrações R
(rotenine) e D (deguelin), enquanto a concentração M (mistura) exibe certa simetria. Além disso, não foram
encontradas diferenças relevantes entre as concentrações em relação ao número de insetos mortos.
# Gráfico de linhas
library(ggplot2)
4
50
40
Concentração
30
Mortos
D
M
R
20
10
##
## Call:
## glm(formula = mtis ~ Dose + Concentração, family = binomial,
## data = morganBD)
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -4.8688 0.4201 -11.590 < 2e-16 ***
## Dose 4.8277 0.3395 14.222 < 2e-16 ***
## ConcentraçãoM 0.9123 0.2449 3.725 0.000196 ***
## ConcentraçãoR 1.6034 0.2656 6.036 1.58e-09 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
5
## Null deviance: 350.069 on 16 degrees of freedom
## Residual deviance: 31.971 on 13 degrees of freedom
## AIC: 98.955
##
## Number of Fisher Scoring iterations: 4
# Avaliando sobredispersão
1-pchisq(mod1$deviance,mod1$df.residual)
## [1] 0.00242618
O desvio de 31.971, que está significativamente distante dos graus de liberdade (13), indica fortes indícios de
sobredispersão no modelo. Esse resultado é corroborado pelo p-valor de 0.002, o que confirma a presença de
uma variabilidade maior nos dados do que a esperada pelo modelo.
Em relação à significância das variáveis dose e concentração, ambas apresentaram uma relação estatisticamente
significativa com a resposta em um nível de significância de 5%. Isso indica que essas variáveis exercem
um impacto estatisticamente significativo na variável de interesse, fornecendo evidências confiáveis de sua
importância no modelo.
#Envelope do modelo de regressão mod1
fit.model<-mod1
ntot=Expostos
source('envelr_bino.txt')
3
2
Componente do Desvio
1
0
−1
−2
−3
−2 −1 0 1 2
Percentil da N(0,1)
Ao analisar o gráfico de envelope, podemos observar que o modelo (mod1) não está ajustado de forma
adequada, pois várias observações se encontram fora dos limites do envelope. Além disso, as assimetrias
presentes nas caudas sugerem a presença de sobredispersão. Esses indícios indicam que o modelo não consegue
capturar completamente a variação dos dados e pode não ser a melhor representação para o fenômeno em
estudo.
#X <- model.matrix(fit.model)
#n <- nrow(X)
#p <- ncol(X)
#w <- fit.model$weights
6
#W <- diag(w)
#H <- solve(t(X)%*%W%*%X)
#H <- sqrt(W)%*%X%*%H%*%t(X)%*%sqrt(W)
#h <- diag(H)
#ts <- resid(fit.model,type="pearson")/sqrt(1-h)
#td <- resid(fit.model,type="deviance")/sqrt(1-h)
#di <- (h/(1-h))*(tsˆ2)
#a <- max(td)
#b <- min(td)
#par(mfrow=c(2,2))
#plot(fitted(fit.model),h,xlab="Valor Ajustado",
#ylab="Medida h", pch=16)
#identify(fitted(fit.model), h, n=5, tolerance = 0.40)
##
#plot(di,xlab="Índice", ylab="Distância de Cook",pch=16)
#identify(di, n=5,tolerance = 0.40)
##
#plot(td,xlab="Índice", ylab="Resíduo Componente do Desvio",
#ylim=c(b-1,a+1), pch=16)
#abline(2,0,lty=2)
#abline(-2,0,lty=2)
#identify(td, n=5, tolerance = 0.40)
##
#plot(fitted(fit.model), td,xlab="Valor Ajustado",
#ylab="Resíduo Componente do Desvio", pch=16)
#identify(fitted(fit.model), td, n=5, tolerance = 0.40)
#par(mfrow=c(1,1))
knitr::include_graphics("Rplot.png")
7
as observações 6, 7 e 13 são possíveis pontos de alavanca, indicando que têm um impacto desproporcional nos
resultados do modelo. Por outro lado, a observação 6 é possivelmente alem de ponto de alavanca um ponto
influente, pois exerce uma influência significativa nos parâmetros do modelo.
##
## Call:
## glm(formula = mtis ~ Dose + Concentração, family = binomial,
## data = morganBD, subset = -6)
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -5.7909 0.5380 -10.764 < 2e-16 ***
## Dose 5.3747 0.4001 13.434 < 2e-16 ***
## ConcentraçãoM 1.3275 0.2866 4.631 3.63e-06 ***
## ConcentraçãoR 2.1402 0.3266 6.552 5.67e-11 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 328.305 on 15 degrees of freedom
## Residual deviance: 23.449 on 12 degrees of freedom
## AIC: 86.206
##
## Number of Fisher Scoring iterations: 4
Após a remoção da observação 6, não foi observada nenhuma mudança estatisticamente significativa no
modelo, considerando um nível de significância de 5%. Isso indica que a exclusão dessa observação não afetou
as conclusões inferenciais obtidas a partir do modelo.
ao2<-glm(mtis~Dose+Concentração, data=morganBD, family = binomial, subset = -7)
summary(ao2)
##
## Call:
## glm(formula = mtis ~ Dose + Concentração, family = binomial,
## data = morganBD, subset = -7)
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -4.4927 0.4449 -10.098 < 2e-16 ***
## Dose 4.7146 0.3413 13.812 < 2e-16 ***
## ConcentraçãoM 0.6412 0.2770 2.315 0.0206 *
## ConcentraçãoR 1.3071 0.2973 4.397 1.1e-05 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
8
## Null deviance: 334.79 on 15 degrees of freedom
## Residual deviance: 27.96 on 12 degrees of freedom
## AIC: 90.675
##
## Number of Fisher Scoring iterations: 4
Após a remoção da observação 7, também não foram observadas mudanças estatisticamente significativas no
modelo, considerando um nível de significância de 5%. Isso sugere que a exclusão dessa observação não teve
impacto nas conclusões inferenciais obtidas a partir do modelo.
ao3<-glm(mtis~Dose+Concentração, data=morganBD, family = binomial, subset = -13)
summary(ao3)
##
## Call:
## glm(formula = mtis ~ Dose + Concentração, family = binomial,
## data = morganBD, subset = -13)
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -5.1043 0.4505 -11.329 < 2e-16 ***
## Dose 5.0359 0.3688 13.654 < 2e-16 ***
## ConcentraçãoM 0.7515 0.2577 2.916 0.00355 **
## ConcentraçãoR 1.6922 0.2745 6.164 7.07e-10 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 344.466 on 15 degrees of freedom
## Residual deviance: 28.546 on 12 degrees of freedom
## AIC: 91.24
##
## Number of Fisher Scoring iterations: 4
Após a remoção da observação 13, também não foram observadas mudanças estatisticamente significativas no
modelo, considerando um nível de significância de 5%. Isso sugere que a exclusão dessa observação não teve
impacto nas conclusões inferenciais obtidas a partir do modelo.
ao4<-glm(mtis~Dose+Concentração, data=morganBD, family = binomial, subset = -c(6,7))
summary(ao4)
##
## Call:
## glm(formula = mtis ~ Dose + Concentração, family = binomial,
## data = morganBD, subset = -c(6, 7))
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -5.5907 0.6864 -8.145 3.80e-16 ***
## Dose 5.2804 0.4454 11.855 < 2e-16 ***
## ConcentraçãoM 1.2146 0.3768 3.223 0.00127 **
## ConcentraçãoR 2.0064 0.4358 4.604 4.15e-06 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
9
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 310.360 on 14 degrees of freedom
## Residual deviance: 23.234 on 11 degrees of freedom
## AIC: 81.721
##
## Number of Fisher Scoring iterations: 4
Após a remoção das observações 6 e 7, não foram observadas mudanças estatisticamente significativas
no modelo, mantendo um nível de significância de 5%. Esses resultados indicam que a exclusão dessas
observações não afetou as conclusões inferenciais obtidas a partir do modelo. Portanto, pode-se concluir que
essas observações não têm um impacto substancial nos resultados e podem ser consideradas como pontos
atípicos ou discrepantes sem influência significativa nas inferências do modelo.
ao5<-glm(mtis~Dose+Concentração, data=morganBD, family = binomial, subset = -c(6,13))
summary(ao5)
##
## Call:
## glm(formula = mtis ~ Dose + Concentração, family = binomial,
## data = morganBD, subset = -c(6, 13))
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -6.2927 0.6011 -10.469 < 2e-16 ***
## Dose 5.7741 0.4549 12.694 < 2e-16 ***
## ConcentraçãoM 1.1588 0.2895 4.002 6.28e-05 ***
## ConcentraçãoR 2.3612 0.3493 6.760 1.38e-11 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 321.123 on 14 degrees of freedom
## Residual deviance: 17.568 on 11 degrees of freedom
## AIC: 76.035
##
## Number of Fisher Scoring iterations: 4
Após a remoção das observações 6 e 13, não foram observadas mudanças estatisticamente significativas
no modelo, mantendo um nível de significância de 5%. Esses resultados indicam que a exclusão dessas
observações não afetou as conclusões inferenciais obtidas a partir do modelo. Portanto, pode-se concluir que
essas observações não têm um impacto substancial nos resultados e podem ser consideradas como pontos
atípicos ou discrepantes sem influência significativa nas inferências do modelo.
ao6<-glm(mtis~Dose+Concentração, data=morganBD, family = binomial, subset = -c(7,13))
summary(ao6)
##
## Call:
## glm(formula = mtis ~ Dose + Concentração, family = binomial,
## data = morganBD, subset = -c(7, 13))
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -4.7188 0.4755 -9.924 < 2e-16 ***
10
## Dose 4.9122 0.3701 13.271 < 2e-16 ***
## ConcentraçãoM 0.4956 0.2897 1.711 0.0871 .
## ConcentraçãoR 1.3938 0.3076 4.532 5.85e-06 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 327.886 on 14 degrees of freedom
## Residual deviance: 24.917 on 11 degrees of freedom
## AIC: 83.342
##
## Number of Fisher Scoring iterations: 4
Após a remoção das observações 7 e 13, não foram observadas mudanças estatisticamente significativas
no modelo, mantendo um nível de significância de 5%. Esses resultados sugerem que a exclusão dessas
observações não afetou as conclusões inferenciais obtidas a partir do modelo. Portanto, pode-se concluir que
essas observações não têm um impacto substancial nos resultados e podem ser consideradas como pontos
atípicos ou discrepantes sem influência significativa nas inferências do modelo.
ao7<-glm(mtis~Dose+Concentração, data=morganBD, family = binomial, subset = -c(6,7,13))
summary(ao7)
##
## Call:
## glm(formula = mtis ~ Dose + Concentração, family = binomial,
## data = morganBD, subset = -c(6, 7, 13))
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -6.3131 0.7930 -7.961 1.71e-15 ***
## Dose 5.7845 0.5266 10.984 < 2e-16 ***
## ConcentraçãoM 1.1680 0.3725 3.136 0.00171 **
## ConcentraçãoR 2.3742 0.4811 4.935 8.02e-07 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 301.437 on 13 degrees of freedom
## Residual deviance: 17.566 on 10 degrees of freedom
## AIC: 71.764
##
## Number of Fisher Scoring iterations: 4
Após a remoção das observações 6, 7 e 13, não foram observadas mudanças estatisticamente significativas
no modelo, mantendo um nível de significância de 5%. Esses resultados sugerem que a exclusão dessas
observações não teve impacto nas conclusões inferenciais obtidas a partir do modelo. Portanto, podemos
concluir que essas observações não têm um efeito substancial nos resultados e podem ser consideradas como
pontos atípicos ou discrepantes sem influência significativa nas inferências do modelo.
Testando o paralelismo
It<-glm(mtis~Dose+Concentração+Dose:Concentração, data=morganBD, family = binomial)
summary(It)
11
##
## Call:
## glm(formula = mtis ~ Dose + Concentração + Dose:Concentração,
## family = binomial, data = morganBD)
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -4.4509 0.6104 -7.291 3.07e-13 ***
## Dose 4.4602 0.5155 8.652 < 2e-16 ***
## ConcentraçãoM 1.0440 0.7795 1.339 0.1805
## ConcentraçãoR -0.3878 0.8828 -0.439 0.6605
## Dose:ConcentraçãoM -0.2244 0.7140 -0.314 0.7533
## Dose:ConcentraçãoR 2.6079 1.0221 2.551 0.0107 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 350.069 on 16 degrees of freedom
## Residual deviance: 22.723 on 11 degrees of freedom
## AIC: 93.707
##
## Number of Fisher Scoring iterations: 4
Com base na saída fornecida, o modelo It indica a presença de paralelismo, uma vez que a interação entre
dose e concentração é estatisticamente significativa ao nível de 5%. Isso significa que o efeito da dose varia de
acordo com a concentração, indicando uma relação complexa entre essas duas variáveis na resposta estudada.
It2<-glm(mtis~Dose+Concentração+Dose:Concentração, data=morganBD, family = binomial, subset=-c(6,7,13))
summary(It2)
##
## Call:
## glm(formula = mtis ~ Dose + Concentração + Dose:Concentração,
## family = binomial, data = morganBD, subset = -c(6, 7, 13))
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -10.831 3.099 -3.495 0.000474 ***
## Dose 8.993 2.224 4.044 5.24e-05 ***
## ConcentraçãoM 6.941 3.165 2.193 0.028281 *
## ConcentraçãoR 5.992 3.164 1.894 0.058234 .
## Dose:ConcentraçãoM -4.401 2.301 -1.913 0.055804 .
## Dose:ConcentraçãoR -1.925 2.392 -0.805 0.421046
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 301.4372 on 13 degrees of freedom
## Residual deviance: 9.4123 on 8 degrees of freedom
## AIC: 67.61
##
## Number of Fisher Scoring iterations: 5
12
Após a exclusão das observações 6, 7 e 13, o modelo continua apresentando indícios de paralelismo. Isso
significa que a interação entre dose e concentração permanece estatisticamente significativa, indicando que o
efeito da dose ainda varia de acordo com a concentração. Esses resultados sugerem uma relação consistente
entre as variáveis e reforçam a presença de um padrão de paralelismo no modelo ajustado, mesmo após a
exclusão dessas observações.
#Agora, podemos verificar os resultados dos testes de Pearson-X2 para cada concentração:
# Criar a tabela de contingência
expostos <- c(50, 48, 46, 49, 50, 49, 48, 48, 49, 50, 48, 47, 46, 46, 48, 46, 50)
mortos <- c(6, 16, 24, 42, 44, 16, 18, 34, 47, 47, 48, 7, 22, 27, 38, 43, 48)
concentracao <- c(rep("R", 5), rep("D", 6), rep("M", 6))
dados <- data.frame(Concentracao = concentracao, Expostos = expostos, Mortos = mortos)
13
Impacto percentual
((ao1$coefficients-mod1$coefficients)/(mod1$coefficients))*100
14
A remoção do par de observações 6,7 e 13 tiveram um impacto significativo nas estimativas dos coefi-
cientes. Especificamente, a variável “Dose” apresentou uma variação de aproximadamente 19,8%, enquanto a
concentração da mistura (M) e a rotenina (R) sofreram alterações de cerca de -28% e 48%, respectivamente.
15