Escolar Documentos
Profissional Documentos
Cultura Documentos
Sarah Emmylle
2023-06-26
Bibliotecas utilizadas
library(MASS)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following object is masked from 'package:MASS':
##
## select
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(ggplot2)
1
variáveis
os dados estão organizados com as seguintes variáveis:
Quedas: número de quedas no período. Intervenção: indicador binário que representa o tipo de intervenção
aplicada. O valor 0 indica apenas educação, enquanto o valor 1 indica educação e exercícios físicos. Sexo:
indicador binário que representa o sexo do indivíduo. O valor 0 indica feminino e o valor 1 indica masculino.
Balanço: escore que mede o equilíbrio do indivíduo. Quanto maior o valor, maior o balanço. Força: escore
que mede a força do indivíduo. Quanto maior o valor, maior a força.
Análise descritiva
summary(geriatra$quedas)
## # A tibble: 2 x 4
## Sexo Média Desvio_Padrão CV
## <fct> <dbl> <dbl> <dbl>
## 1 Feminino 3.47 2.49 0.719
2
## 2 Masculino 2.66 2.34 0.881
A média de quedas para o sexo feminino é de aproximadamente 3,4681, enquanto para o sexo masculino é de
cerca de 2,6604.O desvio padrão indica que há uma maior dispersão dos dados de quedas para o sexo feminino
(2,4922) em comparação com o sexo masculino (2,3447).Os coeficientes de variação estão altos sugerindo que
a as médias não são representativas.
# Média , Desvio_padrão e coeficeiente_de_Variação de quedas por intervenção
Tabela1<-geriatraBD %>% group_by(Intervenção) %>% summarise(Média=round(mean(Quedas),4),Desvio_Padrão= r
Tabela1
## # A tibble: 2 x 4
## Intervenção Média Desvio_Padrão CV
## <fct> <dbl> <dbl> <dbl>
## 1 Educação 4.52 2.40 0.531
## 2 Educação e exercícios 1.56 1.33 0.851
A média de quedas com intervenção apenas de educação é de aproximadamente 4,52, enquanto para a
educação com exercícios é de cerca de 1,56 .O desvio padrão indica que há uma maior dispersão dos dados
de quedas para a intervenção apenas de educação (2,4010) em comparação com a educação com exercícios
(1,3273).Os coeficientes de variação estão altos sugerindo que a as médias não são representativas.
# Contagem da intervenção por sexo
contagem_intervencao <- table(geriatra$intervencao, geriatra$sexo)
3
Intervenção por Sexo
30
Feminino
Masculino
25
20
Contagem
15
10
5
0
Intervenção
# Gráfico de linhas de quedas por sexo
# Dados
dados <- matrix(c(3, 9, 4, 12, 11, 9, 10, 6, 2, 2, 2, 0, 2, 4, 1, 0, 1, 0, 0, 1), nrow = 10, ncol = 2, b
dimnames = list(c("0", "1", "2", "3", "4", "5", "6", "7", "8", "9"), c("Feminino", "Masc
# Adicionar legenda
legend("topright", legend = c("Feminino", "Masculino"), col = c("lightsalmon1", "skyblue1"), lty = 1.5,
4
Quedas por Sexo
15
Feminino
Masculino
10
Contagem
5
0
2 4 6 8 10
Quedas
Com base nos gráficos acima, pode-se observar que a incidência de quedas é maior para indivíduos que
recebem intervenções tanto de educação quanto de exercícios físicos, em comparação com aqueles que recebem
apenas intervenção educacional. Além disso, é evidente que as mulheres têm uma taxa de queda mais alta do
que os homens nesse cenário específico. No entanto, quando consideramos apenas a intervenção educacional,
observa-se que os homens têm uma quantidade maior de quedas em relação às mulheres.
# Resumo do modelo
summary(modelo)
5
##
## Call:
## glm(formula = Quedas ~ Intervenção + Sexo + Balanço + Força,
## family = poisson, data = geriatraBD)
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 0.489467 0.336869 1.453 0.14623
## IntervençãoEducação e exercícios -1.069403 0.133154 -8.031 9.64e-16 ***
## SexoMasculino -0.046606 0.119970 -0.388 0.69766
## Balanço 0.009470 0.002953 3.207 0.00134 **
## Força 0.008566 0.004312 1.986 0.04698 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for poisson family taken to be 1)
##
## Null deviance: 199.19 on 99 degrees of freedom
## Residual deviance: 108.79 on 95 degrees of freedom
## AIC: 377.29
##
## Number of Fisher Scoring iterations: 5
1-pchisq(modelo$deviance,modelo$df.residual)
## [1] 0.157792
Considerando um nível de significância de 1%, as variáveis “balanço” e “intervenção” são estatisticamente
significativas para o modelo, isso significa que o balanço e a intervenção têm um impacto significativo nas
quedas. A análise do desvio residual indica que o modelo se ajusta adequadamente aos dados, com um valor
108,79 com 95 graus de liberdade e valor-p de 0,1578.
## Start: AIC=377.29
## Quedas ~ Intervenção + Sexo + Balanço + Força
##
## Df Deviance AIC
## - Sexo 1 108.94 375.44
## <none> 108.79 377.29
## - Força 1 112.77 379.26
## - Balanço 1 119.07 385.57
## - Intervenção 1 182.31 448.81
##
## Step: AIC=375.44
## Quedas ~ Intervenção + Balanço + Força
##
## Df Deviance AIC
## <none> 108.94 375.44
6
## - Força 1 113.54 378.04
## - Balanço 1 119.19 383.69
## - Intervenção 1 186.10 450.60
##
## Call: glm(formula = Quedas ~ Intervenção + Balanço + Força, family = poisson,
## data = geriatraBD)
##
## Coefficients:
## (Intercept) IntervençãoEducação e exercícios
## 0.443890 -1.077770
## Balanço Força
## 0.009471 0.008979
##
## Degrees of Freedom: 99 Total (i.e. Null); 96 Residual
## Null Deviance: 199.2
## Residual Deviance: 108.9 AIC: 375.4
Após a análise do método stepAIC, sugere-se que o modelo mais adequado para explicar as quedas inclua
apenas as variáveis “balanço”, “força” e “intervenção”, mas como o estudo esta sendo feito considerando 1%
de significancia iremos deixar apenas balanço e intervenção.
##
## Call:
## glm(formula = Quedas ~ Intervenção + Balanço, family = poisson,
## data = geriatraBD)
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 0.993846 0.177676 5.594 2.22e-08 ***
## IntervençãoEducação e exercícios -1.069564 0.131325 -8.144 3.81e-16 ***
## Balanço 0.009483 0.002934 3.232 0.00123 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for poisson family taken to be 1)
##
## Null deviance: 199.19 on 99 degrees of freedom
## Residual deviance: 113.54 on 97 degrees of freedom
## AIC: 378.04
##
## Number of Fisher Scoring iterations: 5
1-pchisq(modelo_proposto$deviance,modelo_proposto$df.residual)
## [1] 0.1203313
Todas as variáveis são estatisticamente significativas para o modelo proposto de regressão de Poisson ao nível
de 1% de significância.Alem disso o desvio esta bem ajustado com 113,54 e 97 graus de liberdade levando a
um valor-p de 0,1203.
7
fit.model<-modelo_proposto
source('envel_pois.txt')
3
2
Componente do Desvio
1
0
−1
−2
−3
−2 −1 0 1 2
8
#abline(-2,0,lty=2)
#identify(td, n=5, tolerance = 0.40)
##
#plot(fitted(fit.model), td,xlab="Valor Ajustado",
#ylab="Resíduo Componente do Desvio", pch=16)
#identify(fitted(fit.model), td, n=5, tolerance = 0.40)
#par(mfrow=c(1,1))
knitr::include_graphics("diag.png")
Os pontos 42, 52,62 e 93 são identificados como pontos discrepantes no modelo, ou seja, eles se afastam
significativamente do padrão geral dos dados.Especificamente as observações 42,52 e 93 são possivelmente
pontos de influentes e a observação 62 possivelmente de alavanca.
##
## Call:
## glm(formula = Quedas ~ Intervenção + Balanço, family = poisson,
## data = geriatraBD, subset = -42)
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
9
## (Intercept) 0.929025 0.180944 5.134 2.83e-07 ***
## IntervençãoEducação e exercícios -1.109705 0.133958 -8.284 < 2e-16 ***
## Balanço 0.010633 0.002973 3.577 0.000348 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for poisson family taken to be 1)
##
## Null deviance: 198.92 on 98 degrees of freedom
## Residual deviance: 108.47 on 96 degrees of freedom
## AIC: 369.7
##
## Number of Fisher Scoring iterations: 5
O ponto 42 é identificado como um ponto que não causa uma mudança inferencial no modelo proposto ao
nível de 1% de significância.
ao2<-glm(Quedas ~ Intervenção + Balanço, data = geriatraBD, family = poisson, subset = -52)
summary(ao2)
##
## Call:
## glm(formula = Quedas ~ Intervenção + Balanço, family = poisson,
## data = geriatraBD, subset = -52)
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 0.923419 0.181899 5.077 3.84e-07 ***
## IntervençãoEducação e exercícios -1.038237 0.132181 -7.855 4.01e-15 ***
## Balanço 0.010173 0.002977 3.417 0.000634 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for poisson family taken to be 1)
##
## Null deviance: 186.61 on 98 degrees of freedom
## Residual deviance: 105.49 on 96 degrees of freedom
## AIC: 365.74
##
## Number of Fisher Scoring iterations: 5
O ponto 52 não causa uma mudança inferencial no modelo proposto ao nível de 1% de significância.
ao3<-glm(Quedas ~ Intervenção + Balanço, data = geriatraBD, family = poisson, subset = -62)
summary(ao3)
##
## Call:
## glm(formula = Quedas ~ Intervenção + Balanço, family = poisson,
## data = geriatraBD, subset = -62)
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 0.996718 0.183115 5.443 5.24e-08 ***
## IntervençãoEducação e exercícios -1.068737 0.131959 -8.099 5.54e-16 ***
## Balanço 0.009417 0.003104 3.033 0.00242 **
10
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for poisson family taken to be 1)
##
## Null deviance: 195.38 on 98 degrees of freedom
## Residual deviance: 113.54 on 96 degrees of freedom
## AIC: 374.23
##
## Number of Fisher Scoring iterations: 5
O ponto 62 também não causa mudança inferencial no modelo proposto ao nível de 1% de significância.
ao4<-glm(Quedas ~ Intervenção + Balanço, data = geriatraBD, family = poisson, subset = -93)
summary(ao4)
##
## Call:
## glm(formula = Quedas ~ Intervenção + Balanço, family = poisson,
## data = geriatraBD, subset = -93)
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 0.926950 0.181818 5.098 3.43e-07 ***
## IntervençãoEducação e exercícios -1.042505 0.132099 -7.892 2.98e-15 ***
## Balanço 0.010186 0.002975 3.424 0.000617 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for poisson family taken to be 1)
##
## Null deviance: 189.14 on 98 degrees of freedom
## Residual deviance: 107.18 on 96 degrees of freedom
## AIC: 367.52
##
## Number of Fisher Scoring iterations: 5
O ponto 93 não causa uma mudança inferencial significativa no modelo proposto, considerando um nível de
significância de 1%.
AO1<-glm(Quedas ~ Intervenção + Balanço, data = geriatraBD, family = poisson, subset = -c(42,52))
summary(AO1)
##
## Call:
## glm(formula = Quedas ~ Intervenção + Balanço, family = poisson,
## data = geriatraBD, subset = -c(42, 52))
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 0.854968 0.185409 4.611 4.00e-06 ***
## IntervençãoEducação e exercícios -1.078507 0.134788 -8.002 1.23e-15 ***
## Balanço 0.011377 0.003019 3.769 0.000164 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
11
## (Dispersion parameter for poisson family taken to be 1)
##
## Null deviance: 186.28 on 97 degrees of freedom
## Residual deviance: 100.23 on 95 degrees of freedom
## AIC: 357.21
##
## Number of Fisher Scoring iterations: 5
Os pares de pontos (42, 52) não são causadores de mudança inferencial no modelo a um nível de significância
de 1%.
AO2<-glm(Quedas ~ Intervenção + Balanço, data = geriatraBD, family = poisson, subset = -c(42,62))
summary(AO2)
##
## Call:
## glm(formula = Quedas ~ Intervenção + Balanço, family = poisson,
## data = geriatraBD, subset = -c(42, 62))
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 0.925654 0.186994 4.950 7.41e-07 ***
## IntervençãoEducação e exercícios -1.110685 0.134642 -8.249 < 2e-16 ***
## Balanço 0.010708 0.003154 3.395 0.000687 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for poisson family taken to be 1)
##
## Null deviance: 195.08 on 97 degrees of freedom
## Residual deviance: 108.46 on 95 degrees of freedom
## AIC: 365.89
##
## Number of Fisher Scoring iterations: 5
O par de pontos (42, 62) não causa nenhuma mudança inferencial no modelo proposto ao nível de significância
de 1%.
AO3<-glm(Quedas ~ Intervenção + Balanço, data = geriatraBD, family = poisson, subset = -c(42,93))
summary(AO3)
##
## Call:
## glm(formula = Quedas ~ Intervenção + Balanço, family = poisson,
## data = geriatraBD, subset = -c(42, 93))
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 0.858546 0.185323 4.633 3.61e-06 ***
## IntervençãoEducação e exercícios -1.082744 0.134707 -8.038 9.15e-16 ***
## Balanço 0.011388 0.003016 3.776 0.00016 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for poisson family taken to be 1)
##
12
## Null deviance: 188.81 on 97 degrees of freedom
## Residual deviance: 101.92 on 95 degrees of freedom
## AIC: 358.99
##
## Number of Fisher Scoring iterations: 5
O par (42, 93) também não causa nenhuma mudança inferencial significativa no modelo proposto a um nível
de significância de 1%.
AO4<-glm(Quedas ~ Intervenção + Balanço, data = geriatraBD, family = poisson, subset = -c(52,62))
summary(AO4)
##
## Call:
## glm(formula = Quedas ~ Intervenção + Balanço, family = poisson,
## data = geriatraBD, subset = -c(52, 62))
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 0.926704 0.187414 4.945 7.63e-07 ***
## IntervençãoEducação e exercícios -1.037281 0.132851 -7.808 5.82e-15 ***
## Balanço 0.010099 0.003151 3.205 0.00135 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for poisson family taken to be 1)
##
## Null deviance: 182.58 on 97 degrees of freedom
## Residual deviance: 105.49 on 95 degrees of freedom
## AIC: 361.93
##
## Number of Fisher Scoring iterations: 5
O par de pontos (52, 62) não causa mudança inferencial no modelo proposto ao nível de significância de 1%.
AO5<-glm(Quedas ~ Intervenção + Balanço, data = geriatraBD, family = poisson, subset = -c(52,93))
summary(AO5)
##
## Call:
## glm(formula = Quedas ~ Intervenção + Balanço, family = poisson,
## data = geriatraBD, subset = -c(52, 93))
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 0.849971 0.186472 4.558 5.16e-06 ***
## IntervençãoEducação e exercícios -1.008777 0.133037 -7.583 3.39e-14 ***
## Balanço 0.010947 0.003023 3.622 0.000293 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for poisson family taken to be 1)
##
## Null deviance: 176.167 on 97 degrees of freedom
## Residual deviance: 98.616 on 95 degrees of freedom
## AIC: 354.71
13
##
## Number of Fisher Scoring iterations: 5
O par (52, 93) não causa mudança inferencial no modelo proposto ao nível de significância de 1%.
AO6<-glm(Quedas ~ Intervenção + Balanço, data = geriatraBD, family = poisson, subset = -c(62,93))
summary(AO6)
##
## Call:
## glm(formula = Quedas ~ Intervenção + Balanço, family = poisson,
## data = geriatraBD, subset = -c(62, 93))
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 0.929620 0.187358 4.962 6.99e-07 ***
## IntervençãoEducação e exercícios -1.041733 0.132760 -7.847 4.27e-15 ***
## Balanço 0.010126 0.003149 3.216 0.0013 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for poisson family taken to be 1)
##
## Null deviance: 185.14 on 97 degrees of freedom
## Residual deviance: 107.18 on 95 degrees of freedom
## AIC: 363.71
##
## Number of Fisher Scoring iterations: 5
O par de pontos (62, 93) também não causa mudança inferencial no modelo proposto ao nível de significância
de 1%.
Impacto percentual
((ao1$coefficients-modelo_proposto$coefficients)/(modelo_proposto$coefficients))*100
14
((ao3$coefficients-modelo_proposto$coefficients)/(modelo_proposto$coefficients))*100
15
## 6.493997
A remoção das observções 52 e 62 tiveram um impacto percentual baixo nas estimativas dos coeficientes.
Especificamente, a variável Intervenção apresentou uma variação de aproximadamente -3,02%, enquanto o
balanço sofreu alterações de cerca de 6,49%.
((AO5$coefficients-modelo_proposto$coefficients)/(modelo_proposto$coefficients))*100
Modelo final
A partir do modelo final temos que o número médio de quedas dos individuos após 6 meses aumenta em
100,95% (exp(0,009483).100%) a cada unidade aumentada do balanço. Temos também que para aqueles
individuos que praticam educação e exercícios o número médio de quedas após 6 meses diminui em 34,31%
(exp(-1.069564).100%).
16