Você está na página 1de 12

Trabalho de Conclusão de Curso apresentado para obtenção do título

de especialista em Data Science e Analytics – 2023

Avaliação da efetividade da vacinação contra a COVID-19 na diminuição de mortes no


Brasil

Thiago Molina Capelão¹*; Walter Mesquita Filho2


1Bacharel em Engenharia de Produção. Rua Belchior de Azevedo, 156 – Vila Leopoldina; 05089-030 São Paulo,
São Paulo, Brasil
2Pecege. Professor Orientador. Parque Tecnológico, R. Cezira Giovanoni Moretti, 600 – Santa Rosa; 13418-445

Piracicaba, São Paulo, Brasil


*autor correspondente: thiago.capelao@gmail.com

1
Trabalho de Conclusão de Curso apresentado para obtenção do título
de especialista em Data Science e Analytics – 2023

Avaliação da efetividade da vacinação contra a COVID-19 na diminuição de mortes no


Brasil

Resumo

Considerando o contexto da pandemia de COVID-19, o presente estudo propõe uma


avaliação da efetividade da vacinação na população brasileira na redução da quantidade
diária de novos casos e óbitos. A partir de dados coletados do portal do Ministério da Saúde,
esse trabalho apresenta resultados de casos novos e óbitos entre os períodos pré e pós-
vacinação (de Março de 2020 até Janeiro de 2023) e da quantidade diária aplicada de vacina
em comparação com a quantidade, também diária, de novos óbitos. Além disso, foram
gerados modelos de Regressão Linear Simples de forma a avaliar e embasar a análise e gerar
modelos preditivos para os dois períodos. Como conclusão da avaliação, foi possível observar
que a vacinação foi realmente efetiva, seguindo a premissa descrita no estudo.
Palavras-chave: Análise Descritiva; Ministério da Saúde; Regressão Linear Simples.

Evaluation of the effectiveness of vaccination against COVID-19 in reducing deaths in


Brazil

Abstract

Considering the context of the COVID-19 pandemic, this study proposes an


assessment of the evolution of vaccination in the Brazilian population in reducing the daily
number of new cases and deaths. Based on data collected from the Ministry of Health portal,
this study presents results of new cases and deaths between the pre- and post-vaccination
periods (from March 2020 to January 2023) and the applied amount of vaccine compared to
the number, also daily, of new deaths. In addition, Simple Linear Regression models were
generated in order to evaluate and support the analysis and generate predictive models for
both periods. As a conclusion to the evaluation, it was possible to observe that the vaccination
was really effective, following the premise described in the study.
Keywords: Descriptive Analysis; Ministry of Health; Simple Linear Regression.

Introdução

De acordo com a Organização Pan-Americana de Saúde [OPAS], “em 31 de dezembro


de 2019, a Organização Mundial da Saúde [OMS] foi alertada sobre vários casos de
pneumonia na cidade de Wuhan, província de Hubei, na República Popular da China. Tratava-
se de uma nova cepa (tipo) de coronavírus que não havia sido identificada antes em seres
humanos. (...) o novo coronavírus (que no início foi temporariamente nomeado 2019-nCoV e,
em 11 de fevereiro de 2020, recebeu o nome de SARS-CoV-2).”
A partir do final de dezembro de 2019, o mundo se viu diante de uma pandemia que
assolou centenas de países e que gerou centenas de milhares de mortes. Muitos sistemas de
saúde estiveram próximos do colapso, por conta do alto número de contaminados que
buscavam tratamento contra essa doença. Essa epidemia fez com que as pessoas mudassem
seus hábitos de higiene, mantendo o distanciamento social, uso de máscaras e álcool em gel
a fim de evitar a contaminação e a transmissão.

2
Trabalho de Conclusão de Curso apresentado para obtenção do título
de especialista em Data Science e Analytics – 2023

Até o mês de outubro de 2020, não existiam indicações de resultados positivos de


vacinas testadas na Fase III, mas em novembro de 2020, foram anunciadas três vacinas que
se mostraram promissoras ao passarem por essa fase, sendo elas, da Moderna, da Pfizer-
BioNTech e da Universidade de Oxford em parceria com a AstraZeneca. E em dezembro do
mesmo ano, foi aprovada a primeira vacina (Pfizer-BioNTech) para uso emergencial na
população.
Já no Brasil, segundo o UNA-SUS, o primeiro caso registrado da doença foi confirmado
pelo Ministério da Saúde em 26 de fevereiro de 2020, em São Paulo. Sendo este, também, o
primeiro registro da doença na América Latina. A primeira vacinação ocorreu em 17 de Janeiro
de 2021, utilizando a vacina desenvolvida pelo Instituto Butantan.
De acordo com o Vacinômetro COVID-19 do Ministério da Saúde, foram aplicadas
506.345.158 de doses até Janeiro de 2023.
Segundo a OPAS, ”a efetividade de uma vacina significa que ela gera um risco
reduzido de infecção ou de doença entre os indivíduos vacinados atribuídos à vacinação em
condições do mundo real; estimada a partir de estudos observacionais (não randomizados)”.
É possível utilizar métodos de DSA, como Estatística Descritiva, para avaliar a
efetividade da vacinação.
O presente projeto tem como objetivo avaliar a eficácia da vacinação contra a COVID-
19, no Brasil, comparando a quantidade total de casos e de óbitos antes e depois da
vacinação, a partir de análise do modelo de Regressão Linear Simples, por meio do método
MQO (Mínimos Quadrados Ordinários), também conhecido como OLS (Ordinary Least
Squares).

Material e Métodos

A Análise Descritiva é a fase inicial deste processo de estudo dos dados coletados.
Utilizamos métodos estatísticos para organizar, resumir e descrever os aspectos importantes
de um conjunto de características observadas ou comparar tais características entre dois ou
mais conjuntos.
As ferramentas descritivas são os muitos tipos de gráficos e tabelas e também medidas
de síntese como porcentagens, índices e médias.
Ao se condensar os dados, perde-se informação, pois não se têm as observações
originais. Entretanto, esta perda de informação é pequena se comparada ao ganho que se
tem com a clareza da interpretação proporcionada (Reis e Reis, 2002).
Segundo Pellegrini (2000), “Métodos quantitativos utilizam dados históricos para
prever a demanda em períodos futuros. A previsão da demanda futura requer a construção

3
Trabalho de Conclusão de Curso apresentado para obtenção do título
de especialista em Data Science e Analytics – 2023

de modelos matemáticos a partir dos dados disponíveis (ou seja, a partir de dados que
descrevem a variação da demanda ao longo do tempo; este grupo de dados é denominado
série temporal). As diferentes técnicas disponíveis para construção desses modelos são
denominadas técnicas de forecasting”. Para complementar, de acordo com Heij et at. (2004),
o modelo de Regressão Linear Simples busca explicar a variação da variável dependente y
em termos de variações da variável explicativa x.
Para a apresentação de forma gráfica, foi utilizado o software MS Power BI® - versão
2.116.622.0 64-bit (abril de 2023). Para o cálculo dos modelos regressivos, foi utilizado o
software RStudio® – versão 4.2.1 (2022.06.23).
As etapas que compreenderam a metodologia foram: extração, tratamento,
processamento e análises dos dados.

Extração dos dados

Os dados foram obtidos por meio do portal do Ministério da Saúde. Foram extraídos,
um arquivo em formato RAR (compactado) contendo sete arquivos em formato CSV (valores
separados por vírgulas) e um arquivo em formato XLSX. Esses arquivos possuem 17 colunas
(Região, Estado, Município, Código da UF, Código do município, Código da Região de Saúde,
Nome da Região de Saúde, Data, Semana, População TCU 2019, Quantidade Acumulada de
Casos, Quantidade de Casos Novos, Quantidade Acumulada de Novos Óbitos, Quantidade
de Novos Óbitos, Quantidade de Novos Recuperados, Quantidade de Novos em
Acompanhamento e Quantidade de casos na região do Interior/Metropolitana).
O arquivo em formato XLSX possui dados sobre a quantidade de doses aplicadas por
data e tipo de dose com oito colunas (Data, Quantidade de 1ª doses aplicadas, Quantidade
de 2ª doses aplicadas, Quantidade de doses únicas aplicadas, Quantidade de 1ª doses de
reforço aplicadas, Quantidade de 2ª doses de reforço aplicadas, Quantidade de dose adicional
aplicadas e Total de doses aplicadas).

Tratamento dos dados

Para os sete arquivos Histórico_COVIDBR, foi realizado o tratamento dos dados,


inicialmente através da inclusão da codificação binária do tipo UTF-8 para organizar os nomes
dos municípios brasileiros de maneira que os textos foram renderizados. Após isso, foi feita a
exclusão das colunas emAcompanhamentoNovos, interior/metropolitana, codRegiaoSaude e
nomeRegiaoSaude, por não serem necessárias para análise. Observações em que variáveis
numéricas eram vazias, também foram excluídas das bases.

4
Trabalho de Conclusão de Curso apresentado para obtenção do título
de especialista em Data Science e Analytics – 2023

Após os tratamentos descritos, os arquivos Histórico_COVIDBR foram divididos em


período pré-vacinação, nomeado por Historico__pré, ou seja, de 25 de Fevereiro de 2020
até 16 de Janeiro de 2021, quando ainda não havia vacinas disponíveis para aplicação e
período pós-vacinação, nomeado por Historico__pós, ou seja, de 17 de Janeiro de 2021 até
27 de Janeiro de 2023, quando já havia vacinas disponíveis e em uso.
Na aba Modelos do Power BI, foi criado um relacionamento entre as bases
Histórico__pós e Geral – Doses aplicadas por data e tipo de dose, em que a variável Data
possuía uma cardinalidade de muitos para um (*:1).
Após todas as transformações, a base de dados pré-vacinação resultante continha
1.574.204 observações. Já, a base de dados pós-vacinação resultante continha 4.253.567
observações. A variáveis originais de ambas as bases podem ser vistas na Tabela 1.

Tabela 1. Descrição das variáveis e seus tipos na base de dados


Campos Tipo
regiao character
estado character
municipio logical
coduf numeric
codmun logical
codRegiaoSaude logical
nomeRegiaoSaude logical
data POSIX calendar time
semanaEpi numeric
populacaoTCU2019 numeric
casosAcumulado numeric
casosNovos numeric
obitosAcumulado numeric
obitosNovos numeric
Recuperadosnovos numeric
emAcompanhamentoNovos numeric
interior/metropolitana logical
Fonte: Dados originais da pesquisa

Processamento dos dados

O primeiro passo da análise de dados consistiu em analisar de maneira descritiva as


bases de dados. Contagens e somas foram calculadas para cada variável, no período
completo (pré-vacinação e pós-vacinação). A apresentação gráfica serviu de facilitadora na
visualização da evolução da pandemia nos períodos descritos.
Após isso, foi realizada a Regressão Linear Simples para os dois períodos de forma a
gerar modelos preditivos para análise.

5
Trabalho de Conclusão de Curso apresentado para obtenção do título
de especialista em Data Science e Analytics – 2023

Análises

Por fim, foram realizadas análises de forma que permitiram verificar se a evolução da
vacinação da COVID-19 na população brasileira foi efetiva, quando comparada a quantidade
total de casos e a quantidade de óbitos antes e depois, além da quantidade de doses
aplicadas diariamente. Além disso, foram gerados dois modelos preditivos, um para cada
período, de forma a analisar a evolução dos casos durante a pandemia e assim, embasar os
dados mostrados nos gráficos.

Resultados e Discussão

Ao confrontar a quantidade diária de casos novos e a de óbitos novos para o período


anterior a criação e disponibilização das vacinas para início do processo de imunização na
população brasileira, observa-se que ambas variáveis se comportam de maneira muito
parecida com relação ao crescimento e decrescimento no período analisado, mesmo com
grandezas diferentes (Figura 1).

Figura 1. Quantidade de Novos Casos (em azul) e de Novos Óbitos (em preto) no período
pré-vacinação (de Março de 2020 até Dezembro de 2020)
Fonte: Resultados originais da pesquisa

Ao confrontar a quantidade de doses aplicadas e de óbitos novos para o período


posterior a criação e disponibilização das vacinas para início do processo de imunização na
população brasileira, observa-se que a grande quantidade de imunizantes disponibilizadas e

6
Trabalho de Conclusão de Curso apresentado para obtenção do título
de especialista em Data Science e Analytics – 2023

aplicadas diariamente na população, principalmente entre Junho e Setembro de 2021,


coincide uma queda acentuada na quantidade, também diária, de novos óbitos (Figura 2).

Figura 2. Quantidade de Doses Aplicadas (em vermelho) e de Novos Óbitos (em preto) no
período pós-vacinação (de Janeiro de 2021 até Janeiro de 2023)
Fonte: Resultados originais da pesquisa

Ainda no período pós-vacinação, ao confrontar a quantidade diária de casos novos e


a de óbitos novos, observa-se que ambas variáveis se comportam de maneira muito parecida
com relação ao crescimento e decrescimento no período analisado, mesmo com grandezas
diferentes (Figura 3). Importante dizer que mesmo a quantidade de casos crescendo muito,
como em Janeiro de 2022, não se observou o mesmo para óbitos, que indica também que a
vacina ajudou.

7
Trabalho de Conclusão de Curso apresentado para obtenção do título
de especialista em Data Science e Analytics – 2023

Figura 3. Quantidade de Novos Casos (em azul) e de Novos Óbitos (em preto) no período
pós-vacinação (de Janeiro de 2021 até Janeiro de 2023)
Fonte: Resultados originais da pesquisa

Ao verificar os Casos Novos Acumulados, observa-se que de Janeiro a Março de 2022


houve um crescimento acentuado nos novos casos registrados, causados pela nova variante
do vírus, que naquele momento era a BA.5, uma subvariante da Ômicron (Figura 4).

Figura 4. Casos Novos Acumulados (de Março de 2020 até Janeiro de 2023)
Fonte: Resultados originais da pesquisa

Já ao verificar os Óbitos Novos Acumulados, observa-se que houve um crescimento


acentuado entre Março e Julho de 2021, pior período registrado da pandemia (Figura 5).

8
Trabalho de Conclusão de Curso apresentado para obtenção do título
de especialista em Data Science e Analytics – 2023

Figura 5. Óbitos Novos Acumulados (de Março de 2020 até Janeiro de 2023)
Fonte: Resultados originais da pesquisa

Ao utilizar o software RStudio®, foi gerado um modelo para o período pré-vacinação e


outro para o período pós. Ambos com Intervalo de Confiança adotado de 95,00%. A
quantidade de Novos Óbitos foi adotada na variável dependente y, enquanto que a quantidade
de Novos Casos foi adotada na variável explicativa/preditora x.
No período pré-vacinação, o output do modelo retorna dentre os diversos dados, o R2,
conhecido como Coeficiente de ajuste/explicação e os coeficientes linear/intercepto e
angular/inclinação, α e β, respectivamente (Tabela 2).

Tabela 2. Output do modelo Pré-vacinação


MODEL INFO:
Observations: 1574204
Dependent Variable: obitosNovos
Type: OLS linear regression

MODEL FIT:
F(1,1574202) = 8756038.3864, p = 0.0000
R2 = 0.8476
Adj. R2 = 0.8476

Standard errors: OLS


Est. 2.5% 97.5% t val. p
Intercept 0.0427 0.0356 0.0499 11.7182 0.0000
casosNovos 0.0223 0.0223 0.0224 2959.0604 0.0000

9
Trabalho de Conclusão de Curso apresentado para obtenção do título
de especialista em Data Science e Analytics – 2023

Fonte: Resultados originais da pesquisa

A equação de Regressão Linear Simples do modelo pré-vacinação se dá por:


𝑌̂ = 0.0427 + 0.0223 ∗ 𝑜𝑏𝑖𝑡𝑜𝑠𝑁𝑜𝑣𝑜𝑠 (1)
onde, α assume o valor de 0.0427, β, 0.0223 e Xi, obitosNovos.

Em seguida, ao fazer a predição no modelo MQO foi obtido o resultado de 2.234,326


novos óbitos a cada 100.000 novos casos registrados.

Já no período pós-vacinação, o output do modelo retorna dentre os diversos dados, o


R2, conhecido como Coeficiente de ajuste/explicação e os coeficientes linear/intercepto e
angular/inclinação, α e β, respectivamente (Tabela 3).

Tabela 3. Output do modelo Pós-vacinação


MODEL INFO:
Observations: 4253567
Dependent Variable: obitosNovos
Type: OLS linear regression

MODEL FIT:
F(1,4253565) = 2804670.7257, p = 0.0000
R2 = 0.3974
Adj. R2 = 0.3974

Standard errors: OLS


Est. 2.5% 97.5% t val. p
Intercept 0.0623 0.0496 0.0751 9.6134 0.0000
casosNovos 0.0142 0.0141 0.0142 1674.7151 0.0000
Fonte: Resultados originais da pesquisa

A equação de Regressão Linear Simples do modelo pós-vacinação se dá por:


𝑌̂ = 0.0623 + 0.0142 ∗ 𝑜𝑏𝑖𝑡𝑜𝑠𝑁𝑜𝑣𝑜𝑠 (2)
onde, α assume o valor de 0.0623, β, 0.0142 e Xi, obitosNovos.

Em seguida, ao fazer a predição no modelo MQO foi obtido o resultado de 1.416,143


novos óbitos a cada 100.000 novos casos registrados.

Conclusão

10
Trabalho de Conclusão de Curso apresentado para obtenção do título
de especialista em Data Science e Analytics – 2023

Ao avaliar os resultados, observa-se que a partir de Abril de 2021, três meses após o
início da vacinação, a quantidade de óbitos diminuiu de maneira significativa, passando de
vários milhares para algumas centenas. A mesma afirmação é valida para a quantidade de
casos novos entre os períodos pré e pós-vacinação.
Antes de gerar os modelos pré- e pós-vacinação de Regressão Linear Simples, havia
um entendimento que o β para o período pré seria positivo e para o período pós, negativo.
Entretanto, ao gerar os modelos, foi possível evidenciar que o β no período pré se manteve
positivo, mas que no pós também ficou positivo. É importante ressaltar que mesmo o β pós-
vacinação ficando positivo, foi evidenciada uma desaceleração no número de novos casos e
óbitos, ou seja, a inclinação da reta diminuiu. Esse resultado se mostrou possivelmente devido
a dimensão do país, diferentes tipos de fabricantes das vacinas, característica da vacinação
adotada e particularidades do próprio vírus e suas variantes.
Desta forma, a constância e grande quantidade de vacinas aplicadas diariamente na
população brasileira se mostrou muito efetiva na redução de novos casos e,
consequentemente, de novos óbitos. Sendo assim possível concluir que a premissa para uma
vacina ser considerada efetiva foi atendida.

Referências

Guedes, T.A.; Martins, A.B.T.; Acorsi, C.R.L. Escola de Artes, Ciências e Humanidades
[EACH-USP]. Janeiro, V. 2022. Projeto de Ensino Aprender Fazendo Estatística: Estatística
Descritiva. Disponível em:
<http://www.each.usp.br/rvicente/Guedes_etal_Estatistica_Descritiva.pdf>. Acesso em: 01
nov. 2022.

Heij, Christiaan et al. 2004. Econometric methods with applications in business and
economics. Oxford University Press Inc. New York City. NY. USA.

Ministério da Saúde [MS]. Coronavírus Brasil. Disponível em: <https://covid.saude.gov.br/>.


Acesso em: 01 nov. 2022.

Ministério da Saúde [MS]. Vacinômetro COVID-19. Disponível em:


<https://infoms.saude.gov.br/extensions/DEMAS_C19_Vacina_v2/DEMAS_C19_Vacina_v2.
html>. Acesso em: 01 nov. 2022.

Ministério da Saúde [MS]. COVID-19 NO BRASIL. Disponível em: <


https://infoms.saude.gov.br/extensions/covid-19_html/covid-19_html.html>. Acesso em: 19
jan. 2023.

11
Trabalho de Conclusão de Curso apresentado para obtenção do título
de especialista em Data Science e Analytics – 2023

Ministério da Saúde [MS]. Painel de Distribuição de Vacinas. Disponível em: <


https://infoms.saude.gov.br/extensions/DEMAS_C19VAC_Distr/DEMAS_C19VAC_Distr.html
>. Acesso em: 19 jan. 2023.

Organização Pan-Americana da Saúde [OPAS]. Histórico da pandemia de COVID-19.


Disponível em: <https://www.paho.org/pt/covid19/historico-da-pandemia-covid-19>. Acesso
em: 22 out. 2022.

Organização Pan-Americana da Saúde [OPAS]. Avaliação de efetividade das vacinas contra


a COVID-19. Disponível em:
<https://iris.paho.org/bitstream/handle/10665.2/54793/OPASWBRAPHECOVID-
19210068_por.pdf?sequence=1&isAllowed=y>. Acesso em: 19 mar. 2023.

Pellegrini, F.R. 2000. Metodologia para implementação de sistemas de previsão de demanda.


Tese de Mestrado. Universidade Federal do Rio Grande do Sul, Porte Alegre, RS, Brasil.
Disponível em: <
http://www.producao.ufrgs.br/arquivos/publicacoes/Fernando%20R%20Pellegrini.pdf>.
Acesso em: 05 abr. 2023.

Reis, E.A.; Reis, I.A. 2002. Análise Descritiva de Dados. 1ed. Relatório Técnico do
Departamento de Estatística da UFMG. Disponível em:
<http://www.est.ufmg.br/portal/arquivos/rts/rte0202.pdf>. Acesso em: 28 out. 2022.

Universidade Aberta do SUS [UNA-SUS]. 2020. Coronavírus: Brasil confirma primeiro caso
da doença. Disponível em: <https://www.unasus.gov.br/noticia/coronavirus-brasil-confirma-
primeiro-caso-da-doenca>. Acesso em: 22 out. 2022.

12

Você também pode gostar