Escolar Documentos
Profissional Documentos
Cultura Documentos
1
Trabalho de Conclusão de Curso apresentado para obtenção do título
de especialista em Data Science e Analytics – 2023
Resumo
Abstract
Introdução
2
Trabalho de Conclusão de Curso apresentado para obtenção do título
de especialista em Data Science e Analytics – 2023
Material e Métodos
A Análise Descritiva é a fase inicial deste processo de estudo dos dados coletados.
Utilizamos métodos estatísticos para organizar, resumir e descrever os aspectos importantes
de um conjunto de características observadas ou comparar tais características entre dois ou
mais conjuntos.
As ferramentas descritivas são os muitos tipos de gráficos e tabelas e também medidas
de síntese como porcentagens, índices e médias.
Ao se condensar os dados, perde-se informação, pois não se têm as observações
originais. Entretanto, esta perda de informação é pequena se comparada ao ganho que se
tem com a clareza da interpretação proporcionada (Reis e Reis, 2002).
Segundo Pellegrini (2000), “Métodos quantitativos utilizam dados históricos para
prever a demanda em períodos futuros. A previsão da demanda futura requer a construção
3
Trabalho de Conclusão de Curso apresentado para obtenção do título
de especialista em Data Science e Analytics – 2023
de modelos matemáticos a partir dos dados disponíveis (ou seja, a partir de dados que
descrevem a variação da demanda ao longo do tempo; este grupo de dados é denominado
série temporal). As diferentes técnicas disponíveis para construção desses modelos são
denominadas técnicas de forecasting”. Para complementar, de acordo com Heij et at. (2004),
o modelo de Regressão Linear Simples busca explicar a variação da variável dependente y
em termos de variações da variável explicativa x.
Para a apresentação de forma gráfica, foi utilizado o software MS Power BI® - versão
2.116.622.0 64-bit (abril de 2023). Para o cálculo dos modelos regressivos, foi utilizado o
software RStudio® – versão 4.2.1 (2022.06.23).
As etapas que compreenderam a metodologia foram: extração, tratamento,
processamento e análises dos dados.
Os dados foram obtidos por meio do portal do Ministério da Saúde. Foram extraídos,
um arquivo em formato RAR (compactado) contendo sete arquivos em formato CSV (valores
separados por vírgulas) e um arquivo em formato XLSX. Esses arquivos possuem 17 colunas
(Região, Estado, Município, Código da UF, Código do município, Código da Região de Saúde,
Nome da Região de Saúde, Data, Semana, População TCU 2019, Quantidade Acumulada de
Casos, Quantidade de Casos Novos, Quantidade Acumulada de Novos Óbitos, Quantidade
de Novos Óbitos, Quantidade de Novos Recuperados, Quantidade de Novos em
Acompanhamento e Quantidade de casos na região do Interior/Metropolitana).
O arquivo em formato XLSX possui dados sobre a quantidade de doses aplicadas por
data e tipo de dose com oito colunas (Data, Quantidade de 1ª doses aplicadas, Quantidade
de 2ª doses aplicadas, Quantidade de doses únicas aplicadas, Quantidade de 1ª doses de
reforço aplicadas, Quantidade de 2ª doses de reforço aplicadas, Quantidade de dose adicional
aplicadas e Total de doses aplicadas).
4
Trabalho de Conclusão de Curso apresentado para obtenção do título
de especialista em Data Science e Analytics – 2023
5
Trabalho de Conclusão de Curso apresentado para obtenção do título
de especialista em Data Science e Analytics – 2023
Análises
Por fim, foram realizadas análises de forma que permitiram verificar se a evolução da
vacinação da COVID-19 na população brasileira foi efetiva, quando comparada a quantidade
total de casos e a quantidade de óbitos antes e depois, além da quantidade de doses
aplicadas diariamente. Além disso, foram gerados dois modelos preditivos, um para cada
período, de forma a analisar a evolução dos casos durante a pandemia e assim, embasar os
dados mostrados nos gráficos.
Resultados e Discussão
Figura 1. Quantidade de Novos Casos (em azul) e de Novos Óbitos (em preto) no período
pré-vacinação (de Março de 2020 até Dezembro de 2020)
Fonte: Resultados originais da pesquisa
6
Trabalho de Conclusão de Curso apresentado para obtenção do título
de especialista em Data Science e Analytics – 2023
Figura 2. Quantidade de Doses Aplicadas (em vermelho) e de Novos Óbitos (em preto) no
período pós-vacinação (de Janeiro de 2021 até Janeiro de 2023)
Fonte: Resultados originais da pesquisa
7
Trabalho de Conclusão de Curso apresentado para obtenção do título
de especialista em Data Science e Analytics – 2023
Figura 3. Quantidade de Novos Casos (em azul) e de Novos Óbitos (em preto) no período
pós-vacinação (de Janeiro de 2021 até Janeiro de 2023)
Fonte: Resultados originais da pesquisa
Figura 4. Casos Novos Acumulados (de Março de 2020 até Janeiro de 2023)
Fonte: Resultados originais da pesquisa
8
Trabalho de Conclusão de Curso apresentado para obtenção do título
de especialista em Data Science e Analytics – 2023
Figura 5. Óbitos Novos Acumulados (de Março de 2020 até Janeiro de 2023)
Fonte: Resultados originais da pesquisa
MODEL FIT:
F(1,1574202) = 8756038.3864, p = 0.0000
R2 = 0.8476
Adj. R2 = 0.8476
9
Trabalho de Conclusão de Curso apresentado para obtenção do título
de especialista em Data Science e Analytics – 2023
MODEL FIT:
F(1,4253565) = 2804670.7257, p = 0.0000
R2 = 0.3974
Adj. R2 = 0.3974
Conclusão
10
Trabalho de Conclusão de Curso apresentado para obtenção do título
de especialista em Data Science e Analytics – 2023
Ao avaliar os resultados, observa-se que a partir de Abril de 2021, três meses após o
início da vacinação, a quantidade de óbitos diminuiu de maneira significativa, passando de
vários milhares para algumas centenas. A mesma afirmação é valida para a quantidade de
casos novos entre os períodos pré e pós-vacinação.
Antes de gerar os modelos pré- e pós-vacinação de Regressão Linear Simples, havia
um entendimento que o β para o período pré seria positivo e para o período pós, negativo.
Entretanto, ao gerar os modelos, foi possível evidenciar que o β no período pré se manteve
positivo, mas que no pós também ficou positivo. É importante ressaltar que mesmo o β pós-
vacinação ficando positivo, foi evidenciada uma desaceleração no número de novos casos e
óbitos, ou seja, a inclinação da reta diminuiu. Esse resultado se mostrou possivelmente devido
a dimensão do país, diferentes tipos de fabricantes das vacinas, característica da vacinação
adotada e particularidades do próprio vírus e suas variantes.
Desta forma, a constância e grande quantidade de vacinas aplicadas diariamente na
população brasileira se mostrou muito efetiva na redução de novos casos e,
consequentemente, de novos óbitos. Sendo assim possível concluir que a premissa para uma
vacina ser considerada efetiva foi atendida.
Referências
Guedes, T.A.; Martins, A.B.T.; Acorsi, C.R.L. Escola de Artes, Ciências e Humanidades
[EACH-USP]. Janeiro, V. 2022. Projeto de Ensino Aprender Fazendo Estatística: Estatística
Descritiva. Disponível em:
<http://www.each.usp.br/rvicente/Guedes_etal_Estatistica_Descritiva.pdf>. Acesso em: 01
nov. 2022.
Heij, Christiaan et al. 2004. Econometric methods with applications in business and
economics. Oxford University Press Inc. New York City. NY. USA.
11
Trabalho de Conclusão de Curso apresentado para obtenção do título
de especialista em Data Science e Analytics – 2023
Reis, E.A.; Reis, I.A. 2002. Análise Descritiva de Dados. 1ed. Relatório Técnico do
Departamento de Estatística da UFMG. Disponível em:
<http://www.est.ufmg.br/portal/arquivos/rts/rte0202.pdf>. Acesso em: 28 out. 2022.
Universidade Aberta do SUS [UNA-SUS]. 2020. Coronavírus: Brasil confirma primeiro caso
da doença. Disponível em: <https://www.unasus.gov.br/noticia/coronavirus-brasil-confirma-
primeiro-caso-da-doenca>. Acesso em: 22 out. 2022.
12