Escolar Documentos
Profissional Documentos
Cultura Documentos
1
Trabalho de Conclusão de Curso apresentado para obtenção do título
de especialista em Data Science e Analytics – 2022
Resumo
Introdução
2
Trabalho de Conclusão de Curso apresentado para obtenção do título
de especialista em Data Science e Analytics – 2022
(Mitchell, 2019). API é um elemento que surgiu como forma de integrar serviços de vários
softwares, promovendo a ligação entre dois elementos de software que não poderiam ser
conectados diretamente sem ela (Padilha et al., 2022).
Em um outro nível de sofisticação há o Robotic Process Automation [RPA]. O RPA
permite que robôs de software executem tarefas em um computador como um humano faria,
destacando-se na automação de tarefas manuais e repetitivas. O trabalho diário de alguém
clicando em telas de computador, inserindo dados e enviando e-mails são exemplos de ações
que o RPA ajuda a fazer (Mullakara e Asokan, 2020). Ao se referir a RPA, Lacity et al. (2015)
esclarece que não se trata tecnologias como scripts de desktop que auxiliam agentes
humanos, mas sim de automação de software que substitui parte ou todo o trabalho
anteriormente realizado por pessoas.
Como se não bastasse, a tecnologia evoluiu para grau ainda mais sofisticado.
Segundo a empresa de pesquisa Gartner, uma das principais tendências estratégicas de
tecnologia previstas para 2022 é o Hyperautomation, uma abordagem usada para identificar,
verificar e automatizar rapidamente o maior número possível de processos de negócios e de
TI, envolvendo o uso orquestrado de várias tecnologias, ferramentas ou plataformas, tais
como RPA, Artificial intelligence [AI] e Machine learning (Gartner, 2022).
Bornet et al. (2020) informa que o termo Hyperautomation também é chamado de
Intelligent Process Automation ou Intelligent Automation [IA], uma designação oficialmente
estabelecida em 2017 pelo Institute of Electrical and Electronics Engineers [IEEE]. Eles
também descrevem que IA se concentra em automatizar o trabalho feito por trabalhadores
que empregam o conhecimento humano em suas atividades. A IA visa criar programas de
automação, trabalhadores digitais, para imitar as ações de profissionais, tal como
programadores, físicos, cientistas, farmacêuticos e outros.
Pressupõe-se que todas essas tecnologias de automação configuradas geram grande
valor para o negócio de quem as contrata e implementa para atuar integradas à arquitetura
de software tanto em domínio interno quanto junto a serviços de sistemas de outras empresas.
Os sistemas externos para trocas de dados são acessados remotamente através da internet
e geralmente estão preparados para troca de dados, inclusive de forma massiva, através de
mecanismos de API, servidores de arquivos, sistemas de mensageria, dentre outros. No
entanto, é previsível que com a capacidade dessas soluções de automação, em algum
momento, queira-se construir integração com sistemas que não foram projetados para atender
demasiada demanda, em especial sistemas online web. Estes quando submetidos a acesso
massivo podem sofrer instabilidade e problema para manter a qualidade do serviço prestado.
Ademais o acesso aos sistemas web das companhias normalmente são protegidos
por módulo de autenticação que muitas vezes atuam em conjunto com outras medidas de
3
Trabalho de Conclusão de Curso apresentado para obtenção do título
de especialista em Data Science e Analytics – 2022
segurança, como o Completely Automated Public Turing test to tell Computers and Humans
Apart [CAPTCHA] ou o reCAPTCHA, cujo propósito é mitigar o acesso automatizado através
mecanismos que o diferenciam do acesso feito por humanos (Google, 2022). Os sistemas
web em si são projetados com diversos campos para o preenchimento e envio de dados, e a
apresentação de resultados, mensagens ou relatórios. Estas aplicações armazenam e
recuperam dados mantidos em bancos de dados, e no meio do percurso há tantos outros
softwares e equipamentos garantindo a comunicação e segurança.
O objetivo deste trabalho é diagnosticar a presença de acesso automatizado em perfis
de transações de sistemas no ambiente Mainframe a partir de análise de registros System
Management Facilities [SMF] do monitor de transação Customer Information Control System
[CICS].
Material e Métodos
A partir desta visão geral, este trabalho foi realizado com dados de uma companhia
brasileira do setor de TI que notou ao longo dos últimos anos o crescimento de acessos
automatizados a seus sistemas, ao qual chamam de acesso robotizado.
Através do seu ambiente computacional Mainframe, também conhecido como
plataforma alta ou grande porte, que tem grande capacidade de aferição, observou-se que
houve mudança na carga de trabalho e aumento do consumo de CPU. Inspeções realizadas
outrora identificaram que acessos robotizados produzem um padrão composto de acessos
repetitivos e em grande frequência e, consequentemente, provocam degradação de
performance dos sistemas e reflexos ao ambiente.
Tal situação, além dos problemas tecnológicos, implica também em desafio financeiro
porque o consumo de CPU é uma variável importante nos custos do ambiente Mainframe.
Mainframe é um computador geralmente projetado para propósitos de negócios e ideal para
gerenciar transações em escala. Ele apresenta grande recurso de I/O e geralmente lida com
operações de missão crítica (Taulli, 2022).
No centro de dados da empresa o Mainframe está integrado aos demais servidores de
ambiente distribuído e Big Data e as transações mencionadas são originadas nos sistemas
web do próprio Mainframe ou de qualquer outra plataforma. Os dados usados neste trabalho
foram autorizados pela gerência de Performance e Plano de Capacidade e se limitam a
análise de registros SMF do ano de 2021.
4
Trabalho de Conclusão de Curso apresentado para obtenção do título
de especialista em Data Science e Analytics – 2022
Os dados foram selecionados e extraídos pelo software Tivoli Decision Support for
z/OS [TDS] 1.8.2, que a partir da versão 1.9.0 foi renomeado para IBM Z Decision Support
[IZDS]. Este software mantém uma cópia atualizada da estruturação de campos dos registros
SMF e através de codificação de programas é possível criar filtros para selecionar os campos
que se deseja de cada registro. Jobs disparam a execução desses programas que fazem
5
Trabalho de Conclusão de Curso apresentado para obtenção do título
de especialista em Data Science e Analytics – 2022
Tabela 1. Relação entre campos do registro 110 SMF e as colunas na tabela DB2
Coluna no DB2 Tipo de Localização Campos no SMF Descrição
coluna no SMF
DIA DATE SMF header SMFMNDTE Data em que o registro foi movido
para o SMF
HORA TIME SMF header SMFMNTME Hora em que o registro foi movido
para SMF
MVS CHAR (4) SMF header SMFMNSID Identificação do sistema
CICS CHAR(8) SMF product SMFMNPRN Nome do produto (GENERIC
section APPLID)
TRANSACAO CHAR(4) CICS data TRAN(C001) Identificação da transação
section, grupo
DFHTASK
TURNO CHAR(8) SMF header SMFMNSID, No DB2 campo com conteúdo
SMFMNDTE, rotulado conforme a combinação
SMFMNTME dos três campos SMF
QTDE_TRANS_TOT INTEGER CICS data START(T005) Usada a contagem de START.
section, grupo No DB2 campo quantificar o
DFHCICS número de chamadas de uma
transação
TMP_RESPOSTA_TOT FLOAT CICS data STOP(T006)- Tempo de resposta da transação
section, grupo START(T005) dado pela subtração STOP-
DFHCICS START
TMP_CPU_TOT FLOAT CICS data USRCPUT(S008) No TDS/IZDS USRCPUT é
section, rotulado como USRCPUT_TOD e
DFHTASK corresponde a soma do tempo de
processador. No DB2
corresponde a operação
SUM(USRCPUT_TOD/4096E6)
Fonte: Dados originais da pesquisa
O DB2 for z/OS é um sistema gerenciador de banco de dados mais restritivo do que o
DB2 em Linux ou Windows, por exemplo, e devido limitações encontradas não foi possível
estabelecer conexão usando pacotes para linguagem de programação R versão 4.1.1, como
ibmdbR, RODBC e RJDBC. Desta maneira, optou-se em descarregar os dados como arquivos
Comma-separated values [CSV] através de utilitário de Unload do DB2 acionados por Job
Control Language [JCL] e com instruções Structured Query Language [SQL] embutidas.
O SQL foi escrito para selecionar somente as transações de CICS em ambiente de
produção, excluindo as transações configuradas nos CICS de mesmo ambiente de servidores
Web e transações iniciadas com a letra C, pois se referem a transações internas do CICS e
que são criadas durante processo de instalação do produto. Além disso, o script SQL foi
programado para selecionar dados do dia primeiro ao último de 2021, unicamente das
6
Trabalho de Conclusão de Curso apresentado para obtenção do título
de especialista em Data Science e Analytics – 2022
transações que executaram todos os 365 dias do ano. Por solicitação da empresa foi
adicionado no SQL um mecanismo de mascaramento dos dados sobre a coluna
TRANSACAO, visto que é um dado sensível para a empresa.
O RStudio 2021.09.0 foi usado para a manipulação e análise dos dados. Para isso
empregou-se bibliotecas R como tidyverse, ggplot2, cluster, dendrograma, factoextra, fpc e
stats.
Resultados e Discussão
7
Trabalho de Conclusão de Curso apresentado para obtenção do título
de especialista em Data Science e Analytics – 2022
Tabela 4. Transações obtidas entre os 100 maiores picos de tempo de CPU no intervalo DIA,
HORA, CICS
Transação Frequência Total Média Desvio Padrão
Absoluta
Q0DD 33 310241.039 9401.244 5314.9717
W16F 23 87858.282 3819.925 216.6114
D009 16 78099.305 4881.207 1595.3201
M05E 10 34385.335 3438.534 276.1126
P065 7 30124.472 4303.496 1214.6533
Q098 4 17079.676 4269.919 926.7870
Z182 3 13202.105 4400.702 1380.2492
S122 2 27085.452 13542.726 7830.5378
Q0AC 1 5273.917 5273.917 NA
T155 1 4436.151 4436.151 NA
Fonte: Resultados originais da pesquisa
Tabela 5. Transações obtidas entre os 100 maiores números de chamadas no intervalo DIA,
HORA, CICS
Transação Frequência Total Média Desvio Padrão
Absoluta
W16F 77 180728785 2347127 137071.71
S136 13 40459142 3112242 1096464.94
D009 4 9260836 2315209 89644.28
S121 4 11956886 2989222 541475.24
E026 2 6575976 3287988 1309771.06
Fonte: Resultados originais da pesquisa
8
Trabalho de Conclusão de Curso apresentado para obtenção do título
de especialista em Data Science e Analytics – 2022
transação para todo o dataframe. Nas Figuras 1 e 2 tem-se um recorte com os dez maiores
valores obtidos.
Ao comparar as duas figuras nota-se que 5 transações aparecem em ambas, que são:
P065, Q07E, Q0C0, S121 e W16F. De certa forma é esperado que isso ocorra porque o uso
intenso da transação aciona um conjunto de programas para realizarem tarefas, que na
maioria das vezes, de forma equivalente, reflete no tempo dedicado de CPU para esses
programas. Por outro lado, o baixo uso de transações e alto consumo de CPU demonstra,
empiricamente, que os programas carregam uma lógica complexa e muitas vezes ineficiência
no uso dos recursos.
Para melhor apresentação da Figura 1 a os valores do desvio padrão foram divididos
por 1000.
9
Trabalho de Conclusão de Curso apresentado para obtenção do título
de especialista em Data Science e Analytics – 2022
10
Trabalho de Conclusão de Curso apresentado para obtenção do título
de especialista em Data Science e Analytics – 2022
11
Trabalho de Conclusão de Curso apresentado para obtenção do título
de especialista em Data Science e Analytics – 2022
12
Trabalho de Conclusão de Curso apresentado para obtenção do título
de especialista em Data Science e Analytics – 2022
13
Trabalho de Conclusão de Curso apresentado para obtenção do título
de especialista em Data Science e Analytics – 2022
O segundo modelo foi criado com a consolidação por transações a partir da soma das
variáveis originais, assim gerando novo dataframe, ainda, com 3 variáveis como mostrado na
Tabela 7.
14
Trabalho de Conclusão de Curso apresentado para obtenção do título
de especialista em Data Science e Analytics – 2022
15
Trabalho de Conclusão de Curso apresentado para obtenção do título
de especialista em Data Science e Analytics – 2022
evitasse gerar novos clusters com apenas uma observação. A Figura 9 traz a formação do
gráfico produzido pelo método Elbow e a quantidade de clusters escolhidos para cada cenário.
No cenário usando 4 variáveis foi escolhido 7 clusters como quantidade adequada e
no cenário com 3 variáveis o número de cluster escolhido foi 5. As Tabelas 9 e 10 apresentam
a configuração dos grupos nos cenários com 4 e 3 variáveis, respectivamente. Os resultados
apresentados nas tabelas são resultantes da média de cada variável.
Tabela 10. Distribuição de grupos no cenário com 3 variáveis e uso de Complete Linkage
Grupo Quantidade Número médio de Tempo médio de Consumo médio de
de transações resposta CPU
observações
unidade Segundo segundo
1 373 116290579 44603783 162611.1
2 7 841008479 196569983 4343972.9
3 3 5076463175 77154668 9920255.5
4 2 186099939 3772982553 399686.2
5 2 20276276110 723561479 3313920.3
Fonte: Resultados originais da pesquisa
16
Trabalho de Conclusão de Curso apresentado para obtenção do título
de especialista em Data Science e Analytics – 2022
Ao listar as transações dentro dos grupos menos adensados de cada cenário, nota-se
que muitas delas são também transações que apareceram entre os 10 maiores desvios
padrões de número chamadas (Figura 1) e tempo de CPU (Figura 2), bem como algumas das
que aparecem na lista dos 100 maiores picos de CPU (Tabela 4) e 100 maiores quantidade
de chamadas (Tabela 5).
A Tabela 11 identifica as 11 transações que compõem os grupos de 2 a 7 especificados
na Tabela 9. A Tabela 12 apresenta as 14 transações dos 4 grupos com menor quantidade
de observações divulgadas na Tabela 10.
Tabela 11. Transações nos grupos de 2 a 7 do cluster de 4 variáveis com Single Linkage
Transação Número de Tempo médio de Consumo médio Consumo médio Grupo
transações resposta de CPU por de CPU
transação
R110 2158 1725.294510530 17.04069250371 36773.8144 2
I051 6570 381.918507506 15.98752323486 105038.0277 2
R108 6578 7490.421255997 17.53289280602 115331.3689 2
Q0DD 38562 5942.227148630 12.69647967414 489601.6492 2
P065 4719869450 0.015538242 0.00191761124 9050874.7009 3
W16F 8665664842 0.007440134 0.00109466879 9486032.8870 3
M05E 1843855232 0.050791311 0.00608716923 11223858.8295 3
O063 43637 41176.746946289 0.00452115865 197.2898 4
R112 4263 1235.118469349 31.73329793103 135279.0491 5
S123 20566371351 0.046065849 0.00004333392 891221.4153 6
S124 19986180868 0.025003056 0.00028702929 5736619.2598 7
Fonte: Resultados originais da pesquisa
Tabela 12. Transações nos grupos de 2 a 5 do cluster de 3 variáveis com Complete Linkage
Transação Número de transações Tempo médio de Consumo médio de Grupo
resposta CPU
D00B 633860545 20231567 3141639.5 2
Z182 1435573830 174396470 3448950.5 2
Z17F 76940553 174244498 3676473.0 2
Q0ED 493142193 39445833 4493433.5 2
Q0C0 2093984721 387774222 4544306.3 2
W175 1030037866 61459925 4955013.2 2
Z17E 123519643 518437368 6147994.4 2
P065 4719869450 73338473 9050874.7 3
W16F 8665664842 64473708 9486032.9 3
M05E 1843855232 93651824 11223858.8 3
R111 371833947 4534919793 295967.7 4
S122 365931 3011045313 503404.8 4
S123 20566371351 947407363 891221.4 5
S124 19986180868 499715596 5736619.3 5
Fonte: Resultados originais da pesquisa
Da mesma maneira que foi realizada a verificação com cluster hierárquico, decidiu-se
pela criação de cluster não hierárquicos também, usando os mesmos dataframes com 3 e 4
variáveis, dados padronizados por Z-scores, medidas de distância euclidiana e sem a
remoção de outliers. Para tanto, adotou-se o procedimento k-means.
17
Trabalho de Conclusão de Curso apresentado para obtenção do título
de especialista em Data Science e Analytics – 2022
18
Trabalho de Conclusão de Curso apresentado para obtenção do título
de especialista em Data Science e Analytics – 2022
Assim como nos agrupamentos hierárquicos, acredita-se também aqui que os grupos
com menor homogeneidade interna, isto é, observações mais distantes dos centroides,
possam carregar mais características correlatas ao acesso robotizado.
A escolha do número de clusters permaneceu a mesma estratégia usada para os
clusters hierárquicos, evitando a criação de novos grupos com muitas observações e por isso
foi escolhido 4 clusters para ambos os cenários. A Figura 12 reproduz o gráfico gerado pelo
método Elbow e indica a quantidade de clusters escolhidos em cada cenário.
Tabela 13. Distribuição das observações nos cluster k-means para o cenário com 3 variáveis
Grupo Quantidade de Número médio de Tempo médio de Consumo médio de
observações transações resposta CPU
Unidade segundo Segundo
1 9 2275843148 176358036 6336326.4
2 367 109814096 16557309 168882.9
3 2 20276276110 723561479 3313920.3
4 9 453408130 2014097265 290544.7
Fonte: Resultados originais da pesquisa
19
Trabalho de Conclusão de Curso apresentado para obtenção do título
de especialista em Data Science e Analytics – 2022
Tabela 14. Distribuição das observações nos cluster k-means para o cenário com 4 variáveis
Grupo Quantidade Número médio de Tempo médio de Consumo médio Consumo médio
de transações resposta de CPU por de CPU
observações transação
Unidade Segundo Segundo Segundo
1 9 2275843147.8 0.77577364 0.0139056860 6336326.4
2 10 37255.9 10900.99823606 10.7321035301 177668.4
3 366 121262496.9 70.82712724 0.1574590662 171634.6
4 2 20276276109.5 0.03553445 0.0001651816 3313920.3
Fonte: Resultados originais da pesquisa
A identificação das transações dos três grupos com menos observações é detalhada
nas duas tabelas seguintes. A Tabela 15 informa as transações referente aos grupos da
Tabela 13 e a Tabela 16 lista as transações dos três menores grupos da Tabela 14.
20
Trabalho de Conclusão de Curso apresentado para obtenção do título
de especialista em Data Science e Analytics – 2022
21
Trabalho de Conclusão de Curso apresentado para obtenção do título
de especialista em Data Science e Analytics – 2022
fizeram que um mesmo número de transações provocasse maior consumo de CPU. Assim,
não foi obtida resposta plausível para o caso de transações que não estiveram sob acesso
robotizado no ano de 2021.
Diante desta resposta, criou-se as tabelas a seguir para facilitar a localização, no
escopo deste trabalho, onde as transações confirmadas com acesso robotizado, Z17E e
Q0C0, aparecem. A Tabela 17 lista as transações especificadas nos grupos de 2 a 7 do cluster
hierárquico de 4 variáveis (Tabela 11), nos grupos de 2 a 5 do cluster hierárquico de 3
variáveis (Tabela 12), nos grupos 1, 3 e 4 do cluster k-means com 3 variáveis (Tabela 15), e
nos grupos 1, 2 e 4 do cluster k-means com 4 variáveis (Tabela 16).
Tabela 17. Lista de transações propensas a acesso robotizado nos resultados dos clusters
produzidos
Tabela 11 Tabela 12 Tabela 15 Tabela 16
D00B
G02B G02B
G02C
G02E
G030 G030
I051 I051
M05E M05E M05E M05E
O063 O063 O063
P065 P065 P065 P065
Q0C0 Q0C0 Q0C0
Q0DD Q0DD
Q0E0
Q0ED Q0ED Q0ED
Q0F2
R108 R108
R110 R110
R111 R111
R112 R112
S122 S122
S123 S123 S123 S123
S124 S124 S124 S124
S136
T15C
W16F W16F W16F W16F
W175 W175 W175
Z17E Z17E Z17E
Z17F Z17F Z17F
Z182 Z182 Z182
Fonte: Resultados originais da pesquisa
22
Trabalho de Conclusão de Curso apresentado para obtenção do título
de especialista em Data Science e Analytics – 2022
quantidade de chamada de transação (Figura 1), e nos 10 maiores desvios padrões por tempo
de CPU (Figura 2).
Tabela 18. Lista de transações propensas a acesso robotizado nos resultados das análises
exploratórias iniciais
Tabela 4 Tabela 5 Figura 1 Figura 2
D009 D009 D009
E026
G035
M05E M05E
P065 P065 P065
Q098
Q0AC
Q0C0 Q0C0
Q0DD Q0DD
Q0FE
S121 S121 S121
S122 S122
S136
T149
T155
W168
W16F W16F W16F W16F
Z17E
Z182 Z182
Fonte: Resultados originais da pesquisa
Considerações Finais
Este trabalho partiu de uma base de dados de registro SMF do Mainframe com
característica temporal, poucas variáveis métricas, correlações não tão fortes entre essas
variáveis e aparentemente sem variáveis explicativas para tentar encontrar situações de
anomalias em registros históricos de transações de sistemas. Para tanto, utilizou-se técnicas
de análise de agrupamento para a formação de clusters hierárquicos e não hierárquicos,
porém de maneira não tão comum, ao evitar retiradas de outliers da base de dados analisada.
Isto serviu para que fossem formados grupos com poucas observações, na qual se acredita
que as primeiras formações de grupos de cluster contenham as principais sugestões de
transações que foram impactadas por acessos robotizados.
Embora este procedimento seja inconclusivo, dois casos reais de transações que
sofreram com acesso robotizado foram relatados pela empresa, e estas surgiram nos
resultados obtidos pelos clusters. Isto gera a expectativa que outras transações apontadas
nos clusters sejam também investigadas. Neste sentido, o uso de técnicas de análise de
agrupamento se mostrou relevante para selecionar os prováveis casos de acesso robotizado
e, assim, reduzir a quantidade de transações a serem melhor investigadas.
23
Trabalho de Conclusão de Curso apresentado para obtenção do título
de especialista em Data Science e Analytics – 2022
Agradecimento
Referências
Bollinger, T.; Eckert, A.; Wurst, M.; Blaha, C.; IBM Corporation. 2018. ibmdbR: IBM in-
Database Analytics for R. Disponível em: <https://cran.r-
project.org/web/packages/ibmdbR/index.html>. Acesso em: 17 abr. 2022.
Bornet, P.; Barkin, I.; Wirtz, J. 2020. Intelligent Automation: Learn how to harness Artificial
Intelligence to boost business & make our world more human. Independently Published.
Chapagain A. 2019. Hands-On Web Scraping with Python: Perform advanced scraping
operations using various Python libraries and tools such as Selenium, Regex, and others.
Packt Publishing, Birmingham, UK.
Cosimo, G.; Kuehner, L. 2018. ABCs of z/OS System Programming. v.2. IBM Redbooks,
Poughkeepsie, NY, USA. Disponível em:
<https://www.redbooks.ibm.com/abstracts/sg246982.html>. Acesso em: 23 jul. 2022.
Ebbers, M.; Kettner, J.; O'Brien, W.; Ogden, B. 2011. Introduction to the New Mainframe:
z/OS Basics. 3ed. IBM Redbooks, Poughkeepsie, NY, USA. Disponível em:
<https://www.redbooks.ibm.com/abstracts/sg246366.html>. Acesso em: 23 jul. 2022.
24
Trabalho de Conclusão de Curso apresentado para obtenção do título
de especialista em Data Science e Analytics – 2022
Ferreira, R.R.M.; Paim, F.A.P.; Rodrigues, V.G.S.; Castro, G.S.A. 2020. Análise de cluster
não supervisionado em R: agrupamento hierárquico. 1ed. Embrapa Territorial, Campinas,
SP, Brasil. Disponível em:
<http://www.infoteca.cnptia.embrapa.br/infoteca/handle/doc/1126478>. Acesso em: 10 set.
2022.
Gartner. 2022. Gartner Top Strategic Technology Trends for 2022. Disponível em:
<https://www.gartner.com/en/information-technology/insights/top-technology-trends>. Acesso
em: 17 abr. 2022.
International Business Machines Corporation [IBM]. 2011. z/OS 2.4: MVS System
Management Facilities (SMF). Disponível em: <https://www-
40.ibm.com/servers/resourcelink/svc00100.nsf/pages/zOSV2R4sa380667/$file/ieag200_v2r4
.pdf>. Acesso em: 23 jul. 2022.
International Business Machines Corporation [IBM]. 2015. CICS Transaction Server for z/OS
Version 5 Release 3: Performance Guide. Disponível em:
<https://publibfi.dhe.ibm.com/epubs/pdf/dfht3h00.pdf>. Acesso em: 23 jul. 2022.
Kyne, F.; Fischer, D.; Girona, J.M.; Klaey, W.; Lundgren, L. 2011. SMF Logstream Mode:
Optimizing the New Paradigm. 1ed. IBM Redbooks, Poughkeepsie, NY, USA. Disponível em:
<https://www.redbooks.ibm.com/abstracts/sg247919.html>. Acesso em: 23 jul. 2022.
Lacity, M.; Willcocks, L.P.; Craig, A. 2015. Robotic process automation at Telefónica O2. The
Outsourcing Unit Working Research Paper Series (15/02). Monografia. The London School
of Economics and Political Science, London, UK.
Mitchell R. 2019. Web scraping com Python. 2ed. Novatec, São Paulo, SP, Brasil.
Mullakara N.; Asokan A.k. 2020. Robotic Process Automation Projects: Build real-world RPA
solutions using UiPath and Automation Anywhere. Packt Publishing, Birmingham, UK.
Padilha, J. 2022. Algoritmos e métodos para extração de informação da web. p. 145-147. In:
Padilha, J.; Soares, J.A; Alves, N.S.R.; Abreu, E.M.; Silva, F.R.; Morais, M.S.F; Lacerda,
P.S.P; Maitino, N.R.; Machado, V.A. Analytics para big data. SAGAH, Porto Alegre, RS,
Brasil.
25
Trabalho de Conclusão de Curso apresentado para obtenção do título
de especialista em Data Science e Analytics – 2022
Rogers, P.; Salla, A. 2010. ABCs of z/OS System Programming. v.11. 2ed. IBM Redbooks,
Poughkeepsie, NY, USA. Disponível em:
<http://www.redbooks.ibm.com/abstracts/sg246327.html>. Acesso em: 23 jul. 2022.
Taulli T. 2022. Modern Mainframe Development. 1ed. O'Reilly Media, Sebastopol, CA, USA.
26