Escolar Documentos
Profissional Documentos
Cultura Documentos
SISTEMAS DE INFORMAÇÕES
GERENCIAIS – SIG
AULA 5
https://univirtus.uninter.com/ava/web/roa/ 1/22
22/05/2022 16:06 UNINTER
CONVERSA INICIAL
segundo o IDC
(S.d.). O mercado mundial de software para Big Data representou em torno
de 11,9%
do mercado mundial total de software até 2019 e já tem uma previsão de
crescer 2,5 pontos
da informação e comunicações).
As análises e insights da IDC alavancam o trabalho de planejamento
e
previsões dos executivos de negócios, profissionais de TI e investidores. Desde
os anos 1964 atua
drones, análises
preditivas, prescritivas em dados híbridos, entre outros elementos que criem um
como
características principais a abordagem dos 3 V’s: velocidade, volume e
variedade.
gerarmos resultados
que possibilitem organizações estarem à frente de seus concorrentes e de si
https://univirtus.uninter.com/ava/web/roa/ 2/22
22/05/2022 16:06 UNINTER
utilizado no marketing.
Inicialmente, o Big Data era usado para descrever imensos volumes de
dados
analisados por grandes corporações como por exemplo a Google ou projetos
científicos da Nasa.
diferentes lugares e em
diferentes formatos. Dados estruturados e não estruturados, provenientes de
(Sharda, 2019).
olhos dos
sistemas de informações gerenciais (Isaacson, 2015).
https://univirtus.uninter.com/ava/web/roa/ 3/22
22/05/2022 16:06 UNINTER
aplicativos algo
desafiador. Dentro de um conjunto grande de dados, o que precisamos encontra-se
ativos no Facebook,
que, inclusive, é a empresa que se destaca no desenvolvimento e adoção de Big
300 milhões de usuários. Como se não bastassem as mídias sociais, também temos
a população que
2015).
dados e
mais dados, o que se configura numa abundância de categorias, incluindo
aplicativos de
sistemas gerenciadores de
bancos de dados relacionais e seus sistemas transacionais. Por muitos
https://univirtus.uninter.com/ava/web/roa/ 4/22
22/05/2022 16:06 UNINTER
anos,
foram as arquiteturas de extração, transformação e carregamento (ETL) que
fizeram todo o
Fonte Alguns
Exemplos
Perfis de
redes
LinkedIn,
Facebook, Twitter, Instagram
sociais
Influenciadores
Pessoas que possuem
conhecimento sobre determinada área e influenciam seguidores
sociais
Arquivos
de logs (IoT), Informações de rastreamento de websites, logs de aplicativos,
dados enviados
Dados
gerados
por sensores (check-ins e rastreamento de localização –
geolocalização), jogos, eletrodomésticos
por atividade
inteligentes, dados gerados dentro
veículos por processadores empacotados.
SaaS e aplicativos
Dropbox,
Google Drive, Google Analytics, Netflix, Paypal
na
nuvem
Informação
Mídias
sociais, informações do governo, informações de empresas de capital aberto
pública da web
Resultados de
Sumarização de fontes
com volumes enormes de dados
MapReduce
Dispositivos
de
Todo
ambiente de Data Warehouse instalado com dados provenientes dos
sistemas transacionais
data warehouse
Bancos de dados
NoSQL
https://univirtus.uninter.com/ava/web/roa/ 5/22
22/05/2022 16:06 UNINTER
Tecnologias
de SolarWinds,
Datadog, Atera
monitoramento
de rede e in-
stream
Documentos
e-mails, intranet,
gerenciadores de conteúdos, wikis
legados
sejam implementados.
Por isso precisarmos de tantos profissionais especializados e ferramentas,
superestimadas.
Quando vamos realmente conhecer a realidade que se estabelece é sempre de um
caminho de experimentos e melhorias até que o produto realmente fique como
prometido. Com o
aumentando,
ela vai crescendo juntamente, sem interrupções. Imaginemos se uma mídia social,
no
momento em que você vai criar um perfil ou incluir qualquer elemento,
enviasse uma mensagem de
qual poderia
até abandonar a ideia de utilização da plataforma (Isaacson, 2015).
em Big
Data. Quem está implementando-o deixa a administração de toda
infraestrutura por conta de
centros de dados, os quais focam em grandes
servidores, comunicação, gerenciamento e
https://univirtus.uninter.com/ava/web/roa/ 6/22
22/05/2022 16:06 UNINTER
exponencial.
escalonamento adequado
precisamos inicialmente compreender qual é o ponto de estrangulamento
de nossa
aplicação. Isso é muito importante porque a escolha errada gerará um
dimensionamento
pontuar cada um
dos elementos importantes a serem analisados:
1.
Uso de CPU implica diretamente o desempenho do aplicativo, porém é o problema
mais
2.
Espera de entrada e saída pode estar relacionada a algum problema de memória
insuficiente,
3.
Alto uso de disco é um indicador importante que aponta para a necessidade de
escalabilidade,
o que significa que será necessário então melhorar o desempenho
de acesso.
de
banco de dados. É nela que podemos armazenar gigabytes a terabytes,
ou até petabytes. Este é o
ponto principal: acomodar grandes conjuntos
de dados surportando uma variedade de alto volume
de necessidades de um
aplicativo (Isaacson, 2015).
chegam
ao Hadoop numa forma de arquivos de logo de um servidor Apache.
Na sequência, o Hadoop
MapReduce é aplicado aos logs para
localização de informações úteis. E, no caso do uso de Hadoop,
as
entradas de dados não são provenientes de UI (User Interfaces), mas de
outros sistemas ou fontes
automatizadas. Essa abordagem é totalmente centrada
em processamento de lote, que pode durar
https://univirtus.uninter.com/ava/web/roa/ 7/22
22/05/2022 16:06 UNINTER
complexidade da solicitação.
implementação deste. É um
assunto vasto e que exige maior aprofundamento em conteúdos
relacionados
especialmente a serviços de computação em nuvem.
Algumas
técnicas que são utilizadas na implementação de um Big Data:
1.
Análise quantitativa: técnica de análise de dados que se concentra
na quantificação de
padrões e correlações encontrados nos dados. Baseada em
práticas estatísticas, envolve a análise de
2.
Análise qualitativa: técnica de análise de dados baseada em
descritivos e envolve a análise
3.
Mineração de dados: Data Mining é uma forma
especializada de análise de grandes
conjuntos de dados e constituída de
técnicas automatizadas que vasculham conjuntos massivos para
identificação de
padrões e tendências;
https://univirtus.uninter.com/ava/web/roa/ 8/22
22/05/2022 16:06 UNINTER
4.
Análise estatística: usa métodos estatísticos baseados em fórmulas
matemáticas como meio
de análise de dados. Geralmente quantitativa, mas pode
ser qualitativa. Descreve conjuntos de dados
5.
Aprendizagem de máquina (Machine Learning): os
seres humanos são bons em detectar
padrões e relacionamentos de dados, mas não
conseguimos fazer isso para um volume gigantesco
filtragem;
6.
Análise semântica: para que as máquinas extraiam informações
valiosas, os dados de texto e
fala precisam ser compreendidos pelas máquinas da
mesma forma que os humanos. Para isso, a
7.
Análise visual: com base na premissa de que seres humanos
entendem e tiram conclusões
sobre representações gráficas mais rapidamente do
que textos, a análise visual atua como uma
ferramenta de descoberta na área de Big
Data. Tipos de análise visual: mapas de calor, gráficos de
séries
temporais, gráficos de rede e mapeamento de dados espaciais.
Segundo
Dietrich (2015), o ciclo de vida de um Big Data baseia-se em métodos
estabelecidos no
estabelecidos dentro de
um domínio de análise de dados e ciência da decisão. Esse processo inclui
https://univirtus.uninter.com/ava/web/roa/ 9/22
22/05/2022 16:06 UNINTER
testarem as ideias.
Um
desses métodos é o CRISP-DM (Cross Industry Standard Process for Data Mining),
que é um
padrão inter-indústrias para mineração de dados. Ele descreve várias
abordagens de mineração de
de decisão,
calibração de estimativas de especialistas, além de derivação do valor esperado
de
informações.
https://univirtus.uninter.com/ava/web/roa/ 10/22
22/05/2022 16:06 UNINTER
Para a
fase 2 é necessária uma sandbox analítica, na qual a equipe trabalha os
dados e realiza
sandbox. Inicialmente os
dados são transformados para que a equipe possa trabalhar com a análise
dos
dados, bem como para se familiarizarem completamente com os dados para o
condicionamento
dos dados. A Figura 3 aponta o momento da preparação dos dados.
https://univirtus.uninter.com/ava/web/roa/ 11/22
22/05/2022 16:06 UNINTER
Para
a fase 3, planejamento do modelo, conforme a figura 4, a equipe de trabalho
define quais
relações e variáveis,
selecionando quais são as variáveis-chave e modelos mais adequados para
serem
aplicados.
https://univirtus.uninter.com/ava/web/roa/ 12/22
22/05/2022 16:06 UNINTER
A
fase 4, conforme a Figura 5, é o momento em que a equipe desenvolve conjuntos
de dados
para testes, treinamento e produção. Ainda nessa fase, a equipe
constrói e executa modelos com
modelos e fluxos de
trabalho, por exemplo, um hardware com processamento paralelo.
A
comunicação dos resultados (fase 5, conforme Figura 6) é responsabilidade da
equipe em
colaboração com os principais stakeholders (partes
interessadas). Nessa fase, com base em todos os
sucesso ou
uma falha. Além disso, é nesse momento em que são identificadas as principais
https://univirtus.uninter.com/ava/web/roa/ 13/22
22/05/2022 16:06 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 14/22
22/05/2022 16:06 UNINTER
fundamental que se
enquadrem esses resultados de forma adaptada ao público junto com a equipe
de
implantação. Ao enquadrar os resultados de trabalho, a equipe demonstrará de
forma clara os
Segundo Julio
(2010), usos de aplicações Big Data consistem nos seguintes segmentos:
prediction);
dados analíticos gerados por máquina (remote device insight, remote sensing, location-based
intelligence); e
https://univirtus.uninter.com/ava/web/roa/ 15/22
22/05/2022 16:06 UNINTER
Mercado Finalidade
• Desempenho de rede;
• CRM
• Detecção de fraude;
• Combate à criminalidade;
Público
• Detenção de ameaças;
• Cybersecurity.
• Detecção de fraude;
• Vigilância comercial;
Bancos
• Conformidade e regulamentação;
• CRM.
• Variedade localizada;
Varejo
• Gestão da cadeia de abastecimento;
https://univirtus.uninter.com/ava/web/roa/ 16/22
22/05/2022 16:06 UNINTER
• Reivindicações de fraude;
• Gestão de reputação;
• CRM.
globalizado acelera
o planejamento e interesse em implantação de projetos de Big Data.
Normalmente, empresas que já ingressaram no mundo do BI, especialmente com base
no Data
oportunidade de criação de
novos produtos ou serviços inovadores.
extremamente importante
para a implantação deste é justamente a socialização das informações. A
https://univirtus.uninter.com/ava/web/roa/ 17/22
22/05/2022 16:06 UNINTER
encontrar,
reunir e analisar dados e posteriormente construir modelos. No entanto, quando
chega o
momento de compartilhar os dados, faltam-lhes habilidades para contar
histórias com base nos
1.
Entender o contexto;
2.
Escolher uma exibição apropriada;
3.
Eliminar a desordem;
4.
Concentrar a atenção no que desejamos;
5.
Pensar como um designer;
6.
Contar uma história.
A compreensão
deve ser robusta para reduzir as iterações no caminho antes da criação do
conteúdo
visual.
linha,
um gráfico de barra vertical, um gráfico de barra vertical empilhado, um
gráfico em cascata, um
https://univirtus.uninter.com/ava/web/roa/ 18/22
22/05/2022 16:06 UNINTER
fazem
parte de um design inteligente.
atenção do nosso
público para o local que desejamos, a fim de comunicarmos da maneira que
estética, recorrendo a uma série de conceitos vistos até aqui. Cores, espessura
das linhas, tamanho
https://univirtus.uninter.com/ava/web/roa/ 19/22
22/05/2022 16:06 UNINTER
Devemos cobrir
estratégias para uma narrativa eficaz, incluindo o poder da repetição, fluxo
narrativo,
considerações com narrativas faladas e escritas e várias táticas que
garantam a qualidade do trabalho
arte. Há componentes
científicos importantíssimos para a construção das imagens, porém deve haver
um
componente artístico para abrir o caminho do entendimento do público.
FINALIZANDO
implementações para
funcionamento. A competitividade global faz com que as empresas busquem
cada
vez mais sofisticação em seus sistemas computacionais buscando maior agilidade
diante do
volume de dados que se agigantam em seus repositórios de dados
estruturados e não estruturados.
decisão a
poucos cliques dos executivos das empresas. Essa capacidade deverá levar a
empresa a
tomada de decisões.
necessita priorizar um
método de trabalho com processos bem definidos. Um pouco diferente do
projeto
de desenvolvimento de aplicativos e sistemas mais simples, o início do processo
dá-se por
https://univirtus.uninter.com/ava/web/roa/ 20/22
22/05/2022 16:06 UNINTER
anteriores.
profissionais altamente
qualificados, a visualização dos dados não é o momento menos importante.
Pelo
contrário, é o momento no qual cientistas e engenheiros envolvidos no processo
precisam
contar uma história da preciosidade de tais conhecimentos que
conseguiram gerar. Serão não apenas
como se
chegou a essas informações incríveis.
REFERÊNCIAS
DIETRICH,
D. et al. Data science and big data analytics: discovering, analyzing,
visualizing and
presenting data. Boston, EUA: O’Reilly Media, Inc. EMC
Education, 2015.
ISAACSON,
C. Understanding Big Data scalability. Boston, USA: Prentice Hall Pearson
Education, Inc.; O’Reilly Media, Inc., 2015. Big data Scalability Series, Part
I.
Disponível em:
<https://solutionsreview.com/data-integration/hello-world/>. Acesso em: 5
mar. 2021.
KNAFLIC,
C. N. Storytelling with data: a data visualization guide for business
professionals. New
Bookman, 2019.
https://univirtus.uninter.com/ava/web/roa/ 21/22
22/05/2022 16:06 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 22/22