Escolar Documentos
Profissional Documentos
Cultura Documentos
Indaial – 2019
1a Edição
2019
Elaboração:
Prof. Barbieri Gonçalves
a
Conteúdo produzido
Copyright © Sagah Educação S.A.
Impresso por:
Apresentação
Prezado acadêmico!
Por fim, ressalto que mesmo sendo uma área muito ampla, o Caderno
de Estudos lhe oferece um início sólido e consistente sobre o tema. Desejo a
você uma excelente experiência nos estudos dos conteúdos dessa disciplina!
III
NOTA
Você já me conhece das outras disciplinas? Não? É calouro? Enfim, tanto para
você que está chegando agora à UNIASSELVI quanto para você que já é veterano, há
novidades em nosso material.
O conteúdo continua na íntegra, mas a estrutura interna foi aperfeiçoada com nova
diagramação no texto, aproveitando ao máximo o espaço da página, o que também
contribui para diminuir a extração de árvores para produção de folhas de papel, por exemplo.
Eu mesmo, UNI, ganhei um novo layout, você me verá frequentemente e surgirei para
apresentar dicas de vídeos e outras fontes de conhecimento que complementam o assunto
em questão.
Todos esses ajustes foram pensados a partir de relatos que recebemos nas pesquisas
institucionais sobre os materiais impressos, para que você, nossa maior prioridade, possa
continuar seus estudos com um material de qualidade.
Bons estudos!
IV
V
LEMBRETE
Acesse o QR Code, que te levará ao AVA, e veja as novidades que preparamos para teu estudo.
VI
Sumário
UNIDADE 1 - FUNDAMENTOS DE BIG DATA.................................................................................1
VII
UNIDADE 2 - INFRAESTRUTURAS PARA PROCESSAMENTO
DE BIG DATA, ARMAZENAMENTO, SUPORTE A TEMPO
REAL E DESAFIOS NA GERÊNCIA DE BIG DATA.............................................57
VIII
TÓPICO 5 - INOVAÇÃO E DESIGN THINKING.............................................................................117
1 INTRODUÇÃO....................................................................................................................................117
2 INOVAÇÃO E DESIGN THINKING................................................................................................117
3 INOVAÇÃO COMO PROCESSO CENTRAL NOS NEGÓCIOS..............................................120
4 INOVANDO COM DESIGN THINKING........................................................................................122
5 DESIGN THINKING............................................................................................................................124
6 O QUE É DESIGN THINKING?.........................................................................................................124
7 FASES DO DESIGN THINKING.......................................................................................................127
7.1 EMPATIA.........................................................................................................................................129
7.2 DEFINIÇÃO.....................................................................................................................................129
7.3 IDEAÇÃO........................................................................................................................................129
7.4 PROTOTIPAÇÃO...........................................................................................................................130
7.5 TESTE................................................................................................................................................130
8 ONDE ESTÁ O DESIGN THINKING?.............................................................................................131
9 DESIGN THINKING: IDEAÇÃO......................................................................................................134
10 DESIGN THINKING: O QUE É IDEAÇÃO.................................................................................135
11 A IDEAÇÃO NO REFINO DO PROBLEMA EM UM PROCESSO
DE DESIGN THINKING...................................................................................................................137
12 DESIGN THINKING: INTERAÇÕES ENTRE A IDEAÇÃO
E A SOLUÇÃO DO PROBLEMA....................................................................................................139
13 DESIGN THINKING: COMPREENSÃO DO PROBLEMA........................................................141
14 DESIGN THINKING: COMO COMPREENDER O PROBLEMA.............................................141
15 EMPATIA NO PROCESSO DE DESIGN THINKING.................................................................142
16 DESIGN THINKING: FERRAMENTAS DA ETAPA DE IMERSÃO........................................145
17 DESIGN THINKING: PROTOTIPAGEM E TESTAGEM...........................................................148
18 PROTOTIPAGEM NO DESIGN THINKING...............................................................................148
19 O PROTÓTIPO NOS PROJETOS DE INOVAÇÃO...................................................................150
20 A VALIDAÇÃO NA PROTOTIPAGEM E NA TESTAGEM.....................................................152
RESUMO DO TÓPICO 5......................................................................................................................155
AUTOATIVIDADE................................................................................................................................157
IX
TÓPICO 3 - UTILIZAR TÉCNICAS DE DATA MINING................................................................179
1 INTRODUÇÃO....................................................................................................................................179
2 IDENTIFICAÇÃO DAS TÉCNICAS DE DATA MINING............................................................179
2.1 MINERAÇÃO POR GRUPO DE ASSOCIAÇÃO.......................................................................180
2.2 MINERAÇÃO POR CLASSIFICAÇÃO.......................................................................................180
2.3 MINERAÇÃO POR CLUSTERING..............................................................................................181
2.3 MINERAÇÃO POR ÁRVORES DE DECISÃO...........................................................................181
2.4 MINERAÇÃO POR PADRÕES SEQUENCIAIS........................................................................182
3 A LÓGICA PARA A MINERAÇÃO DE DADOS..........................................................................182
4 APLICAÇÃO E SINTAXE DE CONSULTAS DE MINERAÇÃO...............................................183
RESUMO DO TÓPICO 3......................................................................................................................186
AUTOATIVIDADE................................................................................................................................187
REFERÊNCIAS........................................................................................................................................249
X
UNIDADE 1
OBJETIVOS DE APRENDIZAGEM
A partir do estudo desta unidade, você deverá ser capaz de:
PLANO DE ESTUDOS
Esta unidade está dividida em cinco tópicos. No decorrer da unidade
você encontrará autoatividades com o objetivo de reforçar o conteúdo
apresentado.
CHAMADA
1
2
UNIDADE 1
TÓPICO 1
1 INTRODUÇÃO
Você sabia que, ao acessarmos praticamente qualquer dispositivo
eletrônico, estamos, de certa forma, inserindo nossos dados e, com o tempo, os
dispositivos acabam guardando esses dados, gerando diversas informações sobre
nós? Estamos vivendo na era da informação.
2 CIÊNCIA DE DADOS
Uma das necessidades explícitas da sociedade atual é aprender a lidar
com a tecnologia. Apesar de isso transparecer como algo natural, na verdade, não
o é, tendo em vista que, com o passar dos tempos, a própria tecnologia foi sendo
moldada para atender à alta demanda social.
Mas o que são esses dados? Antes de tudo, é importante destacar que um
dado sem uma informação não tem sentido. Dados podem ser exemplificados
como números em uma planilha: quando adicionamos um contexto a eles,
estamos gerando informações (como colocar, ao lado dos números, nomes de
produtos ou legendas, como datas, valores, dentre outros).
3
UNIDADE 1 | FUNDAMENTOS DE BIG DATA
Por falar nisso, você já parou para prestar atenção na quantidade de dados
que você mesmo gera na rede? Comece olhando sua caixa de e-mail: são muitas
informações! Você também já fez alguma pesquisa sobre algo, um produto, uma
dúvida ou serviço e, quando acessou suas redes sociais ou e-mail, deparou-se com
promoções e dicas sobre o assunto de sua busca? Então, as empresas, em conjunto
com as ferramentas tecnológicas, possuem diversos meios de obter informações
de você, mesmo que de forma “discreta”.
DICAS
4
TÓPICO 1 | INTRODUÇÃO À CIÊNCIA DE DADOS
Ciência
de dados
Software Pesquisa
tradicional tradicional
Especialização
científica
5
UNIDADE 1 | FUNDAMENTOS DE BIG DATA
De acordo com Provost e Fawcett (2016) (Figura 2), a ciência de dados (ou data
science) se insere no contexto de diversos outros processos intimamente associados
e relacionados com dados na organização e se distingue de outros aspectos do
processamento de dados que estão ganhando cada vez mais atenção nos negócios.
Tomada de decisão
orientada por dados
(na empresa)
DOD automatizada
Data science
Engenharia e processamento
de dados
(incluindo tecnologias "Big Data")
6
TÓPICO 1 | INTRODUÇÃO À CIÊNCIA DE DADOS
DICAS
• Big Data: está associado ao grande volume de dados que é processado por ferramen-
tas específicas, já que ferramentas tradicionais, como planilhas e anotações vagas, não
possuem suporte suficiente e eficaz para processá-las. Podemos associar esse concei-
to a volume, velocidade de atualização e variedade dos formatos.
7
UNIDADE 1 | FUNDAMENTOS DE BIG DATA
ATENCAO
8
TÓPICO 1 | INTRODUÇÃO À CIÊNCIA DE DADOS
FONTE: O autor
O nome data scientist ou cientista de dados foi utilizado pela primeira vez
em 2008 e pode ser definido como um profissional de alto nível de formação, com
curiosidade de fazer descobertas no mundo de Big Data: “[...] um cientista de
dados é alguém que é curioso, que analisa os dados para detectar tendências”,
disse, recentemente, Anuul Bhambhri, vice-presidente de produtos Big Data da
IBM. “É quase como um indivíduo renascentista, que realmente quer aprender e
trazer a mudança para uma organização” (TAURION, 2013).
UNI
Acesse o link a seguir para obter mais informações sobre o cientista de dados.
https://goo.gl/2PHZqk
NTE
INTERESSA
9
RESUMO DO TÓPICO 1
Nesse tópico você aprendeu:
10
11
AUTOATIVIDADE
12
c) ( ) Geralmente o ciclo se inicia com o refinamento dos dados, do qual o
processamento de dados é parte integrante, para que posteriormente
possam ser analisados de forma manual e auxiliar na tomada de
decisão das empresas.
d) ( ) A ciência dos dados é empregada no tratamento dos dados gerados
após a tomada de decisão, dando-lhes forma e empregabilidade
necessária para uso.
e) ( ) A tomada de decisão orientada a dados tem início com o uso de
tecnologias big data, para que posteriormente a ciência dos dados
determine todas as tomadas de decisões.
14
UNIDADE 1
TÓPICO 2
1 INTRODUÇÃO
As informações e os dados nunca foram tão acessíveis quanto o são hoje
em dia. Por meio da internet, conseguimos saber basicamente de tudo que ocorre
na nossa localidade e no mundo. A cada ação nossa, provavelmente, muitos dados
estão sendo gerados para as empresas responsáveis pelos artefatos e serviços
tecnológicos de que fazemos uso.
2 DADOS E DATASETS
Você já parou para pensar na quantidade de observações que estamos
sempre fazendo em tudo que está ao nosso redor? O ser humano, devido a sua
racionalidade, consegue lidar com interpretar e associar diversos acontecimentos
quase que simultaneamente. E essa não é uma característica desenvolvida apenas
quando somos adultos. Se você entrar em uma loja de brinquedos com uma
criança, você compreenderá melhor o que estamos falando, já que as primeiras
reações quase sempre serão as de as escolhas serem realizadas com base em alguns
padrões já preestabelecidos pela criança. Mas você pode estar se questionando
sobre o que isso tem a ver com dados e datasets, não é?
15
UNIDADE 1 | FUNDAMENTOS DE BIG DATA
A definição mais básica de um dado é sabermos que, se estiver só, ele não
faz sentido, de modo que deve haver informações sobre ele, ou seja, complementos
informacionais e até mesmo contextos, para que ele tenha sentido e possa gerar
algum conhecimento.
Mas e dataset, o que seria? Em sua tradução livre, o termo significa conjunto
de dados. Mencionamos que as informações são um coleção de dados e, dentro
desse contexto, é relevante notar que o contexto científico exige que visualizemos
níveis mais profundos dos processos dedutivos e intuitivos de observação para
que possamos registrá-los com precisão. Uma maneira de fazer isso é construir
um conjunto de dados, os quais são apresentados de várias formas. Em sua grande
maioria, os dados são representados por meio de planilhas, podendo conter
diversas linhas ou colunas, e não necessariamente precisam assumir aquela ideia
que temos de planilhas desenvolvidas em alguns softwares específicos.
ATENCAO
• Informação: fornece significado para o dado, pois pode ser definida como um dado
contextualizado.
16
TÓPICO 2 | CIÊNCIA DE DADOS E BIG DATA
• Conhecimento: pode receber diversas definições diferentes, mas, dentro desse contexto,
o conhecimento pode ser definido como uma experiência ou até mesmo aprendizado
obtido devido à organização e à contextualização dos dados e das informações.
17
UNIDADE 1 | FUNDAMENTOS DE BIG DATA
• Princípio da redução do valor de dados. Uma análise dos dados em seu ciclo
de vida mantém a atenção em como o valor dos dados pode diminuir de acordo
com o seu envelhecimento. Assim, o dado tem mais valor quanto mais recente
for. A maioria das organizações não pode operar no má imo de seu desempenho
tendo pontos cegos, isto é, falta de dados disponíveis, de 30 dias ou mais.
• Princípio do uso de dados 90/90. Uma atuação em tempo real ou quase em
tempo real sobre dados operacionais pode trazer vantagens importantes. De
acordo com esse princípio, a maioria dos dados armazenados raramente é
acessada após 90 dias (exceto para fins de auditoria). Ou seja, os dados perdem
grande parte de seu valor após três meses.
• Princípio de dados em contexto. Para capturar, processar, formatar e distribuir
dados rapidamente e quase em tempo real, é necessário um grande investimento
em infraestrutura de gerenciamento de dados para fazer a ligação remota dos
sistemas presentes nos pontos de venda (PDVs) para armazenamento de dados,
sistemas de análise de dados e aplicativos que geram relatórios. Esse investimento
se justifica de acordo com o princípio de que dados devem estar integrados, ser
processados, analisados e formatados em “informação acessível”. Os usuários
finais precisam visualizar os dados em um formato significativo e em contextos,
já que eles irão guiar suas decisões e seus planejamentos.
Mas e como tudo isso acontece? Para isso, são utilizadas tecnologias, como
mencionamos anteriormente, e uma delas que podemos destacar aqui é Big Data.
Como o próprio termo já sugere, isso significa lidar com uma grande quantidade
de dados diversos (estruturados ou não estruturados).
ATENCAO
Os dados não estruturados são aqueles dados cujo contexto total nem sempre
a tecnologia consegue visualizar, por exemplo, em arquivos textuais.
Já os dados estruturados conseguem ser totalmente classificados e identificados com o
uso das tecnologias.
18
TÓPICO 2 | CIÊNCIA DE DADOS E BIG DATA
19
UNIDADE 1 | FUNDAMENTOS DE BIG DATA
DICAS
20
RESUMO DO TÓPICO 2
Nesse tópico você aprendeu:
21
22
AUTOATIVIDADE
a) ( ) Por meio de ligações realizadas pelos call centers das empresas para
seus clientes.
b) ( ) Por meio de correspondências.
c) ( ) Por meio de preenchimento de formulários em planilhas.
d) ( ) Por meio de abordagens pessoais em centros comerciais.
e) ( ) Por meio de aplicações de terceiros, identificação de dispositivo, perfil
do usuário.
23
4 A obtenção dos dados ocorre por meio de diversas fontes: e-mails, redes
sociais, smartphones, tablets, entre outros. Dessa forma, com o passar do
tempo, recursos computacionais se tornaram necessários para que tudo
isso possa ser aproveitado pelo mundo corporativo. Assinale a alternativa
que apresenta os passos percorridos pelo dado durante seu uso na tomada
de decisões corporativas.
24
UNIDADE 1
TÓPICO 3
1 INTRODUÇÃO
Os grandes conjuntos de dados (Big Data) gerados pelas pessoas e empresas
diariamente possuem um potencial de melhorias em diversos segmentos de negócios.
Entretanto, a evolução das técnicas de análise é o gargalo que impede tomadas de
decisões mais eficazes para os negócios. O processo de descoberta do conhecimento
é uma abordagem que sistematiza em etapas a realização dessas análises.
25
UNIDADE 1 | FUNDAMENTOS DE BIG DATA
ATENCAO
26
TÓPICO 3 | DESCOBERTA DE CONHECIMENTO COM BIG DATA
3.2 SELEÇÃO
Nesse caso, foram selecionadas as bases de dados que fornecem dados de
1ª instância, que possuem como característica principal a descentralização dos
dados em bancos de dados divididos por comarca, totalizando 80 bases de dados.
Os dados dessas comarcas foram replicados on-line e centralizados em uma única
base de dados. A Figura a seguir apresenta o modelo lógico de dados utilizados
para compreensão do domínio explorado.
27
UNIDADE 1 | FUNDAMENTOS DE BIG DATA
3.3 PRÉ-PROCESSAMENTO
Na etapa de pré-processamento, foi realizada uma limpeza na base de dados
com o objetivo de trabalhar apenas com dados consistentes. Processos que estavam
considerados como baixados, mas que estavam sem data de baixa, e processos nos
quais foram identificados erros de digitação nas datas foram encaminhados para os
responsáveis para correção e posterior reinserção na base de dados.
3.4 TRANSFORMAÇÃO
Para encaminhar a próxima etapa do KDD, que é a mineração, foram
construídos alguns campos na base de dados. Entre eles, podemos citar o campo
que realiza o cálculo do tempo de tramitação de cada processo (diferença entre
a data da baixa e a data de abertura) e a idade do réu, calculada a partir da sua
idade. Além disso, foram realizadas algumas adequações nos formatos dos dados
de alguns campos, a fim de fornecer os dados num padrão de entrada adequado
para a mineração dos dados na etapa seguinte.
28
TÓPICO 3 | DESCOBERTA DE CONHECIMENTO COM BIG DATA
UNI
https://goo.gl/CGCnt9
29
UNIDADE 1 | FUNDAMENTOS DE BIG DATA
UNI
https://goo.gl/o5fG
Acesse, no link a seguir, o site da rede Sermo, em que os médicos podem trocar
experiências do seu dia a dia — nesse caso, compartilhando casos reais de tratamentos
aplicados aos seus pacientes.
https://goo.gl/KFbJm
30
TÓPICO 3 | DESCOBERTA DE CONHECIMENTO COM BIG DATA
31
RESUMO DO TÓPICO 3
Nesse tópico você aprendeu:
• Descrever o processo de descoberta de conhecimento em Big Data.
• Aplicar o processo de descoberta de conhecimento em Big Data.
• Listar exemplos bem-sucedidos com Big Data.
• Que O processo KDD é constituído de várias etapas, que são executadas de
forma interativa e iterativa. São interativas porque envolvem a cooperação da
pessoa responsável pela análise de dados, cujo conhecimento sobre o domínio
orientará a execução do processo.
• Por sua vez, a iteração deve-se ao fato de que, com frequência, esse processo não
é executado de forma sequencial, mas envolve repetidas seleções de parâmetros
e conjuntos de dados, aplicações das técnicas de Data Mining e posterior análise
dos resultados obtidos, a fim de refinar os conhecimentos extraídos.
• O que traz o Infográfico, que apresenta e descreve as etapas do processo de
descoberta do conhecimento.
32
AUTOATIVIDADE
33
e) ( ) 1- Seleção; 2- Pré-processamento; 3- Transformação; 4-Mineração de
dados; e 5- Interpretação e avaliação.
34
UNIDADE 1
TÓPICO 4
1 INTRODUÇÃO
A era tecnológica possui como característica forte os dados, que são gerados
pelos diversos contextos sociais. Esse movimento trouxe diversas possibilidades
na descoberta de novos valores tanto aos produtos quanto aos serviços oferecidos
pelas grandes corporações. É nesse ponto que a ciência de dados se relaciona com
outras tecnologias, como a Business Intelligence (BI).
35
UNIDADE 1 | FUNDAMENTOS DE BIG DATA
ATENCAO
Enquanto as análises realizadas por tecnologias Big Data, ou seja, que lidam
com grandes volumes de dados, norteiam as empresas diante de novos desafios por meio
da estruturação dos dados, a Business Intelligence traz a interpretação dessas informações
presentes nos processos empresariais, contribuindo para a formulação de novos cenários.
36
TÓPICO 4 | APLICAÇÕES DA CIÊNCIA DE DADOS
Existem diversos exemplos que podem ser citados, porém, é interessante que
você compreenda como a ciência de dados pode ser aplicada em alguns contextos
corporativos diversos. Por exemplo, o contexto do e-commerce tem grande atuação
na busca pela fidelização dos clientes; dessa forma, por meio da disponibilização
de serviços personalizados e de recomendação, as empresas conseguem atender
e atingir as particularidades dos clientes. Um exemplo prático disso é quando
realizamos alguma busca: você já notou que, posteriormente, o produto ou algo
relacionado ao que pesquisamos começa a surgir em nossas redes sociais, sites,
e-mails? Então, por meio de metadados e outros recursos contidos nos sites que
acessamos, as empresas acabam tendo uma fonte de dados para atuar com essa
forma de abordagem. Desse modo, conseguem aplicar ações de marketing digital.
As redes sociais são campos ricos de dados: nelas, as empresas, por meio
das autorizações que nós mesmos acabamos dando, criam perfis de usuários,
particularmente e por grupos, para contribuir com a atuação mais presente na
detecção de padrões, comportamento e até mesmo análises de sentimentos do
usuário. Hoje, podemos acessar nossos computadores, tablets ou smarthphones
por meio de reconhecimento facial, biometria, dentre outros.
37
UNIDADE 1 | FUNDAMENTOS DE BIG DATA
Para colocar tudo isso em prática, a empresa teve que se certificar de que
todos os dados eram reais para que, posteriormente, aplicasse o cruzamento dos
dados de predição de vendas, que só ocorreu devido a técnicas específicas de
análise. Com isso, todos os históricos de transações e identificação de tendências
de vendas de produtos foram detectados, conforme suas respectivas regiões, ou
seja, trouxeram as características particulares para cada loja, tendo como resultado
uma previsão de venda de cada item.
38
TÓPICO 4 | APLICAÇÕES DA CIÊNCIA DE DADOS
Podemos afirmar, com base em Turban et al. (2012, p. 27), que o termo
Business Intelligence significa uma expressão livre de conteúdo e, portanto,
representa coisas diferentes para pessoas diferentes. Parte da confusão relacionada
ao BI é causada pela enxurrada de acrônimos e palavras da moda associadas a ele
e suas ferramentas (como Business Performance Management — BPM). Ainda sob
o ponto de vista dos autores, os principais objetivos do BI são permitir o acesso
interativo aos dados (às vezes, em tempo real), proporcionar a manipulação desses
dados e fornecer aos gerentes e analistas de negócios a capacidade de realizar a
análise adequada. Ao analisarem dados, situações e desempenhos históricos e
atuais, os tomadores de decisão conseguem valiosos insights que podem servir
como base para decisões melhores e mais informadas.
Ciência de dados
Alto
Análise preditiva
Análise prescritiva
Por quê? O que irá...?
O que eu devo fazer?
Valor do
Ciência
negócio
de dados
Business intelligence
Análise descritiva
Business Relatório padrão
intelligence O que aconteceu?
Baixo
Passado Tempo Futuro
FONTE: Schmarzo (2016).
Podemos notar que, enquanto a ciência de dados traz um olhar para o futuro,
por meio de análises preditivas e prescritivas, e se baseia em questionamentos
como por quê, o que devo fazer e o que irá ocorrer, a inteligência de negócios,
ou seja, o BI, traz análises descritivas, relatórios padrão e questionamentos sobre
o que já aconteceu. No entanto, não podemos deixar de mencionar que ambas
ainda conseguem trabalhar em conjunto e com outras tecnologias.
DICAS
Eckerson (2003) traz resultados de uma pesquisa feita entre 510 corporações
que indica os benefícios do BI conforme a visão dos participantes. São eles:
40
RESUMO DO TÓPICO 4
Nesse tópico você aprendeu:
• Discutir onde aplicar ciência de dados.
• Descrever exemplos de aplicação da ciência de dados.
• Relacionar business intelligence (BI) e ciência de dados.
• Que ter a chance de prever possibilidades para o futuro é uma vantagem,
principalmente para as empresas. Por isso, a aplicação e o uso da ciência dos
dados podem ser visualizados por meio de um fluxo de passos que podem ser
utilizados para a obtenção do sucesso nos negócios.
• Acompanhe, no Infográfico, quais são esses passos.
41
42
AUTOATIVIDADE
43
a) ( ) Crescente taxa de sobrecarga de informações.
b) ( ) Podem ser aplicadas por meio de planilhas eletrônicas e tabelas com
dados inseridos manualmente.
c) ( ) Trazem a automatização de processos decisórios, principalmente os
que têm os clientes como foco.
d) ( ) Para executar a filtragem das informações, deve haver obrigatoriamente
outra tecnologia.
e) ( ) São tecnologias que podem ser aplicadas em qualquer máquina, já que
não exigem configurações específicas.
44
UNIDADE 1
TÓPICO 5
INTELIGÊNCIA ARTIFICIAL
1 INTRODUÇÃO
A inteligência artificial (IA) possibilita que as máquinas aprendam com
a experiência, ajustem-se a novas entradas e realizem tarefas semelhantes às
humanas. A maioria dos exemplos de IA sobre os quais você ouve falar hoje
— de computadores que jogam xadrez a carros autônomos — depende muito
do aprendizado profundo e do processamento de linguagem natural. Usando
essas tecnologias, os computadores podem ser treinados para realizar tarefas
específicas, processando grandes quantidades de dados e reconhecendo padrões.
45
UNIDADE 1 | FUNDAMENTOS DE BIG DATA
46
TÓPICO 5 | INTELIGÊNCIA ARTIFICIAL
O conceito de redes neurais existe desde 1949, mas, com os mais recentes
aumentos nos recursos de computação e armazenamento, as redes neurais estão
sendo treinadas para resolver uma variedade de problemas do mundo real,
desde o reconhecimento de imagens e processamento de linguagem natural
até a previsão do desempenho da rede. Outras aplicações incluem descoberta
de características de anomalias, detecção de anomalias de séries temporais e
correlação de eventos para análise de causa raiz.
• Filtragem colaborativa: a maioria das pessoas experimentam filtragem
colaborativa quando escolhem um filme no Netflix ou compram algo da
Amazon e recebem recomendações para outros filmes ou itens de que possam
gostar. Além dos recomendadores, a filtragem colaborativa também é usada
para classificar grandes conjuntos de dados e colocar uma face em uma solução
de IA. É onde toda a coleta e análise de dados é transformada em insight ou
ação significativa. Seja usada em um game show, seja por um médico ou por um
administrador de rede, a filtragem colaborativa é o meio de fornecer respostas
com alto grau de confiança. É como um assistente virtual que ajuda a resolver
problemas complexos.
3 HISTÓRICO
Na primeira metade do século XX, a ficção científica familiarizou o mundo
com o conceito de robôs artificialmente inteligentes. Começou com o homem de
coração “sem coração” de o “Mágico de Oz” e continuou com o robô humanoide
que se fazia passar por Maria em “Metrópolis”. Na década de 1950, tínhamos
uma geração de cientistas, matemáticos e filósofos com o conceito de inteligência
artificial (ou IA) culturalmente assimilado em suas mentes. Uma dessas pessoas
foi Alan Turing, um jovem polímata britânico que explorou a possibilidade
matemática da inteligência artificial. Turing sugeriu que os humanos usam
informações disponíveis, bem como a razão, para resolver problemas e tomar
decisões — então por que as máquinas não podem fazer a mesma coisa? Essa foi a
estrutura lógica de seu artigo de 1950, “Computing Machinery and Intelligence”,
no qual ele discutiu como construir máquinas inteligentes e como testar sua
inteligência (WARWICK, 2011).
47
UNIDADE 1 | FUNDAMENTOS DE BIG DATA
faziam. Em segundo lugar, a computação era extremamente cara. No início dos anos
1950, o custo de alugar um computador chegava a US$ 200 mil por mês. Somente
as universidades de prestígio e as grandes empresas de tecnologia poderiam dar-
se ao luxo de se distrair nessas águas inexploradas. Uma prova de conceito, bem
como a defesa de pessoas de alto perfil, foi necessária para persuadir as fontes de
financiamento de que valeria a pena investigar a inteligência das máquinas.
Cinco anos depois, a prova de conceito foi iniciada por Allen Newell, Cliff
Shaw e Logic Theorist, de Herbert Simon. O Logic Theorist era um programa
projetado para imitar as habilidades de resolução de problemas de um ser humano
e foi financiado pela Corporação de Pesquisa e Desenvolvimento (RAND). É
considerado por muitos como o primeiro programa de inteligência artificial e foi
apresentado no Dartmouth Summer Research Project em Inteligência Artificial
(DSRPAI) por John McCarthy e Marvin Minsky em 1956. Nessa conferência
histórica, McCarthy, imaginando um grande esforço colaborativo, trouxe os
principais pesquisadores de vários campos de uma discussão aberta sobre
inteligência artificial, termo que ele cunhou no próprio evento. Infelizmente, a
conferência ficou aquém das expectativas de McCarthy; as pessoas iam e vinham
como bem entendiam, e não havia acordo sobre métodos padronizados para
o campo. Apesar disso, todos se alinharam com o sentimento de que a IA era
alcançável. O significado desse evento não pode ser minado, pois catalisou os
próximos vinte anos de pesquisa em IA (WARWICK, 2011; ERTEL, 2017).
48
TÓPICO 5 | INTELIGÊNCIA ARTIFICIAL
Nos anos 1980, a IA foi reacendida por duas fontes: uma expansão do conjunto
de ferramentas algorítmicas e um aumento de fundos. John Hopfield e David
Rumelhart popularizaram técnicas de “aprendizado profundo” que permitiram
que os computadores aprendessem usando a experiência. Por outro lado, Edward
Feigenbaum introduziu sistemas especialistas que imitavam o processo de tomada
de decisão de um especialista humano. O programa perguntaria a um especialista
em um campo como responder em uma determinada situação, e, uma vez que isso
fosse aprendido para praticamente todas as situações, os não especialistas poderiam
receber conselhos desse programa. Sistemas especialistas foram amplamente
utilizados nas indústrias. O governo japonês financiou sistemas especialistas
e outros esforços relacionados à IA como parte do Projeto de Computação da
Quinta Geração (FGCP). De 1982 a 1990, eles investiram 400 milhões de dólares
com os objetivos de revolucionar o processamento de computadores, implementar
programação lógica e melhorar a inteligência artificial. Infelizmente, a maioria dos
objetivos ambiciosos não foi atingida. No entanto, pode-se argumentar que os efeitos
indiretos do FGCP inspiraram uma geração jovem e talentosa de engenheiros e
cientistas. Independentemente disso, o financiamento do FGCP cessou, e a IA caiu
fora dos holofotes (WARWICK, 2011).
49
UNIDADE 1 | FUNDAMENTOS DE BIG DATA
Vivemos agora na era de Big Data, uma época em que temos a capacidade
de coletar enormes somas de informações, que são muito complicadas para
uma pessoa processar. A aplicação da inteligência artificial a esse respeito já foi
bastante proveitosa em diversos setores, como tecnologia, bancos, marketing
e entretenimento. Vimos que, mesmo que os algoritmos não melhorem muito,
o Big Data e a computação maciça simplesmente permitem que a inteligência
artificial aprenda por meio da força bruta. Pode haver evidências de que a lei de
Moore está diminuindo um pouco, mas o aumento nos dados certamente não
perdeu nenhum impulso. Avanços na ciência da computação, matemática ou
neurociência servem como saídas potenciais para o limite imposto pela lei de
Moore (IAFRATE, 2018).
4 APLICAÇÕES
O uso de inteligência artificial já é amplo em diversas áreas. A seguir,
você conhecerá algumas das diversas aplicações da inteligência artificial em áreas
comuns na vida das pessoas.
50
TÓPICO 5 | INTELIGÊNCIA ARTIFICIAL
51
UNIDADE 1 | FUNDAMENTOS DE BIG DATA
52
RESUMO DO TÓPICO 5
Nesse tópico você aprendeu:
• Descrever o conceito de inteligência artificial (IA).
• Discutir o histórico da IA.
• Reconhecer as áreas de aplicação da IA.
• Que A inteligência artificial (IA) pode desempenhar papel fundamental em
setores como saúde, agricultura, cuidados pessoais, automação residencial,
serviços bancários e transporte. Em todas essas áreas, são aplicados diferentes
ramos da IA.
• Conheça alguns desses ramos no Infográfico a seguir.
53
54
AUTOATIVIDADE
a) ( ) Herbert Simon.
b) ( ) Cliff Shaw.
c) ( ) Allen Newell.
d) ( ) Alan Turing.
e) ( ) Albert Einstein.
55
4 Alan Turing foi um dos primeiros cientistas que procuraram esclarecer
matematicamente a inteligência artificial. No entanto, seu progresso ficou
limitado pelo alto custo computacional da época. Qual foi o outro principal
motivo que impediu o avanço da inteligência artificial na década de 40,
quando Alan Turing iniciou sua exploração matemática sobre o conceito?
56
UNIDADE 2
INFRAESTRUTURAS PARA
PROCESSAMENTO DE BIG DATA,
ARMAZENAMENTO, SUPORTE A
TEMPO REAL E DESAFIOS NA
GERÊNCIA DE BIG DATA
OBJETIVOS DE APRENDIZAGEM
A partir do estudo desta unidade, você deverá ser capaz de:
PLANO DE ESTUDOS
Esta unidade está dividida em cinco tópicos. No decorrer da unidade,
você encontrará autoatividades com o objetivo de reforçar o conteúdo
apresentado.
CHAMADA
57
58
UNIDADE 2
TÓPICO 1
1 INTRODUÇÃO
Atualmente, sabe-se que a informação é um fator chave para as organizações
que, quanto maior for o número de informações, maior será a possibilidade de
melhoria dos processos e consequente melhoria da performance dos resultados.
O que era, no passado, uma preocupação com a falta de informações, hoje,
se traduz em armazenar corretamente essas informações, para que, quando
solicitadas, auxiliem na tomada de decisão. O mercado tem ofertado às empresas
novas tecnologias na área de hardware, com custos menores e que possibilitam o
armazenamento de um grande volume de dados. O grande desafio é, portanto,
utilizar esses dados de uma forma correta, gerando o conhecimento empresarial
capaz de superar os desafios crescentes que as organizações são submetidas
diariamente por intermédio desses sistemas de apoio a decisão.
59
UNIDADE 2 | INFRAESTRUTURAS PARA PROCESSAMENTO DE BIG DATA, ARMAZENAMENTO, SUPORTE A TEMPO REAL E
DESAFIOS NA GERÊNCIA DE BIG DATA
Gestão de
Conteúdo
Entrega de
Conteúdo
Captura de
Conteúdo
Retenção de
Conteúdo
60
TÓPICO 1 | INFRAESTRUTURA DE DADOS E DE REDES II
3 DATA WAREHOUSE
Os Data Warehouse (DW), como você pode observar na Figura 2, são
cópias de dados de transações, estruturadas especificamente para consultas e
análises. Para as empresas, servem de fonte de consultas fornecendo uma base de
dados analítica que vai auxiliar na tomada de decisão.
61
UNIDADE 2 | INFRAESTRUTURAS PARA PROCESSAMENTO DE BIG DATA, ARMAZENAMENTO, SUPORTE A TEMPO REAL E
DESAFIOS NA GERÊNCIA DE BIG DATA
62
TÓPICO 1 | INFRAESTRUTURA DE DADOS E DE REDES II
FONTE: O autor
63
UNIDADE 2 | INFRAESTRUTURAS PARA PROCESSAMENTO DE BIG DATA, ARMAZENAMENTO, SUPORTE A TEMPO REAL E
DESAFIOS NA GERÊNCIA DE BIG DATA
FONTE: O autor
64
TÓPICO 1 | INFRAESTRUTURA DE DADOS E DE REDES II
65
UNIDADE 2 | INFRAESTRUTURAS PARA PROCESSAMENTO DE BIG DATA, ARMAZENAMENTO, SUPORTE A TEMPO REAL E
DESAFIOS NA GERÊNCIA DE BIG DATA
66
TÓPICO 1 | INFRAESTRUTURA DE DADOS E DE REDES II
• Modelo floco de neve (snow flake): esse modelo visa à normatização do banco,
contando com dimensões auxiliares, veja a Figura 5.
Dimensão Loja
Fatos Vendas
Meio
Marca
Categoria
Com esse formato, a base de dados passa a utilizar mais tabelas para
representar as mesmas dimensões, com a vantagem de ocupar um menor
espaço no DW.
67
UNIDADE 2 | INFRAESTRUTURAS PARA PROCESSAMENTO DE BIG DATA, ARMAZENAMENTO, SUPORTE A TEMPO REAL E
DESAFIOS NA GERÊNCIA DE BIG DATA
Satisfatório, atende a
Tempo de resposta Bom quanto à performance
demanda
68
TÓPICO 1 | INFRAESTRUTURA DE DADOS E DE REDES II
DICAS
Data Warehouse
Data Mart
DB Objects
Data Mart
69
UNIDADE 2 | INFRAESTRUTURAS PARA PROCESSAMENTO DE BIG DATA, ARMAZENAMENTO, SUPORTE A TEMPO REAL E
DESAFIOS NA GERÊNCIA DE BIG DATA
70
TÓPICO 1 | INFRAESTRUTURA DE DADOS E DE REDES II
E
IMPORTANT
71
RESUMO DO TÓPICO 1
Nesse tópico você aprendeu:
72
AUTOATIVIDADE
73
e) ( ) Disponibilização de dados pelo data warehouse sobre o desempenho
de vendas da organização, podendo ser analisados de acordo com a
geografia, com o tipo de produto, grupo de vendas ou individualmente.
74
a) ( ) Em um banco de dados, a volatilidade causada pelo processamento
de transações faz com que a análise dos dados seja muito difícil.
b) ( ) Assim como os bancos de dados, os data warehouses também são
voláteis, pois seus dados sofrem frequentes atualizações.
c) ( ) Assim como os bancos de dados, os data warehouses são projetados
como sistemas de processamento analítico on-line.
d) ( ) Os bancos de dados são considerados como não voláteis, pois dados
são adicionados frequentemente, editados ou atualizados.
e) ( ) Os bancos de dados são sistemas que processam transações offline,
nos quais toda transação precisa ser registrada rapidamente.
75
76
UNIDADE 2 TÓPICO 2
1 INTRODUÇÃO
Uma boa infraestrutura no setor de transportes, por exemplo, significa
que os veículos vão trafegar em vias de boa qualidade, seguras e adequadas
às necessidades desse modal. Trazendo para o mundo corporativo, uma boa
infraestrutura de TI deve ofertar aos serviços a condição de que os dados
trafeguem seguros e cumpram seu papel de gerar as informações tão necessárias
ao gerenciamento empresarial.
2 INFRAESTRUTURA TRADICIONAL DE TI
O que chamamos de infraestrutura tradicional de TI são os componentes
que ofertam suporte de todos os sistemas de informação na empresa. Em geral,
são compostos por hardware; software; tecnologia de gestão de dados; tecnologia
de rede e de telecomunicações e os serviços de tecnologia.
• Administração da TI;
• Canais eletrônicos integrados;
• Comunicações;
• Administração de dados;
• Gestão das instalações;
• Segurança e risco;
• Aplicações de infraestrutura;
• Administração das facilidades de TI;
• Arquitetura e padrões de TI;
• P&D de TI;
• Educação e treinamento em TI.
Por isso, uma boa infraestrutura de TI deve andar lado a lado com o
planejamento da empresa, assim, deixando mais fácil a tomada de decisão, que
levará a empresa a alcançar seus objetivos e metas. Para as escolhas, devem,
então, ser considerados a acessibilidade, a adaptabilidade, a dependência e a
gerenciabilidade de todo o conjunto.
3 INFRAESTRUTURA EM NUVEM
Antes de falarmos na infraestrutura baseada na computação em nuvem,
vale a pena versar um pouco sobre o tema cloud computing (computação em
nuvem) que se trata da capacidade de computação infinitamente disponível e
flexível. A nuvem é tudo aquilo que fica por detrás da conexão. As preocupações
com a largura de banda, espaço de armazenamento, poder de processamento,
confiabilidade e segurança, são postas de parte.
78
TÓPICO 2 | INFRAESTRUTURA DE TI E SISTEMAS DE SUPORTE II
Máquina Física
Máquina
Virtual
Rede
79
UNIDADE 2 | INFRAESTRUTURAS PARA PROCESSAMENTO DE BIG DATA, ARMAZENAMENTO, SUPORTE A TEMPO REAL E
DESAFIOS NA GERÊNCIA DE BIG DATA
• Self-service sob demanda: essa característica diz que o usuário pode adquirir
unilateralmente recursos computacionais, como tempo de processamento no
servidor ou armazenamento na rede, conforme sua demanda, sem precisar de
interação humana com os provedores de cada serviço.
• Amplo acesso: os recursos solicitados podem ser encontrados nas
disponibilidades da rede e acessados por meio de qualquer mecanismo
padronizado que permita o uso por plataformas do tipo thin, como celulares,
laptops e PDAs (personal digital assistants).
• Pooling de recursos: os usuários não precisam ter conhecimento da localização
física dos recursos computacionais, eles podem estar em qualquer lugar, basta
saber que esses recursos estão organizados em um pool para servir múltiplos
usuários, usando um modelo multi-tenant ou multi-inquilino, com diferentes
recursos físicos e virtuais, dinamicamente atribuídos e ajustados.
• Elasticidade rápida: essa característica aparece para o usuário como sendo uma
busca e utilização ilimitada, pois pode ser adquirida em qualquer quantidade
e a qualquer momento, tudo isso devido ao fato de que os recursos veem de
forma rápida e elástica, quase que automaticamente.
• Serviço medido: esses acessos são controlados automaticamente pelos
sistemas em nuvem, otimizando, assim, a utilização dos recursos por meio de
uma capacidade de medição, afinal, esse uso pode ser monitorado e controlado
possibilitando transparência para o provedor do serviço e para os usuários que
o utilizaram para satisfazer suas demandas. Em geral, são considerados o tipo
de serviço para armazenamento, o processamento, a largura de banda e as
contas de usuários ativas.
O NIST prevê três modelos de serviço que você verá no Quadro 4, esses
modelos são de grande importância, pois definem um padrão arquitetural para
soluções da computação em nuvem.
80
TÓPICO 2 | INFRAESTRUTURA DE TI E SISTEMAS DE SUPORTE II
81
UNIDADE 2 | INFRAESTRUTURAS PARA PROCESSAMENTO DE BIG DATA, ARMAZENAMENTO, SUPORTE A TEMPO REAL E
DESAFIOS NA GERÊNCIA DE BIG DATA
NOTA
82
TÓPICO 2 | INFRAESTRUTURA DE TI E SISTEMAS DE SUPORTE II
Requisitos do usuário
83
UNIDADE 2 | INFRAESTRUTURAS PARA PROCESSAMENTO DE BIG DATA, ARMAZENAMENTO, SUPORTE A TEMPO REAL E
DESAFIOS NA GERÊNCIA DE BIG DATA
E
IMPORTANT
84
TÓPICO 2 | INFRAESTRUTURA DE TI E SISTEMAS DE SUPORTE II
E
IMPORTANT
85
UNIDADE 2 | INFRAESTRUTURAS PARA PROCESSAMENTO DE BIG DATA, ARMAZENAMENTO, SUPORTE A TEMPO REAL E
DESAFIOS NA GERÊNCIA DE BIG DATA
É claro que o sistema pode apresentar falhas, por isso deve trabalhar duro
para garantir a disponibilidade com consistência. Esse ponto é fundamental,
afinal uma consistência fraca representa alto custo operacional.
86
TÓPICO 2 | INFRAESTRUTURA DE TI E SISTEMAS DE SUPORTE II
87
UNIDADE 2 | INFRAESTRUTURAS PARA PROCESSAMENTO DE BIG DATA, ARMAZENAMENTO, SUPORTE A TEMPO REAL E
DESAFIOS NA GERÊNCIA DE BIG DATA
88
RESUMO DO TÓPICO 2
Nesse tópico você aprendeu:
89
AUTOATIVIDADE
a) ( ) comunitária.
b) ( ) Híbrida
c) ( ) Privada
d) ( ) pública.
e) ( ) Proprietária
90
a) ( ) Acessibilidade, adaptabilidade, dependência e gerenciabilidade.
b) ( ) Adaptabilidade, assessoramento, dependência e gerenciabilidade.
c) ( ) Acessibilidade, dependência, maleabilidade e manutenibilidade.
d) ( ) Adaptabilidade, dependência, gerenciabilidade e recuperação.
e) ( ) Acessibilidade, adaptabilidade, dependência e manutenibilidade.
91
92
UNIDADE 2 TÓPICO 3
COMPUTAÇÃO NA NUVEM
1 INTRODUÇÃO
Quando se pensa em computação em nuvem, imagina-se grandes
servidores em Data Centers de última tecnologia provendo os mais variados
serviços, como e-mail, armazenamento de arquivos e soluções em gerais. Contudo,
objetivamente, a base da computação em nuvem é o fato de existir algum serviço
disponível na internet, por meio de um computador interligado a outros pela
internet. Portanto, um computador pessoal, por exemplo, pode servir como um
ponto de acesso a outros computadores para um ou vários tipos de serviços.
2 DATA CENTER
Um Data Center ou Central de Processamento de Dados (CPD) é o
local destinado ao armazenamento e funcionamento de equipamentos para o
processamento de dados a serviço de uma ou mais empresas. Dependendo do
tamanho do Data Center, é possível acolher milhares de servidores, além de
inúmeros componentes como storage, roteadores, switches e no-breaks, como
você pode observar na Figura 8.
93
UNIDADE 2 | INFRAESTRUTURAS PARA PROCESSAMENTO DE BIG DATA, ARMAZENAMENTO, SUPORTE A TEMPO REAL E
DESAFIOS NA GERÊNCIA DE BIG DATA
2.1 FUNÇÃO
Os equipamentos instalados em um Data Center possuem o objetivo
de processar de maneira adequada um grande número de dados de forma
ininterrupta e segura. Para manter tudo funcionando com a máxima segurança,
é comum os Data Centers possuírem geradores, sistemas anti-incêndios, pisos
elevados contra inundações, além do acesso restrito aos seus aposentos.
2.2 ESTRUTURA
Para permitir o acesso aos dados processados no Data Center, ele deve
possuir uma infraestrutura de rede para conexão à internet adequada e possuir
um rigoroso projeto estrutural para responder a algumas questões, como quantos
servidores devem ser configurados, quais conexões devem ser utilizadas, quais
switches, roteadores, no-breaks deverão ser instalados, implementação de sistemas
de backup para prevenção de perda de dados etc.
94
TÓPICO 3 | COMPUTAÇÃO NA NUVEM
DICAS
https://goo.gl/N7jEdB
95
UNIDADE 2 | INFRAESTRUTURAS PARA PROCESSAMENTO DE BIG DATA, ARMAZENAMENTO, SUPORTE A TEMPO REAL E
DESAFIOS NA GERÊNCIA DE BIG DATA
• todos os serviços dependem da internet para funcionar, caso ela caia o acesso
aos serviços ficarão comprometidos;
• caso seja necessário o envio de arquivos grandes ou um uso massivo de tráfego
de dados, esse processamento dependerá da banda de internet contratada pelo
usuário, podendo prejudicar o uso dos serviços;
96
TÓPICO 3 | COMPUTAÇÃO NA NUVEM
E
IMPORTANT
97
RESUMO DO TÓPICO 3
Nesse tópico você aprendeu:
98
99
AUTOATIVIDADE
I) Segurança.
II) Interoperabilidade de dados e aplicações.
III) Portabilidade de dados e aplicações.
IV) Medição e monitoramento.
V) Escalabilidade.
100
Qual alternativa abaixo está correta?
a) ( ) Interoperabilidade.
b) ( ) Elasticidade.
c) ( ) Política de segurança
d) ( ) Malware.
e) ( ) Firewall.
101
102
UNIDADE 2
TÓPICO 4
1 INTRODUÇÃO
O volume de dados está aumentando em proporções exponenciais no
mundo. Os Estados Unidos é o país em que mais circulam dados, ficando a Chi-
na em segundo lugar. Também merece destaque em tráfego de dados a América
Latina, o Oriente Médio e a África.
2 BANCOS DE DADOS
Antes de falarmos em bancos de dados, devemos conhecer alguns
conceitos importantes. O que são dados, informação e conhecimento?
103
UNIDADE 2 | INFRAESTRUTURAS PARA PROCESSAMENTO DE BIG DATA, ARMAZENAMENTO, SUPORTE A TEMPO REAL E
DESAFIOS NA GERÊNCIA DE BIG DATA
FONTE: O autor
FONTE: O autor
3 MODELOS DE DADOS
104
TÓPICO 4 | ANALISAR E COMPREENDER A UTILIZAÇÃO
4 SGBD
Sistema Gerenciador de Banco de Dados ou SGBD é um conjunto de
ferramentas baseados em uma linguagem, usadas para gerir a criação da estrutura,
exclusão e alteração de bases de dados, tabelas e manipulação de dados.
5 BIG DATA
A cada dia é gerada uma grande quantidade e variedade de dados.
Podemos citar como algumas das empresas que convivem diariamente com esse
dilúvio de informações as companhias aéreas, operadoras de telefonia, redes
sociais, busca on-line e redes varejistas. No entanto, não basta ter as informações
armazenadas, é necessário gerar conhecimento para nortear processos e tomadas
de decisões, ou seja, saber fazer o melhor uso dos dados. Com isso, entramos no
conceito de Big Data.
105
UNIDADE 2 | INFRAESTRUTURAS PARA PROCESSAMENTO DE BIG DATA, ARMAZENAMENTO, SUPORTE A TEMPO REAL E
DESAFIOS NA GERÊNCIA DE BIG DATA
6 NOSQL
NoSQL (não somente SQL) não faz referência a movimentos contra SQL,
refere-se à solução de banco de dados que possibilita o armazenamento de várias
formas não se limitando ao modelo relacional. Embora não seja um conceito
novo, surgiu em 1998, ainda não se tornou bem conhecido dos profissionais de TI.
106
TÓPICO 4 | ANALISAR E COMPREENDER A UTILIZAÇÃO
107
UNIDADE 2 | INFRAESTRUTURAS PARA PROCESSAMENTO DE BIG DATA, ARMAZENAMENTO, SUPORTE A TEMPO REAL E
DESAFIOS NA GERÊNCIA DE BIG DATA
As solicitações para
armazenar e recuperar dados
são comunicadas usando APIs baseadas em
consultas compatíveis com objetos permitem que
structured query language desenvolvedores de aplicações
(SQL). Essas consultas são armazenem e restaurem
analisadas e executadas por facilmente estruturas de
sistemas de gerenciamento de dados na memória. As chaves
APIs bancos de dados relacionais de partição permitem que os
(RDBMS). aplicativos procurem pares
Os bancos de dados SQL de chave-valor, conjuntos
normalmente oferecem de colunas ou documentos
um rico conjunto de semiestruturados contendo
ferramentas para simplificar objetos e atributos de
o desenvolvimento de aplicativos serializados.
aplicações orientadas ao
banco de dados.
Os bancos de dados SQL
normalmente oferecem Oferecem ferramentas
um rico conjunto de para gerenciar clusters e
Ferramentas ferramentas para simplificar escalabilidade. As aplicações
o desenvolvimento de são a interface principal com
aplicações orientadas ao os dados subjacentes.
banco de dados.
108
TÓPICO 4 | ANALISAR E COMPREENDER A UTILIZAÇÃO
109
UNIDADE 2 | INFRAESTRUTURAS PARA PROCESSAMENTO DE BIG DATA, ARMAZENAMENTO, SUPORTE A TEMPO REAL E
DESAFIOS NA GERÊNCIA DE BIG DATA
110
TÓPICO 4 | ANALISAR E COMPREENDER A UTILIZAÇÃO
• Google bigtable
• Amazon Dynamo
• Facebook Cassandra
• Apache HBASE
• Linkedin Valdemort
111
RESUMO DO TÓPICO 4
Nesse tópico você aprendeu:
112
113
AUTOATIVIDADE
3 Existem muitos bancos de dados para se trabalhar com NoSQL, cada banco
está associado a um determinado tipo do NoSQL. Marque a alternativa em
que todos os bancos de dados estão associados ao seu respectivo tipo.
114
a) ( ) As empresas que optam pelo uso de NoSQL devem eliminar o trabalho
com outros modelos de bancos de dados.
b) ( ) O Modelo NoSQL é um tipo de gerenciador de banco de dados que
conecta os registros em forma de árvore e cada tipo de registro tem
apenas uma raiz.
c) ( ) NoSQL (não somente SQL), refere-se à solução de banco de dados
que possibilita o armazenamento de uma grande variedade de dados
existentes, não se limitando apenas a modelos relacionais.
d) ( ) Os banco de dados NoSQL têm como característica a organização dos
dados em tabelas.
e) ( ) Veio para substituir os bancos de dados relacionais.
115
116
UNIDADE 2
TÓPICO 5
1 INTRODUÇÃO
O processo Design Thinking é interativo, flexível e focado na colaboração
entre designers e usuários, com ênfase em trazer ideias para a vida com base em
como os usuários reais pensam, sentem e se comportam. O Design Thinking aborda
problemas complexos ao compreender as necessidades humanas envolvidas,
definindo o problema de formas centradas no ser humano, criando muitas ideias
na sessão de ideação, adotando uma abordagem prática de prototipagem e
desenvolvendo um protótipo/solução para o problema.
118
TÓPICO 5 | INOVAÇÃO E DESIGN THINKING
1- empatia;
2- definição;
3- idealização;
4- protótipos;
5- testes.
119
UNIDADE 2 | INFRAESTRUTURAS PARA PROCESSAMENTO DE BIG DATA, ARMAZENAMENTO, SUPORTE A TEMPO REAL E
DESAFIOS NA GERÊNCIA DE BIG DATA
Deve-se escolher outras técnicas de ideação até o final dessa fase que ajudem
a investigar e testar as ideias, de modo que se possa encontrar a melhor maneira de
resolver um problema ou fornecer os elementos necessários para contorná-lo.
120
TÓPICO 5 | INOVAÇÃO E DESIGN THINKING
O termo “inovação” pode ser definido como algo original e mais efetivo e,
consequentemente, novo, que “invade” o mercado ou a sociedade. As inovações
tendem a ser produzidas por pessoas de fora e por fundadores em startups, em
vez de organizações existentes. A inovação está relacionada, mas não é o mesmo
que invenção, já que a inovação está mais apta a envolver a implementação
prática de uma invenção para causar um impacto significativo no mercado ou na
sociedade, e nem todas as inovações requerem uma invenção. A inovação, muitas
vezes, manifesta-se por meio do processo de engenharia, quando o problema a
ser resolvido é de natureza técnica ou científica (BROWN, 2018).
121
UNIDADE 2 | INFRAESTRUTURAS PARA PROCESSAMENTO DE BIG DATA, ARMAZENAMENTO, SUPORTE A TEMPO REAL E
DESAFIOS NA GERÊNCIA DE BIG DATA
O Design Thinking não deve ser visto como uma abordagem concreta e
inflexível ao design; os estágios dos componentes identificados servem como um
guia para as atividades que se executaria normalmente. A fim de obter os insights
mais puros e mais informativos para um projeto em particular, esses estágios
podem ser alternados, conduzidos simultaneamente e repetidos várias vezes para
expandir o espaço da solução e se concentrar nas melhores soluções possíveis.
122
TÓPICO 5 | INOVAÇÃO E DESIGN THINKING
• redefinindo valor;
• inovação centrada no homem;
• qualidade de vida;
• problemas que afetam diversos grupos de pessoas;
• múltiplos sistemas;
• mudança de mercados e comportamentos;
• lidando com mudanças sociais ou de mercado rápidas;
• questões relacionadas à cultura corporativa;
• questões relacionadas à nova tecnologia;
• reinventando modelos de negócios;
• abordando mudanças rápidas na sociedade;
• desafios societários complexos não resolvidos;
• cenários envolvendo equipes multidisciplinares;
• iniciativas empreendedoras;
• avanços educacionais;
123
UNIDADE 2 | INFRAESTRUTURAS PARA PROCESSAMENTO DE BIG DATA, ARMAZENAMENTO, SUPORTE A TEMPO REAL E
DESAFIOS NA GERÊNCIA DE BIG DATA
• avanços médicos;
• a inspiração é necessária;
• problemas que os dados não podem resolver.
5 DESIGN THINKING
O termo Design Thinking é utilizado nos mais diferentes cenários, desde
áreas de gestão da saúde até setores de desenvolvimento de novos produtos nas
indústrias. No entanto, o conceito ainda é muito questionado, principalmente em
relação a como ele pode ser aplicado aos modelos de negócios, auxiliando nos
processos de inovação das empresas e instituições.
124
TÓPICO 5 | INOVAÇÃO E DESIGN THINKING
E
IMPORTANT
A escola Bauhaus foi fundada em 1919, por Walter Gropius, na Alemanha. Uma
das grandes contribuições para o desenvolvimento do design no século XX está nesta
máxima: a forma segue a função.
125
UNIDADE 2 | INFRAESTRUTURAS PARA PROCESSAMENTO DE BIG DATA, ARMAZENAMENTO, SUPORTE A TEMPO REAL E
DESAFIOS NA GERÊNCIA DE BIG DATA
função de ser o pioneiro. O artigo aborda como o design está inserido em todas as
áreas da sociedade, bem como a questão de observar a interação do usuário com
os produtos, para identificar as demandas existentes e onde é possível inovar.
Por essa razão, costuma-se dizer que o design thinking é uma metodologia
que vem do design, uma vez que ela utiliza o pensamento dessa área para a solução
de problemas. Contudo, o termo design thinking começou a ser popularizado no
mundo — e principalmente na área de desenvolvimento de produtos e serviços —
por David Kelley, um professor da Universidade de Stanford (Estados Unidos), e
o seu colega Tim Brown.
DICAS
https://goo.gl/isWAln
126
TÓPICO 5 | INOVAÇÃO E DESIGN THINKING
Imagine que essas etapas são como uma receita de bolo: você precisa seguir
os passos que estão na sua receita, para que no fim você tenha o seu bolo. Cada
uma das etapas se refere a um momento da sua pesquisa e, consequentemente,
exige diferentes habilidades de quem está aplicando a metodologia. As etapas
estão organizadas sequencialmente e estão relacionadas entre elas. Contudo,
para iniciar uma nova etapa, é fundamental que você tenha finalizado a anterior.
127
UNIDADE 2 | INFRAESTRUTURAS PARA PROCESSAMENTO DE BIG DATA, ARMAZENAMENTO, SUPORTE A TEMPO REAL E
DESAFIOS NA GERÊNCIA DE BIG DATA
E
IMPORTANT
É importante que você saiba que, apesar de esse processo apresentar uma
estrutura sequencial, isso não significa que você e a sua equipe não poderão voltar
a uma etapa anterior para revisá-la sempre que for necessário.
128
TÓPICO 5 | INOVAÇÃO E DESIGN THINKING
7.1 EMPATIA
É quando inicia o processo, isto é, a etapa de levantamento de dados. Nesse
momento, você deve buscar reunir o maior número de informações sobre o produto
ou serviço que está desenvolvendo. Buscar os usuários do produto ou serviço é
fundamental, assim como questionar os pontos fracos do produto e analisar como
esse usuário interage com ele. Por exemplo, se for uma embalagem de sabão para
roupas, você pode verificar desde como esse produto está apresentado no seu local
de venda (expositores) até a maneira como o consumidor o condiciona em sua
residência (se guarda dentro de armários ou deixa exposto, por exemplo).
Toda essa parte observacional servirá para que você tenha subsídios
para gerar novas ideias. Essa é a fase na qual você vai perceber o que falta no
produto ou serviço analisado, por meio das necessidades do usuário — que nem
sempre são ditas por ele. Ferramentas interessantes para a fase de empatia são
questionários sobre a usabilidade do produto ou mapas de atores (consiste em
organizar graficamente as relações existentes entre os usuários de um serviço).
Dependendo do público com o qual você está trabalhando, o storytelling serve
como uma opção para que as pessoas consigam construir narrativas de problemas
por meio do discurso.
7.2 DEFINIÇÃO
Após ter realizado o levantamento de dados, é preciso trabalhar com
esses dados, ou seja, interpretá-los com o objetivo de definir o problema que
será solucionado ao final. É importante delimitar esse problema, de forma a não
desenvolver um projeto que não atenda às questões levantadas na fase anterior.
Algumas ferramentas que podem ser utilizadas para definir o problema de pesquisa
são os mapas conceituais, com o objetivo de apresentar aos envolvidos uma visão
geral da problemática. Para essa ferramenta, é interessante realizar um trabalho
coletivo, no qual todos os colaboradores possam expressar a sua visão. Ao final,
todos conseguem enxergar o problema a partir de uma perspectiva coletiva.
7.3 IDEAÇÃO
Depois de definida a problemática a ser solucionada, é o momento de
começar a buscar soluções. A etapa de ideação — ou de idear — é o momento
em que a equipe se reúne para, de maneira coletiva, apresentar ideias. Nesse
momento, todos da equipe devem gerar muitas ideias com o objetivo de solucionar
o problema. Quanto maior for a quantidade de ideias apresentadas, maiores as
possibilidades de inovação no que está sendo desenvolvido.
129
UNIDADE 2 | INFRAESTRUTURAS PARA PROCESSAMENTO DE BIG DATA, ARMAZENAMENTO, SUPORTE A TEMPO REAL E
DESAFIOS NA GERÊNCIA DE BIG DATA
7.4 PROTOTIPAÇÃO
Essa é a etapa em que se começa a dar forma à solução esperada. Após
analisar as ideias apresentadas na etapa anterior, inicia-se o processo de selecionar
as ideias que são viáveis de serem aplicadas a essa problemática.
7.5 TESTE
Essa é a última etapa, mas ela não deve ser esquecida ou diminuída pela
equipe. Após ter desenvolvido o protótipo do produto, o teste é o momento no qual
é verificada a usabilidade desse produto. É nessa etapa que é possível observar a
relação do usuário com esse produto — se a solução encontrada resolve de fato a
problemática inicial do processo.
130
TÓPICO 5 | INOVAÇÃO E DESIGN THINKING
131
UNIDADE 2 | INFRAESTRUTURAS PARA PROCESSAMENTO DE BIG DATA, ARMAZENAMENTO, SUPORTE A TEMPO REAL E
DESAFIOS NA GERÊNCIA DE BIG DATA
DICAS
A Natura tem um site que apresenta algumas das suas práticas inovadoras.
Acesse-o por meio do link a seguir ou do código ao lado.
https://goo.gl/56G11A
132
TÓPICO 5 | INOVAÇÃO E DESIGN THINKING
E
IMPORTANT
133
UNIDADE 2 | INFRAESTRUTURAS PARA PROCESSAMENTO DE BIG DATA, ARMAZENAMENTO, SUPORTE A TEMPO REAL E
DESAFIOS NA GERÊNCIA DE BIG DATA
A partir desses exemplos, você pode concluir como essa metodologia está
modificando a estrutura das grandes e pequenas marcas. O design thinking é uma
metodologia inovadora porque trata de entender o que o usuário precisa, ou seja, foca
na experiência e na usabilidade do produto. Esse é o grande diferencial, comparado
com outras metodologias que desenvolvem produtos sem esse olhar criativo.
NTE
INTERESSA
134
TÓPICO 5 | INOVAÇÃO E DESIGN THINKING
1- descobrir;
2- definir;
3- desenvolver;
4- deliverar (entregar).
135
UNIDADE 2 | INFRAESTRUTURAS PARA PROCESSAMENTO DE BIG DATA, ARMAZENAMENTO, SUPORTE A TEMPO REAL E
DESAFIOS NA GERÊNCIA DE BIG DATA
Para gerar novas e melhores opções, você precisa sonhar com suas
ideias antes de estreitá-las em uma lista de opções concebíveis. Assim, a
ideação possui duas fases principais: geração de ideias, onde quantidade
é o que importa, e a síntese, na qual as ideias são discutidas, combinadas
e reduzidas a um pequeno número de opções viáveis.
DICAS
O vídeo De onde vêm as boas ideias foi lançado para promover o livro de mesmo
nome, escrito por Steve Johnson, e traz um apanhado histórico sobre essas perspectivas
da origem das ideias. Ele foi feito utilizando a técnica do visual thinking, que facilita o
aprendizado. Acesse o link a seguir para ver o vídeo.
https://qrgo.page.link/FJ1ph
136
TÓPICO 5 | INOVAÇÃO E DESIGN THINKING
137
UNIDADE 2 | INFRAESTRUTURAS PARA PROCESSAMENTO DE BIG DATA, ARMAZENAMENTO, SUPORTE A TEMPO REAL E
DESAFIOS NA GERÊNCIA DE BIG DATA
138
TÓPICO 5 | INOVAÇÃO E DESIGN THINKING
DICAS
https://qrgo.page.link/7dUQ8
FIGURA 18 – BRAINSTORMING
139
UNIDADE 2 | INFRAESTRUTURAS PARA PROCESSAMENTO DE BIG DATA, ARMAZENAMENTO, SUPORTE A TEMPO REAL E
DESAFIOS NA GERÊNCIA DE BIG DATA
DICAS
140
TÓPICO 5 | INOVAÇÃO E DESIGN THINKING
141
UNIDADE 2 | INFRAESTRUTURAS PARA PROCESSAMENTO DE BIG DATA, ARMAZENAMENTO, SUPORTE A TEMPO REAL E
DESAFIOS NA GERÊNCIA DE BIG DATA
DICAS
https://qrgo.page.link/rn9L8
142
TÓPICO 5 | INOVAÇÃO E DESIGN THINKING
143
UNIDADE 2 | INFRAESTRUTURAS PARA PROCESSAMENTO DE BIG DATA, ARMAZENAMENTO, SUPORTE A TEMPO REAL E
DESAFIOS NA GERÊNCIA DE BIG DATA
DICAS
https://qrgo.page.link/2c5yN
144
TÓPICO 5 | INOVAÇÃO E DESIGN THINKING
• pensa e faz;
• vê;
• ouve;
• fala e faz;
• fraquezas;
• desejos.
145
UNIDADE 2 | INFRAESTRUTURAS PARA PROCESSAMENTO DE BIG DATA, ARMAZENAMENTO, SUPORTE A TEMPO REAL E
DESAFIOS NA GERÊNCIA DE BIG DATA
Design thinking: compreensão do problema 7
Quadro 1. Sugestão
QUADRO 8 –de perguntas DE
SUGESTÃO paraPERGUNTAS
o mapa de empatia
PARA O MAPA DE EMPATIA
147
UNIDADE 2 | INFRAESTRUTURAS PARA PROCESSAMENTO DE BIG DATA, ARMAZENAMENTO, SUPORTE A TEMPO REAL E
DESAFIOS NA GERÊNCIA DE BIG DATA
Segundo Vianna et al. (2012, p. 123), “um protótipo pode ser desde uma
representação conceitual ou análoga da solução (baixa fidelidade), passando por
aspectos da ideia, até a construção de algo o mais próximo possível da solução
final (alta fidelidade)”. Até o momento da prototipagem, o design thinking esteve
trabalhando as ideias. A etapa seguinte, então, precisa tangibilizar essas ideias.
Brown (2010) alerta para o fato de que você pode cair na armadilha de pensar
que fazer um protótipo pode ser perda de tempo. No entanto, essa etapa traz
resultados poderosos para o refino da solução. O autor ainda lembra que a
geração de ideias é um processo complexo; não se tem a ideia perfeita para a
solução de uma hora para outra, então o período entre as fases do projeto podem
ser equivalentes.
148
TÓPICO 5 | INOVAÇÃO E DESIGN THINKING
FIGURA 24 – EXEMPLOS DE PROTÓTIPOS: (A) CROQUI (2D); (B) PROTÓTIPO FUNCIONAL (3D);
(C) PROTÓTIPO DE TESTE DE MERCADO
149
UNIDADE 2 | INFRAESTRUTURAS PARA PROCESSAMENTO DE BIG DATA, ARMAZENAMENTO, SUPORTE A TEMPO REAL E
DESAFIOS NA GERÊNCIA DE BIG DATA
DICAS
https://qrgo.page.link/d5uDi
150
TÓPICO 5 | INOVAÇÃO E DESIGN THINKING
151
a nível de valor para a inovação.
UNIDADE 2 | INFRAESTRUTURAS PARA PROCESSAMENTO DE BIG DATA, ARMAZENAMENTO, SUPORTE A TEMPO REAL E
DESAFIOS NA GERÊNCIA DE BIG DATA
E
IMPORTANT
Uma das formas mais simples de prototipar uma ideia pode ser feita com papel, com
Uma das formas mais simples de prototipar uma ideia pode ser feita com papel,
um desenho, ou mais elaborada, com uma maquete. Entretanto, a matéria-prima é a
com um desenho, ou mais elaborada, com uma maquete. Entretanto, a matéria-prima é a
mesma.Veja,
mesma. Veja,no
noquadro
quadroa aseguir,
seguir, como
como fazer
fazer umum protótipo
protótipo de papel.
de papel.
A validação
20 na NA
A VALIDAÇÃO prototipagem e na
PROTOTIPAGEM testagem
E NA TESTAGEM
A prototipagem não consiste apenas em desenvolver a ideia por meio
de um modelo físico,
A prototipagem mas também
não consiste apenasem emfazer testes e validações.
desenvolver a ideia por Não
meioadianta
de um
elaborar o modelo sem o colocar à teste e ver se realmente funciona, se atende às
modelo físico, mas também em fazer testes e validações. Não adianta elabo-
necessidades do usuário.
rar o modelo sem o colocar à teste e ver se realmente funciona, se atende as
necessidades
Viannado usuário.
et al. (2012) alertam que o protótipo precisa servir para um grande
aprendizado, precisa refinar a ideia a ponto de validar a solução, como mostra a
figura a seguir.
152
TÓPICO 5 | INOVAÇÃO E DESIGN THINKING
153
UNIDADE 2 | INFRAESTRUTURAS PARA PROCESSAMENTO DE BIG DATA, ARMAZENAMENTO, SUPORTE A TEMPO REAL E
DESAFIOS NA GERÊNCIA DE BIG DATA
Portanto, essa é a fase em que você precisa estar maduro e aberto para ouvir
os avaliadores. Aproveite muito a fase de teste, faça perguntas aos participantes,
esmiúce essa etapa para que a solução, quando estiver pronta, realmente atinja o
objetivo do usuário.
DICAS
https://qrgo.page.link/GnQKe
CHAMADA
154
RESUMO DO TÓPICO 5
Nesse tópico você aprendeu:
• A inovação pode ser simplesmente definida como uma nova ideia, pensamen-
tos criativos, novas imaginações em forma de dispositivo ou método. No en-
tanto, muitas vezes, a inovação também é vista como a aplicação de melhores
soluções que atendem a novos requisitos, necessidades não articuladas ou ne-
cessidades de mercados existentes.
• Neste Infográfico, você vai conhecer o processo de inovação, assim como as
suas principais etapas.
155
156
AUTOATIVIDADE
a) ( ) Testes
b) ( ) Definição
c) ( ) Empatia.
d) ( ) Protótipos.
e) ( ) Idealização
157
4 Geralmente em grandes corporações, quando um novo produto é criado,
existe a aplicação de enormes quantias em dinheiro. A aplicação do Design
Thinking pode ajudar a economizar essa quantia de dinheiro imediatamente,
pois direciona a atenção para as soluções específicas que as pessoas precisam.
Nos modelos em que não se usa Design Thinking, qual desses é um problema
frequente?
158
UNIDADE 3
PLANO DE ESTUDOS
Esta unidade está dividida em sete tópicos. No decorrer da unidade você en-
contrará autoatividades com o objetivo de reforçar o conteúdo apresentado.
CHAMADA
159
160
UNIDADE 3
TÓPICO 1
MINERAÇÃO DE DADOS
1 INTRODUÇÃO
O número de dados produzidos pela sociedade, tanto por usuários
(pessoas) quanto pelas organizações (empresas), tem aumentado cada dia mais.
Nesse contexto, insere-se a área de mineração de dados, que se dedica a explorá-
los e analisá-los, e surgiu o termo Big Data, utilizado para descrever grandes
volumes de dados.
161
UNIDADE 3 | ANÁLISE DE DADOS, INTEGRAÇÃO E RECURSOS HUMANOS PARA BIG DATA
Estatística
Visualização Matemática
Mineração
de dados
Sistemas de
Engenharia
informação
Banco de Inteligência
dados artificial
162
TÓPICO 1 | MINERAÇÃO DE DADOS
ATENCAO
163
UNIDADE 3 | ANÁLISE DE DADOS, INTEGRAÇÃO E RECURSOS HUMANOS PARA BIG DATA
Interpretação
Conhecimento
Pré-
processamento
Padrões
Seleção
Dados
transformados
Dados
Dados Dados relevantes pré-processados
DICAS
https://goo.gl/uuVd1A
164
TÓPICO 1 | MINERAÇÃO DE DADOS
As instituições estão investindo cada vez mais em Big Data por notarem
que as consequências podem significar futuro próspero para os negócios,
melhorando a prestação de informações aos gestores e auxiliando, dessa forma,
na tomada de decisões com dados reais e precisos.
165
RESUMO DO TÓPICO 1
166
AUTOATIVIDADE
a) ( ) Seleção dos dados- Limpeza dos dados- Mineração dos dados- Avaliação
b) ( ) Seleção dos dados- Limpeza dos dados- Agrupamento dos dados-
Avaliação
c) ( ) Seleção dos dados- Separação dos dados- Mineração dos dados- Avaliação
d) ( ) Seleção dos dados- Limpeza dos dados- Mineração dos dados-
Alteração dos dados
e) ( ) Inserção dos dados- Limpeza dos dados- Mineração dos dados- Avaliação
167
a) ( ) Produzir- Analisar- Utilizar
b) ( ) Armazenar- Alterar- Utilizar
c) ( ) Armazenar- Analisar- Apagar
d) ( ) Armazenar- Analisar- Utilizar
e) ( ) Armazenar- Analisar- Transferir
168
UNIDADE 3
TÓPICO 2
1 INTRODUÇÃO
O processo em que grandes quantidades de dados são explorados
com o objetivo de identificar padrões, relacionamentos, conhecimentos é
denominado Data Mining (em português, mineração de dados) e tem cada vez
mais importância para o mercado, para os negócios e mesmo para pesquisas
científicas, que têm interesse e necessidade de analisar e organizar a quantidade
enorme de dados que produzem.
169
UNIDADE 3 | ANÁLISE DE DADOS, INTEGRAÇÃO E RECURSOS HUMANOS PARA BIG DATA
170
TÓPICO 2 | APLICAR METODOLOGIAS DE DATA MINING (MINERAÇÃO DE DADOS)
171
UNIDADE 3 | ANÁLISE DE DADOS, INTEGRAÇÃO E RECURSOS HUMANOS PARA BIG DATA
172
TÓPICO 2 | APLICAR METODOLOGIAS DE DATA MINING (MINERAÇÃO DE DADOS)
ATENCAO
173
UNIDADE 3 | ANÁLISE DE DADOS, INTEGRAÇÃO E RECURSOS HUMANOS PARA BIG DATA
174
TÓPICO 2 | APLICAR METODOLOGIAS DE DATA MINING (MINERAÇÃO DE DADOS)
• Basket analysis: é realizada uma análise de afinidade e pode ser aplicada a vários
objetos, identificando combinações de itens com foco no padrão de compras de
consumidores. Metodologia muito aplicada em e-commerce.
• Análises preditivas: a metodologia ajuda a prever quando os clientes irão
realizar novas compras, para que as empresas possam realizar campanhas de
marketing, organizar estoques e traçar cenários.
• Monitoramento de redes sociais: são verificados dados por meio da interação
com conteúdos que instiguem o consumidor a “dizer”, por meio de curtidas,
comentários e compartilhamentos, o que pensam sobre determinados produtos,
marcas e até mesmo tipo de atendimentos.
• Mineração de dados e OLAP (On-Line Analytical Processing): conceito
que engloba análises rápidas de dados multidimensionais compartilhados,
complementando a mineração de dados. Os sistemas de OLAP são ideais para
alocação de custos, análises de séries temporais, indexação de dados e análises
“what-if”. Trata-se de uma forma de analisar negócios e empresas naturalmente.
DICAS
Acesse o site a seguir e saiba mais a respeito das consultas das aplicações de
Big Data.
https://goo.gl/RD3Tis
175
RESUMO DO TÓPICO 2
176
AUTOATIVIDADE
a) ( ) Árvore de decisão.
b) ( ) Processo de exportação de dados.
c) ( ) Progresso de agrupamento de dados.
d) ( ) Processo de descoberta de conhecimento.
e) ( ) Dados em rotina assíncrona.
a) ( ) Análises atemporais.
b) ( ) Árvore de decisão.
c) ( ) Análise de Cluster.
d) ( ) File seek.
e) ( ) Análise de séries temporais.
a) ( ) Calcular tempo.
b) ( ) Limitar períodos.
c) ( ) Definir quais dados estão relacionados.
d) ( ) Definir condições.
e) ( ) Calcular valores dos dados.
5 Arroz, toalha de banho, vinho e saco de lixo são produtos distintos, mas
podem ser considerados de um mesmo grupo. Qual método é utilizado
para fazer esse agrupamento?
a) ( ) Desambiguação.
b) ( ) Análise de vendas.
c) ( ) Análise de Cluster.
d) ( ) Data OLAMP.
e) ( ) Árvore de decisão.
177
178
UNIDADE 3
TÓPICO 3
1 INTRODUÇÃO
O processo de Data Mining — mineração de dados — assume cada vez
mais relevância nos mais diversos contextos, já que, com cada vez mais frequência,
lidamos com uma quantidade imensa de dados que precisam ser explorados,
analisados e organizados. Por isso, existem diversas técnicas que auxiliam os
profissionais nesse processo, fornecendo informações sobre os dados, e há um
interesse crescente pelo desenvolvimento de novos métodos.
179
UNIDADE 3 | ANÁLISE DE DADOS, INTEGRAÇÃO E RECURSOS HUMANOS PARA BIG DATA
180
TÓPICO 3 | UTILIZAR TÉCNICAS DE DATA MINING
181
UNIDADE 3 | ANÁLISE DE DADOS, INTEGRAÇÃO E RECURSOS HUMANOS PARA BIG DATA
ATENCAO
182
TÓPICO 3 | UTILIZAR TÉCNICAS DE DATA MINING
183
UNIDADE 3 | ANÁLISE DE DADOS, INTEGRAÇÃO E RECURSOS HUMANOS PARA BIG DATA
184
TÓPICO 3 | UTILIZAR TÉCNICAS DE DATA MINING
185
RESUMO DO TÓPICO 3
186
AUTOATIVIDADE
a) ( ) GROUP BY.
b) ( ) CUBE.
c) ( ) RANGE.
d) ( ) WINDOW AS.
e) ( ) HAVING.
a) ( )
Um super computador orgânico.
b) ( )
Cruzamento de bases de dados independentes que se filtram sozinhas.
c) ( )
O SGBD aprende conforme a experiência de cada usuário.
d) ( )
Algoritmos programados para detectar padrões, tendências, grupos e
exclusões.
e) ( ) Centenas de processadores em Cluster que podem tomar decisões
sozinhos.
187
188
UNIDADE 3
TÓPICO 4
1 INTRODUÇÃO
O processo de extração de conhecimento e informação a partir de dados de
bases textuais é denominado Text Mining — mineração de textos em português
— e pode ser realizado a partir de diversas técnicas, cada vez mais desenvolvidas.
189
UNIDADE 3 | ANÁLISE DE DADOS, INTEGRAÇÃO E RECURSOS HUMANOS PARA BIG DATA
190
TÓPICO 4 | MINERAÇÃO DE TEXTOS (TEXT MINING)
191
UNIDADE 3 | ANÁLISE DE DADOS, INTEGRAÇÃO E RECURSOS HUMANOS PARA BIG DATA
192
TÓPICO 4 | MINERAÇÃO DE TEXTOS (TEXT MINING)
193
UNIDADE 3 | ANÁLISE DE DADOS, INTEGRAÇÃO E RECURSOS HUMANOS PARA BIG DATA
194
TÓPICO 4 | MINERAÇÃO DE TEXTOS (TEXT MINING)
196
RESUMO DO TÓPICO 4
• Neste Infográfico, você vai conhecer mais sobre cada uma das etapas e subetapas.
197
198
AUTOATIVIDADE
199
d) ( ) Minerar, selecionar e identificar semelhantes significados entre suas
palavras, sem considerar as variações morfológicas e problemas de
processamento.
e) ( ) Minerar, selecionar e assimilar semelhantes significados entre suas
palavras, sem considerar as variações morfológicas e problemas de
processamento
200
UNIDADE 3 TÓPICO 5
1 INTRODUÇÃO
No aprendizado de máquina, temos uma junção entre recursos
computacionais, inteligência artificial, dados, dentre outros elementos. Esses
sistemas devem estar aptos não só a memorizar dados, mas também a observá-
los e explorá-los para que suas habilidades evoluam por meio da prática e,
consequentemente, da construção do conhecimento.
201
UNIDADE 3 | ANÁLISE DE DADOS, INTEGRAÇÃO E RECURSOS HUMANOS PARA BIG DATA
Em torno desse tema, ainda podemos mencionar Big Data, a qual lida com
grande quantidade de dados — se não fosse por esses conceitos, o aprendizado de
máquina não teria ativo suficiente. Para Coppin (2010), na maioria dos problemas
de aprendizado, a tarefa é aprender a classificar entradas de acordo com um
conjunto finito (ou, às vezes, infinito) de classificações. Tipicamente, um sistema
de aprendizado é dotado de um conjunto de dados de treinamento que foram
classificados manualmente. O sistema, então, tenta aprender, a partir desses dados
de treinamento, a como classificar esses mesmos dados (geralmente, uma tarefa
relativamente fácil) e também a como classificar novos dados ainda não observados.
Deve haver a caracterização dos dados, em que esses são analisados para
definir tipo, que determina se os atributos do objeto são quantitativos ou números,
ou qualidade, de acordo com a qual podem ser chamados de qualitativos,
simbólicos (que são facilmente compreendidos por nós, humanos) ou categóricos
(quando os atributos possuem valores em um conjunto finito).
E
IMPORTANT
203
UNIDADE 3 | ANÁLISE DE DADOS, INTEGRAÇÃO E RECURSOS HUMANOS PARA BIG DATA
No próximo tópico, você verá como isso tudo pode ser desempenhado
por uma máquina.
204
TÓPICO 5 | APRENDIZADO DE MÁQUINA (MACHINE LEARNING)
Uma hipótese pode ser compreendida como uma ideia inicial, uma suposição
de algo, ou seja, você sugere algo, mas, posteriormente, terá que comprovar se sua
ideia está, ou não, correta. Métricas, nesse contexto, representam metodologias,
que serão seguidas para comprovar ou até mesmo desenvolver novas hipóteses.
205
UNIDADE 3 | ANÁLISE DE DADOS, INTEGRAÇÃO E RECURSOS HUMANOS PARA BIG DATA
206
TÓPICO 5 | APRENDIZADO DE MÁQUINA (MACHINE LEARNING)
207
UNIDADE 3 | ANÁLISE DE DADOS, INTEGRAÇÃO E RECURSOS HUMANOS PARA BIG DATA
Quadro
QUADRO 2 –2.ALGORITMOS
Algoritmos para aprendizado
PARA supervisionado
APRENDIZADO e não supervisionado
SUPERVISIONADO E NÃO SUPERVISIONADO
(Continua)
208
Quadro 2. Algoritmos para aprendizado supervisionado e não supervisionado
FONTE:
Fonte: Adaptado Adaptado
de Ferreira de(2015),
Junior Ferreira
SilvaJunior
(2016), (2015), Silva e(2016),
Dias, Pascutti Dias,
Silva (2016) Pascuttiet al. (2011).
e Carvalho
e Silva (2016) e Carvalho et al. (2011)
209
UNIDADE 3 | ANÁLISE DE DADOS, INTEGRAÇÃO E RECURSOS HUMANOS PARA BIG DATA
Outros exemplos são citados por Cortez e Morais (2007 apud CARVALHO
et al., 2011, p. 324), que mostram como algoritmos de AM podem ser utilizados
para a prevenção de incêndios florestais. Nesse trabalho, cinco algoritmos
de AM tiveram sua acurácia preditiva comparada: algoritmo de indução de
árvores de decisão, florestas aleatórias, máquinas de vetores de suporte, modelo
de regressão múltipla e redes neurais. Os dados originais tinham atributos
relacionados a coordenadas da área de incêndio, mês do ano, dia da semana,
condições atmosféricas, temperatura, umidade relativa do ar, velocidade do vento
e precipitação atmosférica. Técnicas de transformação converteram atributos
qualitativos em quantitativos, e técnicas de seleção foram utilizadas para
selecionar os atributos mais relevantes. Os melhores resultados foram obtidos
por máquinas de vetores de suporte com quatro atributos, dados meteorológicos
relacionados a temperatura, umidade relativa do ar, precipitação pluviométricas
e velocidade do vento.
210
RESUMO DO TÓPICO 5
• Que A limpeza dos dados é um passo primordial para todos os restantes, ten-
do em vista que o resultado final será com base nos dados inseridos. Nesse
sentido, as ferramentas utilizadas na coleta podem acarretar problemas, assim
como a transmissão e o armazenamento dos dados.
211
• Que a aprendizagem de máquina remete à inserção de conceitos tecnológicos
em conjunto a outros contextos, como o da estatística, da matemática e até mes-
mo da inteligência artificial, em recursos computacionais.
212
AUTOATIVIDADE
213
b) ( ) A exploração de dados pode ocorrer por meio de medidas de
distribuição, em que a média de um conjunto de valores é obtida.
c) ( ) A exploração de dados pode ocorrer por meio do uso de dados
multivariados que possuem o mesmo valor de um atributo que pode
ser detectado mais de uma vez.
d) ( ) A exploração de dados pode ocorrer por meio de dados univariados
em que os dados são compostos por mais de um atributo de entrada.
e) ( ) O intervalo e a variância estão contidos nas medidas de exploração de
dados multivariados.
214
UNIDADE 3 TÓPICO 6
INTRODUÇÃO AO HADOOP
1 INTRODUÇÃO
As pessoas ao redor do mundo geram, diariamente, grandes volumes
de dados, alguns estruturados e outros não. Esses dados são uma valiosa
fonte de informações, mas analisá-los eficientemente ainda é um desafio, pois
os mecanismos tradicionais de gerenciamento de dados não disponibilizam o
suporte adequado para a realização dessa tarefa.
2 HADOOP
Armazenar, manipular e analisar dados são tarefas convencionais para
sistemas computacionais, mas tomam outra dimensão quando o volume de
dados alcança a dimensão de petabytes diários. Esses dados são gerados por
sistemas corporativos, serviços, sistemas web, mídias sociais, comércio eletrônico
etc. Todos são potencialmente valiosos e há muito interesse em extrações de
informações que podem ser obtidas a partir de análises e cruzamentos desses
dados. Boa parte deles não está armazenada de forma estruturada e têm os mais
diversos formatos e estruturas, que, muitas vezes, não são compatíveis.
215
UNIDADE 3 | ANÁLISE DE DADOS, INTEGRAÇÃO E RECURSOS HUMANOS PARA BIG DATA
E
IMPORTANT
O alto valor agregado da empresa Google não se deve apenas ao seu potente
algoritmo de busca na web ou a suas inúmeras ferramentas, mas, também, à enorme
quantidade de informações que mantém sobre seus usuários e buscas realizadas na web.
A análise desses dados permite identificar padrões de comportamentos e correlações entre
perfis de usuários, e isso é extremamente útil. Portanto, essas informações não são valiosas
apenas para a Google, já que também podem ser comercializadas.
O termo Big Data não se refere apenas ao volume de dados, mas, também,
a sua diversidade de formatos (estruturados ou não), à variedade de fontes e à
velocidade para processá-lo. Já as aplicações Big Data são soluções computacionais
que possibilitam a análise de grandes bases de dados, processando algoritmos
que permitam identificar correlações entre os dados para mapear padrões e
comportamentos, conhecidos ou inéditos. A partir disso, torna-se possível criar
estratégias ou disponibilizar produtos e serviços.
Para atender a esse tipo de demanda é que foi projetado o Apache Hadoop,
um framework que promove um processamento muito mais rápido que outras
tecnologias e que simplifica o trabalho com sistemas distribuídos, tornando
transparentes diversas funções, tais como a disponibilidade dos nós do cluster,
escalabilidade da aplicação, integridade dos dados e recuperação em caso de falhas.
Além disso, ele possui um sistema de licenciamento flexível, que torna possíveis
modificações e redistribuição do programa-fonte. Isso permitiu o surgimento
de inúmeras implementações derivadas dele com novas funcionalidades ou que
se especializam em algum nicho de mercado, além de agregar serviços aos que
desejam utilizar seus recursos.
216
TÓPICO 6 | INTRODUÇÃO AO HADOOP
E
IMPORTANT
217
UNIDADE 3 | ANÁLISE DE DADOS, INTEGRAÇÃO E RECURSOS HUMANOS PARA BIG DATA
E
IMPORTANT
Um software que possui código aberto deve garantir quatro liberdades aos
seus usuários:
218
TÓPICO 6 | INTRODUÇÃO AO HADOOP
3 COMPONENTES DO HADOOP
O trabalho do Hadoop utiliza cinco processos: NameNode, DataNode,
SecondaryNameNode, JobTracker e TaskTracker. NameNode, DataNode,
SecondaryNameNode são integrantes do modelo de programação MapReduce.
Já JobTracker e TaskTracker fazem parte do sistema de arquivo HDFS. Os
componentes Name-Node, JobTracker e SecondaryNameNode são únicos para
toda a aplicação; por outro lado, DataNode e JobTracker são instanciados para
cada computador alocado.
219
UNIDADE 3 | ANÁLISE DE DADOS, INTEGRAÇÃO E RECURSOS HUMANOS PARA BIG DATA
4 EXECUÇÃO DO HADOOP
O Hadoop foi construído para trabalhar com um conjunto de máquinas, mas
permite outras formas de execução: modo local (standalone mode), modo pseudo-
distribuído (pseudo-distributed mode) e modo completamente distribuído (fully
distributed mode). A especificação do modo de execução é definida na configuração
dos arquivos: core-site.xml, hdfs-site.xml e mapred-site.xml.
220
TÓPICO 6 | INTRODUÇÃO AO HADOOP
FONTE: O autor
FONTE: O autor
4.1 HDFS
O Hadoop Distributed File System é o sistema de arquivos distribuídos do
Hadoop que possui um conjunto de funções como: armazenamento, organização,
nomeação, recuperação, compartilhamento, proteção e permissão de acesso aos
arquivos. Além de prover funções tradicionais de gerenciamento de arquivos,
precisa prover a distribuição dos dados de forma transparente, garantindo
eficiência e escalabilidade. Tudo isso deve ser transparente e não exigir
conhecimento adicional para operá-lo. Um sistema de arquivos distribuído deve
garantir:
221
UNIDADE 3 | ANÁLISE DE DADOS, INTEGRAÇÃO E RECURSOS HUMANOS PARA BIG DATA
E
IMPORTANT
222
TÓPICO 6 | INTRODUÇÃO AO HADOOP
hadoop fs –ls
hadoop fs -lsr
223
UNIDADE 3 | ANÁLISE DE DADOS, INTEGRAÇÃO E RECURSOS HUMANOS PARA BIG DATA
4.4 ARQUITETURA
O HDFS possui uma arquitetura mestre/escravo: no lado mestre, tem
uma instância do NameNode e, em cada escravo, uma instância do DataNode.
É possível ter centenas ou milhares de máquinas escravas. O NameNode é
o componente central do HDFS; assim, é recomendável ser implantado em
um nó exclusivo, e, preferencialmente, o nó com melhor desempenho. Para
desempenhar seu papel de gerenciar todos os blocos de arquivos, o NameNode
possui duas estruturas de dados importantes: o FsImage e o EditLog. O primeiro
arquivo é o responsável por armazenar informações estruturais dos blocos,
como o mapeamento e namespaces dos diretórios e arquivos, e a localização das
réplicas desses arquivos. O segundo, EditLog, é um arquivo de log responsável
por armazenar todas as alterações ocorridas nos metadados dos arquivos.
224
TÓPICO 6 | INTRODUÇÃO AO HADOOP
5 HADOOP MAPREDUCE
O paradigma de programação MapReduce implementado pelo Hadoop se
inspira em duas funções simples (Map e Reduce) presentes em diversas linguagens
de programação funcionais. Uma das primeiras linguagens a implementar os
conceitos dessas funções foi LISP. Essas funções podem ser facilmente explicadas
de acordo com suas implementações originais, conforme mostram os exemplos a
seguir, em que serão usados pseudocódigos para ilustrar tais funções.
A função Map recebe uma lista como entrada e, aplicando uma função
dada, gera uma nova lista como saída. Um exemplo simples é aplicar um fator
multiplicador a uma lista, por exemplo, dobrando o valor de cada elemento:
226
TÓPICO 6 | INTRODUÇÃO AO HADOOP
227
UNIDADE 3 | ANÁLISE DE DADOS, INTEGRAÇÃO E RECURSOS HUMANOS PARA BIG DATA
228
TÓPICO 6 | INTRODUÇÃO AO HADOOP
229
RESUMO DO TÓPICO 6
230
• Que grandes volumes de dados diariamente e eles são uma importante fonte
de informações, porém, seu processamento não é eficiente quando são usados
mecanismos convencionais de armazenamento e processamento de dados.
• Analisar o MapReduce.
231
AUTOATIVIDADE
232
a) ( ) O NameNode localiza-se nos nós e é responsável pelo gerenciamento
de arquivos utilizados pelo HDFS.
b) ( ) O DataNode localiza-se no nó mestre, identificando os dados que são
distribuídos e replicados.
c) ( ) O JobTracker é o responsável pelo trabalho de execução das tarefas do
MapReduce, que são realizadas nos nós.
d) ( ) O TaskTracker possui a tarefa de controlar o plano de execução do
MapReduce, designando os nós que serão utilizados.
e) ( ) O SecondaryNameNode é responsável pela verificação
dos checkpoints necessários para garantir a recuperação em caso de
falha.
233
234
UNIDADE 3 TÓPICO 7
1 INTRODUÇÃO
Há pouco tempo, utilizávamos a internet apenas para acessar os raros
sites que existiam; hoje, a conexão com a rede transcende diversos âmbitos e,
além disso, proporciona uma relação de dependência entre diversos recursos.
Assim, é muito comum notarmos que um dispositivo necessita de outro para
desempenhar alguma funcionalidade básica, e esse recurso é quase sempre a
conexão com a internet.
Neste tópico, você aprenderá sobre Big Data, conceito aplicado à análise
de grande volume de dados existentes na rede, e sobre a Internet das Coisas (In-
ternet of Things — IoT), que traz justamente a possibilidade de, por meio do uso
da conexão, alinhamento entre as funcionalidades de um dispositivo. A partir
disso, você verá o impacto de ambos, a relação entre eles e as suas possibilidades
de aplicações.
235
UNIDADE 3 | ANÁLISE DE DADOS, INTEGRAÇÃO E RECURSOS HUMANOS PARA BIG DATA
Muitas vezes, sua definição é questionada, tendo em vista, que, como foi
mencionado anteriormente, com o tempo, existiram outros termos, ferramentas
e metodologias voltados ao grande número de dados. Porém, segundo Taurion
(2013), o termo pode ter significados diferentes, conforme o perfil de quem
procura pelo seu significado. O autor ainda cita que, conforme o McKinsey Global
Institute, Big Data é a intensa utilização de redes sociais on-line, de dispositivos
móveis para conexão a internet, transações e conteúdos digitais; além disso, o
crescente uso de computação em nuvem tem gerado quantidades incalculáveis
de dados. O termo Big Data refere-se a esse conjunto de dados cujo crescimento é
exponencial e cuja dimensão está além da habilidade das ferramentas típicas de
capturar, gerenciar e analisar dados.
236
TÓPICO 7 | INTEGRANDO BIG DATA E IOT
E
IMPORTANT
O termo Internet das Coisas foi utilizado pela primeira vez em 1999 pelo
pesquisador britânico Kevin Ashton, do Massachusetts Institute of Technology (MIT).
Esses dados são relevantes, tendo em vista que estamos falando sobre o uso
da tecnologia em contextos que, antes, não eram tidos como foco, como, por exem-
plo, os negócios. Dessa forma, é por meio desse tipo de pesquisa que as empresas
começaram a investir em diversos aspectos que têm como alvo o público.
237
UNIDADE 3 | ANÁLISE DE DADOS, INTEGRAÇÃO E RECURSOS HUMANOS PARA BIG DATA
238
TÓPICO 7 | INTEGRANDO BIG DATA E IOT
Como impactos causados pelo uso do Big Data, podemos citar: maior
transparência e disponibilização de dados, que antes eram inacessíveis; acesso
a dados específicos de usuários específicos, ou seja, as informações passam a
ser individualizadas e os usuários deixam de ser agregados a grupos de perfis
específicos; maior possibilidade de realização de análises preditivas; uso de
algoritmos para tomada de decisões com base em dados e informações obtidos e
analisados anteriormente.
239
UNIDADE 3 | ANÁLISE DE DADOS, INTEGRAÇÃO E RECURSOS HUMANOS PARA BIG DATA
DICAS
240
TÓPICO 7 | INTEGRANDO BIG DATA E IOT
Ainda sob a ótica dos dados fornecidos por Taurion (2013), podemos citar
a startup brasileira IDXP, que traz soluções relacionadas à análise em tempo
real do comportamento do cliente dentro da loja. De acordo com as informações
postadas no próprio site da startup, atualmente, ela se define como:
241
UNIDADE 3 | ANÁLISE DE DADOS, INTEGRAÇÃO E RECURSOS HUMANOS PARA BIG DATA
E
IMPORTANT
Mais informações sobre a startup IDXP podem ser obtidas pelo acesso ao seu
website no link a seguir.
https://goo.gl/NCRxvB
242
TÓPICO 7 | INTEGRANDO BIG DATA E IOT
CHAMADA
243
RESUMO DO TÓPICO 7
• Que Na era tecnológica, há muitos conceitos, porém, é importante saber o que real-
mente cada um significa, de forma a ficar mais simples compreender todo o contexto
que envolve esses termos, tanto no ramo tecnológico quanto no cotidiano.
• Veja neste Infográfico os conceitos básicos do Big Data e da Internet das Coisas.
244
245
AUTOATIVIDADE
3 O Big Data permite que, por meio de suas análises, as empresas possam
evitar desperdícios, trazendo assim mais lucros financeiros, já que
um grande volume de dados é gerado e, por meio dessa tecnologia,
são analisados e estabelecidos padrões, trazendo valor às informações
geradas. O termo Internet das Coisas está integrado ao uso da Internet
na possibilidade de trazer novas funcionalidades a artefatos físicos, como
carros e casas, dentre outros.
246
b) ( ) A camada superior diz respeito aos dispositivos de rede responsáveis
pelas conexões entre os dados, por meio de tecnologias como, por
exemplo, Wi-Fi e Bluetooth, entre outras.
c) ( ) A camada superior traz dispositivos conectados em rede e que
utilizam tecnologias ligadas a conceitos de IoT.
d) ( ) A camada superior representa os sensores e os objetos que são
conectados por meio de uma rede sem fio.
e) ( ) A camada superior traz um gerenciamento de aplicativos e mecanismos
de processamentos ligados primeiramente a tecnologias de IoT.
Quais são as etapas de análise aplicadas na última fase de integração entre IoT
e Big Data?
a) ( ) Enablers e engagers.
b) ( ) Melhoradores e enablers.
c) ( ) Engagers e melhoradores.
d) ( ) Enablers e melhoradores.
e) ( ) Big Data e engagers.
247
248
REFERÊNCIAS
ARANHA, C.; PASSOS, E. A Tecnologia de Mineração de Textos. RESI -
Revista Eletrônica de Sistemas de Informação, v. 5, n. 2, p. 1-8, 2006. Disponível
em: <http://www.spell.org.br/documentos/ver/26518/a-tecnologia-de-mineracao-
de-textos>. Acesso em: 4 jan. 2019.
BRULEY, M. Big Data & Text Mining. 16 jan. 2014. Disponível em: <https://
www.slideshare.net/MichelBruley/1-text-mining-v0a>. Acesso em: 4 jan. 2019.
249