Você está na página 1de 53

GIOVANI FELIPE JAHN

Dissertação de Mestrado

UNIVERSIDADE FEDERAL DE PERNAMBUCO
CIN – CENTRO DE INFORMÁTICA
PÓS-GRADUÇÃO EM CIÊNCIA DA COMPUTAÇÃO
posgraduacao@cin.ufpe.br
www.cin.ufpe.br/~posgraduacao

RECIFE
2017
1/52
UMA PROPOSTA DE ARQUITETURA PARA TRATAMENTO DE DADOS NÃO
ESTRUTURADOS NO ÂMBITO DOS INSTITUTOS FEDERAIS DE EDUCAÇÃO

Aluno:
GIOVANI FELIPE JAHN

Orientador:
Vinicius Cardoso Garcia

Dissertação de Mestrado Profissional em Ciência da Computação 2/52
SUMÁRIO

1. Introdução/Motivação
2. Objetivos
3. Abordagem Metodológica
4. Referencial Teórico
5. Arquitetura de Referência
6. Aplicação da Arquitetura
7. Avaliação
8. Considerações Finais
9. Referências

Dissertação de Mestrado Profissional em Ciência da Computação 3/52
1. Introdução/motivação

● Cenário

Figura 1: Dados produzidos pelas redes ligadas à Internet
Fonte: Excelacom.com
4/52
1. Introdução/motivação

● Cenário

○ O tratamento destes dados, com finalidades analíticas;

○ dados podem fornecer insights e conhecimentos valiosos para as instituições de ensino (WASSANR 2015);

○ instituições de ensino estão usando dados analíticos para melhorar os serviços prestados;

○ Big Data, Cloud, NoSQL, Open Source;

○ agregar as novas tendências de tratamento de dados não estruturados à realidade institucional?

○ uma análise exploratória sobre estas tecnologias é cabível e muito útil;

5/52
1. Introdução/motivação

Pergunta de pesquisa:

Como tratar dados não estruturados, visando o proveito
em uma instituição federal de ensino?

6/52
2. Objetivos

Objetivo Geral

○ Propor uma arquitetura de referência para tratamento de dados não estruturados.

Objetivos específicos

● Apresentar o estado da arte nos temas Big Data, Analytics, NoSQL;
● caracterizar o papel das bases de dados NoSQL;
● comparar as formas de tratamento de dados;
● identificar as técnicas e ferramentas empregadas para soluções de tratamento de dados não estruturados;
● propor uma arquitetura de tratamento de dados não estruturados (NoSQL), identificada com a realidade do
Instituto Federal de Educação Ciência e Tecnologia Farroupilha;
● construir conhecimento no escopo dos Institutos Federais de Educação a partir do estudo de dados não
estruturados.

7/52
2. Objetivos

Contribuição

Propor uma arquitetura e propiciar crescimento tecnológico
institucional e científico.

8/52
3. Abordagem Metodológica

● Teórico-conceitual fundamentada em revisão da literatura

○ Objetiva explorar uma área com escassez de conhecimento (VERGARA, 2005).

9/52
3. Abordagem Metodológica - Caracterização da pesquisa

● Procedimento racional e sistemático com o objetivo de buscar respostas à
problemas (GIL, 2002);

● solução de problemas teóricos ou práticos (CERVO E BERVIAN, 2002);

● necessidade de modernização dos métodos de pesquisa e adequação ao problema
apresentado – Design Science (DAFT e LEVIN, 1990; ROMME 2003).

10/52
3. Abordagem Metodológica - DSR

● Design Science Research

○ fenômenos artificiais (VAISHNAVI e KUECHLER, 2009);

○ Ciência da Informação -> Ciência Aplicada -> Ciência de Projeto (VAKKARI, 1994);

○ desenvolvedora de artefatos tecnológicos para atender as necessidades práticas das

organizações (VAN HAKEN, 2004).

Ponto de Partida da Observação da Metodo Científico Objetivos da
Pesquisa Realidade Pesquisa

• Razões para • Proposta/Projeto • Hipotético- • Propor
realizar a de um artefato dedutivo • Projetar
pesquisa:
• Resposta para
uma questão
importante

Figura 2: Demonstrativo sintético da pesquisa, segundo o DSR
Fonte: Elaborado pelo autor
11/52
3. Abordagem Metodológica - Pesquisa bibliográfica exploratória

● Revisão da Literatura

ACM Digital
Google Scholar Scopus Web Of Science IEEE
Library
BigData 12.300 387 235 281 158
NoSQL 15.900 1.331 810 602 182
NoSQL database 7.920 1.201 623 538 80
NoSQL Clusters 71 122 83 74 1
NoSQL Engine 57 135 56 65 2
NoSQL Architecture 65 272 159 147 1
NoSQL Education 1 24 9 9 0
Hadoop + 28.300 4.964 3.183 2.961 510
MapReduce + 16.600 5.105 3.575 3.123 657
Arquiteturas BigData 0 0 0 282 0
BigData Analytics 322 78 53 61 11

Tabela 1: Relação de termos pesquisados em repositórios e quantidade retornada em número de artigos/dissertações/teses 12/52
Fonte: Elaborado pelo autor
3. Abordagem Metodológica
Revisão Sistemática da Seleção de fontes de
Literatura informação literária
Elaboração de
questionário
Classificação de Artigos Definição de palavras
e Publicações de busca
Definição de
Definição de índices e grupos alvos
Leitura dos resumos amplitude de tempo

Classificação dos Envio de formulário
Buscas
resumos por categorias

Leitura integral dos Analise sobre os título Análise dos
artigos e publicações encontrados formularios e dados

Estruturação de Análise sobre os Exibição dos
capítulos resumos
resultados
Figura 5: Síntese da coleta de dados em instituições federais de ensino - survey
Pesquisa leitura das publicações Fonte: Elaborado pelo autor

Classificação e análise
Redação dos capítulos das publicações

Figura 3: Plano de trabalho Figura 4: Síntese da coleta de dados em repositórios literários 13/52
Fonte: Elaborado pelo autor Fonte: Elaborado pelo autor
3. Abordagem Metodológica
Elaboração de cenários
● Proposição da solução
Definição do pré-
● Avaliação requisitos

Elaboração de
formulário de avaliação

Definição de grupos
alvos

Envio de formulário

Análise dos formularios
e dados

Exibição dos resultados

Figura 6: Etapas do processo de avaliação
Fonte: Elaborado pelo autor
14/52
4. Referencial Teórico

● Características - Big Data, tratamento de dados, dados não estruturados, NoSQL,
Analytics;

● funcionalidades, fluxos de dados e armazenamento de dados de arquiteturas
dispostos na literatura;

● conceitos de adoção de tecnologias NoSQL estão presentes em domínios de Big
Data (VIEIRA et. al., 2012);

15/52
4. Referencial Teórico

Figura 7: Lista dos termos abordados no referencial teórico 16/52
Fonte: Elaborado pelo autor
4. Referencial Teórico
● NoSQL

Escalabilidade (horizontal)

Grandes Volumes

Distribuídos

Simplicidade

Flexibilidade – Bancos de dados NoSQL são livres de imposição de um esquema.

BASE (Basic Availability, Soft State, Eventual Consistency) x ACID (Atômica, Consistente,
Isolada e Durável) - Pritchett (2008);

Diponibilidade
17/52
4. Referencial Teórico
● Trabalhos relacionados

- Towards a Big Data Reference Architecture” (MAIER, 2013)
○ Abordagem sobre tecnologias que podem ser usadas para implementar uma arquitetura de
referência;
○ Como o ecossistema Apache Hadoop e bancos de dados "NoSQL” podem compor arquitetura de
referência;

- Reference Architecture and Classification of Technologies, Products and Services for Big Data Systems
PÄÄKKÖNEN e PAKKALA (2016)
○ aborda casos de uso em arquiteturas de big data por grandes empresas como Facebool, LinkedIn
ou Netflix;

- BASIS: Uma Arquitetura de Big Data para Smart Cities COSTA (2015)
○ Propõe uma arquitetura de Big Data para Smart Cities;
○ Integra componentes tecnológicos de uma arquitetura em várias camadas de abstração, desde a
mais conceptual até a mais tecnológica;

18/52
5. Arquitetura de referência

Propor um modelo de arquitetura de referência:

○ Baseada na análise de casos publicados em trabalhos sobre o uso de tecnologias e
arquiteturas heterogêneas;

○ estudo sobre ferramentas e técnicas de tratamento de dados;

○ facilita a criação de uma arquitetura de design mais elaborada e a seleção de tecnologias
ou soluções comerciais;

○ construída indutivamente com base nos casos da literatura.

19/52
5. Arquitetura de referência

Deve prover a execução das seguintes tarefas:

a) Extrair dados relacionados ao contexto educacional (mas não somente estes) postados por
usuários de redes sociais;
b) extrair dados relacionados ao contexto educacional (mas não somente estes) encontrados
na Internet;
c) extrair dados de sistemas utilizados pela instituição;
d) prover escalabilidade linear para a quantidade de registros que são armazenados;
e) analisar e classificar dados de conteúdo (função analytic – de acordo com os objetivos
específicos da instituição);
f) exibir para o usuário final um Dashboard ou aplicativos web para visualização dos resultados
obtidos após a análise.

20/52
5. Arquitetura de referência

Figura 8: Resumo do aspecto conceitual da arquitetura de referência proposta
Fonte: Elaborado pelo autor
21/52
5. Arquitetura de referência

Desenvolvimento da arquitetura de referência – dois modelos:

a) Arquitetura Conceitual: descreve os níveis que constituem a arquitetura e a explicação das
atividades que são realizadas em cada um dos níveis.

b) Arquitetura Funcional: descreve uma solução tecnológica, através da instanciação de
tecnologias para cada um dos níveis identificados na arquitetura conceitual.

22/52
5. Arquitetura de referência
PROCESSAMENTO ANÁLISE
FONTE AQUISIÇÃO ARMAZENAMENTO VISUALIZAÇÃO
TRANSFORMAÇÃO

Estruturado

/ API
DASHBOARDS
E
T / /
L
Semi-Estr

/ REST

APLICATIVOS
WEB
Não Estr

Figura 9: Arquitetura de referência - alto grau de abstração
Fonte: Elaborado pelo autor 23/52
5. Arquitetura de referência

Fonte:

○ procuram identificar as diferentes origens e tipos de dados que podem ser utilizados;

○ redes sociais, arquivos de texto, vídeos, dados estruturados oriundos de sistemas locais.

24/52
5. Arquitetura de referência

Aquisição:

○ corresponde à entrada de dados no sistema;

○ extração através de APIs disponibilizadas;

○ capturar conteúdo web / postagens públicas através de serviços - REST (Representational State
Transfer - W3C);

○ responsável pelo processo de Extract Transform and Load (ETL) - ações relativas à extração
dos dados (estruturados, semi-estruturados ou não estruturados), transformação e limpeza
(correções), posteriormente levados para o processo (área) de armazenamento (CHAUDHURI
et al., 2011);

○ (ETL = pipeline de dados. A complexidade dos requisitos de coleta e transformação irá
depender dos objetivos do sistema).
25/52
5. Arquitetura de referência

Aquisição:

○ quando extraídos, dados podem ser armazenados temporariamente (base de dados TEMP) ou transferidos
e em “dados Crus”, exclusiva para dados não processados (PAAKKONEN e PAKKALA , 2014) ;

○ mesmo procedimento pode, a critério, para aos dados de transmissão em fluxo contínuo;

○ a compressão dos dados extraídos, pode melhorar a eficiência dos processos de tranferência e carga;

○ “dados crus” podem ser limpos ou combinados e salvos em um novo armazenamento ou enviados
diretamente para a etapa de análise;

○ “dados prontos” podem ser replicados entre os armazenamentos de dados;

○ a extração de informações refere-se ao armazenamento de dados brutos em um formato estruturado;

○ “dados prontos” repositório para dados processados e limpos.

26/52
5. Arquitetura de referência

Processamento:

○ Em uma arquitetura de referência o módulo de processamento deve focar sua responsabilidade
sobre a execução eficiente, escalável e confiável das etapas da arquitetura (Klein et. al 2016) ;
○ disseminar os dados por toda arquitetura;
○ implantar e gerenciar os mecanismos para atender os requisitos que o sistema quer satisfazer;
○ implantar e gerenciar a infraestrutura de distribuição dos dados entre os clusters;
○ prover escalabilidade - novos canais de dados quando necessário;
○ configurar e combinar os outros módulos de ações sobre os dados;
○ processamento distribuído (com réplicas) – distribuir e manipular o armazenamento de dados
entre todas as máquinas do cluster;
○ armazenar os dados oriundos das diversas etapas e diferentes níveis da arquitetura;
○ possui escopo amplo, atuando também sobre a etapa que de ETL.
27/52
5. Arquitetura de referência
Análise:

○ obtenção eficiente do conhecimento a partir dos dados;

○ ocorre desde a extração, podendo serem feitas análises mais profundas de acordo com
solicitações do usuário;

○ procedimentos analíticos - algoritmos de Data Mining, Predictive Analysis, querys adhoc;

○ resultados da análise podem ser armazenados novamente em “dados prontos” ou em um
armazenamento de resultados de análise separado;

○ a análise de tempo real - sinônimo para análise de fluxo - OLAP;

○ cloud computing nesse processo é indicado para permitir que os dados sejam guardados,
acessados e utilizados em qualquer local.
28/52
5. Arquitetura de referência

Visualização:

○ apresentação dos dados processados em um formato que expresse conhecimento;

○ fornece uma "interface humana" para estas informações em relação ao usuário final;

○ devem também permitir ao usuário publicar relatórios acessíveis de plataformas –
computadores/ smartphones.

29/52
5. Arquitetura de referência

Figura 10: Arquitetura de referência
Fonte: Elaborado pelo autor
30/52
5. Arquitetura de referência

Considerações

○ possibilita que o tratamento de dados não estruturados seja abordado

- para com futuras proposições de implementação de um sistema;

- para a composição de uma arquitetura mais refinada;

○ por meio da arquitetura - utilização de dados de redes sociais - decisões sobre a área da
educação;

○ insigths para melhoria da gestão pública.

31/52
6. Uma proposta de utilização de arquitetura para tratamento de dados
não estruturados no ambiente dos Institutos Federais de Educação

○ Instituto Federal de Educação, Ciência e Tecnologia Farroupilha representando os
institutos federais de educação;

○ tentativa de prover uma solução para o problema inicial;

○ utilizar preferencialmente tecnologias embasadas no formato de licenças open source;

○ apresentação da arquitetura elaborada - detalhamento de componentes.

32/52
6. Uma proposta de utilização de arquitetura para tratamento de dados
não estruturados no ambiente dos Institutos Federais de Educação

"Nunca ouvi Meu trabalho na
falar" / Li a respeito Conheço o assunto Instituição é inerente ao
Desconheço assunto

Dados não Estruturados n 8 7 4 1
e/ou Dados NoSQL
% 40,0% 35,0% 20,0% 5,0%
n 7 7 5 1
IoT
% 35,0% 35,0% 25,0% 5,0%
n 7 12 1 0
Big Data Analytics"
% 35,0% 60,0% 5,0% 0,0%
n 9 10 1 0
Open Data"
% 45,0% 50,0% 5,0% 0,0%
n 15 5 0 0
Smart Governance"
% 75,0% 25,0% 0,0% 0,0%
n 10 10 0 0
Social Big Data"
% 50,0% 50,0% 0,0% 0,0%
n 13 6 1 0
Data Science"
% 65,0% 30,0% 5,0% 0,0%

Tabela 2: Nível de conhecimento acerca dos assuntos da pesquisa - Profissionais de TI/IFFar - 2016 33/52
Fonte: Elaborado pelo autor
6. Uma proposta de utilização de arquitetura para tratamento de dados
não estruturados no ambiente dos Institutos Federais de Educação

Gestor
Analista de T.I. Técnico de T.I. Professor
Administrativo

N % n % N % N %

Extremamente importante 0 0% 1 10% 3 60% 0 0%

Poderia ser útil de alguma 1 33% 2 20% 0 0% 1 50%
forma
Irrelevante 0 0% 2 20% 0 0% 0 0%

Relevante 2 67% 5 50% 2 40% 1 50%

Total 3 100% 10 100% 5 100% 2 100%

Tabela 3: Nível de importância dos dados não estruturados de redes sociais x Cargo que ocupa - Profissionais de TI/IFFar - 2016
Fonte: Elaborado pelo autor

34/52
6. Uma proposta de utilização de arquitetura para tratamento de dados
não estruturados no ambiente dos Institutos Federais de Educação

Técnico de Gestor
Dados não estruturados Analista de T.I. Professor
T.I. Administrativo

n % n % n % n %

Até o momento não obtive 2 67% 7 70% 4 100% 1 50%

contato com nenhum

Já utilizei (como usuário) 1 33% 2 20% 0 0% 1 50%

Já participei no processo de 0 0% 1 10% 0 0% 0 0%

construção de software

Total 3 100% 10 100% 4 100% 2 100%

Tabela 4: Utilização de softwares no tratamento de dados não estruturados - Profissionais de TI/IFFar - 2016
Fonte: Elaborado pelo autor

35/52
6. Uma proposta de utilização de arquitetura para tratamento de dados
não estruturados no ambiente dos Institutos Federais de Educação

Utilizou na construção de um
Leu a respeito
sistema

n % n %
Hadoop 3 15% 0 0%
MapReduce 1 5% 0 0%
Cassandra 1 5% 0 0%
MongoDb 2 10% 0 0%
Kafka 1 5% 1 5%
Hbase 1 5% 1 5%

Tabela 5: Conhecimento quanto a ferramentas específicas - Profissionais de TI/IFFar - 2016
Fonte: Elaborado pelo autor
36/52
6. Uma proposta de utilização de arquitetura para tratamento de dados
não estruturados no ambiente dos Institutos Federais de Educação

○ Vantagens de se usar uma solução open source para os institutos federais

Base de MapReduc Método de
Tipo GPL API REST API Java
Dados e Distribuição
Família de Hashing
Cassandra sim Sim não sim
Colunas
CouchDB Documento sim Sim sim sim Hashing
Família de Range
HBase sim Sim sim sim
Colunas
MongoDB Documento sim Sim sim sim range
Neo4J Grafo parcial Não sim sim não se aplica
Redis Chave/valor sim Não não sim Hashing

Tabela 6: Características resumidas das bases de dados open source
Fonte: Elaborado pelo autor
37/52
6. Uma proposta de utilização de arquitetura para tratamento de dados
não estruturados no ambiente dos Institutos Federais de Educação

○ Uma proposta de arquitetura baseada em ferramentas open source e de livre licença

Fonte de Dados Busca / Aquisição Carregamento Transformação Armazenamento Visualização
(Extração
Resultados)

• Logs de Sistemas • Kafka • HBase • Hadoop • HDFS • Tableau
• Redes Sociais • Storm • Hive (SQL)
• Internet* • HBASE (NoSQL) ou
Cassandra

Figura 11: Proposta de arquitetura de referência com ferramentas open source para o IFFar – baseada em análise de literatura
Fonte: Elaborado pelo autor

38/52
6. Uma proposta de utilização de arquitetura para tratamento de dados
não estruturados no ambiente dos Institutos Federais de Educação

Figura 12: Arquitetura proposta para tratamento de dados não estruturados para IFFAR
Fonte: Elaborado pelo autor 39/52
7. Avaliação

SAAM (Software Architecture Analisys Method)

○ SAAM (Software Architecture Analysis Method) tem com principal objetivo auxiliar
arquitetos de software na escolha/comparação de proposições de soluções
arquiteturais de sistema (KAZMAN et al., 1994);

○ ter na forma de resultados, a produção dos cenários inerentes ao sistema;

○ métodos de avaliação de arquiteturas como SAAM, não podem ser diretamente
aplicados a arquiteturas de referência - diferenças entre arquiteturas concretas e
arquiteturas de referência (BASS et al. 2003);

○ SAAM “adaptado”.

40/52
7. Avaliação

Metodologia de avaliação sugerida

• Apresentar o
Passo 1
método de avaliação

Passo 2
• Apresentar os objetivos para o
desenvolvimento da arquitetura

Passo 3 • Apresentar a
arquitetura proposta

Passo 4
• Apresentar
cenários
Requisitos Análise Arquitetura de • Avaliar
Passo 5
arquiteturais arquitetural referência cenários
• Lista de • Avaliadores • Validação
cenários externos
Passo 6 • Validação

Figura 13: Análise arquitetural para uma arquitetura de referência Figura 13: Etapas do método de avaliação da arquitetura (SAAM adaptado)
Fonte: Elaborado pelo autor Fonte: Elaborado pelo autor

41/52
7. Avaliação

Cenários

Cenário 1 – Permitir a coleta de dados de diferentes fontes (sistemas, rede social, SGBDs);

Cenário 2 – Prover o carregamento de dados de formatos diversos (texto, imagem, logs, arquivos,
streaming);

Cenário 3 – Permitir armazenamento em larga escala;

Cenário 4 – Permitir a analise e transformação de dados de diferentes formatos;

Cenário 5 – Permitir escalabilidade;

Cenário 6 – Fornecer mecanismo para tolerância a falhas;

Cenário 7 – Fornecer suporte para serviços de Cloud;

Cenário 8 – Permitir a visualização dos dados transformados;
42/52
7. Avaliação

Processo de avaliação

○ Montar equipe de avaliação (remotamente distribuída);

○ Pré-requisitos;

○ Descrição do método;

○ Apresentação da arquitetura;

○ Contextualizar os cenários para a equipe;

43/52
7. Avaliação

Equipe de avaliação

Doutor Docente em BD/ Data Mining 2
Mestre Docente em BD/Data Mining Atende
Doutor Docente em Desenvolvimento de Sistemas 14%
Mestre Docente em Desenvolvimento de Sistemas 3 0%
Não
Doutor Docente em Áreas Correlatas 86% atende
Mestre Docente em Áreas Correlatas 2
Doutor Analista de T.I. em BD/ Data Mining Atende
com
Mestre Analista de T.I. em BD/Data Mining Restrições
Doutor Analista de T.I. em Desenvolvimento de Sistemas
Figura 15: Avaliação dos especialistas quanto ao
Mestre Analista de T.I. em Desenvolvimento de Sistemas atendimento dos cenários pela arquitetura de referência
Doutor Analista de T.I. em Áreas Correlatas Fonte: Elaborado pelo autor

Mestre Analista de T.I. em Áreas Correlatas

Quadro 1: Quanto à formação/cargo que exerce/ área em que efetivamente atua
Fonte: Elaborado pelo autor
44/52
7. Avaliação

Considerações da equipe de avaliação

• cenário C1 - um dos avaliadores observou que que é adequado a proposta de arquitetura,
contudo usar um filtro (key words) para orientar a coleta;
• cenário C2 - deve ser observado e quantificado o esforço computacional - motores de busca;
• idem para o cenário C3;
• cenário C6 - considerar uma taxa de Main Time to Failure para o ambiente tolerante a falhas;
• demais cenários considerados adequados.

45/52
7. Avaliação

Ameaças ao processo de avaliação

○ pequeno número de avaliadores consultados;

○ não se pode assegurar atendidos os pré-requisitos, habilidades e conhecimentos;

○ não ter havido uma implementação efetiva.

46/52
8. Considerações finais

Trabalho realizado

○ o problema de pesquisa questiona como tratar dados não estruturados – “IFs”;

○ referencial teórico;

○ survey - o grau de ineditismo do assunto “NoSQL”;

○ prospecto de arquitetura de referência;

○ arquitetura funcional por meio de open source;

○ arquitetura respondeu positivamente à avaliação.

47/52
8. Considerações finais

Resultados

○ O problema teve uma resposta;

○ possível estudar e produzir conhecimento quanto às tecnologias envolvidas -
importância dos dados para educação;

○ características principais sobre as ferramentas candidatas de escolha, como Hbase,
Cassandra, MogoDB, Kafka, Tableau, entre tantas;

○ contribuições acadêmicas - propiciado a novos pesquisadores uma visão sobre
tratamento de dados NoSQL, base para futuras implementações;

48/52
8. Considerações finais

Resultados

○ IFFar é beneficiado pela pesquisa - análise sobre si mesma e proposição de um
produto (mesmo que de implementação futura);

○ os gestores, enquanto responsáveis um órgão governamental de educação,
pesquisa e extensão, beneficiam-se para tomadas de decisões.

49/52
8. Considerações finais

Dificuldades e limitações

○ adentrar num campo relativamente novo;

○ pouca interação dos demais profissionais de TI da Instituição;

○ testar efetivamente, via implementação de um cluster, a arquitetura sugerida.

50/52
8. Considerações finais

Trabalhos futuros

○ Aprofundar o estudo;

○ refinar a arquitetura;

○ implantar em um ambiente real a atual proposta;

○ papel analítico validado e prover utilidade;

○ explorar técnicas e tecnologias voltadas a segurança deste presumido sistema.

51/52
9. Referências
Nome do artigo Ano Autor Publicação

Composable architecture for rack scale big data computing 2017 Li, Chung-Sheng, et al Future Generation Computer Systems 67

Persisting big-data: The NoSQL landscape 2017 Corbellini, Alejandro, et al Information Systems 63
Big Data e Transparência: Utilizando Funções de Mapreduce para incrementar a 2016 Eduardo de Paiva XII Brazilian Symposium on Information
transparência dos Gast os Públicos Kate Revoredo Systems, Florianópolis, SC, May 17-20, 2016

Reference Architecture for Big Data Systems in the National Security Domain 2016 John Klein Ross Buglak, David Blockow, Troy Wuttke, 2nd International Workshop on BIG Data
Brenton Cooper Software Engineering
An Effective NoSQL-Based Vector Map Tile Management Approach 2016 Wan, Lin, Zhou Huang, and Xia Peng ISPRS International Journal of Geo-Information

Análise Comparativa dos Bancos Orientados a Grafos de Primeira e Segunda Geração– 2016 Alvarez, Guilherme M., Flávio Ceci, and Alexandre L. III Encontro de Inovação em SI, Florianópolis,
Uma Aplicação na Análise Social Gonçalves SC

Use a análise de big data e de dados rápidos para usufruir da análise como serviço 2016 Chelliah Pethuru Raj, Skylab Vanga IBM Developer Works
(AaaS)
Forensic investigation framework for the document store NoSQL DBMS: MongoDB as a 2016 Yoon, Jongseong, et al. Digital Investigation 17
case study
NoSQL Injection: Data Security on Web Vulnerability 2016 Abdalla, Hemn B., et al. International Journal of Security and Its
Applications 10.9
RDBMS, NoSQL, Hadoop: A Performance-Based Empirical Analysis 2016 Yassien, Amal W., and Amr F. Desouky Proceedings of the 2nd Africa and Middle East
Conference on Software Engineering

A flexible and scalable architecture for real-time ANT+ sensor data acquisition and 2016 Mehmood, Nadeem Qaisar, Rosario Culmone, and Leonardo International Journal of Distributed Sensor
nosql storage Mostarda Networks 12.5
Design Assistant for NoSQL Technology Selection 2015 John Klein and Ian Gorton Proceedings of the 1st International Workshop
on Future of Software Architecture Design
Assistants
Big Data Design 2015 Alberto Abelló In: Proceedings of the ACM Eighteenth
International Workshop on Data Warehousing
and OLAP

Quadro 2: Matriz de artigos utilizados
52/52
Fonte: Elaborado pelo autor
Muitíssimo grato!

“Foi um privilégio ter estado com vocês.”