Você está na página 1de 71

Sefaz-df

Análise de Informações
Business Intelligence
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

SUMÁRIO
Business Intelligence...................................................................................3
Introdução.................................................................................................3
1. Business Intelligence (BI).........................................................................4
2. Big Data – Conceitos................................................................................8
3. Premissas do Big Data............................................................................ 15
4. Características do Big Data..................................................................... 18
4.1. Hadoop.............................................................................................. 18
4.2. Ecossistema Hadoop............................................................................ 22
4.3. NoSQL............................................................................................... 25
5. Aplicações do Big Data no mercado.......................................................... 33
Resumo.................................................................................................... 35
Questões de Concursos.............................................................................. 37
Gabarito................................................................................................... 49
Gabarito Comentado.................................................................................. 50

O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 2 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

BUSINESS INTELLIGENCE

Introdução

No capítulo anterior, tivemos a oportunidade de conversar sobre o modelo di-

mensional, ou multidimensional. Sobre como ele é importante para as empresas

que desejam ter seus dados disponíveis para análise e geração de relatórios sem

que isso possa trazer prejuízos de performance para o banco de dados.

Pudemos perceber que a metodologia envolvida para o desenvolvimento tinha

dois grandes defensores, Inmon e Kimball, que, apesar de possuírem pequenas

modificações, ainda seguem para o mesmo fim: montar e disponibilizar o Data

Warehouse, seja ele o DW corporativo para atender a todos os setores de uma em-

presa ou com o Data Mart para atender a cada setor por vez.

Por fim, chegamos ao ETL, a ferramenta responsável por realizar a extração,

transformação (integração, limpeza etc.) e carga no DW.

Mas apesar de termos estudado tanto sobre o DW, não tratei das ferramentas de

OLAP e isso foi proposital; quis deixar esse assunto para ser tratado aqui, quando

discutiremos sobre Big Data. E por que isso? Simples, eu acredito que o Big Data é

o “novo Business Intelligence (BI)”, e antes de entrarmos no assunto sobre o que

é e como se chega lá, precisamos dar uma passadinha no que ainda é e será muito

utilizado, que é o Business Intelligence.

Se você reparar, estamos mais alguns degraus acima na nossa jornada e BI é

uma parte desse degrau; do que adianta criar DW se eu não usá-lo numa ferra-

menta de OLAP?

O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 3 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

1. Business Intelligence (BI)

O interessante do BI é que depois do trabalho “sujo” na montagem do DW e seu

processo de carga definido pelo ETL, é nessa ferramenta que somos capazes de dar

vazão para a elaboração, enfim, dos tais relatórios que irão responder a todas as

dúvidas dos gestores. Claro que cada projeto possui os seus riscos; já pensou se a

área de TI não realiza o levantamento correto das necessidades dos usuários e no

final apresenta um gráfico ou relatório que não atende direito o que a alta gestão

gostaria de ver? Ou se o gestor está com dúvidas do que gostaria de saber, quais

indicadores ele gostaria de monitorar?

Por definição, BI é uma ferramenta que coleta e processa grandes volumes

de dados de sistemas internos e externos. Seu principal objetivo é encontrar

informações desses dados cruzados, principalmente por meio de consultas/

relatórios analíticos e painéis (dashboards) que possam fornecer aos funcio-

nários e gerentes o poder de acelerar e aprimorar as tomadas de decisões,

aumentar a eficiência operacional, identificar tendências de mercado, apontar

novas oportunidades de negócios e mostrar indicadores chaves de performance

(KPI) reais.

Uma coisa que eu acho interessante no BI é que ele não foi feito para mostrar

como a empresa está bem, e sim o contrário! Isso mesmo! Ele foca em apontar

onde estão os gargalos, onde as informações não batem, para que assim os indica-

dores da empresa possam ser ajustados, melhorados.

O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 4 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

Um característica importante sobre o BI que vale a pena citar é a criação de

cubos para ajudar na análise dos dados.

O cubo é a representação de uma visão de um conjunto de dados dimensional.

Como assim? Ele é a generalização de duas ou três dimensões para trazer uma

visão de algo. Exemplo: uma empresa gostaria de ver os dados financeiros suma-

rizados por produtos, pelo tempo e por cidade para que assim possa comparar as

despesas de orçamentos. Então podemos dizer que produto, tempo e cidade seriam

as dimensões de dados.

Figura 1 – Exemplo de Cubo

O cubo é um atalho para se obter um conjunto de dados específicos; ele facilita

a visão de algo, no lugar de você ter de olhar um mundo de dados.

O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 5 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

Dentro das ferramentas de BI temos diversas opções de construção de gráficos

e relatórios; alguns desses gráficos são disponibilizados em painéis para a alta ges-

tão para que eles possam monitorar os indicadores da empresa, percebendo quan-

do algum problema está acontecendo ou analisando as informações para poder ter

novos insights.

Figura 2 – Exemplo de um painel com várias gráficos

O interessante dessa plataforma é a facilidade de gerar novas visões, uma vez

que os dados por trás já estejam definidos nas dimensões e fatos. A imagem abaixo

traz uma visão de uma tela em que eu tenho, do lado esquerdo, as minhas colunas

disponíveis, e uma interface amigável na qual eu possa construir gráficos e rela-


O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 6 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

tórios instantaneamente. Eu seleciono as colunas que quero mostrar no gráfico,

informo se terá algum filtro específico (ano, cidade etc.), seleciono o tipo de gráfico

que quero ver e ele automaticamente já me mostra um esboço dessa visão. Faço

os ajustes necessários e a partir daí posso até compartilhar via e-mail com outras

pessoas.

Figura 3 – Exemplo de construção de um gráfico pelo usuário final

Traçando o início para a nossa conversa sobre Big Data, o BI é uma ferramenta

poderosa que analisa o passado de uma instituição para ajudar a tomar decisões,

corrigir problemas. No BI conhecemos as perguntas que iremos fazer devido à for-

ma como foi concebida nos relatórios. Já no Big Data, temos essa visão e outras;

nele temos a capacidade de expandir o pensamento para analisar o passado e ten-

tar até prever o futuro. Com ele podemos cruzar informações que antes não esta-
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 7 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

vam disponíveis, que não se conversavam e agora, com o poder do processamento

e armazenagem distribuídos, isso é possível. A imagem abaixo mostra o quadrante

em que cada uma das ferramentas se encaixa nesse contexto:

Figura 4 – Área de atuação do BI e Big Data

2. Big Data – Conceitos

O que é Big Data? De forma genérica: é um volume de dados gigantesco que

não pode ser armazenado ou processado usando as técnicas tradicionais em um

determinado tempo. Ele é composto por dados estruturados e não estruturados e

que impactam os negócios no dia a dia.

Um fato interessante é que estamos acostumados a medir o dado pelo seu

tamanho, MB, GB, TB, EX, mas, quando falamos de Big Data, isso depende do

contexto. Por exemplo: para um e-mail que suporta anexos de até 25 MB, ter de

gerenciar um arquivo de 100MB seria considerado um Big Data.


O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 8 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

Um outro exemplo seria: imagine que você possua 10TB de imagens que preci-

sam ser processadas em um determinado tempo utilizando recursos de processa-

mento tradicionais. Realizar esse procedimento nos moldes atuais não seria possí-

vel, classificando assim esse volume de dados como Big Data.

O Facebook gera aproximadamente 100TB de dados todos os dias; o Twitter

gera 400 milhões de twits por dia e o Youtube gera 48.000 vídeos novos por dia.

Então você poderia se perguntar: por que é tão importante guardar esses dados?

Com o volume de usuários crescendo todos os dias, com os desafios para geren-

ciar todas essas informações, a resposta não poderia ser mais simples: receita,

dinheiro, grana! Isso mesmo, informação é valiosa e é um diferencial para que uma

empresa possa se destacar no mercado, acertar uma expectativa, investir correta-

mente, enfim, várias vertentes que estão ligadas à geração de receita por meio de

informações.

Figura 5 – Estimativa de crescimento em 2017 para Big Data

O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 9 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

O importante quando analisamos dados não é necessariamente a quantidade,

e sim o que as empresas fazem com os dados. O Big Data pode ser utilizado para

trazer novos insights que levam a melhores decisões dentro de uma empresa; me-

lhores decisões levam a uma melhor geração de renda e diferença de mercado.

Hoje temos uma grande diferença quando comparados com o passado: as uni-

dades de armazenamento (HD) ficaram mais baratas, mas mesmo assim não so-

mos capazes de armazenar tudo em um único disco, ainda seria muita informação.

Por isso, o armazenamento é realizado em vários discos distribuídos. E se, além de

armazenar de forma distribuída, executássemos o processamento de forma parale-

la? É exatamente aí que entre uma tecnologia chamada Hadoop.

Figura 6 – Queda do custo do GB pelo tempo.

O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 10 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

Antes que possamos tratar de Hadoop, é importante definir os o conceitos que

ajudam a compreender o que é o Big Data. Quando analisamos algumas empresas

e como elas definem o que é o Big Data – como Gartner Group, MCAFEE e Inter-

national Data Corporation –, todas sempre envolvem a questão da quantidade de

dados; a Gartner Group ainda considera mais duas vertentes importantes: velo-

cidade e variedade, definindo assim os 3 primeiros “Vs” do Big Data: Volume,

Velocidade e Variedade.

Figura 7 – Os 3Vs do Big Data

Mais tarde, em uma opinião pessoal, Cezar Taurion, diretor de novas tecnolo-

gias da IBM, agregou mais dois conceitos que complementaram a visão sobre o Big

Data: Valor e Veracidade, fechando assim os famosos “5 Vs” sobre o Big Data.

Abaixo segue o que representa o conceito por trás cada um deles:

• Volume: são todos os dados gerados. Ele é a representação de toda a infor-

mação armazenada pelo tráfego na internet ou gerado pelas empresas em

O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 11 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

seus sistemas. Por exemplo: transações bancárias, troca de e-mails, mensa-

gens enviadas pelo Facebook, registro dos processos nos sistemas internos

dentro das empresas. O objetivo do Big Data é utilizar a tecnologia para lidar

com esse volume de dados.

• Velocidade: fator primordial para garantir que o processamento dos dados

coletados possa trazer uma visão atualizada da situação desejada. Para Tau-

rion, a importância da velocidade é tão grande que, em algum momento, de-

verá existir uma ferramenta capaz de analisar os dados em tempo real. Hoje

os dados são analisados apenas após serem armazenados.

Um ponto interessante já sabido é que informação é poder, mas a velocidade

com a qual você obtém essa informação é o que torna a empresa diferenciada no

mercado. Um exemplo: uma pessoa que tenta passar o cartão de crédito que de-

mora para aprovar a transação pode desistir da venda porque o processo demorou

demais, ou escolher uma outra forma de pagamento, deixando assim de receber o

pagamento por meio da sua plataforma.

• Variedade: com os dados sendo gerados por meio de diversas plataformas,

assim teremos também diversos tipos de dados, sendo eles classificados em:

–– Dados estruturados: são dados que estão armazenados em banco de

dados, arquivos tipo CSV e XLS; possuem uma organização para serem

recuperados;

–– Dados semi-estruturados: são dados que, em um primeiro momento,

poderiam ser considerados não estruturados, mas depois de analisados

podem ser estruturados. Exemplo: e-mails, arquivos de log, arquivos DOC

etc.
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 12 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

–– Dados não estruturados: são dados de diversas fontes em diversos

formatos, como imagens (PNG e JPG), áudios (MP3) e vídeos (MP4). Um

exemplo: algo que é escrito dentro do Facebook pode ser considerado não

estruturado porque não existiria uma forma de organizar algo que seja ex-

presso por meio de um sentimento.

 Obs.: 90% de todos os dados gerados no mundo estão na forma de dados não

estruturados.

• Veracidade: a informação gerada precisa ser real, os dados por trás do pro-

cesso de Big Data precisam ser verídicos porque só assim ele será importante

para uma empresa. Com o Big Data não é possível controlar toda a infor-

mação falsa que pode existir na internet, mas com análises e estatísticas de

grandes volumes de dados é possível compensar as informações incorretas.

• Valor: esse é o “V” que torna o Big Data importante para uma empresa. Ter

acesso a milhares de dados não representa valor, mas sim o que podemos

fazer com eles para nos tornar competitivos.

Figura 8 – 5 Vs do Big Data

O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 13 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

Os 5 Vs e os 3 Vs já foram cobrados em questões e a banca brinca de trocar um

dos “Vs” para confundir; por isso, mesmo que ele mostre fora de ordem, é muito

importante saber o que cada um faz.

Vimos como o Big Data é importante; olha esse exemplo real que aconteceu no
Estados Unidos e que demonstra como podemos usar as informações para atingir
melhor os consumidores.
Um pai recebeu alguns e-mails de uma loja chamada Target com vale descontos
em produtos para bebês. Indignado, o pai resolveu tirar satisfação com a loja ale-
gando que a loja estava induzindo sua filha a ter relações sexuais e filhos, porém,
só após muita confusão, os fatos finalmente foram esclarecidos. A filha assumiu
que estava grávida e a loja estava apenas fazendo o uso de informações fornecidas
pela web.
Outro caso interessante foi da empresa Skol, que veiculou uma propaganda com
frases que geraram dupla interpretação, assim gerando manifestações pelas mídias
digitais, o que levou a empresa a repensar sua estratégia de marketing. Abaixo
segue a resposta da empresa:
“As peças em questão fazem parte da nossa campanha “Viva RedONdo”, que
tem como mote aceitar os convites da vida e aproveitar os bons momentos. No
entanto, fomos alertados nas redes sociais que parte de nossa comunicação pode-
ria resultar em um entendimento dúbio. E, por respeito à diversidade de opiniões,
substituiremos as frases atuais por mensagens mais claras e positivas, que trans-
mitam o mesmo conceito. Repudiamos todo e qualquer ato de violência seja física
ou emocional e reiteramos o nosso compromisso com o consumo responsável.
Agradecemos por todos os comentários.”
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 14 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

Sobre esse caso, é possível notar a importância do Big Data para coleta e moni-

toramento das informações compartilhadas nas redes sociais, e como isso influen-

ciou a empresa a rever a sua posição no mercado com a peça veiculada.

3. Premissas do Big Data

Quando tratamos de Big Data, o mercado está cada vez mais aderente à solu-

ção, mas existem diversos pontos em que as empresas se confundem quando pen-

sam em Big Data. Esses pontos levam a interpretações equivocadas e distorcem ou

até confundem alguns pontos importantes que ajudam a entender para que serve

a solução.

Abaixo descrevemos algumas premissas que o Big Data possui e que precisam

ser esclarecidas:

1. É só para grandes empresas

Você não precisa ser uma grande empresa para se beneficiar do Big Data. Hoje

a solução está espalhada por diversos segmentos da indústria e criou benefícios

para empresas de todos os tamanhos.

2. Ele substituirá seu Data Warehouse

Algumas pessoas podem até dizer que o Big Data e o DW seriam mutualmen-

te exclusivos, mas não é o caso. Assim que os dados da organização estiverem

processados e carregados, os dados estarão prontos para serem interrogados e

qualquer insight, descoberto. Um não pode operar sem o outro, por isso é muito

provável que isso não aconteça.

O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 15 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

3. É uma solução para tudo


O Big Data não é uma ferramenta que você liga um botão e ela começa a produ-
zir resultados. Enquanto os benefícios da análise dos dados é significante para uma
empresa, o seu resultado só é aparente se usado em conjunto com outras ativida-
des que possam garantir a tradução dos dados obtidos por meio das análises para
trazer o retorno do investimento.

4. Muitos dados são necessários


Difícil não errar esta parte, afinal, o nome é Big Data. Esse ponto peca se a aná-
lise for literal. Do que adianta eu ter milhões de dados que não servem pra nada?
Melhor ter pouco dado coletado de qualidade do que muito de baixa qualidade e
que não servirá para agregar valor.

5. Possui valor inerente


Impossível ter valor inerente se o dado bruto não for processado. Primeiramen-
te o dado precisa ser ordenado, processado e distribuído. Para que você seja capaz
de fazer isso corretamente, precisa saber que questões você quer responder, para
assim o dado começar a ter valor.

6. Traz grandes mudanças


Como visto anteriormente, o dado precisa ser processado antes e baseado nas
questões que eu quero responder. Mesmo que o cientista de dados extraia os dados
desejados, você precisa ter certeza de que está fazendo as perguntas certas. Sem
isso, não existe mudança.

7. Provém sempre as respostas certas


Como você já percebeu, se o dado não é processado corretamente, ou se eu não
sei as questões que quero fazer, pode ser que no final eu tenha uma reposta errada
ou até que eu acabe com uma resposta conflitante.
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 16 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

8. Big Data é um novo conceito

Na verdade, ele já existe por volta de 20 anos. As únicas coisas que mudaram

foram o quão grande o volume é e como o capturamos, armazenamos, analisamos

e utilizamos.

Tentei trazer aqui as 8 premissas mais interessantes, mas a verdade é que

existem muitas outras que poderiam ser respondidas, todas relacionadas à forma

equívoca de ver a solução. As premissas estão relacionadas sempre a dúvidas e,

para um usuário determinado, as interpretações não têm fim...

Figura 9 - Diferenças entre BI e Big Data

O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 17 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

4. Características do Big Data

4.1. Hadoop

Como nós já sabemos, um grande volume de dados armazenados, distribuídos

em diferentes locais (porque seu volume pode não caber em um lugar só), não

pode ser beneficiado pela forma como tratamos os dados atuais (modelo relacio-

nal), porque quanto maior uma tabela, maior é o tempo para processar os dados

dentro dela. Para que possamos acessar esses dados de forma performática, o uso

do Hadoop é essencial.

Figura 10 – Símbolo Hadoop

Hadoop é uma plataforma de software livre desenvolvida pela Apache Softwa-

re Foundation, voltada para exploração de grandes volumes de dados utilizando

diversos computadores interligados em cluster. Entre os pontos positivos dele,

podemos citar:

• Simples implantação: uma das principais vantagens é que ele não necessi-

ta de um hardware específico para rodar, o que facilita a sua utilização.

• Escalável: por meio dos clusters, que podem ter diversas máquinas, são uti-

lizados os processamentos e armazenamentos de cada máquina envolvida;

assim, não será necessário depender de um único hardware para executar

o serviço: todos trabalham juntos, aumentando muito o poder de processa-

mento e o tamanho do espaço de armazenamento.


O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 18 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

• Poder de processamento: outro ponto importante para o sucesso do Ha-

doop é que os dados são processados em paralelo, simultaneamente, econo-

mizando tempo.

• Tolerante a falhas: uma outra vantagem é que ele possui tolerância a fa-

lhas. Se uma máquina do cluster cair, ele automaticamente faz a troca dela

por outra, configurando tudo sozinho para continuar o trabalho.

Tive uma ideia: como essa assunto parece ser muito cansativo, tentarei colocar

uma imagem para cada ponto importante para facilitar o entendimento do que está

escrito, ok?

Cluster: é um termo em inglês que significa “aglomerar” e que na TI ele define

uma arquitetura de sistema capaz combinar vários computadores para trabalharem

em conjunto.

Figura 11 – Cluster Hadoop


O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 19 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

O framework do Apache Hadoop é composto dos seguintes módulos:

• Hadoop Common: contém os arquivos necessários para que o Hadoop fun-

cione corretamente;

• Hadoop Distribuited File System (HDFS): é o sistema de arquivos distri-

buído que armazena os dados. Pode imaginar que é igual a um FAT o NTFS

do Windows;

• Hadoop Yarn: responsável por gerenciar os recursos computacionais em

cluster;

• Hadoop MapReduce: responsável pelo processamento de dados, ele enten-

de e atribui o trabalho para os nós (máquina) dentro do cluster.

Na figura 11, podemos perceber a arquitetura do Hadoop e é interessante citar que

o Namenode e Datanode representam a parte do armazenamento, chamados de Sto-

rage Node (nó de armazenamento), enquanto o Job Tracker e o Task Tracker represen-

tam a parte do processamento (nó de processamento), conforme a imagem 12 abaixo.

Figura 12 – Componentes principais do Hadoop


O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 20 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

Uma das partes mais importantes dessa arquitetura é o MapReduce. Detalhando

um pouco mais como ele funciona, temos a seguinte divisão:

• Map: responsável pelo processamento primário dos dados. O nó principal re-

cebe os dados, divide em partes menores e as envia aos outros nós para se-

rem processadas. Ao final do processamento, são devolvidas ao nó principal.

• Reduce: recebe os dados do Map, combina as respostas obtidas pelos outros

nós, realizando a redução e o resultado final do processamento.

O MapReduce possui dois componentes importantes:

• Job Tracker: submete as tarefas para o Task Tracker, que precisam reportar

de tempos em tempos que estão vivos e efetuando as suas tarefas, caso con-

trário o Job Tracker aloca a sua atividade para outro task.

• Task Tracker: executa as tarefas de Map e Reduce

O Hadoop é a base do processamento do Big Data, por isso seus detalhes são im-

portantes e já foram cobrados em provas.

Como esse processo de gestão do Hadoop possui muitos detalhes, o CESPE costu-

ma inverter os papéis de cada objeto; já foi alvo de questão assim o papel do Job

Tracker. A questão troca o papel do Job Tracker com o do Task Tracker.

O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 21 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

Figura 13 – Exemplo da arquitetura Hadoop

4.2. Ecossistema Hadoop

Agora todos nós sabemos que o Hadoop é um framework. E se fôssemos ima-

ginar o Hadoop como uma casa, ela não seria muito confortável: teria paredes,

janelas, portas, canos e fios por toda parte. Quando falamos do ecossistema, ele

poderia ser considerado os móveis que decoram a casa e a deixam mais confortável

que reflete diretamente o seu estilo e gosto.

Apesar da analogia acima, esse ecossistema representa um conjunto de ferra-

mentas, tanto do lado da própria Apache quanto outras ferramentas comerciais,

como Spark, Hive, Pig, Oozie e Sqoop. O interessante dessas ferramentas é que

elas servem para suplementar o que já foi descrito acima, os 4 componentes que

fazem parte do Hadoop: HDFS, MapReduce, Yarn e Common. Então, por que usar

essas ferramentas se o Hadoop já tem o que eu preciso? Simples, elas são boas e

oferecem funcionalidades mais fáceis.


O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 22 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

Abaixo segue uma breve descrição das principais ferramentas disponíveis:

• Spark: age como se fosse um substituto do MapReduce, jogando os dados

para serem processados em memória. Sua vantagem está em rodar de 10 a

100 vezes mais rápido quando comparado ao processamento em disco.

• Hive: é um software de DW que aborda como os dados são estruturados e

consultados em clusters Hadoop distribuídos.

• Pig: é uma linguagem procedural para desenvolver aplicativos de processa-

mento paralelo para grandes conjuntos de dados no ambiente Hadoop.

• HBase: é um banco de dados escalável, distribuído e NoSQL, que fica no topo

do HFDS. Ele foi projetado para armazenar dados estruturados em tabelas

que poderiam ter bilhões de linhas e milhões de colunas.

• Oozie: é um gerenciador de workflow. Ele gerencia como os fluxos de traba-

lho começam e são executados, e também controla o caminho da execução.

• Sqoop: é uma interface de linha de comando que facilita o envio de dados em

massa do Hadoop para bancos de dados relacionais de dados estruturados.

O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 23 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

Figura 14 – Ecossistema Hadoop

 Obs.: existem diversas ferramentas para Hadoop além das citadas, por isso foquei

em apenas tratar das mais conhecidas.

Caso queiram analisar outras ferramentas, segue o link que descreve cada uma

das soluções catalogadas para Hadoop.

https://hadoopecosystemtable.github.io/

O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 24 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

4.3. NoSQL

Nesse mundo de processamentos, estruturas novas, não poderia ficar de fora

um banco de dados não relacional.

O NoSQL que significa Not Only SQL (Não Apenas SQL), surgiu com o propósito

de ser o banco de dados para gerenciar grandes volumes de dados e escalabilidade

descomplicada. Por conta da sua flexibilidade, a sua popularidade tem aumentado

muito e existe uma previsão de crescimento anual de 21% até a 2020. Cassandra

é um banco de dados NoSQL distribuído e foi desenvolvido originalmente pelo Fa-

cebook. Hoje ele faz parte do ecossistema Hadoop como uma opção de banco de

dados NoSQL.

Um ponto importante que você poder ter se perguntado é: se o NoSQL é tão

bom, por que não abandonamos o banco de dados relacional e migramos tudo

para NoSQL? A resposta é mais complicada, porque envolveria mudar as aplicações

existentes e regras de negócios, que nem sempre são possíveis de mudar, para que

fossem adaptadas; isso com certeza traria um custo muito alto para a empresa,

o que inviabilizaria o projeto, mas pode-se pensar em sua adoção para novos sis-

temas! Mas mesmo assim, ainda com ressalvas. Aí você deve estar pensando que

esse negócio de NoSQL é fraco demais para se usar. Até te entendo, mas a verdade

é que qualquer projeto precisa ser pensado, e isso reflete até na infraestrutura que

vamos oferecer por trás. Podemos usar uma analogia simples: usar um canhão

para matar formiga ou colocar um carro de fórmula 1 para correr numa pista de

kart. Qual seria o propósito? É como gastar tempo para implantar um banco de

dados NoSQL sendo que um SGBDR atenderia perfeitamente.

Sim, pensar em um projeto requer compreensão da necessidade dele e não

necessariamente utilizar um NoSQL seria a resposta para tudo, mas compreender

que, para um sistema que gera milhões de informações todos os dias, utilizar um
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 25 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

banco de dados relacional traria um custo de manutenção muito alto por trás da

aplicação e por isso surgiu essa nova opção, mais performática, para ajudar nessa

gestão.

Um ponto importante que precisa ficar claro quando tratamos de NoSQL é que

ele não segue o ACID (Atomicity, Consistency, Isolation e Durability), que é o que

rege os bancos SGBDRs. Essas 4 características fornecem garantias que impactam

diretamente o negócio de uma empresa, sendo elas:

• Atomicidade: controle do início e fim de uma transação;

• Consistência: garantia que o dado está íntegro;

• Isolação: uma transação não impacta em outra, elas estão isoladas e em

paralelo;

• Durabilidade: controle do dado armazenado. Garantir que o dado, após seu

processamento, esteja íntegro e disponível.

Com isso temos 3 características que precisam ficar claras quando comparamos

o efeito ACID nos bancos relacionais:

• Armazenamento: quanto maior é o volume de dados, maior é o espaço

consumido no disco e, logo, será o maior input/output de leitura e escrita nos

discos.

• Conexão: o acesso a informação realizado entre a aplicação e o banco de

dados é realizado por meio de um driver de conexão e esse processo é bem

simples. Você pode trocar o SGBDR por outro a que a aplicação ainda se co-

nectaria facilmente, modificando apenas a sua configuração.

• Escalabilidade: o SGBR trabalha melhor com a escalabilidade vertical,

que consiste em aumentar o poder de processamento, a memória e o disco

de uma máquina.

O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 26 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

Para que possamos definir melhor como o NoSQL funciona, precisamos explicar

rapidamente o teorema de CAP (Consistency, Availability e Partition Tolerance),

também chamado de teorema de Brewer, que foi definido na época por Eric Brewer.

O teorma de CAP atesta que é impossível para um armazenamento de dados distri-

buído prover mais do que dois de sua regra.

Figura 15 – Teorema de CAP

• Consistência: a propriedade de consistência descreve uma visão consistente

dos dados em todos os nós do sistema distribuído. Ou seja, o sistema assegura

que as operações possuem uma característica atômica e as mudanças são disse-

minadas simultaneamente para todos os nós, produzindo os mesmos resultados.

• Disponibilidade: esta propriedade exige que o sistema responda a cada

pedido, mesmo em caso de falhas. Isso deve ser verdade para as operações

de leitura e gravação. Na prática, essa propriedade é muitas vezes reduzida a

respostas limitadas em um tempo razoável


O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 27 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

• Tolerância de partição: essa propriedade refere-se à capacidade de um

sistema de continuar operando mesmo depois de uma falha. Isso afeta as

propriedades anteriores. Os mecanismos para manter a consistência devem

lidar com perdas de mensagens e ,de acordo com a propriedade de disponi-

bilidade, cada nó de qualquer partição potencial deve ser capaz de responder

a uma solicitação.

Por meio do teorema de CAP, temos as seguintes visões:

• Sistemas CA: sistemas com consistência forte e alta disponibilidade, mas

não suportam falhas.

• Sistemas CP: consistência forte e tolerante a falhas, mas abrem mão (um

pouco) da disponibilidade.

• Sistemas AP: alta disponibilidade com tolerância a falhas, mas prejudicam a

consistência. Exemplo: Facebook, com o banco de dados Cassandra.

Agora quando estamos falando do baco de dados NoSQL, este segue o modelo

BASE (Basically Avaliable, Soft-State e Eventually Consistent), que tem sua base

definida pelo teorema de CAP.

• Basicamente Disponível: esta restrição afirma que o sistema garante a

disponibilidade dos dados em relação ao teorema CAP; haverá uma resposta

a qualquer pedido. Mas essa resposta ainda pode ser “falha” para obter os

dados solicitados ou os dados podem estar em um estado inconsistente ou

em mudança.

• Estado Leve: o estado do sistema pode mudar ao longo do tempo; isso quer

dizer que ele não precisa ser consistente todo o tempo.


O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 28 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

• Eventualmente Consistente: o sistema acabará por se tornar consistente

depois de deixar de receber novos dados. Os dados se propagarão em todos

os lugares, mais cedo ou mais tarde, mas o sistema continuará a receber en-

trada e não verificará a consistência de cada transação antes de passar para

a próxima.

Sobre suas características, podemos comparar duas com o banco relacional:

• Armazenamento: o volume de dados é grande, mas seu armazenamento e

processamento são distribuídos, diminuindo assim o espaço alocado e o gar-

galo de input/output de disco. Outro ponto interessante é que parte do NoSQL

usa memória para processar mais rápido, e as informações que são pouco

utilizadas vão para o disco.

• Escalabilidade: ele foi pensado para trabalhar com escalabilidade horizon-

tal, que consiste em aumentar a quantidade de maquinas. Nos bancos rela-

cionais isso não é possível devido à alta concorrência. Mas nada impede que

o NoSQL trabalhe no modelo de escalabilidade vertical.

Figura 16 – Diferenças entre ACID e BASE

O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 29 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

Abaixo segue um comparativo entre o banco de dados relacional e o banco de

dados NoSQL:

Banco de dados relacional Banco de dados NoSQL


O modelo relacional normaliza Bancos de dados não relacionais
dados em estruturas tabula- (NoSQL) normalmente não apli-
res conhecidas como tabe- cam um schema. Geralmente,
las, que consistem em linhas uma chave de partição é usada
Modelo de dados e colunas. Um schema define para recuperar valores, conjun-
estritamente tabelas, colunas, tos de colunas ou documentos
índices, relações entre tabelas semi-estruturados JSON, XML
e outros elementos do banco ou outros que contenham atri-
de dados. butos de itens relacionados.
Sistemas de gerenciamento Bancos de dados NoSQL nor-
de bancos de dados relacio- malmente trocam algumas pro-
nais (RDBMS) tradicionais são priedades ACID de sistemas de
compatíveis com um conjunto gerenciamento de bancos de
de propriedades definido pela dados relacionais (RDBMS) por
sigla ACID: Atomicidade, Cons- um modelo de dados mais flexí-
tância, Isolamento e Durabi- vel que escala horizontalmente.
lidade. Atomicidade significa Essas características fazem dos
“tudo ou nada”, ou seja, uma bancos de dados NoSQL uma
transação é concluída integral- excelente opção em situações
mente ou não. Constância sig- em que os RDBMS deparam
Propriedades ACID nifica que quando uma tran- com desafios de arquitetura e
sação é realizada, os dados precisam solucionar uma com-
devem estar em conformidade binação de gargalos de sesem-
com o schema do banco de penho, escalabilidade, com-
dados. Isolamentoexige que plexidade operacional e custos
as transações simultâneas crescentes de administração e
sejam executadas separadas suporte.
uma da outra. Durabilidade é a
capacidade de se recuperar de
uma falha do sistema ou falta
de energia inesperada para o
último estado conhecido.

O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 30 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

O desempenho normalmente Desempenho geralmente é uma


depende do subsistema do função do tamanho do cluster
disco. A otimização de con- do hardware subjacente, da
Desempenho
sultas, índices de estrutura de latência de rede e da aplicação
tabela é necessária para alcan- que faz a chamada.
çar máximo desempenho.
Mais fácil de aumentar a escala Projetado para aumentar
“verticalmente” com hardware a escala “horizontalmente”
mais rápido. Outros investi- usando clusters distribuídos de
Escala
mentos são necessários para hardware de baixo custo para
tabelas relacionais para abran- aumentar a transferência sem
ger um sistema distribuído. aumentar a latência.
As solicitações para armazenar APIs baseadas em objetos per-
e recuperar dados são comuni- mitem que desenvolvedores de
cadas usando consultas com- aplicações armazenem e res-
patíveis com structured query taurem facilmente estruturas de
language (SQL). Essas consul- dados na memória. As chaves
tas são analisadas e execu- de partição permitem que os
APIs
tadas por sistemas de geren- aplicativos procurem pares de
ciamento de banco de dados chave-valor, conjuntos de colu-
relacionais (RDBMS). nas ou documentos semi-es-
truturados contendo objetos e
atributos de aplicativos seriali-
zados.
Os bancos de dados SQL nor- Os bancos de dados NoSQL
malmente oferecem um rico normalmente oferecem ferra-
conjunto de ferramentas para mentas para gerenciar clusters
Ferramentas
simplificar o desenvolvimento e escalabilidade. As aplicações
de aplicações orientadas ao são a interface principal com os
banco de dados. dados subjacentes.
Figura 17 – Diferenças entre SGBDR e NoSQL

 Obs.: quadro comparativo retirado do site da Amazon: https://aws.amazon.com/

pt/nosql/

O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 31 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

Entre os tipos de bancos de dados NoSQL existentes, podemos citar 4 impor-

tantes:

• Chave-Valor: é o banco de dados mais simples; possui uma tabela com ape-

nas duas colunas, sendo uma a chave primária e a outra o valor. Dentro da

coluna valor eu guardo todos os dados de que preciso. Permite a visualização

do dado em uma grande tabela.

• Grafos: armazena dados na forma de grafo (vértices e arestas).

• Colunas: armazena dados em colunas e não em linhas.

• Documento: armazena os dados como “documento”, em que um documento

representa a chave.

 Obs.: qual é o melhor modelo? Aquele que resolve o seu problema! Não existe um

mais indicado, cada um tem o seu valor e se encaixa melhor de acordo com

a sua necessidade.

Figura 18 – Tipos de NoSQL


O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 32 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

As bancas cobram questões sobre os modelos de NoSQL. Uma que apareceu foi

tratando sobre o modelo orientado a documentos. Por isso vale a pena saber a ca-

racterística principal de cada um.

5. Aplicações do Big Data no mercado

Agora que já entendemos qual é o propósito do Big Data e como ele está aos

poucos mudando a forma como enxergamos sistemas e sua utilização, fica mais

fácil compreender que sua utilização está mudando a maneira como as grandes

empresas realizam seus estudos.

Até pouco tempo atrás, contratar uma empresa para realizar uma pesquisa de

mercado era suficiente para mapear como um consumidor agia e assim definir uma

estratégia para o futuro, mas, na velocidade em que estamos gerando e consumin-

do informações, saber como responder rapidamente às mudanças de mercado se

torna a chave para garantir uma posição diferenciada nesse mercado tão compe-

titivo. É nesse ponto que o Big Data tem aparecido. Abaixo seguem cases reais de

empresas que estão utilizando dados massivos para obter novas visões.

1. NIKE: a Nike é uma das maiores fabricantes de materiais esportivos de

mundo e constantemente está oferecendo produtos inovadores aos seus clientes.

Um exemplo é o software chamado Nike Run, o qual registra a sua atividade e com

isso você pode compartilhar com os seus amigos o seu rendimento, incentivando

que outros façam a mesma coisa. O ponto importante desse processo é que a Nike,

com isso, possui acesso a todos os dados compartilhados e pode realizar estudos

voltados ao lançamento de novos produtos.


O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 33 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

2. BRITISH AIRWAYS: o programa “Know Me” combina informações de fide-

lidade já existentes com os dados coletados dos clientes com base no seu compor-

tamento na internet. Com a mistura dessas duas fontes de informação, a British

Airways pode fazer ofertas mais direcionadas de forma a criar uma experiência

mais positiva para o passageiro.

3. GOOGLE: trabalhando com os Centros de Controle de Doenças dos EUA, ras-

treia quando os usuários estão inserindo termos de pesquisa relacionados a tópicos

de gripe, para ajudar a prever quais regiões podem sofrer surtos.

4. WALMART: baseia-se em análise de texto, aprendizado de máquina e até

mineração de sinônimos para produzir resultados de pesquisa relevantes. O Wal-

mart diz que adicionar pesquisa semântica melhorou as compras on-line comple-

tando uma compra de 10% a 15% a mais. Nos termos de Walmart, isso são bilhões

de dólares.

5. ATLANTA FALCONS (time de futebol americano): utiliza a tecnologia GPS

para avaliar os movimentos dos jogadores durante os treinos, o que ajuda os trei-

nadores a criar jogadas mais eficientes.

O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 34 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

Resumo

• BI é ferramenta OLAP (Online Analytical Processing);

• BI gera consultas e relatórios analíticos;

• BI olha passado, informações já armazenadas;

• BI responde às perguntas que você já sabe;

• Cubo é um “atalho” para os dados que traz de forma consolidada 2 a 3 dimen-

sões para responder perguntas específicas;

• BI são perguntas que você faz para coisas que você sabe;

• Big Data: perguntas que você não faz para coisas que você não sabe;

• Big Data gerencia grandes volumes;

• Big Data pode cruzar dados de várias fontes para gerar novos insights;

• Big Data possui 3 Vs básicos importantes: Volume, Velocidade e Variedade;

• Depois são aceitos mais 2 Vs adicionais: Veracidade e Valor, formando os 5 Vs;

• As premissas do Big Data são: solução para tudo, trazer grandes mudanças,

prover sempre as respostas certas, possuir valor inerente e ser apenas para

grandes empresas;

• Hadoop é o framework da Apache;

• Hadoop é o coração do Big Data;

• Hadoop é escalável tanto verticalmente quanto horizontalmente. SGBDR,

apenas verticalmente;

• Hadoop trabalha em cluster;

• Hadoop é composto por: Common, Yarn, HDFS e MapReduce;

• Seus componentes mais importantes são: HDFS + MapReduce;

• O MapReduce possui o Job Tracker e o Task Tracker;

• O Ecossistema Hadoop é formado por ferramentas de terceiros também;


O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 35 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

• Outras ferramentas importantes Hadoop são: Pig, Hive, Hbase, Spark, oozie,

Sqoop;

• O NoSQL é o banco de dados não relacional;

• Cassandra, MongoDB, CouchDB são tipos de bancos de dados NoSQL;

• SGBDR segue ACID e NoSQL segue BASE;

• Teorema de CAP: Consistency, Availability e Partition Tolerance;

• Teorema de CAP só permite 2 das 3 opções: CA, AP e CP;

• Tipos de NoSQL: Chave/Valor, Colunas, Documentos e Grafos;

• Tipo mais utilizado é Chave/Valor.

O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 36 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

QUESTÕES DE CONCURSOS

1. (ESAF/ANAC/ANALISTA ADMINISTRATIVO/2016) Big Data é:

a) volume + variedade + agilidade + efetividade, tudo agregando + valor + atu-

alidade.

b) volume + oportunidade + segurança + veracidade, tudo agregando + valor.

c) dimensão + variedade + otimização + veracidade, tudo agregando + agilidade.

d) volume + variedade + velocidade + veracidade, tudo agregando + valor.

e) volume + disponibilidade + velocidade + portabilidade, tudo requerendo - valor.

2. (ESAF/ANAC/ANALISTA ADMINISTRATIVO/2016) Para o processamento de gran-

des massas de dados, no contexto de Big Data, é muito utilizada uma plataforma

de software em Java, de computação distribuída, voltada para clusters, inspirada

no MapReduce e no GoogleFS. Esta plataforma é o(a)

a) Yam Common.

b) GoogleCrush.

c) EMRx.

d) Hadoop.

e) MapFix.

3. (CESPE/TJ-SE/ANALISTA JUDICIÁRIO/2014) Em soluções Big Data, a análise

dos dados comumente precisa ser precedida de uma transformação de dados não

estruturados em dados estruturados.

E. Errado

C. Certo
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 37 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

4. (CESPE/TJ-SE/ANALISTA JUDICIÁRIO/2014) Julgue os itens que se seguem, no

que se refere a Big Data.

O processamento de consultas ad hoc em Big Data, devido às características de

armazenamento dos dados, utiliza técnicas semelhantes àquelas empregadas em

consultas do mesmo tipo em bancos de dados tradicionais.

C. Certo

E. Errado

5. (CESPE/ANATEL/ANALISTA ADMINISTRATIVO/2014) No MapReduce, modelo de

processamento de dados paralelo para processamento e análise de grandes volu-

mes de dados, os programas são escritos em um estilo de programação funcional,

no qual as funções Map e Reduce devem ser criadas.

E. Errado

C. Certo

6. (CESPE/ANATEL/ANALISTA ADMINISTRATIVO/2014) No que se refere a banco

de dados distribuído, programação distribuída, desenvolvimento em nuvem e pro-

cessamento em GRID, julgue os itens que se seguem.

No Hadoop MapReduce, o JobTracker é o processo-escravo responsável por aceitar

submissões de tarefas e disponibilizar funções administrativas.

C. Certo

E. Errado

7. (FGV/TJ-SC/ANALISTA JUDICIÁRIO/2015) Os termos Business Intelligence (BI) e

Big Data confundem-se em certos aspectos. Uma conhecida abordagem para iden-

tificação dos pontos críticos de cada paradigma é conhecida como 3V, e destaca:

a) variedade, visualização, volume;


O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 38 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

b) velocidade, virtualização, volume;

c) variedade, velocidade, volume;

d) virtualização, visualização, volume;

e) variedade, visualização, virtualização.

8. (CESPE/TJ-SE/ANALISTA JUDICIÁRIO/2014) Ao utilizar armazenamento dos da-

dos em nuvem, a localização do processamento de aplicações Big Data não influen-

ciará os custos e o tempo de resposta, uma vez que os dados são acessíveis a partir

de qualquer lugar.

C Certo

E Errado

9. (ESAF/ESAF/GESTÃO DE INFRAESTRUTURA DE TI/2014) Um framework, base-

ado em duas funções principais, para o processamento de grandes quantidades de

dados em clusters computacionais homogêneos, no qual problemas como integri-

dade dos dados, disponibilidade dos nós, escalabilidade da aplicação e recuperação

de falhas ocorrem de forma transparente ao usuário é o Hadoop

a) Cassandra.

b) EC2 - Elastic Compute Cloud.

c) Lambda.

d) MapReduce.

e) VPC - Virtual Private Cloud.

10. (ESAF/ESAF/2015) Em relação a Big Data e NoSQL, é correto afirmar que

a) os “3 Vs” principais do Big Data referem-se a Volume, Velocidade e Versatilidade

de dados.

b) na era do Big Data, as únicas estratégias eficientes para garantir a privacidade

são consentimento individual, opção de exclusão e anonimização.


O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 39 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

c) o Hadoop, o mais conhecido e popular sistema para gestão de Big Data, foi cria-
do pela IBM, a partir de sua ferramenta de Data Mining WEKA.
d) o NoSQL é um sistema relacional, distribuído, em larga escala, muito eficaz na
organização e análise de grande quantidade de dados.
e) o Cassandra é um sistema de banco de dados baseado na abordagem NoSQL,
originalmente criado pelo Facebook, no qual os dados são identificados por meio de
uma chave.

11. (ESAF/ESAF/2015) Os Sistemas de Bancos de Dados Distribuídos (SBDD) apre-


sentam vantagens e desvantagens. Uma das desvantagens é
a) a redução da confiabilidade.
b) a redução da disponibilidade.
c) a redução da escalabilidade.
d) o aumento do overhead de processamento.
e) o compartilhamento de dados e o controle distribuído.

12. ( CESPE/CNJ/ANALISTA JUDICIÁRIO/2013) A escalabilidade dos bancos de da-


dos NoSQL é garantida pela ausência de um esquema (schema free).
C. Certo
E. Errado

13. (INSTITUTO AOCP/CASAN/ANALISTA DE SISTEMA/2016) Em relação à Big


Data e NoSQL, é correto afirmar que
a) são conceitos concorrentes, portanto não podem ser implementados juntos.
b) são conceitos que se complementam e com características eficientes para tra-
balhar com pequenas quantidades de informações.
c) são duas ferramentas de empresas concorrentes.
d) são conceitos que se complementam.

e) os SGBDs Oracle e MySQL são implementações desses conceitos.


O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 40 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

14. (FCC/INFRAERO/ANALISTA – BANCO DE DADOS/2011) É uma característica de

um sistema de Business Intelligence:

a) Capacidade de cruzar informações de diferentes bancos de dados, gerando re-

latórios analíticos diversos.

b) Utilização de comandos SQL para a geração de tabelas dinâmicas inteligentes

ligadas às regras de negócio.

c) Utilização de Sistemas Baseados em Conhecimento, onde é possível utilizar téc-

nicas de Inteligência Artificial na geração de relatórios.

d) Análise automática de requisitos funcionais e não funcionais, permitindo a gera-

ção de relatórios gerenciais.

e) Análise de informações com o intuito de fornecer subsídio para a criação de sis-

temas inteligentes.

15. (FUNCAB/MDA/ANALISTA DE BUSSINESS INTELIGENCE/2014) Os projetos de

Business Intelligence apresentam a seguinte característica:

a) as especificações do projeto são estabelecidas sem necessitar da análise de re-

quisitos.

b) o desenvolvimento do projeto depende diretamente dos indicadores de desem-

penho.

c) o uso de protótipos no projeto deve excluir a participação do cliente no processo.

d) o desenvolvimento do projeto independe do apoio da gestão.

e) as fases do projeto são totalmente independentes uma das outras.

O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 41 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

16. (FCC/MPE-CE/ANALISTA MINISTERIAL/2013) Em relação ao entendimento do

significado do termo Business Intelligence (BI) e da solução que provê, a definição

que NÃO é coerente com o termo Business Intelligence é a que

a) consiste em uma metodologia que fornece objetivos de negócios ligados a obje-

tivos de TI, provendo métricas e modelos de maturidade para medir a sua eficácia

e identificando as responsabilidades relacionadas dos donos dos processos de ne-

gócios e de TI.

b) se refere à aplicação de técnicas analíticas para informações sobre condições

de negócio no sentido de melhorá-las, de uma maneira automatizada, mas com a

interpretação e respostas humanas, de forma a melhorar a tomada de decisões.

c) reúne recursos que provêm a habilidade para que a pessoa certa receba a infor-

mação adequada e no momento correto para tomar a melhor decisão.

d) consiste em um sistema de negócios que inclui uma estrutura de busca efetiva e

acessível, acurada, em tempo real, com informações e relatórios que permitam aos

líderes das áreas de negócio se manterem informados para tomar decisões.

e) é uma solução fácil de dizer, mas difícil de fazer corretamente pois envolve mu-

danças na forma como a organização conduz uma busca efetiva, bem como, a ne-

cessidade de se possuir uma base de dados de qualidade para que se possa tomar

ações com o objetivo de otimizar a performance corporativa.

17. (CESPE/FUB/ANALISTA DE TECNOLOGIA DA INFORMAÇÃO/2015) A respeito

de Business Intelligence e sua aplicação em corporações, julgue o item a seguir.

Em um ambiente de Business Intelligence, o usuário pode deparar com diferentes

requisitos de infraestrutura para atender às necessidades de cada uma das instân-

cias dos sistemas analíticos.

C. Certo

E. Errado
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 42 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

18. (FCC/TRT 15ª REGIÃO/ANALISTA JUDICIÁRIO/2015) No contexto de Business

Intelligence, os sistemas OLAP e OLTP se diferenciam em diversas características.

Na tabela abaixo, no que diz respeito às características, está INCORRETO:

a) Característica - Performance. /OLAP - Otimização para leitura e geração de aná-

lise e relatórios gerenciais. / OLTP - Alta velocidade na manipulação de dados ope-

racio- nais, porém ineficiente para geração de análises gerenciais.

b) Característica - Tipo de permissões nos dados. /OLAP - É permitido apenas in-

serção e leitura. Para o usuário está disponível apenas a leitura. / OLTP - Podem ser

feitas leitura, inserção, modificação e exclusão de dados.

c) Característica - Estrutura dos dados./OLAP - Armazenamento feito em Data Wa-

rehouse com otimização no desempenho em grandes volumes de dados. / OLTP - Ar-

mazenamento feito em bancos de dados convencionais pelos sistemas de informação

da organização.

d) Característica - Foco./OLAP - Nível operacional da organização. Visa a exe- cução

operacional do negócio. / OLTP - Nível estratégico da organização. Visa a análise

empresarial e tomada de decisão.

e) Característica - Volatilidade. /OLAP - Dados históricos e não voláteis que prati-

camente não sofrem alterações salvo em casos específicos motivados por erros ou

inconsistências. / OLTP -Dados voláteis, passíveis de modificação e exclusão.


O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 43 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

19. (FCC/TRT 4ª REGIÃO/ANALISTA JUDICIÁRIO/2015) Considere a arquitetura


geral de um sistema de BI- Business Intelligence mostrada na figura abaixo.

Nesta arquitetura
a) Data Marts representam áreas de armazenamento intermediário criadas a partir
do processo de ETL. Auxiliam na transição dos dados das fontes OLTP para o desti-
no final no Data Warehouse.
b) OLAP é um subconjunto de informações extraído do Data Warehouse que pode
ser identificado por assuntos ou departamentos específicos. Utiliza uma modela-
gem multidimensional conhecida como modelo estrela.
c) os dados armazenados no Data Warehouse são integrados na base única man-
tendo as convenções de nomes, valores de variáveis e outros atributos físicos de
dados como foram obtidos das bases de dados originais.
d) o Data Warehouse não é volátil, permite apenas a carga inicial dos dados e
consultas a estes dados. Além disso, os dados nele armazenados são precisos em
relação ao tempo, não podendo ser atualizados.
e) Data Mining se refere ao processo que, na construção do Data Warehouse, é
utilizado para composição de análises e relatórios, armazenando dados descritivos
e qualificando a respectiva métrica associada.
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 44 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

20. (FCC/TRT 4ª REGIÃO/ANALISTA JUDICIÁRIO/2015) Considere a figura abaixo

que traz componentes de um sistema de BI-Business Intelligence.

Os elementos I, II, III e IV indicados na figura são, correta e respectivamente, as-

sociados com:

a) PL/SQL − Oracle 11g − OLAP − Data Mining.

b) Portal Corporativo − SGBD − Consultas SQL − Cubo de Dados.

c) SGBD − Data Warehouse − OLAP − Data Mining.

d) Oracle − Cubo de Dados − Consultas PL/SQL − OLAP.

e) OLTP − Data Warehouse − Operações Drill − Cubo de Dados.

O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 45 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

21. (FMP/TCE-RS/AUDITOR PÚBLICO EXTERNO/2011) Algumas empresas de ven-

das pela Internet usam intensamente a tecnologia de “Business intelligence (BI)”

para incrementar suas vendas. Dentre as ações abaixo descritas qual a que NÃO se

caracteriza como ação de BI para este objetivo?

a) Armazenar produtos visualizados pelo cliente e periodicamente enviar para o

e-mail cadastrado pelo cliente, ofertas daquele tipo de produto.

b) Armazenar produtos visualizados pelo cliente para alimentar um bloco do site de

navegação com o título de “últimos produtos visualizados”.

c) Armazenar os dados do cartão de crédito ou conta bancária para facilitar a fina-

lização de uma compra.

d) Ao visualizar um produto, mostrar ao cliente percentual de clientes que compra-

ram ou visualizaram este produto e compraram outro similar, ofertando este outro.

e) Para cada produto visualizado pelo cliente oferecer, além da opção de compra,

a opção de armazenar para futura compra ou lista de desejos e, no futuro lembrar

esses armazenamentos ao cliente.

22. (FGV/PROCEMPA/ANALISTA EM TI E COMUNICAÇÃO/2014) O teorema CAP

(CAP Theorem) é um importante resultado teórico na Ciência da Computação, e

frequentemente é referenciado na comparação entre sistemas de bancos de dados

“tradicionais” e aqueles que são conhecidos pela sigla NoSQL. Esse teorema aborda

as propriedades (ou garantias) que um sistema de banco de dados deve prover, e é

central na discussão das conveniências de utilização de um ou outro modelo.

Assinale a opção que descreve, corretamente, o significado das letras na sigla CAP.

a) Concurrency, Access, Time

b) Consistency, Atomicity, Parallel processing.

c) Consistency, Availability, Partition tolerance.

d) Concurrency, Availability, Pear processing.

e) Control, Atomicity, Partition network.


O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 46 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

23. (CESPE/TJ-SE/ANALISTA JUDICIÁRIO/2014) Acerca de bancos de dados se-

miestruturados e bancos de dados NOSQL, julgue os itens subsecutivos.

Bancos de dados NOSQL orientados a documentos são apropriados para o armaze-

namento de dados semiestruturados.

C. Certo

E. Errado

24. (CESPE/TJ-SE/ANALISTA JUDICIÁRIO/2014) Acerca de bancos de dados se-

miestruturados e bancos de dados NOSQL, julgue os itens subsecutivos.

Devido à escalabilidade esperada para os bancos de dados NOSQL, a implementa-

ção desses bancos utiliza modelos de armazenamento de dados totalmente distin-

tos dos utilizados em sistemas relacionais.

C. Certo

E. Errado

25. (CESPE/CNJ/ANALISTA JUDICIÁRIO/2013) Uma característica de bancos de

dados NoSQL é o suporte à replicação de dados. Entre as abordagens utilizadas

para replicação, inclui-se a mestre-escravo.

C. Certo

E. Errado

26. (CESPE/CNJ/ANALISTA JUDICIÁRIO/2013) Apesar de implementarem tecnolo-

gias distintas, todos os bancos de dados NoSQL apresentam em comum a imple-

mentação da tecnologia chave-valor.

C. Certo

E. Errado

O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 47 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

27. (CESPE/TCE-PA/AUDITOR DE CONTROLE EXTERNO/2016) Acerca de seguran-

ça de banco de dados e de desenvolvimento de software, julgue o item subsecutivo.

Os bancos de dados NoSQL são imunes a ataques de injeção SQL.

C. Certo

E. Errado

28. (CESPE/FUNPRESP-JUD/ANALISTA – TECNOLOGIA DA INFORMAÇÃO/2016) A

respeito de banco de dados, julgue o próximo item.

Os bancos de dados NoSQL não permitem a atualização de seus dados, por serem

orientados a documentos e(ou) coleções.

C. Certo

E. Errado

29. (CESPE/TJ-DFT/ANALISTA JUDICIÁRIO/2015) A respeito de tipos de bancos de

dados, julgue o item que se segue.

Sistemas de bancos de dados classificados como NoSQL permitem a inserção de

dados sem que haja um esquema predefinido.

C. Certo

E. Errado

30. (CESPE/TJ-SE/ANALISTA JUDICIÁRIO/2014) Acerca de bancos de dados se-

miestruturados e bancos de dados NOSQL, julgue os itens subsecutivos.

Para garantir a eficiência das consultas a bancos de dados semiestruturados, é fun-

damental a adoção de técnica de indexação que leve em consideração, além das

informações, as propriedades estruturais dos dados.

C. Certo

E. Errado
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 48 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

GABARITO

1. d 16. a

2. d 17. C

3. C 18. d

4. E 19. d

5. C 20. c

6. E 21. c

7. c 22. c

8. E 23. C

9. d 24. E

10. e 25. C

11. d 26. E

12. E 27. E

13. d 28. E

14. a 29. C

15. b 30. C

O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 49 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

GABARITO COMENTADO

1. (ESAF/ANAC/ANALISTA ADMINISTRATIVO/2016) Big Data é:

a) volume + variedade + agilidade + efetividade, tudo agregando + valor + atu-

alidade.

b) volume + oportunidade + segurança + veracidade, tudo agregando + valor.

c) dimensão + variedade + otimização + veracidade, tudo agregando + agilidade.

d) volume + variedade + velocidade + veracidade, tudo agregando + valor.

e) volume + disponibilidade + velocidade + portabilidade, tudo requerendo - valor.

Letra d.

Os 5 Vs do Big Data definem a questão acima:

Volume, Variedade, Velociadade, Veracidade e Valor.

2. (ESAF/ANAC/ANALISTA ADMINISTRATIVO/2016) Para o processamento de gran-

des massas de dados, no contexto de Big Data, é muito utilizada uma plataforma

de software em Java, de computação distribuída, voltada para clusters, inspirada

no MapReduce e no GoogleFS. Esta plataforma é o(a)

a) Yam Common.

b) GoogleCrush.

c) EMRx.

d) Hadoop.

e) MapFix.

O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 50 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

Letra d.

Apenas o Hadoop é capaz processar grandes volumes de dados que um banco tra-

dicional não seria capaz.

3. (CESPE/TJ-SE/ANALISTA JUDICIÁRIO/2014) Em soluções Big Data, a análise

dos dados comumente precisa ser precedida de uma transformação de dados não

estruturados em dados estruturados.

E. Errado

C. Certo

Certo.

Esse processo acontece por meio do uso de ETL, na fase de transformação, que

estrutura os dados para que possam ser carregados e posteriormente consultados.

4. (CESPE/TJ-SE/ANALISTA JUDICIÁRIO/2014) Julgue os itens que se seguem, no

que se refere a Big Data.

O processamento de consultas ad hoc em Big Data, devido às características de

armazenamento dos dados, utiliza técnicas semelhantes àquelas empregadas em

consultas do mesmo tipo em bancos de dados tradicionais.

C. Certo

E. Errado

O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 51 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

Errado.

Devido ao fato de as fontes de dados poderem ter formatos de dados diferentes,

isso requer também mecanismos diferentes para processá-los, se diferenciando do

formato aplicado em bancos tradicionais.

5. (CESPE/ANATEL/ANALISTA ADMINISTRATIVO/2014) No MapReduce, modelo de

processamento de dados paralelo para processamento e análise de grandes volu-

mes de dados, os programas são escritos em um estilo de programação funcional,

no qual as funções Map e Reduce devem ser criadas.

E. Errado

C. Certo

Certo.

O MapReduce é composto do Map() e do Reduce(); são muito utilizadas em pro-

gramação funcional. O Map() realiza o filtro e ordenação e o Reduce() realiza ope-

rações de sumarização. Ele foi introduzido pela Google para suportar computações

paralelas em grandes volumes de dados.

6. (CESPE/ANATEL/ANALISTA ADMINISTRATIVO/2014) No que se refere a banco

de dados distribuído, programação distribuída, desenvolvimento em nuvem e pro-

cessamento em GRID, julgue os itens que se seguem.


O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 52 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

No Hadoop MapReduce, o JobTracker é o processo-escravo responsável por aceitar

submissões de tarefas e disponibilizar funções administrativas.

C. Certo

E. Errado

Errado.

O JobTracker é responsável por submeter o trabalho para Task Tracker disponíveis.

Ele faz a gestão deles e verifica se eles estão ativos e funcionando corretamente.

7. (FGV/TJ-SC/ANALISTA JUDICIÁRIO/2015) Os termos Business Intelligence (BI) e

Big Data confundem-se em certos aspectos. Uma conhecida abordagem para iden-

tificação dos pontos críticos de cada paradigma é conhecida como 3V, e destaca:

a) variedade, visualização, volume;

b) velocidade, virtualização, volume;

c) variedade, velocidade, volume;

d) virtualização, visualização, volume;

e) variedade, visualização, virtualização.

Letra c.

Como descrito na nossa teoria acima, primeiro foram propostos os 3 ”Vs” iniciais e

depois foram acrescentados 2 novos, formando assim os 5 ”Vs”. Sobre os 3 primei-

ros, são eles: Volume, Variedade e Velocidade.

O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 53 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

8. (CESPE/TJ-SE/ANALISTA JUDICIÁRIO/2014) Ao utilizar armazenamento dos da-


dos em nuvem, a localização do processamento de aplicações Big Data não influen-
ciará os custos e o tempo de resposta, uma vez que os dados são acessíveis a partir
de qualquer lugar.
C. Certo
E. Errado

Errado.
Com certeza influenciará no tempo de resposta e no custo porque, apesar da ten-
tativa das empresas de espalhar servidores por diversas regiões, isso não traz
garantia de que sempre haverá um tempo de resposta menor ou que para utilizar
dessa infraestrutura pagar-se-á. Claro que a concorrência entre as empresas que
oferecem serviços de armazenamento e processamento na nuvem está aumen-
tando, já que elas estão tentando se solidificar como oferta segura (protocolos de
segurança, criptografia, TIER-3) e barata (custo do processador, custo do Gb de ar-
mazenamento). Acredito que atingiremos isso no futuro, mas agora não é verdade.

9. (ESAF/ESAF/GESTÃO DE INFRAESTRUTURA DE TI/2014) Um framework, base-


ado em duas funções principais, para o processamento de grandes quantidades de
dados em clusters computacionais homogêneos, no qual problemas como integri-
dade dos dados, disponibilidade dos nós, escalabilidade da aplicação e recuperação
de falhas ocorrem de forma transparente ao usuário é o Hadoop
a) Cassandra.
b) EC2 - Elastic Compute Cloud.
c) Lambda.
d) MapReduce.

e) VPC - Virtual Private Cloud.


O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 54 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

Letra d.
O MapReduce é composto por duas funções: Map e Reduce. Elas são responsáveis
por processar grandes volumes de dados e a gestão do processo é realizada de
forma transparente para o usuário.

10. (ESAF/ESAF/2015) Em relação a Big Data e NoSQL, é correto afirmar que


a) os “3 Vs” principais do Big Data referem-se a Volume, Velocidade e Versatilidade
de dados.
b) na era do Big Data, as únicas estratégias eficientes para garantir a privacidade
são consentimento individual, opção de exclusão e anonimização.
c) o Hadoop, o mais conhecido e popular sistema para gestão de Big Data, foi cria-
do pela IBM, a partir de sua ferramenta de Data Mining WEKA.
d) o NoSQL é um sistema relacional, distribuído, em larga escala, muito eficaz na
organização e análise de grande quantidade de dados.
e) o Cassandra é um sistema de banco de dados baseado na abordagem NoSQL,
originalmente criado pelo Facebook, no qual os dados são identificados por meio de
uma chave.

Letra e.
Letra a está errada porque não é versatilidade e sim variedade.
Letra b está errada porque, analisando o Big Data de uma forma geral, a privacida-
de ainda é um tema a ser discutido na forma como os dados são coletados com ou
não. A sua permissão e os controles ainda são muito complicados.
Letra c está errada porque o Hadoop foi criado pela Apache

Letra d está errada porque o NoSQL não é relacional.

O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 55 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

11. (ESAF/ESAF/2015) Os Sistemas de Bancos de Dados Distribuídos (SBDD) apre-

sentam vantagens e desvantagens. Uma das desvantagens é

a) a redução da confiabilidade.

b) a redução da disponibilidade.

c) a redução da escalabilidade.

d) o aumento do overhead de processamento.

e) o compartilhamento de dados e o controle distribuído.

Letra d.

As vantagens: autonomia dos departamentos que controlam a base, maior tole-

rância a falhas, melhor performance, infraestrutura econômica, modularidade (fra-

co acoplamento).

As desvantagens: maior complexidade, instalação mais cara, criptografia deve ser

segura, overhead de processamento, inexperiência.

12. ( CESPE/CNJ/ANALISTA JUDICIÁRIO/2013) A escalabilidade dos bancos de da-

dos NoSQL é garantida pela ausência de um esquema (schema free).

C. Certo

E. Errado

Errado.

A escalabilidade de um banco de dados NoSQL não está vinculado ao fato de ele

ser um schema free.

O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 56 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

13. (INSTITUTO AOCP/CASAN/ANALISTA DE SISTEMA/2016) Em relação à Big

Data e NoSQL, é correto afirmar que

a) são conceitos concorrentes, portanto não podem ser implementados juntos.

b) são conceitos que se complementam e com características eficientes para tra-

balhar com pequenas quantidades de informações.

c) são duas ferramentas de empresas concorrentes.

d) são conceitos que se complementam.

e) os SGBDs Oracle e MySQL são implementações desses conceitos.

Letra d.

Letra a está errada porque não são concorrentes.

Letra b está errada porque não trabalha com pequenas quantidades de informa-

ções.

Letra c está errada porque não existe concorrência.

Letra e está errada porque Oracle e MySQL são bancos relacionais.

14. (FCC/INFRAERO/ANALISTA – BANCO DE DADOS/2011) É uma característica de

um sistema de Business Intelligence:

a) Capacidade de cruzar informações de diferentes bancos de dados, gerando re-

latórios analíticos diversos.

b) Utilização de comandos SQL para a geração de tabelas dinâmicas inteligentes

ligadas às regras de negócio.

c) Utilização de Sistemas Baseados em Conhecimento, onde é possível utilizar téc-

nicas de Inteligência Artificial na geração de relatórios.


O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 57 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

d) Análise automática de requisitos funcionais e não funcionais, permitindo a gera-

ção de relatórios gerenciais.

e) Análise de informações com o intuito de fornecer subsídio para a criação de sis-

temas inteligentes.

Letra a.

Letra b está errada porque não é uma característica usar SQL para gerar tabelas

dinâmicas. Sim, você pode gerar tabelas dinâmicas no BI, mas não faz isso com

uso de SQL.

Letra c está errada porque não é no BI que se usam técnicas de inteligência artifi-

cial, mas no Big Data.

Letra d está errada porque não existe análise automática para requisitos funcionais

e não funcionais. Funcionais definem as funcionalidades e o comportamento do

sistema e não funcionais definem o padrão e a qualidade que o sistema deve ofe-

recer. O desenvolvimento de BI pode até levar em consideração esses requisitos,

definindo junto aos usuários a sua importância, mas isso não é realizado de forma

automática.

Letra e está errada porque isso seria Big Data.

15. (FUNCAB/MDA/ANALISTA DE BUSSINESS INTELIGENCE/2014) Os projetos de

Business Intelligence apresentam a seguinte característica:

a) as especificações do projeto são estabelecidas sem necessitar da análise de re-

quisitos.

b) o desenvolvimento do projeto depende diretamente dos indicadores de desem-

penho.

O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 58 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

c) o uso de protótipos no projeto deve excluir a participação do cliente no processo.

d) o desenvolvimento do projeto independe do apoio da gestão.

e) as fases do projeto são totalmente independentes uma das outras.

Letra b.

Letra a está errada porque precisa da análise de requisitos. Sem ela, como vou sa-

ber o que o usuário final quer ver?

Letra c está errada porque nunca se deve excluir o cliente do processo de constru-

ção do BI.

Letra d está errada porque o sucesso de um BI é o apoio direto da gestão.

Letra e está errada, já que o BI é construído aos poucos, com suas fases sempre

interligadas. Por sua complexidade, seria impossível realizar um projeto em que a

alta gestão pudesse tirar o máximo proveito sem essa interligação.

16. (FCC/MPE-CE/ANALISTA MINISTERIAL/2013) Em relação ao entendimento do

significado do termo Business Intelligence (BI) e da solução que provê, a definição

que NÃO é coerente com o termo Business Intelligence é a que

a) consiste em uma metodologia que fornece objetivos de negócios ligados a obje-

tivos de TI, provendo métricas e modelos de maturidade para medir a sua eficácia

e identificando as responsabilidades relacionadas dos donos dos processos de ne-

gócios e de TI.

b) se refere à aplicação de técnicas analíticas para informações sobre condições

de negócio no sentido de melhorá-las, de uma maneira automatizada, mas com a

interpretação e respostas humanas, de forma a melhorar a tomada de decisões.


O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 59 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

c) reúne recursos que provêm a habilidade para que a pessoa certa receba a infor-

mação adequada e no momento correto para tomar a melhor decisão.

d) consiste em um sistema de negócios que inclui uma estrutura de busca efetiva e

acessível, acurada, em tempo real, com informações e relatórios que permitam aos

líderes das áreas de negócio se manterem informados para tomar decisões.

e) é uma solução fácil de dizer, mas difícil de fazer corretamente pois envolve mu-

danças na forma como a organização conduz uma busca efetiva, bem como, a ne-

cessidade de se possuir uma base de dados de qualidade para que se possa tomar

ações com o objetivo de otimizar a performance corporativa.

Letra a.

Questão capiciosa! A letra a traz a verdade, mas não para o BI. O que está descrito

é referente à metodologia para desenvolvimento de softwares. Os modelos mais

utilizados para desenvolvimento de softwares são: CMMI (Capability Maturity Model

Integration) e MPS.BR (Melhoria de Processos do Software Brasileiro). Uma dica

seria prestar a atenção caso a banca use palavras como metodologias. Elas, no

mundo de T, têm definições muito fortes e acabam destoando facilmente.

17. (CESPE/FUB/ANALISTA DE TECNOLOGIA DA INFORMAÇÃO/2015) A respeito

de Business Intelligence e sua aplicação em corporações, julgue o item a seguir.

Em um ambiente de Business Intelligence, o usuário pode deparar com diferentes

requisitos de infraestrutura para atender às necessidades de cada uma das instân-

cias dos sistemas analíticos.

C. Certo

E. Errado

O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 60 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

Certo.
Nada impede que o BI seja proveniente de locais diferentes e que esses locais pos-
suam uma infraestrutura diferente. Esse seria um cenário ruim porque aumentaria
a complexidade dos projetos, mas, mesmo assim, viável.

18. (FCC/TRT 15ª REGIÃO/ANALISTA JUDICIÁRIO/2015) No contexto de Business


Intelligence, os sistemas OLAP e OLTP se diferenciam em diversas características.
Na tabela abaixo, no que diz respeito às características, está INCORRETO:

a) Característica - Performance. /OLAP - Otimização para leitura e geração de aná-


lise e relatórios gerenciais. / OLTP - Alta velocidade na manipulação de dados ope-
racio- nais, porém ineficiente para geração de análises gerenciais.
b) Característica - Tipo de permissões nos dados. /OLAP - É permitido apenas in-
serção e leitura. Para o usuário está disponível apenas a leitura. / OLTP - Podem ser
feitas leitura, inserção, modificação e exclusão de dados.
c) Característica - Estrutura dos dados./OLAP - Armazenamento feito em Data Wa-
rehouse com otimização no desempenho em grandes volumes de dados. / OLTP - Ar-
mazenamento feito em bancos de dados convencionais pelos sistemas de informação
da organização.
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 61 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

d) Característica - Foco./OLAP - Nível operacional da organização. Visa a exe- cução

operacional do negócio. / OLTP - Nível estratégico da organização. Visa a análise

empresarial e tomada de decisão.

e) Característica - Volatilidade. /OLAP - Dados históricos e não voláteis que prati-

camente não sofrem alterações salvo em casos específicos motivados por erros ou

inconsistências. / OLTP -Dados voláteis, passíveis de modificação e exclusão.

Letra d.

Seria o contrário. OLAP visa à tomada de decisão enquanto OLTP visa ao operacio-

nal (dia a dia) da empresa.

19. (FCC/TRT 4ª REGIÃO/ANALISTA JUDICIÁRIO/2015) Considere a arquitetura

geral de um sistema de BI- Business Intelligence mostrada na figura abaixo.

O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 62 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

Nesta arquitetura

a) Data Marts representam áreas de armazenamento intermediário criadas a partir

do processo de ETL. Auxiliam na transição dos dados das fontes OLTP para o desti-

no final no Data Warehouse.

b) OLAP é um subconjunto de informações extraído do Data Warehouse que pode

ser identificado por assuntos ou departamentos específicos. Utiliza uma modela-

gem multidimensional conhecida como modelo estrela.

c) os dados armazenados no Data Warehouse são integrados na base única man-

tendo as convenções de nomes, valores de variáveis e outros atributos físicos de

dados como foram obtidos das bases de dados originais.

d) o Data Warehouse não é volátil, permite apenas a carga inicial dos dados e

consultas a estes dados. Além disso, os dados nele armazenados são precisos em

relação ao tempo, não podendo ser atualizados.

e) Data Mining se refere ao processo que, na construção do Data Warehouse, é

utilizado para composição de análises e relatórios, armazenando dados descritivos

e qualificando a respectiva métrica associada.

Letra d.

Letra a está errada porque este seria Staging Area e não Data Mart

Letra b está errada porque ele está definindo o que é Data Mart e não OLAP.

Letra c está errada porque não se mantêm no DW as convenções de nomes, valores

de variáveis e outros atributos físicos de dados como foram obtidos das bases de

dados originais.

Letra e está errada porque ele está definindo o que é uma dimensão.

O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 63 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

20. (FCC/TRT 4ª REGIÃO/ANALISTA JUDICIÁRIO/2015) Considere a figura abaixo

que traz componentes de um sistema de BI-Business Intelligence.

Os elementos I, II, III e IV indicados na figura são, correta e respectivamente, as-

sociados com:

a) PL/SQL − Oracle 11g − OLAP − Data Mining.

b) Portal Corporativo − SGBD − Consultas SQL − Cubo de Dados.

c) SGBD − Data Warehouse − OLAP − Data Mining.

d) Oracle − Cubo de Dados − Consultas PL/SQL − OLAP.

e) OLTP − Data Warehouse − Operações Drill − Cubo de Dados.

O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 64 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

Letra c.

Questão difícil não pela teoria, mas sim pela sutileza! Em um primeiro momento

poderíamos considerar duas respostas certas para ela, a letra c e a letra e, mas

apenas a c está correta. Por quê?

A sutileza está na imagem (sacana). Sabemos que a fonte de dados para carregar

em um DW pode ser de diversos formatos e um deles é o OLTP, mas como as fontes

de dados são várias, então na imagem podemos ver que existe o flat file, e o flat file

por si só não pode ser considerado um OLTP; seria o mesmo que considerar uma

planilha Excel um OLTP, e sabemos que isso não é verdade. Então, por que consi-

derar um flat file um SGBD? Porque temos sistemas de banco de dados criados que

são baseados em flat files, ou seja, nem todo flat file é um SGBD (uma planilha

sozinha), mas um SGBD pode ser baseado em flat files.

Aí você poderia dizer: “mas e a imagem IV no formato de um cubo, não é a repre-

sentação do conceito de cubo?”. Outra pegadinha. A banca queria forçar você es-

colher a letra e tirando o seu foco do flat file. O Data Mining poderia ser executado

dentro de um cubo para descobrir novos insigths, por isso a dica fica em não ficar

tão viciado nos desenhos que a gente encontra por aí, porque às vezes eles trazem

um resumo (para não ficar tão complexo) e podem levar a gente ao erro.

21. (FMP/TCE-RS/AUDITOR PÚBLICO EXTERNO/2011) Algumas empresas de ven-

das pela Internet usam intensamente a tecnologia de “Business intelligence (BI)”

para incrementar suas vendas. Dentre as ações abaixo descritas qual a que NÃO se

caracteriza como ação de BI para este objetivo?

a) Armazenar produtos visualizados pelo cliente e periodicamente enviar para o

e-mail cadastrado pelo cliente, ofertas daquele tipo de produto.


O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 65 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

b) Armazenar produtos visualizados pelo cliente para alimentar um bloco do site de

navegação com o título de “últimos produtos visualizados”.

c) Armazenar os dados do cartão de crédito ou conta bancária para facilitar a fina-

lização de uma compra.

d) Ao visualizar um produto, mostrar ao cliente percentual de clientes que compra-

ram ou visualizaram este produto e compraram outro similar, ofertando este outro.

e) Para cada produto visualizado pelo cliente oferecer, além da opção de compra,

a opção de armazenar para futura compra ou lista de desejos e, no futuro lembrar

esses armazenamentos ao cliente..()

Letra c.

Armazenar dados do cartão de crédito não gera nenhuma visão de negócio, por isso

não pode ser considerado BI.

22. (FGV/PROCEMPA/ANALISTA EM TI E COMUNICAÇÃO/2014) O teorema CAP

(CAP Theorem) é um importante resultado teórico na Ciência da Computação, e

frequentemente é referenciado na comparação entre sistemas de bancos de dados

“tradicionais” e aqueles que são conhecidos pela sigla NoSQL. Esse teorema aborda

as propriedades (ou garantias) que um sistema de banco de dados deve prover, e é

central na discussão das conveniências de utilização de um ou outro modelo.

Assinale a opção que descreve, corretamente, o significado das letras na sigla CAP.

a) Concurrency, Access, Time

b) Consistency, Atomicity, Parallel processing.

c) Consistency, Availability, Partition tolerance.

d) Concurrency, Availability, Pear processing.

e) Control, Atomicity, Partition netwo nrk.


O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 66 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

Letra c.

Esta questão trata diretamente do significado do teorema de CAP: Consistency,

Availability, Partition tolerance.

23. (CESPE/TJ-SE/ANALISTA JUDICIÁRIO/2014) Acerca de bancos de dados se-

miestruturados e bancos de dados NOSQL, julgue os itens subsecutivos.

Bancos de dados NOSQL orientados a documentos são apropriados para o armaze-

namento de dados semiestruturados.

C. Certo

E. Errado

Certo.

Entre as opções NoSQL existentes, a categoria mais apropriada para lidar com re-

gistros de dados semiestruturados são os sistemas de bancos de dados orientados

a documento.

24. (CESPE/TJ-SE/ANALISTA JUDICIÁRIO/2014) Acerca de bancos de dados se-

miestruturados e bancos de dados NOSQL, julgue os itens subsecutivos.

Devido à escalabilidade esperada para os bancos de dados NOSQL, a implementa-

ção desses bancos utiliza modelos de armazenamento de dados totalmente distin-

tos dos utilizados em sistemas relacionais.

C. Certo

E. Errado
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 67 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

Errado.

O erro está no fato de ele ter afirmado que os modelos de armazenamento de da-

dos são totalmente distintos, sendo que ele deveria ter escrito apenas que os mo-

delos de dados são totalmente distintos.

25. (CESPE/CNJ/ANALISTA JUDICIÁRIO/2013) Uma característica de bancos de

dados NoSQL é o suporte à replicação de dados. Entre as abordagens utilizadas

para replicação, inclui-se a mestre-escravo.

C. Certo

E. Errado

Certo.

A replicação no NoSQL pode ser feita de duas formas:

Master-Slave (mestre-escravo):

Cada escrita em banco resulta em N x escritas onde N é o número de slaves. Nesse

caso, temos um banco “master” que propaga cada write para os bancos “slaves”.

Isto aumenta a nossa velocidade de leitura mas não melhora em nada nossa capa-

cidade de escrita.

Multi-Master:

Aumentamos o número de masters em nosso sistema e assim aumentamos nossa

capacidade de escrita. Esta abordagem pode gerar conflitos.

O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 68 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

26. (CESPE/CNJ/ANALISTA JUDICIÁRIO/2013) Apesar de implementarem tecnolo-

gias distintas, todos os bancos de dados NoSQL apresentam em comum a imple-

mentação da tecnologia chave-valor.

C. Certo

E. Errado

Errado.

Errado porque existem outros modelos: grafo, documento, colunas e chave-valor.

27. (CESPE/TCE-PA/AUDITOR DE CONTROLE EXTERNO/2016) Acerca de seguran-

ça de banco de dados e de desenvolvimento de software, julgue o item subsecutivo.

Os bancos de dados NoSQL são imunes a ataques de injeção SQL.

C. Certo

E. Errado

Errado.

SQL injection, que visa a submeter código SQL para dentro de um banco com obje-

tivo de obter dados sem a devida permissão, está relacionado com uma falha mais

voltada para a aplicação do que para o banco. O tratamento do acesso indevido

deveria ser filtrado na aplicação, mas isso infelizmente não impede que o banco

possa sofrer ataques. Os bancos NoSQL também são vulneráveis.

O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 69 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

28. (CESPE/FUNPRESP-JUD/ANALISTA – TECNOLOGIA DA INFORMAÇÃO/2016) A

respeito de banco de dados, julgue o próximo item.

Os bancos de dados NoSQL não permitem a atualização de seus dados, por serem

orientados a documentos e(ou) coleções.

C. Certo

E. Errado

Errado.

A atualização dos dados não tem relação alguma com o fato d ele ser ou não ser

orientado a documentos e/ou coleções. Os tipos de NoSQL, sejam eles chave-valor,

documento, colunas ou grafos, vão permitir a sua atualização.

29. (CESPE/TJ-DFT/ANALISTA JUDICIÁRIO/2015) A respeito de tipos de bancos de

dados, julgue o item que se segue.

Sistemas de bancos de dados classificados como NoSQL permitem a inserção de

dados sem que haja um esquema predefinido.

C. Certo

E. Errado

Certo.

Uma das características do NoSQL é ser livre de esquema, por isso a questão está

certa.

O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 70 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo

30. (CESPE/TJ-SE/ANALISTA JUDICIÁRIO/2014) Acerca de bancos de dados se-

miestruturados e bancos de dados NOSQL, julgue os itens subsecutivos.

Para garantir a eficiência das consultas a bancos de dados semiestruturados, é fun-

damental a adoção de técnica de indexação que leve em consideração, além das

informações, as propriedades estruturais dos dados.

C. Certo

E. Errado

Certo.

A adoção de técnicas para tratar eficientemente a indexação e recuperação de da-

dos semi-estruturados é essencial para que usuários de sistemas de busca possam

construir consultas levando em consideração relações tanto estruturais quanto tex-

tuais.

www.grancursosonline.com.br 71 de 71

Você também pode gostar