Escolar Documentos
Profissional Documentos
Cultura Documentos
Análise de Informações
Business Intelligence
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo
SUMÁRIO
Business Intelligence...................................................................................3
Introdução.................................................................................................3
1. Business Intelligence (BI).........................................................................4
2. Big Data – Conceitos................................................................................8
3. Premissas do Big Data............................................................................ 15
4. Características do Big Data..................................................................... 18
4.1. Hadoop.............................................................................................. 18
4.2. Ecossistema Hadoop............................................................................ 22
4.3. NoSQL............................................................................................... 25
5. Aplicações do Big Data no mercado.......................................................... 33
Resumo.................................................................................................... 35
Questões de Concursos.............................................................................. 37
Gabarito................................................................................................... 49
Gabarito Comentado.................................................................................. 50
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 2 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo
BUSINESS INTELLIGENCE
Introdução
que desejam ter seus dados disponíveis para análise e geração de relatórios sem
Warehouse, seja ele o DW corporativo para atender a todos os setores de uma em-
presa ou com o Data Mart para atender a cada setor por vez.
Mas apesar de termos estudado tanto sobre o DW, não tratei das ferramentas de
OLAP e isso foi proposital; quis deixar esse assunto para ser tratado aqui, quando
discutiremos sobre Big Data. E por que isso? Simples, eu acredito que o Big Data é
é e como se chega lá, precisamos dar uma passadinha no que ainda é e será muito
uma parte desse degrau; do que adianta criar DW se eu não usá-lo numa ferra-
menta de OLAP?
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 3 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo
processo de carga definido pelo ETL, é nessa ferramenta que somos capazes de dar
vazão para a elaboração, enfim, dos tais relatórios que irão responder a todas as
dúvidas dos gestores. Claro que cada projeto possui os seus riscos; já pensou se a
final apresenta um gráfico ou relatório que não atende direito o que a alta gestão
gostaria de ver? Ou se o gestor está com dúvidas do que gostaria de saber, quais
(KPI) reais.
Uma coisa que eu acho interessante no BI é que ele não foi feito para mostrar
como a empresa está bem, e sim o contrário! Isso mesmo! Ele foca em apontar
onde estão os gargalos, onde as informações não batem, para que assim os indica-
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 4 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo
Como assim? Ele é a generalização de duas ou três dimensões para trazer uma
visão de algo. Exemplo: uma empresa gostaria de ver os dados financeiros suma-
rizados por produtos, pelo tempo e por cidade para que assim possa comparar as
despesas de orçamentos. Então podemos dizer que produto, tempo e cidade seriam
as dimensões de dados.
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 5 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo
e relatórios; alguns desses gráficos são disponibilizados em painéis para a alta ges-
tão para que eles possam monitorar os indicadores da empresa, percebendo quan-
novos insights.
que os dados por trás já estejam definidos nas dimensões e fatos. A imagem abaixo
traz uma visão de uma tela em que eu tenho, do lado esquerdo, as minhas colunas
informo se terá algum filtro específico (ano, cidade etc.), seleciono o tipo de gráfico
que quero ver e ele automaticamente já me mostra um esboço dessa visão. Faço
os ajustes necessários e a partir daí posso até compartilhar via e-mail com outras
pessoas.
Traçando o início para a nossa conversa sobre Big Data, o BI é uma ferramenta
poderosa que analisa o passado de uma instituição para ajudar a tomar decisões,
ma como foi concebida nos relatórios. Já no Big Data, temos essa visão e outras;
tar até prever o futuro. Com ele podemos cruzar informações que antes não esta-
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 7 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo
tamanho, MB, GB, TB, EX, mas, quando falamos de Big Data, isso depende do
contexto. Por exemplo: para um e-mail que suporta anexos de até 25 MB, ter de
Um outro exemplo seria: imagine que você possua 10TB de imagens que preci-
mento tradicionais. Realizar esse procedimento nos moldes atuais não seria possí-
gera 400 milhões de twits por dia e o Youtube gera 48.000 vídeos novos por dia.
Então você poderia se perguntar: por que é tão importante guardar esses dados?
Com o volume de usuários crescendo todos os dias, com os desafios para geren-
ciar todas essas informações, a resposta não poderia ser mais simples: receita,
dinheiro, grana! Isso mesmo, informação é valiosa e é um diferencial para que uma
mente, enfim, várias vertentes que estão ligadas à geração de receita por meio de
informações.
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 9 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo
e sim o que as empresas fazem com os dados. O Big Data pode ser utilizado para
trazer novos insights que levam a melhores decisões dentro de uma empresa; me-
Hoje temos uma grande diferença quando comparados com o passado: as uni-
dades de armazenamento (HD) ficaram mais baratas, mas mesmo assim não so-
mos capazes de armazenar tudo em um único disco, ainda seria muita informação.
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 10 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo
e como elas definem o que é o Big Data – como Gartner Group, MCAFEE e Inter-
dados; a Gartner Group ainda considera mais duas vertentes importantes: velo-
Velocidade e Variedade.
Mais tarde, em uma opinião pessoal, Cezar Taurion, diretor de novas tecnolo-
gias da IBM, agregou mais dois conceitos que complementaram a visão sobre o Big
Data: Valor e Veracidade, fechando assim os famosos “5 Vs” sobre o Big Data.
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 11 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo
gens enviadas pelo Facebook, registro dos processos nos sistemas internos
dentro das empresas. O objetivo do Big Data é utilizar a tecnologia para lidar
coletados possa trazer uma visão atualizada da situação desejada. Para Tau-
verá existir uma ferramenta capaz de analisar os dados em tempo real. Hoje
com a qual você obtém essa informação é o que torna a empresa diferenciada no
mercado. Um exemplo: uma pessoa que tenta passar o cartão de crédito que de-
mora para aprovar a transação pode desistir da venda porque o processo demorou
assim teremos também diversos tipos de dados, sendo eles classificados em:
dados, arquivos tipo CSV e XLS; possuem uma organização para serem
recuperados;
etc.
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 12 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo
exemplo: algo que é escrito dentro do Facebook pode ser considerado não
estruturado porque não existiria uma forma de organizar algo que seja ex-
Obs.: 90% de todos os dados gerados no mundo estão na forma de dados não
estruturados.
• Veracidade: a informação gerada precisa ser real, os dados por trás do pro-
cesso de Big Data precisam ser verídicos porque só assim ele será importante
para uma empresa. Com o Big Data não é possível controlar toda a infor-
mação falsa que pode existir na internet, mas com análises e estatísticas de
• Valor: esse é o “V” que torna o Big Data importante para uma empresa. Ter
acesso a milhares de dados não representa valor, mas sim o que podemos
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 13 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo
dos “Vs” para confundir; por isso, mesmo que ele mostre fora de ordem, é muito
Vimos como o Big Data é importante; olha esse exemplo real que aconteceu no
Estados Unidos e que demonstra como podemos usar as informações para atingir
melhor os consumidores.
Um pai recebeu alguns e-mails de uma loja chamada Target com vale descontos
em produtos para bebês. Indignado, o pai resolveu tirar satisfação com a loja ale-
gando que a loja estava induzindo sua filha a ter relações sexuais e filhos, porém,
só após muita confusão, os fatos finalmente foram esclarecidos. A filha assumiu
que estava grávida e a loja estava apenas fazendo o uso de informações fornecidas
pela web.
Outro caso interessante foi da empresa Skol, que veiculou uma propaganda com
frases que geraram dupla interpretação, assim gerando manifestações pelas mídias
digitais, o que levou a empresa a repensar sua estratégia de marketing. Abaixo
segue a resposta da empresa:
“As peças em questão fazem parte da nossa campanha “Viva RedONdo”, que
tem como mote aceitar os convites da vida e aproveitar os bons momentos. No
entanto, fomos alertados nas redes sociais que parte de nossa comunicação pode-
ria resultar em um entendimento dúbio. E, por respeito à diversidade de opiniões,
substituiremos as frases atuais por mensagens mais claras e positivas, que trans-
mitam o mesmo conceito. Repudiamos todo e qualquer ato de violência seja física
ou emocional e reiteramos o nosso compromisso com o consumo responsável.
Agradecemos por todos os comentários.”
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 14 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo
Sobre esse caso, é possível notar a importância do Big Data para coleta e moni-
toramento das informações compartilhadas nas redes sociais, e como isso influen-
Quando tratamos de Big Data, o mercado está cada vez mais aderente à solu-
ção, mas existem diversos pontos em que as empresas se confundem quando pen-
até confundem alguns pontos importantes que ajudam a entender para que serve
a solução.
Abaixo descrevemos algumas premissas que o Big Data possui e que precisam
ser esclarecidas:
Você não precisa ser uma grande empresa para se beneficiar do Big Data. Hoje
Algumas pessoas podem até dizer que o Big Data e o DW seriam mutualmen-
qualquer insight, descoberto. Um não pode operar sem o outro, por isso é muito
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 15 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo
Na verdade, ele já existe por volta de 20 anos. As únicas coisas que mudaram
e utilizamos.
existem muitas outras que poderiam ser respondidas, todas relacionadas à forma
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 17 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo
4.1. Hadoop
em diferentes locais (porque seu volume pode não caber em um lugar só), não
pode ser beneficiado pela forma como tratamos os dados atuais (modelo relacio-
nal), porque quanto maior uma tabela, maior é o tempo para processar os dados
dentro dela. Para que possamos acessar esses dados de forma performática, o uso
do Hadoop é essencial.
podemos citar:
• Simples implantação: uma das principais vantagens é que ele não necessi-
• Escalável: por meio dos clusters, que podem ter diversas máquinas, são uti-
mizando tempo.
• Tolerante a falhas: uma outra vantagem é que ele possui tolerância a fa-
lhas. Se uma máquina do cluster cair, ele automaticamente faz a troca dela
Tive uma ideia: como essa assunto parece ser muito cansativo, tentarei colocar
uma imagem para cada ponto importante para facilitar o entendimento do que está
escrito, ok?
em conjunto.
cione corretamente;
buído que armazena os dados. Pode imaginar que é igual a um FAT o NTFS
do Windows;
cluster;
rage Node (nó de armazenamento), enquanto o Job Tracker e o Task Tracker represen-
cebe os dados, divide em partes menores e as envia aos outros nós para se-
• Job Tracker: submete as tarefas para o Task Tracker, que precisam reportar
de tempos em tempos que estão vivos e efetuando as suas tarefas, caso con-
O Hadoop é a base do processamento do Big Data, por isso seus detalhes são im-
Como esse processo de gestão do Hadoop possui muitos detalhes, o CESPE costu-
ma inverter os papéis de cada objeto; já foi alvo de questão assim o papel do Job
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 21 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo
ginar o Hadoop como uma casa, ela não seria muito confortável: teria paredes,
janelas, portas, canos e fios por toda parte. Quando falamos do ecossistema, ele
poderia ser considerado os móveis que decoram a casa e a deixam mais confortável
como Spark, Hive, Pig, Oozie e Sqoop. O interessante dessas ferramentas é que
elas servem para suplementar o que já foi descrito acima, os 4 componentes que
fazem parte do Hadoop: HDFS, MapReduce, Yarn e Common. Então, por que usar
essas ferramentas se o Hadoop já tem o que eu preciso? Simples, elas são boas e
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 23 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo
Obs.: existem diversas ferramentas para Hadoop além das citadas, por isso foquei
Caso queiram analisar outras ferramentas, segue o link que descreve cada uma
https://hadoopecosystemtable.github.io/
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 24 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo
4.3. NoSQL
O NoSQL que significa Not Only SQL (Não Apenas SQL), surgiu com o propósito
muito e existe uma previsão de crescimento anual de 21% até a 2020. Cassandra
cebook. Hoje ele faz parte do ecossistema Hadoop como uma opção de banco de
dados NoSQL.
bom, por que não abandonamos o banco de dados relacional e migramos tudo
existentes e regras de negócios, que nem sempre são possíveis de mudar, para que
fossem adaptadas; isso com certeza traria um custo muito alto para a empresa,
o que inviabilizaria o projeto, mas pode-se pensar em sua adoção para novos sis-
temas! Mas mesmo assim, ainda com ressalvas. Aí você deve estar pensando que
esse negócio de NoSQL é fraco demais para se usar. Até te entendo, mas a verdade
é que qualquer projeto precisa ser pensado, e isso reflete até na infraestrutura que
vamos oferecer por trás. Podemos usar uma analogia simples: usar um canhão
para matar formiga ou colocar um carro de fórmula 1 para correr numa pista de
kart. Qual seria o propósito? É como gastar tempo para implantar um banco de
que, para um sistema que gera milhões de informações todos os dias, utilizar um
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 25 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo
banco de dados relacional traria um custo de manutenção muito alto por trás da
aplicação e por isso surgiu essa nova opção, mais performática, para ajudar nessa
gestão.
Um ponto importante que precisa ficar claro quando tratamos de NoSQL é que
ele não segue o ACID (Atomicity, Consistency, Isolation e Durability), que é o que
paralelo;
Com isso temos 3 características que precisam ficar claras quando comparamos
discos.
simples. Você pode trocar o SGBDR por outro a que a aplicação ainda se co-
de uma máquina.
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 26 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo
Para que possamos definir melhor como o NoSQL funciona, precisamos explicar
também chamado de teorema de Brewer, que foi definido na época por Eric Brewer.
pedido, mesmo em caso de falhas. Isso deve ser verdade para as operações
a uma solicitação.
• Sistemas CP: consistência forte e tolerante a falhas, mas abrem mão (um
pouco) da disponibilidade.
Agora quando estamos falando do baco de dados NoSQL, este segue o modelo
BASE (Basically Avaliable, Soft-State e Eventually Consistent), que tem sua base
a qualquer pedido. Mas essa resposta ainda pode ser “falha” para obter os
em mudança.
• Estado Leve: o estado do sistema pode mudar ao longo do tempo; isso quer
os lugares, mais cedo ou mais tarde, mas o sistema continuará a receber en-
a próxima.
usa memória para processar mais rápido, e as informações que são pouco
cionais isso não é possível devido à alta concorrência. Mas nada impede que
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 29 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo
dados NoSQL:
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 30 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo
pt/nosql/
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 31 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo
tantes:
• Chave-Valor: é o banco de dados mais simples; possui uma tabela com ape-
nas duas colunas, sendo uma a chave primária e a outra o valor. Dentro da
representa a chave.
Obs.: qual é o melhor modelo? Aquele que resolve o seu problema! Não existe um
mais indicado, cada um tem o seu valor e se encaixa melhor de acordo com
a sua necessidade.
As bancas cobram questões sobre os modelos de NoSQL. Uma que apareceu foi
tratando sobre o modelo orientado a documentos. Por isso vale a pena saber a ca-
Agora que já entendemos qual é o propósito do Big Data e como ele está aos
poucos mudando a forma como enxergamos sistemas e sua utilização, fica mais
fácil compreender que sua utilização está mudando a maneira como as grandes
Até pouco tempo atrás, contratar uma empresa para realizar uma pesquisa de
mercado era suficiente para mapear como um consumidor agia e assim definir uma
torna a chave para garantir uma posição diferenciada nesse mercado tão compe-
titivo. É nesse ponto que o Big Data tem aparecido. Abaixo seguem cases reais de
empresas que estão utilizando dados massivos para obter novas visões.
Um exemplo é o software chamado Nike Run, o qual registra a sua atividade e com
isso você pode compartilhar com os seus amigos o seu rendimento, incentivando
que outros façam a mesma coisa. O ponto importante desse processo é que a Nike,
com isso, possui acesso a todos os dados compartilhados e pode realizar estudos
lidade já existentes com os dados coletados dos clientes com base no seu compor-
Airways pode fazer ofertas mais direcionadas de forma a criar uma experiência
mart diz que adicionar pesquisa semântica melhorou as compras on-line comple-
tando uma compra de 10% a 15% a mais. Nos termos de Walmart, isso são bilhões
de dólares.
para avaliar os movimentos dos jogadores durante os treinos, o que ajuda os trei-
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 34 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo
Resumo
• BI são perguntas que você faz para coisas que você sabe;
• Big Data: perguntas que você não faz para coisas que você não sabe;
• Big Data pode cruzar dados de várias fontes para gerar novos insights;
• As premissas do Big Data são: solução para tudo, trazer grandes mudanças,
prover sempre as respostas certas, possuir valor inerente e ser apenas para
grandes empresas;
apenas verticalmente;
• Outras ferramentas importantes Hadoop são: Pig, Hive, Hbase, Spark, oozie,
Sqoop;
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 36 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo
QUESTÕES DE CONCURSOS
alidade.
des massas de dados, no contexto de Big Data, é muito utilizada uma plataforma
a) Yam Common.
b) GoogleCrush.
c) EMRx.
d) Hadoop.
e) MapFix.
dos dados comumente precisa ser precedida de uma transformação de dados não
E. Errado
C. Certo
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 37 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo
C. Certo
E. Errado
E. Errado
C. Certo
C. Certo
E. Errado
Big Data confundem-se em certos aspectos. Uma conhecida abordagem para iden-
tificação dos pontos críticos de cada paradigma é conhecida como 3V, e destaca:
ciará os custos e o tempo de resposta, uma vez que os dados são acessíveis a partir
de qualquer lugar.
C Certo
E Errado
a) Cassandra.
c) Lambda.
d) MapReduce.
de dados.
c) o Hadoop, o mais conhecido e popular sistema para gestão de Big Data, foi cria-
do pela IBM, a partir de sua ferramenta de Data Mining WEKA.
d) o NoSQL é um sistema relacional, distribuído, em larga escala, muito eficaz na
organização e análise de grande quantidade de dados.
e) o Cassandra é um sistema de banco de dados baseado na abordagem NoSQL,
originalmente criado pelo Facebook, no qual os dados são identificados por meio de
uma chave.
temas inteligentes.
quisitos.
penho.
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 41 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo
tivos de TI, provendo métricas e modelos de maturidade para medir a sua eficácia
gócios e de TI.
c) reúne recursos que provêm a habilidade para que a pessoa certa receba a infor-
acessível, acurada, em tempo real, com informações e relatórios que permitam aos
e) é uma solução fácil de dizer, mas difícil de fazer corretamente pois envolve mu-
danças na forma como a organização conduz uma busca efetiva, bem como, a ne-
cessidade de se possuir uma base de dados de qualidade para que se possa tomar
C. Certo
E. Errado
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 42 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo
serção e leitura. Para o usuário está disponível apenas a leitura. / OLTP - Podem ser
da organização.
camente não sofrem alterações salvo em casos específicos motivados por erros ou
Nesta arquitetura
a) Data Marts representam áreas de armazenamento intermediário criadas a partir
do processo de ETL. Auxiliam na transição dos dados das fontes OLTP para o desti-
no final no Data Warehouse.
b) OLAP é um subconjunto de informações extraído do Data Warehouse que pode
ser identificado por assuntos ou departamentos específicos. Utiliza uma modela-
gem multidimensional conhecida como modelo estrela.
c) os dados armazenados no Data Warehouse são integrados na base única man-
tendo as convenções de nomes, valores de variáveis e outros atributos físicos de
dados como foram obtidos das bases de dados originais.
d) o Data Warehouse não é volátil, permite apenas a carga inicial dos dados e
consultas a estes dados. Além disso, os dados nele armazenados são precisos em
relação ao tempo, não podendo ser atualizados.
e) Data Mining se refere ao processo que, na construção do Data Warehouse, é
utilizado para composição de análises e relatórios, armazenando dados descritivos
e qualificando a respectiva métrica associada.
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 44 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo
sociados com:
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 45 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo
para incrementar suas vendas. Dentre as ações abaixo descritas qual a que NÃO se
ram ou visualizaram este produto e compraram outro similar, ofertando este outro.
e) Para cada produto visualizado pelo cliente oferecer, além da opção de compra,
“tradicionais” e aqueles que são conhecidos pela sigla NoSQL. Esse teorema aborda
Assinale a opção que descreve, corretamente, o significado das letras na sigla CAP.
C. Certo
E. Errado
C. Certo
E. Errado
C. Certo
E. Errado
C. Certo
E. Errado
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 47 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo
C. Certo
E. Errado
Os bancos de dados NoSQL não permitem a atualização de seus dados, por serem
C. Certo
E. Errado
C. Certo
E. Errado
C. Certo
E. Errado
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 48 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo
GABARITO
1. d 16. a
2. d 17. C
3. C 18. d
4. E 19. d
5. C 20. c
6. E 21. c
7. c 22. c
8. E 23. C
9. d 24. E
10. e 25. C
11. d 26. E
12. E 27. E
13. d 28. E
14. a 29. C
15. b 30. C
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 49 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo
GABARITO COMENTADO
alidade.
Letra d.
des massas de dados, no contexto de Big Data, é muito utilizada uma plataforma
a) Yam Common.
b) GoogleCrush.
c) EMRx.
d) Hadoop.
e) MapFix.
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 50 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo
Letra d.
Apenas o Hadoop é capaz processar grandes volumes de dados que um banco tra-
dos dados comumente precisa ser precedida de uma transformação de dados não
E. Errado
C. Certo
Certo.
Esse processo acontece por meio do uso de ETL, na fase de transformação, que
C. Certo
E. Errado
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 51 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo
Errado.
E. Errado
C. Certo
Certo.
rações de sumarização. Ele foi introduzido pela Google para suportar computações
C. Certo
E. Errado
Errado.
Ele faz a gestão deles e verifica se eles estão ativos e funcionando corretamente.
Big Data confundem-se em certos aspectos. Uma conhecida abordagem para iden-
tificação dos pontos críticos de cada paradigma é conhecida como 3V, e destaca:
Letra c.
Como descrito na nossa teoria acima, primeiro foram propostos os 3 ”Vs” iniciais e
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 53 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo
Errado.
Com certeza influenciará no tempo de resposta e no custo porque, apesar da ten-
tativa das empresas de espalhar servidores por diversas regiões, isso não traz
garantia de que sempre haverá um tempo de resposta menor ou que para utilizar
dessa infraestrutura pagar-se-á. Claro que a concorrência entre as empresas que
oferecem serviços de armazenamento e processamento na nuvem está aumen-
tando, já que elas estão tentando se solidificar como oferta segura (protocolos de
segurança, criptografia, TIER-3) e barata (custo do processador, custo do Gb de ar-
mazenamento). Acredito que atingiremos isso no futuro, mas agora não é verdade.
Letra d.
O MapReduce é composto por duas funções: Map e Reduce. Elas são responsáveis
por processar grandes volumes de dados e a gestão do processo é realizada de
forma transparente para o usuário.
Letra e.
Letra a está errada porque não é versatilidade e sim variedade.
Letra b está errada porque, analisando o Big Data de uma forma geral, a privacida-
de ainda é um tema a ser discutido na forma como os dados são coletados com ou
não. A sua permissão e os controles ainda são muito complicados.
Letra c está errada porque o Hadoop foi criado pela Apache
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 55 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo
a) a redução da confiabilidade.
b) a redução da disponibilidade.
c) a redução da escalabilidade.
Letra d.
co acoplamento).
C. Certo
E. Errado
Errado.
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 56 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo
Letra d.
Letra b está errada porque não trabalha com pequenas quantidades de informa-
ções.
temas inteligentes.
Letra a.
Letra b está errada porque não é uma característica usar SQL para gerar tabelas
dinâmicas. Sim, você pode gerar tabelas dinâmicas no BI, mas não faz isso com
uso de SQL.
Letra c está errada porque não é no BI que se usam técnicas de inteligência artifi-
Letra d está errada porque não existe análise automática para requisitos funcionais
sistema e não funcionais definem o padrão e a qualidade que o sistema deve ofe-
definindo junto aos usuários a sua importância, mas isso não é realizado de forma
automática.
quisitos.
penho.
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 58 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo
Letra b.
Letra a está errada porque precisa da análise de requisitos. Sem ela, como vou sa-
Letra c está errada porque nunca se deve excluir o cliente do processo de constru-
ção do BI.
Letra e está errada, já que o BI é construído aos poucos, com suas fases sempre
tivos de TI, provendo métricas e modelos de maturidade para medir a sua eficácia
gócios e de TI.
c) reúne recursos que provêm a habilidade para que a pessoa certa receba a infor-
acessível, acurada, em tempo real, com informações e relatórios que permitam aos
e) é uma solução fácil de dizer, mas difícil de fazer corretamente pois envolve mu-
danças na forma como a organização conduz uma busca efetiva, bem como, a ne-
cessidade de se possuir uma base de dados de qualidade para que se possa tomar
Letra a.
Questão capiciosa! A letra a traz a verdade, mas não para o BI. O que está descrito
seria prestar a atenção caso a banca use palavras como metodologias. Elas, no
C. Certo
E. Errado
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 60 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo
Certo.
Nada impede que o BI seja proveniente de locais diferentes e que esses locais pos-
suam uma infraestrutura diferente. Esse seria um cenário ruim porque aumentaria
a complexidade dos projetos, mas, mesmo assim, viável.
camente não sofrem alterações salvo em casos específicos motivados por erros ou
Letra d.
Seria o contrário. OLAP visa à tomada de decisão enquanto OLTP visa ao operacio-
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 62 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo
Nesta arquitetura
do processo de ETL. Auxiliam na transição dos dados das fontes OLTP para o desti-
d) o Data Warehouse não é volátil, permite apenas a carga inicial dos dados e
consultas a estes dados. Além disso, os dados nele armazenados são precisos em
Letra d.
Letra a está errada porque este seria Staging Area e não Data Mart
Letra b está errada porque ele está definindo o que é Data Mart e não OLAP.
de variáveis e outros atributos físicos de dados como foram obtidos das bases de
dados originais.
Letra e está errada porque ele está definindo o que é uma dimensão.
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 63 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo
sociados com:
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 64 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo
Letra c.
Questão difícil não pela teoria, mas sim pela sutileza! Em um primeiro momento
poderíamos considerar duas respostas certas para ela, a letra c e a letra e, mas
A sutileza está na imagem (sacana). Sabemos que a fonte de dados para carregar
de dados são várias, então na imagem podemos ver que existe o flat file, e o flat file
por si só não pode ser considerado um OLTP; seria o mesmo que considerar uma
planilha Excel um OLTP, e sabemos que isso não é verdade. Então, por que consi-
derar um flat file um SGBD? Porque temos sistemas de banco de dados criados que
são baseados em flat files, ou seja, nem todo flat file é um SGBD (uma planilha
sentação do conceito de cubo?”. Outra pegadinha. A banca queria forçar você es-
colher a letra e tirando o seu foco do flat file. O Data Mining poderia ser executado
dentro de um cubo para descobrir novos insigths, por isso a dica fica em não ficar
tão viciado nos desenhos que a gente encontra por aí, porque às vezes eles trazem
um resumo (para não ficar tão complexo) e podem levar a gente ao erro.
para incrementar suas vendas. Dentre as ações abaixo descritas qual a que NÃO se
ram ou visualizaram este produto e compraram outro similar, ofertando este outro.
e) Para cada produto visualizado pelo cliente oferecer, além da opção de compra,
Letra c.
Armazenar dados do cartão de crédito não gera nenhuma visão de negócio, por isso
“tradicionais” e aqueles que são conhecidos pela sigla NoSQL. Esse teorema aborda
Assinale a opção que descreve, corretamente, o significado das letras na sigla CAP.
Letra c.
C. Certo
E. Errado
Certo.
Entre as opções NoSQL existentes, a categoria mais apropriada para lidar com re-
a documento.
C. Certo
E. Errado
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 67 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo
Errado.
O erro está no fato de ele ter afirmado que os modelos de armazenamento de da-
dos são totalmente distintos, sendo que ele deveria ter escrito apenas que os mo-
C. Certo
E. Errado
Certo.
Master-Slave (mestre-escravo):
caso, temos um banco “master” que propaga cada write para os bancos “slaves”.
Isto aumenta a nossa velocidade de leitura mas não melhora em nada nossa capa-
cidade de escrita.
Multi-Master:
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 68 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo
C. Certo
E. Errado
Errado.
C. Certo
E. Errado
Errado.
SQL injection, que visa a submeter código SQL para dentro de um banco com obje-
tivo de obter dados sem a devida permissão, está relacionado com uma falha mais
deveria ser filtrado na aplicação, mas isso infelizmente não impede que o banco
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 69 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo
Os bancos de dados NoSQL não permitem a atualização de seus dados, por serem
C. Certo
E. Errado
Errado.
A atualização dos dados não tem relação alguma com o fato d ele ser ou não ser
C. Certo
E. Errado
Certo.
Uma das características do NoSQL é ser livre de esquema, por isso a questão está
certa.
O conteúdo desta aula em pdf é licenciado para WESLEY HENRIQUE DE ALBUQUERQUE - 02409124119, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 70 de 71
ANÁLISE DE INFORMAÇÕES
Business Intelligence
Prof. Rafael Faria e Celso Ângelo
C. Certo
E. Errado
Certo.
tuais.
www.grancursosonline.com.br 71 de 71