Você está na página 1de 73

Aula 05

Tecnologia da Informação p/ ICMS/SP


Professor: Victor Dalton
Tecnologia da Informação para /CMS/SP 2015- Pré Edital
Agente Fiscal de Rendas- Especialidade Gestão Tributária
Pro Victor Dalton -Aula 05
AULA 05: Business Intelligence

SUMARIO PAGINA
1. Business I ntelligence 2
2. Data Mining 3
2.1 O Processo de Descoberta do Conhecimento em BDs(KDD ) 3
2.2 Data Mining 5
3. Data Warehouse 8
3.1 Conceitos Básicos 8
3.2 Características do Data Warehouse 9
3.3 Data Marts 11
Comparação - Data Mining x Data Warehouse 12
3.4 ETL 13
4. Ferramentas OLAP 16
4.1 Definição 16
4. 2 Ooeracões em OLAP 17
4. 3 Arquiteturas OLAP 18
4.4 Duas formas de modelagem multidimensional: star e snow flake 19
Exercícios Comentados 22
Considerações Finais 53
Exercícios 54
Gabarito 72

Olá a m igos e amigas!

Estudar Business I nt elligence é u m a cont inuação natura l do est ud o d e


Bancos de Dados, u ma vez q ue sua a plicação oco rre princi pa l m ente sobre eles.
Espero q ue gost e m da aula .

Aos estudos !

Observação importante: este curso é protegido por direitos


autorais (copyright}, nos termos da Lei 9.610/98, que altera,
atualiza e consolida a legislação sobre direitos autorais e dá
outras providências.

Grupos de rateio e pirataria são clandestinos, violam a lei e


prejudicam os professores que elaboram o cursos. Valorize o
trabalho de nossa equipe adquirindo os cursos honestamente
através do site Estratégia Concursos;-}

Prof. Victor Da/ton


www.estrategiaconcursos.com.br 1 de 72
Tecnologia da Informação para /CMS/SP 2015- Pré Edital
Agente Fiscal de Rendas- Especialidade Gestão Tributária
Pro Victor Dalton -Aula 05
BUSINESS INTELLIGENCE

1. BUSINESS INTELLIGENCE (INTELIGÊNCIA DE NEGÓCIO)

Quando estudamos bancos de dados, nossa primeira preocupação é


conceituar dado, informação, e conhecimento.

O Banco de dados, como o próprio nome diz, é populado com dados, que
estão relacionados com alguma finalidade . As informações, em um segundo
momento, são depreendidas dos próprios dados, com certa facilidade . Às vezes,
a própria modelagem dos dados em um formato apresentável já extrai
informação.

Obter conhecimento, todavia, não é uma tarefa simples. Encontrar


padrões relevantes dentre milhares (ou mesmo milhões) de registros em bases
de dados distintas, de modo a subsidiar decisões de negócio é um verdadeiro
desafio empresarial. Nesse contexto, surge a Business Intelligence .

Business Intelligence (BI) pode ser traduzido como inteligência de


negócios, ou inteligência empresaria l. Isto significa que é um método que visa
ajudar as empresas a tomar decisões inteligentes, por meio de dados e
informações recolhidas por diversos sistemas de informação.

Prof. Victor Da/ton


www.estrategiaconcursos.com.br 2 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
Sendo assim, BI é uma tecnologia que permite às empresas transformar
dados guardados nos seus sistemas em Informação qualitativa e importante
para a tomada de decisão. Há uma forte tendência de que os produtos que
compõem o sistema de BI de uma empresa passem provenham funções extras
que auxiliem na tomada de decisões, como, por exemplo, ferramentas de Data
Mining.

Ou seja, BI é um conjunto de técnicas, métodos e ferramentas que


subsidiam o processo de decisão de uma empresa.

Sistemas de apoio à Decisão (ou suporte à Decisão) costumam


combinar diversas dessas técnicas, métodos e ferramentas para suportar a
Inteligência do Negócio.

Estudaremos uma técnica de descoberta de conhecimento, o Data Mining,


e uma ferramenta (repositório de dados) chamada DataWarehouse.

2. DATA MINING (MINERAÇÃO DE DADOS)

2.1 O Processo de Descoberta do Conhecimento em BDs (KDD)

O Data Mining pode fazer parte de um processo maior, chamado Processo


de Descoberta do Conhecimento em Bancos de Dados (KDD). Como o próprio
nome diz, e, dentro do nosso contexto, este processo está diretamente
relacionado à Inteligência de Negócios, pois compreende a descoberta de
padrões úteis em Bases de Dados.

Fayyad et al (1996) afirmam que o KDD é composto por cinco fases, a


saber:

Prof. Victor Dalton


www.estrategiaconcursos.com.br 3 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05

Seleção
Processo que define quais serão os dados a serem trabalhados. Os dados
podem ser selecionados das mais diversas fontes de dados, tais como: banco de
dados relacional, arquivo texto legado, dentre outros. Ainda, dentro do universo
de dados selecionados, outras restrições podem ser aplicadas.

Pré-processamento
Estágio de “limpeza dos dados”, por meio de remoção de inconsistências,
ajustes de formatos de dados, análise de outliers (remover do universo dos
dados ou considerá-los?).

Exs: O sexo de um paciente gestante (informação desnecessária)


Reconfiguração dos dados para assegurar formatos consistentes (dados
que distinguem sexo por “F” ou “M”, e dados que distinguem por “M” ou “H”)

Transformação
Transformam-se os dados em formatos utilizáveis. Esta dependerá da
técnica data mining usada.
Exs: Rede neural, que converte valor literal em valor numérico
Disponibilização os dados de maneira usável e navegável.

Data mining
É a verdadeira extração dos padrões de comportamento dos dados.
Estudaremos à parte.

Prof. Victor Dalton


www.estrategiaconcursos.com.br 4 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
Interpretação e Avaliação
Identificados os padrões pelo sistema, estes serão interpretados em
conhecimentos, os quais darão suporte à tomada de decisões humanas.

2.2 Data Mining

Data Mining, como o nome indica, se refere à mineração ou a descoberta


de informações em função de padrões ou regras em grande quantidade de
dados, sejam elas bases de dados convencionais ou não.
O DM utiliza técnicas de inteligência artificial que procuram relações de
similaridade ou discordância entre dados.
Seu objetivo é encontrar, automaticamente, padrões, anomalias e regras
com o propósito de transformar dados, aparentemente ocultos, em informações
úteis para a tomada de decisão e/ou avaliação de resultados.

Esta mineração pode utilizar várias técnicas para a descoberta de


conhecimento. Vejamos algumas:

Associação: Explicando de forma bem simples, é enxergar alguma forma


de relação entre variáveis (do tipo X influencia Y). Ex: Idade influencia valor do
carro comprado.

Prof. Victor Dalton


www.estrategiaconcursos.com.br 5 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
Descrição de classes: provê um resumo conciso e sucinto de uma coleção
de dados e a distingue de outras. O resumo de uma coleção de dados é
chamado de caracterização de classe; enquanto a comparação entre duas ou
mais coleções de dados é chamada comparação ou discriminação de classe. A
descrição de classe não só deveria cobrir suas propriedades de resumo tal como
a contagem, somas, e cálculos de médias, mas também suas propriedades sobre
a dispersão dos dados, tais como a variância, desvio padrão, quartis, dentre
outros;

Classificação: É o processo de encontrar um modelo que descreve classes


diferentes de dados (por exemplo, “ensinar” ao sistema quais clientes bancários
são de risco alto, médio e baixo, por meio de alguns registros, e, a partir deste
ponto, a mineração por si só será capaz de classificar o restante da base de
dados).

Agrupamento(clustering): Similar à classificação, porém sem supervisão


(o sistema por si só sendo capaz de criar grupos).

Descoberta de padrões sequenciais: Envolve a descoberta de


informações relevantes com base na sequência dos registros. Exemplo, o
sistema descobrir que se o cliente compra pão, é provável que também compre
leite;

Prof. Victor Dalton


www.estrategiaconcursos.com.br 6 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
Descoberta de padrões em séries temporais: Descoberta de
informações relevantes com base na época dos registros. Exemplo, o sistema
descobrir que as vendas de guarda-chuva caem em determinados meses do ano,
“coincidentemente” na época da seca;

Regressão: a análise de diversas variáveis para prever uma próxima. Por


exemplo, ver os exames de um paciente e calcular a probabilidade de
sobrevivência a uma cirurgia, com base no histórico de pacientes operados.

Redes neurais: é uma extensão da regressão (regressão generalizada),


utilizando princípios da inteligência artificial;

Algoritmos genéticos: são técnicas de busca utilizadas na ciência da


computação para achar soluções aproximadas em problemas de otimização e
busca, sendo uma classe particular de algoritmos evolutivos que usam técnicas
inspiradas pela biologia evolutiva como hereditariedade, mutação, seleção
natural e recombinação.

EXEMPLO CLÁSSICO DA APLICAÇÃO DE DATA MINING!

Todo professor conta essa historinha ao falar de Data Mining, rs.


O Walmart, na década de 90, descobriu que homens casados, entre 25 e
30 anos, compravam fraldas e/ou cervejas às sextas-feiras à tarde no
caminho do trabalho para casa. Assim sendo, a rede otimizou às gôndolas nos
pontos de vendas, colocando as fraldas ao lado das cervejas, e o consumo de
ambos os produtos cresceu 30%. Cá entre nós, uma associação entre fraldas
e cervejas não é intuitiva. É o tipo de coisa que o Data Mining pode revelar!

Prof. Victor Dalton


www.estrategiaconcursos.com.br 7 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
Ainda, as Lojas Brasileiras, antes de encerrarem suas operações, em 1999,
aplicaram 1 milhão de dólares em técnicas de data mining, reduzindo de 51000
produtos para 14000 produtos oferecidos em suas lojas. Como exemplo de
anomalias detectadas, encontraram roupas de inverno e guarda chuvas
encalhados no Nordeste, bem como batedeiras 110v à venda em SC, onde a
corrente é 220v. Se tivessem aplicado o DM antes, provavelmente não teriam
falido....

3. DATA WAREHOUSE

3.1 Conceitos Básicos

Um Data Warehouse, ou armazém de dados, ou ainda depósito de


dados, é um repositório de informações colhidas de várias origens,
armazenadas sob um esquema unificado, em um único local. Quando
reunidos, os dados são armazenados por muito tempo, permitindo o acesso a
dados históricos. Ainda, o desenho da base de dados favorece os relatórios, a
análise de grandes volumes de dados e a obtenção de informações estratégicas
que podem facilitar a tomada de decisão.

O Data Warehouse possibilita a análise de grandes volumes de dados,


coletados dos sistemas transacionais (OLTP). São as chamadas séries históricas

Prof. Victor Dalton


www.estrategiaconcursos.com.br 8 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
que possibilitam uma melhor análise de eventos passados, oferecendo suporte
às tomadas de decisões presentes e a previsão de eventos futuros. Por
definição, os dados em um data warehouse não são voláteis, ou seja, eles não
mudam, salvo quando é necessário fazer correções de dados previamente
carregados. Os dados estão disponíveis somente para leitura e não podem ser
alterados.

A ferramenta mais popular para exploração de um data warehouse é


a Online Analytical Processing OLAP ou Processo Analítico em Tempo Real,
mas muitas outras podem ser usadas, como o Data Mining.

Atualmente, por sua capacidade de sumarizar e analisar grandes volumes


de dados, o data warehouse é o núcleo dos sistemas de informações
gerenciais e apoio à decisão das principais soluções de business intelligence do
mercado.

3.2 Características do Data Warehouse

O Datawarehouse possui 4 características marcantes. São elas:

Não-volátil: Diferentemente de um Banco de Dados operacional, o


Datawarehouse apenas recebe informações. Exclusões ou alterações ocorrem
apenas para a correção de dados inseridos com erro.

Prof. Victor Dalton


www.estrategiaconcursos.com.br 9 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05

Integrado: Um Datawarehouse deve ser integrado, ou seja, trabalha de


forma a globalizar e aproveitar os termos e as estruturas técnicas que são
utilizados nos sistemas de informações tradicionais. Por exemplo, na
representação de sexo, um Datawarehouse manipula todas as formas seguintes:
“m” ou “f”, “0” ou “1”, “x” ou “y”, “macho” ou “fêmea”, “homem” ou “mulher”,
“dama” ou “cavalheiro”.

Prof. Victor Dalton


www.estrategiaconcursos.com.br 10 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
Orientado por assuntos: Um DW sempre armazena dados importantes
sobre temas específicos da empresa e conforme o interesse das pessoas que irão
utilizá-lo. Bancos de dados operacionais tratam de estoques, entradas e saídas
de materiais. DW trata de clientes, vendas e produtos.
Por exemplo, uma empresa pode trabalhar com vendas de produtos
alimentícios no varejo e ter o seu maior interesse ser o perfil de seus
compradores. Portanto, o DW será voltado para as pessoas que compram seus
produtos e não para os produtos que ela vende.

Variante no tempo: A variação em relação ao tempo consiste na


manutenção de um histórico de dados em relação ao período de tempo maior
que dos sistemas comuns. Ao analisarmos um dado de um DW, o mesmo
sempre estará relacionado a um período determinado de tempo, pois terá uma
chave de tempo que irá indicar o dia no qual esses dados foram extraídos.

3.3 Data Marts

Um Data Mart pode ser considerado um “mini DataWarehouse”. Entretanto,


ao invés de englobar uma empresa, um data mart envolverá apenas um
determinado setor (Administração, Marketing, RH), possibilitando uma
especialização maior por ocasião da extração do conhecimento.

Existem duas abordagens para os relacionamentos Data Mart/Data


Warehouse: a topdown e a bottom up.

Abordagem Bottom Up

Prof. Victor Dalton


www.estrategiaconcursos.com.br 11 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
Na abordagem bottom up, a organização prefere iniciar seu repositório de
dados pela criação dos Data Marts, para posteriormente criar o Data Warehouse.
Os Data Marts são menos complexos e custos, e a integração acontece
posteriormente.

Abordagem Top Down

Na abordagem top down, a organização cria inicialmente o Data


Warehouse, para depois criar seus Data Marts, mais especializados. Solução
típica de organizações mais maduras, e que podem arcar com os elevados
custos inicais da implantação de um DW.

COMPARAÇÃO – DATA MINING x DATA WAREHOUSE

Data Mining Data Warehouse

Técnica de BI que extrai padrões Repositório histórico de dados,


úteis em bancos de dados montado de forma a facilitar a
extração de conhecimento

Pode ser aplicado em bancos de Diversas ferramentas podem ser


dados comuns, sistemas legados, e utilizadas sobre um Data
também em Data Warehouse Warehouse, como ferramenas
(onde, provavelmente, melhores OLAP, geradores de relatórios e
resultados serão obtidos) Data Mining

Ambas estão inseridas no contexto de Business Intelligence, com


o objetivo de extrair conhecimento útil para a tomada de decisões
empresariais!

Prof. Victor Dalton


www.estrategiaconcursos.com.br 12 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
3.4 Extração, Transformação e Carga

Se você prestou atenção nas imagens sobre sistemas de apoio à decisão,


deve ter percebido que a alimentação de um DataWarehouse envolve, antes, o
trabalho de ETL (extração, transformação e carga dos dados).

ETL, na prática, são ferramentas de software cuja função é a extração de


dados de diversos sistemas, transformação desses dados conforme
regras de negócios e, por fim, a carga dos dados em um Data Mart ou um
Data Warehouse. A extração e carga são obrigatórias para o processo, sendo a
transformação/limpeza opcional. É considerada uma das fases mais críticas do
Data Warehouse e/ou Data Mart.
Os projetos de data warehouse consolidam dados de diferentes fontes. A
maioria dessas fontes tendem a ser bancos de dados relacionais ou arquivo de
texto (texto plano), mas podem existir outras fontes. Um sistema ETL tem que
ser capaz de se comunicar com as bases de dados e ler diversos formatos de
arquivos utilizados por toda a organização. Essa pode ser uma tarefa não trivial,
e muitas fontes de dados podem não ser acessadas com facilidade.

Prof. Victor Dalton


www.estrategiaconcursos.com.br 13 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05

Extração

A primeira parte do processo de ETL é a extração de dados dos sistemas de


origem. Esses sistemas de origem podem ser: sistemas legados, bancos de
daods em diferentes formatos (Oracle, DB2, Sql Server), outros sistemas
corporativos, informações públicas disponíveis em sites web, dentre
outros.
Cada sistema pode também utilizar um formato ou organização de dados
diferente. Formatos de dados comuns são bases de dados relacionais e flat files
(também conhecidos como arquivos planos), mas podem incluir estruturas de
bases de dados não relacionais, como o IMS ou outras estruturas de dados,
como VSAM ou ISAM. A extração converte para um determinado formato para a
entrada no processamento da transformação.

Transformação

O estágio de transformação aplica uma série de regras ou funções aos


dados extraídos para derivar os dados a serem carregados. Algumas fontes de
dados necessitarão de muito pouca manipulação de dados. Em outros casos,
podem ser necessários um ou mais de um dos seguintes tipos de transformação:

 Seleção de apenas determinadas colunas para carregar (ou a seleção


de nenhuma coluna para não carregar);
 Tradução de valores codificados (se o sistema de origem armazena 1
para sexo masculino e 2 para feminino, mas o data warehouse
armazena M para masculino e F para feminino, por exemplo), o que
é conhecido como limpeza de dados;
 Codificação de valores de forma livre (mapeando “Masculino”,“1” e
“Sr.” para M, por exemplo);

Prof. Victor Dalton


www.estrategiaconcursos.com.br 14 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
 Derivação de um novo valor calculado (montante_vendas = qtde *
preço_unitário, por exemplo);
 Junção de dados provenientes de diversas fontes;
 Resumo de várias linhas de dados (total de vendas para cada loja e
para cada região, por exemplo);
 Geração de valores de chaves substitutas (surrogate keys);
 Transposição ou rotação (transformando múltiplas colunas em
múltiplas linhas ou vice-versa);
 Limpeza dos dados, ajustando valores não permitidos, erros de
ortografia, dentre outros;
 Quebra de uma coluna em diversas colunas (como por exemplo,
colocando uma lista separada por vírgulas e especificada como uma
cadeia em uma coluna com valores individuais em diferentes
colunas).

Carga

A fase de carga carrega os dados no Data Warehouse. Dependendo das


necessidades da organização, este processo varia amplamente. Alguns data
warehouses podem substituir as informações existentes semanalmente, com
dados cumulativos e atualizados, ao passo que outro DW (ou até mesmo outras
partes do mesmo DW, conhecidos como Data Marts) podem adicionar dados a
cada hora. A temporização e o alcance de reposição ou acréscimo constituem
opções de projeto estratégicas que dependem do tempo disponível e das
necessidades de negócios. Sistemas mais complexos podem manter um histórico
e uma pista de auditoria de todas as mudanças sofridas pelos dados.

Prof. Victor Dalton


www.estrategiaconcursos.com.br 15 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
4. FERRAMENTAS OLAP

4.1 Definição

OLAP é um software cuja tecnologia de construção permite aos analistas


de negócios, gerentes e executivos analisar e visualizar dados corporativos de
forma rápida, consistente e principalmente interativa.

A funcionalidade OLAP é inicialmente caracterizada pela análise dinâmica


e multidimensional dos dados consolidados de uma organização permitindo
que as atividades do usuário final sejam tanto analíticas quanto navegacionais.
Esta tecnologia geralmente é implementada em ambiente multiusuário e
cliente/servidor, oferecendo assim respostas rápidas às consultas adhoc
(construção de listagens, interligando a informação disponível na base de dados
conforme as necessidades especificas da empresa, assim como a sua
exportação, possibilitando várias simulações), não importando o tamanho do
banco de dados nem sua complexidade. Essa tecnologia auxilia o usuário a
sintetizar informações corporativas por meio de visões comparativas e
personalizadas, análises históricas, projeções e elaborações de cenários.

Qual a margem de lucro para bicicletas em fevereiro? Esse é o tipo de pergunta que o OLAP vai responder, em
uma busca multidimensional no banco de dados (tempo, produto, margem de lucro)

Prof. Victor Dalton


www.estrategiaconcursos.com.br 16 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
4.2 Operações em OLAP

Drill Across: O Drill Across ocorre quando o usuário pula um nível


intermediário dentro de uma mesma dimensão. Por exemplo: a dimensão tempo
é composta por ano, semestre, trimestre, mês e dia. O usuário estará
executando um Drill Across quando ele passar de ano direto para trimestre ou
mês, sem passar por semestre.

Drill Down: O Drill Down ocorre quando o usuário aumenta o nível de


detalhe da informação, diminuindo o grau de granularidade, como passar de
semestre para trimestre.

Drill Up (ou Roll Up): O Drill Up é o contrário do Drill Down. Ele ocorre
quando o usuário aumenta o grau de granularidade, diminuindo o nível de
detalhamento da informação, como passar de mês para trimestre.

Drill Throught: O Drill Throught ocorre quando o usuário passa de uma


informação contida em uma dimensão para uma outra. Por exemplo: Estou na
dimensão de tempo e no próximo passo começo a analisar a informação por
região.

Slice And Dice: O Slice and Dice é uma das principais características de
uma ferramenta OLAP. Como a ferramenta OLAP recupera o microcubo, surgiu a
necessidade de criar um módulo que se convencionou de Slice and Dice para
ficar responsável por trabalhar esta informação. Ele serve para modificar a
posição de uma informação, alterar linhas por colunas de maneira a facilitar a
compreensão dos usuários e girar o cubo sempre que tiver necessidade.

Cross-join: O Cross-join é um recurso no qual dados são unidos e colunas


e linhas são invertidas, permitindo uma melhor visualização sob a ótica do
negócio. Por exemplo:

Pivot: O Pivot é somente a rotação do cubo, sem a junção dos dados. No


exemplo das bicicletas imagine que pode-se girar o cubo para visualizar as

Prof. Victor Dalton


www.estrategiaconcursos.com.br 17 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
vendas por trimeste, ou por quantidades. É semelhante ao Drill Throught, mas
ocorre a rotação do cubo.

Alertas: Os Alertas são utilizados para indicar situações de destaque em


elementos dos relatórios, baseados em condições envolvendo objetos e
variáveis. Servem para indicar valores mediante condições mas não para isolar
dados pelas mesmas.

Ranking: A opção de ranking permite agrupar resultados por ordem de


maiores / menores, baseado em objetos numéricos (Measures). Esta opção
impacta somente uma tabela direcionada (relatório) não afetando a pesquisa
(Query).

Filtros: Os dados selecionados por uma Query podem ser submetidos a


condições para a leitura na fonte de dados. Os dados já recuperados pelo
Usuário podem ser novamente “filtrados” para facilitar análises diretamente no
documento.

Sorts: Os sorts servem para ordenar uma informação. Esta ordenação


pode ser customizada, crescente ou decrescente.

Breaks: Os Breaks servem para separar o relatório em grupos de


informações (blocos). Por exemplo: O usuário tem a necessidade de visualizar a
informação por cidades, então ele deve solicitar um Break. Após esta ação ter
sido executada, automaticamente o relatório será agrupado por cidades,
somando os valores mensuráveis por cidades.

Consultas Ad-Hoc: São consultas com acesso casual único e tratamento


dos dados segundo parâmetros nunca antes utilizados, geralmente executado de
forma iterativa e heurística.

4.3 Arquiteturas OLAP

A análise multidimensional é uma das grandes utilidades da tecnologia


OLAP, consistindo em ver determinados cubos de informações de diferentes
ângulos e de vários níveis de agregação. Os “cubos” são massas de dados que
retornam das consultas feitas ao banco de dados e podem ser manipulados e
visualizados por inúmeros ângulos e diferentes níveis de agregação.

Conforme o método de armazenamento de dados utilizado para uma


aplicação OLAP, será elaborada a arquitetura da aplicação. Os métodos de
armazenamento de dados, são MOLAP, ROLAP, DOLAP e HOLAP. Cada um deles

Prof. Victor Dalton


www.estrategiaconcursos.com.br 18 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
tem uma função específica e deve ser utilizada quando melhor atender às
necessidades de análise pela ferramenta de OLAP.

No MOLAP (Multidimensional On-Line Analytical Processing) os


dados são armazenados de forma multidimensional (como se fosse um cubo de
dados). Sua implementação varia de acordo com a sua ferramenta de OLAP,
mas é frequentemente implementado em um banco de dados relacional, porém
não na terceira forma normal. Além disto o acesso aos dados ocorre diretamente
no banco de dados do servidor multidimensional. Os gerenciadores de banco de
dados têm um limite prático quanto ao tamanho físico de dados que eles podem
manipular. As restrições de armazenamento e desempenho limitarão o tamanho
do banco de dados, não esquecendo o limite das dimensões que também
restringem sua manipulação. A complexidade que existe no processo de carga
de um banco de dados multidimensional, pode acarretar a demora no processo.
O processo de carga é complexo devido a série de cálculos que devem ser
realizados para agregar os dados às dimensões e preencher as estruturas do
banco. Depois do processo concluído, ainda é realizado uma série de
mecanismos para melhorar a capacidade de pesquisa.

Já no ROLAP (Relational On-Line Analytical Processing) os dados são


armazenados no modelo relacional como também suas consultas são
processadas pelo gerenciador do banco relacional.

Por outro lado, o DOLAP (Desktop On-Line Analytical Processing) é


uma variação que existe para fornecer portabilidade dos dados. A vantagem que
oferece esta arquitetura é a redução do tráfico na rede.

A arquitetura mais recente é a HOLAP (Hybrid On-Line Analytical


Processing), na qual ocorre uma combinação entre ROLAP e MOLAP. A
vantagem é que com a mistura de tecnologias pode-se extrair o que há de
melhor de cada uma, a alta performance do MOLAP e a escalabilidade do ROLAP.

4.4 Duas formas de modelagem multidimensional: esquemas


Estrela e Floco de Neve

O Modelo Estrela (Star Schema)

No modelo estrela todas as tabelas relacionam-se diretamente com a tabela


de fatos. Sendo assim, as tabelas dimensionais devem conter todas as
descrições que são necessárias para definir uma classe como Produto, Tempo ou
Loja nela mesma (veja exemplo na figura abaixo). Em suma, as tabelas de
dimensões são desnormalizadas no modelo estrela. Por consequência,
deteminados campos como Categoria, Departamento, Marca conterão suas
descrições repetidas em cada registro, assim, aumentando o tamanho das
Prof. Victor Dalton
www.estrategiaconcursos.com.br 19 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
tabelas de dimensão por repetirem estas descrições de forma textual em todos
os registros.

Este modelo é chamado de estrela porque a tabela de fatos fica ao centro


cercada das tabelas dimensionais assemelhado a uma estrela. Mas o ponto forte
a fixar é que as dimensões não são normalizadas.

O Modelo Floco de Neve (Snow Flake)

No modelo Floco as tabelas dimensionais relacionam-se com a tabela de


fatos, mas algumas dimensões relacionam-se apenas entre elas. Isto ocorre
para fins de normalização das tabelas dimensionais, visando diminuir o espaço
ocupado por estas tabelas. Informações como Categoria, Departamento e Marca
tornar-se-ão, no exemplo, tabelas de dimensões auxiliares.

No modelo Floco existem tabelas de dimensões auxiliares que normalizam


as tabelas de dimensões principais. Na figura anterior, Ano, Mês e Dia são
tabelas que normalizam a Dimensão Tempo, ao passo que Categoria,
Departamento e Marca normalizam a Dimensão Produto e a tabela Meio
normaliza a Dimensão Promoção.
Construindo a base de dados desta forma, passamos a utilizar mais tabelas
para representar as mesmas dimensões, mas ocupando um espaço em disco

Prof. Victor Dalton


www.estrategiaconcursos.com.br 20 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
menor do que o modelo estrela. Este modelo chama-se floco de neve, pois cada
dimensão se divide em vaias outras tabelas, onde organizadas de certa forma
lembra um floco de neve.

Considerações

O Modelo Floco (Snow Flake) reduz o espaço de armazenamento dos dados


dimensionais mas acrescenta várias tabelas ao modelo, deixando-o mais
complexo, tornando mais difícil a navegação pelos softwares que utilizarão o
banco de dados. Um outro fator é que mais tabelas serão utilizadas para
executar uma consulta, então mais JOINS de instrução SQL serão feitos,
tornando o acesso aos dados mais lento do que no modelo estrela.

O Modelo Estrela (Star Schema) é mais simples e mais fácil de navegação


pelos softwares, porém desperdiça espaço repetindo as mesmas descrições ao
longo de toda a tabela. Porém, análises mostram que o ganho de espaço
normalizando este esquema resulta em um ganho inferior a 1% do espaço total
no banco de dados. Isto posto, cabe analisar outros fatores mais importantes
para serem avaliados para redução do espaço em disco, como a adição de
agregados e alteração na granularidade dos dados, por exemplo.

Enfim, finalizamos a parte de BI. Não deixe de ver os exercícios!

Prof. Victor Dalton


www.estrategiaconcursos.com.br 21 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
EXERCÍCIOS COMENTADOS

1ª Questão) (ESAF – Analista de Planejamento e Orçamento –


Tecnologia da Informação – 2010) BI – Business Inteligence

a) é uma técnica de otimização da árvore de decisão.


b) é um método de formação avançada de gestores.
c) compreende ferramentas de análise de dados para otimizar os processos
produtivos de uma empresa.
d) são técnicas, métodos e ferramentas para mineração de dados na área
de negócios de uma empresa.
e) são técnicas, métodos e ferramentas de análise de dados para subsidiar
processos de decisão de uma empresa.

Business Intelligence (BI) pode ser traduzido como inteligência de


negócios, ou inteligência empresarial. Na prática, configura-se como um
conjunto de técnicas, métodos e ferramentas que subsidiam o processo
de decisão de uma empresa.

Resposta, letra e). As demais alternativas servem para confundi-lo.

2ª Questão) (ESAF – Comissão de Valores Mobiliários – Analista de


Sistemas – 2010) O sistema de apoio a decisão

a) visa obter informações de todos os níveis a partir de informações


detalhadas armazenadas nos sistemas de processamento de ações.
b) analisa dados on-line coletados por sistemas de processamento de
transição, para ajudar as pessoas a executar ações operacionais.
c) visa obter informações de alto nível a partir de informações gerenciais
armazenadas nos sistemas de processamento de documentos.
d) analisa dados coletados por sistemas de processamento de inovação,
para ajudar as pessoas a viabilizarem ações de transcrições.
e) analisa dados on-line coletados por sistemas de processamento de
transação, para ajudar as pessoas a tomarem decisões de negócios.

É particularmente fácil acertar esta questão porque somente uma


alternativa fala o óbvio sobre a atividade fim destes sistemas, que é dar suporte
à decisão. Mas formalizemos um pouco mais.
Os sistemas de apoio à decisão servem para dar apoio aos tomadores de
decisão, líderes de uma organização com dados de mais alto nível para decisões
complexas e importantes (logo, decisões de negócio). Estas ferramentas podem
trabalhar com descoberta de conhecimento e processamento online de

Prof. Victor Dalton


www.estrategiaconcursos.com.br 22 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
transações, para permitir que tomador de decisão tenha a sua própria
percepção.

Alternativa e).

3ª Questão) (CESPE – Banco Central – Analista – Análise e


Desenvolvimento de Sistemas – 2013) Inteligência de negócios (business
intelligence) refere-se aos processos de obtenção de informações válidas a partir
de dados oriundos de fontes diversas (ERPs, CRMs, sistemas legados etc.), que
serão utilizados para apoiar decisões de negócios.

Correto. Sistemas Integrados de Gestão Empresarial (ERPs), Sistemas de


Gestão de Relacionamento com o Consumidor (CRMs), sistemas legados, bancos
de dados, a Internet, Data Warehouses, dentre outros, podem ser fontes para a
obtenção de dados para fundamentar decisões de negócios.

4ª Questão) (UEPA – SEFA/PA – Auditor Fiscal de Receitas Estaduais


– 2013) Leia o texto para responder à questão abaixo.

A solução de TI que está relacionado ao texto é:

a) a construção de um portal corporativo

b) a utilização de uma ferramenta de Business Inteligence

Prof. Victor Dalton


www.estrategiaconcursos.com.br 23 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
c) a construção de um portal colaborativo

d) a implantação de Governança em TI

e) a aquisição de novos ativos de rede

Pela descrição do texto, é notável que a solução é a utilização de uma


ferramenta de Business Intelligence. Mais especificamente, a questão parece
citar Ferramentas OLAP, pois, de maneira online, vai processar informações de
notas fiscais dos estados de origem, cruzando com dados de outras bases, como
a RFB. Além disso, parece também ter um pouco de Data Mining, pois vai
analisar os dados com dados anteriores, para analisar riscos potenciais. Na
prática, não é “uma ferramenta de BI”, pois envolve mais de uma ferramenta.

Mesmo assim, alternativa b).

5ª Questão) (FCC – TST – Analista Judiciário – Análise de Sistemas -


2012) Leia as afirmações a seguir:

I. Um Data Warehouse é um repositório de dados atuais e históricos de


uma organização que possibilita a análise de grande volume de dados para
suportar a tomada de decisões estratégicas, possuindo registros permanentes.

II. O processo de Data Mining, ou mineração de dados, tem por objetivo


localizar possíveis informações em um banco de dados através de comparações
com dados informados pelo usuário e registros de tabelas.

III. Um ERP, ou Sistema Integrado de Gestão Empresarial, é conhecido por


integrar os dados de diferentes departamentos de uma organização,
aumentando o uso de interfaces manuais nos processos.

IV. As ferramentas OLAP (On-line Analytical Processing) são capazes de


analisar grandes volumes de dados, fornecendo diferentes perspectivas de visão
e auxiliando usuários na sintetização de informações.

Está correto o que se afirma APENAS em

a) I e II.
b) II e III.
c) I, III e IV.
d) I, II e III.
e) I e IV.

Prof. Victor Dalton


www.estrategiaconcursos.com.br 24 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
Analisando as alternativas:

I. Correta. O Data Warehouse é um repositório de dados orientado à


tomada de decisões.

II. Errada. O Data Mining tem por objetivo encontrar padrões úteis em
bases de dados, não se relacionando com comparações de dados informados
pelo usuário.

III. Errada. Um ERP procura eliminar as interfaces manuais nos processos,


não aumentá-las.

IV. Correta.

Portanto, a resposta a ser marcada é a alternativa e).

6ª Questão) (FCC – TRT/9ª Região – Técnico Judiciário – Tecnologia


da Informação - 2013) Com o crescente aumento do volume de dados, surge
a necessidade de ferramentas e mecanismos que permitam que eles possam ser
analisados de forma otimizada, uma vez que armazenam toda a trajetória da
empresa. Uma solução é a utilização de ...I... que, em síntese, é utilizado para
armazenar conjuntos de dados organizados por assuntos, mantendo todo um
histórico corporativo. Outro recurso muito utilizado e dos mais importantes
quando o objetivo é a busca de conhecimento, é o ...II... , que é um processo
que consiste na identificação de informações relevantes que estão presentes em
grandes bancos de dados ou repositórios, geralmente realizado em três etapas:
a exploração, a definição dos padrões e a validação dos dados. Estas
ferramentas e técnicas fazem parte do ...III... , definido como um conjunto de
métodos e conceitos que podem ser implementados através de softwares com o
intuito de utilizar os dados importantes da organização para auxiliar no processo
de tomada de decisões, proporcionando melhorias para a alta administração.
Outra tecnologia que pode prover uma melhor e mais flexível análise das
informações, é o ...IV... que permite uma visão conceitual de forma
multidimensional das informações da organização, de maneira que as
informações possam ser visualizadas e analisadas de diferentes perspectivas
pelo usuário.

(http://www.devmedia.com.br/mineracao-de-dados-data-warehouse-data-
mining-bi-e-olap-atraves-do-fastcube-revista-clubedelphi-146/26537)

As lacunas que completam corretamente o texto estão expressas em

Prof. Victor Dalton


www.estrategiaconcursos.com.br 25 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05

E então, achou tranquila a questão? Espero que sua associação mental


tenha sido veloz!

I – armazenar conjuntos de dados orientados por assunto, mantendo


um histórico corporativo – Data Warehouse;

II – identificação de informações relevantes em bancos de dados –


Data Mining;

III – conjunto de métodos e conceitos para a tomada de decisões –


Business Intelligence;

IV – visão multidimensional das informações da organização – OLAP.

Alternativa d).

7ª Questão) (FCC – SEFAZ/RJ – Auditor Fiscal da Receita Estadual –


3ª Categoria - 2014) Sistemas de BI − Business Intelligence reúnem um
conjunto de tecnologias orientadas a disponibilizar informação e conhecimento
em uma organização, dentre as quais está o DW. Um ambiente que utiliza DW
reúne processos e ferramentas, está sempre em evolução e pode ser visualizado
como na figura abaixo.

Prof. Victor Dalton


www.estrategiaconcursos.com.br 26 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
Os componentes I, II, III e IV estão corretamente identificados em:

Mais um diagrama ilustrativo de processos de Business Intelligence. Como


não existe uma única solução para tal, esta questão obriga que você utilize as
informações já existentes no diagrama, e trabalhe por eliminação para encontrar
a alternativa correta.

Inicialmente, aquelas alternativas que possuem sistemas de análise antes


da ponta final do processo estão equivocadas. Alternativa a) e b), com Sistemas
OLAP no início do processo, podem ser sumariamente eliminadas.

A alternativa c) inicia por um Data Warehouse e , após o processo de ETL,


monta sua base inteligente em um Banco de Dados Transacional. Também
incorreta.

A alternativa e), por fim, poderia até colocar uma dúvida na sua cabeça,
mas ela possui, na “ponta da linha”, um banco de dados multidimensional. Mas
um banco de dados multidimensional por si só não oferece análise e utilização
estratégica da informações. Quem possibilita isso é um Sistema OLAP.

Portanto, a alternativa correta é a letra d). Os Sistemas OLTP são fontes


de dados, que são tratados e compilados em um Data Warehouse, que pode
ser replicado e especializado em Data Marts, cujos dados podem ser utilizados
por Sistemas OLAP para acesso, análise e tomada de decisões.

8ª Questão) (FCC – INFRAERO – Analista Superior III – Analista de


Sistemas/Administrador de Banco de Dados – 2011) No âmbito da
descoberta do conhecimento (KDD), a visão geral das etapas que constituem o
processo KDD (Fayyad) e que são executadas de forma interativa e iterativa
apresenta a seguinte sequência de etapas:

a) seleção, pré-processamento, transformação, data mining e


interpretação/avaliação.
Prof. Victor Dalton
www.estrategiaconcursos.com.br 27 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
b) seleção, transformação, pré-processamento, interpretação/avaliação e
data mining.
c) data warehousing, star modeling, ETL, OLAP e data mining.
d) ETL, data warehousing, pré-processamento, transformação e star
modeling.
e) OLAP, ETL, star modeling, data mining e interpretação/avaliação.

Relembrando:

Alternativa a).

9ª Questão) (ESAF – Analista de Planejamento e Orçamento –


Tecnologia da Informação – 2010) Mineração de Dados

a) é uma forma de busca sequencial de dados em arquivos.


b) é o processo de programação de todos os relacionamentos e algoritmos
existentes nas bases de dados.
c) por ser feita com métodos compiladores, método das redes neurais e
método dos algoritmos gerativos.
d) engloba as tarefas de mapeamento, inicialização e clusterização.
e) engloba as tarefas de classificação, regressão e clusterização.

Data Mining, como o nome indica, se refere à mineração ou a descoberta


de informações em função de padrões ou regras em grande quantidade de
dados.

Prof. Victor Dalton


www.estrategiaconcursos.com.br 28 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05

Esta mineração pode utilizar várias técnicas para a descoberta de


conhecimento. Vejamos algumas, de forma bem resumida:

 Associação: Explicando de forma bem simples, é enxergar alguma


forma de relação entre variáveis (do tipo X influencia Y);
 Descrição de classes: provê um resumo conciso e sucinto de uma
coleção de dados e a distingue de outras. O resumo de uma coleção
de dados é chamado de caracterização de classe; enquanto a
comparação entre duas ou mais coleções de dados é chamada
comparação ou discriminação de classe. A descrição de classe não só
deveria cobrir suas propriedades de resumo tal como a contagem,
somas, e cálculos de médias, mas também suas propriedades sobre
a dispersão dos dados, tais como a variância, desvio padrão, quartis,
dentre outros;
 Classificação: É o processo de encontrar um modelo que descreve
classes diferentes de dados (por exemplo, “ensinar” ao sistema quais
clientes bancários são de risco alto, médio e baixo, por meio de
alguns registros, e, a partir deste ponto, a mineração por si só será
capaz de classificar o restante da base de dados).
 Agrupamento(clustering): Similar à classificação, porém sem
supervisão (o sistema por si só sendo capaz de criar grupos).
 Descoberta de padrões sequenciais: Exemplo, o sistema
descobrir que se o cliente compra pão, é provável que compre pão e
leite;
 Descoberta de padrões em séries temporais: Exemplo, o
sistema descobrir que as vendas de guarda-chuva caem na época da
seca;
 Regressão: a análise de diversas variáveis para prever uma
próxima (exemplo, ver os exames de um paciente e calcular a
probabilidade de sobrevivência a uma cirurgia, com base no histórico
de pacientes operados);
 Redes neurais: é uma extensão da regressão (regressão
generalizada), utilizando princípios da inteligência artificial;
 Algoritmos genéticos: são técnicas de busca utilizadas na ciência
da computação para achar soluções aproximadas em problemas de
otimização e busca, sendo uma classe particular de algoritmos
evolutivos que usam técnicas inspiradas pela biologia evolutiva como
hereditariedade, mutação, seleção natural e recombinação.

Já dá pra marcar a resposta correta, não? Alternativa e).

10ª Questão) (FCC –TRF4 – Analista Judiciário – Apoio Especializado


- Especialidade Informática- 2010) Sobre data mining, é correto afirmar:
Prof. Victor Dalton
www.estrategiaconcursos.com.br 29 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
a) Não requer interação com analistas humanos, pois os algoritmos
utilizados conseguem determinar de forma completa e eficiente o valor dos
padrões encontrados.

b) Na mineração de dados, encontrar padrões requer que os dados brutos


sejam sistematicamente "simplificados", de forma a desconsiderar aquilo que é
genérico e privilegiar aquilo que é específico.

c) É um grande banco de dados voltado para dar suporte necessário nas


decisões de usuários finais, geralmente gerentes e analistas de negócios.
d) O processo de descobrimento realizado pelo data mining só pode ser
utilizado a partir de um data warehouse, onde os dados já estão sem erros, sem
duplicidade, são consistentes e habilitam descobertas abrangentes e precisas.

e) É o processo de descoberta de novas correlações, padrões e tendências


entre as informações de uma empresa, por meio da análise de grandes
quantidades de dados armazenados em bancos de dados usando técnicas de
reconhecimento de padrões, estatísticas e matemáticas.

Analisando as alternativas:

a) Errada, pois, mesmo que seja somente para analisar e validar o


resultado do Data Mining, é necessária a participação humana no
processo!
b) Errada. A mineração de dados valoriza a informação a mais específica
possível. A simplificação dos dados brutos pode descartar informação
valiosa para a criação de conhecimento.
c) Definição de Data Warehouse! Errada.
d) Errada! E IMPORTANTE! O Data Mining não precisa ser utilizado
somente em DataWarehouse, também pode-se aplicar DM em bancos de
dados comuns, arquivos legados, na web, etc;
e) Correta, e definição bastante completa.

11ª Questão) (FCC – INFRAERO – Analista Superior III –


Administrador de Banco de Dados – 2012) Funcionalidade cujo objetivo é
encontrar conjuntos de dados que não obedecem ao comportamento ou modelo
dos dados. Uma vez encontrados, podem ser tratados ou descartados para
utilização em mining. Trata-se de

a) descrição.
b) agrupamento.
c) visualização.
d) análise de outliers.

Prof. Victor Dalton


www.estrategiaconcursos.com.br 30 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
e) análise de associações.

Se você já estudou estatística provavelmente já ouviu falar dos outliers.


São dados isolados, cujos valores apresentam um grande afastamento dos
demais de uma série.
A análise de outliers, por consequência, faz o que o enunciado apresenta,
ou seja, trata ou descarta dos dados, de acordo com o objetivo da análise.
Ocorre durante a etapa de pré-processamento dos dados.

Resposta certa, alternativa d).

12ª Questão) (FCC – TCE/SP – Agente da Fiscalização Financeira -


2008) NÃO é uma técnica no processo de garimpagem de dados utilizada em
Data Mining:

a) Associação.
b) Classificação.
c) Avaliação.
d) Agregação.
e) Padrões sequenciais

Avaliação não existe em Mining. Agregação é sinônimo de agrupamento


(clustering), e os demais já conhecemos.

Alternativa c).

13ª Questão) (CESPE – SERPRO – Analista – Negócios em Tecnologia


da Informação – 2013) Clusterização é a tarefa preditiva relativa à
identificação de um conjunto finito de categorias empregadas para descrever
uma informação. Essas categorias nunca poderão ser mutuamente exclusivas.

Errado! A clusterização, embora descrita de maneira excessivamente


técnica, está correta. Entretanto, nada impede que as categorias levantadas
sejam mutuamente exclusivas. Pelo contrário. Quando isso ocorre, os grupos
são melhores definidos, concorda?

14ª Questão) (FCC – Prefeitura de São Paulo – Auditor Fiscal


Tributário Municipal I – Tecnologia da Informação - 2012) Em aplicações
de data mining uma operação comum é o aprendizado ou mineração de regras

Prof. Victor Dalton


www.estrategiaconcursos.com.br 31 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
de associação entre itens. Uma papelaria aplica o algoritmo Apriori para minerar
regras de associação entre as seguintes compras:

Supondo um suporte mínimo de 50%, os conjuntos de itens frequentes de


dois elementos são:
a) {caneta, borracha}, {caneta, régua} e {lápis, borracha}
b) {lápis, caneta}
c) {lápis, borracha}
d) {caneta, régua} e {compasso, transferidor}
e) {lápis, régua} e {caneta, borracha}

O algoritmo Apriori, que é um algoritmo de associação, procura, em um


universo, encontrar um itemset (conjunto de itens) que aparece com uma certa
frequência. Como o suporte escolhido pela questão é de 50%, deve-se procurar
os conjuntos de produtos que aparecam ao menos na metade do universo de
compras para que ele seja um itemset válido.

Desta forma, apenas os itens {lápis, régua} e {caneta, borracha} atendem


ao suporte mínimo, pois aparecem em 50% das compras realizadas.
Alternativa e).

15ª Questão) (ESAF – Técnico da Receita Federal do Brasil –


Tecnologia da Informação – 2006 - adaptada) Analise as seguintes
afirmações relacionadas a Datawarehouse.

I. Um Datawarehouse deve ser volátil, ou seja, os dados sofrem as


alterações necessárias, como: incluir, alterar ou excluir dados.
II. Um Datawarehouse deve ser integrado, ou seja, trabalha de forma a
globalizar e aproveitar os termos e as estruturas técnicas que são utilizados nos
sistemas de informações tradicionais. Por exemplo, na representação de sexo,
um Datawarehouse utiliza todas as formas seguintes: “m” ou “f”, “0” ou “1”, “x”
ou “y”, “macho” ou “fêmea”, “homem” ou “mulher”, “dama” ou “cavalheiro”.
III. Um Datawarehouse deve ser orientado aos principais assuntos ou
negócios da empresa como, por exemplo, clientes, vendas e produtos. Já os
sistemas de informações tradicionais são orientados a processos como, por
exemplo, estoques, entradas e saídas de materiais.

Prof. Victor Dalton


www.estrategiaconcursos.com.br 32 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
IV. Um Datawarehouse deve ser invariável no tempo, ou seja, sua
estrutura dos dados dispensa elementos temporais, sendo importante apenas a
retenção da chave primária.

Indique a opção que contenha todas as afirmações verdadeiras.

a) I e II
b) II e III
c) I e III
d) III e IV
e) II e IV

O Datawarehouse possui 4 características marcantes, que repetidamente


são questões de concursos. Então nos cabe discutir estas características:

 Não-volátil: o Datawarehouse apenas recebe informações.


Exclusões ou alterações ocorrem apenas para a correção de dados
inseridos com erro.
 Integrado: de acordo com o item II da questão;
 Orientado por assuntos: conforme o item III da questão;
 Variante no tempo: A variação em relação ao tempo consiste na
manutenção de um histórico de dados em relação ao período de
tempo maior que dos sistemas comuns, isto significa que as técnicas
de mineração de dados não são aplicadas em tempo real, de forma a
não comprometer o desempenho dos bancos transacionais OLTP. Ao
analisarmos um dado de um DW, o mesmo sempre estará
relacionado a um período determinado de tempo, pois terá uma
chave de tempo que irá indicar o dia no qual esses dados foram
extraídos.

Estas são as 4 características do Datawarehouse. Lembre-se delas! Nossa


resposta certa, portanto, é a alternativa b).

16ª Questão) (FCC – SEFAZ/RJ – Auditor Fiscal da Receita Estadual –


3ª Categoria - 2014) Com o advento da tecnologia de Data Warehousing, os
ambientes de apoio à decisão passaram a ser denominados ambientes de Data
Warehouse (DW).

Em relação à tecnologia DW, é correto afirmar:

a) Em um DW as convenções de nomes, valores de variáveis e outros


atributos físicos de dados como data types são bastante flexíveis. Para facilitar a
tomada de decisões, as informações são apresentadas de diferentes formas, da
mesma maneira que foram carregadas dos sistemas legados.

Prof. Victor Dalton


www.estrategiaconcursos.com.br 33 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
b) Um projetista de DW deve ter seu foco na modelagem dos dados e no
projeto de banco de dados. Um sistema transacional armazena as informações
agrupadas por assuntos de interesse da empresa que são mais importantes,
enquanto um DW é orientado a processos e deve ser desenvolvido para manter
disponíveis as transações realizadas diariamente.

c) Os dados de um DW são um conjunto dinâmico de registros de uma ou


mais tabelas, capturados em um momento de tempo predeterminado, por isso
têm que ser sempre atualizados.

d) Um sistema multidimensional, como o DW, deve atualizar o valor


corrente das informações e sua exatidão é válida por um tempo curto, por
exemplo, o valor total das notas fiscais processadas pela Receita às 12:00 de um
dia pode ser diferente às 18:00 do mesmo dia.

e) Um DW tem duas operações básicas: a carga dos dados (inicial e


incremental) e o acesso a estes dados em modo leitura. Depois de carregado,
um DW não necessita de operações de bloqueio por concorrência de usuários no
acesso aos seus dados.

Outra questão que trabalha em cima da quatro características fundamentais


do Data Warehouse. Analisemos as alternativas:

a) Um Data Warerouse deve ser integrado, ou seja, deverá ser capaz de


lidar com as informações nos seus mais deferentes formatos. Contudo,
as informações deverão ser apresentadas de maneira padronizada, e
não da mesma forma como apresentada nos sistemas legados. Errada;
b) Um sistema transacional é orientado a processos. Um DW é orientado
por assuntos. Errada;
c) Um DW é não-volátil. Seus dados não devem ser atualizados. Errada;
d) Mesma argumentação da assertiva anterior;
e) Correta, também de acordo com a não-volatilidade.

17ª Questão) (FGV – SEFAZ/RJ – Agente Fiscal de Rendas –2007)


DataWarehouse e DataMining são recursos utilizados por muitas organizações
para facilitar e agilizar o processamento, a análise e a consulta de dados. Sobre
esses recursos, é correto afirmar que:

a) um DataMining armazena dados extraídos de bancos de dados de


diferentes organizações.
b) um DataWarehouse armazena dados por períodos não superiores a três
meses, o que dificulta previsões e análises de tendência.

Prof. Victor Dalton


www.estrategiaconcursos.com.br 34 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
c) um DataWarehouse é repositório de dados históricos orientados a
assunto, organizados para serem acessíveis para atividades de processamento
analítico.
d) DataMining é uma técnica de análise de dados exclusiva para aplicação
em um DataWarehouse.
e) num DataWarehouse, os usuários finais necessitam conhecer linguagem
de programação para acessar dados.

Questão boa para analisar alternativa a alternativa, não é mesmo?

a) Errada; poderia ser até uma característica de DataWarehouse, caso as


diferentes organizações pertençam a um mesmo conglomerado. Quem
poderia montar um DW com dados de diferentes empresas?
b) Errado! Quanto mais longo o período de armazenamento, melhor para
um Data Warehouse, que tem caráter histórico;
c) Correta! Atividades de processamento analítico são realizadas pelas
ferramentas OLAP;
d) Errada! O Data Mining não precisa ser utilizado somente em
DataWarehouse, também pode-se aplicar DM em bancos de dados
comuns, arquivos legados, na web, etc;
e) Errada! Os usuários finais apenas obtêm informações do DW.

18ª Questão) (FCC – TCE/SP – Agente da Fiscalização Financeira -


2008) Os depósitos de dados voltados para o processo decisório gerencial e que
podem ser definidos como espécies de mesmo tipo e estrutura são

a) business intelligence e data mining.


b) data warehouse e data mart.
c) data warehouse e data mining.
d) data mining e data mart.
e) data mining, data warehouse e data mart.

Data Marts são pequenos Datawarehouses, setoriais. Alternativa b).

19ª Questão) (CESPE – Banco Central – Analista – Análise e


Desenvolvimento de Sistemas – 2013) Data warehouse (DW) e data mart
(DM) são componentes importantes em um ambiente de business intelligence,
visto que eles representam repositórios de múltiplos bancos de dados
operacionais da empresa. Um DM agrega informações de diversos DWs
distribuídos pelos departamentos da empresa.

Prof. Victor Dalton


www.estrategiaconcursos.com.br 35 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
Errado! Apenas porque, na sentença final, a banca troca DM e DW,
colocando uma pegadinha pro candidato.

20ª Questão) (FCC – SEFAZ/SP – Agente Fiscal de Rendas – 2009 –


Tecnologia da Informação) Se uma empresa de grande porte, com alto
volume de transações e informações, resolver iniciar um projeto usando o
conceito de Data Mart (DM) em vez de Data Warehouse (DW),
independentemente disso ser ou não a melhor opção, os fatores que a levam a
tal decisão podem ser justificados por:
I. Possibilidade de extrair e preparar os dados diretamente de fontes de
interesse específicas, fornecendo acesso mais rápido pela não necessidade de
sincronia com dados de outras fontes.
II. Menor risco quanto ao sucesso do projeto.
III. Necessidade imediata de informações organizacionais integradas.

Está correto o que consta em

a) I, apenas.
b) I e II, apenas.
c) I e III, apenas.
d) I, II e III.
e) II e III, apenas.

Ora, sendo setorizados, os Data Marts são fontes de dados específicas,


que não precisam de sincronia com fontes de outros setores da organização.
Naturalmente, sua adoção implica em menos custo e riscos por parte da
organização. Como contrapartida, as informações organizacionais não estarão
integradas.

Resposta certa, alternativa b).

(FCC – SEFAZ/SP – Agente Fiscal de Rendas – Tecnologia da


Informação - 2013) Considere o texto a seguir (baseado em uma notícia real):

O Grupo Montanhês implantou uma solução de BI para unificar as informações de


todos os segmentos em que atua e disponibilizá-las de acordo com a necessidade e
permissão de acesso de cada colaborador. Antes da implementação do sistema, os
relatórios departamentais eram elaborados manualmente, o que demandava muito
tempo. “Desde os dados contábeis até as informações de marketing e de RH eram
compiladas de forma mecânica pelas equipes”, lembra o gerente de planejamento do
grupo, que foi um dos líderes do projeto.
Ele explica que, observando os processos da empresa, percebeu que o método
utilizado era ultrapassado e, além de moroso, não permitia a integração de dados entre
as unidades de negócios. “Da forma como atuávamos não conseguíamos aproveitar as
informações que detínhamos para otimizar nossos processos, projetar cenários futuros e
desenvolver ofertas especiais para o perfil dos clientes”. Assim, o gerente desenvolveu

Prof. Victor Dalton


www.estrategiaconcursos.com.br 36 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
um projeto-piloto para mostrar como a solução poderia facilitar o dia-a-dia das áreas de
negócio. “Nesse primeiro momento, foram integrados apenas os dados financeiros e
contábeis de nossas unidades de negócio vindas de sistemas legados para os Data
Marts”, afirma ele.
Após demonstrações para os gerentes e diretores, a alta diretoria deu o aval para
implementar a iniciativa em todo o grupo “Trabalhamos com a previsão de obter um ROI
em 3 anos”, calcula o executivo. “Buscávamos uma ferramenta que gerasse análises
detalhadas a partir de um grande volume de informações, até porque tínhamos a
necessidade de sermos mais competitivos frente ao dinâmico mercado varejista”. O que,
segundo o executivo, exigia decisões rápidas e acertadas.
Uma das fases essenciais do projeto foi a criação de uma central de
armazenamento de dados, desenvolvida pela equipe interna de TI. Nesse repositório
estão todas as principais informações corporativas, que incluem dados financeiros,
contábeis, de vendas, RH e marketing. “Essa fase do projeto durou cerca de 6 meses e
foi uma das mais desafiadoras, visto que previu a padronização − em uma base única −
dos dados que antes eram gerenciados por diversos sistemas”, diz.
Antes da implementação da solução de BI, o acesso às informações acontecia por
meio da extração de arquivos diretamente dos sistemas. Em seguida, esses dados eram
processados em planilha Excel ou por meio do Access, que geravam os relatórios
departamentais não padronizados. Hoje esses processos foram substituídos por
relatórios e paineis (dashboards). “As informações passaram a ser consolidadas em um
Data Warehouse de 1TB, administrado pela área de TI”.
Uma vez implantado, o sistema integrado começou a ser acessado pelos diretores
e gerentes das áreas de negócios. “Por meio de ferramentas OLAP com interface web,
hoje os funcionários de alto escalão já podem acessar as informações de sua área, bem
como cruzá-las com outros dados", explica o gerente, ao informar que isso permite
mapear o perfil dos clientes, projetar cenários futuros e facilitar a criação de
apresentações setoriais. Além dos benefícios de agilidade na elaboração de relatórios e
da visão consolidada que a alta direção consegue ter da empresa, o gerente destaca que
a produtividade das equipes aumentou consideravelmente após a implementação da
solução de BI. “Em breve todos os funcionários − cada um com seu nível de permissão –
terão acesso à interface de dados de todo o grupo empresarial."

21ª Questão) Ao grupo Montanhês foi apresentada uma solução de BI que


trouxe diversas vantagens para o grupo empresarial. O resultado dessa solução
permitiu:

1 − Informação disponível para gestão


2 − Visão de curvas de comportamento
3 − Agilidade de ferramentas para apoio à gestão
4 − Segurança de informações para decisão
5 − Maior abrangência de visão de indicadores
6 − Recursos mais abrangentes para análise de negócios
7 − Necessidades e expectativas atendidas por ferramentas de TI

A solução apresentada foi


a) uma modelagem de banco de dados multidimensional.
b) um projeto de Data Warehouse.
c) um query & report de uma ferramenta OLAP.
d) uma operação ETL.
e) um projeto de banco de dados transacional.

Prof. Victor Dalton


www.estrategiaconcursos.com.br 37 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
Todas essas características são conseguidas com a implantação de um
DataWarehouse, já suportado por ferramentas OLAP. Deste modo, a
alternativa mais adequada a ser marcada é a alternativa b).

22ª Questão) Considerando o contexto da solução de BI do Grupo


Montanhês, no segundo parágrafo, a integração inicial apenas dos dados
financeiros e contábeis vindas de sistemas legados indica que

a) foi utilizada uma implementação bottom up, que permite que o


planejamento e desenho dos Data Marts possam ser realizados sem esperar pela
infraestrutura corporativa do DW, permitindo um ROI mais rápido.

b) foi utilizada uma implementação combinada que tem o propósito de


integrar a arquitetura top down com a bottom up, usando diversos modelos de
Data Marts, gerados de uma só vez.

c) foi utilizada uma implementação top down. Nesta implementação há um


grande trabalho inicial, envolvendo todas as pessoas da empresa que irão
participar do projeto, o que força a empresa a definir regras de negócio de forma
corporativa antes de se iniciar o projeto do DW.

d) não foi utilizada a implementação top down, porque o processo se iniciou


com a extração, transformação e integração das informações dos sistemas
internos, dados externos e das fontes operacionais para um ODS.

e) foi utilizada uma implementação bottom up, porque a partir do DW


foram extraídos os dados e metadados para os Data Marts departamentais do
grupo empresarial.

Nem é preciso voltar ao texto para responder, pois o conteúdo relevante


para a questão foi abordado no enunciado. Essa criação de um DataWarehouse
pela integração gradativa dos setores indica que a abordagem foi bottom up,
típica das empresas que criam suas soluções BI de maneira gradativa.

Abordagem Bottom Up

Prof. Victor Dalton


www.estrategiaconcursos.com.br 38 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
Resposta certa, alternativa a).

23ª Questão) (FGV – MPE/MS – Analista – Análise de Sistemas –


2013 - adaptada) Com relação ao tema “Arquitetura e aplicações de data
warehousing”, analise as afirmativas a seguir.

I. As quatro características principais dos datawarehouses são: orientação


por assunto, não volatilidade, integração com outras fontes de dados e variação
em relação ao tempo.

II. Datawarehouses auxiliam diretores e gestores no processamento de


transações do dia a dia da empresa e, por esse motivo, armazenam dados e
metadados altamente normalizados e de baixa granularidade.

Assinale:

a) se somente a afirmativa I estiver correta.

b) se somente a afirmativa II estiver correta.

c) se nenhuma estiver correta.

d) ambas estiverem corretas.

Quanto ao item I, já sabemos que está correto. O equívoco no item II está


em dizer que as informações em DataWarehouses é altamente normalizada e de
baixa granularidade. Na verdade, as informações em um DW são altamente
desnomalizadas, para facilitar a realização de consultas as mais variadas
possíveis, e de alta granularidade (granularidade é nível de detalhe: as
informações em um DW devem ser bastante detalhadas, possibilitando consultas
tanto pouco como muito detalhadas).

Resposta certa, alternativa a).

24ª Questão) (UEL – CELEPAR – Analista Júnior de Desenvolvimento


de Sistemas – 2009) Sobre DataWarehouse, é correto afirmar:

I. É uma coleção de dados orientada por assuntos, integrada, variante no


tempo, que tem por objetivo dar suporte aos processos de tomada de decisão.

II. É implementado por meio de um banco de dados contendo dados


extraídos do ambiente de produção da empresa, que foram selecionados e
depurados, tendo sido otimizados para processamento de consulta e não para
processamento de transações.

Prof. Victor Dalton


www.estrategiaconcursos.com.br 39 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
III. Seu objetivo é fornecer uma “imagem única da realidade do negócio”.
De uma forma geral, são sistemas que compreendem um conjunto de programas
que extraem dados do ambiente de dados operacionais da empresa, um banco
de dados que os mantém, e sistemas que fornecem estes dados aos seus
usuários.

IV. As ferramentas ROLAP surgiram juntamente com os Sistemas de Apoio


à Decisão para fazerem a consulta e a análise dos dados contidos nos Data
Warehouses e Data Marts.

Assinale a alternativa correta.

a) Somente as afirmativas I e III são corretas.


b) Somente as afirmativas I e IV são corretas.
c) Somente as afirmativas II e IV são corretas.
d) Somente as afirmativas I, II e III são corretas.
e) Somente as afirmativas II, III e IV são corretas.

A questão é muito saudável para explicar características do DW. A


pegadinha está em escrever ROLAP ao invés de OLAP. Logo, a alternativa
correta é a letra d).

25ª Questão) (ESAF – Comissão de Valores Mobiliários – Analista de


Sistemas – 2010) Ferramentas de processamento analítico on-line (OLAP)

a) funcionam sobre dados multidimensionais, caracterizados por atributos


de dimensão e atributos de medida.
b) funcionam sobre dados unidirecionais, caracterizados por atributos de
medida e atributos de qualidade.
c) funcionam sobre dados multidimensionais, caracterizados por atributos
de dispersão e atributos de mediação.
d) desconsideram dados multidimensionais.
e) transformam dados unidimensionais em dados analíticos, caracterizando
dimensão e medidas por atributos equivalentes.

OLAP é um software cuja tecnologia de construção permite aos analistas


de negócios, gerentes e executivos analisar e visualizar dados corporativos de
forma rápida, consistente e principalmente interativa.

A funcionalidade OLAP é inicialmente caracterizada pela análise dinâmica e


multidimensional dos dados consolidados de uma organização permitindo que as
atividades do usuário final sejam tanto analíticas quanto navegacionais. Esta
tecnologia geralmente é implementada em ambiente multiusuário e
cliente/servidor, oferecendo assim respostas rápidas às consultas adhoc
Prof. Victor Dalton
www.estrategiaconcursos.com.br 40 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
(construção de listagens, interligando a informação disponível na base de dados
conforme as necessidades especificas da empresa, assim como a sua
exportação, possibilitando várias simulações), não importando o tamanho do
banco de dados nem sua complexidade. Essa tecnologia auxilia o usuário a
sintetizar informações corporativas por meio de visões comparativas e
personalizadas, análises históricas, projeções e elaborações de cenários.

Qual a margem de lucro para bicicletas em fevereiro? Esse é o tipo de pergunta que o OLAP vai responder, em
uma busca multidimensional no banco de dados (tempo, produto, margem de lucro)

Após este leve embasamento, podemos responder à questão com


tranquilidade. Alternativa a).

26ª Questão) (FCC – TRT/11ª Região – Analista Judiciário –


Tecnologia da Informação – 2012) No âmbito dos DWs e OLAP, o processo
onde se faz a junção dos dados e transforma-se as colunas em linhas e as linhas
em colunas, gerando dados cruzados, é chamado de

a) drill-across.
b) star.
c) cube.
d) pivot.
e) cross-join.

Espero que você lembre dessa!

Junção de dados e rotação do cubo é o cross-join. As demais definições


você já conhece, e foram explicadas nos exercícios anteriores. Se não lembrar,
volte e leia! Tem uma dose boa de teoria na questão anterior.
Prof. Victor Dalton
www.estrategiaconcursos.com.br 41 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
Alternativa e).

27ª Questão) (Cesgranrio – Petrobrás – Analista de Sistemas Júnior


– Engenharia de Software – 2010 - adaptada) A modelagem
multidimensional é uma técnica de concepção e visualização de um modelo de
dados de um conjunto de medidas que descrevem aspectos comuns de negócios.
Ela é especialmente utilizada para sumarizar e reestruturar dados, de forma a
apresentá-los em visões que ajudem ao usuário analisá-los para tomar decisões
relevantes e bem informadas para o processo de negócio sujacente. Qual das
seguintes descrições refere-se corretamente a uma propriedade da modelagem
multidimensional?

a) Quando o usuário realiza uma operação de drill down ou uma operação


de roll up ou drill up, ele está navegando em uma ou mais hierarquias da tabela
de dimensões, respectivamente aumentando e diminuindo a precisão usada para
visualização dos dados.

b) No modelo dimensional, a tabela de fatos representa uma hierarquia dos


dados, transações ou eventos de negócio, sendo sempre implementada de forma
completamente desnormalizada.

c) O uso do modelo dimensional aproxima o armazenamento da forma de


pensar do usuário final e, por isto, faz com que este aprenda a usar SQL de
forma mais eficaz e eficiente.

d) A tabela de dimensões apresenta vários membros que representam


valores diferentes dos fatos e que necessariamente estão organizados em uma
hierarquia única armazenada como uma árvore.

e) A visualização mais popular dos dados em modelos dimensionais é feita


através do desenho de um hipercubo de informação, cujas dimensões são
normalizações dos índices das tabelas transacionais.

É estilo da Cesgranrio “questões para pensar”. Vamos responde-las com o


conhecimento adquirido, exercitando um pouco a mente.

a) Explicação perfeita. Certa!

b) Desnormalizar a base de dados para facilitar a modelagem


multidimensional é um procedimento relativamente comum, para
auxiliar a redução dos tempos de busca de informação na base de
dados. Agora, dizer que isso ocorre sempre é errado;

c) O começo da sentença é válido, mas dizer que o usuário final vai


aprender a usar SQL por causa disso chega a ser nonsense;

Prof. Victor Dalton


www.estrategiaconcursos.com.br 42 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
d) Mais um começo correto que termina totalmente errado;

e) Outra frase que começa certa e termina falando nada com nada. As
dimensões são apenas atributos cujo enfoque é relevante para a análise
em questão.

Exemplificando para descomplicar: no cubo acima, componentes, vestuário,


bicicletas, total de vendas, custo de vendas, quantidade de vendas , margem de
lucro e tempo são atributos de dimensão. O Tempo, por sua vez, pode ser
escalonado em atributos de medida, conforme o drill up e drill down(mês,
trimestre, semestre, dia, ano...). Em cada caso, existirão atributos de dimensão
que poderão conter diversos atributos de medida, ou não.

28ª Questão) (FCC – INFRAERO – Analista de Sistema – Banco de


Dados e Administrador de Dados - 2011) Considere:

I. No Data Warehouse, o dado tem um valor histórico, por referir-se a


algum momento específico do tempo, portanto, ele não é atualizável; a cada
ocorrência de uma mudança, uma nova entrada é criada para sinalizar esta
mudança.

II. O estágio de transformação no processo ETL deve ser capaz de


selecionar determinadas colunas (ou nenhuma) para carregar; transformar
múltiplas colunas em múltiplas linhas; traduzir e unificar códigos heterogêneos
de um mesmo atributo, oriundos de diversas fontes de dados (tabelas).

Prof. Victor Dalton


www.estrategiaconcursos.com.br 43 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
III. No Snow Flake as subdimensões, por não serem normalizadas, geram
aumento significativo no número de registros e, como consequência, aumentam
também a quantidade de joins necessários à exibição de uma consulta.

IV. Data Mining é uma ferramenta de mineração de dados que executa a


varredura nos dados históricos com o objetivo de desconsiderar o que é genérico
sobre algum assunto e valorizar tudo que o for específico dentro do sistema.

Está correto o que consta em

a) I e II, apenas.
b) III e IV, apenas.
c) I, II e III, apenas.
d) II, III e IV, apenas.
e) I, II, III e IV.

Analisando:

I. Correta, uma vez que o DW é não-voltátil;

II. Definição correta acerca de ETL;

III. No snow flake as subdimensões são normalizadas. Errada;

IV. Definição também equivocada de DM.

Resposta certa, alternativa a).

29ª Questão) (FCC – MPE/MA – Analista Ministerial – Banco de


Dados e Administrador de Dados - 2013) Considerando um data warehouse,
podem ser utilizadas, para sua consulta, as ferramentas MOLAP
(Multidimensional OLAP), cuja característica principal é fazer o acesso a um
conjunto de dados previamente calculados, denominado

a) matriz de dados.

b) lista ligada.

c) matriz hash.

d) milestone.

e) cubo de dados.

Prof. Victor Dalton


www.estrategiaconcursos.com.br 44 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
O nosso famoso cubo de dados. Alternativa e).

30ª Questão) (FCC – TRT/9ª Região – Analista Judiciário –


Tecnologia da Informação - 2013) As ferramentas OLAP são as aplicações às
quais os usuários finais têm acesso para extrair os dados de suas bases e
construir os relatórios capazes de responder às suas questões gerenciais. As
operações realizadas abaixo navegam nos dados, modificando o nível de
granularidade da consulta.

A primeira e a segunda operações são, respectivamente,

a) roll up e drill down.

b) drill across e slice and dice.

c) slice and dice e dill throught.

d) dill throught e roll up.

e) drill down e roll up.

Na operação 1, houve uma diminuição no nível de detalhe da informação,


saindo de uma análise do Trimestre 1 para uma análise anual. Na operação 2,
Prof. Victor Dalton
www.estrategiaconcursos.com.br 45 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
houve um aumento no detalhe da informação, “entrando” no Estado do Rio
Grande do Sul, passando a analisar por municípios. Portanto, ocorreram,
respectivamente, um roll up e um drill down.

Alternativa a).

31ª Questão) (FCC – TRT/12ª Região – Analista Judiciário –


Tecnologia da Informação - 2013) Dentre as diferenças cruciais entre o
modelo tradicional de uso de bancos de dados OLTP (Online Transaction
Processing) e o modelo voltado para Data Warehousing (DW) está

a) o nível de armazenamento de dados, muito mais sumarizado no caso de


DW.

b) a quantidade de cláusulas JOIN, utilizadas em maior número para DW.

c) a necessidade de normalização para as bases OLAP, o que não é


necessário em OLTP.

d) a utilização de dados derivados e agregados em OLTP, o que não ocorre


no ambiente de DW.

e) o número de índices necessários, muito maior no caso de DW.

Todas as afirmativas estão erradas, com exceção da alternativa e). Um


DW, por servir de base para ferramentas OLAP, precisa de muitos índices, para
diminuir o custo operacional das pesquisas, que podem ser as mais variadas
possíveis.

32ª Questão) (FCC – TRT/12ª Região – Técnico Judiciário –


Tecnologia da Informação - 2013) Em uma comparação entre bancos de
dados OLTP (Online Transaction Processing), com bancos de dados OLAP (Online
Analytical Processing), para os bancos OLAP

a) não é necessário um grande espaço de armazenamento, pois as


informações são buscadas em tempo real.

b) as operações podem levar horas para serem executadas para certas


queries.

c) as operações de INSERT e UPDATE são efetuadas somente pelos


usuários finais.

d) o principal objetivo é rodar e controlar tarefas básicas de regras de


negócio.
Prof. Victor Dalton
www.estrategiaconcursos.com.br 46 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
e) os dados são obtidos ad hoc, ou seja, sempre que um relatório é
requisitado, os bancos OLTP são acessados dinamicamente para a obtenção
imediata desta informação.

Esta questão está diretamente relacionada com a anterior. Um dos motivos


pelos quais um DW possui muitos índices é justamente porque as consultas
OLAP podem ser demasiadamente complexas e, mesmo em um banco indexado,
as operações podem levar horas para serem executadas.

Alternativa b).

33ª Questão) (FCC – Prefeitura de São Paulo – Auditor Fiscal


Tributário Municipal I – Tecnologia da Informação - 2012) Sobre os
esquemas estrela e floco de neve para modelagem de dados multidimensionais
voltados para OLAP é correto afirmar que

a) ambos os esquemas possuem várias tabelas de fato hierárquicas por


meio de normalização, sendo que apenas no esquema estrela as tabelas de
dimensão também são hierárquicas por meio de normalização.

b) o esquema estrela possui uma única tabela de fato, enquanto no


esquema floco de neve existem várias tabelas de fato hierárquicas por meio de
normalização.

c) o esquema floco de neve possui uma única tabela de fato, enquanto no


esquema estrela existem várias tabelas de fato hierárquicas por meio de
normalização.

d) ambos os esquemas possuem uma tabela de fato e várias tabelas de


dimensão, sendo que apenas no esquema floco de neve as tabelas de dimensão
são hierárquicas por meio de normalização.

e) ambos os esquemas possuem uma tabela de fato e várias tabelas de


dimensão, sendo que apenas no esquema estrela as tabelas de dimensão são
hierárquicas por meio de normalização.

Já sabemos que ambos os esquemas possuem uma única tabela de fato, o


que torna as assertivas de a) a c) erradas. Ainda, sabemos que é o esquema
floco de neve que hierarquiza as tabelas de dimensão por meio da normalização
dos dados.

Alternativa d).

Prof. Victor Dalton


www.estrategiaconcursos.com.br 47 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
34ª Questão) (FCC – TCE/AM – Analista Técnico de Controle Externo
– Tecnologia da Informação - 2012) Em ferramentas OLAP, a estrutura de
dados que agrega as medidas por níveis e hierarquias de cada uma das
dimensões a serem analisadas, combinando várias dimensões, tais como tempo,
geografia e linhas de produtos, com dados resumidos, tais como números de
vendas ou de inventário, é visualizada na forma de

a) um gráfico multidimensional.

b) uma esfera.

c) uma planilha.

d) um cubo.

e) uma pirâmide tridimensional.

Alguma dúvida? Alternativa d).

35ª Questão) (Cesgranrio – Petrobrás – Analista de Sistemas Júnior


– Engenharia de Software - 2010) Em um ambiente de data warehousing,
uma das fases mais importantes é a ETL (Extract, Transformation and Load), em
que se definem as estratégias de conversão, transformação e consistência dos
dados dos sistemas de origem para realizar a carga dos dados no sistema de
data warehouse. Uma característica relacionada a essa fase de ETL é que

a) a garantia da consistência dos dados é especialmente necessária nos


sistemas que incluem SGBDs relacionais, pois estes são incapazes de garantir as
consistências das transações e as integridades referenciais.

b) sua existência é incompatível com o uso dos sistemas legados, pois sua
tecnologia antiquada impede que estes sejam integrados em um sistema de data
warehousing.

c) pode ser eliminada, se o próprio SGBD relacional transacional for usado


como o banco do sistema de data warehousing, o que permite obter uma grande
economia de recursos.

d) é necessária para se obter os dados das múltiplas fontes, de forma a


transformá-los nas variáveis que interessam ao processo de decisão.

e) visa a garantir que cada registro do data warehouse corresponda a


exatamente um registro do SGBD transacional, para assegurar a correção das
variáveis de decisão.

Prof. Victor Dalton


www.estrategiaconcursos.com.br 48 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
Vamos analisar as alternativas uma a uma:

a) a garantia da consistência dos dados é especialmente necessária


nos sistemas que incluem SGBDs relacionais, pois estes são incapazes
de garantir as consistências das transações e as integridades
referenciais. – Amigo, se um SGBD não conseguisse manter a consistência das
transações e as integridades referenciais, eles não custariam milhares de
dólares. Você sabe quanto custa uma licença empresarial de um Oracle?

b) sua existência é incompatível com o uso dos sistemas legados,


pois sua tecnologia antiquada impede que estes sejam integrados em
um sistema de data warehousing. – Sem comentários. O ETL é uma
ferramenta útil justamente por extrair informações de sistemas legados;

c) pode ser eliminada, se o próprio SGBD relacional transacional for


usado como o banco do sistema de data warehousing, o que permite
obter uma grande economia de recursos. – Comparação de bananas com
maças. Uma coisa é usar e administrar um banco de dados, outra coisa é
preenche-lo com informações que precisarão vir de diversas fontes diferentes.

d) é necessária para se obter os dados das múltiplas fontes, de


forma a transformá-los nas variáveis que interessam ao processo de
decisão. – Simples e correto!

e) visa a garantir que cada registro do data warehouse corresponda


a exatamente um registro do SGBD transacional, para assegurar a
correção das variáveis de decisão. – Outra alternativa que não fala nada com
nada. O SGBD não tem registros, quem tem registro é banco de dados.

(CESPE – MPOG – Categoria Profissional 2 – Tecnologia da


Informação - 2013)

36. Em ETL, frequentemente, é necessário limpar, ajustar e


consolidar os dados antes de realizar sua carga. Nesse estágio de
transformação, aplicam-se regras ou funções aos dados extraídos para
ajustar os dados a serem carregados. A limpeza trata de vários tipos de
erros, como, por exemplo, valores ilegais, ou que não obedeçam às
regras de integridade da base, e erros de ortografia.

Correto. A limpeza pode ser realizada durante a transformação, antes da


carga dos dados.

Prof. Victor Dalton


www.estrategiaconcursos.com.br 49 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
(CESPE – ANTT – Analista Administrativo – Desenvolvimento de
Sistemas da Informação - 2013)

37. Ferramentas ETL são utilizadas na extração, transformação e


remoção de dados.

Errado! E – extração; T – transformação; L – carga!

38ª Questão) (CETRO – ANVISA – Analista Administrativo – Área 5 –


2013 – prova anulada) Quanto aos bancos de dados de suporte à decisão,
assinale a alternativa correta.

a) São, principalmente (embora não totalmente), apenas de leitura (read-


only).

b) São, principalmente, livres de qualquer tipo de redundância.

c) Sua principal preocupação é a integridade.

d) Por questões de eficiência no armazenamento, não são indexados.

e) Não devem ser muito grandes devido à constante manutenção exigida e


às transações comerciais que não devem ser acumuladas com o tempo.

Os bancos de dados de suporte à decisão, como um Data Warehouse, via


de regra, são apenas para leitura (alternativa a)), uma vez que as aplicações
que os manipulam visam apenas extrair conhecimento, e não modificar os seus
dados.

Estes bancos costumam conter redundâncias, inclusive sendo


desnormalizados, para facilitar as pesquisas multidimensionais. Isto posto, é
comum a indexação da maioria das tabelas.

Por fim, dependendo do intervalo de tempo que o DW retiver informações,


ele pode ser enorme, e sua manutenção custosa.

39ª Questão) (CETRO – ANVISA – Analista Administrativo – Área 5 –


2013 – prova anulada) Assinale a alternativa que apresenta um recurso
essencialmente OLAP.

a) ROLLUP.

b) GROUP BY.

Prof. Victor Dalton


www.estrategiaconcursos.com.br 50 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
c) OLAPUP.

d) HAVING.

e) SELECT.

Roll up (ou Drill uP) e Drill Down são aumentos ou diminuições na


granularidade de uma consulta, para a visualização de informações com
diferentes níveis de detalhamento.

Olap UP não existe, e as demais alternativas tratam de cláusulas para


consultas SQL.

Alternativa a).

40ª Questão) (CETRO – ANVISA – Analista Administrativo – Área 5 –


2013 – prova anulada) Em relação aos DWs (Data warehouses), assinale a
alternativa correta.

a) São orientados a objetos.

b) Não variam com o tempo.

c) São voláteis.

d) Evitam o uso de gerenciadores de bancos de dados tradicionais,


reduzindo custos, mas podem causar impactos significativos nos sistemas
operacionais.

e) Seus dados não podem ser alterados, mas podem ser excluídos.

Os Data Warehouses são:

Não-volátil: Diferentemente de um Banco de Dados operacional, o


Datawarehouse apenas recebe informações. Exclusões ou alterações ocorrem
apenas para a correção de dados inseridos com erro.

Prof. Victor Dalton


www.estrategiaconcursos.com.br 51 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
Integrado: Um Datawarehouse deve ser integrado, ou seja, trabalha de
forma a globalizar e aproveitar os termos e as estruturas técnicas que são
utilizados nos sistemas de informações tradicionais. Por exemplo, na
representação de sexo, um Datawarehouse manipula todas as formas seguintes:
“m” ou “f”, “0” ou “1”, “x” ou “y”, “macho” ou “fêmea”, “homem” ou “mulher”,
“dama” ou “cavalheiro”.

Orientado por assuntos: Um DW sempre armazena dados importantes


sobre temas específicos da empresa e conforme o interesse das pessoas que irão
utilizá-lo. Bancos de dados operacionais tratam de estoques, entradas e saídas
de materiais. DW trata de clientes, vendas e produtos.

Variante no tempo: A variação em relação ao tempo consiste na


manutenção de um histórico de dados em relação ao período de tempo maior
que dos sistemas comuns. Ao analisarmos um dado de um DW, o mesmo
sempre estará relacionado a um período determinado de tempo, pois terá uma
chave de tempo que irá indicar o dia no qual esses dados foram extraídos.

Essa questão vem para exigir o seu raciocínio. Postos os comentários


acima, percebe-se com facilidade que as alternativas de a) a c) estão erradas. A
alternativa d) também é incorreta porque, apesar de evitar a utilização de
SGBDs tradicionais, um DW não impacta significativamente sistemas
operacionais. Eles se envolvem com as aplicações que os manipulam, apenas.

Aí você chega na alternativa e) e pensa: “os dados no DW não podem ser


excluídos ou alterados, pois ele é não volátil”.

Não é bem assim! Ele é não volátil no sentido de não poderem ser
excluídos ou alterados dados válidos. Observou que o DW é variante no
tempo? Ora, se um DW guarda apenas informações dos últimos 10 anos de uma
empresa, o que acontece com os dados que ultrapassam esse período de
longevidade? Naturalmente, eles serão excluídos do DW, preferencialmente, com
o armazenamento de uma cópia de backup.

Resposta certa, alternativa e).

Prof. Victor Dalton


www.estrategiaconcursos.com.br 52 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
CONSIDERAÇÕES FINAIS

E terminamos a teoria do nosso curso!

Esta aula foi um pouco mais curta, porque, via de regra, este conteúdo é
unido à parte de Bancos de Dados. Entretanto, como o conteúdo de Banco de
Dados para vocês ficou muito extenso, fiz questão de separar esse tópico.

Nossa próxima aula será sobre Programação. Até lá!

Victor Dalton

Prof. Victor Dalton


www.estrategiaconcursos.com.br 53 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
LISTA DE EXERCÍCIOS

1ª Questão) (ESAF – Analista de Planejamento e Orçamento –


Tecnologia da Informação – 2010) BI – Business Inteligence

a) é uma técnica de otimização da árvore de decisão.


b) é um método de formação avançada de gestores.
c) compreende ferramentas de análise de dados para otimizar os processos
produtivos de uma empresa.
d) são técnicas, métodos e ferramentas para mineração de dados na área
de negócios de uma empresa.
e) são técnicas, métodos e ferramentas de análise de dados para subsidiar
processos de decisão de uma empresa.

2ª Questão) (ESAF – Comissão de Valores Mobiliários – Analista de


Sistemas – 2010) O sistema de apoio a decisão

a) visa obter informações de todos os níveis a partir de informações


detalhadas armazenadas nos sistemas de processamento de ações.
b) analisa dados on-line coletados por sistemas de processamento de
transição, para ajudar as pessoas a executar ações operacionais.
c) visa obter informações de alto nível a partir de informações gerenciais
armazenadas nos sistemas de processamento de documentos.
d) analisa dados coletados por sistemas de processamento de inovação,
para ajudar as pessoas a viabilizarem ações de transcrições.
e) analisa dados on-line coletados por sistemas de processamento de
transação, para ajudar as pessoas a tomarem decisões de negócios.

3ª Questão) (CESPE – Banco Central – Analista – Análise e


Desenvolvimento de Sistemas – 2013) Inteligência de negócios (business
intelligence) refere-se aos processos de obtenção de informações válidas a partir
de dados oriundos de fontes diversas (ERPs, CRMs, sistemas legados etc.), que
serão utilizados para apoiar decisões de negócios.

4ª Questão) (UEPA – SEFA/PA – Auditor Fiscal de Receitas Estaduais


– 2013) Leia o texto para responder à questão abaixo.

Prof. Victor Dalton


www.estrategiaconcursos.com.br 54 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05

A solução de TI que está relacionado ao texto é:

a) a construção de um portal corporativo

b) a utilização de uma ferramenta de Business Inteligence

c) a construção de um portal colaborativo

d) a implantação de Governança em TI

e) a aquisição de novos ativos de rede

5ª Questão) (FCC – TST – Analista Judiciário – Análise de Sistemas -


2012) Leia as afirmações a seguir:

I. Um Data Warehouse é um repositório de dados atuais e históricos de


uma organização que possibilita a análise de grande volume de dados para
suportar a tomada de decisões estratégicas, possuindo registros permanentes.

II. O processo de Data Mining, ou mineração de dados, tem por objetivo


localizar possíveis informações em um banco de dados através de comparações
com dados informados pelo usuário e registros de tabelas.

III. Um ERP, ou Sistema Integrado de Gestão Empresarial, é conhecido por


integrar os dados de diferentes departamentos de uma organização,
aumentando o uso de interfaces manuais nos processos.

Prof. Victor Dalton


www.estrategiaconcursos.com.br 55 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
IV. As ferramentas OLAP (On-line Analytical Processing) são capazes de
analisar grandes volumes de dados, fornecendo diferentes perspectivas de visão
e auxiliando usuários na sintetização de informações.

Está correto o que se afirma APENAS em

a) I e II.
b) II e III.
c) I, III e IV.
d) I, II e III.
e) I e IV.

6ª Questão) (FCC – TRT/9ª Região – Técnico Judiciário – Tecnologia


da Informação - 2013) Com o crescente aumento do volume de dados, surge
a necessidade de ferramentas e mecanismos que permitam que eles possam ser
analisados de forma otimizada, uma vez que armazenam toda a trajetória da
empresa. Uma solução é a utilização de ...I... que, em síntese, é utilizado para
armazenar conjuntos de dados organizados por assuntos, mantendo todo um
histórico corporativo. Outro recurso muito utilizado e dos mais importantes
quando o objetivo é a busca de conhecimento, é o ...II... , que é um processo
que consiste na identificação de informações relevantes que estão presentes em
grandes bancos de dados ou repositórios, geralmente realizado em três etapas:
a exploração, a definição dos padrões e a validação dos dados. Estas
ferramentas e técnicas fazem parte do ...III... , definido como um conjunto de
métodos e conceitos que podem ser implementados através de softwares com o
intuito de utilizar os dados importantes da organização para auxiliar no processo
de tomada de decisões, proporcionando melhorias para a alta administração.
Outra tecnologia que pode prover uma melhor e mais flexível análise das
informações, é o ...IV... que permite uma visão conceitual de forma
multidimensional das informações da organização, de maneira que as
informações possam ser visualizadas e analisadas de diferentes perspectivas
pelo usuário.

(http://www.devmedia.com.br/mineracao-de-dados-data-warehouse-data-
mining-bi-e-olap-atraves-do-fastcube-revista-clubedelphi-146/26537)

As lacunas que completam corretamente o texto estão expressas em

Prof. Victor Dalton


www.estrategiaconcursos.com.br 56 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
7ª Questão) (FCC – SEFAZ/RJ – Auditor Fiscal da Receita Estadual –
3ª Categoria - 2014) Sistemas de BI − Business Intelligence reúnem um
conjunto de tecnologias orientadas a disponibilizar informação e conhecimento
em uma organização, dentre as quais está o DW. Um ambiente que utiliza DW
reúne processos e ferramentas, está sempre em evolução e pode ser visualizado
como na figura abaixo.

Os componentes I, II, III e IV estão corretamente identificados em:

8ª Questão) (FCC – INFRAERO – Analista Superior III – Analista de


Sistemas/Administrador de Banco de Dados – 2011) No âmbito da
descoberta do conhecimento (KDD), a visão geral das etapas que constituem o
processo KDD (Fayyad) e que são executadas de forma interativa e iterativa
apresenta a seguinte sequência de etapas:

a) seleção, pré-processamento, transformação, data mining e


interpretação/avaliação.
b) seleção, transformação, pré-processamento, interpretação/avaliação e
data mining.

Prof. Victor Dalton


www.estrategiaconcursos.com.br 57 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
c) data warehousing, star modeling, ETL, OLAP e data mining.
d) ETL, data warehousing, pré-processamento, transformação e star
modeling.
e) OLAP, ETL, star modeling, data mining e interpretação/avaliação.

9ª Questão) (ESAF – Analista de Planejamento e Orçamento –


Tecnologia da Informação – 2010) Mineração de Dados

a) é uma forma de busca sequencial de dados em arquivos.


b) é o processo de programação de todos os relacionamentos e algoritmos
existentes nas bases de dados.
c) por ser feita com métodos compiladores, método das redes neurais e
método dos algoritmos gerativos.
d) engloba as tarefas de mapeamento, inicialização e clusterização.
e) engloba as tarefas de classificação, regressão e clusterização.

10ª Questão) (FCC –TRF4 – Analista Judiciário – Apoio Especializado


- Especialidade Informática- 2010) Sobre data mining, é correto afirmar:
a) Não requer interação com analistas humanos, pois os algoritmos
utilizados conseguem determinar de forma completa e eficiente o valor dos
padrões encontrados.

b) Na mineração de dados, encontrar padrões requer que os dados brutos


sejam sistematicamente "simplificados", de forma a desconsiderar aquilo que é
genérico e privilegiar aquilo que é específico.

c) É um grande banco de dados voltado para dar suporte necessário nas


decisões de usuários finais, geralmente gerentes e analistas de negócios.
d) O processo de descobrimento realizado pelo data mining só pode ser
utilizado a partir de um data warehouse, onde os dados já estão sem erros, sem
duplicidade, são consistentes e habilitam descobertas abrangentes e precisas.

e) É o processo de descoberta de novas correlações, padrões e tendências


entre as informações de uma empresa, por meio da análise de grandes
quantidades de dados armazenados em bancos de dados usando técnicas de
reconhecimento de padrões, estatísticas e matemáticas.

11ª Questão) (FCC – INFRAERO – Analista Superior III –


Administrador de Banco de Dados – 2012) Funcionalidade cujo objetivo é
encontrar conjuntos de dados que não obedecem ao comportamento ou modelo
dos dados. Uma vez encontrados, podem ser tratados ou descartados para
utilização em mining. Trata-se de

Prof. Victor Dalton


www.estrategiaconcursos.com.br 58 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05

a) descrição.
b) agrupamento.
c) visualização.
d) análise de outliers.
e) análise de associações.

12ª Questão) (FCC – TCE/SP – Agente da Fiscalização Financeira -


2008) NÃO é uma técnica no processo de garimpagem de dados utilizada em
Data Mining:

a) Associação.
b) Classificação.
c) Avaliação.
d) Agregação.
e) Padrões sequenciais

13ª Questão) (CESPE – SERPRO – Analista – Negócios em Tecnologia


da Informação – 2013) Clusterização é a tarefa preditiva relativa à
identificação de um conjunto finito de categorias empregadas para descrever
uma informação. Essas categorias nunca poderão ser mutuamente exclusivas.

14ª Questão) (FCC – Prefeitura de São Paulo – Auditor Fiscal


Tributário Municipal I – Tecnologia da Informação - 2012) Em aplicações
de data mining uma operação comum é o aprendizado ou mineração de regras
de associação entre itens. Uma papelaria aplica o algoritmo Apriori para minerar
regras de associação entre as seguintes compras:

Supondo um suporte mínimo de 50%, os conjuntos de itens frequentes de


dois elementos são:
a) {caneta, borracha}, {caneta, régua} e {lápis, borracha}
b) {lápis, caneta}
c) {lápis, borracha}
d) {caneta, régua} e {compasso, transferidor}
e) {lápis, régua} e {caneta, borracha}

Prof. Victor Dalton


www.estrategiaconcursos.com.br 59 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
15ª Questão) (ESAF – Técnico da Receita Federal do Brasil –
Tecnologia da Informação – 2006 - adaptada) Analise as seguintes
afirmações relacionadas a Datawarehouse.

I. Um Datawarehouse deve ser volátil, ou seja, os dados sofrem as


alterações necessárias, como: incluir, alterar ou excluir dados.
II. Um Datawarehouse deve ser integrado, ou seja, trabalha de forma a
globalizar e aproveitar os termos e as estruturas técnicas que são utilizados nos
sistemas de informações tradicionais. Por exemplo, na representação de sexo,
um Datawarehouse utiliza todas as formas seguintes: “m” ou “f”, “0” ou “1”, “x”
ou “y”, “macho” ou “fêmea”, “homem” ou “mulher”, “dama” ou “cavalheiro”.
III. Um Datawarehouse deve ser orientado aos principais assuntos ou
negócios da empresa como, por exemplo, clientes, vendas e produtos. Já os
sistemas de informações tradicionais são orientados a processos como, por
exemplo, estoques, entradas e saídas de materiais.
IV. Um Datawarehouse deve ser invariável no tempo, ou seja, sua
estrutura dos dados dispensa elementos temporais, sendo importante apenas a
retenção da chave primária.

Indique a opção que contenha todas as afirmações verdadeiras.

a) I e II
b) II e III
c) I e III
d) III e IV
e) II e IV

16ª Questão) (FCC – SEFAZ/RJ – Auditor Fiscal da Receita Estadual –


3ª Categoria - 2014) Com o advento da tecnologia de Data Warehousing, os
ambientes de apoio à decisão passaram a ser denominados ambientes de Data
Warehouse (DW).

Em relação à tecnologia DW, é correto afirmar:

a) Em um DW as convenções de nomes, valores de variáveis e outros


atributos físicos de dados como data types são bastante flexíveis. Para facilitar a
tomada de decisões, as informações são apresentadas de diferentes formas, da
mesma maneira que foram carregadas dos sistemas legados.

b) Um projetista de DW deve ter seu foco na modelagem dos dados e no


projeto de banco de dados. Um sistema transacional armazena as informações
agrupadas por assuntos de interesse da empresa que são mais importantes,
enquanto um DW é orientado a processos e deve ser desenvolvido para manter
disponíveis as transações realizadas diariamente.

Prof. Victor Dalton


www.estrategiaconcursos.com.br 60 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05

c) Os dados de um DW são um conjunto dinâmico de registros de uma ou


mais tabelas, capturados em um momento de tempo predeterminado, por isso
têm que ser sempre atualizados.

d) Um sistema multidimensional, como o DW, deve atualizar o valor


corrente das informações e sua exatidão é válida por um tempo curto, por
exemplo, o valor total das notas fiscais processadas pela Receita às 12:00 de um
dia pode ser diferente às 18:00 do mesmo dia.

e) Um DW tem duas operações básicas: a carga dos dados (inicial e


incremental) e o acesso a estes dados em modo leitura. Depois de carregado,
um DW não necessita de operações de bloqueio por concorrência de usuários no
acesso aos seus dados.

17ª Questão) (FGV – SEFAZ/RJ – Agente Fiscal de Rendas –2007)


DataWarehouse e DataMining são recursos utilizados por muitas organizações
para facilitar e agilizar o processamento, a análise e a consulta de dados. Sobre
esses recursos, é correto afirmar que:

a) um DataMining armazena dados extraídos de bancos de dados de


diferentes organizações.
b) um DataWarehouse armazena dados por períodos não superiores a três
meses, o que dificulta previsões e análises de tendência.
c) um DataWarehouse é repositório de dados históricos orientados a
assunto, organizados para serem acessíveis para atividades de processamento
analítico.
d) DataMining é uma técnica de análise de dados exclusiva para aplicação
em um DataWarehouse.
e) num DataWarehouse, os usuários finais necessitam conhecer linguagem
de programação para acessar dados.

18ª Questão) (FCC – TCE/SP – Agente da Fiscalização Financeira -


2008) Os depósitos de dados voltados para o processo decisório gerencial e que
podem ser definidos como espécies de mesmo tipo e estrutura são

a) business intelligence e data mining.


b) data warehouse e data mart.
c) data warehouse e data mining.
d) data mining e data mart.
e) data mining, data warehouse e data mart.

Prof. Victor Dalton


www.estrategiaconcursos.com.br 61 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
19ª Questão) (CESPE – Banco Central – Analista – Análise e
Desenvolvimento de Sistemas – 2013) Data warehouse (DW) e data mart
(DM) são componentes importantes em um ambiente de business intelligence,
visto que eles representam repositórios de múltiplos bancos de dados
operacionais da empresa. Um DM agrega informações de diversos DWs
distribuídos pelos departamentos da empresa.

20ª Questão) (FCC – SEFAZ/SP – Agente Fiscal de Rendas – 2009 –


Tecnologia da Informação) Se uma empresa de grande porte, com alto
volume de transações e informações, resolver iniciar um projeto usando o
conceito de Data Mart (DM) em vez de Data Warehouse (DW),
independentemente disso ser ou não a melhor opção, os fatores que a levam a
tal decisão podem ser justificados por:
I. Possibilidade de extrair e preparar os dados diretamente de fontes de
interesse específicas, fornecendo acesso mais rápido pela não necessidade de
sincronia com dados de outras fontes.
II. Menor risco quanto ao sucesso do projeto.
III. Necessidade imediata de informações organizacionais integradas.

Está correto o que consta em

a) I, apenas.
b) I e II, apenas.
c) I e III, apenas.
d) I, II e III.
e) II e III, apenas.

(FCC – SEFAZ/SP – Agente Fiscal de Rendas – Tecnologia da


Informação - 2013) Considere o texto a seguir (baseado em uma notícia real):

O Grupo Montanhês implantou uma solução de BI para unificar as informações de


todos os segmentos em que atua e disponibilizá-las de acordo com a necessidade e
permissão de acesso de cada colaborador. Antes da implementação do sistema, os
relatórios departamentais eram elaborados manualmente, o que demandava muito
tempo. “Desde os dados contábeis até as informações de marketing e de RH eram
compiladas de forma mecânica pelas equipes”, lembra o gerente de planejamento do
grupo, que foi um dos líderes do projeto.
Ele explica que, observando os processos da empresa, percebeu que o método
utilizado era ultrapassado e, além de moroso, não permitia a integração de dados entre
as unidades de negócios. “Da forma como atuávamos não conseguíamos aproveitar as
informações que detínhamos para otimizar nossos processos, projetar cenários futuros e
desenvolver ofertas especiais para o perfil dos clientes”. Assim, o gerente desenvolveu
um projeto-piloto para mostrar como a solução poderia facilitar o dia-a-dia das áreas de
negócio. “Nesse primeiro momento, foram integrados apenas os dados financeiros e
contábeis de nossas unidades de negócio vindas de sistemas legados para os Data
Marts”, afirma ele.

Prof. Victor Dalton


www.estrategiaconcursos.com.br 62 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
Após demonstrações para os gerentes e diretores, a alta diretoria deu o aval para
implementar a iniciativa em todo o grupo “Trabalhamos com a previsão de obter um ROI
em 3 anos”, calcula o executivo. “Buscávamos uma ferramenta que gerasse análises
detalhadas a partir de um grande volume de informações, até porque tínhamos a
necessidade de sermos mais competitivos frente ao dinâmico mercado varejista”. O que,
segundo o executivo, exigia decisões rápidas e acertadas.
Uma das fases essenciais do projeto foi a criação de uma central de
armazenamento de dados, desenvolvida pela equipe interna de TI. Nesse repositório
estão todas as principais informações corporativas, que incluem dados financeiros,
contábeis, de vendas, RH e marketing. “Essa fase do projeto durou cerca de 6 meses e
foi uma das mais desafiadoras, visto que previu a padronização − em uma base única −
dos dados que antes eram gerenciados por diversos sistemas”, diz.
Antes da implementação da solução de BI, o acesso às informações acontecia por
meio da extração de arquivos diretamente dos sistemas. Em seguida, esses dados eram
processados em planilha Excel ou por meio do Access, que geravam os relatórios
departamentais não padronizados. Hoje esses processos foram substituídos por
relatórios e paineis (dashboards). “As informações passaram a ser consolidadas em um
Data Warehouse de 1TB, administrado pela área de TI”.
Uma vez implantado, o sistema integrado começou a ser acessado pelos diretores
e gerentes das áreas de negócios. “Por meio de ferramentas OLAP com interface web,
hoje os funcionários de alto escalão já podem acessar as informações de sua área, bem
como cruzá-las com outros dados", explica o gerente, ao informar que isso permite
mapear o perfil dos clientes, projetar cenários futuros e facilitar a criação de
apresentações setoriais. Além dos benefícios de agilidade na elaboração de relatórios e
da visão consolidada que a alta direção consegue ter da empresa, o gerente destaca que
a produtividade das equipes aumentou consideravelmente após a implementação da
solução de BI. “Em breve todos os funcionários − cada um com seu nível de permissão –
terão acesso à interface de dados de todo o grupo empresarial."

21ª Questão) Ao grupo Montanhês foi apresentada uma solução de BI que


trouxe diversas vantagens para o grupo empresarial. O resultado dessa solução
permitiu:

1 − Informação disponível para gestão


2 − Visão de curvas de comportamento
3 − Agilidade de ferramentas para apoio à gestão
4 − Segurança de informações para decisão
5 − Maior abrangência de visão de indicadores
6 − Recursos mais abrangentes para análise de negócios
7 − Necessidades e expectativas atendidas por ferramentas de TI

A solução apresentada foi


a) uma modelagem de banco de dados multidimensional.
b) um projeto de Data Warehouse.
c) um query & report de uma ferramenta OLAP.
d) uma operação ETL.
e) um projeto de banco de dados transacional.

Prof. Victor Dalton


www.estrategiaconcursos.com.br 63 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
22ª Questão) Considerando o contexto da solução de BI do Grupo
Montanhês, no segundo parágrafo, a integração inicial apenas dos dados
financeiros e contábeis vindas de sistemas legados indica que

a) foi utilizada uma implementação bottom up, que permite que o


planejamento e desenho dos Data Marts possam ser realizados sem esperar pela
infraestrutura corporativa do DW, permitindo um ROI mais rápido.

b) foi utilizada uma implementação combinada que tem o propósito de


integrar a arquitetura top down com a bottom up, usando diversos modelos de
Data Marts, gerados de uma só vez.

c) foi utilizada uma implementação top down. Nesta implementação há um


grande trabalho inicial, envolvendo todas as pessoas da empresa que irão
participar do projeto, o que força a empresa a definir regras de negócio de forma
corporativa antes de se iniciar o projeto do DW.

d) não foi utilizada a implementação top down, porque o processo se iniciou


com a extração, transformação e integração das informações dos sistemas
internos, dados externos e das fontes operacionais para um ODS.

e) foi utilizada uma implementação bottom up, porque a partir do DW


foram extraídos os dados e metadados para os Data Marts departamentais do
grupo empresarial.

23ª Questão) (FGV – MPE/MS – Analista – Análise de Sistemas –


2013 - adaptada) Com relação ao tema “Arquitetura e aplicações de data
warehousing”, analise as afirmativas a seguir.

I. As quatro características principais dos datawarehouses são: orientação


por assunto, não volatilidade, integração com outras fontes de dados e variação
em relação ao tempo.

II. Datawarehouses auxiliam diretores e gestores no processamento de


transações do dia a dia da empresa e, por esse motivo, armazenam dados e
metadados altamente normalizados e de baixa granularidade.

Assinale:

a) se somente a afirmativa I estiver correta.

b) se somente a afirmativa II estiver correta.

c) se nenhuma estiver correta.

d) ambas estiverem corretas.

Prof. Victor Dalton


www.estrategiaconcursos.com.br 64 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
24ª Questão) (UEL – CELEPAR – Analista Júnior de Desenvolvimento
de Sistemas – 2009) Sobre DataWarehouse, é correto afirmar:

I. É uma coleção de dados orientada por assuntos, integrada, variante no


tempo, que tem por objetivo dar suporte aos processos de tomada de decisão.

II. É implementado por meio de um banco de dados contendo dados


extraídos do ambiente de produção da empresa, que foram selecionados e
depurados, tendo sido otimizados para processamento de consulta e não para
processamento de transações.
III. Seu objetivo é fornecer uma “imagem única da realidade do negócio”.
De uma forma geral, são sistemas que compreendem um conjunto de programas
que extraem dados do ambiente de dados operacionais da empresa, um banco
de dados que os mantém, e sistemas que fornecem estes dados aos seus
usuários.

IV. As ferramentas ROLAP surgiram juntamente com os Sistemas de Apoio


à Decisão para fazerem a consulta e a análise dos dados contidos nos Data
Warehouses e Data Marts.

Assinale a alternativa correta.

a) Somente as afirmativas I e III são corretas.


b) Somente as afirmativas I e IV são corretas.
c) Somente as afirmativas II e IV são corretas.
d) Somente as afirmativas I, II e III são corretas.
e) Somente as afirmativas II, III e IV são corretas.

25ª Questão) (ESAF – Comissão de Valores Mobiliários – Analista de


Sistemas – 2010) Ferramentas de processamento analítico on-line (OLAP)

a) funcionam sobre dados multidimensionais, caracterizados por atributos


de dimensão e atributos de medida.
b) funcionam sobre dados unidirecionais, caracterizados por atributos de
medida e atributos de qualidade.
c) funcionam sobre dados multidimensionais, caracterizados por atributos
de dispersão e atributos de mediação.
d) desconsideram dados multidimensionais.
e) transformam dados unidimensionais em dados analíticos, caracterizando
dimensão e medidas por atributos equivalentes.

26ª Questão) (FCC – TRT/11ª Região – Analista Judiciário –


Tecnologia da Informação – 2012) No âmbito dos DWs e OLAP, o processo

Prof. Victor Dalton


www.estrategiaconcursos.com.br 65 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
onde se faz a junção dos dados e transforma-se as colunas em linhas e as linhas
em colunas, gerando dados cruzados, é chamado de

a) drill-across.
b) star.
c) cube.
d) pivot.
e) cross-join.

27ª Questão) (Cesgranrio – Petrobrás – Analista de Sistemas Júnior


– Engenharia de Software – 2010 - adaptada) A modelagem
multidimensional é uma técnica de concepção e visualização de um modelo de
dados de um conjunto de medidas que descrevem aspectos comuns de negócios.
Ela é especialmente utilizada para sumarizar e reestruturar dados, de forma a
apresentá-los em visões que ajudem ao usuário analisá-los para tomar decisões
relevantes e bem informadas para o processo de negócio sujacente. Qual das
seguintes descrições refere-se corretamente a uma propriedade da modelagem
multidimensional?

a) Quando o usuário realiza uma operação de drill down ou uma operação


de roll up ou drill up, ele está navegando em uma ou mais hierarquias da tabela
de dimensões, respectivamente aumentando e diminuindo a precisão usada para
visualização dos dados.

b) No modelo dimensional, a tabela de fatos representa uma hierarquia dos


dados, transações ou eventos de negócio, sendo sempre implementada de forma
completamente desnormalizada.

c) O uso do modelo dimensional aproxima o armazenamento da forma de


pensar do usuário final e, por isto, faz com que este aprenda a usar SQL de
forma mais eficaz e eficiente.

d) A tabela de dimensões apresenta vários membros que representam


valores diferentes dos fatos e que necessariamente estão organizados em uma
hierarquia única armazenada como uma árvore.

e) A visualização mais popular dos dados em modelos dimensionais é feita


através do desenho de um hipercubo de informação, cujas dimensões são
normalizações dos índices das tabelas transacionais.

28ª Questão) (FCC – INFRAERO – Analista de Sistema – Banco de


Dados e Administrador de Dados - 2011) Considere:

I. No Data Warehouse, o dado tem um valor histórico, por referir-se a


algum momento específico do tempo, portanto, ele não é atualizável; a cada

Prof. Victor Dalton


www.estrategiaconcursos.com.br 66 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
ocorrência de uma mudança, uma nova entrada é criada para sinalizar esta
mudança.

II. O estágio de transformação no processo ETL deve ser capaz de


selecionar determinadas colunas (ou nenhuma) para carregar; transformar
múltiplas colunas em múltiplas linhas; traduzir e unificar códigos heterogêneos
de um mesmo atributo, oriundos de diversas fontes de dados (tabelas).

III. No Snow Flake as subdimensões, por não serem normalizadas, geram


aumento significativo no número de registros e, como consequência, aumentam
também a quantidade de joins necessários à exibição de uma consulta.

IV. Data Mining é uma ferramenta de mineração de dados que executa a


varredura nos dados históricos com o objetivo de desconsiderar o que é genérico
sobre algum assunto e valorizar tudo que o for específico dentro do sistema.

Está correto o que consta em

a) I e II, apenas.
b) III e IV, apenas.
c) I, II e III, apenas.
d) II, III e IV, apenas.
e) I, II, III e IV.

29ª Questão) (FCC – MPE/MA – Analista Ministerial – Banco de


Dados e Administrador de Dados - 2013) Considerando um data warehouse,
podem ser utilizadas, para sua consulta, as ferramentas MOLAP
(Multidimensional OLAP), cuja característica principal é fazer o acesso a um
conjunto de dados previamente calculados, denominado

a) matriz de dados.

b) lista ligada.

c) matriz hash.

d) milestone.

e) cubo de dados.

30ª Questão) (FCC – TRT/9ª Região – Analista Judiciário –


Tecnologia da Informação - 2013) As ferramentas OLAP são as aplicações às
quais os usuários finais têm acesso para extrair os dados de suas bases e
construir os relatórios capazes de responder às suas questões gerenciais. As

Prof. Victor Dalton


www.estrategiaconcursos.com.br 67 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
operações realizadas abaixo navegam nos dados, modificando o nível de
granularidade da consulta.

A primeira e a segunda operações são, respectivamente,

a) roll up e drill down.

b) drill across e slice and dice.

c) slice and dice e dill throught.

d) dill throught e roll up.

e) drill down e roll up.

31ª Questão) (FCC – TRT/12ª Região – Analista Judiciário –


Tecnologia da Informação - 2013) Dentre as diferenças cruciais entre o
modelo tradicional de uso de bancos de dados OLTP (Online Transaction
Processing) e o modelo voltado para Data Warehousing (DW) está

a) o nível de armazenamento de dados, muito mais sumarizado no caso de


DW.

b) a quantidade de cláusulas JOIN, utilizadas em maior número para DW.

Prof. Victor Dalton


www.estrategiaconcursos.com.br 68 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
c) a necessidade de normalização para as bases OLAP, o que não é
necessário em OLTP.

d) a utilização de dados derivados e agregados em OLTP, o que não ocorre


no ambiente de DW.

e) o número de índices necessários, muito maior no caso de DW.

32ª Questão) (FCC – TRT/12ª Região – Técnico Judiciário –


Tecnologia da Informação - 2013) Em uma comparação entre bancos de
dados OLTP (Online Transaction Processing), com bancos de dados OLAP (Online
Analytical Processing), para os bancos OLAP

a) não é necessário um grande espaço de armazenamento, pois as


informações são buscadas em tempo real.

b) as operações podem levar horas para serem executadas para certas


queries.

c) as operações de INSERT e UPDATE são efetuadas somente pelos


usuários finais.

d) o principal objetivo é rodar e controlar tarefas básicas de regras de


negócio.

e) os dados são obtidos ad hoc, ou seja, sempre que um relatório é


requisitado, os bancos OLTP são acessados dinamicamente para a obtenção
imediata desta informação.

33ª Questão) (FCC – Prefeitura de São Paulo – Auditor Fiscal


Tributário Municipal I – Tecnologia da Informação - 2012) Sobre os
esquemas estrela e floco de neve para modelagem de dados multidimensionais
voltados para OLAP é correto afirmar que

a) ambos os esquemas possuem várias tabelas de fato hierárquicas por


meio de normalização, sendo que apenas no esquema estrela as tabelas de
dimensão também são hierárquicas por meio de normalização.

b) o esquema estrela possui uma única tabela de fato, enquanto no


esquema floco de neve existem várias tabelas de fato hierárquicas por meio de
normalização.

c) o esquema floco de neve possui uma única tabela de fato, enquanto no


esquema estrela existem várias tabelas de fato hierárquicas por meio de
normalização.

Prof. Victor Dalton


www.estrategiaconcursos.com.br 69 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
d) ambos os esquemas possuem uma tabela de fato e várias tabelas de
dimensão, sendo que apenas no esquema floco de neve as tabelas de dimensão
são hierárquicas por meio de normalização.

e) ambos os esquemas possuem uma tabela de fato e várias tabelas de


dimensão, sendo que apenas no esquema estrela as tabelas de dimensão são
hierárquicas por meio de normalização.

34ª Questão) (FCC – TCE/AM – Analista Técnico de Controle Externo


– Tecnologia da Informação - 2012) Em ferramentas OLAP, a estrutura de
dados que agrega as medidas por níveis e hierarquias de cada uma das
dimensões a serem analisadas, combinando várias dimensões, tais como tempo,
geografia e linhas de produtos, com dados resumidos, tais como números de
vendas ou de inventário, é visualizada na forma de

a) um gráfico multidimensional.

b) uma esfera.

c) uma planilha.

d) um cubo.

e) uma pirâmide tridimensional.

35ª Questão) (Cesgranrio – Petrobrás – Analista de Sistemas Júnior


– Engenharia de Software - 2010) Em um ambiente de data warehousing,
uma das fases mais importantes é a ETL (Extract, Transformation and Load), em
que se definem as estratégias de conversão, transformação e consistência dos
dados dos sistemas de origem para realizar a carga dos dados no sistema de
data warehouse. Uma característica relacionada a essa fase de ETL é que

a) a garantia da consistência dos dados é especialmente necessária nos


sistemas que incluem SGBDs relacionais, pois estes são incapazes de garantir as
consistências das transações e as integridades referenciais.

b) sua existência é incompatível com o uso dos sistemas legados, pois sua
tecnologia antiquada impede que estes sejam integrados em um sistema de data
warehousing.

c) pode ser eliminada, se o próprio SGBD relacional transacional for usado


como o banco do sistema de data warehousing, o que permite obter uma grande
economia de recursos.

d) é necessária para se obter os dados das múltiplas fontes, de forma a


transformá-los nas variáveis que interessam ao processo de decisão.

Prof. Victor Dalton


www.estrategiaconcursos.com.br 70 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
e) visa a garantir que cada registro do data warehouse corresponda a
exatamente um registro do SGBD transacional, para assegurar a correção das
variáveis de decisão.

(CESPE – MPOG – Categoria Profissional 2 – Tecnologia da


Informação - 2013)

36. Em ETL, frequentemente, é necessário limpar, ajustar e


consolidar os dados antes de realizar sua carga. Nesse estágio de
transformação, aplicam-se regras ou funções aos dados extraídos para
ajustar os dados a serem carregados. A limpeza trata de vários tipos de
erros, como, por exemplo, valores ilegais, ou que não obedeçam às
regras de integridade da base, e erros de ortografia.

(CESPE – ANTT – Analista Administrativo – Desenvolvimento de


Sistemas da Informação - 2013)

37. Ferramentas ETL são utilizadas na extração, transformação e


remoção de dados.

38ª Questão) (CETRO – ANVISA – Analista Administrativo – Área 5 –


2013 – prova anulada) Quanto aos bancos de dados de suporte à decisão,
assinale a alternativa correta.

a) São, principalmente (embora não totalmente), apenas de leitura (read-


only).

b) São, principalmente, livres de qualquer tipo de redundância.

c) Sua principal preocupação é a integridade.

d) Por questões de eficiência no armazenamento, não são indexados.

e) Não devem ser muito grandes devido à constante manutenção exigida e


às transações comerciais que não devem ser acumuladas com o tempo.

39ª Questão) (CETRO – ANVISA – Analista Administrativo – Área 5 –


2013 – prova anulada) Assinale a alternativa que apresenta um recurso
essencialmente OLAP.

a) ROLLUP.

b) GROUP BY.
Prof. Victor Dalton
www.estrategiaconcursos.com.br 71 de 72
Tecnologia da Informação para ICMS/SP 2015 Pré Edital
Agente Fiscal de Rendas Especialidade Gestão Tributária
Prof Victor Dalton Aula 05
c) OLAPUP.

d) HAVING.

e) SELECT.

40ª Questão) (CETRO – ANVISA – Analista Administrativo – Área 5 –


2013 – prova anulada) Em relação aos DWs (Data warehouses), assinale a
alternativa correta.

a) São orientados a objetos.

b) Não variam com o tempo.

c) São voláteis.

d) Evitam o uso de gerenciadores de bancos de dados tradicionais,


reduzindo custos, mas podem causar impactos significativos nos sistemas
operacionais.

e) Seus dados não podem ser alterados, mas podem ser excluídos.

GABARITO

1.e 2.e 3.c 4.b 5.e 6.d 7.d 8.a 9.e 10.e
11.d 12.c 13.e 14.e 15.b 16.e 17.c 18.b 19.e 20.b
21.b 22.a 23.a 24.d 25.a 26.e 27.a 28.a 29.e 30.a
31.e 32.b 33.d 34.d 35.d 36.c 37.e 38.a 39.a 40.e

Prof. Victor Dalton


www.estrategiaconcursos.com.br 72 de 72

Você também pode gostar