Você está na página 1de 5

GLOSSÁRIO de BUSINESS ANALYTICS

Organizador: Prof. Robson Gonçalves

Arquitetura de BI/BA - estrutura para organização de dados, gestão de informações e


componentes usados para construir os sistemas de Business Intelligence e Business Analytics.
Seus componentes incluem desde as fontes de dados, processos relacionados a ETL (ver
abaixo), a organização das warehouses (ver abaixo) chegando até a geração de relatórios,
análises, dashboards e práticas vinculadas à OLAP (ver abaixo).

Análise descritiva - é a interpretação de dados históricos e KPIs para identificar tendências e


padrões. Isso permite que você tenha uma visão global do que aconteceu e do que está
acontecendo, usando técnicas de agregação e extração de dados. Muitas empresas usam
análises descritivas para detalhar o comportamento do cliente e como direcionar esses
clientes com estratégias de marketing. (Fonte: https://farolbi.com.br)

Análise de diagnóstico - Trata-se de um tipo avançado de análise, em que são utilizadas


técnicas como mineração, correlações, detalhamento e descoberta de dados com vistas a
descobrir as causas de um dado problema ou situação organizacional. deve responder à
pergunta “Por que aconteceu?”. (Fonte: https://farolbi.com.br)

Análise preditiva - A análise preditiva abrange uma variedade de técnicas estatísticas de


mineração de dados, modelagem preditiva e aprendizado de máquina que analisam fatos
atuais e históricos para fazer previsões sobre eventos futuros ou desconhecidos. (Fonte:
Wikipedia).

Análise prescritiva - proporciona às organizações as ações ideais para alcançar seus objetivos
de negócios, como a satisfação do cliente, a lucratividade e a redução de custos. As soluções
de análise prescritiva usam a tecnologia de otimização para resolver decisões complexas, com
milhões de variáveis de decisão, restrições e trocas. (Fonte: www.ibm.com).

BABOK - Business Analitics Body of Knowledge, correspondente em Business Analytics ao


PMBOK – Project Management Body of Knowledge.

Big Data - conceito relacionado a um fenômeno em evidência e em aceleração nas últimas


décadas marcado pela geração de dados com grande variedade, volume e velocidade (3 Vs). A
geração desses dados está, no geral, associada a novas fontes que fazem grande uso de
tecnologia: internet, telefonia celular, streaming etc.

Conhecimento - em Business Analytics, capacidade de dar significado à informação de modo


prático, com vistas a seu uso no âmbito corporativo e no contexto da estratégia da
organização.

Dado(s) - registro de atributo ou comportamento de um ente, objeto ou fenômeno onde


registro indica o ato de registrar, ou seja, é a gravação ou a impressão de caracteres ou
símbolos que tenham um significado em algum documento ou suporte físico. A palavra dado
vem do latim datum que, usado como substantivo, significa "presente" no sentido de algo que
foi oferecido ou dado. (Fonte: Wikipedia).
Dados estruturados/não estruturados - os dados estruturados são aqueles que possuem
estruturas bem definidas, rígidas, pensadas antes da própria existência do dado que será
carregado naquela estrutura. Não permitem que tipos de dados diferentes das estruturas
preestabelecidas sejam carregados. Por exemplo, se a coluna de uma tabela foi criada para ser
numérica, ela não aceitará dados textuais. Dados não estruturados não possuem estruturas
bem definidas, alinhadas, padronizadas, podendo ser compostos por diversos elementos
diferentes dentro de um todo – milhares de pixels únicos dentro de uma mesma foto de uma
paisagem, por exemplo. Compreendem cerca de 80% de todos os dados existentes no mundo,
exatamente porque são criados a partir do uso cotidiano das tecnologias na sociedade –
mensagens de texto, selfies, áudios via WhatsApp, dentre outros.
(Fonte:www.digitalhouse.com).

Data lake - é um repositório utilizado para armazenar todos os dados estruturados e não
estruturados, antes mesmo do tratamento típico da fase ETL (ver verbete). Ao armazená-los de
forma não estruturada pode-se realizar diferentes tipos de análise, incluindo processamento
de big data, análise em tempo real e machine learning, a fim de adquirir melhores decisões.
(Fonte: Wikipedia).

Data mart - é uma forma simples de data warehouse (veja verbete) voltado para atender as
necessidades de acesso de clientes (usuários de dados internos ou externos) específicos.
Enquanto os data warehouses armazenam dados gerados e/ou utilizáveis por toda a empresa,
os dados dos data marts referem-se em geral a um único departamento. Em algumas formas
de implantação, cada departamento ou unidade de negócios é considerado o proprietário de
seu data mart, incluindo hardwares, softwares e dados. Quando esse modelo é considerado
adequada no âmbito da governança de dados (veja verbete) o uso de data mats permite que
cada departamento isole o uso de seus dados, seu tratamento e modelagem.

Data mining - prospecção de dados ou mineração de dados é o processo de explorar dados à


procura de padrões consistentes, como regras de associação ou sequências temporais, para
detectar relacionamentos sistemáticos entre variáveis, detectando assim novos subconjuntos
de dados. (Fonte: Wikipedia).

Data warehouse - armazém de dados, ou ainda depósito de dados, é utilizado para armazenar
informações relativas às atividades de uma organização em bancos de dados, de forma
consolidada. (Fonte: Wikipedia).

Decisão - em Business Analytics, fazer uma escolha dentre algumas alternativas com vistas ao
atingimento de objetivo(s) ou meta(s) previamente definidos. A tomada de decisão nas
organizações consiste em fazer uma escolha importante, normalmente dividida entre mais de
duas possibilidades e que desdobrará consequências para o futuro, tanto do negócio quanto
dos colaboradores e clientes. (Fonte: www.totvs.com).

Deep Learning - o termo se refere a redes neurais artificiais, que são extremamente
complexas. Nelas, os algoritmos conseguem não apenas tomar decisões e aprender, mas fazer
isso com altíssimos níveis de precisão aplicados a situações como reconhecimento de imagem
ou de som e sistemas de recomendação, problemas em que mesmo reconhecer as
características importantes já é uma tarefa muito complexa. (Fonte: https://blog.idwall.co).

Ecossistema de dados - é o ambiente de interação entre redes/sistemas e atores


codependentes que contribuem para a coleta, transferência e uso de dados. Reúne um
conjunto de interfaces e aparatos (leitores e códigos de barra, cookies nos sites da internet,
tags) e sistemas (ERP, sistemas geradores de notais fiscais, sistemas de controle de acesso ou
de estoques) que envolvem relações entre os entes ou fatos que alimentam as bases de dados
e o processo típico do Business Analytics que culmina na tomada de decisão visando a geração
de valor. O ecossistema de dados inclui a forma como os dados são gerados (registro), sua
linguagem, sua forma de armazenamento, tratamento e acesso, a modelagem (Data Mining),
chegando ao uso efetivo dos produtos de dados (veja verbete) pelos tomadores de decisão.

ERP (Enterprise Resources Planning ou Planejamento de Recursos Empresariais) - é um sistema


de informação que interliga todos os dados e processos de uma organização em um único
sistema. A interligação pode ser vista sob a perspectiva funcional e sob a perspectiva sistêmica.
(Fonte: Wikipedia).

ETL - Extract Transform Load (Extrair Transformar Carregar) são ferramentas de software cuja
função é a extração de dados de diversos sistemas, transformação desses dados conforme
regras de negócios e por fim o carregamento dos dados geralmente para um Data Mart e/ou
Data Warehouse, porém nada impede que também seja para enviar os dados para um
determinado sistema da organização. A extração e carregamento são obrigatórios para o
processo, sendo a transformação/limpeza opcional, mas que são boas práticas, tendo em vista
que os dados já foram encaminhados para o sistema de destino. É considerada uma das fases
mais críticas do Data Warehouse e/ou Data Mart. (Fonte: Wikipedia).

Governança de dados – ao nível corporativo refere-se ao conjunto de regras definidas com o


objetivo de assegurar o melhor gerenciamento dos dados. Visa permitir a qualidade de dados
durante todo seu ciclo de vida, seu tratamento e acesso seletivos com vistas a dar suporte
adequado à tomada de decisão. As principais áreas de foco da governança de dados incluem a
definição de critérios de disponibilidade, usabilidade, consistência, integridade e segurança
dos dados em linha com os processos da empresa e definindo claramente responsabilidades e
competências relacionadas a cada setor e/ou colaborador de modo a permitir que, a partir
desses critérios, os dados possam ser amplamente utilizados por toda a organização. A
governança de dados abrange as pessoas, os processos e a tecnologia da informação
necessários para criar um tratamento consistente e adequado dos dados de uma organização
em toda a empresa. Engloba todas as práticas de gerenciamento de dados com a base
necessárias para garantir que os dados sejam gerenciados como um ativo e transformados em
valor para a empresa.

Informação - é a reunião ou o conjunto de dados e conhecimentos organizados, que possam


constituir referências sobre um determinado acontecimento, fato ou fenômeno. Em um
contexto geral, este conjunto de dados tem como objetivo reduzir a incerteza ou aprofundar
os conhecimentos sobre um assunto de interesse a partir do que já se possui. (Fonte:
https://www.significados.com.br/informacao/).

Insight (descoberta) - no contexto do Data Mining, o insight é a descoberta de padrões ou


relações entre dados a partir de sua modelagem ou tratamento estatístico e matemático.
Chegar a insights significa transformar dados (registros) em informações úteis (que reduzem a
incerteza), apoiando, assim, a tomada de decisão no campo pessoal ou empresarial. Os
insights revelam aspectos e padrões de comportamento de agentes e organizações que ainda
não eram conhecidos antes do tratamento dos dados e que se revelam úteis para atingir as
metas e os objetivos estratégicos de pessoas e empresas.

Inteligência artificial (IA) - originalmente a IA era uma disciplina estudada em Ciências da


Computação. Na atualidade, refere-se ao desenvolvimento de softwares e algoritmos que
imitam e reproduzem o comportamento humano especificamente nos processos de tomada
de decisão e realização de algumas tarefas, desde as mais simples até as mais
complexas. Exemplos são os corretores ortográficos dos Apps de mensagem e editores de
texto e os mecanismos de reconhecimento facial usados em portarias e mesmo em aplicativos
do sistema financeiro.

Integridade de dados - refere-se à manutenção e à garantia da precisão e consistência dos


dados durante todo o seu ciclo de vida e é um aspecto crítico para a arquitetura de Analytics,
isto é, implementação e uso de qualquer sistema que armazene, processe ou recupere dados.
O termo às vezes é usado como sinônimo para qualidade de dados, sendo que, nesse contexto,
a validação de dados se torna um pré-requisito para sua integridade. Ao mesmo tempo,
integridade de dados é o oposto da corrupção/adulteração de dados. A intenção geral de
qualquer técnica de integridade de dados é a mesma: garantir que os dados sejam registrados
exatamente como pretendido, rejeitando-se inconsistências, por exemplo (uma pessoa não
pode estar viva e morta ao mesmo tempo ou, se estiver morta, não pode ser funcionário de
uma dada empresa ou estar fazendo compras em dado estabelecimento). Além disso, a
integridade visa garantir que um dado não seja alterado pelo simples fato de ter sido acessado
ou consultado. Em suma: a integridade dos dados visa evitar alterações não intencionais ou
fraudulentas nas informações. Integridade de dados não deve ser confundida com segurança
de dados. Dados podem ser “roubados” sem que sua integridade seja afetada. Ao mesmo
tempo, uma ameaça à integridade é a fraude, que envolve tanto aspectos de segurança
(acesso indevido e com intenção criminosa) quanto de integridade (uma alteração intencional
fraudulenta).

Machine learning (Aprendizagem de máquina) - é o ramo da inteligência artificial (IA) e da


ciência da computação que se concentra no uso de dados e algoritmos para imitar a maneira
como os humanos aprendem, melhorando gradualmente sua precisão. Refere-se à capacidade
de as máquinas aprenderem a partir dos dados com os quais são alimentadas. Por possibilitar
que as máquinas atuem e tomem decisões com base nesses dados, os algoritmos de machine
learning eliminam a necessidade de programá-las explicitamente para realizar uma
determinada tarefa. (Fonte: https://www.ibm.com/br-pt/cloud/learn/machine-learning).

Metadados - (ou Metainformação) são dados sobre outros dados. Um item de um metadado
pode dizer do que se trata aquele dado, geralmente uma informação inteligível por um
computador. Os metadados facilitam o entendimento dos relacionamentos e a utilidade das
informações dos dados. (Fonte: Wikipedia)

OLAP - On-Line Analytical Processing (Processamento Analítico On-Line) é a capacidade para


manipular e analisar um grande volume de dados sob múltiplas perspectivas. As aplicações
OLAP são usadas pelos gestores em qualquer nível da organização para lhes permitir análises
comparativas que facilitem a sua tomada de decisões diárias. (Fonte: Wikipedia).

Requisito(s) - conjunto de elementos necessários à efetivação de projeções, ações ou


arquitetura de BA. Inclui insumos e ativos como equipamentos, softwares e mão de obra, mas
também rotinas, regras de governança e elementos menos tangíveis como cultura digital.

SQL - Structured Query Language (Linguagem de Consulta Estruturada) é uma linguagem


padrão para trabalhar com bancos de dados relacionais. Ela é uma linguagem declarativa e que
não necessita de profundos conhecimentos de programação para que alguém possa começar a
escrever queries, as consultas e pedidos, que trazem resultados de acordo com o que você
está buscando. Seu objetivo é organizar dados de forma ordenada para facilitar a consulta e o
tratamento posterior dos mesmos (Fonte: Wikipedia).

Você também pode gostar