Você está na página 1de 18

Tecnologias

Inserir TítulodeAqui
Inserir
BI e BigTítulo
Data Aqui
Análise de Dados

Responsável pelo Conteúdo:


Prof. Me. Orlando da Silva Junior

Revisão Textual:
Prof.ª Dr.ª Selma Aparecida Cesarin
Análise de Dados

Nesta unidade, trabalharemos os seguintes tópicos:

Fonte: Getty Images


• Introdução;
• Ecossistema de Análise de Dados;
• Visualização de Dados.

Objetivos
• Compreender o Ecossistema da Análise de Dados;
• Estudar os diferentes tipos de Análise de Dados;
• Praticar a visualização de Dados por meio de ferramentas.

Caro Aluno(a)!

Normalmente, com a correria do dia a dia, não nos organizamos e deixamos para o úl-
timo momento o acesso ao estudo, o que implicará o não aprofundamento no material
trabalhado ou, ainda, a perda dos prazos para o lançamento das atividades solicitadas.

Assim, organize seus estudos de maneira que entrem na sua rotina. Por exemplo, você
poderá escolher um dia ao longo da semana ou um determinado horário todos ou alguns
dias e determinar como o seu “momento do estudo”.

No material de cada Unidade, há videoaulas e leituras indicadas, assim como sugestões


de materiais complementares, elementos didáticos que ampliarão sua interpretação e
auxiliarão o pleno entendimento dos temas abordados.

Após o contato com o conteúdo proposto, participe dos debates mediados em fóruns de
discussão, pois estes ajudarão a verificar o quanto você absorveu do conteúdo, além de
propiciar o contato com seus colegas e tutores, o que se apresenta como rico espaço de
troca de ideias e aprendizagem.

Bons Estudos!
UNIDADE
Análise de Dados

Contextualização
Os dados têm papel muito importante para a tomada de decisão. E não apenas nas
Empresas, mas também na nossa vida cotidiana.

Constantemente, estamos decidindo o que comprar a partir das informações que


temos disponíveis sobre os produtos. E quanto mais caro é esse produto, mais informa-
ções precisamos deles.

Na nossa vida, muitas das informações que precisamos para consumir são proveni-
entes dos próprios fornecedores. Em algumas situações, também temos informações da
nossa “Rede Social” da vida real, que é a opinião das pessoas próximas a nós a respeito
do que queremos. E mais: quanto mais próxima essa pessoa é de nós, maior é a nossa
certeza de que aquele produto com opinião positiva é o certo para comprarmos.

As Empresas têm essa desvantagem, porque elas não podem perguntar a seus
concorrentes sobre determinados fornecedores ou funcionários. Isso, no entanto, não
as impede de avaliar previamente a qualidade das “aquisições” que elas querem fazer.

Processos seletivos, leilões, ofertas públicas... tudo isso gera dados para as Empresas
tomarem as melhores decisões.

E você, não acha que aprender a ler e a interpretar os dados é mais importante agora?

Nesta Unidade, nosso foco será o entendimento do Ecossistema de Análise de Dados,


incluindo seus conceitos, fundamentos, ferramentas e aplicações.

6
Introdução
Os dados têm se tornado cada vez mais importantes no mundo atual. No entanto,
nem todos os dados importam. Afinal, “lixo que entra, lixo que sai” também se aplica
a Big Data. Para fazer jus à sua promessa, à sua proposição de valor e à sua capaci-
dade de esclarecer os fatos, os dados têm de ser cuidadosamente criados/identificados,
coletados, integrados, limpos, transformados e adequadamente contextualizados para
embasar decisões com precisão e agilidade (SHARDA; DELEN; TURBAN, 2019).

Vamos nos lembrar de que os dados apresentam muitas e diversas características,


sendo todas elas potencializadas com os Sistemas de informações gerenciais e Big Data:
• Volume: podem vir em muita ou pouca quantidade;
• Variedade: podem ser estruturados, sendo bem organizados para serem proces-
sados pelos computadores, ou sem estrutura alguma, como textos gerados por
seres humanos;
• Velocidade: podem ser apresentados em lotes pequenos e contínuos ou em um
único lote imenso.

Ao longo desta Unidade você vai entender a natureza dos dados no âmbito da inteligência
de negócios e da Análise de Dados, aprender os métodos usados para preparar a Análise de
Dados no mundo real e aplicar técnicas para projetar boas visualizações de dados.

Dados como Ativos Estratégicos


Os dados são a matéria-prima de qualquer Projeto de BI ou de Data Science. Por meio
dos dados, conseguimos produzir informações, conhecimentos e insights para o negócio.
Atualmente, os dados são considerados o bem mais valioso das Organizações.

Conforme o framework TOGAF (JOSEY, 2018), voltado à Arquitetura Corporativa,


os dados devem ser tratados como Ativos da Empresa, que deve garantir que todos os
dados processados sejam avaliados como potencial Ativo Estratégico. Nesse contexto, a
Arquitetura de Dados é a estrutura dos ativos de dados e dos recursos de Gestão de
Dados da Empresa.

Quando falamos que o dado é um Ativo, estamos dizendo que ele tem valor para a cor-
poração e é gerenciado como um bem. Ele é tão precioso quanto qualquer outro Ativo que
a Organização possua, sendo por meio do dado que as decisões mais críticas são tomadas.

Na prática, um dado como Ativo é o resultado da extração do dado bruto em dado


run-the-business, ou seja, em informação de alta qualidade que agrega valor ao negócio.

Qualidade dos Dados


Com a expansão dos Sistemas de Informação e o aumento no volume de dados,
as Empresas deixaram para trás os métodos tradicionais de coleta de dados, como os
questionários, e deram preferência a mecanismos mais modernos, como a Internet e
sensores e Sistemas RFID.

7
7
UNIDADE
Análise de Dados

Esse tipo moderno de coleta permitiu também que a qualidade dos dados melho-
rasse, já que muitos erros humanos passaram a ser evitados.
Portanto, para fins de qualidade, nem todo dado pode estar pronto para ser utilizado.
É necessário que eles obedeçam a alguns padrões de qualidade e usabilidade, cumprindo
exigências e correspondendo a determinadas especificações, antes de serem colocados
à disposição para a Análise de Dados.
Um outro princípio da arquitetura de dados do TOGAF que faz sentido nesse contexto
é que o dado precisa ter uma definição comum a todos da Organização.
Os dados que serão usados no desenvolvimento de aplicações têm uma definição
comum para todos que compartilham deles. Esse vocabulário comum facilita a comuni-
cação e permite um diálogo mais efetivo.
Projetos de Análise e Ciência de Dados que ignoram propostas de adequação de dados
podem acabar gerando respostas erradas para o problema. E essas respostas, muitas
vezes aparentemente boas e criadas sem intenção, podem levar a decisões imprecisas.
Por isso, antes de conduzir um Projeto de Ciência de Dados com fins de modelagem,
recomendamos a elaboração de um projeto que avalie e adeque os dados segundo cri-
térios de qualidade.

Natureza dos Dados


Em Projetos de Análise e Ciência de Dados, não utilizamos todos os dados disponí-
veis na Organização.
Na realidade, selecionamos partes dos dados que precisamos para o Projeto. De modo
geral, chamamos essa porção reduzida de dados de conjunto de dados, que nada mais
é do que uma coleção de fatos obtida do Banco de Dados Organizacional. Em algumas
situações, também podemos agregar dados de fora da Organização, como dados de
Redes Sociais.
Podemos trabalhar com dados não estruturados, que são aqueles advindos de tex-
tos, imagens e sons, e também dados estruturados, que são ideais para Projetos de
Mineração de Dados e Machine Learning. No caso dos dados estruturados, podemos
classificá-los ainda como (SHARDA; DELEN; TURBAN, 2019):
• Dados categóricos: representam as designações de múltiplas classes usadas para
dividir uma variável em grupos específicos. Por exemplo, a variável sexo (mascu-
lino, feminino);
• Dados nominais: contêm medidas de códigos simples atribuídos a objetos na forma
de designações, que em si não são mensurações. Por exemplo, a variável estado civil
(solteiro, casado, divorciado);
• Dados ordinais: contêm códigos atribuídos a objetos ou eventos na forma de de-
signações, que também representam o ranking entre eles. Por exemplo, a variável
altura (baixo, alto);
• Dados numéricos: representam os valores numéricos de variáveis específicas.
Por exemplo, as variáveis temperatura (medida na escala Celsius) e distância (medida
em quilômetros);

8
• Dados intervalares: são variáveis que podem ser medidas em escalas intervalares.
Por exemplo, a variável temperatura, medida na escala Celsius, cujo intervalo é de
0 a 100 graus;
• Dados racionais: incluem variáveis de medidas geralmente encontradas nas Ciências
Físicas e na Engenharia. Por exemplo, a variável carga elétrica (medida em Coulombs).
Na Engenharia, a carga fundamental é o menor valor de carga elétrica que existe na
Natureza, e seu valor corresponde a 1,6 x 10–19 C.
No caso dos dados não estruturados, eles precisam ser convertidos em alguma repre-
sentação categórica ou numérica antes de serem processados pelos métodos de Análise
de Dados, como os algoritmos de mineração de dados.
Os dados também podem ser classificados como estáticos ou dinâmicos, como são as
séries temporais e, ainda, como dados semiestruturados, como o conteúdo de Arqui-
vos XML e JSON.
A Figura 1 sintetiza essa taxonomia e resume a classificação para todas as categorias
de dados abordadas até aqui.

Nominais
Categóricos
Ordinais
Dados Estruturados
Intervalares
Numéricos
Racionais
Dados

Textuais Imagem
Dados Não-Estruturados
Multimídia Áudio

XML Vídeo
Dados Semiestruturados
JSON

Figura 1 – Taxonomia dos dados

Ecossistema de Análise de Dados


Ao trazermos a ideia do Ecossistema de Análise de Dados, nosso propósito aqui
é identificar os diversos ramos da Indústria da Análise de Dados, proporcionar uma
classificação dos diferentes tipos de participantes dessa Indústria e ilustrar os tipos de
oportunidades que você pode aproveitar.
Outra vantagem em trazermos esse Ecossistema é deixar você por dentro das novi-
dades e atualizações do Mercado de Análise de Dados.

Em alguns anos, a qualquer momento, você poderá verificar como os atores foram
reescritos e compará-los com o momento atual.

9
9
UNIDADE
Análise de Dados

A Figura 2 ilustra uma visão do Ecossistema da Análise de Dados. No centro desse


Ecossistema está a Organização usuária de Análise de Dados. Nas estruturas mais externas,
os fornecedores de Tecnologia. E nas mais internas, temos os aceleradores, que trabalham
tanto com fornecedores quanto com usuários de Tecnologias.

Fornecedores de
infraestrutura de
geração de dados

Desenvolvedores de Fornecedores de
softwares focados Analistas e infraestrutura de
em análise de dados Reguladores de gerenciamento de dados
influenciadores do
Políticas de atuação
mercado

Organização
Instituições
Desenvolvedores
acadêmicas e
de aplicativos
Prestadores de agência de certificação Fornecedores de
serviços de dados data warehouse

Fornecedores de
middleware

Figura 2 – Ecossistema de Análise de Dados


Chamamos de Ecossistema porque todos os 11 atores estão intimamente conectados,
fazendo com que cresçam e morram juntos.
No núcleo desse Ecossistema, temos o elemento mais importante, que é a organização
usuária de Análise de Dados, responsável pela motivação de todos os demais elementos.
Dos elementos mais internos e próximos ao núcleo, temos:
• Órgãos reguladores de Políticas de atuação;
• Analistas e influenciadores da Indústria da Análise de Dados;
• Desenvolvedores de aplicações;
• Instituições Acadêmicas e Agências de Certificação.
E entre os elementos mais externos, encontramos, com maior especificidade:
• Fornecedores de infraestrutura de geração de dados;
• Fornecedores de infraestrutura de gerenciamento de dados;
• Fornecedores de data warehouse;
• Fornecedores de middleware;
• Prestadores de serviços de dados;
• Desenvolvedores de software focados em Análise de Dados.
O entendimento desse Ecossistema nos permite observar que as organizações usuá-
rias atuam como um agrupamento-chave no Ecossistema de Análise de Dados, forman-
do e concentrando talentos.

Assim, elas incluem carreiras capazes de levar profissionais de Análise de Dados a


cargos de gerência, como Gerente de Projetos, Gerente Sênior e Supervisor.

10
Análise de Dados
Nos últimos anos, temos substituído o termo Business Intelligence, que você já conhece,
pelo termo Data Analytics, ou “Análise de Dados”.
Embora muitos estudiosos e especialistas usem definições ligeiramente diferentes, a
Análise de Dados pode ser vista como o processo de desenvolvimento de decisões ou
recomendações práticas para ações baseadas em insights gerados por dados históricos
(SHARDA; DELEN; TURBAN, 2019).
Na prática, a Análise de Dados é a combinação da Ciência da Computação, de Técni-
cas de Administração e da Estatística para solucionar problemas de negócio.
Podemos também compreender a Análise de Dados observando-a em diferentes níveis
de Maturidade Analítica.
A Figura 3 apresenta os 8 níveis descritos pelo SAS Institute, uma das maiores Em-
presas de Analytics, para descrever a Maturidade Analítica de uma Empresa conforme
a Análise de Dados.
Segundo a Organização, esses níveis podem ser separados em duas partes: na pri-
meira e mais inicial, os níveis descrevem uma relação de descrição, exploração e/ou
reporte dos dados analisados.
Na segunda parte, mais final, os níveis chegam a envolver um detalhamento estatís-
tico com finalidade de melhor compreensão dos padrões nos dados.

Otimização
Modelagem preditiva
Previsão

Análise estatística

Alertas
OLAP

Relatórios ad hoc

Relatórios-padrão

Figura 3 – Níveis de maturidade analítica segundo o SAS Institute


Em outra visão, dessa vez sugerida pela Informs Analytics Society, a Análise de Dados
pode ser identificada em 3 diferentes níveis: Análise Descritiva, Análise Preditiva e Aná-
lise Prescritiva.

Análise Descritiva
A Análise Descritiva (ou de extração de relatórios) é um tipo de Análise de Dados
que visa a fornecer informações sobre o que está acontecendo na Organização.
Ela nos ajuda a entender tendências e causas subjacentes desses acontecimentos.
Quando consolidamos fontes de dados, verificamos a disponibilidade de todos os dados
relevantes, de modo que permita a extração e a análise apropriadas dos relatórios.

11
11
UNIDADE
Análise de Dados

Na maior parte das vezes, a infraestrutura de dados faz parte dos DWs. Mais recente-
mente, uma parte desses dados também tem se concentrando nos Data Lakes (Lago de
Dados), que visam a armazenar os dados em seu formato bruto.
Independentemente do repositório situado, podemos desenvolver relatórios, consultas,
alertas e tendências usando ferramentas e técnicas de extração de relatórios.

Análise Preditiva
Na Análise Preditiva, queremos determinar o que é mais provável de acontecer
no futuro.
Para isso, utilizamos Técnicas Estatísticas e de Mineração de Dados. Atualmente, a
maior parte do trabalho dos cientistas de dados é modelar problemas de Análise Preditiva
para descobrir oportunidades futuras.
Provost e Fawcett (2016) descrevem uma série de tarefas de Análise Preditiva que
podem ser exploradas pelas Empresas, como classificação e regressão de dados.
Das aplicações de Análise Preditiva mais comuns que podemos encontrar, citamos
algumas que podem ser facilmente identificadas por você:
• Previsão se um cliente vai abandonar a Empresa pelo concorrente;
• Previsão do que o cliente vai comprar;
• Previsão do nível de sucesso de um produto, como um filme em cartaz;
• Segmentação de clientes em diferentes grupos, a fim de lhes oferecer promo-
ções diferentes;
• Recomendação de produtos relacionados à compra.

Análise Prescritiva
Na Análise Prescritiva, o objetivo da Análise de Dados é reconhecer o que está
acontecendo e o que deve vir a acontecer.
Essa ideia quase futurística tem o propósito de melhorar a qualidade das decisões
tomadas, garantindo o melhor desempenho possível.
Apesar de essa análise parecer irreal e inexistente, já que ela exige ainda mais detalhes
dos dados para fazer previsões, ela não é tão recente.
Tradicionalmente, a análise prescritiva tem sido estudada e aplicada a partir de técnicas
de pesquisa operacional, visando à otimização de desempenho de Sistemas.
Nesse tipo de Análise, a meta é alcançar uma decisão ou uma recomendação para uma
ação específica. As recomendações podem assumir a forma de uma decisão pontual do
tipo sim/não a um problema, uma quantidade específica ou um conjunto completo de pla-
nos de produção. A decisão pode ser apresentada a um ser humano tomador de decisões
ou a um Sistema automatizado de regras decisórias (SHARDA; DELEN; TURBAN, 2019).

Um exemplo nessa categoria é o Sistema Automático de Precificação de passagens


aéreas das Companhias de Viagens.

12
Análise de Big Data
A Análise de Big Data é uma categoria especial de Análise de Dados destinada à
aplicação de qualquer uma das análises anteriores em conjuntos de dados muito grandes
e diversos que possuem dados estruturados, semiestruturados e não estruturados, de
diferentes fontes e de tamanhos, mas gigantescos.
A vantagem desse tipo de análise é tomar decisões melhores e mais rapidamente,
usando novos tipos de dados.
De todo modo, não podemos nos esquecer que qualquer tipo de Análise de Dados
vai exigir de nós algumas habilidades de interpretação.
Compreender os dados é fundamental para que nossos projetos de análise e ciência
de dados apresentem a informação correta e no exato nível para a tomada de decisão.
E uma forma de aprimorarmos essas habilidades e o nosso entendimento do negócio
é por meio de ferramentas que projetem os dados em esquemas de representação que
traduzam a complexidade do negócio em informações, conhecimento e insights.

Visualização de Dados
A visualização de dados (ou visualização de informações) corresponde ao uso de
estruturas de representação visuais para explorar, dar sentido e comunicar dados.
Na prática, a visualização de dados está intimamente relacionada a Infográficos, à
exploração visual de informações, à visualização científica e Gráficos Estatísticos.

Gráficos e Diagramas
Em essência, boa parte da visualização de dados concentra-se em mecanismos visuais
como Gráficos e Diagramas.
Sabemos da existência de várias categorias, dos mais simples aos mais complexos.
A Figura 4 resume os principais tipos de Gráficos:

Básicos Especializados

Gráfico de Linhas Histograma


Diagrama de Gantt
Gráfico de Barras Diagrama de Pert
Mapa Geográfico
Gráfico de Pizza (Sectograma)
Gráfico de Marcadores (Bullet)
Gráfico e Dispersão Mapa de Calor
Tabela realçada
Diagrama de Bolhas Tree map

Figura 4 – Principais tipos de Diagramas e Gráficos

13
13
UNIDADE
Análise de Dados

Qual Representação Gráfica utilizar?

Não existe um único Diagrama ou Gráfico melhor que os demais. Diferentes Represen-
tações Gráficas podem ser usadas para a mesma tarefa de visualização.

Uma regra prática é escolher aquele mais simples dentre as alternativas para facilitar
a compreensão do público-alvo.

Dashboards
Os dashboards fornecem exibições visuais com informações importantes consolidadas
e organizadas em uma única apresentação visual.
Esse formato é suporte importante nas Organizações porque permite que as infor-
mações possam ser digeridas num simples relance, além de serem facilmente explora-
das e aprofundadas.
A maior parte dos Sistemas de Análise de Negócios focados em gestão de desempe-
nho empresarial possui componentes para a construção de dashboards informativos.

Figura 5 – Dashboard Coronavírus Brasil


Fonte: covid.saude.gov

Um exemplo de dashboard informativo é o apresentado pelo Ministério da Saúde na


Figura 5.
Observe que o painel destaca as principais informações a respeito do novo Coronavírus
no Brasil, atualizadas até 03/02/2021, às 19h40.
Ainda que as informações reais sobre os casos possam apresentar divergências no
painel, devemos destacar que a data de atualização é um dos elementos principais de
um dashboard informativo, pois é a partir da sua notificação que gestores e executivos
poderão tomar melhores decisões no tempo.

14
Ferramentas
Atualmente, existem muitas ferramentas de Análise de Dados, sendo o Microsoft
Excel a mais popular delas.

Embora o Excel seja uma ferramenta prática e acessível, ela não é capaz de lidar com
grandes volumes de dados, além de sofrer com imprecisões de cálculos.

Entre os produtos especializados em visualização, atualmente, os favoritos são o


Microsoft Power BI – cujo propósito é oferecer visualizações interativas e recursos de
BI com uma interface simples – e o Tableau Desktop, este último, desenvolvido e licen-
ciado pela Tableau Software, líder mundial no desenvolvimento de softwares para visu-
alização de dados.

As plataformas oferecidas pela Tableau interagem com Bancos de Dados relacio-


nais, analíticos, computação em nuvem e planilhas para gerar gráficos e outros elemen-
tos gráficos.

Além dos mais populares e de uso geral, existem também aqueles específicos para um
Mercado ou domínio particular, como Plataformas de Análise e visualização de Dados
Geográficos ou focados em dados médicos.

Existem, ainda, aqueles gratuitos e/ou open source, como o Gephi, que é um software
gratuito e de Código Aberto focado em Redes Complexas.

Quem tem dados, tem histórias. Seja diagnosticando os motivos para defeitos de fabrica-
ção, vendendo uma nova ideia de forma a capturar a imaginação de seu público-alvo ou
informando colegas sobre um determinado programa de melhoria de atendimento aos
clientes. Quem nunca passou por apresentações com muitos slides e descobriu que os es-
pectadores não estão entendendo nada porque estão sobrecarregados de informações?
Comece a conquistar sua Equipe Executiva contando-lhe uma história.

Nesta Unidade, estudamos os tipos de Análise de Dados e compreendemos o Ecossistema


geral de Análise de Dados.
Para entender melhor como a Teoria Acadêmica se alinha ao Mercado, praticamos a visuali-
zação de dados utilizando uma das ferramentas mais populares entre as grandes Empresas.

15
15
UNIDADE
Análise de Dados

Material Complementar
Indicações para saber mais sobre os assuntos abordados nesta Unidade:

Vídeos
Curso completo de Power BI
https://bit.ly/3q9dFGV
MC01 – Introdução ao Tableau Public
https://youtu.be/1M_KLhWKUaY

Leitura
8 Levels of Analytics – SAS
https://bit.ly/35mH5HV
Blog – StatPop – Popularização da Estatística
https://bit.ly/3gFbAht

16
Referências
JOSEY, A. An Introduction to the TOGAF Standard, Version 9.2. W182, The Open
Group, UK, Reading, 2018.

PROVOST, F.; FAWCETT, T. Data science para negócios. Tradução de Marina Boscatto.
Rio de Janeiro: Alta Books, 2016.

SHARDA, R.; DELEN, D.; TURBAN, E. Business Intelligence e Análise de Dados


para Gestão do Negócio. 4.ed. Porto Alegre: Bookman, 2019.

SIVARAJAH, U. et al. Critical analysis of Big Data challenges and analytical methods.
Journal of Business Research, v. 70, p. 263-286, 2017.

17
17

Você também pode gostar