Você está na página 1de 53

DADOS

Vivemos em uma era cada vez mais conectada e

informatizada, em que diariamente são gerados centenas

de bilhões de dados por pessoas e máquinas ao redor do

mundo. Esta época, também conhecida como a “era da

informação”, demonstra claramente que os dados têm o

poder de movimentar e direcionar a humanidade por

caminhos outrora desconhecidos. Por conseguinte, os

detentores de todo este fluxo de dados os convertem em

bases de conhecimento e, por sua vez, passam a ter o poder

de decisão nas mãos. É sabido também que grandes

conglomerados de empresas investem anualmente bilhões

de dólares para garantir a exclusividade sobre a posse dos

dados gerados por consumidores e potenciais clientes em

todo o mundo. E é neste contexto que entra o conceito de

Ciência de Dados, bem como suas técnicas de visualização.

Para definirmos ou formarmos um entendimento conciso e

completo sobre o que é a visualização de dados, precisamos

primeiro compreender o que de fato é um dado e qual é seu


impacto e importância para a humanidade ao longo das

gerações.

De maneira conceitual, pode-se afirmar que dados são

conjuntos de ocorrências, valores ou informações que, ao

serem combinados, podem gerar incontáveis bases de

conhecimentos, que propiciam aos seus detentores grandes

vantagens, de ganhos financeiros a benefícios imateriais.

É importante mencionar, entretanto, que dado e

informação são coisas distintas e, portanto, devem ser

compreendidos de maneiras diferentes. Vejamos a

explicação de ambos com base em exemplos:


Em outras palavras, dado é um fato ou ocorrência qualquer

(se analisado de forma isolada). Informação, por sua vez, é

a inserção deste dado dentro de um contexto, dando

sentido e coerência.

A partir daí, desenvolve-se a importância dos dados nas

mais diversas áreas, lugares e pessoas. Sistemas

computacionais e pessoas trabalham constantemente

processando-os e interagindo com eles o tempo todo, com

o objetivo de entendê-los para transformá-los em

informações e bases de conhecimento.

DADOS ESTRUTURADOS E NÃO


ESTRUTURADOS

De certo modo, os dados precisam ser categorizados para serem


compreendidos. Eles podem, portanto, ser divididos em duas vertentes
básicas: dados estruturados e não estruturados, conforme o
detalhamento a seguir.

BIG DATA

Nas áreas de Data Science e Tecnologia da Informação, Big Data é uma


terminologia utilizada para a representação de grandes volumes de dados
armazenados e manipulados (processados) com alta velocidade e
performance. O conceito de Big Data está baseado essencialmente em
5Vs (Volume, Velocidade, Variedade, Veracidade e Valor), conforme
detalhado no Quadro 1.
A quantidade massiva de dados gerada diariamente e a forma

como eles são tratados e processados é o que torna o Big Data tão

importante. O principal ponto do Big Data, e que talvez seja seu

maior destaque, é a entrega de valor para as organizações. A

quantidade enorme de dados e a velocidade no processamento faz

com que cada vez mais empresas adotem o Big Data como

estratégia em seus negócios.

Os dados que o formam são oriundos de diversas fontes. Por isso,

são denominados como não estruturados, pois não seguem um

padrão e/ou não são provenientes de fontes de dados tradicionais,


conforme mencionado anteriormente. Deste modo, esses dados

não podem ser armazenados em Sistemas Gerenciadores de

Bancos de Dados Relacionais, pois estes sistemas possuem uma

estrutura baseada em tabelas (colunas e linhas).

Os dados em Big Data possuem tipos básicos, tais como:

Social data

Estes dados fazem parte de informações coletadas em redes sociais

ou em ambientes com interações entre usuários. Em suma,

costumam estar relacionados com informações demográficas.

Representam ainda dados de interações e condutas sociais. Neste

sentido, podemos citar como exemplos os tipos de “likes” que um

grupo de pessoas recebe, tipos de comentários em determinadas

publicações, o que mais se pesquisa no Google ou em sites de filmes

etc. Seu uso é mais comum em campanhas de marketing, que

fornecem serviços ou produtos personalizados ao público;

Enterpser_educacional data

Os dados empresariais costumam compreender informações sobre

funcionários de uma organização e são gerados por setores de

Recursos Humanos, Vendas, Finanças, Produção, Logística, dentre

outros. Estes dados podem ser utilizados para organizar os

processos dentro de uma empresa, visando a lucros ou reduzir

custos;

Personal data

Essa categoria compreende a Internet das Coisas (Internet of Things

ou IoT), isto é, dados gerados por câmeras conectadas à rede

mundial de computadores, relógios inteligentes, geladeiras

conectadas à internet, SmarTVs, aplicativos de trânsito como o Waze

etc. Estes dispositivos e aplicações guardam diariamente dados e

perfis de consumo das pessoas, para que posteriormente, possam

ser utilizados na extração de conhecimento.

VISUALIZAÇÃO DE DADOS

Após o cientista de dados (especialista analítico que atua na

extração e compreensão dos dados) coletar, armazenar e

transformar os dados, inicia-se o momento de mostrar os

resultados e “contar a história” que os dados se propõem a

informar. Esta etapa ou processo, se dá através da visualização de

dados. Vamos entender qual é o seu papel no Big Data.


A visualização de dados, também conhecida como Data

Visualization ou simplesmente DataViz, faz parte da Ciência de

Dados e compreende os mecanismos para a representação gráfica

de informações. Assim, por meio de elementos visuais – sejam

gráficos, diagramas ou imagens –, é possível entender o

comportamento dos dados e, a partir de então, prever tendências,

detectar padrões, encontrar vínculos com outros dados ou projetar

metas. A visualização, portanto, é amplamente utilizada para a

representação de dados científicos, estatísticos, geográficos ou em

linhas do tempo.

A principal característica da visualização de dados é prover às

pessoas compreensão sobre o real significado dos dados,

comunicando, através de gráficos ou recursos visuais diversos, as

informações decorrentes.

Ao manipular dados, talvez não percebamos de imediato que

podem existir inúmeras informações importantes que, em um

primeiro momento, encontram-se ocultas aos olhos de quem

analisa. Por outro lado, ao inserir um recurso visual para

representá-los, é possível perceber padrões, caminhos e conexões


que não seriam apreendidos em um recurso apenas textual, como

uma tabela ou planilha eletrônica simples.

Você consegue imaginar como seria interpretar milhões de linhas

de dados sem auxílio de recursos visuais, como gráficos ou

dashboards, para a tradução destas informações? Certamente seria

uma tarefa humanamente impossível ou extremamente árdua e

custosa. A visualização de dados atua exatamente neste processo,

possibilitando a interpretação completa de grandes quantidades de

dados, incluindo das informações que, sem auxílio de recursos

visuais, estavam “ocultas”.

Ferramentas como dashboards e gráficos são, portanto,

responsáveis por revelar importantes informações e conexões

sobre o objeto de análise, dando profundidade à interpretação dos


dados. Podemos inclusive afirmar que o recurso visual gráfico,

assim como os textos, define uma forma de linguagem cuja função

é comunicar, informar e explicar ao espectador o que os dados

representam.

A definição que dá base à Ciência de Dados diz que sua função

principal é revelar significado e valor a partir dos dados brutos.

Nas palavras do autor Alexandre Lopes Machado no livro

Administração do Big Data, de 2017 (p. 16),

a ciência de dados agrega os impactos, os problemas

decorrentes do veloz e exponencial crescimento dos

dados e também as técnicas, as metodologias e as

ferramentas relacionadas à manipulação desses dados.

Partindo deste princípio, podemos entender que a Ciência de

Dados é altamente relevante no processo de tomada de decisões,

visto que engloba inúmeros mecanismos para manipulação dos

dados. Contudo, vale lembrar que encontrar os insights certos, que

podem fazer diferença na tomada de decisão, não proverá bons


resultados se o cientista de dados não souber como comunicar

suas descobertas para o público a quem se destina a informação.

O cientista de dados precisa projetar o modo como deseja

comunicar visualmente o significado dos dados aos interlocutores.

Além disso, precisa conhecer em detalhes o perfil de seu público-

alvo e o propósito pelo qual está projetando a visualização de

dados. Isto implicará na construção de visualizações coerentes

com as necessidades dos tomadores de decisão. Por conseguinte,

precisa conhecer também os diversos tipos de recursos visuais

disponíveis, assim como os principais benefícios e possíveis

desvantagens no uso de cada um.

A exibição de dados organizados em tabelas e gráficos gera muito

mais benefícios do que se fossem demonstrados por meio de

relatórios, devido à forma como o cérebro humano interpreta e

processa as informações que lhe são apresentadas. Vejamos os

principais benefícios gerados:

Absorção de informação

O usuário consegue receber grandes quantidades de informações

quando representadas em gráficos, e elas também são mais


rapidamente compreendidas, ou seja, os tomadores de decisões

podem perceber conexões entre os diversos conjuntos de dados,

podendo ter novas maneiras de interpretá-los;

Visualização de padrões de negócios


A visualização de dados permite que sejam identificados de maneira

eficaz o desempenho do negócio e as condições operacionais em que

ele se encontra. Se houver uma queda significativa na satisfação dos

clientes, é possível identificar a raiz do problema e planejar uma

reformulação na estrutura organizacional da empresa;

Identificação de tendências

O volume de dados que as empresas são capazes de reunir sobre

clientes e condições de mercado pode fornecer aos gestores insights

sobre receitas e novas oportunidades de negócio, presumindo que se

possa encontrar novas oportunidades a partir deles. Os tomadores de

decisão são capazes de identificar e compreender com agilidade

mudanças que ocorrem nos comportamentos dos clientes;

Manipulação e interação de dados


As ferramentas de visualização de dados permitem que os usuários

interajam com eles. Ao usar a visualização em tempo real, juntamente

com uma análise preditiva, o gestor pode observar os números de

vendas atuais, por exemplo;


Conversão em linguagem de negócio

A visualização de dados permite que uma “história seja contada” por

meio de uma linguagem de fácil compreensão, o que amplia a visão

sobre os dados.

COMPREENDENDO SUA AUDIÊNCIA


Uma das peculiaridades do cientista de dados que pode ser

classificada como de fundamental importância é

compreender e conhecer bem sua audiência, para

conseguir projetar uma visualização de dados adequada às

necessidades do público-alvo. Pode-se afirmar, por

conseguinte, que é extremamente importante levantar as

características de cada tipo de público.

Após a identificação do tipo de audiência e suas

necessidades, é importante fazer os dados “contarem a

história” por trás dos números. Ou seja, se o público alvo

for menos técnico, o cientista de dados deve projetar uma

visualização coerente às necessidades deste perfil.


Na narrativa de dados, este tipo de público depende

exclusivamente do cientista de dados para compreender a

mensagem que os dados querem informar. Sendo assim, a

visualização deve ser completamente focada para que os

membros do grupo consigam extrair os significados dos

dados com pouco esforço. Estas representações visuais

têm um resultado mais assertivo quando apresentadas sob

a forma de imagens estáticas, porém, algumas camadas do

público podem preferir visualizá-los através de

dashboards ou gráficos dinâmicos e interativos, a fim de

manusear melhor as informações.

Se o público-alvo for mais técnico, as visualizações de dados

podem ser ainda melhor exploradas e projetadas de maneira mais

ampla e com uma gama maior de informações. Neste tipo de

visualização, a exposição dos dados é mais contextual e menos

conclusiva, ou seja, os usuários têm maior autonomia para

explorá-los, observá-los e definir suas próprias conclusões. Essas

representações geralmente são feitas em dashboards interativas e

com gráficos dinâmicos.

Além disso, é muito provável que o cientista de dados

tenha de projetar uma visualização de dados para um


público completamente não-técnico. Neste caso, o cenário

ideal é trabalhar com os sentidos e sentimentos desta

audiência, provocando sensações e reações que podem

atrair a atenção das pessoas. Esta técnica de visualização

não possui narrativa e não permite que o público-alvo

interprete ou tire suas próprias conclusões sobre os dados.

O objetivo é apenas comunicar os fatos, porém, de forma

impactante.

É importante mencionar, contudo, que o cientista de

dados deve agir sempre de maneira ética, não adulterando

os dados ou a mensagem para transmitir algo que o

público queira ouvir. Um público não-técnico muito

provavelmente não será capaz de identificar erros e

inconsistências na visualização de dados e dependem de

um cientista que projete representações fidedignas e

precisas, o que amplia o nível de responsabilidade ética do

cientista de dados perante seu público.


Storytelling
Talvez você já tenha ouvido falar em storytelling, termo

em inglês amplamente utilizado para representar a

atividade de se contar histórias de maneira altamente

persuasiva e poderosa, ganhando a empatia de quem ouve,

com a vantagem de não ser invasivo e respeitando o

espaço do público ouvinte. Muitas pessoas enxergam esta

técnica como uma arte de se contar histórias envolventes e

com alto grau de impacto. Storytelling não trabalha


apenas como uma simples narrativa, mas também gera

relevância ao tema abordado, utilizando recursos

audiovisuais em conjunto com palavras que podem

aproximar ainda mais uma marca de seu consumidor

final.

Este método está presente em muitos lugares,

perpassando diversas áreas, como marketing,

comunicação, vendas e outras. Em campanhas de

marketing, por exemplo, as empresas que utilizam

storytelling podem viabilizar a conexão da marca com a

mensagem ou ainda passar a imagem de que produz e

entrega serviços de qualidade aos clientes. Utilizar o

storytelling em propagandas possibilita que a empresa se

destaque em relação à concorrência. Podemos dizer que,

ao contar histórias, temos a oportunidade de atrair e

conquistar ouvintes. Assim, é recomendado que

conheçamos em detalhes quem é nosso público-alvo, para

que a mensagem seja melhor direcionada e proporcione

maior assertividade e impacto.


Para que uma história seja cativante o suficiente para prender a

atenção de uma audiência, é de vital importância que alguns itens

(fatores) estejam bem organizados e alinhados. São eles:

repertório e palavras adequadas; roteiro engenhoso e instigante;

figuras que representem as pretensões e anseios do público-alvo

da mensagem; apoio visual, como imagens, vídeos e ilustrações,

completando assim toda uma estrutura dialógica e visual capaz de

prender a atenção total de seus interlocutores.

Storytelling é a maneira pela qual a humanidade passa

conhecimentos de geração para geração. Em outras

palavras, a visão de mundo que temos, em conjunto com

nossas atitudes e valores, nada mais é do que uma coleção

de histórias aprendidas, processadas e interpretadas ao

longo da nossa vida. Podemos dizer ainda que uma

história bem elaborada cria a sensação de pertencimento

por parte de quem a ouve, pois tem a capacidade de

envolver completamente o ouvinte e colocá-lo na posição

de um personagem importante da história.


Um dos grandes desafios para o cientista de dados é

promover um entendimento completo da mensagem que

os dados querem transmitir. Portanto, ele deve perceber

que, em muitos casos, os dados querem passar mensagens

diferentes para públicos também distintos.

Com isso, o cientista de dados pode e deve utilizar todos os

recursos audiovisuais à sua disposição para preparar uma

boa história, porém, deve tomar muito cuidado ao

selecionar quais recursos se adequam melhor ao seu

público: uma escolha errada pode não gerar o impacto

necessário que a informação deveria causar.

Além disso, o storytelling é uma técnica que os analistas e cientistas de

dados precisam dominar bem ao exemplificar e demonstrar linhas de

pensamento a seus pares, que podem possuir conhecimento técnico ou

não, referente ao assunto abordado.

Neste caso, faz-se necessária uma boa habilidade de

comunicação, pois o objetivo principal é explicar ao

ouvinte de maneira clara o que foi feito, para se chegar a

determinados resultados ou ainda “vender” uma linha de

pensamento, gerando melhores resultados para uma


empresa. Ou seja, o storytelling impacta diretamente na

tomada de decisões.

Vale lembrar que a aplicação da técnica de storytelling está

acima da simples interpretação dos dados, ou seja, ela visa

a contar algo por meio dos números. Como exemplo, se

observarmos os dados coletados de quaisquer pesquisas de

censo realizadas no Brasil sobre índices de longevidade da

população – ou natalidade e mortalidade –,

perceberíamos rapidamente que, analisados de forma

isolada, os dados podem não significar muita coisa, mas

quando organizados em uma história, podem ser

traduzidos em conclusões como: a população brasileira

está vivendo mais tempo ou as famílias estão optando por

gerar menos filhos.

Em outras palavras, através do storytelling, podemos

explorar minuciosamente os resultados e possibilidades,

indo muito além do que os números podem demonstrar

por si só. Ter a habilidade de projetar a visualização de

dados e contar a história sobre o que eles representam e


querem informar é o ponto crucial para direcionar o

público a tomar decisões com alta segurança e precisão.

Ou seja, se pensarmos em como o usuário final irá utilizar ou

interpretar a informação já processada, poderemos prever como a

história deve ser elaborada para atingir seu anseio. Isto não

significa distorcer o contexto dos dados para atingir o que o

usuário quer ouvir, mas demonstrar todo o conteúdo da

mensagem que os dados se propõem a informar de maneira clara e

concisa, em consonância com o perfil do público-alvo.

Portanto, a visualização de dados não deve ser focada única e

exclusivamente na exibição de gráficos ou ilustrações. Você, na

condição de cientista de dados, deve aprender a projetar

visualizações além da criação de gráficos. Elas devem estar

conectadas com uma história, delimitadas dentro de um contexto,

exibindo as correlações entre os respectivos dados. Os recursos

visuais podem e devem ser combinados com histórias que os

complementem, dando sentido completo aos dados analisados.

Visualização de dados não se trata apenas de cuidado com a

estética, mas deve estar conectado com as regras do negócio. O

storyteller (contador de histórias) de dados, logo, não deve


projetar a história apenas com dados estatísticos e científicos, mas

também entender o comportamento humano, para ser mais

assertivo no repasse das informações.

Por fim, conforme já mencionado, sabemos que a ciência de dados

é extremamente importante para inúmeras áreas, mas se a

quantidade gigantesca de dados disponíveis não for analisada de

maneira rápida e com fácil assimilação, de nada adiantam para as

tomadas de decisão do negócio.

DEFININDO O PROPÓSITO DA

VISUALIZAÇÃO DE DADOS

O mercado de Data Science está em constante expansão, e muitas

ferramentas estão sendo incorporadas a projetos de visualização

de dados. Por este motivo, novas habilidades se fazem necessárias

para lidar com estas demandas, visando à criação de um propósito

para o que está sendo exibido.


Muitos cientistas de dados iniciantes entram em constantes

conflitos por não saberem quais ferramentas escolher para cada

tipo de projeto de visualização. Entretanto, o real problema não

está na escolha da ferramenta, mas na definição do propósito do

projeto.

Geralmente, a maioria das ferramentas de visualização busca

garantir a qualidade das informações que estão sendo entregues.

Com isso, o foco deve ser na definição de qual mensagem o

cientista de dados quer passar aos seus ouvintes. Uma vez definido

o propósito, os dados poderão ser processados por quaisquer

fontes e ferramentas, incluindo àquelas ferramentas de analytics,

que exibem dados em tempo real. Concomitante a isso, as técnicas

de storytelling devem colaborar para que o raciocínio seja claro

mediante os dados analisados.

Em suma, pode-se afirmar que a visualização de dados tem como

propósito um direcionamento estratégico à tomada de decisões,

ou seja, ao projetar uma visualização, o foco deve estar em como

comunicar os dados ao público, de modo a facilitar as tomadas de


decisão, e não somente informar quais ferramentas de software

utilizar.

VISUALIZAÇÃO INTERATIVA DE

DADOS
Agora que conhecemos sobre storytelling e como definir o

propósito da visualização de dados, vamos atuar sob o ponto de

vista da visualização interativa de dados.

O mecanismo de visualização de dados se configura pela

codificação dos dados em símbolos, imagens e gráficos, ou seja,

em representações visuais, a fim de aumentar a compreensão

humana em relação ao objeto de estudo analisado. Neste sentido, a

vertente do Data Science denominada Visualização Interativa de

Dados (VID) é um conjunto de métodos ou técnicas oriundas da

interação humana com os computadores, que viabiliza ao analista

modificar os elementos em busca de outras conclusões sobre os

dados, conduzindo à realização de modificações na respectiva

reprodução visual.
É factível também que a visualização interativa de dados permite

melhorias na avaliação qualitativa dos dados e, portanto, da

mensagem assimilada e interpretada pelo analista, tendo em vista

que ele pode colaborar diretamente para a composição de sua ideia

sobre um cenário.

Dada a importância e a complexidade do Big Data, inúmeros

métodos de visualização interativa de dados estão disponíveis no

mercado e são adotados como recursos eficazes para a correta

análise e reconhecimento de modelos em grupos de dados

complexos. Estes procedimentos são apontados como

instrumentos fundamentais neste contexto, pois utilizam o poder

do sistema visual humano e ferramentas gráficas para viabilizar a


sondagem de dados complexos e a concepção e avaliações de

possibilidades de modo interativo, segundo Tamara Munzner,

autora do livro Visualization analysis and design, publicado em 2014.

Design Thinking para

cientista de dados
Antes de entendermos o que é o Design Thinking,

precisamos ter em mente o significado de design em um

contexto mais universal. Normalmente, o termo é

associado a aspectos visuais de determinados produtos,

layouts de revistas, websites ou marcas. A verdade é que,

independentemente de estar conectado ao significado de

“desenho” ou representar “estilos de desenho”, o termo

vai muito além, dando a ideia de estruturar um modo de

pensar a fim de projetar soluções, ou seja, design está

mais ligado ao contexto de desenvolvimento de projetos e

soluções do que aos estilos de desenhos ou ao modo de

desenhar.
Quando falamos e/ou pensamos na questão visual, o

design é fundamental, pois a compreensão de seus quatro

princípios básicos possibilita projetar e planejar

essencialmente qualquer coisa. Os princípios são:

contraste, repetição, alinhamento e proximidade.

● Contraste: princípio do design responsável por dar

relevância ao conteúdo visual, facilitando a

identificação do que é mais importante com um

simples olhar. Ou seja, com o contraste, é possível

colocar em destaque determinadas áreas de um

layout web, de um produto, gráfico, logotipo, dentre

outros exemplos. Esta relevância pode ser feita com o

uso de fontes negritadas, cores, imagens etc. O ideal

é colocar em evidência o que é importante e precisa

ser destacado dentro do layout.

Na Figura 1, é possível observar um balão amarelo

contrastando com alguns balões azuis:


Repetição: princípio responsável por dar consistência aos layouts

produzidos por meio da repetição de elementos. A ideia da

repetição faz com que a pessoa que está observando o layout siga

um fluxo de leitura, dando sentido de conexão entre os elementos,

conforme podemos observar na Figura 2.


Na Figura 2, portanto, vemos alguns padrões de repetição que

facilitam a compreensão de quem está observando. Por exemplo:

• Todos os títulos estão em azul;

• Todos os links estão em verde;

• As descrições estão em cinza.

Alinhamento: princípio do design responsável por organizar os

elementos visuais de modo a facilitar a compreensão dos

espectadores. O princípio do alinhamento, além de organizar o

fluxo dos elementos, possibilita uma organização estética do

layout. No exemplo da Figura 3, é possível observar janelas de um

prédio devidamente alinhadas.


Proximidade: princípio do design responsável pela formação de

grupos de elementos visuais que se relacionam e estão próximos.

Veja, o exemplo da Figura 4, na qual se observa grupos de círculos

vermelhos próximos, dando coerência e sentido à representação

visual.

Portanto, se os princípios do design forem adotados

corretamente na formação de layouts, o entendimento e

interpretação das formas por parte dos espectadores será

mais facilitado.

É importante ressaltar que a visualização de dados é

apenas uma ferramenta de suporte capaz de

complementar a habilidade do cientista de dados de contar

uma história por meio dos dados. Isto significa que a


escolha do melhor design em visualização de dados está

além das questões técnicas e visuais. Os fatores decisivos

nesta escolha estão centrados no ser humano, que é muito

mais relevante que qualquer gráfico ou ilustração.

Quando pensamos em design em seu sentido mais amplo,

ou em representações que vão além das formas e

ilustrações, estamos na verdade falando de Design

Thinking, uma abordagem adaptada para o uso em

empresas e organizações e que pode ser definido como

uma maneira de se pensar sobre problemas e projetar

soluções.

Assim, projetar seria o mesmo que desenhar uma solução,

determinando métricas e caminhos a serem seguidos até a solução

definitiva do problema. O foco está no bem-estar das pessoas

envolvidas e não somente na aparência do produto ou serviço.

O Design Thinking, é uma metodologia de solução de problemas

cuja proposta fundamental centra-se na humanização dos

processos, priorizando as pessoas envolvidas e, em um segundo

momento, preocupando-se com as ferramentas.


No livro Design Thinking, de 2017, a autora Talita Pagani define que

embora o design thinking possa ser aplicado em qualquer

processo de resolução de problemas, ele é comumente utilizado

como uma abordagem para inovar determinado produto ou

serviço, tendo o olhar sobre os negócios e sobre as pessoas como

um de seus pilares. No design thinking, há a preocupação

também com a viabilidade técnica de uma solução. O design

thinking, enquanto um processo para se atingir a inovação em

negócios, reúne o que as pessoas desejam com o que é econômica

e tecnologicamente viável (p. 26).

A ideia central, e principal propósito do Design Thinking, é

encontrar soluções competentes e eficazes para os problemas das

pessoas envolvidas nos processos, baseando-se sempre na

empatia e interatividade, a fim de alcançar a melhoria contínua. A

aplicação do Design Thinking no processo de visualização de

dados pode gerar resultados admiráveis, visto que a inovação é um

dos seus principais objetivos, cujo desafio é responder

criativamente às necessidades e desejos dos usuários, ou seja, o

foco passa a ser na experiência do público-alvo na busca por

soluções aos problemas identificados.


São cinco as etapas do Design Thinking, conforme explicitado a

seguir:

Empatia

Esta fase caracteriza-se pelo entendimento, compreensão e imersão

nos desejos, anseios e necessidades das pessoas. Como o próprio

nome diz, a fase de empatia está relacionada ao ato de colocar-se no

lugar das pessoas, para que o problema seja compreendido sob seu

ponto de vista. Nesta etapa, o contexto histórico, social e cultural de

cada um dos envolvidos é levado em consideração, pois pode gerar

insumos para o entendimento do funcionamento dos processos. A

pergunta central nesta fase é: eu tenho um desafio ou problema.

Como posso abordá-lo?

Definição

Esta fase caracteriza-se pela sintetização, compilação, organização e

análise dos dados obtidos pela fase anterior, visando à identificação

e definição dos problemas que necessitam ser solucionados. A

pergunta central nesta fase é: eu aprendi alguma coisa. Como posso

interpretá-la?

Idealização

Nesta etapa, o maior objetivo é determinar alternativas e caminhos

coerentes para que a solução do problema seja efetiva. A pergunta


central nesta fase é: eu vejo uma oportunidade. Quais caminhos devo

seguir até a solução?

Protótipos

Nesta fase, as soluções planejadas são articuladas e colocadas em

prática de modo a simular o ambiente real. A pergunta central nesta

fase é: eu tenho uma ideia. Como posso concretizá-la?

Testes

Esta fase caracteriza-se pela realização de testes com protótipos,

feitos em um ambiente real com a participação dos usuários. Neste

momento, é possível observar se os usuários entendem como o

protótipo funciona. Além disso, todos os erros encontrados nos

testes são registrados e corrigidos, para que o produto, serviço ou

solução final seja melhorado. A pergunta central nesta fase é: eu

experimentei algo novo. Como posso aprimorá-lo?

Ao responder às perguntas contidas em cada fase, o design thinker

proporcionará uma excelente experiência a seu público. O cientista

de dados, por sua vez, pode ser um design thinker que, ao utilizar

tais conceitos dentro de seus projetos de visualização de dados,

conseguirá:

Extrair informações relevantes, experimentando novos métodos;


Encontrar respostas para perguntas que ainda não haviam sido

realizadas;

Evoluir os sistemas de visualização a partir do aprimoramento de

técnicas e métodos.

Talita Pagani, na mesma obra de 2017, também afirma que:

O design thinking também pode ser utilizado para descobrir novas

possibilidades de negócios e inovação, antes mesmo de se

identificar um problema. Há a flexibilidade de usá-lo como uma

abordagem de exploração e descoberta sobre como as pessoas usam

determinado produto ou serviço (p. 31).

Utilizar o Design Thinking desde o início de qualquer projeto faz

com que as visões sejam amplificadas em relação às tendências de

mercado, facilitando a criação de visualizações de dados altamente

contextualizadas e conectadas com a realidade do público-alvo.

Há outra maneira efetiva de aplicar adequadamente as técnicas de

visualização de dados em conjunto com o Design Thinking dentro

de Data Science: utilizar os conceitos da Gestalt.

GESTALT
Mas, afinal de contas, o que seria Gestalt?

O efeito que as representações visuais proporcionam às pessoas

está diretamente conectado ao conceito de Gestalt, um estudo que

visa entender o comportamento visual das pessoas em relação às

formas (imagens) que lhes são apresentadas.

A Gestalt possui algumas leis que descrevem como o ser humano

interpreta as representações visuais. São elas: unidade,

segregação, unificação, proximidade, semelhança, fechamento,

continuidade e pregnância da forma.

Vamos conhecer em detalhes cada uma delas a seguir:

Unidade

Esta lei representa um único elemento que se encerra em si mesmo

ou um conjunto de elementos que, percebidos juntos, formam um

todo. Uma unidade pode ser definida através de linhas, pontos e

cores que estejam isolados ou relacionados entre si.

Segregação

Esta lei representa a capacidade humana de perceber os elementos,

destacando um ou mais deles dentro de uma composição inteira. Isso

pode ser constituído através de elementos visuais como cores,

linhas, texturas

etc. Observe o exemplo na Figura 5.

Unificação

Esta lei diz que a unificação ocorre quando elementos parecidos ou

iguais são organizados de uma maneira harmonizada, conforme

podemos analisar na Figura 6.

Proximidade

Esta lei diz que elementos próximos uns dos outros formam grupos e

são vistos como um todo, conforme observa-se na Figura 7.

Semelhança

Esta lei diz que elementos parecidos (semelhantes) se agrupam,

formando um todo ou unidades que compõem um todo. A

semelhança pode ocorrer por cor, textura, forma, etc. Veja um

exemplo na Figura 8.

Fechamento

Segundo esta lei, nosso cérebro pode complementar uma forma, caso

as partes que a compõem não estejam completas. Porém, isto só

ocorre se os elementos estiverem estruturados de maneira

organizada. Nossa percepção visual tem a capacidade de formar o

objeto ou imagem de maneira completa, ainda que estejam faltando

partes. Analise o exemplo da Figura 9.

Continuidade

Esta lei pressupõe que elementos próximos dão a sensação de seguir

uma direção específica. Os elementos tendem a se repetir de forma

ordenada, dando a ideia de algo contínuo. Na Figura 10, há um

exemplo de continuidade.

Pregnância da forma

De todas as leis aqui apresentadas, a pregnância da forma sem

dúvida é a mais importante. Esta lei diz que quanto mais fácil for a

compreensão e leitura do objeto apresentado, maior é sua

pregnância. Em outras palavras, a pregnância pode ser traduzida

como o grau de estabilidade de percepção de um objeto, conforme

Figura 11 (primeiro alta pregnância, depois baixa e, por fim, mais

baixa ainda).
O estudo referente ao Gestalt é extremamente importante, pois

com ele é possível entender o comportamento visual que temos em

relação aos elementos visuais que nos são apresentados. Uma boa

articulação e organização dos elementos gráficos amplifica a


compreensão da mensagem que está sendo passada em uma

visualização de dados.

O MELHOR DESIGN PARA A

VISUALIZAÇÃO DE DADOS
Sabemos que os recursos visuais impactam o

entendimento das pessoas com maior facilidade e podem

ser muito úteis nos trabalhos de Data Science

implementados em grandes ou pequenas organizações. No

cotidiano de uma empresa, um gestor terá muito mais

facilidade em tomar decisões baseadas em gráficos, que

apresentam informações compiladas e organizadas, do

que em relatórios exclusivamente textuais com diversas

páginas.

É do conhecimento da comunidade científica que o cérebro

humano processa com mais velocidade imagens do que

textos. Isto ocorre em virtude de o cérebro humano

possuir um hemisfério inteiro dedicado à análise de

imagens. Para que haja um processamento adequado

destas imagens, há muitos sensores localizados nos olhos.


Desta forma, a estrutura composta pelos nossos olhos e

cérebro possibilita a interpretação de um objeto ou cena

em menos de 1 décimo de segundo, e a alta complexidade

por trás da interpretação dos dados é reduzida com muita

velocidade.

Os tomadores de decisão geralmente não possuem muito tempo

para analisar os dados e, portanto, necessitam encontrar as

melhores alternativas ou saídas para o futuro dos negócios de suas

empresas no menor tempo possível. Isto não significa, todavia,

que chegar às melhores decisões será fácil. Inúmeras variáveis

precisam ser consideradas neste processo e, em muitas destas

decisões, há um nível de risco relevante que precisa ser assumido

pelo tomador de decisão.

Para auxiliar neste processo, a visualização de dados deve ser

planejada de modo que o gestor consiga observar e identificar

possíveis problemas e oportunidades de melhorias em suas

estratégias.

A utilização de recursos visuais, como os dashboards

personalizáveis, proporciona benefícios incomensuráveis, dando


inúmeras vantagens que não podem ser medidas, em razão de seu

alto grau de relevância. Destes benefícios, podemos citar a

economia de tempo e maior probabilidade de assertividade na

decisão tomada. Estes dashboards, são baseados nos conceitos e

princípios do design que falamos anteriormente.

FERRAMENTAS DE VISUALIZAÇÃO

DE DADOS

Ao navegar por um website com um visual organizado e bonito, é

natural que sejamos atraídos pela aparência contida nas formas,

combinação de cores e posicionamento dos elementos visuais. No

entanto, é somente no momento que encontramos informações

relevantes na página ou aplicação web que decidimos regressar ou

até salvar o endereço em nossa pasta de favoritos.

A visualização de dados, por sua vez, se baseia em muitos dos

pilares utilizados na construção de websites (web design), ou seja,

a ideia é exibir todos os dados, de maneira que sejam intuitivos e

fáceis de entender, pensando também na interface amigável com o

usuário.
Dentre as inúmeras ferramentas que o cientista de dados pode

utilizar para exibir os dados, podemos destacar os gráficos

estáticos ou dinâmicos, infográficos, dashboards, linhas do tempo

etc.

Vejamos alguns resultados produzidos por ferramentas de

visualização de dados nas Figuras 12 e 13, respectivamente.

// Dashboard interativo
Infográfico

Agora, vamos conhecer algumas ferramentas de visualização de

dados que podem produzir os resultados demonstrados nas

imagens anteriores. São elas:


SINTETIZANDO

Nesta unidade, apresentamos os principais conceitos

sobre dados e pudemos entender como eles podem ser

manipulados dentro do campo de estudo do Data Science.

Compreendemos também a importância da compilação e


organização de informações em projetos de visualizações

de dados, para que uma interpretação aprofundada sobre

as mensagens extraídas do Big Data seja efetiva e atinja

assertivamente as expectativas do público-alvo.

Além disso, você teve acesso ao principal objetivo do

storytelling, que é auxiliar a construção de histórias, a

partir dos dados, que sejam completamente envolventes,

impactantes e focadas no perfil do público-alvo.

Tratamos também do perfil e da responsabilidade ética

que o cientista de dados tem na concepção e projeção de

visualizações coerentes.

Além disso, conhecemos as cinco fases do Design

Thinking: empatia, definição, idealização, prototipação e

testes, que dão base ao conjunto de ideias que visa a

projetar soluções mais humanas para os processos das

companhias e organizações.
Por fim, foram apresentadas algumas das principais

ferramentas de visualização de dados utilizadas pelos

cientistas de dados, como Tableau, SAS Visual Analytics,

Plotly, Infogr.am, Google Charts e DataWrapper.

REFERÊNCIAS BIBLIOGRÁFICAS
FERNANDA Viegas: "Visualização de dados para todos".

Postado por Panorama. (18 min. 56 s.). son. color. port.

Disponível em: <https://www.youtube.com/watch?

v=t73yuUV2xXI>. Acesso em: 23 out. 2019.

GOMES, J. F. Gestalt do objeto: sistema de leitura visual da

forma. 8. ed. rev. e ampl. São Paulo: Escrituras, 2008.

MACHADO, A. L. Administração do Big Data. São Paulo:

Senac, 2017.

MUNZNER, T. Visualization Analysis and Design. Boca

Raton, FL: CRC Press, 2015.

PAGANI, T. Design Thinking. São Paulo: Senac, 2017.


WEISS, J. DataWrapper levar jornalismo de dados a

redações africanas. IJNET, Washington, DC, 9 ago. 2013.

Disponível em:

<https://ijnet.org/pt-br/story/datawrapper-leva-

jornalismo-de-dados-redacoes-africanas>. Acesso em: 2

nov. 2019.

A Ciência de Dados, apesar de nova, é bastante importante para que possamos


compreender, processar e interpretar o fluxo de dados gerado diariamente.

Você também pode gostar