Escolar Documentos
Profissional Documentos
Cultura Documentos
Sumário
Visualizando o passado. .........................................................................................3
Este whitepaper conta a história da representação visual, desde as pinturas em cavernas até a revolução
da informática e o lançamento do Tableau. Ele fala sobre alguns dos pioneiros nas pesquisas de dados e
mostra como seus trabalhos ajudaram a revolucionar as técnicas de comunicação visual. Examinaremos
os diferentes estilos de dados visuais e conheceremos alguns dos desafios da criação de recursos visuais
eficazes e os métodos utilizados para superar essas barreiras. Por fim, este whitepaper mostrará o potencial
(e as limitações) da percepção humana e como usar dados para contar histórias – bem parecidas com
aquelas pinturas rupestres da pré-história.
3
Visualizando o passado
As representações visuais são fundamentais no processo de aprendizado e
compreensão humana. Para estudarmos o impacto e a evolução da visualização
de dados, é preciso olhar primeiro para o passado e ver como as formas de modelar
e representar dados mudaram ao longo do tempo. A humanidade usa visualizações
para instruir, comunicar e contar histórias desde o início dos tempos. Os mapas, em
especial, têm uma longa história. A figura abaixo é uma pintura de quase três metros
de altura descoberta na Turquia e que data de 6.200 a.C. Na parte de baixo está
a cidade de Catal Hyük com o vulcão Hasan Dag em erupção acima [1, 2]. Ainda
não se sabe a finalidade da pintura, se é uma obra de arte ou um mapa de dados.
De qualquer forma, ela é um exemplo de como a humanidade usava imagens
para transmitir conceitos e ideias.
4
Mais de uma década depois, o teórico francês Jacques Bertin publicou o livro Semiology
of Graphics (Semiologia dos gráficos) [8]. Ele estava particularmente interessado em
mapeamento estatístico e observou que as exibições de dados envolviam três tipos de
marcas: pontos, linhas e áreas. Essas marcas tinham algumas propriedades, e a mais
importante delas era a posição. Outras seis propriedades, além da posição, incluem cor,
tamanho, forma, matiz, orientação e textura. Jacques Bertin transformou essas marcas
e propriedades em orientações para representar dados graficamente.
Ele também desenvolveu uma técnica muito importante de análise visual, que envolvia a
classificação de tabelas. Essa técnica, chamada de matrizes de permutação, manipulava
linhas e colunas de uma tabela para encontrar padrões em dados não classificados
previamente e mostrava uma correlação entre os valores. Sempre inovador, Jacques
Bertin publicou outro livro em 1977 chamado Graphics and Graphic Information Processing
(Processamento de informações gráficas e gráficos), que relata os primórdios da
visualização computadorizada. Embora os computadores de Bertin tenham se mostrado
muito primitivos para o trabalho que ele pretendia fazer, uma explosão tecnológica
em breve produziria grandes avanços nessa área.
7
É aí que entra o Tableau. Em 2003, Chris Stolte mostrou como acessar de forma
eficaz dados não processados em sua dissertação de doutorado em Stanford. Ele
e seu orientador, Pat Hanrahan, desenvolveram uma linguagem de especificação
chamada VizQL, que descrevia gráficos de dados e como conectá-los a bancos
de dados. Esse trabalho se baseava na semiologia de Jacques Bertin e em
minha própria pesquisa de doutorado. O VizQL também era compatível com um
sistema “arrastar e soltar” intuitivo, que acabaria por se transformar na interface do
Tableau. Essencialmente, o VizQL permitia que seus usuários fizessem consultas
e as transformassem em exibições. Chris Stolte conseguiu conectar dados
a visualizações na forma de um aplicativo prático.
Observando as opções gráficas para analisar esses tipos de dados, podemos ver
que o gráfico de área seria adequado para alguns tipos de dados, mas não para
outros. Utilizar um gráfico de área para analisar dados nominais transmitiria a ideia de
ordenação, o que simplesmente não se aplica. Com os dados ordinais, o gráfico de
área se sairia um pouco melhor, pois como esses valores são distintos, você poderia
ter apenas algumas áreas que distinguiriam os tamanhos diferentes. O gráfico de
área funciona melhor com dados quantitativos, porque demonstra com precisão
o que o valor quantitativo é em relação a uma determinada ordem.
Alterar a representação gráfica para cores altera essas descobertas. As cores não
são muito eficientes para dados quantitativos, porque seria muito difícil fornecer um
esquema de cores para representar com precisão um conjunto de dados inteiro.
As cores são ideias para dados nominais, pois é possível atribuir uma cor diferente
para cada ponto.
A figura abaixo mostra como o Tableau usa esses fatores para gerar visualizações
eficazes. Mais uma vez, a posição é sempre a primeira da lista, pois é a forma mais
eficiente de representar todos os três tipos de dados. No entanto, se você observar
a figura, verá que isso muda dependendo dos tipos de dados. Alguns fatores
ocupam posições diferentes em cada uma das listas. É interessante observar
que apesar de a forma não ser aplicável para dados quantitativos ou ordinais,
ela é a segunda na lista dos dados nominais.
11
Uma forma de resolver isso seria usar a agregação. Uma medida simples como separar
os dados por ano reduziria muito a quantidade de dados e, consequentemente, sua
sobreposição. Por isso, a agregação pode ser uma ótima ferramenta quando estamos
lidando com dados multidimensionais.
Outra técnica é usar a filtragem interativa. Voltando à figura acima, imagine que
podemos criar widgets de filtro que nos permitem exibir apenas os dados que
queremos analisar. Com esses widgets, podemos adicionar e excluir os dados
imediatamente e ter uma visão mais clara das descobertas gerais. A filtragem é
uma ótima forma de trabalhar com dados multidimensionais, apesar de ter seus
pontos fracos. Por exemplo, isolar alguns conjuntos de dados pode dificultar,
ou até mesmo impossibilitar, a identificação das relações entre eles.
Para superar as limitações da filtragem, podemos empregar um processo conhecido
como realce. Com essa técnica, colorimos um ou mais conjuntos de dados para
identificarmos melhor os contrastes e as relações entre eles.
Outra maneira de usar interatividade são os links. O Google Maps, por exemplo. Uma
simples consulta retorna um mapa com áreas realçadas, nas quais podemos clicar para
obter ainda mais dados. Com os menus suspensos ou os wigdets da página, você pode
filtrar ainda mais os dados para refinar as visualizações. Logo, os links interativos são
uma excelente forma de lidar com conjuntos de dados multidimensionais.
Então, descobri que, nos últimos cinco anos, o estado de Washington aplicou
dois testes diferentes: o WASL e o ITBS (Iowa Testing Program). O gráfico acima
compara os dois testes e mostra resultados surpreendentes. Embora os resultados
do WASL estivessem melhorando ao longo do tempo, os resultados do ITBS
permaneciam basicamente inalterados. Como as pontuações do ITBS representam
uma amostragem dos estudantes do país, concluí que os números do WASL não
podiam ser confiáveis.
Moral da história: sempre duvide dos dados. Procure saber sua origem e use
sistemas visuais para ter certeza de que você pode confiar neles e entender
o que eles dizem.
16
Lição 1:
A credibilidade é fundamental para a criação de histórias visuais. Se você não criar
suas exibições corretamente, é muito provável que elas não sejam confiáveis para
as pessoas experientes que as visualizarem.
Lição 2:
Crie visualizações expressivas e que transmitam com precisão as informações
contidas nos dados.
Lição 3:
Aumente a eficácia de suas visualizações ao tirar proveito do sistema de percepção
humano. As regras abaixo ajudarão você a criar visualizações eficazes:
Lição 4:
É importante que suas visualizações tenham contexto. Títulos, legendas, unidades,
comentários – todos esses elementos ajudam o público a entender melhor sua
visualização de dados. Esteja sempre empenhado em contar histórias com seus
dados e suas visualizações. Entenda que boas histórias são muito mais do que
apenas dados e considere o seguinte:
Sobre a Tableau
A Tableau Software ajuda as pessoas a ver e a entender seus dados. O Tableau possibilita que
qualquer pessoa analise, visualize e compartilhe informações rapidamente. Mais de 15.000 contas
de usuário obtêm resultados rápidos com o Tableau, no escritório e em dispositivos móveis. Além
disso, dezenas de milhares de pessoas usam o Tableau Public para compartilhar dados em seus
blogs e sites da Web. Veja como a Tableau pode ajudá-lo. Baixe a versão de avaliação gratuita
em www.tableausoftware.com/pt-br/products/trial.
Recursos adicionais
Baixe a versão de avaliação gratuita
· Treinamentos e tutoriais
· Comunidade e suporte
· Histórias de clientes
· Soluções
Referências
[1] http://www.henry-davis.com/MAPS/AncientWebPages/100B.html
[2] http://www.math.yorku.ca/SCS/Gallery/milestone/sec2.html
[3] http://www.henry-davis.com/MAPS/AncientWebPages/101.html
[4] http://www.henry-davis.com/MAPS/Ren/Ren1/406B.htm
[5] http://www.math.yorku.ca/SCS/Gallery/images/playfair2.jpg
[6] http://www.math.yorku.ca/SCS/Gallery/images/minard.gif
[7] Darrell Huff. How to Lie With Statistics. Norton, New York. 1955.
[8] Jacques Bertin. Semiology of Graphics. University of Wisonson Press. 1983
(Semiologie Graphique Gauthier-Villars, Paris 1967).
[9] Stuart K. Card, Jock D. Mackinlay, & Ben Shneiderman. Readings in Information
Visualization: Using Vision to Think. Morgan Kaufman, San Francisco. 1999.
Tableau e Tableau Software são marcas comerciais da Tableau Software, Inc. Todos os outros nomes de
produtos e empresas podem ser marcas comerciais das respectivas empresas às quais estão associados.