Você está na página 1de 116

Dashboards

Eficazes em Excel
Um roteiro passo a passo para o desenho de
dashboards e para o domínio de técnicas avançadas
de criação de gráficos em Microsoft Excel
Pág. 01

Jorge Camões

Dashboards Eficazes em Excel: Um roteiro passo a passo para o desenho


de dashboards e para o domínio de técnicas avançadas de criação de gráficos
em Microsoft Excel

Versão 1.1
24 de julho de 2018

Copyright ©2018
Wisevis Unipessoal, Lda

www.excelcharts.com

Os nomes comerciais referenciados neste livro têm patente registada.

Reservados todos os direitos. Esta publicação não pode ser reproduzida, nem
transmitida, por quaisquer meios, sem prévia autorização escrita da Wisevis.
Para facilitar o acompanhamento da discussão e tirar o máximo partido do
ebook, deve aceder aos ficheiros complementares, que encontrará na página de
suporte:

• O ficheiro IDTDados-v1-0.xlsx: o ficheiro que contém os dados de base


e que deverá usar para seguir o manual;
• O ficheiro MapaNUTS3.png: ficheiro de imagem necessário à
construção de um mapa;
• O ficheiro MapaConcelhos.png: ficheiro de imagem também necessário
à construção de um segundo mapa.

Envie as suas dúvidas sobre o e-book através do formulário de contacto no meu


blog ou da Wisevis. Consulte também a página de suporte e perguntas
frequentes:

https://excelcharts.com/ebook-dashboards-eficazes-excel-suporte/
A sua aquisição deste e-book inclui a garantia de acesso a futuras versões.

A visualização de informação não é uma ciência, e muitas vezes as escolhas


baseiam-se em critérios subjetivos. Procurei justificar as escolhas e escrever as
instruções de forma tão clara quanto possível. Eventualmente, não o terei
conseguido em todos os casos. Conto com as suas críticas, sugestões,
comentários e correções para que possamos em conjunto melhorar o livro, para
benefício de todos.

Uma nota quanto ao português: este livro foi escrito em português de Portugal.
Há diferenças conhecidas nesta área para com o português do Brasil: planilha é
folha de cálculo, usuário é utilizador. Mas na verdade não sei se algumas
palavras são suficientes para distrair da leitura do livro. Espero pelo vosso
feedback.
A visualização de informação é um campo muito vasto, mesmo
que apenas observemos a pequena secção da visualização de
dados de negócio.

Escrevi o que entendo ser os princípios básicos de visualização


aplicável nas organizações no livro Data at Work: Best
practices for creating effective charts and information
graphics in Microsoft Excel

No entanto, um livro não pode abordar todas as necessidades


das organizações. Algumas querem dar o primeiro passo para
uma melhor eficácia das suas práticas de visualização, mas
querem dá-lo com segurança. Outras precisam de resolver
problemas específicos. Umas preferem focar-se na utilização
prática do Excel, enquanto outras usam sistemas de BI
sofisticados, mas necessitam de competências de visualização
que sejam agnósticas quanto à ferramenta utilizada.

Contacte-me pelo email jorge.camoes@wisevis.com para que


possamos conversar sobre o seu caso específico.
INTRODUÇÃO .............................................................................................................................. 1

VISUALIZAÇÃO DE INFORMAÇÃO ............................................................................................ 4

PARA LÁ DO GRÁFICO ............................................................................................................. 10

A CONSTRUÇÃO DO DASHBOARD ........................................................................................ 18

O VELOCÍMETRO....................................................................................................................... 31

O GRÁFICO DE PONTOS .......................................................................................................... 43

OS GRÁFICOS BULLET ............................................................................................................ 54

O GRÁFICO DE DISPERSÃO .................................................................................................... 63

MAPA DE NUTS3 ....................................................................................................................... 70

A PIRÂMIDE ETÁRIA ................................................................................................................. 78

AS SPARKLINES........................................................................................................................ 87

O MAPA DE PONTOS ................................................................................................................ 92

DESENHO DO DASHBOARD .................................................................................................... 98

CONCLUSÕES ......................................................................................................................... 108


Tradicionalmente, cabe aos sistemas de informação das organizações a tarefa de
traduzir em relatórios e dashboards as necessidades e correspondentes
requisitos dos utilizadores. Nem sempre o resultado é o esperado, e os
equívocos e a dificuldade da relação entre estes dois grupos são tão
generalizados que merecem uma categoria de humor específica (muitas das tiras
do Dilbert são aqui inspiradas).

No entanto, algo está a mudar. A crescente literacia informática dos utilizadores


significa que a natureza da relação com os sistemas de informação tem de ser
diferente. Prova disso é o aparecimento da categoria self-service BI, com
ferramentas como o Tableau, o Qlik Sense ou o PowerBI. O termo self-service
implica uma facilidade de utilização das ferramentas e de autonomia dos
utilizadores que é um mito, de acordo com Stephen Few, mas isto não desmente
o sentido da evolução da relação entre os dois grupos, e até alguma diluição das
fronteiras entre eles.

No caso dos dashboards, um utilizador de negócio sabe quais são as suas


necessidades, e deverá ser capaz de traduzir numa representação visual essas
necessidades e definir prioridades. Para isso, apenas precisa de caneta e papel.

A segunda melhor opção é fazê-lo na aplicação que melhor domina, a qual em


muitos casos é o Excel. Ter a capacidade de desenhar um dashboard em Excel
não só dá ao utilizador mais autonomia como facilita avaliação das suas
próprias ideias, ou a incorporação do feedback de outros. Desenhar um
Pág. 02 INTRODUÇÃO

dashboard não significa que o Excel seja a ferramenta usada para a sua
produção: criar um protótipo, para além de facilitar a discussão, tende a gerar
redução de custos de consultoria e desenvolvimento em outras ferramentas de
Business Intelligence.

Uma pesquisa de imagens no Google, ou os exemplos nos sites de muitos


vendedores, poderia levar-nos a concluir que dois ou três indicadores
descontextualizados, mas embrulhados em gráficos vistosos, constituem a
melhor forma de monitorizar a performance organizacional.

É possível que esses dashboards cumpram a função a que foram destinados,


mas monitorizar eficazmente não é de todo o seu principal objetivo. O desenho
de um dashboard, para além de depender dos objetivos que o originaram, deve
também tentar ser um repositório de boas práticas e princípios de visualização
de informação.

Nenhum tipo de gráfico deve ser excluído à partida de qualquer representação


gráfica, mas devemos avaliar em cada caso se esse tipo de gráfico é o mais
adequado no contexto.

Uma das condicionantes essenciais no design de um dashboard é o limitado


espaço disponível. Se isto é verdade para um computador de secretária, ainda
tem mais razão de ser quando os dashboards têm de estar preparados para
utilização em dispositivos móveis.

Daí uma preocupação constante com a pegada gráfica de cada objeto (o espaço
necessário para representar os dados), procurando alternativas mais eficazes na
gestão de espaço. Tipos de gráficos como os velocímetros, ou formatação com
efeitos tridimensionais podem ser criticados de vários pontos de vista, mas
Pág. 03 INTRODUÇÃO

mesmo que aceitamos que eles são úteis para atrair e manter a atenção do
utilizador (duvidoso) devemos também avaliar o custo do ponto de vista da
riqueza da mensagem.

Este projeto procura conciliar boas práticas em visualização de informação com


a utilização de uma diversidade de técnicas de Excel aplicáveis ao desenho de
dashboards. A maioria das tarefas que realizamos no Excel podem ser
desenvolvidas de diversas formas, e a sua flexibilidade permite-nos ir muito
além da biblioteca de gráficos.

O primeiro capítulo do livro discute sumariamente a visualização de informação


num contexto organizacional, e a forma como ela difere de outros tipos de
visualização, como a que vemos todos os dias nos media.

O capítulo seguinte discute o cenário que conduziu à elaboração do dashboard e


os dados que lhe servem de base. Nos restantes capítulos, cada um dos objetos
gráficos é explicado em pormenor e são apresentados os passos necessários para
os criar. No último capítulo todos os objetos são colocados no desenho do
dashboard.
Responda rapidamente a esta pergunta: qual é o número maior: 84537894 ou
124518954? Imagino que precise de alguns segundos o fazer. Bastaria uma
pequena pista visual, como a introdução de separadores de milhares, para
tornar a tarefa mais fácil. Um gráfico de barras não só permitiria uma resposta
instantânea como facilitaria a avaliação da diferença entre os dois valores. Isto é
óbvio, mas apenas porque a grande maioria dos recursos despendidos pelo
cérebro da espécie humana no processamento de estímulos exteriores é
canalizada para o processamento de estímulos visuais.

Observe de novo aqueles números. Imagine que são propostas de fornecimento


do mesmo equipamento, e que tem apenas alguns segundos para decidir.
Prefere gastar esses segundos a verificar qual é o número maior, ou prefere
gastar esse tempo avaliando o impacto da sua decisão no seu orçamento? Claro
que tomar este cenário pelo seu valor facial torna-o inverosímil, mas a sua lição
é muito real e prática: quando trabalhamos com números, corremos o risco de
despendermos demasiado tempo em tarefas menores, quando poderíamos
aproveitá-lo para tarefas de mais alto nível, caso os nossos sistemas
(tecnológico, organizacional...) o permitissem.

O exemplo dos gráficos não é único, mas é particularmente significativo. Os


gráficos tiram partido da tremenda capacidade do sistema olho-cérebro para
pré-processar dados e libertar recursos cognitivos para aplicação a tarefas mais
nobres (avaliação, tomada de decisão). O pré-processamento dos dados é a
principal tarefa de uma representação gráfica, e a nossa preocupação deve ser
Pág. 05 VISUALIZAÇÃO DE INFORMAÇÃO

formatá-la para facilitar a tarefa. Infelizmente, as práticas


organizacionais e o marketing dos vendedores de aplicações vão
por vezes noutro sentido: usar o gráfico como mero apêndice
ilustrativo de alguns números, em que um arco-íris de cor e efeitos
tridimensionais têm lugar cativo. Um gráfico circular em 3D como
o da Figura 1 é o exemplo mais comum. Se além quiser convencê-
Figura 1: Um gráfico circular lo a fazer (ou comprar uma aplicação para fazer) gráficos
profissionais e memoráveis é provável 1) que não sejam
profissionais para o seu negócio e 2) sejam memoráveis no pior sentido: aquilo a
que a expressão popular designa por “muita parra, pouca uva”.

A segunda principal característica da visualização de informação, para além


desta utilização do sistema olho-cérebro para pré-processar os dados, é o facto
de ela se focar nas relações entre os dados. Enquanto a principal vantagem
de uma tabela bem construída é a de facilitar a localização de valores
específicos, ou a estatística descritiva calcular índices que resumem as
características dos dados (como a média ou o desvio padrão), no caso da
visualização de informação enfatiza a observação de regularidades (padrões,
tendências) e irregularidades (valores extremos) na relação entres os dados.

A imagem da Figura 3 é uma representação gráfica de um horário de comboios,


onde em linha são marcadas as estações e em coluna as horas. Quanto mais
inclinada for a linha, mais lento é o comboio.

Esta representação visual de um horário de comboios é interessante para


perceber o funcionamento geral da linha ferroviária, mas é pouco provável que
Pág. 06 VISUALIZAÇÃO DE INFORMAÇÃO

um utente a prefira, quando o seu objetivo é saber quando parte e quando chega
um comboio. Isto exemplifica algumas noções essenciais:

• Não há uma forma única, ou mesmo preferencial, de comunicar dados


quantitativos.
• Apenas em função dos nossos objetivos é possível determinar os meios
mais adequados. Em certos casos será uma tabela, noutros casos será um
tipo de gráfico ou mesmo uma simples frase.

É útil entender a visualização como uma linguagem, através da qual


comunicamos e transmitimos uma determinada mensagem. Tal como outras
linguagens, os “falantes” da visualização de informação usam-na para
mensagens, formas e objetivos de comunicação muito distintos. Mesmo quando
há tudo em comum, cada pessoa tem o seu estilo pessoal, que se revela em
muitas das suas opções de representação gráfica, desde os dados que usa à
palete de cores que aplica.

As diferenças decorrem de muitos fatores, desde competências e experiência, ao


tipo de uso da representação gráfica (análise versus comunicação) e mesmo das
ferramentas utilizadas. No entanto, há um fator particularmente diferenciador:
a importância da forma (componente estética) e da função (para que serve).
Esta é uma distinção antiga que é necessário usar com cuidado, porque nem
sempre é fácil distinguir uma da outra (utilizadores de um sistema visualmente
mais agradável tendem também a considerá-lo mais funcional).

Uma representação gráfica numa revista ou num site tende a ter uma
componente estética mais vincada que uma representação equivalente num
manual de estatística. Em teoria, isso atrairá a atenção dos leitores, mesmo
aqueles menos familiarizados com o tema.
Pág. 07 VISUALIZAÇÃO DE INFORMAÇÃO

Numa organização, onde há uma missão e objetivos concretos a prosseguir, a


eficácia da comunicação deve ser o principal critério no desenho da
representação gráfica. Infelizmente, nem sempre a organização tem consciência
de que isso só pode ser atingido com as competências adequadas, e por vezes
essas competências são confundidas com competências na utilização das
ferramentas. Um exemplo concreto: “fazer gráficos” (comunicar através de
representações gráficas) e “fazer gráficos em Excel” (saber usar uma aplicação)
são competências distintas.

Numa era em que é difícil conhecer em profundidade a multiplicidade de tarefas


que as nossas funções exigem, os modelos (templates) e as predefinições são,
em simultâneo, uma bênção e um risco. Eles permitem-nos suportar o que
entendemos serem as nossas tarefas essenciais, delegando nos modelos a gestão
das tarefas acessórias.

Para que isto produza resultados, é necessário confiar que as predefinições e os


modelos estão alinhados com a natureza das funções essenciais, e permitindo
expressá-las de forma clara. Isso não deve ser um dado adquirido, pelo que
deverá existir um conhecimento mínimo que permita avaliar de forma crítica
essa adequação.

O Excel é uma folha de cálculo, isto é, permite realizar uma grande diversidade
de tarefas associadas à gestão de dados. Há aplicações muito mais sofisticadas
em várias áreas do Excel, como a representação gráfica ou a análise de tabelas
de dados. No entanto, é muito difícil reproduzir a sua universalidade e
familiaridade numa única ferramenta. O Excel é também muito flexível, embora
isso tenha um preço por vezes invisível (ineficiência de processos, por exemplo).
Pág. 08 VISUALIZAÇÃO DE INFORMAÇÃO

A biblioteca de gráficos do Excel é muito mais reduzida do que aparenta e, até


ao Excel 2003, as predefinições eram francamente desoladoras. No Excel 2007,
a Microsoft introduziu um novo motor de gestão de gráficos e melhorou a sua
qualidade visual, mas privilegiar formatos mais apelativos em detrimento da
sua eficácia continuou a ser a sua opção.

Atualmente, há uma forte aposta da Microsoft, através do PowerBI, no mercado


do chamado self-service BI. O PowerBI, é uma ferramenta interessante e está
em desenvolvimento contínuo, com constantes atualizações, mas os seus
gráficos de origem são (ainda?) muito pouco flexíveis. Alguns desses gráficos
foram introduzidos no Excel 2016, e é notória a diferença (negativa) entre eles e
os gráficos de Excel tradicionais.

A biblioteca de gráficos do Excel é, como disse, muito reduzida, e com opções de


design muito discutíveis. No entanto, a flexibilidade dos gráficos permite, com
alguns truques e “pensando fora da caixa” ir muito além daquilo que a biblioteca
nos oferece. Como veremos, ir para lá da biblioteca é muitas vezes um trabalho
demorado e detalhado. Deverá avaliar, em todos os casos, se o rácio custo-
benefício é positivo, e que estratégia seguir (não usar o gráfico, otimizá-lo, fazê-
lo numa outra ferramenta…). Esta avaliação é ainda mais necessária quando,
como num dashboard, há vários objetos gráficos.

Se pensarmos na visualização de informação como “estatística visual” será mais


fácil de perceber que ela é uma das dimensões que compõem o pensamento
sobre os dados, a forma como planeamos a sua análise e como comunicamos as
nossas conclusões. Como vimos no caso do horário de comboios, pensar de
forma integrada é decidir, por exemplo, que a média é usada porque a variação
dos dados é tão baixa que não justifica a elaboração de um gráfico, ou que
Pág. 09 VISUALIZAÇÃO DE INFORMAÇÃO

vamos usar um gráfico para facilitar a escolha da métrica estatística mais


adequada.

Há estratégias específicas da visualização. Sendo a descoberta das relações entre


os dados a sua principal característica, ela deve ser otimizada através da escolha
e do design das representações gráficas. Infelizmente, isso muitas vezes significa
trabalho extra para eliminar várias das predefinições do Excel.

Se consultar o capítulo sobre desenho de questionários num bom manual de


estudos de mercado, verificará que a elaboração das perguntas é um tema mais
complexo do que aparenta aos olhos de um leigo: basta a pergunta sugerir a
resposta para que os resultados devam ser postos em causa. Talvez pareça
estranho, mas ler este capítulo poderá ser o melhor ponto de partida para fazer
um gráfico. Um gráfico é uma resposta a uma pergunta implícita. Quanto mais
clara for a pergunta mais fácil será elaborar um gráfico que lhe responda.
Se fosse possível definir pontos-chave na evolução da literacia gráfica de alguém
(pessoa ou organização), o primeiro seria o momento em que toma consciência
de que um gráfico não serve apenas como um objeto colorido para ilustrar
alguns números.

O segundo momento é aquele em que percebe que é necessário quebrar a


barreira do gráfico único e pensar numa narrativa, feita de um conjunto de
gráficos e outros objetos visuais articulados cujo total é mais que a soma dos
objetos dispersos. Chamemos-lhe paisagem gráfica ou, usando a expressão da
moda (que não é equivalente), storytelling.

A forma mais segura de ir para lá do gráfico é através de algo que defina uma
estrutura clara, onde cada objeto tem idênticas características e é fácil de
comparar com outros objetos. Pense, por exemplo, na pirâmide etária de cada
distrito em Portugal. Seria possível representar todos esses dados num único
gráfico, cuja capacidade de nos ajudar seria nula. Para evitar isto, poderíamos
desdobrar o gráfico em 18 e apresentar um após o outro, desde Aveiro a Viseu.

No entanto, se reduzirmos o seu tamanho e os colocarmos numa grelha, será


fácil compará-los e analisar as diferenças. Esta técnica de visualização,
conhecida por “pequenos múltiplos” é apenas uma das formas de representar
perfis de entidades (outras existem, como a matriz ordenável). Na Figura 2 é
usada esta técnica para mostrar a evolução esperada da população portuguesa
até 2100. Se é possível concluir algo a partir do foco num único gráfico, também
é certo que a apreciação global nos permite outro tipo de raciocínio.
Pág. 11 PARA LÁ DO GRÁFICO

Figura 3: Horário de comboios, por Jules Marey (1880)

Figura 2: Evolução da população portuguesa. O primeiro gráfico inclui a legenda e outros objetos de identificação comuns aos
restantes.

Perante esta matriz, é difícil defender tanto que se trata de 18 gráficos como que
se trata de um gráfico único. No entanto, este é mais um caso em que o todo é
maior que a soma das partes.

O gráfico na Figura 4 é algo complexo. Ele mostra a evolução mensal da taxa de


desemprego na União Europeia desde o ano 2000. A cor azul mostra a diferença
da taxa para a média da UE quando essa diferença é negativa (ou seja, quando
há menos desemprego no país que na UE. Inversamente, os tons alaranjados
mostram os valores superiores à média. Quanto mais escuros forem os tons,
Pág. 12 PARA LÁ DO GRÁFICO

Figura 4: Gráfico horizonte

tanto azul como laranja, maior é essa diferença. Esta é uma das formas mais
densas de representar dados num gráfico, através de dobragens sucessivas do
eixo vertical. Independentemente da complexidade dos seus detalhes técnicos,
assim que temos os códigos de leitura básicos ele revela-nos muito detalhes
sobre essa realidade que eventualmente nos escapariam num gráfico menos
denso.
Pág. 13 PARA LÁ DO GRÁFICO

A “infografia” é um dos termos com mais aceções na visualização de informação.


Aqui bastará que o entendamos como uma representação articulada de objetos
gráficos com suporte quantitativo e com objetivo de transmitir uma
determinada mensagem. O que importa sublinhar é a potencial diversidade de
dados e de objetos gráficos e a libertação da estrutura imposta pela perfilação.

Figura 5: o crescimento da rede da Walmart e a população total nas áreas de influência

Neste sentido genérico, a infografia tanto abarca tanto as ilustrações dos media
como os dashboards, os quais, segundo Stephen Few, são “a representação
visual da informação mais importante necessária para atingir um ou mais
objetivos; consolidada e disposta num único ecrã para que a informação possa
ser monitorizada à vista.” [tradução minha] A Figura 5 mostra um exemplo que
está a meio caminho entre um dashboard e um infográfico.
Pág. 14 PARA LÁ DO GRÁFICO

Correndo o risco de ser excessivamente simplista, poderíamos dizer que há duas


perspetivas no desenho de dashboards. Uma é a de muitos vendedores, que
enfatizam a representação colorida de objetos que imitam objetos do mundo
real. A Figura 6 mostra exemplos desta escola de pensamento.

Figura 6: Uma pesquisa por “dashboard reporting”. Direitos reservados pela Google
Pág. 15 PARA LÁ DO GRÁFICO

Na minha opinião, é uma filosofia que tira partido da atração básica pelo brilho,
a cor e os efeitos especiais, e que se preocupa mais com as vendas das
ferramentas que com a prestação de um serviço útil aos clientes e utilizadores.

Se acrescentar “Stephen Few” à pesquisa (Figura 7) obtém imagens no polo


oposto: pouca cor e usada funcionalmente, maior densidade de dados. Há
muitos livros sobre dashboards, mas Stephen Few escreveu (que seja do meu
conhecimento) o único livro que sistematiza um pensamento coerente sobre o
tema. O resultado poderá ser demasiado racional para alguns, mas se
definirmos eficácia como algo desprovido de uma componente emocional, é
difícil encontrar uma melhor alternativa.

Figura 7: Uma pesquisa por “dashboard reporting Stephen Few”. Direitos reservados pela Google
Pág. 16 PARA LÁ DO GRÁFICO

É necessário clarificar o papel do Excel na construção de dashboards. Há muitas


organizações cujos requisitos não são compatíveis com a utilização do Excel.
Basta pensar no processamento de um grande volume de dados em tempo real,
de uma forma interativa e online para ter alguma dificuldade em imaginar essa
organização a tentar usar o Excel para esse fim.

Isto não significa que o Excel não possa desempenhar um papel relevante,
mesmo em situações para o qual ele não foi de todo desenvolvido. Com exceção
de casos particulares que se baseiem em sistemas de informação geográfica e
redes, a grande maioria dos dashboards podem ser desenhados em Excel. Nas
imagens anteriores é difícil encontrar algum que não possa ser reproduzido em
Excel. No entanto, muitos destes exemplos têm como base outras ferramentas.

Isto significa que o Excel é uma excelente ferramenta para desenho de


dashboards. A partir de uma folha branca pode colocar formas, texto, imagens e,
através disso, estruturar a mensagem que o dashboards deve transmitir. Não há
uma diferença essencial entre este trabalho e o trabalho de um designer gráfico,
quando usa as suas ferramentas de ilustração.

Os objetos utilizados podem ser mais ou menos próximos dos objetos finais.
Veja como é possível modelar essa proximidade:

1. Formas: simples retângulos e círculos indicando a posição de gráficos de


barras ou gráficos circulares. O Excel permite inserir texto no interior da
forma, onde descrevemos o seu conteúdo;
2. Imagens: se temos ideias mais claras sobre o tipo de representação gráfica,
é possível substituir as formas por imagens de representações semelhantes
retiradas de uma pesquisa online, por exemplo;
3. Gráficos com dados fictícios: as funções de geração de números
aleatórios permitem-nos criar rapidamente tabelas com a dimensão
necessária e semelhante às tabelas com dados reais. Podemos usar estes
Pág. 17 PARA LÁ DO GRÁFICO

números para criar gráficos com as características daqueles que seriam


usados;
4. Gráficos com dados reais: isto permite-nos, não apenas verificar se os
gráficos se adequam aos objetivos, como cria uma base concreta que facilita
a discussão e o feedback.

Dependendo do seu domínio do Excel, qualquer colaborador que trabalhe com


dados numa organização consegue definir o que é prioritário para a sua
atividade, e talvez o consiga traduzir num dashboard.

Se todo esse processo mental for desenvolvido com a presença de um


consultor/programador de ferramentas alternativas de Business Intelligence os
custos serão muito significativos, ao contrário daquilo que aconteceria se todo o
processo de desenho do dashboard e feedback fosse feito antes da contratação
do sistema. Isto tem também a vantagem adicional de selecionar as aplicações
que têm capacidade para incluir os elementos gráficos mais relevantes.

Em resumo, o Excel não deve ser avaliado em função da sua capacidade de


suportar um dashboard num sistema de informação pesado, mas sim em função
das suas mais que suficientes capacidades para criação de protótipos funcionais
capazes de aproximar os sistemas das necessidades do negócio de uma forma
mais rápida e a mais baixo custo. Usar o Excel para suportar um dashboard em
produção é uma questão totalmente diferente e que deve ter o seu processo de
avaliação próprio.
Figura 8: O dashboard que iremos desenvolver

O dashboard que iremos desenvolver (Figura 8) faz um retrato de cada um dos


concelhos portugueses quanto à sua estrutura demográfica. O cenário é o da
análise do envelhecimento da população.

Este não é o ponto de partida. A disposição de gráficos e outros objetos na folha


é um dos últimos passos na construção de um dashboard. O processo começa
muito antes, na clara identificação dos objetivos e na avaliação da forma como a
comunicação deve ser estruturada. Ao longo das tarefas seguintes,
reformulações e reavaliações são quase inevitáveis, devido à análise dos dados e
à eventual intervenção de fatores externos.
Pág. 19 A CONSTRUÇÃO DO DASHBOARD

Algumas pessoas terão mais predisposição, nessa fase inicial, para se


aproximarem do problema de uma forma mais qualitativa e descritiva, com
listas de pontos ou mapas mentais. Para outras será mais fácil trabalhar de
forma visual. Usar formas e testar a sua posição e tamanho poderá ajudar no
processo, mas evite introduzir elementos demasiado específicos antes de definir
a primeira estrutura.

No nosso dashboard, há uma âncora a partir da qual do todo o desenho de


articula: o Índice de Dependência Total. Com exceção de alguns elementos
identificativos, esse deve ser o dado mais proeminente do dashboard.

Vejamos como podemos definir um conjunto de análises a incorporar no


dashboard e tentar traduzi-las num texto traduzir coerente:

“O concelho de… situa-se em… e tem um IDT de…, o que o coloca entre os
concelhos mais/menos…, tendo um peso de IDI superior/inferior a….
Comparativamente aos outros concelhos da sua região, ele está entre os…
enquanto que a comparação com os concelhos a nível nacional mostra que
ele está entre os concelhos que… Na sua região, o concelho ocupa a
posição… sendo o concelho x o primeiro da tabela. Na análise da relação
entre IDJ e IDI observamos que o concelho tem um IDJ… à média nacional
e um IDI ... à média nacional. Há… concelhos com IDT superior.

O concelho tem uma população total de..., o que, combinado com uma área
de… Km2, resulta numa densidade populacional de… O concelho
perdeu/ganhou …% de população entre os censos de 1981 e de 2011, os
grupos etários que mais cresceram foram os… e os que mais decresceram
foram os… A estrutura etária da população mostra uma… quer em relação
ao todo nacional quer em relação à sua região. O concelho pertence a uma
região com alto/baixo IDT/IDJ/IDI densidade populacional… e
crescimento.... “
Pág. 20 A CONSTRUÇÃO DO DASHBOARD

É necessária alguma flexibilidade para perceber de que forma o texto se pode


adaptar ao dashboard, e como o dashboard se pode adaptar ao texto. A primeira
versão deste dashboard dispunha os objetos numa forma que obrigava a saltos
na narrativa, enquanto a versão atual, não sendo a única possível, permite que
ela flua de forma mais natural.

Também é necessário notar que o dashboard se foca no retrato de um concelho


e do seu contexto, mas poderia ser integrada mais interatividade através da
seleção de um ponto que automaticamente ativaria esse concelho, mas isso
obrigaria à utilização de VBA. Uma forma de facilitar a identificação dos pontos
extremos na variável IDT é através do mapa, onde podemos escolher apenas os
concelhos nos extremos.

É importante ter a consciência de que um especialista em visualização de


informação ajudar a elevar a literacia gráfica de uma organização e a estruturar
melhor a análise dos dados, mas falta-lhe algo essencial: a sensibilidade aos
conteúdos específicos. Daí que qualquer exemplo genérico tenha de ser avaliado
e ajustado a esses conteúdos.

O foco numa área particular de uma organização fictícia (vendas da empresa


Acme) é legítimo em contexto formativo, mas o exemplo que iremos analisar
parte de dados associados a um problema muito concreto, o envelhecimento da
população. No nosso cenário, o dashboard identifica os concelhos portugueses
onde esse problema é mais acentuado, mostrando cada um nos contextos
regional e nacional. Teremos de criar uma lista de indicadores-chave (KPI) e
observar a sua evolução.
Pág. 21 A CONSTRUÇÃO DO DASHBOARD

Como exemplo prático, o dashboard procura equilibrar uma análise consistente


dos dados e a utilização de técnicas variadas de Excel para organização de
dados, elaboração de gráficos e desenho de dashboards.

A principal tabela de dados para este projeto contém dados de população


residente por concelho tal como reportados nos quatro últimos censos da
população do INE. Uma segunda tabela contém as coordenadas do centro de
cada concelho e a respetiva área. Os campos da tabela de população são os
seguintes:

• Nome do concelho;
• DTCC: código do concelho, definido pelo INE e correspondente ao código
do distrito (DT) e do concelho nesse distrito (CC).
• NUTS de nível 3: as NUTS são nomenclaturas regionais comuns a todos
os países da União Europeia. O nível 3 corresponde, em Portugal, a
agregações de concelhos. A nomenclatura sofre revisões periódicas, não
apenas porque têm de ser ajustadas a alterações administrativas, como os
países procuram otimizar o acesso a fundos regionais (um concelho
desenvolvido que eleve a sua região para níveis não elegíveis evitará que
concelhos menos desenvolvidos tenham acesso a esses fundos).
• Sexo: Homens e Mulheres;
• Idade: Grupos etários de cinco anos;
• IdNum: O limite mínimo do grupo etário;
• IdGrupo: tradicionalmente a população é agrupada em três grupos:
Jovens (0-14 anos), Adultos (15-64 anos) e Idosos (65 e mais anos);
• Ano: Ano a que se referem os dados. São usados os quatro últimos censos
da população: 1981, 1991, 2001 e 2011. O campo é expresso em formato
data (15-03-AAAA, porque março é habitualmente o mês de referência dos
censos) mas apenas o ano é representado;
• População: a população residente no concelho.
Pág. 22 A CONSTRUÇÃO DO DASHBOARD

Os campos da tabela de dados geográficos são os seguintes:

• Nome do concelho;
• DTCC;
• Área: expressa em km2;
• Long: correspondente ao eixo horizontal num gráfico de dispersão;
• Lat: correspondente ao eixo vertical num gráfico de dispersão;

Note que os dados de latitude e longitude são apenas valores utilizados num
gráfico de dispersão e não devem ser considerados como geograficamente
precisos. Isto resulta da necessidade de aproximar as regiões autónomas do
Continente, colocando-as numa localização fictícia.

Um dos principais problemas com que a humanidade se debate é o do


envelhecimento da população. Isto é particularmente sentido em Portugal, que
tem uma das estruturas demográficas mais envelhecidas da Europa.

O envelhecimento da população tem impacto nos sistemas de saúde e de


segurança social, entre outros. Uma das formas mais rápidas de analisar este
problema é assumir que a população adulta (15-64 anos) é geradora de riqueza e
a população jovem (0-14) e a população idosa (65+ anos) são consumidoras de
riqueza. A população ativa (adulta) deverá ter um volume suficiente para
garantir o suporte da população não ativa (jovens e idosos).

O quociente entre o número de jovens e o número de adultos (Jovens / Adultos


x 100) é chamado de Índice de Dependência de Jovens (IDJ). O mesmo
raciocínio permite-nos calcular o Índice de Dependência de Idosos (IDI). A
soma dos dois índices resulta no Índice de Dependência Total (IDT). Este
último valor será o nosso principal indicador. O valor de 100 significa que cada
ativo terá de suportar um não-ativo. Os dados na tabela da população variam
Pág. 23 A CONSTRUÇÃO DO DASHBOARD

entre um mínimo de 39, o concelho com mais ativos, e 107, o concelho com
menos ativos. Note que dois concelhos poderão ter o mesmo valor de IDT mas
com uma composição muito distinta, pelo que é necessário observar essa
composição.

Para poder elaborar o dashboard há duas configurações que é necessário alterar,


caso não o tenha feito já, e que são representadas na Figura 9 e na Figura 10.

No menu Ficheiro, abra as Opções do Excel e, dentro destas, escolha a opção


Barra de Ferramentas de Acesso Rápido para adicionar a Máquina Fotográfica

Figura 9: Criar atalho para Máquina Fotográfica

(Figura 9). Dado que não é um dos comandos mais comuns, no campo Escolher
comandos de selecione Todos os Comandos. Procure a Máquina Fotográfica na
lista e adicione-a à lista da direita.

Ainda nas Opções do Excel, escolha Personalizar Friso para ativar o separador
Programador (Figura 10).
Pág. 24 A CONSTRUÇÃO DO DASHBOARD

Figura 10: Ativar separador de Programador

Um dashboard em Excel deverá ter um conjunto especializado de folhas que


torne fácil a compreensão da sua estrutura. Dependendo da complexidade,
deverá ter pelo menos as seguintes folhas:

• Dashboard. O dashboard concreto e que deverá ser a única folha com


que o utilizador irá interagir;
• Dados. A folha com a tabela de dados. É aqui que deverá colocar a tabela
quando os dados estão ligados a uma fonte externa;
• Tratamento. Quaisquer transformações/operações efetuadas sobre os
dados;
• Controle. Folha onde são armazenadas listas para menus e parâmetros
do sistema.

Qualquer uma destas quatro folhas pode na verdade


corresponder a grupos de folhas: um dashboard
poderá reenviar o utilizador para folhas adicionais,
Figura 11: Separadores correspondentes a tipos de folhas
enquanto é inevitável que a folha de tratamento se
distintos
Pág. 25 A CONSTRUÇÃO DO DASHBOARD

multiplique, sendo cada uma delas a fonte para os objetos gráficos do


dashboard.

É mais fácil perceber o conteúdo das folhas se der uma cor distinta a cada grupo
de separadores e usar o mesmo prefixo no nome. Procure o sistema com que se
sinta mais confortável. No fim do projeto ajuste os nomes, se necessário.

A Figura 11 mostra que temos duas folhas de dados. Os dados demográficos


foram colocados na folha b_pop e os dados geográficos foram colocados na
folha b_geo.

Chegou o momento de abrir o ficheiro com os dados originais. Copie os dados


de população e cole-os na célula A10 da folha b_pop. Copie e cole os dados
geográficos na célula $A$10 da folha b_geo. A colocação dos dados apenas na
linha 10 tem como objetivo deixar espaço para meta-dados (informação sobre os
dados) e notas.

Figura 12: Deixe algumas linhas livres acima, para introdução de informação sobre os dados e conceitos

Este projeto foca-se no desenho de um dashboard, e muito do trabalho prévio é


dado como adquirido. Mas isto não nos deve fazer esquecer o muitas vezes
Pág. 26 A CONSTRUÇÃO DO DASHBOARD

esquecido e menorizado trabalho de limpeza e de estruturação, o qual consome


muito tempo. Por exemplo, foram encontradas algumas diferenças no nome de
alguns concelhos nas duas tabelas e que tiveram de ser conciliados (há dois
concelhos com o nome Lagoa e outros dois com o nome Calheta) e foi necessário
estimar dados para os concelhos criados depois de 1981.

Porque o foco no livro é na construção do dashboard, a origem dos dados foi


simplificada para uma simples colagem numa folha. No entanto, importá-los a
partir de uma base de dados, através de algum tipo de ligação é mais seguro e
uma melhor prática.

As tabelas têm inúmeras vantagens sobre os intervalos de dados, desde a maior


segurança à maior consistência e rapidez. Na quase totalidade dos casos, faz
todo o sentido a transformação em tabelas antes de qualquer outra ação sobre
os dados. Na Figura 13 são representados de novo os primeiros registos de
população, mas agora após a transformação em tabela.

Figura 13: A tabela da população


Pág. 27 A CONSTRUÇÃO DO DASHBOARD

Para o fazer selecione uma célula com dados (A10, por exemplo) e escolha o
menu Inserir e de seguida Tabela. Verifique se o intervalo proposto está correto,
inclua os cabeçalhos e ative essa opção na janela. Note que, enquanto estiver no
interior da tabela, terá disponível uma nova opção de menu, Estrutura. Escolha-
a e altere o nome da tabela para tbpop. Repita o processo com os dados
geográficos, alterando o nome da tabela para tbgeo.

O dashboard é o retrato de um concelho selecionado pelo utilizador, pelo que a


primeira coisa a fazer é encontrar a mecânica de seleção desse concelho. Tal
como em muitas outras áreas do Excel, isto pode ser feito de várias formas.

Antes de definir o método de seleção, é necessário distinguir entre “selecionar” e


“filtrar”. Quando selecionamos um concelho apenas apontamos para um ou
vários registos correspondentes a essa seleção na tabela de dados. Quando
filtramos, excluímos todos os registos que não correspondem ao critério de
seleção. O dashboard contém várias tabelas dinâmicas, e usaremos uma delas
para referenciar o concelho ativo, aplicando essa referência ao resto do sistema.

Vamos criar uma tabela dinâmica que será mais tarde a fonte para a criação das
sparklines.

1. Escolha no menu, com base na tabela de dados demográficos, Inserir e


Tabela Dinâmica;
2. Coloque-a numa nova folha a que dará o nome de t_sparklines;
3. Escolha Analisar e Nome da Tabela Dinâmica e dê-lhe o nome ptSpark;
Pág. 28 A CONSTRUÇÃO DO DASHBOARD

Figura 14: Definição da tabela dinâmica

Observe a Figura 15. Nos Filtros foi colocado o nome do Concelho, e os dados já
foram filtrados para um concelho. Em Linhas, foi incluído o campo IdNum. No
campo Colunas foi colocado o campo Ano e nos Valores foi colocado o campo
Populacao. Dado que o campo Ano é entendido como data, a tabela dinâmica
sugere que os dados sejam agrupados, acrescentando automaticamente Anos e
Trimestres, o que não é relevante para os nossos dados, porque são dados
anuais. Daí que seja necessário desagrupar os valores. Para isso, escolha um dos
anos, com o botão do lado direito do rato, ative o menu e escolha Desagrupar.
Os ícones “+” desaparecem.
Pág. 29 A CONSTRUÇÃO DO DASHBOARD

Figura 15: Primeira tabela dinâmica

Iremos mais tarde voltar a esta tabela para a preparar para o seu uso final. O
que queremos neste momento é que ela apresente apenas os dados de um
concelho, e não de todos. Para que possamos fazer isso não apenas na folha da
tabela dinâmica, mas noutra folha qualquer, vamos inserir uma segmentação de
dados.
Pág. 30 A CONSTRUÇÃO DO DASHBOARD

Com a tabela dinâmica selecionada, escolha Analisar e


Inserir Segmentação de Dados. Da lista de campos, escolha
Concelho. Quando escolher apenas um concelho da
segmentação irá vê-lo no filtro da tabela dinâmica.

Para que não seja necessário procurar a segmentação de


dados cada vez que precisarmos dela, é preferível colocá-la
desde já na folha do dashboard. Com o botão direito do rato,
escolha Cortar. Selecione a folha d_ e cole aí a janela de
segmentação. Escolha para outro concelho e verifique se esse
é agora o concelho ativo na folha t_sparklines.

Em certas fórmulas será necessário identificar o concelho


ativo, o que na prática corresponde a saber qual o conteúdo
na folha t_sparklines da célula identificada como B1 na
Caixa de nome (o retângulo abaixo do menu Ficheiro).
Selecione a célula B1 e, na Caixa de nome, escreva refSelConc
(ou seja, referência de concelho ativo). Se preferir, escolha
outro nome, embora para a sequência de aprendizagem seja
preferível manter os nomes propostos.

Figura 16: Segmentação de dados: desenho e Neste capítulo criámos os grupos de folhas que nos serão
seleção úteis na construção do dashboard, transformámos os dados
de população e geográficos em tabelas e fizemos uma tabela
dinâmica que nos vai servir para filtrar e identificar o concelho ativo. No
próximo capítulo começaremos a criar os objetos gráficos que serão utilizados
no nosso dashboard.
Se o que diferencia a visualização de informação é a sua
capacidade de nos mostrar relações entre pontos, e se um
velocímetro apenas representa um ponto, talvez possamos
concluir que o velocímetro não é um gráfico. O silogismo é
tentador, mas neste caso serve apenas para recordar que
alguns gráficos são muito ineficientes e que nos ajudam pouco
Figura 17: A versão final do velocímetro a compreender os dados.

Os gráficos circulares e os velocímetros estão nesse grupo, pelo que devem ser
usados com muita parcimónia. Um uso excessivo de gráficos ineficazes sugere
que não está a tirar todo o valor dos dados disponíveis, e é um potencial sintoma
de insuficientes competências de análise de dados na organização.

No entanto, a visualização de informação é útil numa tão grande diversidade de


situações que é difícil ser dogmático em relação a quaisquer regras. Ter uma boa
literacia gráfica ajuda-nos a identificar os casos em, no nosso entender, certas
regras poderão dar lugar a outras.

Deste modo, se temos um cenário em que identificámos um indicador-chave a


partir do qual vamos acrescentar camadas sucessivas de informação relevante,
não é descabido apresentar esse indicador num velocímetro, o que também
facilita a relação com os seus fans.

Não devemos, no entanto, ceder à tentação de reduzir o nosso dashboard a um


conjunto de velocímetros. Daí que seja útil introduzir um critério adicional para
a sua utilização: ele só poderá ser usado quando serve como porta de entrada
para outros dados. Dito de outra forma, deverá existir uma relação direta entre
Pág. 32 O VELOCÍMETRO

o velocímetro e outros objetos gráficos que o complementem. No caso do nosso


dashboard, será o gráfico de pontos que iremos colocar abaixo, e que veremos
no próximo capítulo.

Concelho Albufeira Como regra, desenharemos um gráfico em cada nova folha do


Ano 1981 ficheiro (haverá exceções a esta regra, para não criar
redundâncias desnecessárias). Também copiaremos folhas
Rótulos de Linha Soma de Populacao
Adultos 100.00% existentes, ajustando-as às necessidades dos novos gráficos.
Jovens 31.70% Este é o caso da fonte de dados para o velocímetro. Copie a
Idosos 23.37% folha t_sparklines com as teclas Crtl-Shift e arraste o
Total Geral
separador para criar uma cópia desta folha. Altere o nome
Figura 18: A base para o velocímetro
para t_velocimetro e o nome da tabela dinâmica para
ptVelocimetro. De seguida restruture a tabela de acordo com a Figura 18: mova
Ano para o campo de Filtros e nas Linhas substitua IdNum por Grupo.

Iremos usar o velocímetro para representar o IDT, e seria fácil fazer os cálculos
a partir dos valores absolutos. Em vez disso, e para usar uma funcionalidade
interessante das tabelas dinâmicas, vamos fazer o cálculo de ambos os índices
parciais (Jovens e Idosos) na própria tabela. Para isso, ative uma das células
com valores e, com o botão do lado direito do rato, escolha Mostrar valores
como e % De… Na janela seguinte escolha Grupo no Campo Base e Adultos no
Item Base. Desta forma, podemos ver de imediato que IDJ no concelho
escolhido é de 31.7% e de 23,37% no caso do IDI, sem necessidade de cálculos
adicionais (evite o uso de fórmulas quando há alternativas de cálculo mais
seguras).

Note que esta tabela não só filtra os dados para um único concelho como
também o faz para um único ano. Isto permite-nos criar uma nova segmentação
de dados para filtrar esse campo. No entanto, comecemos pelo concelho.
Pág. 33 O VELOCÍMETRO

Figura 19: Verificação das ligações entre as duas tabelas dinâmicas

Em versões anteriores do Excel, era necessário criar uma rotina em VBA para
sincronizar múltiplas tabelas dinâmicas. A segmentação de dados eliminou essa
necessidade. O facto de existirem neste momento duas tabelas filtradas por
concelho significa que temos de as sincronizar para que, quando escolhemos um
concelho na segmentação, isso se reflita em ambas. Como uma é uma cópia da
outra, isso em princípio está assegurado, mas noutros casos não será assim.
Para confirmar que elas estão a usar a mesma segmentação de dados, selecione
a folha d_ e, com o botão do lado direito do rato sobre a segmentação, escolha
Ligações do Relatório. Deverá obter uma lista como a da Figura 19, onde deverá
ativar todas as tabelas que quer que sejam sincronizadas por esta segmentação
de dados no campo Concelho. De regresso à folha t_velocimetro, crie uma nova
segmentação de dados com o Ano. Filtre para 2011. Mova a nova segmentação
para junto da anterior na folha d_.

Tal como fizemos com o concelho, também haverá casos em que quereremos
determinar o ano ativo numa fórmula. Altere o nome da célula B2 na folha
t_velocimetro para refSelAno. Ela passará a ser a nossa referência nestes casos.
Pág. 34 O VELOCÍMETRO

O velocímetro tem a forma de uma semicircunferência. Para criar o mostrador


usaremos um gráfico Anel, em que a semicircunferência inferior é invisível. Os
valores para ambas terão de ser iguais. Em muitos casos, o índice a representar
tem um valor que se situa no intervalo 0-100. Assim,
o total dos segmentos visíveis do anel deve ser 100,
tal como o valor do segmento invisível.

No caso do IDT, o valor máximo atinge 107, sendo


39 o valor mínimo. Iremos usar uma escala que
varia entre 30 e 110. Isto coloca um problema,
porque o valor 107 irá apontar no gráfico para a
semicircunferência invisível. Para o resolver,
teremos de fazer corresponder o valor 30 a zero e
110 a 100. O valor do índice terá de ser
transformado através de interpolação linear. No
entanto, isso não será percetível para o utilizador: se
o IDT é de 63, ele terá de ler 63 no gráfico. Note que
este procedimento será válido mesmo para o caso
em que o valor do índice escolhido se situe entre
zero e 100.

Figura 20: Parâmetros do velocímetro Vamos começar por resolver o problema da


transformação dos valores. Na Figura 20 são
representados alguns dos parâmetros necessários à construção do velocímetro.
Comece por inserir os textos nas células de coluna F. Introduza os valores
mínimo e máximo na coluna G e dê às células com esses valores o nome
indicado em itálico na coluna H. Por exemplo, deverá dar à célula G4 o nome
pvelMin. Faça o mesmo para as restantes células. O raio é, como sabe, a reta
entre o centro de uma circunferência e o seu perímetro. Para efeitos práticos, ele
Pág. 35 O VELOCÍMETRO

indica neste caso o comprimento do ponteiro. Crie também uma tabela idêntica
à da Figura 21 e dê-lhe o nome tbVelMostra.

O valor atual corresponde à soma de Jovens e Idosos na tabela dinâmica. O


resultado foi multiplicado por 100. Introduza na célula uma referência somando
as respetivas células na tabela dinâmica. Se, ao fazê-lo, não aparecer a função
OBTERDADOSDIN() selecione qualquer célula da tabela dinâmica e escolha o
menu Analisar e Opções. Aqui, ative a opção Gerar ObterDadosDin. A fórmula
terá o seguinte teor:

=(OBTERDADOSDIN("Populacao",$A$4,"IdGrupo","Jovens")+OBTERDADOSDIN("Populacao",$A$4,"
IdGrupo","Idosos"))*100

O primeiro membro da soma pode traduzir-se como “obter os valores da


População na tabela dinâmica da célula $A$4, correspondente ao valor ‘Jovens’
do campo IdGrupo. O segundo membro é equivalente. A soma dos dois
corresponde ao IDT.

A fórmula que irá transformar o IDT num valor no intervalo 0-100 é a seguinte:

=(pvelAtual-pvelMin)*((100)/(pvelMax-pvelMin))

A interpolação linear para o valor 63, por exemplo, corresponderia a:

=(63-30)*((100)/(110-30))=41.2

Figura 21: Tabela para o


anel, colocada na célula K3

Dar nomes a intervalos de células é uma boa prática. Calcular =Vendas-Custos em


vez de =$B$234-$F$465 é um exemplo clássico das vantagens. Se quiser somar toda
a coluna Escala da tabela tbVelMostra poderá usar a fórmula:

=SOMA(t_velocimetro!$L$4:$L$19).
Pág. 36 O VELOCÍMETRO

Mas, porque se trata de coluna de uma tabela, é mais claro usar:

=SOMA(tbVelMostra[Escala]).

A diferença é muito maior que o simples uso de uma referência mais


compreensível: o segundo caso é um intervalo dinâmico, e se acrescentar linhas
à tabela o intervalo será atualizado, bem como a soma.

Outra boa prática é usar nomes e não o sistema de


referência normal quando introduzimos dados num
gráfico. Se esse nome for dinâmico, não precisará de se
preocupar em atualizar as referências quando
acrescentar novos dados, porque elas serão atualizadas
automaticamente.

Infelizmente, o Excel não reconhece ainda uma coluna de


uma tabela como fonte para um gráfico, pelo que, se
definirmos =tbVelMostra[Escala] ele transformá-la-á em
Figura 22: Criação de nome associado a uma coluna de =t_velocimetro!$L$4:$L$19. Para que a referência dinâmica
tabela
se mantenha, teremos de recorrer a um pequeno truque:
criar um novo nome cujo intervalo é a coluna. Será esse nome que
introduziremos no gráfico. Para criar o novo nome (Figura 22):

1. No menu, selecione Fórmulas, seguido de Gestor de Nomes;


2. Crie um Novo intervalo com o Nome pvelEscala;
3. Selecione toda a coluna Escala da tabela tbVelMostra, com exceção do
cabeçalho.

No campo Refere-se a: o sistema de referência normal dos intervalos é


substituída pelo sistema de referência das tabelas, representado por
Pág. 37 O VELOCÍMETRO

=tbVelMostra[Escala], como ilustrado pela Figura 22. Seguindo os mesmos passos,


crie um novo intervalo com o nome pvelEtiquetas, correspondente à coluna
Etiquetas da mesma tabela (para facilitar a localização de nomes de intervalos
para cada gráfico, use o mesmo prefixo para cada grupo de nomes: neste caso, o
prefixo pvel será usado para todos os nomes associados aos parâmetros
velocímetro).

Note a estrutura a tabela tbVelMostra na Figura 21: cada segmento da parte


visível do anel tem o valor 10, porque esse é o intervalo que decidimos usar. O
último segmento terá de ser igual à soma dos restantes, para criar o efeito de
semicircunferência.

Se associarmos um rótulo a cada uma dos segmentos de valor 10, esse rótulo
será representado a meio do segmento, quando na realidade queremos que eles
sejam colocados entre os segmentos, junto às linhas separadoras. É essa a razão
da existência de segmentos de valor zero, os únicos que têm rótulos.

Figura 23: Fase de construção da escala do velocímetro

Para passar do anel inicial para a escala do velocímetro mostrado na Figura 23:

1. Selecione a coluna Escala e, no menu Inserir, escolha um Gráfico Circular ou


em Anel e de seguida Anel;
Pág. 38 O VELOCÍMETRO

2. Com o botão do lado direito do rato sobre o gráfico, escolha Selecionar


dados… e de seguida Editar a série;
3. Defina o nome da série como Escala e altere a referência aos Valores da série
para =t_velocimetro!pvelEscala, ou seja, para o nome da folha e o nome que
definimos, separados por um ponto de exclamação. Também pode, como
mostra a figura, usar o nome do ficheiro, em substituição do nome da folha;
4. Apague a legenda e o título, que não serão necessários;
5. Selecione a série e, com o botão do lado direito do rato, escolha Formatar
Séries de Dados… e, nas Opções de Série (o ícone com um gráfico de barras)
modifique o Ângulo do 1º setor para 270º.
6. Selecione apenas o setor inferior e, com o botão do lado direito do rato,
defina o Preenchimento para Sem Preenchimento e o Contorno para Sem
Contorno;
7. Selecione os setores de valor 10 um a um, altere o seu preenchimento para
três níveis de intensidade;
8. Selecione a Área do Gráfico e, nas opções de Preenchimento e Linha (ícone
com uma lata de tinta) defina o Limite para Sem linha.

O resultado final deverá ser semelhante ao da imagem na Figura 23.

Figura 24: Fases na introdução dos rótulos

Como vimos, os intervalos de valor zero são usados para posicionar


corretamente os rótulos. Para o conseguir, como mostra a Figura 24:
Pág. 39 O VELOCÍMETRO

1. Adicione uma nova série de dados, usando de novo a coluna Escala e dando-
lhe o nome Rotulos;
2. Selecione essa nova série e, com o botão do lado direito do rato, escolha
Adicionar Rótulos de Dados (gráfico 1);
3. Selecione os rótulos de dados e, nas Opções de Rótulo, ative o campo Valor a
Partir de Células;
4. Na janela seguinte introduza o nome definido anteriormente:
=t_velocimetro!pvelEtiquetas;
5. Desative os campos Valor e Mostrar Linhas de Cotas ou outros, caso estejam
ativos (gráfico 2);
6. Selecione a série Rotulos e, com o botão do lado direito do rato, defina o
Preenchimento para Sem Preenchimento e o Contorno para Sem Contorno
(gráfico 3).

Crie uma tabela idêntica à da Figura 25 e dê-lhe o nome


tbVelPonteiro. Ela define a localização das extremidades do
ponteiro. Entenda estes valores como coordenadas num plano
Figura 25: Tabela para coordenadas do cartesiano, no qual o centro corresponde às coordenadas 0,0. É esse
ponteiro
o sentido da primeira linha da tabela. Introduza os valores na linha
Seta (iremos substituí-los por fórmulas em breve). Crie dois novos nomes,
pvelPontaX e pvelPontaY, correspondentes às colunas PontaX e PontaY da
tabela.

Para criar o velocímetro, iremos combinar o gráfico anel com um gráfico de


dispersão. Esse gráfico terá valores entre -5 e 5, tanto no eixo vertical como no
eixo horizontal. Recorde que, no início, calculámos uma transformação do valor
do IDT (pvelTrans) compatível com a escala do velocímetro.

Tendo o valor de uma semicircunferência o valor π, correspondente à função


PI() em Excel, usaremos as funções de seno (para y) e cosseno (para x) para
Pág. 40 O VELOCÍMETRO

determinar as coordenadas da seta, a partir do valor transformado pvelTrans.


Assim, para calcular os valores:

1. Valor de x: usamos a fórmula: =COS(PI()*pvelTrans)*pvelRaio


2. Valor de y: usamos a fórmula: =SIN(PI()*pvelTrans)*pvelRaio

Note que ambas as fórmulas incluem o multiplicador pvelRaio, que define o


comprimento do ponteiro. Se necessário, ajustá-lo-emos no dashboard. Estas
fórmulas são introduzidas na linha “Seta”, em substituição dos valores
introduzidos anteriormente.

Figura 26: Fases de introdução do ponteiro no velocímetro

Para concluir o velocímetro resta-nos inserir o ponteiro, que terá as fases


representadas na Figura 26. Para isso:
Pág. 41 O VELOCÍMETRO

1. Adicione uma nova série ao gráfico, usando pvelPontaX e dando-lhe o nome


Ponteiro. O resultado será semelhante ao gráfico 1;
2. Escolha essa nova série e com o botão do lado direito do rato, escolha Alterar
Tipo de Gráfico da Série…
3. Defina a série Ponteiro para a última das opções no gráfico de dispersão
(gráfico 2);
4. Edite a série Ponteiro e introduza os Valores da série X
(=t_velocimetro!pvelPontaX) e Valores da série Y (=t_velocimetro!pvelPontaY). O
resultado corresponderá ao gráfico 3;
5. Selecione o eixo X e escolha Formatar Eixo, definindo os seus limites
mínimo para -5 e máximo para 5.;
6. Repita o passo anterior para o eixo Y. É importante verificar se os quatro
valores estão em modo manual (deverá ver a indicação Repor à direita). Se
deixar algum deles em modo Automático irá desconfigurar o gráfico. Estes
passos correspondem ao gráfico 4.

Vamos agora formatar o velocímetro:

1. No eixo horizontal, os valores começam à direita, enquanto a nossa escala


começa à esquerda. Para que a seta aponte para o local correto, ative o eixo,
escolha Formatar Eixo com o botão do lado direito do rato e, nas Opções de
Eixo, ative o campo Valores em Ordem Inversa;
2. Remova tudo o que não queira mostrar: linhas de grelha, eixos, etiquetas de
eixos;
3. Ative o Ponteiro e selecione Formatar Série de Dados com o botão do lado
direito do rato;
4. Na secção de Preenchimento e Linha, em Linha defina o Tipo de Seta de
Início para seta oval;
5. No Tamanho de Seta de Início, escolha o maior;
6. No Tipo de Seta de Fim escolha a seta fechada;
7. No Tamanho de Seta de Fim, escolha o maior;
8. Altere a cor do Ponteiro para azul escuro;
9. Selecione a área do gráfico e defina o Limite para Sem Linha.

Para testar o velocímetro, selecione a folha d_, onde deixámos a segmentação


de dados, e escolha um outro concelho. Regresse à folha t_velocimetro e
Pág. 42 O VELOCÍMETRO

verifique se o ponteiro se moveu como esperado. Em particular, se a base se


afastou do centro da circunferência isso significa que algum dos valores máximo
e mínimo dos eixos está configurado para modo automático. Introduza de novo
o valor para reverter para modo manual.

Neste capítulo, vimos uma das formas de criar velocímetros em Excel. Talvez
mais relevante que isso, percebemos a importância de usar intervalos dinâmicos
e, do ponto de vista mais estrito da representação gráfica, que o Excel é bastante
tolerante quando à combinação de vários tipos de gráficos. Com alguma
criatividade, quase sempre é possível obter o desenho que pretendemos. No
próximo capítulo iremos penitenciarmo-nos do uso do velocímetro através da
criação de um gráfico de pontos.
O gráfico de pontos representa, tal
como o velocímetro, o Índice de
Dependência Total. No entanto, e
ao contrário do velocímetro, o
gráfico de pontos permite
Figura 27: O gráfico de pontos responder a uma das perguntas
que Edward Tufte considera
essenciais da visualização de informação: “comparado com quê?” O gráfico de
pontos coloca, ao longo de um eixo, todas as entidades (concelhos) segundo o
seu IDT. Não é nosso objetivo identificar cada um desses pontos. O que
queremos saber é, de uma forma rápida, como se compara o concelho ativo com
esses pontos. Os concelhos da mesma região foram isolados, pelo que é possível
uma dupla comparação, com a região e com os restantes concelhos do país.
Foram ainda introduzidos alguns pontos de referência, como a mediana e os
quartis.

Para criar o gráfico de pontos vamos precisar de uma tabela com todos os
concelhos e respetivos IDT. Não sendo estritamente necessário, vamos criar
duas folhas, uma para alojar a tabela dinâmica com os cálculos e uma segunda
folha com os valores para os gráficos. Os passos para preparar os dados são os
seguintes:

1. Insira uma nova folha com o nome t_pontosTD e outra com o nome
t_pontos;
Pág. 44 O GRÁFICO DE PONTOS

2. Na folha t_velocimetros já temos os valores dos índices de Jovens e de


Idosos calculados, pelo que podemos aproveitar esses cálculos. Para isso,
copie a tabela dinâmica (o intervalo $A$1:$B$8) para a folha t_pontosTD.
3. Em Analisar, altere o nome para ptPontos.
4. Mantenha o Ano nos Filtros, mova Concelho para as Linhas e IdGrupo para
as Colunas.
5. Em Opções de Tabela Dinâmica, no separador Totais e Filtros, desative o
campo Mostrar totais gerais das linhas;
6. Se o filtro de Ano estiver na linha 2, apague a linha 1 (Figura 28);
7. Na folha d_, com o botão do lado direito do rato sobre a segmentação por
ano, escolha Ligações de Relatório e confirme que a tabela ptPontos está
ativa;

Figura 28: configuração da tabela dinâmica para uso no gráfico de pontos

8. No caso desta tabela dinâmica, queremos que ela seja filtrada por Ano, mas
não por Concelho. Teremos de verificar nas segmentações de dados se é essa
a configuração ativa.
9. Na folha d_, com o botão do lado direito do rato sobre a segmentação por
Concelho, escolha Ligações de Relatório. Dado que copiámos esta tabela
dinâmica, ela deverá estar ativa. Nesse caso, desative-a, ficando apenas as
tabelas ptSpark e ptVelocimetro ativas;

Agora criamos a tabela que será cliente destes dados:


Pág. 45 O GRÁFICO DE PONTOS

1. Selecione a folha t_pontos e copie para a célula A10 uma lista de concelhos.
Use, por exemplo, as três primeiras colunas da tabela de dados geográficos;
2. Transforme estes dados numa tabela com o nome tbPontos;
3. Acrescente uma nova coluna com o cabeçalho IDT à nova tabela;
4. Na primeira linha dessa nova coluna, insira uma referência para um valor
numérico na tabela dinâmica ptPontos.
5. Será gerada uma fórmula com função OBTERDADOSDIN() semelhante a
esta:
=OBTERDADOSDIN("Populacao",t_pontosTD!$A$3,"Concelho","Avis","IdGrupo","Jovens")
6. Edite a célula e substitua o nome do concelho por [@Concelho], para que a
função OBTERDADOSDIN() obtenha os dados para o concelho na respetiva
linha;
7. Acrescente uma referência para Idosos para obter o IDT. O conteúdo da
célula será, assim:
=(OBTERDADOSDIN("Populacao",t_pontosTD!$A$3,"Concelho",[@Concelho],"IdGrupo","Jove
ns")+OBTERDADOSDIN("Populacao",t_pontosTD!$A$3,"Concelho",[@Concelho],"IdGrupo","I
dosos"))*100

Estes dados serão colocados ao longo do eixo horizontal do gráfico, permitindo


observar a distribuição dos concelhos, localizando as zonas de maior
concentração e as de valores extremos. Para facilitar a comparação entre o
concelho ativo com os concelhos na mesma região e com os restantes concelhos,
vamos separar verticalmente esses grupos em três níveis, em que o concelho
ativo ocupará o nível superior, a região o nível intermédio e os restantes
concelhos o nível inferior. Usaremos um gráfico de dispersão para esta
representação, no qual o valor do índice é alocado ao eixo horizontal, os
elementos do grupo Concelho terão o valor 4 no eixo vertical, os elementos do
grupo NUTS3 terão o valor 3 e os elementos dos restantes concelhos terão o
valor 2.

Seria possível usar uma única série para criar a representação gráfica assim
descrita. No entanto, porque queremos diferenciar visualmente o concelho dos
Pág. 46 O GRÁFICO DE PONTOS

restantes grupos, iremos criar três séries, a partir da segmentação do IDT. Antes
de o fazermos, é necessário determinar qual a região do concelho ativo, algo que
ainda não fizemos. Para isso, basta usar a função PROCV() na tabela de dados
geográficos. Seria possível determinar este dado de cada vez que precisássemos
dele mas, dentro do espírito de reduzir a complexidade e número de fórmulas,
vamos fazê-lo apenas uma vez e guardar o valor.

Este é um dado que devemos armazenar na folha de controle. Selecione a folha


c_ e escreva, na célula A1, “NUTS3 do concelho ativo”. Na célula B2, introduza a
fórmula:

=PROCV(refSelConc,tbgeo[[Concelho]:[NUTS3]],3,FALSO)

Dê a esta célula o nome refSelNUTS3.

Figura 29: Segmentação do valor de IDT em três colunas

De seguida, iremos colocar o valor do IDT para o concelho ativo numa coluna, o
valor para os concelhos da região noutra coluna e o valor dos restantes
concelhos numa terceira coluna (Figura 29). Para isso:

1. Adicione três novas colunas na tabela tbPontos: IDTConcX, IDTNUTSX e


IDTNacX.
2. Na coluna IDTConcX, teste se o concelho nessa linha é o concelho ativo:
=SE([@Concelho]=refSelConc,[@IDT],NÃO.DISP())
Pág. 47 O GRÁFICO DE PONTOS

3. Se o concelho na linha for igual ao concelho em refSelConc, inserimos o


valor da coluna IDT. Caso contrário, introduzimos uma mensagem de erro
NÃO.DISP() para que o valor não apareça na linha de concelho;
4. Na coluna IDTNUTSX iremos fazer algo semelhante mas, como não
queremos repetir o concelho, teremos de ter uma outra condição lógica, a de
que a NUTS3 do concelho ativo tem de ser igual à da linha, mas também que
o concelho da linha não pode ser o concelho ativo:
=SE(E([@NUTS3]=refSelNUTS3,É.NÃO.DISP([@IDTConcX])),[@IDT],NÃO.DISP()).
Para testar se é o concelho ativo poderíamos comparar os nomes dos
concelhos ou, como foi feito aqui, verificar se a coluna anterior retorna um
erro #N/D;
5. Aplicando a mesma lógica, se ambas as colunas retornam um erro #N/D
então o concelho da linha faz parte do grupo dos restantes concelhos:
=SE(E(É.NÃO.DISP([@IDTNUTSX]),É.NÃO.DISP([@IDTConcX])),[@IDT],NÃO.DISP())

Agora que temos os valores do eixo horizontal, precisamos dos valores do eixo
vertical. Insira três novas colunas com os nomes IDTConcY, IDTNUTSY e
IDTNacY, que deverão ter os valores 4, 3 e 2, respetivamente. Insira os valores

Figura 30: Lista de nomes criados para o gráfico de pontos


Pág. 48 O GRÁFICO DE PONTOS

na primeira linha e copie-os para o resto das linhas. É necessário agora criar seis
novos intervalos correspondentes às seis colunas inseridas. Use o nome das
colunas com o prefixo “ppt”. Observe a lista na Figura 30.

Fazer o gráfico é relativamente simples:

1. Escolha uma célula longe da tabela e insira um gráfico de dispersão apenas


com pontos (a primeira opção).
2. Escolha Selecionar Dados com o botão do lado direito do rato e prima o
botão Adicionar para introduzir uma nova série;
3. Dê o nome Concelho à série, com =t_pontos!pptIDTConcX como Valores da série
X e =t_pontos!pptIDTConcY como Valores da série Y;
4. Acrescente a série NUTS3 e Nacional da mesma forma (se necessário,
verifique na Figura 30 os nomes atribuídos).

O resultado inicial do gráfico é apresentado no gráfico 1 da Figura 31 (apenas foi


alterada a escala do eixo horizontal para os valores entre 30 e 110). Teremos
ainda algum trabalho de limpeza, mas uma coisa que nos deve preocupar
quando vemos uma linha contínua feita de marcadores é a de que poderemos
estar a avaliar mal os dados devido à sobreposição de pontos.

Há algumas estratégias para minimizar esse problema ou que, pelo menos,


mostrem que ele existe, para que seja corrigido. Uma das estratégias de
minimização é a redução ao essencial da largura do marcador, o que no caso dos
círculos não é muito prático, pois reduz o tamanho do marcador a um ponto
demasiado pequeno. Idealmente, usaríamos um traço vertical, mas o Excel não
Pág. 49 O GRÁFICO DE PONTOS

Figura 31: Gráfico inicial e utilização das barras de erro

oferece de raiz essa opção. No entanto, dado que a aplicação permite usar uma
imagem como marcador, criar uma imagem de 1 x 10 pixels pode ser uma
solução.

Outra a solução é a de usar as barras de erro. As barras de erro são usadas


comumente para mostrar que os dados podem não ser exatos: uma sondagem
com uma margem de erro de 3% significa que uma resposta de 24% poderá na
verdade situar-se até 3% acima ou abaixo disso, ou seja, no intervalo 21%-27%.
Quando, numa sondagem, dois partidos políticos obtêm intenções de voto
próximas, fala-se de “empate técnico” se os dois valores estão dentro da mesma
banda de variação. As barras de erro são pouco usadas (infelizmente) para
expressar essa incerteza, mas elas estão disponíveis no Excel para utilizações
criativas. Para as usar como marcadores:

1. Ative as barras de erro da série Nacional.


2. Em Formatar Série de Dados, se escolher Opções de Gráfico, encontrará sob
a série referências para as barras de erro, tanto para o eixo vertical como
para o eixo horizontal (como o gráfico de dispersão tem dois eixos
quantitativos, o Excel insere barras de erro para ambos). No entanto, neste
gráfico não precisamos das barras horizontais, pelo que deverá escolher em
Formatar Séries de Dados a Série “Nacional” Barras de Erro em X e apagá-
las.
Pág. 50 O GRÁFICO DE PONTOS

3. Escolha a Série “Nacional” Barras de Erro em Y e,


nas opções, escolha Ambas em Direção, Sem Linhas no
Estilo Final e, no Montante de Erro, escolha um valor
fixo (0.2) ou mantenha o valor pré-definido;
4. Escolha de novo a série e, nas Opções de Marcador,
escolha Nenhum, dado que estamos a usar as barras de
erro como marcador;
5. Repita os passos 1-4 para a série NUTS3;
6. No caso do Concelho, defina a Direção para Menos,
Sem Linhas no Estilo Final e, no Montante de erro, use
uma Percentagem de erro de 100%. Isto cria uma linha
vertical que liga o ponto ao eixo horizontal.

O resultado final, o gráfico 2 da Figura 31, dá-nos uma

Figura 32: Barras de erro na série Nacional


ideia muito mais clara da distribuição dos pontos. Nas
opções de Preenchimento e Linha das barras de erro
nas séries Nacional e NUTS3 foi escolhido o preto como Cor, uma
Transparência de 50% e Largura de linha de 0.25pt.

Antes de definir os pontos de referência nesta distribuição, é necessário


sublinhar que cada linha corresponde a um concelho e que os pontos de corte na
distribuição apenas indicam quantos concelhos estão em cada intervalo. Mas, se
10 concelhos têm IDT elevado e apenas um tem um valor baixo, isso não
significa que, globalmente, a população esteja envelhecida: o volume de
população do concelho mais jovem pode ser superior ao conjunto de todos os
outros 10 concelhos.

Um dos pontos essenciais em qualquer análise é ter sempre presente com que
conceitos estamos a trabalhar, para que não tiremos conclusões erradas de uma
análise que poderá estar correta, mas que não analisa aquilo que pensamos que
Pág. 51 O GRÁFICO DE PONTOS

analisa. Não o faremos aqui, mas poderíamos, por exemplo, fazer variar o
comprimento dos marcadores em função do volume de população, ou observar
que quantidade de população corresponde à mediana nos concelhos.

Para criar pontos de corte que mostrem como estão distribuídos os


pontos ao longo do eixo usaremos os quartis Q1 (os 25% de concelhos
com IDT mais baixo), Q2 (os 50% de concelhos com IDT mais baixo) e
Q3 (os 75% de concelhos com IDT mais baixo), em que o quartil Q2
corresponde à mediana. Também vamos calcular o intervalo a partir

Figura 33: Métricas do IDT


do qual se localizam os valores extremos.

Crie na folha t_pontos a tabela da Figura 33 com o nome tbPontosMetricas. Os


valores para cada linha são ose seguintes:

1. -X. O valor mínimo a partir do qual os valores abaixo são considerados


extremos (população com um peso anormal de população adulta). O cálculo
é dado pela fórmula Q1-(Q3-Q1) x 1.5 ou, no formato de Excel, =N3-(N5-
N3)*1.5.
2. Q1. Tem a fórmula =QUARTIL.EXC(tbPontos[IDT],1)
3. Q2. Tem a fórmula =QUARTIL.EXC(tbPontos[IDT],2)
4. Q3. Tem a fórmula =QUARTIL.EXC(tbPontos[IDT],3)
5. +X. O valor máximo a partir do qual os valores acima são considerados
extremos (população com um peso anormalmente baixo de população
adulta). O cálculo é dado pela fórmula Q3+(Q3-Q1) x 1.5 ou, no formato de
Excel, =N5+(N5-N3)*1.5.

Para introduzir esta nova série crie nomes para Metrica, MetricaX e MetricaY:
pptMetrica, pptMetricaX e pptMetricaY. O nome da nova série será Métrica.

Altere os marcadores para pequenos triângulos com preenchimento laranja e


sem limite. De seguida adicione rótulos de dados, definindo o Conteúdo do
Rótulo como Valor a Partir de Células (desative as restantes opções) e inserindo
=t_pontos!pptMetrica no campo relativo ao Intervalo de Etiquetas de Dados. Em
Pág. 52 O GRÁFICO DE PONTOS

Posição da etiqueta, selecione Abaixo. Para concluir, elimine a linha do eixo


vertical e respetivas etiquetas, bem como os limites da área do gráfico. Defina o
Limite máximo do eixo vertical para 4 e as unidades Maior para 1, e reduza a
Largura das linhas de grelha para 0.25pt. Reduza também a altura do gráfico.

O resultado final é visível na Figura 34. Tal como no caso do velocímetro,


faremos os ajustamentos necessários quando o gráfico for colocado no
dashboard.

Figura 34: O gráfico de pontos final

Embora já fosse visível no velocímetro a posição do concelho na escala do IDT, o


retrato fornecido pelo gráfico de pontos resulta muito mais rico, porque nos
permite comparar o concelho com os concelhos da sua região e com os restantes
concelhos do país.

Seria possível introduzir em fundo os três segmentos definidos no velocímetro


através da intensidade de cor, tornando-o funcionalmente irrelevante. Isto
mostra, mais uma vez, que os velocímetros têm um papel decorativo que pode
ser útil, mas que não deve ser confundido com a verdadeira análise e
comunicação de informação.
Pág. 53 O GRÁFICO DE PONTOS

Neste capítulo discutimos como densificar as nossas representações através do


uso de formas de codificação dos dados com menor pegada gráfica. Vimos
também como certas opções nos gráficos de Excel estão disponíveis para outros
fins que não aqueles para os quais foram planeadas, aumentando a nossa
liberdade de desenho de gráficos.
Os gráficos bullet foram propostos por Stephen Few
com o objetivo de substituir os velocímetros na
representação de KPI.

Ao contrário dos velocímetros, os gráficos bullet não


usam vermelho, amarelo e verde saturados para
definir as classes do mostrador, mas a diferença mais
significativa é a de que a representação da escala é
Figura 35: Os gráficos bullet feita através de uma linha reta, e não de uma linha
curva, como fazem os velocímetros na sua débil
tentativa de imitar o velocímetro de um automóvel. O uso do segmento de reta
tem duas grandes vantagens: reduz o espaço ocupado pelo gráfico, o que é útil
quando o espaço escasseia, e torna possível empilhar um conjunto de KPI,
facilitando a sua comparação.

Os gráficos bullet neste dashboard mostram os cinco concelhos de região ativa


com maior Índice de Dependência Total. Para além disso, um botão permite ao
utilizador ver os concelhos seguintes. Daí que as fórmulas utilizadas para os
hierarquizar sejam um pouco mais complexas que uma simples listagem.

O facto de serem cinco gráficos e não um ou dez não tem qualquer significado,
para além de uma opção de design. O racional seria sempre o mesmo.

Tal como no caso do velocímetro, para criar os gráficos vamos necessitar de


duas tabelas:
Pág. 55 OS GRÁFICOS BULLET

1. Tabela de mostradores. Necessária para definir as classes em fundo;


2. Tabela de dados. Necessária para calcular o valor atual (o IDT), indicar o
objetivo (vamos defini-lo como sendo de 75) e determinar se o alerta é visível
ou não.

Iremos recorrer de novo ao gráfico de dispersão, criando três


séries, uma para cada classe no mostrador. Crie uma tabela
idêntica à da Figura 36, com o nome tbBulletMostra. A coluna
SerY indica a localização do gráfico no eixo vertical, enquanto
cada uma das colunas seguintes indica os limites de cada classe ao
longo do eixo horizontal.

Infelizmente, não há uma forma simples de indicar ao gráfico


(quer com opções, quer através de fórmulas) que não deve
representar uma linha entre dois pontos se célula entre eles não
representar um valor. A única forma de o fazer é apagar o
Figura 36: Tabela para mostradores conteúdo da célula (manualmente ou através de programação).
Note que a célula tem de estar vazia, e não apenas parecer vazia.

Crie uma segunda tabela com o nome tbBulletData, idêntica à da Figura 37.
Esta tabela é um pouco mais complexa. Vejamos cada uma das colunas.

Figura 37: Tabela de dados para os gráficos bullet

• Rank. Esta coluna diz-nos quais os concelhos que queremos, ordenados


pelo valor do IDT. No caso na imagem queremos, em sequência, os cinco
concelhos com o IDT mais elevado. A primeira célula está ligada a um
botão que nos permite alterar o seu valor, enquanto as restantes linhas se
referem sempre à linha anterior e acrescentam 1. Assim, quando
Pág. 56 OS GRÁFICOS BULLET

aumentamos o valor da primeira célula para 3 os restantes valores


alteram-se para 4, 5, 6 e 7. Isto é útil para ver os restantes concelhos da
região;
• SerY. O ponto vertical onde queremos colocar o gráfico, sendo 5 o ponto
mais alto e 1 o mais baixo. Corresponde ao valor SerY na tabela anterior.
• Valor. O valor do IDT;
• Concelho. O nome do concelho;
• Objetivo. O Objetivo permite-nos, não apenas comparar o valor real com
as classes de cumprimento, mas também a distância face ao objetivo
concreto. Neste caso, definimos um objetivo arbitrário para todos os
gráficos. Com KPI diferentes estabeleceríamos diferentes objetivos;
• SerX. A coluna X corresponde à origem dos dados. Permite-nos traçar a
linha horizontal entre a origem e o valor real;
• AlertaX. O ponto no eixo horizontal onde será colocado o alerta. O valor
real é comparado com o objetivo e, se for superior, é introduzido o valor de
X, o que mostra o alerta. Para isso, usamos a fórmula
=SE([@Valor]>[@Objetivo],-3,NÃO.DISP());
• Rank X. O gráfico inclui etiquetas com os valores da primeira coluna.
Para o fazer, teremos de associá-las a uma série cuja posição no eixo é
dada pelo valor nesta coluna.

O valor do IDT para cada um dos concelhos já está calculado na folha t_pontos,
pelo que seria redundante fazê-lo de novo. O que é novo é a necessidade de
localizar os valores que correspondem aos rankings indicados na primeira
coluna da tabela e inseri-los na coluna Valor. É também necessário restringir a
procura desse valor à região a que o concelho pertence. Conseguimos obter a
posição no ranking com a função MAIOR() associada a uma função lógica SE():

={MAIOR(SE(tbPontos[NUTS3]=refSelNUTS3,tbPontos[IDT],0),[@Rank])}

A condição SE() avalia se o concelho faz parte da região. Se faz, e corresponde


ao valor de Rank, coloca o valor, caso contrário, introduz o erro #N/D. Esta é
Pág. 57 OS GRÁFICOS BULLET

uma fórmula array, o que significa que deve premir as teclas Ctrl+Shift e de
seguida premir Enter. Se foi bem introduzida deverão aparecer chavetas de
ambos os lados da fórmula (as chavetas aparecem com o Ctrl+Shift+Enter, não
devem ser introduzidas manualmente).

O nome do concelho é obtido usando a combinação de funções ÍNDICE() e


CORRESP(). Assumindo (como é o caso) que estamos a trabalhar em colunas, a
função CORRESP() procura um valor numa coluna e retorna o número da linha
onde encontrou esse valor. Com a função ÍNDICE() usamos esse número de
linha para obter o conteúdo de uma célula na mesma linha mas numa outra
coluna.

=SE.ERRO(
ÍNDICE(tbPontos[Concelho],
CORRESP(refSelNUTS3&[@Valor],tbPontos[NUTS3]&tbPontos[IDT],0)
),"")

A fórmula acima, lida a partir do interior, diz o seguinte: “procurar a junção da


região ativa e do valor de IDT na junção das colunas NUTS3 e IDT. Usar essa
referência para obter o valor na linha equivalente da coluna Concelho. Se
encontrar um erro, introduzir um texto vazio.”
Pág. 58 OS GRÁFICOS BULLET

Agora que temos todos os dados necessários para criar o gráfico, crie novos
nomes para todas as colunas em ambas as tabelas, usando o prefixo “pbl”. Na
imagem da Figura 38 poderá observar os novos nomes (note que SerY na
segunda tabela foi designado por pblSerYdata para o diferenciar do nome na
pblSeY na tabela anterior).

Figura 38: Nomes para a criação dos gráficos bullet

Para criar os gráficos bullet:

1. Escolha a última opção entre os gráficos de dispersão (com linhas retas, sem
marcadores);
2. Insira as três classes de fundo (Figura 39);
Pág. 59 OS GRÁFICOS BULLET

Figura 39: Os gráficos bullet após a introdução das classes

3. Para cada classe, defina nas opções de Preenchimento e Linha, uma Largura
de 15pt e Plano como Tipo de Remate.
4. Escolha para cada série um tom de cinzento, de mais escuro a mais claro;

Concluída a introdução e configuração das barras de fundo, vamos introduzir os


dados:

1. Insira uma série com o nome IDT com os Valores da Série X


=t_bullet!pblValor e, para Valores da série Y, =t_bullet!pblSerYdata. Deverá
obter um gráfico semelhante ao gráfico 1 da Figura 40;
1. Com a série ativa, escolher Formatar Série de Dados e colocar a série no Eixo
Secundário;
2. Adicionar barras de erro (gráfico 2);
3. Apagar as barras de erro verticais;
Pág. 60 OS GRÁFICOS BULLET

Figura 40: Introdução do IDT nos gráficos bullet

4. Definir a Direção das barras de erro horizontais para Menos, Sem Linhas
como Estilo Final e com Montante de erro de 100%;
5. Escolha uma cor para a barra de erro e a Largura da Linha para 5pt (gráfico
3).
6. Selecione a série IDT e defina Linha para Sem Linha (gráfico 4);

Na fase seguinte iremos introduzir os restantes objetos gráficos, começando


pelos marcadores de objetivos, usando também as barras de erro:

1. Introduza a série Objetivo, com os valores =t_bullet!pblObjetivo e


=t_bullet!SerYdata.
1. Confirme que a série está escolhida (poderá não estar visível);
2. Confirme que está associada ao Eixo Secundário;
3. Adicione barras de erro e apague as barras horizontais;
Pág. 61 OS GRÁFICOS BULLET

Figura 41: Configurações adicionais nos gráficos bullet

4. Defina a Direção para Ambos, Estilo final Sem Linhas e o Montante de Erro
para um Valor fixo de 0.2;
5. Introduza a série Alertas, com os valores =t_bullet!pblAlertaX e
=t_bullet!SerYdata.
6. Verifique se a série está selecionada e escolha um círculo vermelho como
marcador (gráfico 4);
7. Introduza a série Rank, com os valores =t_bullet!pblRankX e
=t_bullet!pblSerYdata.
8. Com a série selecionada, escolha Adicionar Rótulos de Dados;
9. Selecione esses rótulos e indique que quer definir o conteúdo com Valor a
Partir de Célula (=t_bullet!pblRank) e posicionado à esquerda;
10. Para identificar os gráficos, adicione a série Concelhos, com =t_bullet!pblSerX
como X e =t_bullet!pblSerYdata como Y;
11. Com a série selecionada, escolha Adicionar Rótulos de Dados;
Pág. 62 OS GRÁFICOS BULLET

12. Selecione esses rótulos e indique que quer definir o conteúdo com Valor a
Partir de Célula (=t_bullet!pblConcelho) e posicionado à Direita.
13. No Tamanho e Propriedades das Etiquetas, na opção Alinhamento, inative a
opção Moldar texto na forma e reduza a Margem esquerda para zero.

Para terminar os gráficos bullet:

1. Elimine as linhas dos eixos verticais e respetivos rótulos, bem como as linhas
de grelha, o preenchimento e o limite da área do gráfico.
2. Defina o Limite mínimo do eixo horizontal para -20, o máximo para 120 e as
unidades para 20.
3. Ainda nas opções do eixo, escolha na categoria de número Personalizar e
acrescente o formato [>=0]0;"", o que significa que só serão representadas
as etiquetas com valores de zero ou acima;
4. Altere a cor do nome dos concelhos para preto;
5. Aumente o tamanho do texto das etiquetas de Rank para 14 e altere a sua
posição para Centro.
6. Na coluna AlertaX, experimente valores que afastem o alerta do início da
barra.
7. Selecione a primeira célula da coluna Rank e dê-lhe o nome refRankIDT.

Como em relação aos gráficos anteriores, também este está aberto a alterações
quando o colocarmos no dashboard.

Há algumas alternativas no desenho de gráficos bullet no Excel, mas esta é


provavelmente a mais flexível, para além de integrar com mais facilidade os
alertas, algo que devemos ter sempre ligado à monitorização da performance.
Vimos também que as barras de erro podem na prática substituir gráficos de
barras, o que em certas circunstâncias será útil.
O Índice de Dependência Total é útil como síntese, mas a sua
composição não pode ser ignorada. Ele tanto pode sem
composto por uma grande proporção de jovens como por uma
grande proporção de idosos.

Vamos fazer um gráfico de dispersão em que associamos os


índices a cada um dos eixos para perceber a sua relação. Tal
como no gráfico de pontos, iremos comparar o concelho ativo
com os concelhos da sua região e com os restantes concelhos, o
que nos permite perceber de imediato a posição do concelho
face a todos os outros em ambos os índices.

Figura 42: O gráfico de dispersão

Os dados de que necessitamos são muito semelhantes aos da tabela de pontos,


pelo que usaremos parte da sua estrutura:

1. Crie uma nova folha com o nome t_dispersao;


2. Copie, da tabela tbPontos, as colunas [Concelho]:[IDTNacX];
3. Transforme estas colunas em tabela e dê-lhe o nome tbdispersao;
4. Substitua “IDT” por “IDJ” no cabeçalho de todas as colunas e retire o “X” no
final do nome;
5. Adicione novas colunas para cálculo do segundo índice: IDI, IDIConc,
IDINUTS e IDINac.

O racional na construção desta tabela (Figura 43) é igual ao da tabela tbPontos:


obtemos os índices que nos interessam com a fórmula OBTERDADOSDIN() a
Pág. 64 O GRÁFICO DE DISPERSÃO

Figura 43: Tabela para gráfico de dispersão

partir da tabela dinâmica ptPontos, colocamo-los nas colunas IDJ e IDI. Nas
três colunas seguintes segmentamo-los por grupos regionais. As fórmulas para
cada coluna serão, deste modo:

• IDJ:
=OBTERDADOSDIN("Populacao",t_pontosTD!$A$3,"Concelho",[@Concelho],"IdGrupo","Jov
ens")*100
• IDJConc:
=SE([@Concelho]=refSelConc,[@IDJ],NÃO.DISP())
• IDJNUTS:
=SE(E([@NUTS3]=refSelNUTS3,É.NÃO.DISP([@IDJConc])),[@IDJ],NÃO.DISP())
• IDJNac:
=SE(E(É.NÃO.DISP([@IDJConc]),É.NÃO.DISP([@IDJNUTS])),[@IDJ],NÃO.DISP())
• IDI:
=(OBTERDADOSDIN("Populacao",t_pontosTD!$A$3,"Concelho",[@Concelho],"IdGrupo","Id
osos")*100)
• IDIConc:
=SE([@Concelho]=refSelConc,[@IDI],NÃO.DISP())
• IDINUTS:
=SE(E([@NUTS3]=refSelNUTS3,É.NÃO.DISP([@IDIConc])),[@IDI],NÃO.DISP())
• IDINac:
=SE(E(É.NÃO.DISP([@IDIConc]),É.NÃO.DISP([@IDINUTS])),[@IDI],NÃO.DISP()).

Como habitualmente, crie novos nomes para cada coluna da tabela, de acordo
com a lista da Figura 44. Agora fazemos o gráfico, colocando os Jovens no eixo
Pág. 65 O GRÁFICO DE DISPERSÃO

Figura 44: Lista de nomes para gráfico de dispersão

horizontal e os Idosos no eixo vertical. Insira primeiro os dados nacionais, de


seguida os regionais e apenas no fim o concelho. Dado que cada nova série se
sobrepõe à anterior, isto facilita a visualização das três séries sem necessidade
de as ordenar posteriormente. Observe o resultado na Figura 45.

Figura 45: primeira fase de construção do gráfico de dispersão


Pág. 66 O GRÁFICO DE DISPERSÃO

Quando os eixos de um gráfico de dispersão usam as mesmas unidades, a escala


e o comprimento dos eixos devem ser iguais, ou seja, a área de desenho do
gráfico deve ser quadrada. Isto não significa que não possam ser feitos
ajustamentos para melhorar a resolução do gráfico, sem que essa regra seja
posta em causa. Antes de o fazer, teremos de verificar se a escala no gráfico da
Figura 45 é a adequada.

O gráfico tem dados de 2011, pelo que talvez seja seguro assumir que a escala do
Índice de Dependência de Idosos é adequada, mesmo quando usamos outros
anos. O eixo horizontal, no entanto, parece ter uma amplitude excessivamente
pequena. Selecione o ano de 1981 e verificará que o valor máximo é de 75.09. O
primeiro gráfico da Figura 46 usa a mesma escala em ambos os eixos. Ao

Figura 46: Ajustamento do gráfico de dispersão mantendo a regra da proporção


Pág. 67 O GRÁFICO DE DISPERSÃO

segundo gráfico foi cortada a secção 75-1001 no eixo horizontal, tornando o mais
curto, mas mantendo as proporções entre ambos os eixos.

Para formatar os pontos, escolha para a série Nacional um tom mais escuro de
uma cor para o preenchimento dos marcadores, mas defina a sua Transparência
para 75%. Reduza o tamanho dos marcadores para tamanho 4. No caso das
NUTS3, use a mesma cor, tom e tamanho, mas sem transparência. No caso do
concelho, use uma cor contrastante para preenchimento.

No gráfico, vemos como se compara o concelho com os concelhos da sua região


e com os restantes concelhos. Mas seria interessante verificar a sua posição face
aos índices nacionais. Para isso, teremos de calcular o valor de ambos (Figura
47), através das fórmulas (entre parêntesis o nome que foi dado ao intervalo):

• Para calcular o número de Adultos (refTotalAdultos):


=SOMARPRODUTO((tbPop[IdGrupo]="Adultos")*(tbPop[Ano]=refSelAno)*(tbPop[Populacao
]))
• Para calcular o número de Jovens (refTotalJovens):
Figura 47: Cálculo de • =SOMARPRODUTO((tbPop[IdGrupo]="Jovens")*(tbPop[Ano]=refSelAno)*(tbPop[Populacao]
indicador total nacional ))

1Para ser mais preciso, o valor máximo foi colocado em 76 para que o valor
75.09 possa ser representado, pelo que a secção removida é entre 76 e 100.
Foram mantidas as linhas de grelha com intervalos de 75 para permitir a
comparação com as linhas de grelha horizontais.
Pág. 68 O GRÁFICO DE DISPERSÃO

• Para calcular o número de Idosos (refTotalIdosos):


=SOMARPRODUTO((tbPop[IdGrupo]="Idosos")*(tbPop[Ano]=refSelAno)*(tbPop[Populacao]
))
• Para calcular o IDJ (refTotalIDJ): =refTotalJovens/refTotalAdultos*100;
• Para calcular o IDI (refTotalIDI): =refTotalIdosos/refTotalAdultos*100;

Insira esta série com o nome Total e =PopDash03.xlsm!refTotalIDJ nos Valores da


série X e =PopDash03.xlsm!refTotalIDI nos Valores da série Y. Insira barras de erro
nesta série, ambas com Direção Menos, Estilo Final Sem Linhas e o Montante
de Erro em 100%. Escolha a série e altere o marcador para um círculo preto de
tamanho 2. Use as mesmas definições de barras de erro na série Concelho.

Para terminar o gráfico, acrescente os títulos dos eixos,


com o texto “IDI” no eixo vertical e “IDJ” no eixo
horizontal. Rode o texto “IDI” para horizontal e coloque-o
no canto superior esquerdo da área de desenho. Coloque o
texto “IDJ” no canto inferior direito. Adicione a legenda e
coloque-a no canto superior direito. Reduza a largura das
linhas de grelha para 0.25pt e elimine as linhas dos eixos.

O resultado deverá ser semelhante ao do gráfico na Figura


48. A utilização de barras de erro facilita a comparação
entre o concelho ativo e o valor nacional. É claro, neste
caso, que o concelho ativo é muito mais envelhecido que a
média nacional no que respeita ao peso dos Idosos, tendo
também um valor abaixo da média no peso dos Jovens.
Note que apenas é possível comparar as diferenças porque
mantivemos os eixos proporcionais, caso contrário,
Figura 48: Versão final do gráfico de dispersão qualquer conclusão baseada apenas na visualização (sem
leitura dos eixos) poderia não corresponder à realidade.
Pág. 69 O GRÁFICO DE DISPERSÃO

O gráfico de dispersão permite-nos compreender a relação entre duas variáveis,


e neste caso ajuda-nos a compreender de que forma evoluiu e é composto o
Índice de Dependência Total. As barras de erro facilitam a comparação entre o
concelho ativo e o todo nacional. A nuvem de concelhos serve de contexto sem
interferir na análise.
Os mapas têm uma história conturbada com o Excel. Nas primeiras
versões da aplicação havia um suplemento que permitia fazer
alguns mapas temáticos. Esse suplemento foi retirado e, durante
algumas versões, era necessário adquirir a um vendedor um novo
suplemento. Com o Excel 2016 os mapas voltaram, mas com
algumas restrições.

Quando a geografia não é a nossa variável de interesse, é


necessário ter bastante cuidado na utilização dos mapas. Tomemos
como exemplo a polémica sobre as eleições americanas de 2016.
Um mapa com correção geográfica mostra um absoluto domínio de
Donald Trump, com a cor vermelha (do Partido Republicano) a
Figura 49: Mapa de regiões preencher quase todo o mapa dos EUA. No entanto, Hillary Clinton
obteve mais votos diretos, o que é difícil de acreditar olhando para
o mapa. Justificação: uma grande fatia da população americana está
concentrada em ambas as costas, em cidades grandes como Los Angeles e Nova
Iorque, e os votos em Clinton tiveram uma forte componente urbana.

Algo semelhante se passou durante muitos anos em Portugal, em que 1/3 do


território (o Alentejo) era dominado pelo Partido Comunista. Lisboa e os seus
subúrbios têm uma área total muito inferior ao Alentejo, mas um volume muito
superior de população. É possível dimensionar através de cartogramas as
regiões em função das variáveis que nos interessam, como a população, o que
Pág. 71 MAPA DE NUTS3

produz resultados interessantes, mas difíceis de conciliar com a nossa memória


da geografia.

Compare este caso a um outro a que já nos habituámos: os mapas das redes de
metropolitano. Seria difícil representar em detalhe a rede no centro de Londres
se o rigor geográfico não tivesse sido sacrificado em benefício de informação
mais relevante (ligações entre linhas, quantas estações até ao destino).

A localização geográfica dos clientes, a dimensão da área de influência ou a


facilidade de acesso devem ser analisadas com rigor geográfico. Mas em muitos
casos as nossas necessidades limitam-se a verificar se a quota de mercado do
produto é mais alta no Norte que no Sul. Ou seja, procuramos um padrão
espacial na nossa variável que não tem de ser traduzido num rigor geográfico
que terá custos acrescidos e com ganhos marginais reduzidos.

Há várias formas e variantes de criar mapas temáticos em


Excel, para além da que o Excel 2016 introduziu (exemplo
básico na Figura 50). Uma das formas com que os utilizadores
foram tentando contornar a sua ausência foi através da
importação de um ficheiro em formato Windows Meta File, com
formas correspondentes a regiões. Essas formas têm
características iguais a quaisquer outras formas no Excel, e
podem ser coloridas através de uma pequena rotina de VBA.
Figura 50: Mapa 3D introduzidos na Excel
2016
Uma segunda forma é a de associar uma ou mais células a uma
região, unindo-as ou não (Figura 49). Para que a região seja semelhante à
geografia que conhecemos usamos mais células, reduzindo a altura das linhas e
a largura das colunas. Quantas mais células utilizarmos maior a resolução mas,
de novo, isso poderá ter uma baixa relação custo-benefício. A versão que iremos
Pág. 72 MAPA DE NUTS3

usar neste primeiro mapa é a da união de células. Como não é possível unir
células para criar intervalos com formas irregulares, todas as regiões terão uma
forma retangular, tão próxima quando possível da realidade geográfica.

Também é possível criar mapas de pontos usando um gráfico de dispersão.


Veremos esta opção em mais detalhe no respetivo capítulo.

Para criar um mapa a nível de NUTS3 necessitamos,


naturalmente, de dados a esse nível. Para isso teremos de criar
duas folhas, com uma tabela e com a tabela dinâmica:

1. Crie uma nova tabela dinâmica, fazendo uma cópia da folha


t_pontosTD;
2. Alter o nome da folha para t_nuts3TD e o nome da tabela
dinâmica para ptNUTS3;
3. Substitua o campo Concelho pelo campo NUTS3;
4. No menu Mostrar Valores Como… escolha Sem cálculo.
5. Nas Opções de Tabela Dinâmica, no marcador Totais e
Filtros, ative o campo Mostrar totais gerais das linhas.
6. Verifique, na segmentação por ano (folha d_), se a nova
tabela dinâmica está ativa;
7. Crie uma nova folha com o nome t_nuts3;
8. Copie coluna NUTS3 da tabela de dados geográficos para a
célula $B$10;
9. Do menu Dados, escolha a opção Remover Duplicados.
10. Na coluna A coloque os códigos de NUTS na Figura 51.
11. Defina estes dados como tabela com o nome tbNUTS3.
12. Acrescente as colunas Jovens, Adultos, Idosos e Total.

Com esta estrutura vai ser possível preencher as novas colunas


Figura 51: Lista de NUTS3 e códigos associados com os dados da população, com origem na tabela dinâmica.
Pág. 73 MAPA DE NUTS3

Para isso, na coluna Jovens crie uma referência para a tabela dinâmica para
obter:

=+OBTERDADOSDIN("Populacao",t_nuts3TD!$A$3,"NUTS3","Algarve","IdGrupo","Jovens")

Altere o nome da NUTS3 (“Algarve” no exemplo acima) para o nome da coluna


NUTS3, para obter:

=+OBTERDADOSDIN("Populacao",t_nuts3TD!$A$3,"NUTS3",[@NUTS3],"IdGrupo","Jovens")

Repita o processo para as duas colunas seguintes, não esquecendo de alterar o


valor do Grupo para “Adultos” e “Idosos”. No caso da coluna Total, a fórmula
será mais simples:

=+OBTERDADOSDIN("Populacao",t_nuts3TD!$A$3,"NUTS3",[@NUTS3])

Para calcular os indicadores de dependência a nível de NUTS3 adicione três


novas colunas (entre parêntesis é indicada a fórmula a introduzir):

• • DepJovens: =+[@Jovens]/[@Adultos]*100)
• • DepIdosos: =+[@Velhos]/[@Adultos]*100
• • DepTotal: =+[@DepVelhos]+[@DepJovens]

Para além destas colunas, vamos também colocar como informação adicional a
densidade populacional, com o nome Densidade e a fórmula:

=[@Total]/SOMA.SE(tbgeo[NUTS3],[@NUTS3],tbgeo[Area])

A fórmula procura na tabela geográfica a região correspondente, e soma a


coluna Area, para obter a área total da NUTS3. A densidade populacional é
dada através do quociente entre o Total e a Area, em habitantes por Km2.
Pág. 74 MAPA DE NUTS3

A Dependência de Jovens, a Dependência de Idosos, a Dependência Total e a


Densidade Populacional são as quatro opções disponíveis para observar no
mapa. Para isso é necessário criar um menu como ilustrado na Figura 52:

1. Na folha c_, liste as variáveis nas células A10:A13 e dê o nome


refMenuMapa a esse intervalo;
2. Selecione a célula $A$16 e, no menu Dados, escolha Validação de Dados. No
Critério de validação, escolha Por Lista e na Origem introduza =refMenuMapa;
3. Verifique se pode escolher uma opção da lista e dê o nome refMenuMapaSel
a essa célula;
4. Na coluna B, introduza ao lado de cada opção o nome da respetiva coluna na
tabela. Escolha o intervalo com dados em ambas as colunas (A10:B13) e dê-
lhe o nome refMenuMapaColunas.

Deste modo, sabemos que a opção de menu Densidade


Populacional corresponde à coluna Densidade na tabela
tbMapaNUTS. Agora é necessário determinar a posição dessa
coluna, para determinar a que coluna corresponde o menu.
Vamos fazê-lo com a seguinte fórmula, que começa por procurar
o nome de coluna:

=PROCV(refMenuMapaSel,refMenuMapaColunas,2,FALSO)
Figura 52: Base para criação do menu do
mapa das regiões
Esta fórmula retorna o nome da coluna, que usaremos para
procurar a sua posição nos cabeçalhos da tabela através da função CORRESP().
Edite a fórmula e acrescente a função CORRESP():

=CORRESP(PROCV(refMenuMapaSel,refMenuMapaColunas,2,FALSO),tbMapaNUTS[#Cabeçalhos],0)

Se a Densidade Populacional é a variável escolhida, então o valor na célula será


10. Chame a esta célula refMenuMapaNum. Agora podemos começar a fazer o
mapa.
Pág. 75 MAPA DE NUTS3

O Excel permite colocar uma imagem de fundo numa folha de


cálculo, de forma temporária. Para isso, no menu Esquema de
Página, escolha Fundo e de seguida escolha o ficheiro de
mapas de NUTS3 fornecido. Irá ter o mapa replicado ao longo
da folha.
Figura 53: Processo de construção de regiões.

Numa área afastada da tabela, à direta, escolha o mapa que


quer usar como referência, e estreite um número significativo
de colunas para uma largura abaixo de 40. Quanto mais baixo
for esse número mais resolução terá o seu mapa. No nosso
exemplo vamos usar o valor 37.

Selecione o intervalo de células que melhor define uma região


e una-as. Note que não é possível definir um intervalo de
células unidas que não seja retangular, pelo que deverá ter isso
em consideração para a região atual e para as regiões que
desenhará a seguir. É quase inevitável ter de fazer alguns
ajustamentos, anulando a união das células e refazendo a
região. A Figura 53 ilustra o início desse processo, com os
limites destacados.

O mapa final será parecido com o representado na Figura 54.


Usando a imagem como referência, coloque em cada região o
seu código de três letras. Mas vamos precisar de usar uma
fórmula em cada região, pelo não podemos simplesmente
inserir o texto.
Figura 54: Mapa com as regiões definidas
A solução está nos números personalizados. Coloque-se na
região que quer identificar e selecione Formatar células e
Pág. 76 MAPA DE NUTS3

Personalizado no separador Número. No Tipo, introduza o texto (por exemplo,


“TTM”, incluindo as aspas). Faça isto para cada região.

Selecione todas as regiões e, no menu Base,


em Formatação condicional, escolha uma
nova regra de formatação de acordo com a
imagem da Figura 55. Note os critérios
escolhidos para a formatação condicional:
havendo a possibilidade de valores extremos
deturparem a representação, optou-se por
usar o percentil 10 como valor mínimo e o
percentil 90 como valor máximo.
Experimente outras opções e com outras
variáveis para avaliar o impacto de cada
alternativa. Enquanto tem as regiões
escolhidas, insira como limite uma linha
Figura 55: Opções de formatação condicional do mapa
branca.

Não vai observar qualquer alteração na cor das células, dado que elas não têm
qualquer conteúdo. Para que a formatação condicional se torne visível terá de
introduzir valores. Insira a seguinte fórmula em cada região:
=PROCV("TTM",tbMapaNUTS,refMenuMapaNum,FALSO)

Esta fórmula procura o valor correspondente ao código da região na coluna


escolhida. Terá de alterar a fórmula em cada região para procurar o seu código
(neste exemplo, o “TTM”). À medida que introduzir as fórmulas a formatação
condicional irá ficando visível.
Pág. 77 MAPA DE NUTS3

Figura 56: Preenchimento de células unidas com gradação de cores

Para criar uma legenda, una um grupo de células e, em Preenchimento,


selecione Efeitos de Preenchimento com Gradação, aplicando as mesmas cores
da formatação condicional (Figura 56).

Tal como qualquer outra forma de representação gráfica, o uso dos mapas deve
ter uma justificação, que no seu caso é a procura de uma qualquer regularidade
espacial. Se ela não existe, é preferível procurar outras formas de representação.

Este mapa para alguns leitores talvez cause estranheza, mas com a familiaridade
vem a perceção de que a absoluta precisão geográfica não só é em muitos casos
desnecessária como contraproducente.
As pirâmides etárias tradicionais não são
gráficos particularmente eficazes. A
utilização de barras torna-as pesadas, e
dificulta a comparação de várias populações.
A colocação de homens e mulheres em lados
opostos do eixo horizontal (criando um lado
falsamente positivo do lado esquerdo)
também dificulta a comparação entre sexos.
Embora os valores sejam em geral muito

Figura 57: Pirâmide etária com linhas no lugar de colunas


próximos, é útil observar o momento em
que o número de mulheres ultrapassa o
número de homens, e como a diferença entre eles se alarga no topo da pirâmide.
Também as migrações e as guerras tendem a afetar as proporções entre homens
e mulheres.

A atração por um objeto físico reconhecível (a pirâmide) foi, para o autor do


primeiro gráfico, maior que a avaliação da sua eficácia. A pirâmide etária (que
só tem essa forma quando há muitos jovens e poucos idosos) tem leituras
codificadas que definem a estrutura da população, pelo que propor alterações na
estrutura do gráfico terá de garantir que essas codificações ainda são aplicáveis.

Há alternativas para tornar a pirâmide etária mais eficaz dentro desses


constrangimentos. A primeira é deixar de usar colunas, substituindo-as por
linhas (Figura 57). Quando temos apenas uma população, seria adequado
colocar homens e mulheres do mesmo lado do eixo. Para além de facilitar a
comparação, reduz em quase 50% a área do gráfico. No caso de múltiplas
populações, devemos avaliar em cada caso qual a solução mais adequada.
Pág. 79 A PIRÂMIDE ETÁRIA

Comparativamente aos gráficos anteriores, a pirâmide


etária é muito simples de construir, sendo as bandas de
fundo a parte menos óbvia.

Será, no entanto, necessário criar primeiro uma tabela


dinâmica, eventualmente a maior de todo o projeto. A
fonte é a tabela de dados da população e a Figura 58
resume as suas características. Terá como Filtro o Ano,
terá os campos Sexo e IdNum em Colunas e os campos
NUTS3 e Concelho em Linhas, sendo os Valores os da
População. Dê-lhe o nome de ptPiramide e chame à
folha t_pirTD.

Depois de criada a tabela, com o botão do lado direito


sobre os valores, escolha Mostrar Valores Como e de
Figura 58: Estrutura da tabela dinâmica seguida % do Total Principal…, escolhendo Sexo como
Campo base. Regresse à folha d_, onde está a
segmentação por Ano e, com o botão do lado direito, escolha Ligações do
Relatório e ative a tabela.

Iremos comparar a estrutura etária por sexo do concelho com a da sua região e
com a do país, usando grupos etários de 5 anos. É, portanto, um número
significativo de dados. Esta estrutura inclui todos esses dados, totais e subtotais,
pelo que apenas precisamos de usar a função
OBTERDADOSDIN() para preencher a tabela
e criar a pirâmide.

Crie uma tabela com a estrutura da


Figura 59: Estrutura da tabela para elaboração da pirâmide apresentada na Figura 59, e com o nome
etária
tbPiramide. A tabela tem três pares de
Pág. 80 A PIRÂMIDE ETÁRIA

colunas, correspondentes aos três níveis regionais, concelho, NUTS3 e nacional.


Cada coluna deverá ser preenchida com os respetivos dados por sexo.

A partir das colunas de mulheres, crie referências à tabela dinâmica para


qualquer ponto do respetivo nível regional. Obterá fórmulas semelhantes a
estas:

• Concelho:
=OBTERDADOSDIN("Populacao",t_pirTD!$A$3,"Concelho",refSelConc,"NUTS3",refSelNUTS
3,"Sexo","Mulheres","IdNum",[@Idade])*100
• NUTS3:
=OBTERDADOSDIN("Populacao",t_pirTD!$A$3,"NUTS3",refSelNUTS3,"Sexo","Mulheres","I
dNum",[@Idade])*100
• Nacional:
=OBTERDADOSDIN("Populacao",t_pirTD!$A$3,"Sexo","Mulheres","IdNum",[@Idade])*100

Para os homens:

• Concelho: =-
OBTERDADOSDIN("Populacao",t_pirTD!$A$3,"Concelho",refSelConc,"NUTS3",refSelNUTS3
,"Sexo","Homens","IdNum",[@Idade])*100
• NUTS3: =-
OBTERDADOSDIN("Populacao",t_pirTD!$A$3,"NUTS3",refSelNUTS3,"Sexo","Homens","IdNu
m",[@Idade])*100
• Nacional: =-
OBTERDADOSDIN("Populacao",t_pirTD!$A$3,"Sexo","Homens","IdNum",[@Idade])*100

Para os concelhos e as NUTS, substitua o nome pelos valores ativos, refSelConc,


e refSelNUTS3. Em IdNum, referencie a coluna da esquerda, [@Idade]. Note
que, para além de ter de usar “Homens” e “Mulheres” nas colunas corretas, no
caso dos homens a fórmula deverá começar com um sinal negativo, para que
esses dados sejam colocados no lado esquerdo da pirâmide.

Os nomes dos intervalos para este gráfico são os indicados na Figura 60.
Pág. 81 A PIRÂMIDE ETÁRIA

Figura 60: Nomes de intervalos para criação da pirâmide etária

O gráfico é relativamente simples de produzir:

1. Selecionando uma célula longe da tabela, crie um novo gráfico de dispersão


com curvas suaves (a terceira opção);
2. Insira as seis séries com o respetivo nome, em que o nome ppiIdade será
sempre usado nos Valores da série Y;
3. Altere o valor máximo do eixo vertical para 75 e o mínimo para zero;
4. Na mesma folha de opções do eixo vertical, em Etiquetas, defina a Posição de
Etiqueta para Mínimo, de forma a que sejam representadas à esquerda do
gráfico;
5. Defina o Limite mínimo do eixo horizontal para -20 e o Limite máximo para
20. Confirme se os valores ficaram em modo manual;
6. Para que os valores não apareçam com sinal negativo, nas opções do eixo
altere o formato do Número para Personalizado e introduza o código 0;0.
Pág. 82 A PIRÂMIDE ETÁRIA

7. Elimine as linhas de grelha.


8. Codifique os dados para homens e mulheres com a mesma cor, usando um
tom cinzento escuro para o nível Nacional, com uma Largura de linha de 1pt,
uma cor mais clara para as NUTS3 e uma Largura de linha de 1.5pt e um tom
da mesma cor mas mais escuro para o Concelho, também com Largura de
linha de 1.5pt;
9. Remova o limite da área do gráfico;
10. Em cada uma das séries, nas opções de Linha, altere o Tipo de Remate para
Plano.

A Figura 61 mostra o resultado:

Figura 61: Primeira versão da pirâmide etária

Vamos definir sombreados de fundo que funcionam como bandas, dividindo os


três grupos etários, Jovens, Adultos e Idosos. Esta é uma técnica útil para
definição de bandas de variação numa séries temporal, por exemplo, facilitando
a visualização de pontos fora da amplitude aceitável.
Pág. 83 A PIRÂMIDE ETÁRIA

Nesta técnica, as bandas são independentes dos valores dos eixos, sendo os
pontos de corte definidos em percentagem da altura ou da largura da área de
desenho. Dado que o eixo vertical varia entre 0 e 75, os valores de corte dos anos
15 e 65 corresponderão em percentagem aos valores 20% e 87%.

Figura 62: Definições de gradação de cores

A gradação de cores produz uma gradação suave entre duas marcas. Quanto
mais afastadas essas marcas estiverem, mas suave a gradação será. Em sentido
contrário, quando mais próximas as marcas estiverem, mais brusca será a
transição. Logicamente, não haverá gradação de duas marcas se elas tiverem a
mesma cor. Vamos aplicar estes dois princípios para criar as três bandas:

1. Selecione as Opções de Área de Desenho e aí o Preenchimento com gradação


de cores. Defina um ângulo de 270º.
2. Comece por criar cinco marcas de gradação, afastadas umas das outras.
Coloque a última marca na Posição 87%, a anterior próxima dos 75%, a
terceira nos 30%, a segunda nos 20% e a primeira nos 0%.
3. Dê à primeira e à segunda marcas o mesmo tom, cinzento muito claro.
4. As terceira e quarta marcas devem ter também a mesma cor, um cinzento
um pouco mais escuro.
5. A quinta marca deverá ter o tom mais escuro.
Pág. 84 A PIRÂMIDE ETÁRIA

6. Selecione a marca nos 30% e altere a sua posição para 20%, a marca nos 75%
deve passar para 87%. Agora terá duas marcas sobrepostas tanto nos 20%
como nos 87% e as três bandas bem definidas.

A Figura 63 mostra o resultado. Para que o gráfico fique completo, insira duas
caixas de texto, uma no canto inferior esquerdo com o texto “Homens” e uma no
canto inferior direito com o texto “Mulheres”.

Figura 63: A versão final da pirâmide etária

A amplitude do Índice de Dependência Total faz-nos suspeitar de diferenças


significativas na estrutura demográfica da população, e basta comparar um
concelho suburbano do Porto com um pequeno concelho do interior alentejano
para o confirmar. Além disso, numa população envelhecida, o topo da pirâmide
não é simétrico: a percentagem de mulheres é muito superior à dos homens.

Num gráfico dinâmico, é necessário prever essas variações, porque podem gerar
erros quando certas definições são deixadas em modo automático: se a
Pág. 85 A PIRÂMIDE ETÁRIA

amplitude do eixo horizontal do lado positivo for maior que a amplitude do lado
negativo isso condiciona a leitura que fazemos dos dados. Uma forma de
resolver o problema é fixar os limites mínimo e máximo do gráfico. A solução
não é perfeita, porque teremos de garantir que esses limites cobrem todas as
possibilidades, o que reduz a resolução do gráfico quando os valores têm menor
amplitude.

Uma possível solução (que é válida apenas para o gráfico do concelho ativo) é a
de forçar o gráfico a usar valores simétricos nesse concelho, deixando esses
valores mudar no concelho seguinte.

Para aplicar esta solução, precisamos primeiro de identificar quais


são os valores mínimo e máximo. De seguida, determinamos qual o
maior em valor absoluto (sem sinal). Finalmente, introduzimos
Figura 64: Valores para simetria de x
uma nova série no gráfico usando esses valores. Por exemplo, se o
mínimo nos dados é -17 e o máximo é 15, criamos uma série em
que o valor mínimo é -17 e o valor máximo é 17. Desta forma forçamos os Excel
a gerar limites simétricas.

Para isso, determine os valores mínimo e máximo de toda a tabela. Dê-lhes o


nome refMinPir e refMaxPir. De seguida, crie uma tabela tbEixosPir indicando
os valores de simetria (Figura 64). Introduza de coluna SimetriaX a fórmula:

=SE([@Limite]="Min",-
MÁXIMO(ABS(refMinPir),ABS(refMaxPir)),MÁXIMO(ABS(refMinPir),ABS(refMaxPir)))

A fórmula compara o valor mínimo e o valor máximo em termos absolutos


MÁXIMO(ABS(refMinPir),ABS(refMaxPir)) e retorna maior dos dois. De seguida, se
encontrar o texto “Min” na coluna Limite adiciona o sinal negativo ao valor.

Crie novos nomes com as colunas de simetria, chamando-lhe ppiSimX e


ppiSimY. Adicione uma nova série ao gráfico com o nome Simetria. Irá obter
Pág. 86 A PIRÂMIDE ETÁRIA

uma linha horizontal ao longo do eixo. Em Formatar Série de Dados, defina a


opção de Linha para Sem Linha.

É fácil criar gráficos com muitos dados e pouca informação. Esse é o problema
das pirâmides etárias tradicionais com barras para codificar mais de uma
população. A sua substituição por linhas torna mais fácil estudar as diferenças
entre as populações em cada grupo etário, bem como observar a forma geral da
pirâmide.

As bandas de fundo fazem parte de uma dimensão mais vasta da representação


de visualização, as anotações. Anotar um gráfico, seja indicando a variação
comum, seja acrescentando notas, é muito útil para uma melhor compreensão
do gráfico, em especial por uma audiência que esteja menos familiarizada sobre
os conteúdos específicos. Não deve recear anotar um gráfico desde que isso
complemente a sua mensagem de forma relevante e não reduza a facilidade de
leitura.
As sparklines são, segundo o seu autor, Edward Tufte, gráficos reduzidos ao
essencial. Isto torna-os, naturalmente, excelentes candidatos para utilização
em representações em que o espaço tem de ser gerido cuidadosamente, como é
o caso dos dashboards.

Há vários detalhes que devemos ter em atenção quando usamos sparklines, o


principal dos quais é a gestão da escala vertical. Quando temos várias
sparklines, optamos por partilhar a mesma escala com todas elas ou ter uma
Figura 65: Sparklines escala única para cada uma:

• A escala partilhada. Se há uma grande variação entre os valores, ou


uma das sparklines contém um valor extremo, isso vai dificultar a nossa
capacidade de diferenciar os valores num gráfico tão reduzido, caso
usemos uma escala comum. No entanto, sabemos que podemos comparar
todas as sparklines, porque a variação é proporcional (Figura 65).
• A escala individual. Quando os valores são de tal forma distintos que a
variação parece quase inexistente, optamos por definir uma escala para
cada uma das sparklines. Isto permite-nos perceber as variações dentro de
uma sparkline, mas deixamos de poder compará-las.

Não há uma solução única, tem de ser decidida a partir dos dados. As sparklines
usadas neste dashboard mostram o crescimento percentual entre cada grupo
etário relativamente ao valor de base de 1981. O retrato geral é o de que haverá
variações negativas nos níveis etários mais baixos e variações positivas nos
grupos etários mais altos. Colocando as sparklines ao lado da pirâmide etária
cria alguma complementaridade entre as duas representações.
Pág. 88 AS SPARKLINES

Neste caso, dado que temos variações de um único indicador, vamos escolher
uma escala única. Note que isto nos permite perceber as variações dentro do
mesmo concelho mas, como não estamos a fixar a escala para todos os
concelhos, não deve comparar as sparklines entre dois concelhos distintos, que
podem ter escalas diferentes.

Se está recordado, já temos os dados de base na tabela dinâmica da folha


t_sparklines. São necessários alguns ajustamentos para a usar como fonte. O
primeiro passo será ordenar as idades em sentido inverso, para que seja mais
fácil o diálogo entre as sparklines e a pirâmide etária (alinhando as idades em
ambos os gráficos).

As sparklines no dashboard mostram a diferença percentual de cada grupo


etário face aos valores de 1981. Valores acima de 100% indicam aumento da
população nesses grupos, enquanto valores abaixo de 100% indicam redução de
efetivos. Com o botão do lado direito do rato na tabela, escolha Mostrar Valores
como…, seguido de % Diferença De… e escolher o Ano como Campo Base e 1981
como Item Base.

O Total Geral de linhas não é útil aqui, pelo que podemos removê-lo.
Novamente com o botão do lado direito do rato, escolha Opções de Tabela
Dinâmica e, no marcador Totais e Filtros, inative o botão Mostrar totais gerais
das linhas.

Observe a Figura 66, onde são ilustrados os primeiros passos para a construção
das sparklines:
Pág. 89 AS SPARKLINES

1. Selecione um intervalo com todas as


percentagens apresentadas na tabela, incluindo o
Total Geral (edite esta célula e apague “Geral”,
dado que neste caso “Total” é suficiente, porque
não temos subtotais) e dê-lhe o nome pskDados.
2. Copie as idades para a direita, na coluna I;
3. Insira o nome pskSpark para as células à
direita (J5:J21).
4. Em Inserir, escolha Gráfico Sparkline de
Coluna. Na janela seguinte (Figura 67), introduza
os nomes de intervalos criados.

A Figura 68 mostra o impacto das sucessivas


alterações no desenho dos gráficos. O gráfico 1
Figura 66: A tabela dinâmica para criação das sparklines representa a versão inicial, com base nas
predefinições do Excel. Parecem existir variações
significativas, mas só olhando mais atentamente
se percebe se a variação é positiva ou negativa.

O gráfico 2 resulta da aplicação da mesma escala


a todas as sparklines. No menu Estrutura, escolha
Eixo e ative Igual Para Todos os Gráficos
Sparkline, tanto em relação ao valor mínimo
como ao valor máximo do eixo vertical. O que se
Figura 67: Criação das sparklines observa é um significativo crescimento no último
grupo etário.

O gráfico 3 realça a diferença entre crescimentos


positivos e crescimentos negativos. Com o
Pág. 90 AS SPARKLINES

1 2 3 4 intervalo das sparklines selecionado, no menu Estruturas


75 escolha Cor de Marcador, seguido de Pontos Negativos, onde
70
65
poderá escolher uma cor avermelhada. Aqui já é mais evidente
60 que houve uma redução de efetivos na base da pirâmide e um
55
crescimento no topo.
50
45
40 No gráfico 4 foi adicionado o eixo horizontal, para criar uma
35 linha de referência. No menu Estrutura, escolha Eixo e de
30
25 seguida ative a opção Mostrar Eixo.
20
15 Para concluir, coloque as percentagens de crescimento de cada
10
5 grupo etário relativamente a 1981 (Figura 69). Para isso,
0 introduza na coluna ao lado das sparklines o valor do
Total
crescimento através da função OBTERDADOSDIN(). A
Figura 68: Versões das sparklines fórmula será:

75 91% =+OBTERDADOSDIN("Populacao",$A$3,"IdNum",I25,"Ano",DATA(2011,3,15))

70 -27%
65 -46% Aponte o campo IdNum para o valor 75 e copie a fórmula até
60 -28% ao fim da lista. No caso do Total, a fórmula não inclui o grupo
55 -48%
etário:
50 -46%
45 -50% =+OBTERDADOSDIN("Populacao",$A$3,"Ano",DATA(2011,3,15))
40 -38%
35 -24%
30 -50%
25 -44%
20 -65%
15 -75% As sparklines, em qualquer uma das suas formas, são muito
10 -66% úteis no desenho de dashboards. Devido à sua muito baixa
5 -77%
pegada gráfica, elas permitem introduzir múltiplas e longas
0 -68%
Total -37% séries temporais num espaço muito reduzido.

Figura 69: A versão final das sparklines


Pág. 91 AS SPARKLINES

A questão mais crítica no desenho das sparklines é a definição da escala vertical.


A sua partilha por todas as sparklines terá leituras diferentes da opção por
escalas individuais.

Há espaço para melhoria da implementação das sparklines em Excel, onde falta,


por exemplo, a opção para introdução de bandas de variação. Note que, pelo
facto de existir esta implementação das sparklines não significa que não as
possa criar num gráfico normal onde, embora com um custo acrescido, poderá
introduzir opções de design que as sparklines na implementação atual não
oferecem.
Num gráfico de dispersão comum, duas variáveis são
colocadas em relação através da associação de cada uma
delas aos eixos vertical e horizontal. Analisar a forma como
os pontos se distribuem nesse plano é o nosso principal
objetivo.

Se usarmos os eixos para introduzir variáveis de natureza


geográfica, a distribuição final poderá adquirir uma forma
reconhecível (Portugal) mas essa forma não tem qualquer
relevância analítica, porque o que nos interessa é observar
a distribuição espacial de uma terceira variável que não
poderá ser alocada a qualquer um dos eixos.

Se essa terceira variável for contínua, uma das formas de a


codificar é através da dimensão do ponto, transformando o
Figura 70: Mapa de pontos
gráfico de dispersão num gráfico de bolhas. Quando há
muitos pontos essa poderá não ser a melhor opção.

A alternativa é transformar dados contínuos em categorias, e aplicando o


processo de segmentação que já vimos no gráfico de pontos, no qual foram
criadas três séries a partir do valor do IDT: concelho, NUTS3 e outros
concelhos. Usamos a mesma técnica para criação de classes contínuas,
divergentes ou categóricas, dependendo dos objetivos da análise.

O que faremos neste mapa é definir apenas duas classes (Figura 70), dividindo
os concelhos que estão acima ou abaixo de um determinado nível do Índice de
Dependência Total. O utilizador poderá interagir com o mapa alterando o nível,
Pág. 93 O MAPA DE PONTOS

para perceber que concelhos estão acima e abaixo desse valor. Os concelhos que
estejam dentro dos critérios definidos serão associados a um ponto colorido, e
os restantes serão codificados com cinzento. Para tornar a análise mais
interessante, o utilizador terá a opção de escolher se o ponto de partida serão os
concelhos com maior IDT ou se serão aqueles com menor valor.

Enquanto num gráfico de dispersão comum as variáveis com que trabalhamos


são associadas aos eixos, num mapa de pontos a variável apenas serve para
avaliação dos critérios. Os pontos colocados no mapa correspondem às
coordenadas geográficas de cada concelho. Para preparar os dados vamos
precisar de uma lista de concelhos, as respetivas coordenadas, o IDT e o ponto
de corte. Assim (Figura 71):

Concelho DTCC NUTS3 IDT LongSim LatSim LongNao LatNao


Alandroal 0701 Alentejo Central 71.80 -7.38307 38.6039 #N/D #N/D
Arraiolos 0702 Alentejo Central 62.93 -7.91221 38.7794 #N/D #N/D
Borba 0703 Alentejo Central 61.80 -7.49614 38.8213 #N/D #N/D
Estremoz 0704 Alentejo Central 67.07 -7.62537 38.8479 #N/D #N/D
Évora 0705 Alentejo Central 51.81 #N/D #N/D -7.85865 38.5558
Montemor-o-Novo 0706 Alentejo Central 68.65 -8.30465 38.6542 #N/D #N/D
Mora 0707 Alentejo Central 76.65 -8.07961 38.9172 #N/D #N/D
Mourão 0708 Alentejo Central 69.83 -7.41687 38.3 #N/D #N/D
Figura 71: Tabela para mapa de pontos

1. Comece por colocar na folha c_ a célula que recebe o valor do ponto de corte.
Escreva em $A$3 “Limite do mapa de pontos” e em $B$3 introduza um
valor entre 30 e 110 (60, por exemplo). Dê a esta célula o nome de
refLimiteMapa;
2. Insira uma nova folha com o nome t_mapa;
3. Da tabela tbPontos, copie as colunas Concelho, DTCC, NUTS3 e IDT para a
célula $A$10 da nova folha;
4. Defina estas colunas como tabela e dê-lhe o nome tbMapaPontos;
Pág. 94 O MAPA DE PONTOS

5. Adicione quatro novas colunas: LongSim, LatSim, LongNao, LatNao. Nas


duas primeiras serão colocados os pontos que cumprem os critérios
definidos e nas duas últimas os que não cumprem.

Quando copiou as colunas da tabela tbPontos a coluna IDT manteve a sua


fórmula. Poderá optar por mantê-la ou substituí-la por esta, que procura na
tabela o valor do IDT:

=PROCV([@Concelho],tbPontos[[Concelho]:[IDT]],4,FALSO)

As fórmulas para as restantes colunas são as seguintes:

• LongSim:
=SE([@IDT]>=refLimiteMapa,PROCV([@Concelho],tbgeo,5,FALSO),NÃO.DISP())
• LatSim: =SE([@IDT]>=refLimiteMapa,PROCV([@Concelho],tbgeo,6,FALSO),NÃO.DISP())
• LongNao:
=SE([@IDT]<refLimiteMapa,PROCV([@Concelho],tbgeo,5,FALSO),NÃO.DISP())
• LatNao: =SE([@IDT]<refLimiteMapa,PROCV([@Concelho],tbgeo,6,FALSO),NÃO.DISP())

O que cada uma destas fórmulas faz é avaliar se o IDT é superior ao ponto de
corte que definimos. Se o concelho cumpre o critério são introduzidas as suas
coordenadas geográficas. No caso contrário a fórmula retorna o erro #N/D.

Para tornar a análise um pouco mais interessante, podemos dar ao utilizador a


opção de alterar a direção do filtro: enfatizar os concelhos que estão acima ou os
que estão abaixo do ponto de corte. Na folha c_ escreva “Direção do filtro” na
célula $A$4 e o valor 1 na célula $B$4. Dê o nome refDirFiltro a esta célula.
Quando o utilizador escolher o valor máximo de IDT como ponto de partida, o
valor da célula será 1, e quando escolher o valor mínimo o valor será 2. Quando
desenharmos o dashboard iremos incluir um botão para facilitar a escolha.
Pág. 95 O MAPA DE PONTOS

Nas colunas LongSim e LatSim, a fórmula atual verifica se o IDT é maior ou


igual ao valor de referência ([@IDT]>=refLimiteMapa). Substitua apenas essa secção
por:

SELECIONAR(refDirFiltro,[@IDT]>=refLimiteMapa,[@IDT]<=refLimiteMapa)

A função SELECIONAR() recebe um valor, seguido de um conjunto de opções.


Se o valor for 1, ela seleciona a primeira das opções, se for 2, seleciona a
segunda, e assim sucessivamente. No nosso exemplo, o valor 1 significa que ela
vai escolher o critério que filtra os concelhos acima do ponto de corte. Se o valor
for 2, ela escolherá o critério que filtra os valores abaixo do ponto de corte. No
caso das colunas LongNao e LatNao, o critério será substituído por:

SELECIONAR(refDirFiltro,[@IDT]<refLimiteMapa,[@IDT]>refLimiteMapa)

A única diferença entre as duas funções SELECIONAR() está na utilização dos


sinais de maior e menor.

Para iniciar a criação do mapa introduza os novos nomes que vamos utilizar, de
acordo com a Figura 72. De seguida:

1. Insira um novo gráfico de dispersão vazio (escolha a primeira opção, só com


pontos);
2. Para que seja mais fácil reconhecer a localização dos pontos, coloque um
mapa em fundo. Em Formatar Área do Gráfico, escolha a opção
Preenchimento com imagem ou textura no Preenchimento. Abra o ficheiro
de imagem fornecido;
3. Ative Imagem em mosaico como textura para garantir que a sua relação
altura-largura se mantém;
4. Na mesma opção, reduza a Escala X e a Escala Y. Isto terá de ser ajustado em
função do tamanho do mapa no dashboard, mas teste 40% em ambos;
Pág. 96 O MAPA DE PONTOS

5. Ajuste a área do gráfico para que apenas fique visível um mapa;


6. Insira a série Sim com =t_mapa!pmpLongSim nos Valores da série X e
=t_mapa!pmpLatSim nos Valores da série Y ;
7. Insira a série Não com =t_mapa!pmpLongNao nos Valores da série X e
=t_mapa!pmpLatNao nos Valores da série Y.

Figura 72: Nomes para mapa de pontos

Como em muitos casos em que não nos restringimos à biblioteca de gráficos, o


resultado não parece prometedor (mapa 1 da Figura 73). Na verdade, apenas
temos de definir escalas mais adequadas para cada eixo e ajustar a área de
desenho à imagem de fundo (mapa 2). Para terminar, elimine todos os eixos,
linhas de grelha e etiquetas, reduza o tamanho dos marcadores e mude a cor dos
azuis para cinzento (mapa 3). Outras alterações serão feitas no dashboard.
Pág. 97 O MAPA DE PONTOS

Figura 73: Fases de construção do mapa de pontos

A técnica aplicada no mapa do capítulo anterior poderá ser interessante quando


o número de regiões é baixo, mas quando passamos para centenas (concelhos)
ou milhares (freguesias) de regiões é questionável se o custo se justifica. O mapa
de pontos, por seu turno, acomoda com facilidade um número virtualmente
ilimitado de pontos, pelo que poderá ser uma boa alternativa, complementando
outro tipo de análises.
Chegou finalmente o momento de desenhar o dashboard. Recordo que os
objetos foram elaborados em função de uma narrativa que vimos anteriormente,
e que essa narrativa deverá servir também para colocar os objetos na folha.

Vamos organizar o dashboard em três áreas paralelas, cada uma das quais com
um conjunto de elementos complementares. Para as separar, altere a largura de
todas as colunas na folha d_ para 50. Algumas colunas servirão de separadores
ou de margens e deverão ter uma largura de 20 (note que a resolução do seu
ecrã poderá exigir outro tipo de valores).

1. Altere a largura das colunas A,B,K, L e M para 20;


2. Afaste as segmentações de dados para a direita, caso estejam a interferir
3. Escolha o intervalo B5:K6, una as células e introduza uma referência para o
concelho ativo (=refSelConc);
4. Centre o texto, aumente o tipo de letra e escolha outras opções de
formatação que lhe pareçam adequadas;
5. Na segmentação por concelho, selecione Figueira de Castelo Rodrigo. É o
nome mais longo, permitindo verificar se as suas opções são compatíveis
com este texto;
6. Insira o título “Índice de Dependência Total”;

Vamos copiar cada um dos gráficos para o dashboard, começando pelo que
representa no nosso principal indicador:
Pág. 99 DESENHO DO DASHBOARD

1. Copie ou mova o velocímetro para o


dashboard;
2. Una algumas células no interior do
velocímetro e introduza uma referência para o
valor atual (=pvelAtual);
3. Aumente o tamanho da letra, centre o texto,
mas use uma cor que não interfira com o
ponteiro;

A Figura 74 mostra o resultado até agora. O


próximo passo é a colocação do gráfico de
Figura 74: Início de construção do dashboard pontos. Copie o título do velocímetro e
acrescente “ – Comparação Regional”. Para que seja mais claro o que significam
os três níveis de dados, adicione caixas de texto indicando “Concelho”,
“NUTS3”, “Outros” e “Quartis” (Figura 75). Altere o tipo de marcador, de círculo
para losango.

Índice de Dependência Total - Comparação Regional Vimos anteriormente que não há


regras absolutas em visualização de
Concel ho
informação e, se um velocímetro não
NUTS3 é um gráfico que possa ser usado
Outros indiscriminadamente, ele pode ser
Qua rti s usado com critério, sendo o primeiro
Q1 M Q3 +X desses critérios a relação com outros
30 40 50 60 70 80 90 100 110 gráficos.
Figura 75: Gráfico de pontos
O gráfico de pontos faz o seguimento
natural do velocímetro, repetindo o seu valor e enquadrando-o num contexto
mais vasto. De um ponto de vista estritamente funcional, o velocímetro não
seria necessário, mas um gráfico tão simples facilita a entrada no dashboard. O
Pág. 100 DESENHO DO DASHBOARD

gráfico de pontos aproveita essa predisposição do utilizador para lhe dar


informação mais complexa.

Como sabe, era nosso objetivo representar os


gráficos bullet com os cinco primeiros
concelhos da região ordenados por valor de
IDT, tendo a possibilidade de observar as
posições seguintes. Recordar-se-á que demos o
nome de refRankIDT à primeira célula da
coluna Rank na tabela de dados que suporta
estes gráficos. É altura de a usar.

Comece por copiar o título que estamos a usar


e altere o texto para “="Ranking do IDT na
NUTS3 " & refSelNUTS3” para incluir o nome
da NUTS3 do concelho atual. Copie o gráfico
Figura 76: Configuração do botão giratório para a folha do dashboard. No menu
Programador, escolha Inserir e Botão Giratório
(o quarto da primeira fila).

Com o botão do lado direito do rato sobre o


controlo, escolha Formatar Controlo e defina
as suas propriedades como indicado na Figura
76.

Experimente usar o botão. Em princípio, ele


deverá permitir alterar o valor da célula
Figura 77: Os gráficos bullet refRankIDT e deste modo alterar os concelhos
visíveis. Se o valor 1 será sempre o mínimo,
Pág. 101 DESENHO DO DASHBOARD

não é possível alterar o valor máximo para o número de concelhos na região


(sem recorrer a VBA). Quando o número máximo for superior ao número de
concelhos, as linhas de IDT deixarão de aparecer.

Com este gráfico termina a introdução de objetos na primeira área do


dashboard.

Figura 78: Gráfico de dispersão e mapa das regiões

Deixe a coluna L de intervalo e comece a segunda área do dashboard na coluna


M. Copie o subtítulo dos outros gráficos e altere o texto para “Índice de
Dependência: Jovens vs. Idosos”, mas reduza a sua extensão apenas até à coluna
S (anule a união e refaça-a sem as restantes células). Copie o gráfico de
dispersão, que parece não ter muito para alterar.
Pág. 102 DESENHO DO DASHBOARD

Ao lado deste gráfico iremos colocar o mapa das regiões, e aqui surge-nos um
problema novo. Ao contrário do que podemos fazer com os gráficos, no caso
deste mapa não é possível simplesmente copiá-lo para o dashboard. É para isso
que iremos usar a Máquina Fotográfica. O mapa manter-se-á na folha, mas
todas as alterações que forem feitas no original serão refletidas nesta imagem.

Na folha t_nuts3, escolha um intervalo de células que inclua todo o mapa mais
uma linha ou coluna à volta. Prima o botão Máquina Fotográfica que instalou na
Barra de ferramentas de acesso rápido. Volte ao dashboard e indique com um
clique onde quer colocar a imagem. Experimente reduzir a imagem para a
mesma altura do gráfico de dispersão. A imagem é aceitável, mas a identificação
das regiões é difícil, pelo que é necessário aumentar o tamanho das letras.

Volte à folha t_nuts3 e selecione as linhas


inteiras 8 a 60. Como o botão do lado direito
sobre o cabeçalho de linhas, defina a Altura de
Linhas com o valor atual. Isto fará com que a
altura não seja ajustada automaticamente
quando alterarmos o tamanho de letra.

Selecione de novo a zona do mapa e aumente o


tamanho da letra para 16. Verifique no
dashboard que já é possível lê-las. Se algumas
das legendas forem transformadas em “###”,
com o botão do lado direito do rato escolha
Formatar células, o marcador Alinhamento e
na Orientação altere o valor para 90º. Isto
Figura 79: Ajustamento do texto nas etiquetas das regiões
deverá resolver o problema (Figura 79).
Pág. 103 DESENHO DO DASHBOARD

Mas o mapa é interativo, e permite-nos escolher várias outras variáveis. Para


isso, selecione na folha c_ a célula refMenuMapaSel, que contém a variável
atual. Corte a célula e coloque-a na célula $U$5 do dashboard, ou uma coluna
após o título do gráfico de dispersão. A partir dessa célula escolha algumas
outras para a direita para que possam funcionar como título do mapa. Una
todas as células. Se começou na célula que trouxe não deverá perder a
funcionalidade de escolher outras variáveis. Neste caso, a barra do título foi
preenchida com verde para sinalizar que há outros valores que podem ser
escolhidos.

Pirâmide Etária do Concelho, NUTS3 e Nacional Variação por Idades

Idade Variação

75 91%
70 70 -27%
65 -46%
60 60 -28%
55 -48%
50 50 -46%
45 -50%
40 40 -38%
35 -24%
30 30 -50%
25 -44%
20 20 -65%
15 -75%
10 10 -66%
Homens Mulheres 5 -77%
0 0 -68%
35 30 25 20 15 10 5 0 5 10 15 20 25 30 35 Total -37%

Figura 80: Pirâmide etária e sparklines

Abaixo do gráfico de dispersão coloque de novo uma linha de título, com o texto
Pirâmide Etária de Concelho, NUTS e Nacional. Escolha a palavra Concelho e
Pág. 104 DESENHO DO DASHBOARD

altere a sua cor para a cor da linha do concelho no gráfico. Faça o mesmo com as
restantes regiões.

Isto não é estritamente necessário, porque poderíamos usar uma legenda


tradicional, mas serve apenas para mostrar outras formas de identificar séries.

No dashboard iremos ajustar as idades ao eixo vertical da pirâmide etária, a


qual não respeita a altura das linhas. Devido a isto, selecione o intervalo com os
grupos etários, as sparklines e as percentagens e use a Máquina Fotográfica
para colocar esta visualização no dashboard. Insira um título para o gráfico e
coloque a imagem.

Finalmente, o último passo é o da colocação do mapa de pontos. Deixe uma


coluna de separação para o mapa de NUTS3 e copie o gráfico. Verifique se a sua
dimensão é compatível com o layout do dashboard. Se não for, reduza a imagem
de fundo da área do gráfico e ajuste os limites a área. Ajuste de seguida a área de
desenho para que se sobreponha de forma correta à imagem de fundo.

O título do mapa inclui dois botões de opção que permitem definir se


procuramos os valores acima ou abaixo do ponto de corte definido à direita.
Para os colocar, no menu Programador escolha Inserir e Botão de Opção (o
último da primeira fila). Em cada um deles, com o botão do lado direito do rato
selecione Formatar controlo… e no separador Controlo escolha Ligação à célula
e introduza refDirFiltro.
Pág. 105 DESENHO DO DASHBOARD

IDT Acima Abaixo 62 De seguida, corte a célula refLimiteMapa da folha


c_ e coloque-a à direita no título. Entre os botões
e este valor coloque uma Barra de deslocamento,
retirada também do menu Programador, Inserir
(terceiro botão da segunda fila).

Com o botão do lado direito do rato, selecione


Formatar controlo… ative o separador controlo e
coloque os valores indicados na Figura 82,
incluindo a Ligação à célula refLimiteMapa.

Finalmente, abaixo do mapa coloque um novo


título com o texto “Seleção de concelho e ano” e,
abaixo, coloque as duas segmentações. Com o
botão do lado direito do rato, selecione a
segmentação por ano e escolha Ordenar do Mais
Recente para o Mais Antigo.

O dashboard parece estar concluído. No entanto,


talvez seja útil mais alguma informação, como a
população total, e outros indicadores que não
estão presentes.
Figura 81: O mapa de pontos

Não resta muito espaço no dashboard, mas talvez


possamos roubar um pouco de espaço ao
velocímetro, e colocar aí esses dados (Figura 83).
A população foi calculada a partir da tabela de
dados, usando a fórmula:
Figura 82: Opções da barra de deslocamento
Pág. 106 DESENHO DO DASHBOARD

=SOMARPRODUTO((tbPop[Concelho]=refSelConc)*(tbPop[Ano]=refSelAno)*(tbPop[Populacao]))

O crescimento foi retirado da tabela das sparklines:

=+OBTERDADOSDIN("Populacao",t_sparklines!$A$3,"Ano",DATA(2011,3,15))

A área foi retirada da tabela de dados geográficos:

=+PROCV(refSelConc,tbgeo[[Concelho]:[Area]],4,FALSO)

Finalmente, a densidade é um simples quociente entre população e área:

=+B9/B15

Ferreira do Alentejo
População Índice de Dependência Total
8,255 70
60 80

Crescimento 50 90
-27%
40 100
Área (Km2)
648

Densidade
64
12.7

Figura 83: Introdução de alguns dados adicionais

Para concluir, verifique se é possível adicionar um pouco de maquilhagem. Por


exemplo, cada uma das três áreas foi sombreada com um cinzento muito ligeiro
(RGB 245,245,245). Talvez seja necessário retirar o preenchimento na área de
alguns gráficos. Nas duas imagens da Máquina Fotográfica, sob Preenchimento,
coloque o nível de Transparência em 100%.
Pág. 107 DESENHO DO DASHBOARD

Se for necessário, nos títulos acrescente um comentário (botão do lado direito e


Inserir Comentário) explicando os conceitos envolvidos. Altere o nome da folha
d_ para Dashboard e a folha c_ para Parametros.

Não se esqueça que apenas terminou a primeira versão. Escolha alguns


concelhos mais extremos (o nome do concelho, o volume de população) e
verifique se não encontra erros. Teste o dashboard com outras resoluções de
ecrã e outras versões de Excel (esta versão é apenas para a versão 2013 e
seguintes). O Excel 2010 poderá dar alguns problemas na colocação das
etiquetas, que terão de ser colocadas manualmente.

(Acrescentei uma funci0nalidade final: a possibilidade de mostrar o


dashboard em português ou inglês, com um botão no canto inferior direito.
Descubra como o fiz!)
Fernando Pessoa escreveu uma conhecida peça de teatro intitulada O Banqueiro
Anarquista. A premissa é sedutora, mas falaciosa: um anarquista quer ser
absolutamente livre de “ficções sociais”, sendo o dinheiro uma delas. Só
possuindo uma grande quantidade de dinheiro nos tornamos livres do seu
poder, e, portanto, anarquistas. Como qualquer banqueiro o é, se aceitarmos a
premissa.

Mas há algo mais generalizável nesta lógica: quanto mais dominamos uma
ferramenta, menos atrito ela provoca e, assim, mais livres somos para expressar
as nossas ideias através dela. Claro que isto gera efeitos perversos: Maslow dizia
que “se a única ferramenta que temos é um martelo, é tentador ver tudo como
um prego”. Uma das formas de reduzir esse perigo é a de pensar nos problemas
usando lápis e papel ou, de uma forma mais genérica, encontrando formas de
expressar as nossas ideias sem que elas sejam constrangidas ou contaminadas
pelas ferramentas. Avaliar se elas têm capacidade para traduzir essas ideias (ou
melhorá-las) é algo que tem de estar sempre presente, mas esse deve ser um
segundo momento.

Este é um livro prático, cujo principal objetivo é o que transmitir o como-fazer


em técnicas específicas de Excel. É possível agrupá-las em duas categorias. A
primeira corresponde às técnicas que deveriam ser usadas: estruturar os dados
em tabelas e tabelas dinâmicas, usar folhas para cada tipo de tarefa, criar nomes
de intervalos. A segunda categoria corresponde a utilizações menos óbvias das
opções disponíveis para atingir certos objetivos: o uso das barras de erro ou a
criação de bandas de variação através da gradação de cor. A primeira categoria
mostra-nos o uso apropriado do nosso martelo, a segunda mostra-nos que, com
alguma criatividade, é possível expandir as suas funcionalidades.
Pág. 109 CONCLUSÕES

Embora o tema seja abordado nos dois primeiros capítulos, é importante


reforçar a ideia de que um dashboard dificilmente é eficaz sem que algumas
boas práticas e princípios de visualização de informação sejam considerados: o
gráfico é uma resposta a uma pergunta que deve ser tão explícita quanto
possível, para que a resposta também o seja; os objetos visuais e sua formatação
devem ter uma justificação racional; um gráfico é uma interpretação dos dados,
pelo que devemos explorar interpretações alternativas.

Um dashboard torna isto mais necessário: a multiplicação de gráficos significa


que temos de encontrar uma narrativa que os una e dê sentido à comunicação;
se estamos a monitorizar algo, tudo o que esteja fora dos parâmetros normais
deve chamar-nos a atenção; a gestão do espaço é crítica e devemos encontrar as
representações que o usem de forma mais eficiente.

Tudo isto mostra que fazer um dashboard em Excel é, provavelmente, uma das
eficazes formas de integrar uma multiplicidade de conceitos que vão para além
da simples aplicação de técnicas de Excel: é também uma forma de pensar e
estruturar os dados na sua área de conhecimento e atividade, traduzir esses
dados em objetos gráficos eficazes e integrar tudo isso numa comunicação
coerente.

Espero que este livro o tenha ajudado a consegui-lo e que isso se traduza em
benefícios concretos para si, para a sua organização e para os seus clientes.

Recordo-lho que, para mais conteúdos na área da visualização de informação,


pode acompanhar-me no Twitter, no Linkedin ou no meu blog principal, o
Excel Charts.
Pág. 110 CONCLUSÕES