Escolar Documentos
Profissional Documentos
Cultura Documentos
Quando o Tableau foi introduzido pela primeira vez, foi uma mudança dramática
de paradigma em relação aos relatórios tabulares e aos extensos ciclos de
integração de dados que produziram resultados muito depois que decisões
relevantes poderiam ter sido tomadas. O Tableau interrompeu o paradigma da
interação visual com os dados. E continua a oferecer um paradigma único – que
torna fácil e intuitivo (e divertido!) ser prático com os dados, receber feedback
visual instantâneo a cada ação e fazer perguntas e descobrir insights em um fluxo
natural de pensamento e interação. O resultado é uma #datafam cada vez maior,
uma comunidade que ama o Tableau por sua simplicidade, beleza e capacidade
de tornar divertido trabalhar com dados!
Se você é novo no Tableau ou o usa há meses ou até anos, com este livro você
obterá uma base sólida de compreensão do Tableau e as ferramentas e
habilidades a serem desenvolvidas para o domínio avançado da ferramenta.
O Capítulo 6, Mergulhando fundo com cálculos de tabela, fornece uma base sólida
para entender e usar cálculos de tabela para resolver uma ampla gama de
desafios de dados. Ele aborda os conceitos de escopo e direção, endereçamento
e particionamento, e percorre vários exemplos práticos aprofundados.
A maioria dos exemplos pode ser concluída com praticamente qualquer versão
recente do Tableau. Novos recursos e interfaces exigirão a versão 2022.1 ou
posterior.
Você pode baixar e instalar as versões mais recentes do Tableau usando estes
links:
Tableau Desktop: https://www.tableau.com/products/desktop/download
Dependendo dos termos de sua licença, o Tableau também permite que você use
sua licença em duas máquinas. Isso significa que você pode ter o Tableau
instalado no escritório (talvez até mesmo uma versão mais antiga), mas também
pode instalar a versão mais recente em sua máquina doméstica. Verifique seu
contrato de licenciamento e fale com um representante do Tableau para verificar
os detalhes do seu caso.
Convenções utilizadas
Há uma série de convenções de texto usadas ao longo deste livro.
IF LEFT([Room], 1) = "1"
END
CopyExplain
Negrito: indica um novo termo, uma palavra importante ou palavras que você vê
na tela. Por exemplo, palavras em menus ou caixas de diálogo aparecem no texto
como esta. Por exemplo: "Selecionar layout de tabela | Avançado no
menu Análise."
Entre em contato
Feedback de nossos leitores é sempre bem-vindo.
Você gosta de ler em movimento, mas não consegue levar seus livros impressos
para todos os lugares? Sua compra de eBook não é compatível com o dispositivo
de sua escolha?
Não se preocupe, agora com cada livro Packt você recebe uma versão PDF sem
DRM desse livro sem nenhum custo.
As vantagens não param por aí, você pode ter acesso exclusivo a descontos,
newsletters e ótimos conteúdos gratuitos em sua caixa de entrada diariamente
Você não precisa escrever scripts ou consultas complexas para aproveitar o poder
do Tableau. Em vez disso, você estará interagindo com seus dados em um
ambiente visual onde tudo o que você arrastar e soltar será traduzido nas
consultas necessárias para você e, em seguida, exibido visualmente. Você estará
trabalhando em tempo real, para que você veja os resultados imediatamente,
obtenha respostas o mais rápido possível para fazer perguntas e seja capaz de
iterar através de potencialmente dezenas de maneiras de visualizar os dados, a
fim de encontrar um insight chave ou contar um pedaço da história.
Vamos começar analisando como você pode conectar o Tableau aos seus dados.
Figure 1.1: The data connection screen allows you to build a connection to your
data
For this connection, no other configuration is required, so simply click on the Sheet
1 tab at the bottom of the Tableau window to start visualizing the data! You should
now see the main work area within Tableau, which looks like this:
We’ll refer to elements of the interface throughout the book using specific
terminology, so take a moment to familiarize yourself with the terms used for
various components numbered in the preceding screenshot:
Now that you have connected to the data in the text file, we’ll explore some
examples that lay the foundation for data visualization and then move on to
building some foundational visualization types. To prepare for this, please do the
following:
Campos discretos
Os campos discretos (azuis) têm valores que são mostrados como distintos e
separados uns dos outros. Valores discretos podem ser reordenados e ainda
fazem sentido. Por exemplo, você poderia facilmente reorganizar os valores de ser
, , e , em vez da ordem padrão na Figura 1.4.RegionEastSouthWestCentral
Quando um campo discreto é usado nas prateleiras Linhas ou Colunas, o campo
define cabeçalhos. Aqui, o campo discreto define os cabeçalhos de coluna: Region
Figura 1.7: O campo discreto em Cor define uma paleta de cores discreta
Campos contínuos
Figura 1.9: O campo contínuo em Cor define uma paleta de cores de gradiente
Ao analisar os exemplos deste livro, preste atenção aos campos que você está
usando para criar as visualizações, sejam elas dimensões ou medidas e se são
discretas ou contínuas. Experimente alterar campos na visualização de contínuo
para discreto e vice-versa, para obter uma compreensão das diferenças na
visualização. Colocaremos esse entendimento em prática à medida que voltarmos
nossa atenção para a visualização de dados.
Visualizando dados
Uma nova conexão com uma fonte de dados é um convite para explorar e
descobrir! Às vezes, você pode chegar aos dados com perguntas muito bem
definidas e uma forte noção do que espera encontrar. Outras vezes, você chegará
aos dados com perguntas gerais e muito pouca ideia do que encontrará. Os
recursos de análise visual do Tableau permitem que você explore os dados de
forma rápida e iterativa, faça novas perguntas e faça novas descobertas.
Os exemplos de visualização a seguir abrangem alguns dos tipos de visualização
mais fundamentais. Ao analisar os exemplos, tenha em mente que o objetivo não
é simplesmente aprender a criar um gráfico específico. Em vez disso, os exemplos
são projetados para ajudá-lo a pensar no processo de fazer perguntas sobre os
dados e obter respostas por meio de iterações de visualização. O Tableau foi
projetado para tornar esse processo intuitivo, rápido e transparente.
Algo que é muito mais importante do que memorizar as etapas para criar um tipo
de gráfico específico é entender como e por que usar o Tableau para criar um
gráfico e ser capaz de ajustar sua visualização para obter novos insights à medida
que você faz novas perguntas.
Gráficos de barras
Os gráficos de barras representam visualmente os dados de uma forma que
facilita a comparação de valores entre diferentes categorias. O comprimento da
barra é o principal meio pelo qual você entenderá visualmente os dados. Você
também pode incorporar cor, tamanho, empilhamento e ordem para comunicar
atributos e valores adicionais.
Criar gráficos de barras no Tableau é muito fácil. Basta arrastar e soltar a medida
que você deseja ver na prateleira Linhas ou Colunas e a dimensão que define as
categorias na divisória Linhas ou Colunas opostas.
Como analista da Superstore, você está pronto para iniciar um processo de
descoberta focado em vendas (especialmente o valor em dólar das vendas). À
medida que você segue os exemplos, trabalhe nas planilhas da pasta de trabalho.
A pasta de trabalho contém os exemplos completos para que você possa
comparar seus resultados a qualquer momento:Chapter 01 StarterChapter 01
Complete
1. Clique na guia Vendas por Departamento para visualizar essa planilha.
2. Arraste e solte o campo de Medidas no painel Dados para a
divisória Colunas. Agora você tem um gráfico de barras com uma única
barra representando a soma das vendas de todos os dados na fonte de
dados.Sales
3. Arraste e solte o campo de Dimensões no painel Dados para a
divisória Linhas. Isso divide os dados para fornecer três barras, cada uma
com um comprimento que corresponde à soma das vendas de cada
departamento:Department
Figura 1.11: A exibição Vendas por departamento deve ter esta aparência quando
você tiver concluído as etapas anteriores
Agora você tem um gráfico de barras horizontal. Isso facilita a comparação das
vendas entre os departamentos. O menu suspenso Tipo no cartão Marcas é
definido como Automático e indica que o Tableau determinou que as barras são a
melhor visualização, considerando os campos que você colocou na exibição.
Como uma dimensão, fatia os dados. Sendo discreto, ele define cabeçalhos de
linha para cada departamento nos dados. Como medida, o campo é agregado.
Sendo contínuo, define um eixo. O tipo de marca de barra faz com que barras
individuais para cada departamento sejam extraídas do valor da soma das vendas
desse departamento.DepartmentSales0
Normalmente, o Tableau desenha uma marca (como uma barra, um círculo ou um
quadrado) para cada combinação de valores dimensionais na exibição. Nesse
caso simples, o Tableau está desenhando uma única marca de barra para cada
valor dimensional (, e ) do . O tipo de marca é indicado e pode ser alterado no
menu suspenso no cartão Marcas. O número de marcas desenhadas na exibição
pode ser observado na barra de status inferior esquerda. FurnitureOffice
SuppliesTechnologyDepartment
O Tableau desenha marcas diferentes de maneiras diferentes; Por exemplo, as
barras são desenhadas a partir de 0 (ou do final da barra anterior, se empilhadas)
ao longo do eixo. Círculos e outras formas são desenhados em locais definidos
pelo(s) valor(es) do campo que está definindo o eixo. Reserve um momento para
experimentar a seleção de diferentes tipos de marcas no menu suspenso no
cartão Marcas. Uma compreensão sólida de como o Tableau desenha diferentes
tipos de marca ajudará você a dominar a ferramenta.
Você ainda tem um gráfico de barras horizontal, mas agora introduziu como outra
dimensão, o que altera o nível de detalhes na exibição e fatia ainda mais o
agregado da soma das vendas. Ao colocar antes, você pode facilmente comparar
as vendas de cada departamento dentro de uma determinada
região.RegionRegionDepartment
Agora você está começando a fazer algumas descobertas. Por exemplo, o
departamento de Tecnologia tem o maior número de vendas em todas as
regiões, exceto no Leste, onde Móveis teve vendas mais altas. Materiais de
Escritório nunca teve as maiores vendas em nenhuma região.
Figura 1.13: O modo de exibição Gráfico de Barras (empilhado) deve ter esta
aparência
Considere como o nível de detalhe do modo de exibição muda com base nos
campos usados no modo de exibição:
Se for o único campo usado como dimensão, você terá uma exibição no
nível de detalhe do departamento e todas as medidas na exibição serão
agregadas por departamento.Department
Se for o único campo usado como dimensão, você terá uma exibição no
nível de detalhe da região e todas as medidas na exibição serão agregadas
por região.Region
Se você usar ambas e como dimensões na exibição, você terá uma
exibição no nível de departamento e região. Todas as medidas serão
agregadas por combinação única de departamento e região, e haverá uma
marca para cada combinação de departamento e região. DepartmentRegion
Barras empilhadas podem ser úteis quando você deseja entender as relações de
parte para o todo. Agora é mais fácil ver qual parcela das vendas totais de cada
departamento é feita em cada região. No entanto, é muito difícil comparar as
vendas para a maioria das regiões entre departamentos. Por exemplo, você pode
facilmente dizer qual departamento teve as maiores vendas na região Leste? É
difícil porque, com exceção da região Oeste, cada segmento da barra tem um
ponto de partida diferente.
Agora reserve algum tempo para experimentar o gráfico de barras para ver quais
variações você pode criar:
À medida que você continuar a explorar várias iterações, ganhará confiança com a
flexibilidade disponível para visualizar seus dados.
Gráficos de linhas
Os gráficos de linhas conectam marcas relacionadas em uma visualização para
mostrar o movimento ou uma relação entre essas marcas conectadas. A posição
das marcas e as linhas que as conectam são os principais meios de comunicação
dos dados. Além disso, você pode usar tamanho e cor para comunicar
informações adicionais.
O tipo mais comum de gráfico de linhas é uma série temporal. Uma série
temporal mostra o movimento dos valores ao longo do tempo. A criação de um no
Tableau requer apenas uma data e uma medida.
Continue sua análise das vendas da Superstore usando a pasta de trabalho que
você acabou de salvar:Chapter 01 Starter
1. Navegue até o quadro de horas Vendas ao longo do tempo.
2. Arraste o campo de Medidas para Linhas. Isso fornece uma única barra
vertical que representa a soma de todas as vendas na fonte de dados. Sales
3. Para transformar isso em uma série temporal, você deve introduzir uma
data. Arraste o campo de Dimensões no painel Dados à esquerda e solte-
o em Colunas. O Tableau tem uma hierarquia de data interna e o nível
padrão de forneceu um gráfico de linhas conectando quatro anos. Observe
que você pode ver claramente um aumento nas vendas ano após ano: Order
DateYear
Figura 1.15: Uma etapa intermediária na criação do gráfico de linhas final; Isso
mostra a soma das vendas por ano
Figura 1.18: Este gráfico de linhas mostra a soma das vendas por trimestre com
linhas coloridas diferentes para cada região
As variações nas linhas para cada uma permitem que você perceba variações nas
tendências, extremos e taxa de mudança.Category
Visualizações geográficas
No Tableau, o banco de dados geográfico interno reconhece funções geográficas
para campos como , , , , ou . Mesmo que seus dados não contenham valores de
latitude e longitude, você pode simplesmente usar campos geográficos para plotar
locais em um mapa. Se seus dados contiverem campos de latitude e longitude,
você poderá usá-los em vez dos valores
gerados.CountryStateCityAirportCongressional DistrictZip Code
O Tableau atribuirá automaticamente funções geográficas a alguns campos com
base em um nome de campo e uma amostra de valores nos dados. Você pode
atribuir ou reatribuir funções geográficas a qualquer campo clicando com o botão
direito do mouse no campo no painel Dados e usando a opção Função
Geográfica. Essa também é uma boa maneira de ver quais funções geográficas
internas estão disponíveis.
Mapas preenchidos
Mapas de símbolos
Mapas de densidade
Além disso, o Tableau pode ler arquivos espaciais e geometrias de alguns bancos
de dados e renderizar objetos espaciais, polígonos e muito mais. Examinaremos
essas e outras capacidades geoespaciais no Capítulo 12, Explorando o
mapeamento e os recursos geoespaciais avançados. Por enquanto, vamos
considerar alguns princípios fundamentais para a visualização geográfica.
Mapas preenchidos
Os mapas preenchidos preenchem áreas como países, estados ou códigos
postais para mostrar uma localização. A cor que preenche a área pode ser usada
para comunicar medidas como vendas médias ou população, bem como
dimensões como região. Esses mapas também são chamados de mapas
coropléticos.
Figura 1.20: Um mapa preenchido mostrando a soma das vendas por estado
O mapa preenchido preenche cada estado com uma única cor para indicar a soma
relativa das vendas desse estado. A legenda da cor, agora visível na vista, dá o
intervalo de valores e indica que o estado com menos vendas teve um total
de 3.543 e o estado com mais vendas teve um total de 1.090.616.
Quando você olha para o número de marcas exibidas na barra de status inferior,
você verá que é 49. Um exame cuidadoso revela que as marcas consistem nos 48
estados inferiores e em Washington DC; Havaí e Alasca não são mostrados. O
Tableau só desenhará uma marca geográfica, como um estado preenchido, se ela
existir nos dados e não for excluída por um filtro.
Observe que o mapa exibe Canadá, México e outros locais não incluídos nos
dados. Eles fazem parte de uma imagem de fundo recuperada de um serviço de
mapa online. As marcas de estado são então desenhadas na parte superior da
imagem de fundo. Veremos como você pode personalizar o mapa e até mesmo
usar outros serviços de mapa na seção Técnicas de mapeamento do Capítulo
12, Explorando o mapeamento e recursos geoespaciais avançados.
Mapas de símbolos
A visualização final deve ficar assim, depois de fazer alguns ajustes finos no
tamanho e na cor:
Figura 1.21: Um mapa de símbolos que mostra a soma do lucro (codificada com
cor) e a soma das vendas (codificada com tamanho) por código postal
Figura 1.22: A caixa de diálogo Editar cores inclui opções para alterar o número de
etapas, inverter, usar o intervalo de cores completo, incluindo totais, e opções
avançadas para ajustar o intervalo e o ponto central
Ao contrário dos mapas preenchidos, os mapas de símbolos permitem que você
use o tamanho para codificar visualmente aspectos dos dados. Os mapas de
símbolos também permitem maior precisão. Na verdade, se você tiver latitude e
longitude em seus dados, poderá traçar marcas com muita precisão em um nível
de detalhe de endereço. Esse tipo de visualização também permite mapear locais
que não têm limites claramente definidos.
Além dos casos em que mapas preenchidos não são possíveis, você precisará
decidir qual tipo melhor atende às suas necessidades. Também consideraremos a
possibilidade de combinar mapas preenchidos e mapas de símbolos em uma
única visualização nos capítulos posteriores.
Mapas de densidade
Os mapas de densidade mostram a dispersão e concentração de valores
dentro de uma área geográfica. Em vez de pontos ou símbolos individuais, as
marcas se misturam, mostrando maior intensidade em áreas com alta
concentração. Você pode controlar a cor, o tamanho e a intensidade.
Digamos que você queira entender a concentração geográfica dos pedidos. Você
pode criar um mapa de densidade usando as seguintes etapas:
Várias paletas de cores estão disponíveis que funcionam bem para marcas de
densidade (as padrão funcionam bem com planos de fundo de cores claras, mas
há outras projetadas para funcionar com planos de fundo de cores escuras). O
controle deslizante Intensidade permite determinar a intensidade com que as
marcas devem ser desenhadas com base nas concentrações. O controle
deslizante Opacidade permite que você decida o quão transparentes as marcas
devem ser.
Este mapa de densidade exibe uma alta concentração de ordens da costa leste.
Às vezes, você verá padrões que apenas refletem a densidade populacional.
Nesses casos, sua análise pode não ser particularmente significativa. Neste caso,
a concentração na costa leste em comparação com a falta de densidade na costa
oeste é intrigante.
Com uma compreensão de como usar o Tableau para visualizar seus dados,
vamos voltar nossa atenção para um recurso que gera algumas visualizações
automaticamente, o Show Me!
Usando o Show Me
O recurso Mostrar é um componente poderoso do Tableau que organiza os
campos selecionados e ativos nos locais necessários para o tipo de visualização
selecionado. A barra de ferramentas Mostrar Me exibe pequenas imagens em
miniatura de diferentes tipos de visualizações, permitindo que você crie
visualizações com um único clique. Com base nos campos selecionados no
painel Dados e nos campos que já estão em exibição, Mostrar Me habilitará
possíveis visualizações e realçará uma visualização recomendada.
O Show Me pode ser uma maneira poderosa de iterar rapidamente por diferentes
tipos de visualização à medida que você procura insights sobre os dados. Mas,
como explorador de dados, analista e contador de histórias, você deve considerar
o Show Me como um guia útil que dá sugestões. Você pode saber que um
determinado tipo de visualização responderá às suas perguntas de forma mais
eficaz do que as sugestões de Mostrar-me. Você também pode ter um plano para
um tipo de visualização que funcionará bem como parte de um painel, mas nem
mesmo está incluído no Show Me.
Você estará no caminho certo para aprender e dominar o Tableau quando puder
usar o Show Me de forma eficaz, mas se sentir igualmente confortável para criar
visualizações sem ele. O Show Me é poderoso para iterar rapidamente por meio
de visualizações à medida que você procura insights e levanta novas perguntas. É
útil para começar com uma visualização padrão que você personalizará ainda
mais. É maravilhoso como ferramenta de ensino e aprendizagem.
No entanto, tenha cuidado para não usá-lo como muleta sem entender como as
visualizações são realmente construídas a partir dos dados. Tire um tempo para
avaliar por que certas visualizações são ou não possíveis. Pause para ver quais
campos e prateleiras foram usados quando você selecionou um determinado tipo
de visualização.
A interface do painel
Você pode criar um novo painel clicando no botão Novo painel ao lado das guias
na parte inferior da janela do Tableau ou selecionando Painel | Novo painel no
menu.
Quando você cria um novo painel, a interface será um pouco diferente do que é ao
projetar uma única exibição. Começaremos a projetar seu primeiro painel após
uma breve olhada na interface. Você pode navegar até a folha de vendas da
Superstore e dar uma olhada rápida nela você mesmo.
A janela do painel consiste em vários componentes-chave. As técnicas para usar
esses objetos serão detalhadas no Capítulo 8, Contando uma história de dados
com painéis. Por enquanto, concentre-se em ganhar alguma familiaridade com as
opções que estão disponíveis.
Uma coisa que você notará é que a barra lateral esquerda foi substituída por
conteúdo específico do painel:
Figura 1.26: A barra lateral dos painéis
Figura 1.29: Clique no botão Usar como filtro para usar uma exibição como
filtro em um painel
Resumo
O ambiente visual do Tableau permite um processo rápido e iterativo de
exploração e análise visual de dados. Você deu seus primeiros passos para
entender como usar a plataforma. Você se conectou aos dados e, em seguida,
explorou e analisou os dados usando alguns tipos de visualização importantes,
como gráficos de barras, gráficos de linhas e visualizações geográficas. Ao longo
do caminho, você se concentrou em aprender as técnicas e entender conceitos-
chave, como a diferença entre medidas e dimensões, e campos discretos e
contínuos. Finalmente, você junta todas as peças para criar um painel totalmente
funcional que permite que um usuário final entenda sua análise e faça suas
próprias descobertas.
No próximo capítulo, exploraremos como o Tableau funciona com dados. Você
será exposto a conceitos fundamentais e exemplos práticos de como se conectar
a várias fontes de dados. Combinado com os principais conceitos que você
acabou de aprender sobre a criação de visualizações, você estará bem equipado
para passar para visualizações mais avançadas, análises mais profundas e contar
histórias de dados totalmente interativas.
Você não precisa escrever scripts ou consultas complexas para aproveitar o poder
do Tableau. Em vez disso, você estará interagindo com seus dados em um
ambiente visual onde tudo o que você arrastar e soltar será traduzido nas
consultas necessárias para você e, em seguida, exibido visualmente. Você estará
trabalhando em tempo real, para que você veja os resultados imediatamente,
obtenha respostas o mais rápido possível para fazer perguntas e seja capaz de
iterar através de potencialmente dezenas de maneiras de visualizar os dados, a
fim de encontrar um insight chave ou contar um pedaço da história.
Vamos começar analisando como você pode conectar o Tableau aos seus dados.
We’ll refer to elements of the interface throughout the book using specific
terminology, so take a moment to familiarize yourself with the terms used for
various components numbered in the preceding screenshot:
Now that you have connected to the data in the text file, we’ll explore some
examples that lay the foundation for data visualization and then move on to
building some foundational visualization types. To prepare for this, please do the
following:
Medidas e dimensões
Os campos da fonte de dados ficam visíveis no painel Dados e são divididos
em Medidas e Dimensões.
Antes do Tableau 2020.2, essas são seções separadas no painel Dados. Em
versões mais recentes, cada tabela terá Medidas e Dimensões separadas por
uma linha:
Figura 1.3: Cada tabela (esta fonte de dados tem apenas uma) tem dimensões
listadas acima da linha e medidas listadas abaixo da linha
Campos discretos
Os campos discretos (azuis) têm valores que são mostrados como distintos e
separados uns dos outros. Valores discretos podem ser reordenados e ainda
fazem sentido. Por exemplo, você poderia facilmente reorganizar os valores de ser
, , e , em vez da ordem padrão na Figura 1.4.RegionEastSouthWestCentral
Quando um campo discreto é usado nas prateleiras Linhas ou Colunas, o campo
define cabeçalhos. Aqui, o campo discreto define os cabeçalhos de coluna: Region
Figura 1.7: O campo discreto em Cor define uma paleta de cores discreta
Campos contínuos
Figura 1.9: O campo contínuo em Cor define uma paleta de cores de gradiente
Ao analisar os exemplos deste livro, preste atenção aos campos que você está
usando para criar as visualizações, sejam elas dimensões ou medidas e se são
discretas ou contínuas. Experimente alterar campos na visualização de contínuo
para discreto e vice-versa, para obter uma compreensão das diferenças na
visualização. Colocaremos esse entendimento em prática à medida que voltarmos
nossa atenção para a visualização de dados.
Visualizando dados
Uma nova conexão com uma fonte de dados é um convite para explorar e
descobrir! Às vezes, você pode chegar aos dados com perguntas muito bem
definidas e uma forte noção do que espera encontrar. Outras vezes, você chegará
aos dados com perguntas gerais e muito pouca ideia do que encontrará. Os
recursos de análise visual do Tableau permitem que você explore os dados de
forma rápida e iterativa, faça novas perguntas e faça novas descobertas.
Os exemplos de visualização a seguir abrangem alguns dos tipos de visualização
mais fundamentais. Ao analisar os exemplos, tenha em mente que o objetivo não
é simplesmente aprender a criar um gráfico específico. Em vez disso, os exemplos
são projetados para ajudá-lo a pensar no processo de fazer perguntas sobre os
dados e obter respostas por meio de iterações de visualização. O Tableau foi
projetado para tornar esse processo intuitivo, rápido e transparente.
Algo que é muito mais importante do que memorizar as etapas para criar um tipo
de gráfico específico é entender como e por que usar o Tableau para criar um
gráfico e ser capaz de ajustar sua visualização para obter novos insights à medida
que você faz novas perguntas.
Gráficos de barras
Os gráficos de barras representam visualmente os dados de uma forma que
facilita a comparação de valores entre diferentes categorias. O comprimento da
barra é o principal meio pelo qual você entenderá visualmente os dados. Você
também pode incorporar cor, tamanho, empilhamento e ordem para comunicar
atributos e valores adicionais.
Criar gráficos de barras no Tableau é muito fácil. Basta arrastar e soltar a medida
que você deseja ver na prateleira Linhas ou Colunas e a dimensão que define as
categorias na divisória Linhas ou Colunas opostas.
Como analista da Superstore, você está pronto para iniciar um processo de
descoberta focado em vendas (especialmente o valor em dólar das vendas). À
medida que você segue os exemplos, trabalhe nas planilhas da pasta de trabalho.
A pasta de trabalho contém os exemplos completos para que você possa
comparar seus resultados a qualquer momento:Chapter 01 StarterChapter 01
Complete
1. Clique na guia Vendas por Departamento para visualizar essa planilha.
2. Arraste e solte o campo de Medidas no painel Dados para a
divisória Colunas. Agora você tem um gráfico de barras com uma única
barra representando a soma das vendas de todos os dados na fonte de
dados.Sales
3. Arraste e solte o campo de Dimensões no painel Dados para a
divisória Linhas. Isso divide os dados para fornecer três barras, cada uma
com um comprimento que corresponde à soma das vendas de cada
departamento:Department
Figura 1.11: A exibição Vendas por departamento deve ter esta aparência quando
você tiver concluído as etapas anteriores
Agora você tem um gráfico de barras horizontal. Isso facilita a comparação das
vendas entre os departamentos. O menu suspenso Tipo no cartão Marcas é
definido como Automático e indica que o Tableau determinou que as barras são a
melhor visualização, considerando os campos que você colocou na exibição.
Como uma dimensão, fatia os dados. Sendo discreto, ele define cabeçalhos de
linha para cada departamento nos dados. Como medida, o campo é agregado.
Sendo contínuo, define um eixo. O tipo de marca de barra faz com que barras
individuais para cada departamento sejam extraídas do valor da soma das vendas
desse departamento.DepartmentSales0
Normalmente, o Tableau desenha uma marca (como uma barra, um círculo ou um
quadrado) para cada combinação de valores dimensionais na exibição. Nesse
caso simples, o Tableau está desenhando uma única marca de barra para cada
valor dimensional (, e ) do . O tipo de marca é indicado e pode ser alterado no
menu suspenso no cartão Marcas. O número de marcas desenhadas na exibição
pode ser observado na barra de status inferior esquerda. FurnitureOffice
SuppliesTechnologyDepartment
O Tableau desenha marcas diferentes de maneiras diferentes; Por exemplo, as
barras são desenhadas a partir de 0 (ou do final da barra anterior, se empilhadas)
ao longo do eixo. Círculos e outras formas são desenhados em locais definidos
pelo(s) valor(es) do campo que está definindo o eixo. Reserve um momento para
experimentar a seleção de diferentes tipos de marcas no menu suspenso no
cartão Marcas. Uma compreensão sólida de como o Tableau desenha diferentes
tipos de marca ajudará você a dominar a ferramenta.
Você ainda tem um gráfico de barras horizontal, mas agora introduziu como outra
dimensão, o que altera o nível de detalhes na exibição e fatia ainda mais o
agregado da soma das vendas. Ao colocar antes, você pode facilmente comparar
as vendas de cada departamento dentro de uma determinada
região.RegionRegionDepartment
Agora você está começando a fazer algumas descobertas. Por exemplo, o
departamento de Tecnologia tem o maior número de vendas em todas as
regiões, exceto no Leste, onde Móveis teve vendas mais altas. Materiais de
Escritório nunca teve as maiores vendas em nenhuma região.
Figura 1.13: O modo de exibição Gráfico de Barras (empilhado) deve ter esta
aparência
Considere como o nível de detalhe do modo de exibição muda com base nos
campos usados no modo de exibição:
Se for o único campo usado como dimensão, você terá uma exibição no
nível de detalhe do departamento e todas as medidas na exibição serão
agregadas por departamento.Department
Se for o único campo usado como dimensão, você terá uma exibição no
nível de detalhe da região e todas as medidas na exibição serão agregadas
por região.Region
Se você usar ambas e como dimensões na exibição, você terá uma
exibição no nível de departamento e região. Todas as medidas serão
agregadas por combinação única de departamento e região, e haverá uma
marca para cada combinação de departamento e região. DepartmentRegion
Barras empilhadas podem ser úteis quando você deseja entender as relações de
parte para o todo. Agora é mais fácil ver qual parcela das vendas totais de cada
departamento é feita em cada região. No entanto, é muito difícil comparar as
vendas para a maioria das regiões entre departamentos. Por exemplo, você pode
facilmente dizer qual departamento teve as maiores vendas na região Leste? É
difícil porque, com exceção da região Oeste, cada segmento da barra tem um
ponto de partida diferente.
Agora reserve algum tempo para experimentar o gráfico de barras para ver quais
variações você pode criar:
À medida que você continuar a explorar várias iterações, ganhará confiança com a
flexibilidade disponível para visualizar seus dados.
Gráficos de linhas
Os gráficos de linhas conectam marcas relacionadas em uma visualização para
mostrar o movimento ou uma relação entre essas marcas conectadas. A posição
das marcas e as linhas que as conectam são os principais meios de comunicação
dos dados. Além disso, você pode usar tamanho e cor para comunicar
informações adicionais.
O tipo mais comum de gráfico de linhas é uma série temporal. Uma série
temporal mostra o movimento dos valores ao longo do tempo. A criação de um no
Tableau requer apenas uma data e uma medida.
Continue sua análise das vendas da Superstore usando a pasta de trabalho que
você acabou de salvar:Chapter 01 Starter
1. Navegue até o quadro de horas Vendas ao longo do tempo.
2. Arraste o campo de Medidas para Linhas. Isso fornece uma única barra
vertical que representa a soma de todas as vendas na fonte de dados. Sales
3. Para transformar isso em uma série temporal, você deve introduzir uma
data. Arraste o campo de Dimensões no painel Dados à esquerda e solte-
o em Colunas. O Tableau tem uma hierarquia de data interna e o nível
padrão de forneceu um gráfico de linhas conectando quatro anos. Observe
que você pode ver claramente um aumento nas vendas ano após ano: Order
DateYear
Figura 1.15: Uma etapa intermediária na criação do gráfico de linhas final; Isso
mostra a soma das vendas por ano
Figura 1.18: Este gráfico de linhas mostra a soma das vendas por trimestre com
linhas coloridas diferentes para cada região
As variações nas linhas para cada uma permitem que você perceba variações nas
tendências, extremos e taxa de mudança.Category
Visualizações geográficas
No Tableau, o banco de dados geográfico interno reconhece funções geográficas
para campos como , , , , ou . Mesmo que seus dados não contenham valores de
latitude e longitude, você pode simplesmente usar campos geográficos para plotar
locais em um mapa. Se seus dados contiverem campos de latitude e longitude,
você poderá usá-los em vez dos valores
gerados.CountryStateCityAirportCongressional DistrictZip Code
O Tableau atribuirá automaticamente funções geográficas a alguns campos com
base em um nome de campo e uma amostra de valores nos dados. Você pode
atribuir ou reatribuir funções geográficas a qualquer campo clicando com o botão
direito do mouse no campo no painel Dados e usando a opção Função
Geográfica. Essa também é uma boa maneira de ver quais funções geográficas
internas estão disponíveis.
Mapas preenchidos
Mapas de símbolos
Mapas de densidade
Além disso, o Tableau pode ler arquivos espaciais e geometrias de alguns bancos
de dados e renderizar objetos espaciais, polígonos e muito mais. Examinaremos
essas e outras capacidades geoespaciais no Capítulo 12, Explorando o
mapeamento e os recursos geoespaciais avançados. Por enquanto, vamos
considerar alguns princípios fundamentais para a visualização geográfica.
Mapas preenchidos
Os mapas preenchidos preenchem áreas como países, estados ou códigos
postais para mostrar uma localização. A cor que preenche a área pode ser usada
para comunicar medidas como vendas médias ou população, bem como
dimensões como região. Esses mapas também são chamados de mapas
coropléticos.
Figura 1.20: Um mapa preenchido mostrando a soma das vendas por estado
O mapa preenchido preenche cada estado com uma única cor para indicar a soma
relativa das vendas desse estado. A legenda da cor, agora visível na vista, dá o
intervalo de valores e indica que o estado com menos vendas teve um total
de 3.543 e o estado com mais vendas teve um total de 1.090.616.
Quando você olha para o número de marcas exibidas na barra de status inferior,
você verá que é 49. Um exame cuidadoso revela que as marcas consistem nos 48
estados inferiores e em Washington DC; Havaí e Alasca não são mostrados. O
Tableau só desenhará uma marca geográfica, como um estado preenchido, se ela
existir nos dados e não for excluída por um filtro.
Observe que o mapa exibe Canadá, México e outros locais não incluídos nos
dados. Eles fazem parte de uma imagem de fundo recuperada de um serviço de
mapa online. As marcas de estado são então desenhadas na parte superior da
imagem de fundo. Veremos como você pode personalizar o mapa e até mesmo
usar outros serviços de mapa na seção Técnicas de mapeamento do Capítulo
12, Explorando o mapeamento e recursos geoespaciais avançados.
Mapas de símbolos
A visualização final deve ficar assim, depois de fazer alguns ajustes finos no
tamanho e na cor:
Figura 1.21: Um mapa de símbolos que mostra a soma do lucro (codificada com
cor) e a soma das vendas (codificada com tamanho) por código postal
Figura 1.22: A caixa de diálogo Editar cores inclui opções para alterar o número de
etapas, inverter, usar o intervalo de cores completo, incluindo totais, e opções
avançadas para ajustar o intervalo e o ponto central
Ao contrário dos mapas preenchidos, os mapas de símbolos permitem que você
use o tamanho para codificar visualmente aspectos dos dados. Os mapas de
símbolos também permitem maior precisão. Na verdade, se você tiver latitude e
longitude em seus dados, poderá traçar marcas com muita precisão em um nível
de detalhe de endereço. Esse tipo de visualização também permite mapear locais
que não têm limites claramente definidos.
Além dos casos em que mapas preenchidos não são possíveis, você precisará
decidir qual tipo melhor atende às suas necessidades. Também consideraremos a
possibilidade de combinar mapas preenchidos e mapas de símbolos em uma
única visualização nos capítulos posteriores.
Mapas de densidade
Os mapas de densidade mostram a dispersão e concentração de valores
dentro de uma área geográfica. Em vez de pontos ou símbolos individuais, as
marcas se misturam, mostrando maior intensidade em áreas com alta
concentração. Você pode controlar a cor, o tamanho e a intensidade.
Digamos que você queira entender a concentração geográfica dos pedidos. Você
pode criar um mapa de densidade usando as seguintes etapas:
Várias paletas de cores estão disponíveis que funcionam bem para marcas de
densidade (as padrão funcionam bem com planos de fundo de cores claras, mas
há outras projetadas para funcionar com planos de fundo de cores escuras). O
controle deslizante Intensidade permite determinar a intensidade com que as
marcas devem ser desenhadas com base nas concentrações. O controle
deslizante Opacidade permite que você decida o quão transparentes as marcas
devem ser.
Este mapa de densidade exibe uma alta concentração de ordens da costa leste.
Às vezes, você verá padrões que apenas refletem a densidade populacional.
Nesses casos, sua análise pode não ser particularmente significativa. Neste caso,
a concentração na costa leste em comparação com a falta de densidade na costa
oeste é intrigante.
Com uma compreensão de como usar o Tableau para visualizar seus dados,
vamos voltar nossa atenção para um recurso que gera algumas visualizações
automaticamente, o Show Me!
Usando o Show Me
O recurso Mostrar é um componente poderoso do Tableau que organiza os
campos selecionados e ativos nos locais necessários para o tipo de visualização
selecionado. A barra de ferramentas Mostrar Me exibe pequenas imagens em
miniatura de diferentes tipos de visualizações, permitindo que você crie
visualizações com um único clique. Com base nos campos selecionados no
painel Dados e nos campos que já estão em exibição, Mostrar Me habilitará
possíveis visualizações e realçará uma visualização recomendada.
O Show Me pode ser uma maneira poderosa de iterar rapidamente por diferentes
tipos de visualização à medida que você procura insights sobre os dados. Mas,
como explorador de dados, analista e contador de histórias, você deve considerar
o Show Me como um guia útil que dá sugestões. Você pode saber que um
determinado tipo de visualização responderá às suas perguntas de forma mais
eficaz do que as sugestões de Mostrar-me. Você também pode ter um plano para
um tipo de visualização que funcionará bem como parte de um painel, mas nem
mesmo está incluído no Show Me.
Você estará no caminho certo para aprender e dominar o Tableau quando puder
usar o Show Me de forma eficaz, mas se sentir igualmente confortável para criar
visualizações sem ele. O Show Me é poderoso para iterar rapidamente por meio
de visualizações à medida que você procura insights e levanta novas perguntas. É
útil para começar com uma visualização padrão que você personalizará ainda
mais. É maravilhoso como ferramenta de ensino e aprendizagem.
No entanto, tenha cuidado para não usá-lo como muleta sem entender como as
visualizações são realmente construídas a partir dos dados. Tire um tempo para
avaliar por que certas visualizações são ou não possíveis. Pause para ver quais
campos e prateleiras foram usados quando você selecionou um determinado tipo
de visualização.
A interface do painel
Você pode criar um novo painel clicando no botão Novo painel ao lado das guias
na parte inferior da janela do Tableau ou selecionando Painel | Novo painel no
menu.
Quando você cria um novo painel, a interface será um pouco diferente do que é ao
projetar uma única exibição. Começaremos a projetar seu primeiro painel após
uma breve olhada na interface. Você pode navegar até a folha de vendas da
Superstore e dar uma olhada rápida nela você mesmo.
A janela do painel consiste em vários componentes-chave. As técnicas para usar
esses objetos serão detalhadas no Capítulo 8, Contando uma história de dados
com painéis. Por enquanto, concentre-se em ganhar alguma familiaridade com as
opções que estão disponíveis.
Uma coisa que você notará é que a barra lateral esquerda foi substituída por
conteúdo específico do painel:
Figura 1.26: A barra lateral dos painéis
Figura 1.29: Clique no botão Usar como filtro para usar uma exibição como
filtro em um painel
Resumo
O ambiente visual do Tableau permite um processo rápido e iterativo de
exploração e análise visual de dados. Você deu seus primeiros passos para
entender como usar a plataforma. Você se conectou aos dados e, em seguida,
explorou e analisou os dados usando alguns tipos de visualização importantes,
como gráficos de barras, gráficos de linhas e visualizações geográficas. Ao longo
do caminho, você se concentrou em aprender as técnicas e entender conceitos-
chave, como a diferença entre medidas e dimensões, e campos discretos e
contínuos. Finalmente, você junta todas as peças para criar um painel totalmente
funcional que permite que um usuário final entenda sua análise e faça suas
próprias descobertas.
No próximo capítulo, exploraremos como o Tableau funciona com dados. Você
será exposto a conceitos fundamentais e exemplos práticos de como se conectar
a várias fontes de dados. Combinado com os principais conceitos que você
acabou de aprender sobre a criação de visualizações, você estará bem equipado
para passar para visualizações mais avançadas, análises mais profundas e contar
histórias de dados totalmente interativas.
Comparação
Datas e horários
Relacionar partes dos dados com o todo
Distribuições
Múltiplos eixos
Você deve ter notado a falta de uma localização espacial ou categoria geográfica
na lista anterior. O mapeamento foi introduzido no Capítulo 1, Decolando com o
Tableau, e chegaremos a alguns recursos geográficos avançados no Capítulo
12, Explorando o mapeamento e os recursos geoespaciais avançados.
Você pode recriar os exemplos encontrados neste capítulo usando a pasta de
trabalho ou até mesmo começar do zero usando uma pasta de trabalho em branco
e conectando-se ao arquivo localizado na pasta. Os exemplos concluídos podem
ser encontrados na pasta de trabalho.Chapter 03 Starter.twbxHospital
Visits.csvLearning Tableau/Chapter 03Chapter 03 Complete.twbx
Comparando valores
Muitas vezes, você desejará comparar as diferenças entre os valores medidos em
diferentes categorias. Você pode se encontrar fazendo as seguintes perguntas:
Quantos clientes cada loja atendeu?
Quanta energia cada parque eólico produziu?
Quantos pacientes cada médico atendeu?
Em cada caso, você está procurando fazer uma comparação (entre lojas, parques
eólicos ou médicos) em termos de alguma medição quantitativa (o número de
clientes, unidades de eletricidade e pacientes).
Gráficos de barras
Aqui está um gráfico de barras simples, semelhante ao que construímos
no Capítulo 1, Decolando com o Tableau:
Gráfico de marcadores
Um gráfico de marcadores (às vezes também chamado de gráfico de
marcadores) é uma ótima maneira de comparar visualmente uma medida com
uma meta, alvo ou limite. A barra indica o valor da medida, enquanto a linha indica
o destino. O Tableau também usa como padrão sombreamento para indicar 60% e
80% da distância até a meta ou limite. A linha e o sombreamento são linhas de
referência. Consideraremos exemplos detalhados de trabalho com linhas de
referência ao longo do livro, especialmente no Capítulo 9, Visual Analytics:
Trends, Clustering, Distributions and Forecasting. Aqui está um exemplo de um
gráfico de marcadores:
Chamando limites
Com gráficos de marcadores, pode ser útil chamar visualmente as barras que não
atendem ou excedem o limite. Examinaremos os cálculos em profundidade no
próximo capítulo, mas, por enquanto, você pode concluir este exemplo com as
seguintes etapas:
Figura 3.12: Os departamentos que atingiram sua meta são destacados neste
gráfico de marcadores
Por exemplo, você pode comparar a receita com uma meta ou pode comparar a
receita do ano atual com o ano anterior:
Figura 3.13: Gráfico de barras em barras
Para criar esse modo de exibição, continue na mesma pasta de trabalho e siga
estas etapas:
Figura 3.16: Esta lista suspensa determina como a exibição atual é dimensionada
Ocultando a legenda do tamanho. Você pode decidir que a legenda de
tamanho não adiciona nada a essa exibição específica, pois o tamanho foi
usado apenas para permitir que barras sobrepostas sejam vistas.
Para ocultar qualquer legenda, use a seta suspensa na legenda e
selecione Ocultar cartão:
Agora, à medida que os dados são atualizados ao longo do tempo, você poderá
ver imediatamente como os dois departamentos de seu interesse se comparam a
outros departamentos. Para criar esse modo de exibição, execute estas etapas:
Figura 3.19: Após Ctrl + clicando nas duas barras, use o ícone de clipe de
papel para agrupá-las
Para ver isso em ação, continue com a pasta de trabalho, navegue até a planilha e
crie um modo de exibição arrastando e soltando Número de Visitas de
Pacientes em Linhas e Data de Admissão em Colunas. O campo ANO (Data
de Admissão) em Colunas terá um indicador de sinal de mais, como este:Chapter
3Built-in Date Hierarchy
Figura 3.20: O campo que representa a parte Ano da hierarquia de datas
Figura 3.21: Um ícone de adição nos cabeçalhos de coluna que pode ser usado
para expandir a hierarquia
Figura 3.24: Esta vista utiliza Mês como parte da data. O número de atendimentos
é o total do mês, independentemente do ano
É importante notar que quase todas essas opções podem ser usadas como
campos discretos ou contínuos. As partes de data são discretas por padrão. Os
valores de data e as datas exatas são contínuos por padrão. No entanto, você
pode alternar entre discreto e contínuo, conforme necessário, para permitir
flexibilidade na visualização.
Por exemplo, você deve ter um eixo (exigindo um campo contínuo) para criar uma
linha de referência. Além disso, o Tableau só conectará linhas no nível mais baixo
de cabeçalhos de linha ou coluna. Usar um valor de data contínua em vez de
várias partes de data discretas permitirá que você conecte linhas em vários anos,
trimestres e meses.
Como atalho, você pode clicar com o botão direito do mouse e arrastar e soltar um
campo de data no modo de exibição para obter um menu de opções de como o
campo de data deve ser usado antes do modo de exibição ser desenhado.
Por exemplo, usar a parte de data do mês para colunas e a parte de data do ano
para cor fornece uma série temporal que torna uma comparação visual ano a ano
bastante fácil. A parte da data do ano foi copiada para o rótulo para que as linhas
possam ser rotuladas:
Figure 3.26: The comparison of two years, month by month
Clicking on any of the shelves on the Marks card will give you a menu of options.
Here, Label has been clicked, and the label was adjusted to show only at the end
of each line.
The following heat map is another example of using date parts on different shelves
to achieve useful analysis. This kind of visualization can be quite useful when
looking at patterns across different parts of time, such as hours in a day or weeks
in a month. Here, we are looking at how many patients were admitted by month
and day:
Figure 3.27: A heat map showing the intensity of patient visits by day and month
The year has not been included in the view, so this is an analysis of all years in
the data and allows us to see whether there are any seasonal patterns or hotspots.
We might notice patterns related to epidemics, doctors’ schedules, or the timing of
insurance benefits. Perhaps the increased intensity of patient admissions in
February corresponds to the flu season.
Gantt charts
Gantt charts can be incredibly useful for understanding any series of events with a
duration, especially if those events have some kind of relationship. Visually, they
are very useful for determining whether certain events overlap, have a
dependency, or take more or less time than other events.
For example (not included in the workbook), the following Gantt chart shows a
series of processes that run when an application is started.
Some of these processes run in parallel, and some are clearly dependent on
others. The Gantt chart makes these dependencies clear:
Figure 3.28: A Gantt chart showing the time each process started and how long
each took
Figura 3.30: Gráfico de Gantt final, mostrando cada paciente, quando foi internado,
quanto tempo permaneceu e se retornou
Esse tipo de gráfico pode ser muito útil para ver padrões e relacionamentos entre
entidades ao longo do tempo.
Esses tipos de perguntas são sobre a relação entre a peça (método de produção,
estado e arquivo/diretório) e o todo (energia total, vendas nacionais e disco rígido).
Existem vários tipos de visualizações e variações que podem ajudá-lo em sua
análise.
Barras empilhadas
Analisamos as barras empilhadas no Capítulo 1, Decolando com o Tableau, onde
observamos uma desvantagem significativa: é difícil comparar valores na maioria
das categorias. Com exceção das barras mais à esquerda (ou mais abaixo), os
outros segmentos de barras têm pontos de partida diferentes, de modo que os
comprimentos são muito mais difíceis de comparar. Isso não significa que barras
empilhadas nunca devam ser usadas, mas deve-se ter cautela para garantir a
clareza da comunicação.
Aqui, estamos usando barras empilhadas para visualizar a composição do todo.
Estamos menos preocupados em comparar visualmente entre categorias e mais
preocupados em ver as partes que compõem uma categoria.
Podemos visualizar o número de visitas discriminado por perfil de risco como uma
barra empilhada, assim:
Isso dá uma visão decente das visitas para cada tipo de departamento. Podemos
dizer que mais pessoas visitam os departamentos gerais e que o número de
pacientes de alto risco tanto para a Especialidade quanto para os Laboratórios é
praticamente o mesmo. Os Cuidados Intensivos atendem menos pacientes de
alto risco e menos pacientes em geral. Mas isso é apenas parte da história.
Considere uma barra empilhada que não forneça o valor absoluto, mas forneça
porcentagens para cada tipo de departamento:
Figura 3.34: Este botão da barra de ferramentas ativa ou desativa rótulos de texto
Mapas de árvore
Os mapas de árvore usam uma série de retângulos aninhados para exibir partes
do todo, especialmente dentro de relações hierárquicas. Os mapas de árvore são
particularmente úteis quando você tem hierarquias e dimensões com alta
cardinalidade (um alto número de valores distintos).
Aqui está um exemplo de um treemap que mostra o número de dias passados no
hospital pelos pacientes. As seções de retângulo maiores mostram Tipo de
Departamento. Dentro deles estão departamentos e pacientes:
Figura 3.36: Um mapa de árvore que mostra a relação parte-a-todo dos tipos de
departamentos/departamentos/médicos/pacientes
Gráficos de área
Pegue um gráfico de linhas e preencha a área abaixo da linha. Se houver várias
linhas, empilhe as áreas preenchidas umas sobre as outras. É assim que você
pode pensar em um gráfico de área.
Na verdade, no Tableau, talvez seja mais fácil criar um gráfico de linhas, como já
fez anteriormente, e alterar o tipo de marca no cartão Marcas para Área.
Quaisquer dimensões nas prateleiras Cor, Rótulo ou Detalhe criarão fatias da
área que serão empilhadas umas sobre as outras. A prateleira Tamanho não é
aplicável a um gráfico de área.
Figura 3.39: Gráfico de área que mostra as visitas aos pacientes ao longo do
tempo por ramo hospitalar
As outras bandas estão empilhadas em cima e torna-se muito difícil comparar. Por
exemplo, é óbvio que há um pico por volta de fevereiro de cada ano. Mas será que
é em cada ramo? Ou uma das bandas mais baixas está empurrando as bandas
mais altas para cima? Qual banda tem o pico mais significativo?
Gráficos de pizza
Os gráficos de pizza também podem ser usados para mostrar relações de parte
para o todo. Para criar um gráfico de pizza no Tableau, altere o tipo de marca
para Pizza. Isso lhe dará uma prateleira Angle, que você pode usar para codificar
uma medida. Quaisquer que seja(m) a(s) dimensão(ões) colocada(s) no
cartão Marcas (normalmente, na prateleira Cor) definirá as fatias da torta:
Figura 3.41: Gráfico de pizza mostrando a receita total discriminada por ramo
Observe que o gráfico de pizza anterior usa a soma da receita total para definir
o ângulo de cada fatia; quanto maior a soma, maior a fatia. A dimensão do Ramo
Hospitalar está fatiando a medida e definindo fatias do bolo. Essa exibição
também demonstra a capacidade de colocar vários campos na divisória Rótulo. O
segundo campo SOMA(Receita) é a porcentagem do cálculo total da tabela que
você viu anteriormente. Isso permite que você veja os valores absolutos da
receita, bem como uma porcentagem do todo.
Os gráficos de pizza podem funcionar bem com algumas fatias. Na maioria dos
casos, mais de dois ou três tornam-se muito difíceis de ver e entender. Além
disso, como uma boa prática, classifique as fatias classificando a dimensão que
define as fatias. No exemplo anterior, a dimensão Ramo Hospitalar foi
classificada pela receita decrescente. Isso foi feito usando a opção de menu
suspenso. Isso faz com que as fatias sejam ordenadas da maior para a menor e
permite que qualquer pessoa que leia o gráfico possa ver facilmente quais fatias
são maiores, mesmo quando o tamanho e os ângulos são quase idênticos. SUM
Visualizando distribuições
Muitas vezes, simplesmente entender totais, somas e até mesmo a divisão de
parte para todo só dá uma parte do quadro geral. Na maioria das vezes, você vai
querer entender onde os itens individuais se enquadram em uma distribuição de
todos os itens semelhantes.
Quanto cada cliente gasta em nossas lojas e como isso se compara a todos
os outros clientes?
Quanto tempo a maioria dos nossos pacientes fica no hospital? Quais
pacientes estão fora da normalidade?
Qual é a expectativa de vida média dos componentes de uma máquina e
que duram mais do que a média? Existem componentes com vida útil
extremamente longa ou extremamente curta?
Quão acima ou abaixo da aprovação foram as notas dos alunos nos testes?
Todas essas perguntas têm semelhanças. Em cada caso, você busca entender
como os indivíduos (clientes, pacientes, componentes e alunos) se relacionam
com o grupo. Em cada caso, você provavelmente tem um número relativamente
alto de indivíduos. Em termos de dados, você tem uma dimensão (cliente,
paciente, componente e aluno) que representa uma população relativamente
grande de indivíduos e alguma medida (quantidade gasta, tempo de permanência,
expectativa de vida e pontuação do teste) que você gostaria de comparar. Usar
uma ou mais das visualizações a seguir pode ser uma boa maneira de fazer isso.
Gráficos circulares
Os gráficos circulares são uma maneira de visualizar uma distribuição. Considere
a seguinte visão, que mostra como cada médico se compara a outros médicos
dentro do mesmo tipo de departamento em termos da média de dias que seus
pacientes permanecem no hospital:
Figura 3.42: Gráfico circular com o tempo médio de internação de cada médico em
cada tipo de departamento
Aqui, você pode ver quais médicos têm pacientes que permanecem no hospital
por períodos mais longos ou mais curtos do que a média. Também é interessante
notar que certos tipos de departamentos têm maior tempo médio de permanência
em relação a outros. Isso faz sentido, pois cada tipo de departamento tem
pacientes com necessidades diferentes. Provavelmente não é surpreendente que
os pacientes em Terapia Intensiva tendam a ficar mais tempo. Alguns
departamentos podem ter objetivos ou requisitos diferentes. Ser capaz de avaliar
médicos dentro de seu tipo de departamento torna as comparações muito mais
significativas.
Para criar o gráfico de círculo anterior, você precisa colocar os campos nas
prateleiras que são mostrados e, em seguida, basta alterar o tipo de marca
de Automático (que era uma marca de barra) para Círculo. Tipo de
Departamento define as linhas, e cada círculo é desenhado no nível de Doutor,
que está no nível de Detalhe no cartão Marcas.
Finalmente, para adicionar as linhas médias, basta alternar para a
guia Analytics do painel esquerdo e arrastar Linha média para a exibição,
especificamente soltando-a na opção Célula:
Figura 3.43: Você pode adicionar linhas de referência e muito mais arrastando da
guia Analytics para a exibição
Nervosismo
Ao usar modos de exibição como gráficos de círculo ou outros tipos de
visualização semelhantes, você verá frequentemente que as marcas se
sobrepõem, o que pode levar a obscurecer partes da história real. Sabe ao certo,
só de olhar, quantos médicos há nos Cuidados Intensivos que estão acima da
média? Quantos estão abaixo? Ou poderia haver dois ou mais círculos
exatamente sobrepostos? Uma maneira de minimizar isso é clicar na
prateleira Cor e adicionar um pouco de transparência e uma borda a cada círculo.
Outra abordagem é uma técnica chamada jittering.
Jittering é uma técnica comum na visualização de dados que envolve adicionar
um pouco de ruído intencional a uma visualização para evitar sobreposição sem
prejudicar a integridade do que está sendo comunicado. Alan Eldridge e Steve
Wexler estão entre aqueles que foram pioneiros em técnicas para nervosismo no
Tableau.
Várias técnicas de nervosismo, como o uso das funções ou, podem ser
encontradas pesquisando por nervosismo nos fóruns do Tableau ou o tremor do
Tableau usando um mecanismo de pesquisa.Index()Random()
Aqui está uma abordagem que usa a função, computada ao longo de Doctor,
como um campo contínuo em Rows. Como INDEX() é contínuo (verde), ele define
um eixo e faz com que os círculos se espalhem verticalmente. Index()
Agora, você pode ver mais claramente cada marca individual e ter maior confiança
de que a sobreposição não está obscurecendo a imagem verdadeira dos dados:
Figura 3.44: Aqui, INDEX() foi adicionado como um campo contínuo em Linhas (o
cálculo da tabela é calculado ao longo de Doctor)
Histogramas
Outra possibilidade para mostrar distribuições é usar um histograma. Um
histograma é semelhante a um gráfico de barras, mas as barras mostram uma
contagem de ocorrências de um valor. Por exemplo, auditores de teste
padronizados que procuram evidências de adulteração de notas podem construir
um histograma das pontuações dos testes dos alunos.
Algo está claramente errado. Talvez os alunos tenham esbarrado em alunos que
eram apenas tímidos de passar para mal passar. Também é possível que isso
possa indicar viés na classificação subjetiva em vez de adulteração flagrante. Não
devemos tirar conclusões precipitadas, mas o padrão não é normal e requer
investigação. Histogramas são muito úteis na captura de anomalias como esta.
Agora que vimos um exemplo de histogramas, vamos mudar nosso foco de volta
para os dados hospitalares e trabalhar com um exemplo. E se você quiser
visualizar o tempo que leva para iniciar o tratamento do paciente para que você
possa observar os padrões para diferentes populações de pacientes. Talvez você
queira criar um histograma. Neste exemplo, começaremos com um modo de
exibição em branco e seguiremos estas etapas:
Você pode buscar análises adicionais, como ver como os tempos de espera
variam para a maioria dos pacientes com base em seu perfil de risco, como nesta
visão:
Você pode criar novas lixeiras por conta própria clicando com o botão direito do
mouse em um campo numérico e selecionando Criar | Lixeiras. Você pode editar
o tamanho dos compartimentos selecionando a opção Editar para o campo de
lixeira.
Você também vai querer considerar o que você deseja contar para cada
compartimento e colocá-lo em Linhas. Quando você usou Mostrar-me, o Tableau
colocou o de Minutos para Serviço em Linhas, que é apenas uma contagem de
cada registro em que o valor não era nulo. Nesse caso, isso equivale a uma
contagem de visitas de pacientes porque o conjunto de dados contém um registro
por visita. No entanto, se você quiser contar o número de pacientes exclusivos,
considere substituir o campo na exibição por .COUNTCOUNTD([Patient ID])
Assim como as datas, quando o campo de compartimento na exibição é discreto,
o menu suspenso inclui uma opção para Mostrar valores ausentes. Se você usar
um campo de compartimento discreto, convém usar essa opção para evitar
distorcer a visualização e identificar quais valores não ocorrem nos dados.
Gráfico de dispersão
Um gráfico de dispersão é um tipo de visualização essencial para entender a
relação entre duas medidas. Considere um gráfico de dispersão quando você se
encontrar fazendo perguntas como as seguintes:
Cada uma dessas questões busca entender a correlação (se houver) entre duas
medidas. Os gráficos de dispersão ajudam você a entender essas relações e a ver
quaisquer outliers.
Considere o gráfico de dispersão a seguir, que procura uma relação entre a
receita total de um departamento e o número de visitas de pacientes:
Vamos considerar alguns outros tipos de gráficos que usam vários eixos.
Este gráfico usa uma combinação de barras e linhas para mostrar o número total
de visitas de pacientes ao longo do tempo (as barras) e a divisão das visitas de
pacientes por ramo hospitalar ao longo do tempo (as linhas). Esse tipo de
visualização pode ser bastante eficaz para dar contexto adicional aos dados.
Resumo
Nós cobrimos um pouco de terreno neste capítulo! Agora você deve ter uma boa
compreensão de quando usar certos tipos de visualizações. Os tipos de perguntas
que você faz sobre dados geralmente o levarão a um determinado tipo de
exibição. Você explorou como criar esses vários tipos e como estender
visualizações básicas usando uma variedade de técnicas avançadas, como
campos calculados, tremulação, vários tipos de marca e eixo duplo. Ao longo do
caminho, também abordamos alguns detalhes sobre como as datas funcionam no
Tableau.
Espero que os exemplos de uso de cálculos neste capítulo tenham aguçado seu
apetite para aprender mais sobre a criação de campos calculados. A capacidade
de criar cálculos no Tableau abre infinitas possibilidades para estender a análise
de dados, calcular resultados, personalizar visualizações e criar interatividade
avançada com o usuário. Vamos mergulhar fundo nos cálculos nos próximos dois
capítulos para ver como eles funcionam e que coisas incríveis eles podem fazer.
A primeira metade deste capítulo se concentra em fornecer uma visão geral dos
vários tipos de cálculos e como eles são criados, enquanto a segunda metade
fornece alguns exemplos práticos. Os tópicos que estudaremos aqui são os
seguintes:
Parâmetros
Neste capítulo, examinaremos de perto dois dos quatro principais tipos de cálculos
no Tableau: cálculos em nível de linha e cálculos agregados. Consideraremos os
dois últimos tipos no Capítulo 5, Alavancando cálculos de nível de detalhe, e no
Capítulo 6, Mergulhando fundo com cálculos de tabela.
Tipos de dados
Fundamentais para o conceito de cálculos são os tipos de dados, que descrevem
o tipo de informação armazenada por um campo, parâmetro ou retornada por uma
função. O Tableau distingue seis tipos de dados:
Cada campo no Tableau tem um desses tipos de dados e cada função no Tableau
retorna um desses tipos de dados. Algumas funções esperam entrada que
corresponda a alguns desses tipos, e você receberá erros se tentar passar o tipo
errado.
Alguns tipos podem ser convertidos em outros tipos. Por exemplo, usando
algumas das funções de conversão de tipo mencionadas acima, você pode
converter a cadeia de caracteres no valor decimal . Você poderia converter esse
valor decimal em um número inteiro, mas nesse caso, você perderia os lugares
após o valor decimal e o número inteiro seria simplesmente . "2.81"2.812
Um tipo de dados é diferente do formato exibido. Por exemplo, você pode optar
por formatar um decimal como uma porcentagem (por exemplo, poderia ser
mostrado como ), como moeda (por exemplo, poderia ser formatado como ) ou até
mesmo como um número com 0 decimais (por exemplo, seria arredondado
para ).0.220%144.56$144.562.813
Operador/palavra-
Descrição
chave
Os nomes de campo que são uma única palavra podem, opcionalmente, ser
colocados entre colchetes quando usados em cálculos. Os nomes de campo com
espaços, caracteres especiais ou de fontes de dados secundárias devem ser
colocados entre colchetes.
Esse conjunto de dados é incluído como no diretório dos recursos deste livro e
também está incluído na pasta de trabalho como uma fonte de dados
chamada :Vacation Rentals.csv\Learning Tableau\Chapter 04Chapter 4Vacation
Rentals
Imóv
Impo
el
Prime Come Fi Desco Alu sto
para Último
iro çar m nto gar por
Loca
Noite
ção
112-
Atol
de 1,50
de Maria Locador dez 2 150 15
z9 0
Asbur
y
112-
Atol de
Carmichae 1,50
de Amy dez 9 z 0 15
l 0
Asbur 15
y
Brisa
da Charle de 1,30
Ryrie dez 2 260 10
Praia s z9 0
155
Brisa
de
da Dwigh Pentecoste 1,40
dez 16 z 280 10
Praia t s 0
23
155
Brisa
de
da 2,80
Lewis Chafer dez 9 z 280 10
Praia 0
23
207
Brisa
da de 1,50
John Walvoord dez 2 60 10
Praia z9 0
207
Em seguida, crie outro campo calculado nomeado com o seguinte código: Building
Ambas as funções usam a função, que divide uma cadeia de caracteres em vários
valores e mantém um desses valores. Essa função usa três argumentos: a cadeia
de caracteres, o delimitador (um caractere ou conjunto de caracteres que separa
valores) e o número do token (qual valor manter da divisão, ou seja, primeiro,
segundo, terceiro e assim por diante). Usando o (traço) como delimitador, é o
primeiro valor e é o segundo.Split()-RoomBuilding
Figura 4.4: Usando seus campos calculados para criar uma exibição
Observe que o Tableau adiciona um pequeno sinal de igual ao ícone dos campos
no painel de dados para indicar que são campos calculados:
O Tableau fornece um atalho para dividir um campo. Você pode usar o menu
suspenso em um campo no painel de dados e
selecionar Transformar | Dividir ou Transformar | Divisão personalizada (se
você tiver um delimitador não padrão). Os resultados são campos calculados
semelhantes aos criados anteriormente, mas com alguma lógica adicional em
torno da determinação de tipos de dados. A funcionalidade de transformação,
como a divisão, também está disponível para campos nos modos de exibição
Visualizar ou Metadados na tela Fonte de dados.
Vamos estender um pouco mais o exemplo e supor que você saiba que o piso de
uma sala é indicado pelo seu número. As salas 100 a 199 estão no primeiro andar,
e 200 a 299 estão no segundo. Você gostaria de ter essas informações
disponíveis para análise.
Em vez disso, você pode criar um cálculo em nível de linha no Tableau para
estender os dados. Para fazer isso, crie um campo calculado nomeado com o
seguinte código:Floor
IF LEFT([Room], 1) = "1"
END
CopyExplain
Esse código usa a função para retornar o caractere mais à esquerda da sala.
Assim, dá um resultado de ; dá um resultado de . LEFT()11212072
A lógica nos permite atribuir um resultado (ou seja), dependendo de qual caso é
verdadeiro. Observe que você usou o campo no cálculo, que, por sua vez, era
outro cálculo.IF THEN ENDFirst FloorSecond FloorRoom
MID([Room], 0, LEN([Room]) - 2)
CopyExplain
Cálculos agregados
Já consideramos agregações como , e no Tableau. Muitas vezes, você usará
campos como agregações simples no modo de exibição. Mas, às vezes,
convém usar agregações em cálculos mais complexos.summinmax
Por exemplo, você pode estar curioso para explorar a porcentagem do aluguel que
foi descontada. Não há esse campo nos dados. Ele não pôde realmente ser
armazenado na fonte, porque o valor muda com base no nível de detalhe presente
na exibição (por exemplo, a porcentagem de desconto para uma unidade
individual será diferente da porcentagem de desconto por andar ou por edifício).
Em vez disso, ele deve ser calculado como um agregado e recalculado à medida
que o nível de detalhe muda.
SUM([Discount]) / SUM([Rent])
CopyExplain
Esse código indica que a soma de deve ser dividida pela soma de . Isso significa
que todos os valores de serão adicionados, e todos os valores de serão
adicionados. Somente após o cálculo dos valores é que ocorrerá a
divisão.DiscountRentDiscountRent
Depois de criar o cálculo, você notará que o Tableau trata o novo campo
como uma Medida no painel de dados. O Tableau tratará qualquer cálculo com
um resultado numérico como uma medida por padrão, mas você pode alterar os
cálculos em nível de linha para dimensões, se desejar. Neste caso, porém, você
nem é capaz de redefinir o novo campo como uma dimensão. A razão para isso é
que o Tableau tratará cada cálculo agregado como uma medida,
independentemente do tipo de dados retornado. Isso ocorre porque um cálculo
agregado depende de dimensões para definir o nível de detalhe no qual o cálculo
é realizado. Portanto, um cálculo agregado não pode ser uma dimensão em si.
Agora, crie alguns modos de exibição para ver como o cálculo retorna resultados
diferentes, dependendo do nível de detalhes no modo de exibição. Primeiro,
criaremos uma exibição para analisar cada período de locação individual:
1. Coloque edifício, sala, nome completo, início e fim em linhas.
2. No painel de dados, em Medidas, clique duas vezes em cada um dos
seguintes campos: Aluguel, Desconto e Desconto %. O Tableau colocará
cada uma dessas medidas na exibição usando Nomes de medidas e Valores
de medidas.
3. Reorganize os campos na prateleira Valores de medida para que o pedido
seja %Aluguel, Desconto e Desconto:
Figura 4.7: Ilustra o % de desconto calculado no nível de Edifício, Sala, Nome
Completo, Início e Fim
Você deve ter notado que, ao clicar duas vezes em cada medida, ela foi
adicionada ao painel da exibição de uma maneira especial. Nomes de Medidas
e Valores de Medidas são campos especiais que aparecem em todas as
conexões de dados (na parte inferior do painel Dados). Eles servem como
espaços reservados para várias medidas que compartilham o mesmo espaço na
exibição.
No modo de exibição que você acabou de criar, por exemplo, três mede todo o
espaço compartilhado no painel. Medir Valores no Texto indicou que todos os
valores das medidas na prateleira Valores de Medida devem ser exibidos como
texto. O campo Nomes de Medidas em Colunas criou uma coluna para cada
medida, com o valor do nome dessa medida.
Agora que você tem uma compreensão básica de cálculos agregados e de nível
de linha, vamos considerar por que a distinção é importante.
[Discount]/[Rent]
CopyExplain
SUM([Discount])/SUM([Rent])
CopyExplain
Por que há tanta diferença nos resultados? É resultado da forma como os cálculos
foram realizados.
Com a distinção entre cálculos de nível de linha e agregados clara, vamos fazer
um interlúdio e discutir parâmetros antes de criar exemplos adicionais.
Parâmetros
Antes de passar para alguns exemplos adicionais de cálculos agregados e em
nível de linha, vamos fazer uma pequena viagem lateral para examinar
parâmetros, já que eles podem ser usados de maneiras incríveis em cálculos.
O valor de um parâmetro é global para que, se o valor for alterado, cada exibição
e cálculo na pasta de trabalho que faz referência ao parâmetro usará o novo valor.
Os parâmetros fornecem outra maneira de fornecer interatividade avançada aos
usuários finais de seus painéis e visualizações.
Os parâmetros podem ser usados para permitir que qualquer pessoa que interaja
com seu modo de exibição ou painel faça dinamicamente muitas coisas, incluindo
o seguinte:
Passar valores para uma instrução SQL personalizada usada em uma fonte
de dados
Criando parâmetros
Criar um parâmetro é semelhante à criação de um campo calculado. Há várias
maneiras de criar um parâmetro no Tableau:
Quando você cria um parâmetro pela primeira vez (ou edita um parâmetro
existente), o Tableau apresenta uma interface como esta:
Aqui está o controle de parâmetro, mostrado como uma única lista de valores,
para o parâmetro que criamos anteriormente:
Figura 4.14: O controle de parâmetros mostrado como uma única lista de botões
de opção de seleção
Esse controle pode ser mostrado em qualquer planilha ou painel e permite que o
usuário final selecione um único valor. Quando o valor for alterado, todos os
cálculos, filtros, conjuntos ou compartimentos que usam o parâmetro serão
reavaliados e todas as exibições afetadas serão redesenhadas.
Começar Fim
dez 2 dez 9
dez 9 dez 15
dez 16 dez 23
Supondo, neste caso, que você está confiante de que o ano deve ser sempre
2020, você pode criar campos calculados nomeados e . Start DateEnd Date
O que esses campos calculados fazem é concatenar o mês e o dia com o ano e,
em seguida, usar a função para converter a cadeia de caracteres em um valor de
data. Na verdade, o Tableau reconhece os campos resultantes como datas (com
todos os recursos de um campo de data, como hierarquias internas). Uma
verificação rápida no Tableau revela os resultados esperados: DATE()
Figura 4.15: As datas corrigidas aparecem ao lado das versões da cadeia de
caracteres. Todos os campos são dimensões discretas em Linhas (as datas são
datas exatas)
Estendendo os dados
Muitas vezes, haverá dimensões ou medidas que você gostaria de ter em seus
dados, mas que não estão presentes na fonte. Muitas vezes, você poderá
estender seu conjunto de dados usando campos calculados. Já consideramos um
exemplo de criação de um campo para o nome completo do hóspede onde só
tínhamos campos de nome e sobrenome.
Outro dado que pode destravar alguma análise realmente interessante seria a
duração de cada locação. Temos as datas de início e fim, mas não o período de
tempo entre essas duas datas. Felizmente, isso é fácil de calcular.
1. Se você não tiver feito isso, crie um gráfico de Gantt semelhante ao que foi
mostrado anteriormente (seguindo o posicionamento do campo da captura de
tela).
2. Crie um parâmetro chamado Free Night com um tipo de dados de Date e um
valor inicial de . Isso permitirá que o gerente defina e ajuste a data de início
para o mês promocional. Mostre o controle de parâmetro
selecionando Mostrar controle de parâmetro no menu suspenso no
parâmetro Noite livre no painel de dados.12/12/2020
3. Agora, adicione uma linha de referência à exibição para mostrar a noite livre.
Faça isso alternando para a guia Analytics na barra lateral esquerda. Arraste
a Linha de Referência para o modo de exibição e solte-a na Tabela:
Figura 4.18: Adicione uma linha de referência alternando para o painel Analytics e
arrastando a linha de referência para a tela
7. AND
Até agora, criamos campos calculados que estendem a fonte de dados. Às vezes,
você só precisa de um cálculo rápido para ajudar em uma única exibição.
Concluiremos analisando esses rápidos cálculos ad hoc.
Cálculos ad hoc
Os cálculos ad hoc permitem adicionar campos calculados a prateleiras em um
único modo de exibição sem adicionar campos ao painel de dados.
Digamos que você tenha uma visualização simples que mostre a Receita por
Convidado, assim:
Aqui, inserimos o código que retornará se a soma for inferior a US$ 1.500 e de
outra forma. Pressionar Enter ou clicar fora da caixa de texto revelará um novo
campo ad hoc que pode ser arrastado e solto em qualquer lugar dentro da
exibição. Aqui, nós o movemos para a prateleira de cores:TrueRentFalse
Figura 4.23: Usando o cálculo ad hoc em Color
END
END
END
CopyExplain
Observe como a verificação do tipo não precisa ser feita para nenhum registro em
que a idade era igual ou maior que 1. Essa pode ser uma porcentagem muito alta
de registros no conjunto de dados.
Quando você usa uma extração para materializar cálculos em nível de linha,
somente os cálculos que foram criados no momento da extração são
materializados. Se você editar campos calculados ou criar novos campos depois
de criar a extração, será necessário otimizar a extração (use o menu suspenso na
fonte de dados ou selecione-a no menu Dados e
selecione Extrair | Otimizar ou extrair | computar cálculos agora).
À medida que você continua a trabalhar com cálculos, preste atenção especial às
situações em que você percebe problemas de desempenho e considere se você
pode otimizar seus cálculos para obter melhores resultados.
Resumo
Os cálculos abrem possibilidades incríveis no Tableau. Você não está mais
confinado aos campos nos dados de origem. Com os cálculos, você pode
estender os dados adicionando novas dimensões e medidas, corrigir dados ruins
ou mal formatados e aprimorar a experiência do usuário com parâmetros para
entrada do usuário e cálculos que aprimoram as visualizações.
Nesse caso, cada registro define um único cliente exclusivo. Se fôssemos realizar
um cálculo em nível de linha, como ,, para determinar o número de anos que cada
cliente foi membro, o resultado seria calculado por
registro.DATEDIFF('year' [Membership Date] TODAY())
Agora considere uma exibição criada a partir dos dados com um nível de
exibição de detalhes do estado:
Com base nessa visão específica, talvez queiramos melhorar nossa compreensão
fazendo perguntas adicionais, como as seguintes:
Fixo
As expressões de nível fixo de detalhes funcionam no nível de detalhe
especificado pela lista de dimensões no código, independentemente de quais
dimensões estão na exibição. Por exemplo, o código a seguir retorna os pedidos
médios por estado, independentemente de quais outras dimensões estão na
exibição:
{FIXED [State] : AVG([Orders])}
CopyExplain
{FIXED : AVG([Orders])}
CopyExplain
{AVG([Orders])}
CopyExplain
Uma expressão de nível fixo de detalhe sem dimensões especificadas às vezes é
chamada de expressão de nível fixo de detalhe com escopo de tabela porque a
agregação definida no cálculo será para a tabela inteira.
Incluir
Inclua expressões de nível de detalhe agregadas no nível de detalhe determinado
pelas dimensões no modo de exibição, juntamente com as dimensões listadas no
código. Por exemplo, o código a seguir calcula os pedidos médios no nível de
detalhe definido pelas dimensões no modo de exibição, mas inclui a dimensão,
mesmo que não esteja no modo de exibição:Membership LevelMembership Level
{INCLUDE [Membership Level] : AVG([Orders])}
CopyExplain
Excluir
Exclua expressões de nível de detalhe agregadas no nível de detalhe
determinado pelas dimensões na exibição, excluindo qualquer listada no código.
Por exemplo, o código a seguir calcula o número médio de pedidos no nível de
detalhe definido no modo de exibição, mas não inclui a dimensão como parte do
nível de detalhes, mesmo que esteja no modo de exibição:CustomerCustomer
{EXCLUDE [Customer] : AVG([Orders])}
CopyExplain
Você terminará com uma linha média que se parece com esta:
Mas será mesmo o número médio de encomendas no geral? Acontece que não é.
Na verdade, é a média da soma do número de pedidos para cada estado: . Muitas
vezes, essa linha média (ou seja, a média do número total de pedidos por estado)
é exatamente o que queremos comparar ao usar números agregados. 6.66667(6 +
10 + 4) / 3
Mas, às vezes, podemos querer calcular a verdadeira média geral. Para obter o
número médio de pedidos presentes em todo o conjunto de dados, podemos
considerar a criação de um cálculo nomeado e usando um cálculo de nível fixo de
detalhes como este:Overall Average Number of Orders
{FIXED : AVG([Orders])}
CopyExplain
Adicionar esse campo calculado à parte Detalhe do cartão Marcas e editar a linha
de referência para usar esse campo nos dá um resultado diferente:
Você lembrará que o conjunto de dados original tinha quatro registros, e uma
verificação rápida valida o resultado:
(1 + 5 + 10 + 4) / 4 = 5
CopyExplain
No Pon
Tipo
Data me tuaç Id
de Equ
Dat Past de do ão a Estad
Emp ilíbr
a a Aber Me de d o
résti io
tura mbr Cré e
mo
o dito
Novo
Auto
3/1/2 Auto 159 9/29/2 Sam Califór
mátic 678 37
020 móve 87 018 uel nia
o
l
1ª
7/1/2 Hipot 963 8/7/20 Lloy
Hipot 768 62 Ohio
020 eca 64 13 d
eca
1ª
3/1/2 Hipot 418 9/30/2 Patrí
Hipot 766 60 Ohio
020 eca 635 015 cio
eca
Auto
5/1/2 Auto 115 10/22/ Pensil
mátic Eric 660 44
020 usado 1 2018 vânia
o
... ... ... ... ... ... ... ... ...
Esse cálculo determina a pontuação de crédito mais baixa para cada membro e a
compara com o limite de risco de 550.
Nesse caso, a expressão include level of detail nos dá uma solução útil. Existem
algumas maneiras alternativas de resolver e é útil considerar algumas delas
enquanto você pensa em como você pode resolver problemas semelhantes.
Vamos considerá-los a seguir.
Abordagens alternativas
Vale a pena notar que o conjunto de dados acima realmente permite que você use
em vez de como o número simplesmente aumenta para cada membro com base
em quantos empréstimos eles têm. O número mais elevado é idêntico ao número
de empréstimos para esse membro. Em um conjunto de dados significativamente
grande, o cálculo deve ter um desempenho melhor. MAX([Loan Number])COUNTD([Loan
Number])MAX
Existem também algumas outras abordagens para resolver esse problema, como
o cálculo. Por exemplo, você pode escrever o seguinte código:
COUNTD([Member ID])
CopyExplain
Esse cálculo resulta no mesmo nível de detalhe que a expressão include e usa a
mesma contagem distinta do número do empréstimo. Acontece que, nesse
conjunto de dados, cada membro pertence a apenas um único estado, então o
estado não precisaria necessariamente ser incluído no nível fixo de expressão de
detalhe. No entanto, se você quisesse alterar o nível de detalhes, precisaria
ajustar o cálculo, enquanto, com a expressão de inclusão, você só precisaria
adicionar ou remover dimensões à exibição.
Com o exemplo de inclusão, juntamente com algumas alternativas em mente,
vamos voltar nossa atenção para um exemplo de cálculos de nível de detalhe de
exclusão.
Tome a seguinte vista, que mostra a pontuação de crédito média por tipo de
empréstimo (onde os tipos de empréstimo são agrupados em carteiras):
Figura 5.13: Esta tabela de referência cruzada mostra a pontuação média de
crédito por tipo de empréstimo
Resumo
As expressões de nível de detalhe ampliam muito o que você pode realizar com
cálculos. Agora você tem um conjunto de ferramentas para trabalhar com dados
em diferentes níveis de detalhes. Com cálculos de nível fixo de detalhes, você
pode identificar o primeiro ou o último evento de uma série ou se uma condição é
verdadeira em subconjuntos inteiros de dados. Com as expressões de inclusão,
você pode trabalhar em níveis mais baixos de detalhes e, em seguida, resumir
esses resultados em um modo de exibição. Com expressões de exclusão, você
pode trabalhar em níveis mais altos de detalhes, expandindo consideravelmente
as possibilidades de análise.
Eles tornam possível usar dados que não estão bem estruturados e ainda
obter resultados rápidos sem esperar que alguém corrija os dados na fonte.
Escopo e direção
Endereçamento e particionamento
Exemplos práticos
Os exemplos neste capítulo retornarão aos dados de exemplo que usamos no
primeiro capítulo. Para acompanhar os exemplos, use a pasta de
trabalho.SuperstoreChapter 06 Starter.twbx
Com esta visão geral dos cálculos de tabela em mente, vamos entender algumas
opções para criar cálculos de tabela.
Criando e editando cálculos de tabela
Há várias maneiras de criar cálculos de tabela no Tableau, incluindo:
Usando o menu suspenso para qualquer campo ativo usado como uma
agregação numérica na exibição, selecionando Cálculo Rápido de Tabela e,
em seguida, o tipo de cálculo desejado
Usando o menu suspenso para qualquer campo ativo usado como uma
agregação numérica na exibição, selecionando Adicionar Cálculo de
Tabela e, em seguida, selecionando o tipo de cálculo e ajustando as
configurações desejadas
Criando um campo calculado e usando uma ou mais funções de cálculo de
tabela para escrever seus próprios cálculos de tabela personalizados
Na verdade, você pode ver o código que o cálculo de tabela rápida usa clicando
duas vezes no campo de cálculo de tabela no modo de exibição. Isso o transforma
em um cálculo ad hoc. Você também pode arrastar um campo ativo com um
cálculo de tabela rápido aplicado ao painel de dados, o que o transformará em um
campo calculado que pode ser reutilizado em outros modos de exibição.
A tabela a seguir demonstra alguns dos cálculos rápidos da tabela:
Para ver como escopo e direção funcionam juntos, vamos trabalhar com alguns
exemplos. Começaremos criando nossos próprios cálculos de tabela
personalizados. Crie um novo campo calculado chamado contendo o
código .IndexIndex()
Painel (para baixo): define um limite para Índice e faz com que ele seja
incrementado para baixo até atingir o limite do painel, momento em que a
indexação é reiniciada:
Endereçamento e particionamento
O endereçamento e o particionamento são muito semelhantes ao escopo e à
direção, mas são mais frequentemente usados para descrever como os cálculos
de tabela são calculados com referência absoluta a determinados campos na
exibição. Com o endereçamento e o particionamento, você define quais
dimensões na exibição definem o endereçamento (direção) e todas as outras
definem o particionamento (escopo).
Vamos considerar alguns outros exemplos do que acontece quando você adiciona
dimensões adicionais. Por exemplo, se você marcar Trimestre da Data do Pedido,
verá o Tableau realçar uma partição definida por Região e Ano da Data do
Pedido, com Índice incrementando pelos campos de endereçamento de Data do
Trimestre do Pedido e, em seguida, Departamento:
Figura 6.17: A adição de dimensões altera o comportamento do cálculo da tabela.
Uma das partições resultantes é realçada
Se você fosse selecionar Departamento e Ano da Data do Pedido como o
endereçamento do Índice, veria uma única partição definida por Região e Data
do Trimestre do Pedido, assim:
Figura 6.18: A alteração das dimensões verificadas altera o comportamento do
cálculo da tabela. Uma das partições resultantes é realçada
Você notará, nessa exibição, que o Índice aumenta para cada combinação de Ano
da Data do Pedido e Departamento dentro da partição do Trimestre da Data do
Pedido e da Região.
Reserve algum tempo para experimentar várias opções e sinta-se confortável com
o funcionamento do endereçamento e do particionamento. Em seguida, veremos
como escrever nossos próprios cálculos de tabela personalizados.
Cálculos de tabela personalizados
Antes de passarmos para alguns exemplos práticos, vamos discutir brevemente
como escrever seus próprios cálculos de tabela, em vez de usar cálculos de tabela
rápidos. Você pode ver uma lista de funções de cálculo de tabela disponíveis
criando um novo cálculo e selecionando Cálculo de tabela na lista suspensa
em Funções.
Observe na captura de tela a seguir que a direção é muito importante para essas
duas funções:
Figura 6.20: Funções de pesquisa e Previous_Value (embora Previous_Value
inclua alguma lógica adicional descrita abaixo)
Aqui, usamos o código , que procura o valor da categoria na linha deslocada pela
atual. A primeira linha em cada partição obtém um resultado da pesquisa (porque
não há uma linha antes dela).Lookup(ATTR([Category]), -1)-1NULL
Se você quisesse evitar ter a vírgula inicial, você poderia escrever um cálculo um
pouco mais complexo que verificasse o comprimento do valor anterior e só
acrescentasse a vírgula se já houvesse um valor, assim:
IF LEN(Previous_Value("")) == 0
THEN ATTR([Category])
END
CopyExplain
Executando funções
Essas funções são executadas ao longo da direção/endereçamento e incluem , , ,
e , da seguinte
maneira:Running_Avg()Running_Count()Running_Sum()Running_Min()Running_Max()
Figura 6.21: Funções em execução
Funções da janela
Essas funções operam em todas as linhas da partição de uma só vez e
essencialmente agregam os agregados. Eles incluem , , , e , entre outros, como
mostrado na captura de tela a seguir:Window_SumWindow_AvgWindow_MaxWindow_Min
Figura 6.22: Exemplos de funções de janela
Você pode passar parâmetros opcionais para funções de janela para limitar ainda
mais o escopo da janela. A janela será sempre limitada a, no máximo, a partição.
Funções de classificação
Essas funções fornecem várias maneiras de classificar com base em valores
agregados. Existem várias variações de classificação, que permitem que você
decida como lidar com empates (valores iguais) e quão denso o ranking deve ser,
como mostrado na captura de tela a seguir:
Figura 6.23: Exemplos de funções de classificação
Funções de script
Essas funções permitem a integração com a plataforma de análise R ou Python,
que podem incorporar scripts simples ou complexos para tudo, desde estatísticas
avançadas até modelagem preditiva. Consideraremos vários exemplos dessa
funcionalidade no Capítulo 13, Integrando recursos avançados: extensões, scripts
e IA.
A função Total
A função merece uma categoria própria porque funciona de forma um pouco
diferente das outras. Ao contrário das outras funções, que funcionam na tabela
agregada no cache, consultarão novamente a fonte subjacente para todas as
linhas de dados de origem que compõem uma determinada partição. Na maioria
dos casos, isso produzirá o mesmo resultado que uma função. TotalTotalwindow
Nesta seção, examinamos várias funções de cálculo de tabela. Estes lhe darão os
blocos de construção para resolver todos os tipos de problemas práticos e
responder a muitas perguntas. Do ranking às comparações ano a ano, agora você
tem uma base para o sucesso. Passemos agora a alguns exemplos práticos.
Exemplos práticos
Tendo analisado alguns dos conceitos essenciais dos cálculos de tabela, vamos
considerar alguns exemplos práticos. Veremos vários exemplos, embora o uso
prático de cálculos de tabela seja quase infinito. Você pode fazer tudo, desde
executar somas e analisar o crescimento ano a ano até visualizar as diferenças
percentuais entre as categorias e muito mais.
Se você filtrou 2017, os nulos que apareceriam em 2018 como cálculos de tabela
só poderão operar em valores presentes nos dados agregados no cache. Todos
os filtros regulares aplicados aos dados são aplicados na origem e os dados
excluídos nunca chegam ao cache.
Por mais fácil que seja criar uma exibição como este exemplo, tome cuidado
porque o Tableau pressupõe que cada ano na exibição tenha o mesmo número de
trimestres. Por exemplo, se os dados do 1º trimestre de 2017 não estivessem
presentes ou filtrados, a exibição resultante não representaria necessariamente o
que você deseja. Considere o seguinte, por exemplo:
Figura 6.26: Crescimento ano a ano das vendas, mas não funciona com a falta do
1º trimestre no primeiro ano
Uma questão adicional surge para consideração: e se você não quiser mostrar
2017 na vista? Filtrá-lo causará problemas para 2018. Nesse caso, veremos a
filtragem de cálculo de tabela, ou filtragem tardia, mais adiante nesta seção.
Outra maneira potencial de remover 2017, mas manter o acesso aos seus valores
de dados, é clicar com o botão direito do mouse no cabeçalho 2017 na exibição e
selecionar Ocultar.
Você também pode querer ocultar o indicador nulo na exibição. Você pode fazer
isso clicando com o botão direito do mouse no indicador e selecionando Ocultar
indicador. Clicar no indicador revelará opções para filtrar os dados ou exibi-los
como um valor padrão (normalmente, 0).
O crescimento ano após ano (ou qualquer período sobre outro) é uma pergunta
analítica comum que os cálculos de tabela permitem responder. A seguir, vamos
considerar outro exemplo de cálculos de tabela na prática.
Por padrão, o título exibe o nome da planilha e as legendas estão ocultas, mas
você pode mostrá-las e modificá-las. Às vezes, convém exibir totais que ajudem
os usuários finais a entender o contexto amplo ou a compreender imediatamente a
magnitude.
Aqui, por exemplo, está uma exibição que permite ao usuário selecionar uma ou
mais regiões e, em seguida, ver Vendas por Estado em cada Região:
Você pode lembrar que uma janela é definida como os limites determinados pelo
escopo ou partição. Seja qual for a nossa escolha, queremos definir a janela como
a tabela inteira. Uma computação relativa ou uma computação fixa usando todas
as dimensões conseguiria isso. Aqui está uma exibição que ilustra um título
dinâmico e todas as três opções na legenda: Table (down)
Figura 6.28: Vários cálculos de tabela poderiam ser empregados para atingir o
total no título
Este exemplo ilustrou como você pode usar vários cálculos de tabela para
trabalhar em níveis mais altos de detalhes, contando especificamente todos os
estados no modo de exibição. Essa técnica permitirá que você resolva várias
questões analíticas ao usar o Tableau. Vamos agora voltar nossa atenção para
outra técnica que ajuda a resolver alguns problemas.
Como os cálculos de tabela são executados depois que os dados agregados são
retornados ao cache, o filtro em Departamento já foi avaliado na fonte de dados e
as linhas agregadas não incluem nenhum departamento excluído pelo filtro.
Assim, o percentual do total sempre somará 100%; ou seja, é a porcentagem do
total filtrado, conforme mostrado na captura de tela a seguir:
Você pode criar um campo calculado chamado com o código . A função torna isso
um cálculo de tabela, enquanto trata o Departamento como uma agregação. O
segundo argumento, , diz à função de pesquisa para não olhar para trás ou para
frente. Assim, o cálculo retorna todos os valores para Departamento, mas como
um resultado de cálculo de tabela.Department (table calc
filter)LOOKUP(ATTR([Department]), 0)Lookup()ATTR()0
In this case, that allows Percent of Total to be calculated for all departments, even
though the table calculation filter is hiding one or more, as shown in the following
screenshot:
Figure 6.30: When a table calculation filter is used, all the aggregate data is
available in the cache for the % of Total Sales to be calculated for all departments
You might have noticed the function used. Remember that table calculations
require aggregate arguments. (which is short for attribute) is a special aggregation
that returns the value of a field if there is only a single value of that field present for
a given level of detail or a if there is more than one value.ATTRATTR*
Neste exemplo, vimos como usar efetivamente cálculos de tabela como filtros
quando precisamos de outros cálculos de tabela para operar em todos os dados
no cache.
Resumo
Abordamos muitos conceitos em torno de cálculos de tabela neste capítulo. Agora
você tem uma base para usar a simplicidade dos cálculos de tabela rápidos e
aproveitar o poder dos cálculos de tabela avançados. Examinamos os conceitos
de escopo e direção à medida que eles se aplicam aos cálculos de tabela que
operam em relação ao layout de linha e coluna do modo de exibição. Também
consideramos os conceitos relacionados de endereçamento e particionamento
relacionados a cálculos de tabela que têm cálculos fixos em determinadas
dimensões.
Vamos voltar nossa atenção para alguns tópicos mais leves nos próximos
capítulos, olhando para formatação e design, mas certamente veremos outro
cálculo de tabela ou dois antes de terminarmos!
Criando visualizações que parecem
ótimas e funcionam bem
O Tableau aplica muitas boas práticas visuais por padrão e, para uma análise
rápida, você provavelmente não se preocupará muito em alterar muitos desses
padrões. No entanto, ao considerar a melhor forma de comunicar a história de
dados que descobriu, convém considerar como aproveitar tudo, desde fontes e
texto até cores e design, para que você possa se comunicar bem com seu público.
Ao pensar sobre por que você deve ajustar uma determinada visualização, há
várias coisas a serem consideradas. Vamos começar com essas considerações.
Nível de
Descrição Exemplo
formato
A formatação padrão de
Definir o formato de número padrão
um campo, incluindo
Fonte de dados do campo Vendas como Moeda
formatos de número e
(Personalizado).
data, cores e formas.
O formato padrão
aplicado em um nível
de pasta de trabalho.
Isso inclui a fonte
Tornar o formato padrão das linhas de
Pasta de padrão para planilhas,
tendência uma linha pontilhada cinza-
trabalho dicas de ferramentas e
claro.
títulos. Ele também
permite que você
especifique formatos
padrão para linhas.
Formatação aplicada a
uma matéria, como
sombreamento de Tornando o sombreamento padrão
História
matéria, título, para o navegador um azul claro.
navegador e objetos de
texto.
Formatação aplicada a
um painel, como
Definir a fonte padrão dos títulos das
sombreamento geral,
Painel planilhas como negrito, itálico e verde
título do painel, títulos
escuro do Tableau.
de planilha e objetos de
texto.
Você também pode clicar com o botão direito do mouse em praticamente qualquer
elemento no modo de exibição e selecionar Formatar. Isso abrirá a janela de
formato específica para o contexto do elemento selecionado. Apenas certifique-se
de verificar se o título da janela de formato corresponde ao que você espera. Ao
fazer uma alteração, você verá a atualização do modo de exibição imediatamente
para refletir sua formatação. Se você não fizer isso, provavelmente está
trabalhando na guia errada da janela de formatação ou pode ter formatado algo
em um nível inferior (por exemplo, Linhas) que substitui as alterações feitas em
um nível superior (por exemplo, Planilha).
Agora você deve ver a janela de formato à esquerda, neste caso, Formatar fonte.
Ficará assim:
Figura 7.4: O painel Formatar fonte
O título da janela de formato irá alertá-lo para o campo que você está formatando.
Selecionar um ícone para Fonte, Alinhamento e assim por diante no canto
superior esquerdo da janela voltará para a formatação no nível da planilha. No
entanto, você pode alternar entre as guias de Eixo e Painel. Essas duas guias
permitem que você tenha formatação diferente para um campo quando ele é
usado no cabeçalho ou como um rótulo de eixo versus como ele é formatado no
painel do modo de exibição. As opções de campos incluem os formatos
Fonte, Alinhamento, Sombreamento e Número e Data. As duas últimas opções
substituirão quaisquer formatos de metadados padrão.
A cadeia de caracteres de formato permite até três entradas, separadas por ponto-
e-vírgula, para representar os formatos positivo, negativo e zero.
Os formatos de número e data personalizados são bons quando você tem valores
que precisam ser formatados. Mas e se não houver valor? Ou seja, como formatar
valores? Vamos considerar isso a seguir.NULL
Formatação nula
Um aspecto adicional da formatação de um campo é especialmente a formatação
de valores Nulos. Ao formatar um campo, selecione a guia Painel e localize a
seção Valores Especiais, conforme mostrado na captura de tela a seguir:
Insira qualquer texto que você gostaria de exibir no painel (no campo Texto)
quando o valor do campo for nulo. Você também pode escolher onde as marcas
devem ser exibidas. O menu suspenso Marcas fornece várias opções que
definem onde e como as marcas para valores nulos devem ser desenhadas
quando um eixo está sendo usado. Você tem as seguintes opções:
Mostrar em Indicador resulta em um pequeno indicador com o número de
valores nulos no canto inferior direito da exibição. Você pode clicar no
indicador para opções para filtrar os valores nulos ou mostrá-los no valor
padrão. Você pode clicar com o botão direito do mouse no indicador para
ocultá-lo.
Mostrar no Valor Padrão exibe uma marca no local padrão (geralmente 0).
Ocultar (Conectar linhas) não coloca uma marca para valores nulos, mas
conecta linhas entre todos os valores não nulos.
Ocultar (Quebrar linhas) faz com que a linha quebre onde há lacunas
criadas por não mostrar os valores nulos.
Você pode ver essas opções nas capturas de tela a seguir, com o local de dois
valores nulos indicados por uma faixa cinza.
Qualquer uma dessas opções pode ter um bom uso, mas considere como cada
uma comunica as informações. Conectar as linhas pode ajudar a comunicar um
movimento ao longo do tempo, mas também pode minimizar a existência de dados
ausentes. Quebrar as linhas pode ajudar a destacar valores ausentes, mas pode
tirar a mensagem geral. Você precisará decidir qual opção melhor atende aos
seus objetivos com base nas considerações mencionadas no início deste capítulo.
Saber como formatar valores nulos oferece algumas opções ao considerar como
comunicar os dados. Vamos dar uma olhada em algumas opções adicionais.
This option will apply any custom formatting present on the source sheet to the
target. However, specific formatting applied during the editing of the text of titles,
captions, labels, and tooltips is not copied to the target sheet.
Dicas de ferramentas
Como nem sempre são visíveis, as dicas de ferramentas são um aspecto
facilmente negligenciado das visualizações. No entanto, eles adicionam
profissionalismo sutil. Considere a seguinte dica de ferramenta padrão que é
exibida quando o usuário final passa o mouse sobre uma das marcas mostradas
na captura de tela anterior:
Existem muitas outras aplicações valiosas desse recurso, mas aqui estão algumas
dicas para concluir nosso exame da Visualização na dica de ferramenta:
Você pode ter mais de uma visualização em uma única dica de ferramenta.
Definir a opção Ajustar como Modo de Exibição Inteiro para a planilha
que está sendo usada em uma dica de ferramenta ajusta-a à largura e
altura máximas.
Você pode ocultar planilhas usadas em dicas de ferramentas clicando com
o botão direito do mouse na guia da planilha e selecionando Ocultar. Para
restaurá-los, clique com o botão direito do mouse na guia da planilha que
está sendo usada na dica de ferramenta e selecione Reexibir planilhas.
Resumo
O objetivo da formatação é aumentar a comunicação eficaz dos dados em mãos.
Sempre considere o público, a configuração, o modo, o humor e a consistência ao
trabalhar no processo iterativo de formatação. Procure formatação que agregue
valor à sua visualização e evite desordem inútil.
Objetivos do painel
O principal objetivo de um painel é comunicar dados a um determinado público
com um resultado pretendido. Muitas vezes, falamos sobre contar a história dos
dados. Ou seja, há uma narrativa (ou múltiplas narrativas) contida nos dados que
podem ser comunicadas a outros.
Embora você possa contar uma história de dados com uma única visualização ou
até mesmo uma série de painéis complexos, um único painel do Tableau é a
maneira mais comum de comunicar uma única história. Cada painel procura
contar uma história, dando uma imagem clara de certas informações. Antes de
enquadrar a história, você deve entender qual história os dados contam. A forma
como você conta a história dependerá de inúmeros fatores, como seu público, a
maneira como o público acessará o painel e qual resposta você deseja obter do
seu público.
Abordagens do painel
Existem inúmeras abordagens possíveis para criar painéis com base em seus
objetivos. O seguinte não é de forma alguma uma lista abrangente:
Seu painel pode ter uma abordagem híbrida. Por exemplo, você pode ter um
painel exploratório que exibe com destaque alguns KPIs. No entanto, tenha
cuidado para não sobrecarregar um painel. Tentar cumprir mais de um ou dois
objetivos com um único painel provavelmente resultará em uma bagunça
esmagadora.
Usando objetos
Os painéis são compostos de objetos organizados em uma tela.
Você verá uma lista de objetos que podem ser adicionados a um painel no painel
esquerdo de um painel:
Figura 8.1: Objetos disponíveis para adicionar a um painel
Além dos objetos que você pode adicionar por meio da barra lateral, há outros
objetos que podem ser aplicáveis a um determinado painel:
Filtros: eles aparecerão como controles para o usuário final para que ele
possa selecionar valores a serem filtrados
Parâmetros: Semelhante aos filtros, eles aparecerão como controles para
o usuário final selecionar uma opção de parâmetro
Controles de página: são controles que dão ao usuário final opções para
paginação através dos dados e podem ser usados para animar
visualizações e painéis
Legendas: incluem legendas de cor, tamanho e forma para ajudar o
usuário final a entender várias visualizações
Marcadores: permitem que o usuário destaque vários valores de dimensão
nas exibições
Título do painel: um objeto de texto especial que exibe o nome da planilha
do painel por padrão
Azulejo versus flutuante
Um objeto no painel está lado a lado ou flutuante. Se for um objeto lado a lado, ele
se encaixará no painel ou no contêiner de layout onde você o soltar. Se for um
objeto flutuante, ele flutuará no painel em camadas. Você pode alterar a ordem
das camadas de um objeto flutuante.
Você pode querer manipular um objeto quando ele fizer parte de um painel. Cada
objeto tem determinados controles que se tornam visíveis quando você o
seleciona:
Construindo as vistas
Use o conjunto de dados e siga estas etapas para criar as exibições individuais
que formarão a base do painel:Superstore Sales
1. Crie um gráfico de barras mostrando o lucro por categoria. Classifique as
categorias em ordem decrescente pela soma do lucro.
2. Adicione o campo Departamento a Filtros e mostre um filtro. Para fazer
isso, use o menu suspenso do campo Departamento no painel de dados e
selecione Mostrar Filtro.
3. Nomeie a folha :Overall Profit by Category
Figura 8.3: Um gráfico de barras mostrando a soma do lucro por categoria com o
Departamento como filtro
4. Crie outro modo de exibição semelhante mostrando o lucro por item.
Classifique os itens em ordem decrescente pela soma do lucro.
5. Você notará que há muitos itens para ver ao mesmo tempo. Para seus
objetivos neste painel, você pode limitar os itens apenas aos 10 menos
rentáveis. Adicione o campo Item à divisória Filtros, selecione a
guia Superior e ajuste as configurações para filtrar por campo.
Especifique Bottom 10 por:Sum(Profit)
Figura 8.4: Use a guia Superior para definir o número de itens a serem exibidos
9. Crie uma folha final para mostrar quando os lucros foram feitos ou perdidos.
Verifique se o campo Data do Pedido foi adicionado como o valor
da Data do trimestre e se ele é contínuo (verde).
10. Adicione uma linha de tendência linear. Para fazer isso, alterne para a
guia Analytics da barra lateral esquerda e arraste Linha de
tendência do modelo para a exibição. Como alternativa, clique com o
botão direito do mouse em uma área em branco da tela do modo de
exibição e selecione Linhas de tendência | Mostrar linhas de tendência.
11. Renomeie a planilha para:Profit Trend
Figura 8.7: Um gráfico de linhas mostrando a tendência do lucro por trimestre
Agora que você criou as visualizações que irão compor o painel, vamos começar a
montar o painel!
Na barra lateral esquerda, arraste e solte um objeto Text acima
de Lucro Geral por Categoria e insira as seguintes instruções:
1. Select a Department from the drop-down
2. Select a category below
3. Select an Item below
Figura 8.10: O controle Usar como filtro no modo de exibição Lucro por categoria
Agora você tem três filtros (dois são ações) que direcionam o painel:
Filtragem de contexto
Você deve ter notado que, ao usar o filtro suspenso para selecionar um único
departamento ou selecionar uma única categoria, você tem menos de 10 itens na
visualização Top 10. Por exemplo, selecionar Móveis no filtro Departamento e
clicar na barra de Tabelas resulta em apenas três itens sendo mostrados. Isso
ocorre porque o filtro Item superior é avaliado ao mesmo tempo que o filtro de
ação. Há apenas três itens com a categoria de Tabelas que também estão no Top
10.
E se você quiser ver os 10 principais itens dentro da categoria de Tabelas? Você
pode fazer isso usando filtros de contexto.
Os filtros de contexto são um tipo especial de filtro no Tableau que são
aplicados antes de outros filtros. Outros filtros são então aplicados dentro do
contexto dos filtros de contexto. Conceitualmente, os filtros de contexto resultam
em um subconjunto de dados sobre o qual outros filtros e cálculos operam. Além
dos Filtros Superiores, os cálculos de Conjuntos Computados e Nível Fixo de
Detalhe também são computados dentro do contexto definido pelos filtros de
contexto.
Nesse caso, navegue até a planilha Top 10 e adicione o filtro Departamento e o
filtro de ação recém-adicionado (Categoria) ao contexto usando o menu suspenso
dos campos na divisória Filtros. Depois de adicionados ao contexto, esses
campos ficarão cinza na divisória Filtros. Agora, você verá os 10 principais itens
dentro do contexto do departamento e da categoria selecionados:
Figura 8.13: Os 10 itens menos rentáveis estarão dentro do contexto dos filtros
Ação (Categoria) e Departamento
Observe que adicionar filtros ao contexto faz com que os campos sejam
codificados por cores cinza na divisória Filtros.
Você pode não apenas ver como seu painel aparecerá em vários dispositivos e
modelos, mas também como ele ficará com base na orientação do dispositivo e se
o aplicativo Tableau Mobile será usado (se disponível para o dispositivo
selecionado).
Ações de filtro: a ação do usuário faz com que um ou mais filtros sejam
aplicados a um ou mais modos de exibição.
Ações de destaque: a ação do usuário faz com que marcas e cabeçalhos
específicos sejam realçados em um ou mais modos de exibição.
Ações de URL: a ação do usuário faz com que uma URL específica seja
aberta (em um navegador, em uma nova guia ou em um objeto da Web
incorporado).
Ir para Planilha: a ação do usuário faz com que a navegação para uma
planilha ou painel selecionado.
Ações de parâmetro: a ação do usuário altera o valor de um parâmetro.
Isso permite que o usuário interaja visualmente com os parâmetros de
maneiras novas e emocionantes!
Definir ações: a ação do usuário define um conjunto. Os conjuntos podem
ser usados em cálculos, em filtros e em prateleiras para definir atributos
visuais de marcas. Isso abre muitas possibilidades para permitir interações
complexas e criativas.
Determinadas ações são geradas automaticamente pelo Tableau com base em
atalhos. Por exemplo, você pode selecionar Usar como filtro no menu suspenso
de uma exibição em um painel, o que resulta em uma ação de filtro gerada
automaticamente. Ativar o realce usando o botão em uma legenda de cor discreta
ou na barra de ferramentas gerará automaticamente uma ação de realce:
Ações de filtro
As ações de filtro são definidas por uma ou mais planilhas de origem que
passam um ou mais valores dimensionais como filtros para folhas de destino em
uma ação. Lembre-se de que cada marca em uma folha é definida por uma
interseção única de valores dimensionais. Quando ocorre uma ação envolvendo
uma ou mais dessas marcas, os valores dimensionais que compõem a(s) marca(s)
podem ser passados como filtros para uma ou mais folhas de destino.
Ao criar ou editar uma ação de filtro, você verá opções como estas:
Figura 8.20: Opções para ações de filtro
Nomeie o filtro.
Escolha as planilhas de origem e de destino. A folha Origem é onde o
usuário iniciará a ação (focalizar, seleção, menu) e a folha Destino é onde
a resposta será aplicada (filtrando neste exemplo, mas também realçando).
Defina a ação que aciona o filtro e se a seleção de várias marcas ou
apenas uma única marca inicia a ação.
Escolha o que acontece quando a seleção é desmarcada.
Especifique quais dimensões são usadas para passar valores de filtro para a(s)
planilha(s) de destino.
Tente dar às suas ações nomes que o ajudem a diferenciar entre várias ações no
painel. Além disso, se sua ação estiver definida para ser executada no Menu, o
nome usado será mostrado como um link na dica de ferramenta. Use a seta à
direita do nome para inserir espaços reservados de campo especiais. Eles serão
atualizados dinamicamente com os valores dos campos de uma marca quando o
usuário vir a opção de menu em uma dica de ferramenta.
Você pode selecionar quantas folhas de origem e destino desejar. No entanto, se
você especificar filtros de destino específicos na seção inferior, os campos
selecionados deverão estar presentes na planilha de origem (por exemplo,
em Linhas, Colunas e Detalhes). Você receberá um aviso se um campo não
estiver disponível para uma ou mais planilhas de origem e a ação não será
acionada para essas planilhas. Na maioria das vezes, sua origem e destino serão
o mesmo painel. Opcionalmente, você pode especificar uma planilha ou painel de
destino diferente, o que fará com que a ação navegue até o destino, além da
filtragem.
Quando as ações de filtro são definidas no nível da planilha (ao exibir uma
planilha, selecione Planilha | Ações do menu), um item de menu para essa ação
aparecerá como itens de menu para cada marca em cada planilha que usa a
mesma fonte de dados. Você pode usar isso para criar rapidamente a navegação
entre planilhas e de painéis para planilhas individuais.
As ações de filtro podem ser definidas para ocorrer em qualquer uma das três
ações possíveis:
Pairar: o usuário move o cursor do mouse sobre uma marca (ou toca em
uma marca em um dispositivo móvel).
Selecionar: o usuário clica ou toca em uma marca, e um
retângulo/radial/laço seleciona várias marcas clicando e arrastando um
retângulo ao redor delas e clica em um cabeçalho (nesse caso, todas as
marcas desse cabeçalho são selecionadas). Um usuário pode desmarcar
clicando/tocando na marca já selecionada, clicando/tocando em um espaço
vazio na visualização ou clicando/tocando no cabeçalho já selecionado.
Menu: O usuário seleciona a opção de menu para a ação na dica de
ferramenta.
Figura 8.21: Clicar na barra de Tabelas passa Categoria como um filtro para a
folha Destino
As ações de filtro são muito úteis para estreitar o foco, detalhar e ver diferentes
aspectos de uma dimensão selecionada. Você vai se encontrar usando-os com
frequência. Vamos considerar outro tipo de ação: destacar ações.
Ações de destaque
Esse tipo de ação não filtra folhas de destino. Em vez disso, as ações de
destaque fazem com que as marcas definidas, pelo menos em parte, pelo(s)
valor(es) dimensional(is) selecionado(s) sejam realçadas nas planilhas de destino.
As opções para ações de realce são muito semelhantes às ações de filtro, com as
mesmas opções de configuração para planilhas de origem e destino, e quais
eventos são capazes de disparar a ação.
Considere um painel com três modos de exibição e uma ação de realce com base
no campo Região. Quando a ação é acionada para a região Leste, todas
as marcas definidas por Leste são destacadas. A(s) dimensão(ões) usada(s) para
o realce deve estar presente em todos os modos de exibição em que você deseja
que o realce seja aplicado. Tanto o mapa quanto o gráfico de dispersão
têm Região na parte Detalhe do cartão Marcas:
Figura 8.23: Clicar na barra para Leste destacou todas as outras marcas
associadas a esse valor dimensional
Ações de URL
As ações de URL permitem gerar dinamicamente uma URL com base em uma
ação e abri-la em um objeto da Web no painel ou em uma nova janela ou guia do
navegador. As ações de URL podem ser acionadas pelo mesmo foco, menu e
eventos de seleção que outras ações. O nome da ação de URL a diferencia e
aparecerá como o link quando usado como um menu.
Ações de parâmetro
As ações de parâmetro permitem definir o valor de um parâmetro com base em
uma ação do usuário. Ao criar uma ação de parâmetro, você definirá opções
usando uma tela como esta:
Definir ações
As ações de conjunto permitem preencher um conjunto com um ou mais valores
para uma ou mais dimensões. Isso é muito poderoso porque os conjuntos podem
ser usados em qualquer prateleira para codificar qualquer elemento visual, podem
ser usados em cálculos e podem ser usados como filtros. Eles podem ser usados
de todas essas maneiras — e de maneiras diferentes — em diferentes modos de
exibição. Isso lhe dá uma flexibilidade incrível no que pode ser realizado com
ações definidas.
Você se lembrará de discutir conjuntos no Capítulo 2, Conectando-se a dados no
Tableau. Lá vimos que é possível criar conjuntos fixos ou computados. Como
veremos no exemplo a seguir, as ações de conjunto operam em conjuntos fixos.
Há muitas coisas que você pode fazer com conjuntos! Aqui, exploraremos um
exemplo de gráfico de barras que representa as vendas por categoria. Se você
filtrasse o gráfico de barras por uma determinada região, notaria que os
comprimentos das barras mudaram. No entanto, se, em vez de filtrar, você apenas
realçasse os segmentos da barra que representavam essa região, você obteria
alguma visão sobre o contexto geral. Essa técnica é conhecida como escovação
proporcional.
Você encontrará este exemplo de uma ação definida na pasta de trabalho no
painel chamado , que tem a seguinte aparência: Chapter 08 Complete.twbxSales by
Region and Category (set actions)
Figura 8.27: A ação de conjunto permite escovar: destacando a parte das barras
que pertencem à seleção
Aqui, no entanto, a ação de conjunto é usada para mostrar a parte da barra geral
que pertence a essa região, mantendo o comprimento total da barra para todas as
regiões.
Você pode usar um conjunto em prateleiras, assim como faria com qualquer
outro campo. Observe como o conjunto dá dois valores, ou seja, In e Out,
que definem duas cores. Você pode querer ajustar as cores para
enfatizar In.
Você também pode usar conjuntos em campos calculados. Por exemplo, o
código fornece um resultado booleano verdadeiro/falso para cada registro,
indicando se ele está no conjunto. [Region Set]
5. THEN "Acceptable"
6. ELSE "Poor"
7. END
CopyExplain
Esse código comparará a relação de lucro com o valor de corte
parametrizado. Qualquer coisa igual ou acima do ponto de corte receberá
um valor de , e tudo abaixo receberá o valor de . AcceptablePoor
4. Crie uma nova planilha chamada Scorecard de Região. O modo de
exibição consiste em Linhas, como uma parte de data discreta
em Colunas, e o campo em forma e cor. Você observará que as formas
foram editadas para usar marcas de seleção e Xs, e que a paleta de cores
está usando azul e laranja seguros para daltônicos. RegionOrder DateKPI -
Profit Ratio
5. Adicione totais gerais de coluna usando o painel do Google Analytics e
formate os totais gerais com um rótulo personalizado de Geral, com fonte
em negrito e sombreamento cinza claro.
6. Adicione a Data do Pedido como um filtro e defina-a para o campo 6
superior por (Data do Pedido como Min). Isso filtrará dinamicamente a
exibição dos últimos seis meses:
Figura 8.31: Esta vista define o scorecard Região que mostra resultados
Aceitáveis versus Fracos por região por mês
13. Depois que ambos os modos de exibição tiverem sido criados, você poderá
organizá-los como um painel. O exemplo na pasta de trabalho tem um
layout de telefone aplicado a ele, conforme mostrado aqui: Chapter 08
Complete
Figura 8.33: Um layout de telefone para o painel de KPI
Histórias
O recurso de histórias permite que você conte uma história usando instantâneos
interativos de painéis e exibições. Os instantâneos se tornam pontos em uma
história. Isso permite que você construa uma narrativa guiada ou até mesmo uma
apresentação inteira.
Vamos considerar um exemplo em que pontos de história podem ser úteis. Os
gerentes executivos estão satisfeitos com o painel do Scorecard Regional
que você desenvolveu anteriormente. Agora, eles querem que você faça uma
apresentação para a diretoria e destaque alguns assuntos específicos para a
região Sul. Com o mínimo de esforço, você pode pegar seu scorecard simples,
adicionar algumas visualizações adicionais e contar uma história inteira:
1. Primeiro, criaremos algumas exibições adicionais. Crie uma exibição
geográfica simples chamada . Faça deste um mapa preenchido com o
campo KPI – Taxa de Lucro, definindo Cor.ProfitRatio KPI by State
2. Adicione Taxa de Lucro à parte Detalhe do cartão Marcas para que ele
esteja disponível para uso posterior:
Figura 8.34: KPI de taxa de lucro por estado usa codificação de cores para
mostrar aceitável versus ruim
Resumo
Quando estiver pronto para compartilhar sua descoberta e análise, provavelmente
usará painéis para relacionar a história ao seu público. A forma como você conta a
história vai depender dos seus objetivos, bem como do seu público e do modo de
entrega. Usando uma combinação de modos de exibição, objetos, parâmetros,
filtros e legendas, você pode criar uma estrutura incrível para contar uma história
de dados. O Tableau permite que você crie layouts específicos para diferentes
dispositivos para garantir que seu público tenha a melhor experiência possível. Ao
introduzir ações e interatividade, você pode convidar seu público para participar da
história. Os pontos de história permitirão que você reúna muitos instantâneos de
painéis e visualizações para criar e apresentar narrativas inteiras.
Tendências
World Population.xlsx está
incluído no diretório. Ele contém um registro para cada
país para cada ano de 1960 a 2015, medindo a população. Usando esse conjunto
de dados, vamos dar uma olhada nas tendências históricas de vários países. Crie
uma exibição semelhante à mostrada na captura de tela a seguir, que mostra a
mudança na população ao longo do tempo para o Afeganistão e a Austrália.
Você notará que o Nome do país foi filtrado para incluir apenas o Afeganistão e
a Austrália e o campo também foi adicionado às prateleiras Cor e Rótulo:Chapter
09
Figura 9.1: Valores da população para o Afeganistão e a Austrália ao longo do
tempo
Embora tenhamos uma noção das duas tendências, elas se tornam ainda mais
óbvias quando vemos as linhas de tendência. O Tableau oferece várias maneiras
de adicionar linhas de tendência:
One option is to simply select the marks in the view for the time period of interest.
Tableau will, by default, calculate a trend line for the current selection. Here, for
example, the points for Afghanistan from 1980 to 1988 have been selected and a
new trend is displayed:
Figura 9.4: As configurações padrão especificam que linhas de tendência serão
desenhadas para seleções
END
CopyExplain
Ao colocá-lo em colunas, você obterá um cabeçalho para cada período de tempo,
o que quebra as linhas e faz com que tendências separadas sejam mostradas
para cada período de tempo. Você também observará que o Tableau mantém o
intervalo de datas completo no eixo para cada período. Você pode definir um
intervalo independente clicando com o botão direito do mouse em um dos eixos de
data, selecionando Editar Eixo e marcando a opção Intervalo de eixo
independente para cada linha ou coluna:
Figura 9.5: Aqui, a dimensão discreta Período cria três períodos de tempo
separados e uma tendência para cada um
Como alternativa, você pode usar o menu suspenso em cada um dos campos de
medida em linhas e colunas para alterá-los de medidas para dimensões,
mantendo-os contínuos. Como dimensões, cada valor individual definirá uma
marca. Mantê-los contínuos manterá os eixos necessários para as linhas de
tendência.
Vamos considerar algumas das opções disponíveis para linhas de tendência. Você
pode editar linhas de tendência usando o menu e selecionando Análise | Linhas
de Tendência | Editar linhas de tendência... ou clicando com o botão direito do
mouse em uma linha de tendência e selecionando Editar linhas de tendência....
Quando o fizer, verá uma caixa de diálogo como esta:
Figura 9.7: O Tableau oferece muitas opções para configurar linhas de tendência
Aqui, você tem opções para selecionar um tipo de modelo; selecionar campos
aplicáveis como fatores no modelo; permitir cores discretas para definir linhas de
tendência distintas; mostrando Bandas de Confiança; forçando a
interceptação em y a ser zero; mostrar tendências recalculadas para marcas
selecionadas; e mostrando dicas de ferramentas para a linha de tendência.
Examinaremos essas opções com mais detalhes.
Você só deve forçar a interceptação y a ser zero se souber que ela deve ser zero.
Com esses dados, quase certamente não é zero (ou seja, não existem casas que
são 0 metro quadrado que estão listadas por US $ 0).
Por enquanto, experimente as opções. Observe como remover o campo Tipo de
Venda como um fator ou desmarcar a opção Permitir uma linha de tendência por
cor resulta em uma única linha de tendência.
Você também pode ver o resultado da exclusão de um campo como um fator na
exibição a seguir, onde Tipo de Venda foi adicionado a Linhas:
Figura 9.8: A inclusão de um campo como fator informa ao Tableau se ele
contribui para o modelo de tendência
Modelos de tendência
Vamos retornar à exibição original e manter uma única linha de tendência ao
considerarmos os modelos de tendência disponíveis no Tableau. Os modelos a
seguir podem ser selecionados na janela Opções de Linha de Tendência.
Linear
Usaríamos um modelo linear se supuséssemos que, à medida que
o Tamanho aumenta, o Preço aumentará a uma taxa constante. Não
importa quanto o tamanho aumente, esperamos que o preço aumente para que
novos pontos de dados caiam perto da linha reta:
Figura 9.9: Tendência linear
Logarítmica
Empregaríamos um modelo logarítmico se esperássemos que a lei dos retornos
decrescentes estivesse em vigor – ou seja, o tamanho só pode aumentar muito
antes que os compradores parem de pagar muito mais:
Figura 9.10: Tendência logarítmica
Exponencial
Poder
Polinomial
Usaríamos esse modelo se sentíssemos que a relação
entre Tamanho e Preço era complexa e seguisse mais uma curva em forma de S,
onde inicialmente aumentar o tamanho aumentava drasticamente o preço, mas,
em algum momento, o preço se estabilizou. Você pode definir o grau do modelo
polinomial em qualquer lugar de para . A linha de tendência mostrada aqui é um
328Rd-grau polinomial:
Você vai querer entender os conceitos básicos dos modelos de tendência para
que você possa testar e validar suas suposições dos dados. Alguns dos modelos
de tendência estão claramente errados para nossos dados (embora
estatisticamente ainda válidos, é altamente improvável que os preços aumentem
exponencialmente). Uma mistura de bom senso com uma compreensão cada vez
maior de estatísticas irá ajudá-lo à medida que você progride em sua jornada.
Você também pode querer analisar seus modelos para precisão, e vamos lá em
seguida.
Basta passar o mouse sobre uma única linha de tendência para revelar a fórmula,
bem como o valor R-quadrado e P para essa linha de tendência:
Isso nos permite criar uma exibição como a seguinte, usando os resíduos e as
previsões (você notará que o Tableau exportou os campos com nomes bastante
detalhados):
Figura 9.18: Uma visualização usando resíduos e previsões para testar o modelo
Você pode incluir essa nova exibição junto com a original em um painel para
explorar o modelo de tendência visualmente. Use o botão de realce na barra de
ferramentas para realçar o campo Endereço:
Figura 9.19: O botão de realce
Entender e usar modelos de tendência pode ser muito útil na análise de dados.
Ele ajuda você a fazer previsões e ver tendências e padrões. Um aspecto muito
importante de olhar para as tendências é encontrar outliers e entender o que as
torna excepcionais.
Explicar dados
Com o Explain Data, você pode começar a descobrir algumas das razões e
explicações por trás dos dados que você vê em suas visualizações. Por que as
vendas estão subindo tanto em um ponto específico da linha do tempo? Por que o
lucro caiu tanto no mês passado? Explicar Dados tira um pouco do tedioso esforço
manual de procurar respostas para perguntas como essas.
Você pode ver uma ou mais explicações para o valor. Clicar em cada um deles
revelará uma visualização da explicação.
Outro fator dado a explorar é o tamanho. Para explicar isso e quaisquer outros
fatores, você precisará explorar mais o problema para verificar a(s) causa(s)
real(is) e garantir que os dados sejam bons. Mas parece razoável que tantos
quartos possam, sim, aumentar o valor de um determinado imóvel.
Em alguns casos, Explicar dados revelará problemas com os dados. Por exemplo,
Explain Data sugere que o número de quartos pode ser um fator contribuinte para
outro outlier, 80 Regency Pkwy. No entanto, se você examinar
as Características Subjacentes, os Dados Explicativos revelam uma explicação
muito provável: a soma do preço do imóvel é muito maior do que a média
(enquanto todos os outros imóveis têm somas iguais às médias):
Figura 9.24: Explorar as características subjacentes a uma marca
A análise de outliers é muito mais fácil com o Explain Data. Grande parte da
adivinhação é removida e você pode identificar caminhos para explorar com muito
mais rapidez e eficiência. Em seguida, examinaremos a capacidade do Tableau de
identificar relacionamentos complexos em dados usando clustering.
Clustering
O Tableau oferece a capacidade de executar rapidamente análises de clustering
em suas visualizações. Isso permite que você encontre grupos, ou clusters, de
pontos de dados individuais que são semelhantes com base em qualquer número
de sua escolha. Isso pode ser útil em muitas indústrias e campos de estudo
diferentes, como nos exemplos a seguir:
O marketing pode achar útil determinar grupos de clientes relacionados
entre si com base em valores de gastos, frequência de compras ou horários
e dias de pedidos
Os diretores de assistência ao paciente em hospitais podem se beneficiar
da compreensão de grupos de pacientes relacionados entre si com base
em diagnósticos, medicamentos, tempo de internação e número de
reinternações
Os imunologistas podem procurar cepas de bactérias relacionadas com
base na resistência a drogas ou marcadores genéticos
Os consultores de energia renovável podem gostar de identificar
aglomerados de moinhos de vento com base na produção de energia e, em
seguida, correlacionar isso com a localização geográfica
O Tableau usa um algoritmo de clustering k-means padrão que produzirá
resultados consistentes sempre que a exibição for renderizada. O Tableau
atribuirá automaticamente o número de clusters (k), mas você tem a opção de
ajustar o valor e atribuir qualquer número de variáveis.
Como as duas variáveis usadas para os clusters são as mesmas usadas para o
gráfico de dispersão, é relativamente fácil ver os limites dos clusters (você pode
imaginar algumas linhas diagonais particionando os dados).
Você pode arrastar e soltar praticamente qualquer campo para dentro e para fora
da seção Variáveis (do painel de dados ou do modo de exibição) para adicionar e
remover variáveis. Os clusters serão atualizados automaticamente à medida que
você fizer isso. Experimente adicionando Camas à lista de Variáveis e observe
que agora há alguma sobreposição entre o Cluster 1 e o Cluster 2 porque
algumas casas maiores têm apenas dois ou três quartos, enquanto algumas casas
menores podem ter quatro ou cinco. O número de quartos agora ajuda a definir os
clusters. Remova as camas e observe que os clusters são atualizados
imediatamente novamente.
Depois de ter clusters significativos, você pode materializar os clusters como
grupos na fonte de dados arrastando-os da exibição e soltando-os no
painel Dados:
Na exibição aqui, cada cluster original agora é um grupo que foi aliased para
fornecer uma melhor descrição do cluster. Você pode usar o menu suspenso para
o campo de grupo no painel de dados ou, alternativamente, clicar com o botão
direito do mouse no item na legenda de cores para editar aliases.
Há muitas opções para editar como os mapas aparecem. Você pode ajustar as
camadas mostradas nos mapas para ajudar a fornecer contexto adicional para os
dados que você está plotando. No menu superior, selecione Mapas | Camadas de
plano de fundo. As opções de camada serão exibidas na barra lateral esquerda.
O mapa anterior tinha Ruas, Rodovias, Fronteiras do Condado e Limites de
CEP habilitados para dar a cada endereço um contexto mais preciso de
localização. As camadas que estão disponíveis para seleção dependerão do nível
de zoom do mapa. Abordaremos esses recursos com mais detalhes no Capítulo
12, Explorando o mapeamento e os recursos geoespaciais avançados.
Ao olhar para a visão anterior, você realmente encontra bairros que são quase
exclusivamente de Preço Baixo (Cluster 1) e outros que são quase
exclusivamente de Médio Alcance (Cluster 2). Considere como um investidor
imobiliário pode usar essa visualização para procurar uma casa de baixo preço em
um bairro de médio porte.
Distribuições
Analisar distribuições pode ser bastante útil. Já vimos que certos cálculos estão
disponíveis para determinar informações estatísticas, como médias, percentis e
desvios-padrão. O Tableau também facilita a visualização rápida de várias
distribuições, incluindo intervalos de confiança, porcentagens, percentis, quantis e
desvios padrão.
Depois de selecionar o escopo e o eixo, você terá opções para alterar algumas
configurações. Você também pode editar linhas, bandas, distribuições e gráficos
de caixa clicando com o botão direito do mouse no recurso analítico no modo de
exibição ou clicando com o botão direito do mouse no eixo ou nas próprias linhas
de referência.
Como você aplicou os desvios padrão por painel, você obtém faixas diferentes
para cada tipo de venda. Cada eixo pode suportar várias distribuições, linhas de
referência e bandas. Você pode, por exemplo, adicionar uma linha média no modo
de exibição anterior para ajudar um visualizador a entender o centro dos desvios
padrão.
Em um gráfico de dispersão, usar uma distribuição para cada eixo pode produzir
uma maneira muito útil de analisar outliers.
Previsão
Como vimos, os modelos de tendência fazem previsões. Dado um bom modelo,
você espera que dados adicionais sigam a tendência. Quando a tendência é ao
longo do tempo, você pode ter alguma ideia de onde os valores futuros podem
cair. No entanto, prever valores futuros geralmente requer um tipo diferente de
modelo. Fatores como a sazonalidade podem fazer uma diferença não prevista
apenas por uma tendência. O Tableau inclui modelos de previsão internos que
podem ser usados para prever e visualizar valores futuros.
Para usar a previsão, você precisará de uma exibição que inclua um campo de
data ou partes de data suficientes para que o Tableau reconstrua uma data (por
exemplo, um campo Ano e um campo). O Tableau também permite previsões
com base em números inteiros em vez de datas. Você pode arrastar e soltar uma
previsão no painel Análise, selecione Analytics | Previsão | Mostrar Previsão no
menu ou clique com o botão direito do mouse no painel do modo de exibição e
selecione a opção no menu de contexto.
Por padrão, o último valor é excluído do modelo. Isso é útil quando você está
trabalhando com dados em que o período de tempo mais recente está incompleto.
Por exemplo, quando os registros são adicionados diariamente, o último mês
(atual) não é concluído até que os registros finais sejam adicionados no último dia
do mês. Antes desse último dia, o período de tempo incompleto pode distorcer o
modelo se ele não for ignorado.
Clicar no link Saiba mais sobre o resumo de previsão na parte inferior da janela
fornecerá muito mais informações sobre os modelos de previsão usados no
Tableau.
Resumo
O Tableau oferece um amplo conjunto de recursos para agregar valor à sua
análise. As linhas de tendência permitem identificar com mais precisão outliers,
determinar quais valores se enquadram nas previsões de determinados modelos e
até mesmo fazer previsões de onde as medições são esperadas. O Tableau
oferece ampla visibilidade dos modelos de tendência e até permite exportar dados
contendo previsões e resíduos do modelo de tendência. Os clusters permitem
localizar grupos de pontos de dados relacionados com base em vários fatores. As
distribuições são úteis para entender a dispersão de valores em um conjunto de
dados. A previsão permite um modelo complexo de tendências e sazonalidade
para prever resultados futuros. Ter uma boa compreensão dessas ferramentas lhe
dará a capacidade de esclarecer e validar suas análises visuais iniciais.
Visualizações avançadas
Exploramos muitos tipos diferentes de visualizações e consideramos quais tipos
de perguntas elas respondem melhor. Por exemplo, gráficos de barras ajudam na
comparação de valores; gráficos de linhas podem mostrar mudanças e tendências
ao longo do tempo; barras empilhadas e mapas de árvore nos ajudam a ver
relações de parte para o todo; Os gráficos de caixa nos ajudam a entender
distribuições e outliers. Também vimos como melhorar nossa compreensão e
narrativa de dados com cálculos, anotações, formatação e linhas de referência.
Com esse conhecimento como base, ampliaremos as possibilidades de análise de
dados com algumas visualizações avançadas.
Gráficos em cascata
Linhas de faísca
Gráficos de halteres
Gráficos de unidades/símbolos
Gráficos de Marimekko
Visualizações animadas
Cada uma das visualizações neste capítulo é criada usando os dados fornecidos.
Em vez de fornecer instruções passo a passo, vamos apontar técnicas avançadas
específicas usadas para criar cada tipo de gráfico. O objetivo não é memorizar
etapas, mas entender como aproveitar criativamente os recursos do
Tableau.Superstore
Gráficos em cascata
Um gráfico em cascata é útil quando você deseja mostrar como as partes se
acumulam sucessivamente em um todo. Na captura de tela a seguir, por exemplo,
um gráfico em cascata mostra como o lucro acumula um total geral
em Departamento e Categoria de produtos. Às vezes, o lucro é negativo, então,
nesse ponto, o gráfico em cascata dá uma queda, enquanto os valores positivos
se acumulam em direção ao total:
Figura 10.3: Este gráfico em cascata mostra como cada Categoria adiciona (ou
subtrai) lucro para aumentar em direção ao total
Experimente alternar tipos de linha para ver o impacto visual e o que cada um
comunica sobre os dados.
Minigráficos
Minigráficos são visualizações que usam vários gráficos de linhas pequenas que
são projetados para serem lidos e comparados rapidamente. O objetivo dos
minigráficos é dar uma visualização que possa ser entendida em um piscar de
olhos. Você não está tentando comunicar valores exatos, mas sim dar ao público a
capacidade de entender rapidamente tendências, movimentos e padrões.
Entre vários usos desse tipo de visualização, você já deve ter visto minigráficos
usados em publicações financeiras para comparar o movimento dos preços das
ações. Lembre-se de que, no Capítulo 1, Decolando com o Tableau,
consideramos o início inicial de uma visualização de minigráficos ao analisarmos
iterações de gráficos de linhas. Aqui está um exemplo muito mais desenvolvido:
Gráficos de halteres
Um gráfico de halteres é uma variação do gráfico de círculos que compara dois
valores para cada fatia de dados, enfatizando a distância entre os dois valores.
Gráficos de unidades/símbolos
Um gráfico de unidades pode ser usado para mostrar itens individuais,
geralmente usando formas ou símbolos para representar cada indivíduo. Esses
gráficos podem provocar uma resposta emocional poderosa porque as
representações dos dados são menos abstratas e mais facilmente identificadas
como algo real. Por exemplo, aqui está um gráfico mostrando quantos clientes
tiveram remessas atrasadas para cada região:
Figura 10.8: Cada imagem representa uma pessoa real e é menos abstrata do que
círculos ou quadrados
O gráfico de unidade anterior pode provocar mais uma resposta dos gerentes
regionais do que um gráfico de barras padrão quando eles são gentilmente
lembrados de que o mau atendimento ao cliente afeta pessoas reais. É verdade
que as formas ainda são abstratas, mas representam mais de perto uma pessoa
real. Você também pode considerar rotular a marca com o nome do cliente ou usar
outras técnicas para envolver ainda mais seu público.
Depois de saber o significado de uma forma, você não precisa mais fazer
referência a uma lenda. Colocar um campo discreto na prateleira Forma permite
atribuir formas a valores individuais do campo.
As formas são imagens localizadas no diretório. Você pode incluir suas próprias
formas personalizadas em subpastas desse diretório adicionando pastas e
arquivos de imagem.My Tableau Repository\Shapes
Gráficos de Marimekko
Um gráfico Marimekko (às vezes chamado alternadamente de gráfico Mekko) é
semelhante a um gráfico de barras empilhado verticalmente, mas também usa
larguras variadas de barras para comunicar informações adicionais sobre os
dados. Aqui, por exemplo, há um gráfico Marimekko mostrando a divisão das
vendas por região e departamento.
9. ELSE
10. PREVIOUS_VALUE(0)
11. END
CopyExplain
Embora esse código possa parecer assustador no início, ele segue uma
progressão lógica. Especificamente, se este for o primeiro segmento de barra,
desejaremos saber a soma de Vendas para toda a região (e é por isso que
excluímos o Departamento com um cálculo de nível de detalhe embutido).
Quando o cálculo for movido para uma nova Região, precisaremos adicionar o
total da Região anterior ao novo total da Região. Caso contrário, o cálculo é para
outro segmento na mesma Região, portanto, o total regional é o mesmo que o
segmento anterior. Observe novamente, a opção Computar usando foi definida
como Departamento para permitir que a progressão lógica funcione conforme o
esperado.
Para uma discussão mais abrangente dos gráficos de Marimekko, juntamente com
abordagens que funcionam com dados esparsos, consulte a postagem do blog de
Jonathan Drummey no https://www.tableau.com/about/blog/2016/8/how-build-
marimekko-chart-tableau-58153.
Visualizações animadas
As versões anteriores do Tableau permitiam animação rudimentar usando a
prateleira Páginas com controles de reprodução. As versões mais recentes do
Tableau incluem Mark Animation, o que significa que as marcas fazem uma
transição suave quando você aplica filtros, classificação ou alterações de página.
Considere aproveitar a animação para estender seu potencial analítico de algumas
maneiras:
1. Ative-o enquanto explora e analisa seus dados. Isso permite que você
obtenha insights analíticos que você poderia perder, como ver até onde e em
que direção as marcas em um gráfico de dispersão se movem à medida que
um filtro muda.
2. Use-o estrategicamente para melhorar a história dos dados. A animação pode
ser usada para capturar interesse, chamar a atenção para elementos
importantes ou criar suspense em direção a uma conclusão.
Agora, ative as animações para o modo de exibição. Para fazer isso, use o menu
para selecionar Formatar | Animações.... O painel de formato Animações será
exibido à esquerda. Use-o para ativar a Planilha Selecionada:
Figura 10.13: O painel de formato Animações oferece várias opções para
configurações de animação de pasta de trabalho e planilha individual
Resumo
Abordamos uma grande variedade de tipos de visualização avançada neste
capítulo! Consideramos gráficos de inclinação e colisão que mostram mudanças
na classificação ou valor, linhas de passo e salto que mostram valores que mudam
discretamente e gráficos de unidade que ajudam a materializar conceitos
abstratos.
Painéis dinâmicos
Analisamos os painéis anteriormente, no Capítulo 8, Contando uma história de
dados com painéis, e consideramos como torná-los interativos usando uma
variedade de ações. Agora, vamos expandir esse conceito para considerar como
criar painéis verdadeiramente dinâmicos — painéis onde os objetos podem ser
mostrados e ocultos. Isso permite que você faça todos os tipos de coisas incríveis,
como permitir que o usuário selecione qual tipo de visualização ver ou oculte ou
mostre dinamicamente controles que são relevantes ou desejados.
Mostrar/Ocultar botões
Troca de folhas
Mostrar/Ocultar botões
Os botões Mostrar/Ocultar permitem que você mostre e oculte contêineres de
layout (e tudo neles!). Você encontrará alguns exemplos na pasta de trabalho. A
pasta de trabalho tem os painéis, mas não os botões ou contêineres
Mostrar/Ocultar. As imagens usadas no segundo exemplo também estão no
diretório.Chapter 11 CompleteChapter 11 StarterChapter 11
Figura 11.3: Selecionando o botão Editar... revela muitas opções para alterar o
comportamento e a aparência do botão
Na caixa de diálogo resultante, você terá opções para selecionar qual contêiner de
layout mostrar ou ocultar, o estilo do botão (imagem ou texto) e quais imagens ou
texto mostrar quando o contêiner for mostrado ou oculto.
Figura 11.5: Aqui você pode ver os estados ocultos e mostrados do contêiner de
layout junto com a imagem de alteração do botão
Nesse caso, a imagem do botão padrão foi substituída por um ícone de ponto de
interrogação. Isso é feito editando a imagem conforme ilustrado na Figura 11.3 e
alterando a imagem ( está incluído no diretório.) questionmark.pngChapter 11
Vamos passar a considerar outro método de mostrar, ocultar e até mesmo trocar
conteúdo em um painel dinamicamente.
Troca de folhas
A troca de folhas, às vezes também chamada de seleção de folhas, é uma
técnica na qual as exibições são mostradas dinamicamente e ocultadas em um
painel, muitas vezes com a aparência de trocar uma exibição por outra. A
ocultação dinâmica e a exibição de exibições em um painel têm uma aplicação
ainda mais ampla. Quando combinada com objetos flutuantes e contêineres de
layout, essa técnica permite criar painéis ricos e dinâmicos.
Além disso, títulos e legendas não são recolhidos com a exibição. No entanto, eles
podem ser ocultos para que a vista colapse completamente.
Figura 11.12: O mapa está visível enquanto o gráfico de barras está recolhido
A chave para recolher uma exibição é ter um filtro ou conjunto de filtros que
garanta que nenhuma linha de dados seja mostrada. Não é necessário usar um
parâmetro para controlar a filtragem. Você pode usar um filtro normal ou um filtro
de ação para obter o mesmo efeito. Isso abre todos os tipos de possibilidades de
comportamento dinâmico em painéis.
Vamos estender o exemplo de troca de folha anterior para ver como mostrar e
ocultar a legenda de cores:
1. Crie uma nova planilha chamada . Esse modo de exibição é usado apenas
para mostrar e ocultar a legenda da cor.Show/Hide Legend
2. Crie um cálculo ad hoc clicando duas vezes em Linhas e digite . Devemos ter
um campo em linhas ou colunas para que a exibição seja recolhida, então
usaremos esse campo para nos dar um único eixo para Linhas e um único
eixo para Colunas sem outros cabeçalhos.MIN(1)
3. Duplique o cálculo ad hoc em Colunas. Agora você deve ter um gráfico de
dispersão simples com uma marca.
4. Como esta é uma folha auxiliar e não qualquer coisa que queremos que o
usuário veja, não queremos que ela mostre marcas ou linhas. Formatar o
modo de exibição usando Formatar | Linhas para remover Linhas de
Grade de Linhas e Colunas, juntamente com Réguas de Eixo. Além disso,
oculte os eixos (clique com o botão direito do mouse em cada eixo ou campo
e desmarque Mostrar cabeçalhos). Além disso, defina a cor como
transparência total para ocultar a marca.
5. Desejaremos que essa exibição mostre quando a opção de mapa estiver
selecionada, então mostre o controle de parâmetro e verifique se ele está
definido como Mapa e, em seguida, adicione o Mostrar Filtro de Folha aos
filtros e verifique Mapa:
Figura 11.14: A folha Mostrar/Ocultar Legenda com o Filtro Mostrar Folha aplicado
Neste ponto, você tem um painel dinâmico no qual a legenda é mostrada quando
o mapa é mostrado e é aplicável, e oculto quando o gráfico de barras está visível.
Quando Mapa é selecionado, a folha Mostrar/Ocultar Legenda é mostrada e
envia a legenda para a parte inferior do Contêiner de Layout:
Figura 11.15: A legenda Show/Hide empurra a legenda para baixo além do objeto
flutuante
Não há limite para quantas variações dessa técnica você pode usar em um painel.
Você pode ter quantas camadas quiser. Você pode até mesmo usar combinações
dessas técnicas para enviar exibições e objetos para dentro e para fora do painel.
As possibilidades de criar uma experiência de usuário ricamente interativa são
incríveis.
Resumo
A criação de painéis verdadeiramente dinâmicos oferece uma flexibilidade incrível
no design do seu painel. Os botões Mostrar/Ocultar dão ao usuário final a opção
de mostrar ou ocultar conteúdo no painel. As técnicas de troca de planilhas
permitem que você troque quais modos de exibição são mostrados e também
mostre ou oculte automaticamente controles ou outro conteúdo.
As técnicas abordadas neste capítulo permitirão que você realize todos os tipos de
interatividade incrível, desde ocultar e mostrar controles, instruções e explicações
de regras de negócios e análise até permitir que os usuários determinem tipos de
visualização e troquem visualizações dentro e fora.
Você pode clicar com o botão direito do mouse no indicador desconhecido para
ocultá-lo ou clicar nele para obter as seguintes opções:
As marcas são então renderizadas sobre essa imagem. Você já sabe como usar
dados, cálculos e parâmetros para ajustar como as marcas são renderizadas, mas
o Tableau oferece muito controle sobre como os mapas são renderizados.
Figura 12.2: O mapa escuro é uma das muitas opções para planos de fundo de
mapa
Este mapa contém exatamente as mesmas marcas que a captura de tela anterior.
Ele simplesmente usa um plano de fundo diferente. Outras opções
incluem Luz, Ruas, Satélite e muito mais.
Você também pode usar combinações de teclado e mouse para navegar no mapa.
Use Ctrl + roda do mouse ou Shift + Ctrl + clique do mouse para ampliar. Clique e
segure ou Shift + clique para deslocar.
Muitos aplicativos, como , e , podem ser usados para gerar arquivos espaciais.
Arquivos espaciais também estão prontamente disponíveis para download de
várias organizações. Isso lhe dá muita flexibilidade quando se trata de análise
geoespacial.AlteryxGoogle EarthArcGIS
Para replicar este exemplo, baixe o shapefile do United States Census Bureau
aqui: https://catalog.data.gov/dataset/tiger-line-shapefile-2015-nation-u-s-rails-
national-shapefile.
Depois de baixar e descompactar os arquivos, conecte-se ao arquivo. Na
visualização, você verá registros de dados com campos de identificação e nomes
de ferrovias. O campo Geometria é o objeto espacial que define a forma linear do
segmento ferroviário:tl_2015_us_rails.shp
MAKELINE() e MAKEPOINT()
Ao considerarmos essas duas funções, criaremos um campo calculado para traçar
uma linha entre o hospital e cada paciente. Vamos nomear nosso cálculo e
escrever este código:Line
MAKELINE(
MAKEPOINT([Latitude], [Longitude])
)
CopyExplain
Como a função retorna um objeto espacial, você notará que o campo tem um
ícone de geografia:
Figura 12.12: Cada linha tem origem no hospital e é desenhada para um paciente
DISTÂNCIA()
A distância pode ser um conceito muito importante quando analisamos
nossos dados. Saber o quão distantes estão dois pontos geoespaciais pode nos
dar muitos insights. O cálculo em si é muito semelhante e podemos criar um
campo calculado nomeado com o seguinte código:MAKELINE()Distance to the
Hospital
DISTANCE(
MAKEPOINT([Latitude], [Longitude]),
'mi'
)
CopyExplain
Semelhante ao cálculo, a função requer alguns pontos, mas também requer uma
unidade de medida. MAKELINE()DISTANCE()
Este exemplo simples poderia ser muito ampliado. Neste momento, podemos dizer
que o ID do paciente 5 está a 2.954 quilômetros de distância do hospital quando
pairamos sobre a linha. Poderíamos melhorar a exibição arredondando a distância
para casas decimais ou pesquisando o nome do paciente. Poderíamos aumentar
muito a utilidade analítica usando a distância como um filtro (para analisar
pacientes que estão acima ou abaixo de um determinado limiar de distância) ou
usando a distância como um fator de correlação em uma análise mais complexa. 2
BUFFER()
O buffer é semelhante ao , mas o inverso. Em vez de calcular uma distância entre
dois pontos, a função permite especificar um ponto, uma distância e uma unidade
de medida para desenhar um círculo com um raio da distância especificada em
torno do ponto.DISTANCE()BUFFER()
Por exemplo, você pode querer visualizar quais pacientes caem em um raio de 3
milhas do hospital.
END
CopyExplain
Esse código primeiro verifica se deseja realizar o cálculo apenas para o registro
hospitalar. O próprio cálculo usa a latitude e longitude para fazer um ponto e, em
seguida, especifica um raio de 3 milhas. BUFFER()
Para visualizar o raio junto com as marcas individuais de cada paciente, criaremos
um mapa de eixo duplo. Um mapa de eixo duplo copia os campos de latitude ou
longitude em linhas ou colunas e, em seguida, usa as seções separadas do
cartão Marcas para renderizar objetos geoespaciais diferentes. Aqui, por exemplo,
plotaremos os pontos para os pacientes como círculos e o raio usando o tipo de
marca Automático:
Com uma boa compreensão das funções geoespaciais disponíveis, vamos mudar
um pouco nosso foco para discutir outro tópico de interesse: a criação de
territórios personalizados.
Aqui, usando a fonte de dados, vamos considerar um exemplo usando CEP: Real
Estate with Custom Territories
Figura 12.15: Depois de selecionar as regiões preenchidas para agrupar como um
novo território, use o ícone de clipe de papel para criar o grupo
Você pode continuar a selecionar e agrupar marcas até ter todos os territórios
personalizados desejados. Com o CEP ainda fazendo parte do nível de detalhe da
visualização, você terá uma marca para cada CEP (e qualquer medida será
fatiada por CEP). No entanto, quando você remover o CEP da exibição, deixando
apenas o campo, o Tableau desenhará as marcas com base no novo grupo: Zip
Code (group)
Em vez disso, você pode informar ao Tableau que a relação já existe nos dados.
Neste exemplo, você usaria o menu suspenso do campo Região no painel de
dados e selecionaria Função Geográfica | Criar a partir
de... | CEP. Região agora é um campo geográfico que define territórios
personalizados:
Figura 12.18: As regiões personalizadas aqui são definidas pelo campo Região
nos dados
Camadas do mapa
As camadas de mapa foram introduzidas no Tableau 2020.4 e facilitam a reunião
de uma ampla variedade de dados geoespaciais de sua(s) fonte(s) de dados em
um único mapa. Considere, por exemplo, a fonte de dados que usamos no
exemplo anterior. Ele contém inúmeros dados geográficos, incluindo: Real Estate
with Custom Territories
Cidade
Estado
Código Postal
Digamos que queremos criar um mapa que reúna muito disso, mostrando as
casas individuais como círculos dimensionados por preço, juntamente com uma
indicação dos códigos postais e das regiões personalizadas que definimos
anteriormente com uma etiqueta indicando o preço médio para a região.
Para começar, vamos criar um mapa simples. Podemos começar com qualquer
um dos campos geoespaciais, mas o CEP pode ser o mais fácil, pois um simples
clique duplo no CEP cria uma visualização geográfica. Depois de alterar o tipo de
marca para Map, você verá uma visualização semelhante à Figura 12.19:
Figura 12.19: Um mapa preenchido de códigos postais
Com uma boa compreensão das camadas do mapa, agora você está pronto para
mostrar vários detalhes geográficos em um único mapa. Cuidado para não
sobrecarregar seu público, mas a capacidade de reunir inúmeros detalhes que
estão relacionados geoespacialmente é uma ferramenta poderosa em suas
habilidades de análise e storytelling. Com isso, vamos a algumas dicas e truques
finais para mapeamento no Tableau.
Você pode usar eixos duplos para exibir vários níveis de detalhes ou para
usar diferentes tipos de marca. Neste caso, ambos são realizados. O mapa
aproveita o eixo duplo para mostrar Lucro em nível estadual com um mapa
preenchido e Vendas em nível de CEP com um círculo.
Ao usar mapas preenchidos, considere definir Washout como 100% na
janela Camadas de plano de fundo para mapas organizados. No entanto,
apenas as formas preenchidas serão exibidas, portanto, os estados ausentes
(ou municípios, países ou outros) não serão desenhados:
Figura 12.25: Mapa desbotado
Você não precisa usar pixels, mas na maioria das vezes isso torna muito mais fácil
mapear os locais para os dados. Nesse caso, temos uma aba de um arquivo Excel
com os locais já mapeados para as coordenadas x e y na imagem (em pixels).
Com as uniões entre bancos de dados, você pode criar um texto simples ou um
arquivo do Excel contendo mapeamentos para suas imagens e associá-los a uma
fonte de dados existente. Você pode mapear pontos manualmente (usando um
aplicativo gráfico) ou usar uma das muitas ferramentas on-line gratuitas que
permitem mapear rapidamente coordenadas em imagens.
Como essa imagem se aplica apenas ao térreo, queremos mostrá-la apenas para
dados relacionados ao térreo, portanto, alternando para a guia Opções,
garantiremos que a condição seja definida com base nos dados. Também nos
certificaremos de marcar Sempre mostrar imagem inteira:
Resumo
Nós cobrimos muito terreno neste capítulo! O básico da visualização de mapas é
simples, mas há muito poder e possibilidade nos bastidores. Desde o uso de seus
próprios dados geoespaciais até o aproveitamento de objetos e funções
geoespaciais e potencialmente a colocação de muitas informações em camadas
em um único mapa, você tem muitas opções analíticas. Criar territórios
personalizados e plotar dados em imagens de fundo expandem ainda mais suas
possibilidades.
Com essa base, vamos passar a considerar como usar e, finalmente, criar
extensões de painel.
Quando você abre pela primeira vez uma pasta de trabalho que usa extensões de
painel, você pode receber um prompt para permitir a extensão. Este é um recurso
de segurança que permite desabilitar uma extensão que você não confia.
Para acompanhar este exemplo, use a pasta de trabalho, localize o painel Salas
de Hospital e arraste e solte o objeto Extension no painel, conforme
ilustrado:Chapter 13 Starter
Figura 13.8: Alternar para filtragem quando todas as formas forem mapeadas
11. Teste a extensão clicando em várias salas. Você deve ver a atualização
apropriada do gráfico de volume do paciente. Você ampliou a capacidade
do seu painel e deu aos usuários finais uma nova maneira de interagir com
o painel que, de muitas maneiras, é mais intuitiva e divertida do que
selecionar um local em uma lista suspensa.
12. Novas extensões são adicionadas com frequência, então continue a
explorar e descobrir novas maneiras de estender a funcionalidade de seus
painéis!
Mas e se você precisar de recursos exclusivos que vão além das extensões
criadas pelo Tableau ou por terceiros? Você pode considerar criar suas próprias
extensões - e é isso que vamos considerar a seguir!
Você pode querer usar um editor de texto simples (como o bloco de notas), um
editor de texto mais avançado (como o Notepad ++) ou até mesmo uma
plataforma de desenvolvimento (como o Visual Studio) para exibir e editar
arquivos de código.
Vamos examinar cada um desses arquivos com um pouco mais de detalhes para
ver o que eles contêm e como funcionam.
O arquivo de manifesto
Começaremos com o arquivo de manifesto, . O arquivo de manifesto é um
documento XML que contém tudo o que é necessário para informar ao Tableau
onde a extensão está hospedada e fornecer aos usuários informações como uma
descrição e o autor da extensão. Abra o arquivo em um editor de sua escolha se
você deseja ver o arquivo inteiro. Aqui, examinaremos apenas trechos
especialmente relevantes.ShowImage.trex
website="https://www.vizpainter.com"/>
CopyExplain
<url>http://localhost:8765/Samples/ShowImage/ShowImage.html</url>
</source-location>
CopyExplain
O arquivo HTML
Neste exemplo, o documento HTML é chamado . Este exemplo usa um
documento HTML muito simples com alguns links para arquivos JavaScript
externos e uma imagem com uma fonte em branco, que será atualizada por meio
do JavaScript. Examine o arquivo completo em um editor e, em seguida, considere
os trechos mais importantes:ShowImage.html
<script src="../../lib/tableau.extensions.1.latest.js"></script>
CopyExplain
Essa referência aponta para a versão mais recente da API de extensões. Supondo
que você tenha configurado e iniciado o servidor Web com base no local de
download da API de extensões do Tableau, sua referência não precisará ser
alterada.
<script src="./ShowImage.js"></script>
CopyExplain
Esta linha faz referência ao arquivo que contém todo o código necessário para
atualizar a imagem com base nos valores de parâmetro no painel. ShowImage.js
Isso define a imagem e a inicializa com uma fonte em branco. Atualizaremos esse
objeto no código JavaScript com base nos valores de parâmetro no painel.
O arquivo JavaScript
Finalmente, vamos considerar algumas das seções relevantes do arquivo
JavaScript, . Este é um arquivo JavaScript muito simples que usa a API de
extensões do Tableau para ler valores de parâmetro e aplicar os valores
apropriados, com base no nome do parâmetro, à imagem no documento
HTML.ShowImage.js
Primeiro, temos uma função para atualizar a imagem com base nos valores dos
parâmetros:
if (p.name=='ImageURL'){
document.getElementById("imgImage").src = p.currentValue.formattedValue;
else if (p.name=='ImageWidth'){
document.getElementById("imgImage").style.width = p.currentValue.formattedValue + "px";
}
CopyExplain
Essa função usa um objeto de parâmetro e, em seguida, verifica o nome do
objeto. Se o nome do parâmetro for , ele definirá o atributo da imagem HTML
como o valor do parâmetro. Se o nome do parâmetro for , ele definirá o estilo para
o valor do parâmetro com (pixels) anexado. pImageURLsrcImageWidthwidth"px"
Este exemplo destaca o fato de que muitas extensões exigirão que determinadas
convenções de nomenclatura sejam usadas em um painel. Especificamente, essa
extensão requer um parâmetro chamado para definir a URL da imagem. A
extensão funcionará sem um segundo parâmetro chamado , mas apenas um
parâmetro com esse nome exato pode ser usado para definir a largura da
imagem.ImageURLImageWidth
parameterChangeEvent.getParameterAsync().then(function (param) {
updateImage(param);
});
}
CopyExplain
Veremos a seguir como a função é definida como um ouvinte de eventos. Por
enquanto, entenda que a função é chamada sempre que um valor de um
parâmetro é alterado no painel. Quando o valor de um parâmetro é alterado, a
função examinada anteriormente é chamada com o parâmetro alterado como um
argumento.onParameterChangeupdateImage
Finalmente, observe a função, que será chamada após o carregamento do
documento HTML, dando-nos a chance de inicializar tudo o que
precisamos:document.ready
$(document).ready(function () {
tableau.extensions.initializeAsync().then(function () {
tableau.extensions.dashboardContent.dashboard.getParametersAsync().then(function (parameters)
parameters.forEach(function (p) {
p.addEventListener(tableau.TableauEventType.ParameterChanged, onParameterChange);
updateImage(p);
});
});
});
});
CopyExplain
Quando o documento HTML estiver carregado e pronto, esse bloco de código será
executado. Primeiro, a inicialização de extensões do Tableau é chamada, após o
que obtém uma matriz de todos os parâmetros no painel. Para cada um desses
parâmetros, a função é adicionada como um ouvinte de eventos e a função é
chamada, o que atualizará a origem da imagem ou a largura, dependendo de qual
parâmetro
é passado.tableau.extensions.dashboardContent.dashboard.getParametersAsync()onP
arameterChangeupdateImage
Todas essas funções funcionam juntas de modo que, quando a extensão for
carregada pela primeira vez no painel e sempre que um valor de parâmetro for
alterado, a imagem será atualizada. Vamos ver isso em ação!
Verifique se você iniciou o servidor Web local para que o conteúdo da extensão
esteja disponível para o painel do Tableau.
Arraste o objeto Extension para a área em branco do painel e, na janela pop-
up Adicionar uma extensão, selecione Acessar extensões locais no canto
inferior esquerdo:
Você acabou de montar e usar uma extensão simples! Nós apenas arranhamos a
superfície do que é possível!
Nesta seção, veremos um exemplo de uso de um script Python com o TabPy para
ilustrar como usar extensões de análise. Na próxima seção, veremos o Einstein
Discovery (CRM Analytics), que é uma extensão de análise, mas merece
consideração especial.
Configurando o TabPy
Ao abrir pela primeira vez uma pasta de trabalho que contém uma conexão com
um serviço externo por meio de extensões de análise, você receberá um aviso de
segurança. Assim como acontece com as extensões de painel, convém estar
ciente de que os dados podem ser transferidos para o serviço externo. Certifique-
se de que confia no livro e na sua origem.
"
import re
exceptions = ['a', 'an', 'the', 'at', 'by', 'for', 'in', 'of', 'on', 'to', 'up', 'and', 'as', 'but', 'or', 'nor', 'with', 'is']
if _arg1 is None:
return None
title = _arg1[0]
capitalized_title = [word_list[0].capitalize()]
",
MIN([Title]) )
CopyExplain
Esse cálculo define um script Python que é executado via TabPy para retornar
uma versão de caso de título de um valor de cadeia de caracteres que é passado
para o script. Vamos dissecar o script Python em si, mas primeiro, vamos observar
alguns aspectos importantes das funções no Tableau: Script_
O campo calculado usa a função. As funções do Tableau permitem que
você passe um script para um mecanismo externo e retorne um resultado.
A função exata usada depende do tipo de dados do resultado retornado do
script. Nesse caso, esperamos um resultado de cadeia de caracteres. Em
outros casos, talvez seja necessário usar , ou se você espera um resultado
booleano, inteiro ou número real,
respectivamente.SCRIPT_STR()Script_SCRIPT_BOOLSCRIPT_INTSCRIPT_REAL
Todas as funções usam dois ou mais argumentos. O primeiro argumento é
uma cadeia de caracteres que contém o script que será executado por meio
da extensão de análise. O segundo, e opcionalmente terceiro, quarto,
quinto e assim por diante, são valores que você deseja passar para o seu
roteiro. Esses valores serão referenciados no script como , , , e assim por
diante. Eles serão passados como objetos, portanto, na maioria das vezes,
você obterá o valor do objeto como um atributo usando código
como .Script__arg1_arg2_arg3_arg2[0]
As funções são tratadas como cálculos de tabela no Tableau. Isso significa
que todos os valores que você passar para o script serão agregações no
nível de detalhe definido pela exibição. É por isso que é usado em vez de
apenas . Além disso, talvez seja necessário especificar o escopo e a
direção do cálculo da tabela para garantir que os valores sejam passados
para o script conforme o esperado.Script_MIN([Title])[Title]
Agora, vamos voltar nossa atenção para o script Python em si para entender como
ele funciona. Vamos percorrer linha por linha através do código, começando com o
primeiro:
import re
CopyExplain
Essa linha importa a biblioteca de expressões regulares do Python, que usaremos
para analisar a cadeia de caracteres.
Também definiremos uma lista de palavras de exceção que não devem estar em
maiúsculas no meio de um título:
exceptions = ['a', 'an', 'the', 'at', 'by', 'for', 'in', 'of', 'on', 'to', 'up', 'and', 'as', 'but', 'or', 'nor', 'with', 'is']
CopyExplain
A variável contém a lista de palavras de exceção. As próximas linhas saem da
função se for null:exceptionsTitle
if _arg1 is None:
return None
CopyExplain
Você vai lembrar que passamos como o primeiro argumento. Se for Null, o script
Python também retornará Null. Title
Em seguida, atribuiremos o valor a uma variável Python chamada . Isso é
principalmente para conveniência e legibilidade: title
title = _arg1[0]
CopyExplain
Observe que usamos porque queremos que o valor da cadeia de caracteres do
primeiro (e, neste exemplo, apenas) argumento seja passado para o
script._arg1[0]
Em seguida, dividimos o título em cada palavra individual e o armazenamos como
uma lista em uma variável chamada :word_list
word_list = re.split(' ', title.lower())
CopyExplain
Você notará que usamos a biblioteca de expressões regulares que importamos na
primeira linha de código para realizar a divisão. Também usamos a função para
garantir que todas as palavras no título estejam em minúsculas antes de
implementar qualquer lógica de capitalização.lower()
capitalized_title = [word_list[0].capitalize()]
CopyExplain
Inicializamos a lista com a primeira palavra em maiúsculas, porque a primeira
palavra de cada título é maiúscula sem exceção.
Você notará que é um cálculo de tabela indicado pelo símbolo delta no campo e
que o Título original ainda está na exibição (em Detalhes no
cartão Marcas). O título deve estar na exibição para que possa ser passado para
o script Python e é computado no nível da célula para que cada título individual
seja passado.EpisodeEpisode
Além deste simples exemplo, há tantas coisas incríveis que você pode fazer com
Python (e similarmente R). À medida que você aprende e cresce, você descobrirá
uma variedade de ferramentas estatísticas, bibliotecas preditivas e a capacidade
de realizar feitos incríveis de análise.
Os exemplos nesta seção exigirão uma conta do Salesforce com uma licença para
o CRM Analytics. Você pode completar os exemplos usando uma conta demo por
tempo limitado, que você pode se inscrever
aqui: https://www.salesforce.com/products/crm-analytics/overview/.
Depois de fazer login no Salesforce, crie sua história seguindo estas etapas:
Você vai querer definir as opções para a história, conforme mostrado aqui:
Einstein está lhe dando uma visão sobre quais campos são úteis (ou não) para
determinar o resultado. Observe que cada campo recebe uma porcentagem de
quão estreitamente ele se correlaciona com a condição de sobrevivência. O
Einstein também mostra alguns alertas que dão indicação de possíveis
problemas. Survived?
First, you can connect to Einstein as an analytics extension and use table
calculations. This gives you a lot of flexibility to use the prediction results
from Einstein. You can use them in other calculations, compute averages,
set parameter values, and much more. The possibilities for rich predictive
content are endless!
Second, you can use a dashboard extension that reads data from your
dashboard and provides feedback on prediction results and reasons.
We’ll consider both of these approaches in this example. Locate and open the
dashboard named in the directory. It won’t display correctly until you connect
the Einstein analytics extension and alter a table calculation based on your
Salesforce account and the story you created in the preceding
section. Please follow the instructions that follow to connect and configure the
extensions.Chapter13.Einstein.twbxLearning Tableau\Chapter 13\Titanic
We’ll start by enabling the analytics extension. Follow these steps to enable access
to Einstein via calculation in Tableau:
You now have enabled Tableau to communicate with the Einstein analytics
extension. You may now use your Einstein model, but you’ll have to determine
Salesforce’s unique key to correctly reference it. Fortunately, Salesforce makes it
very easy to integrate your model in Tableau — even going so far as generating a
table calculation for you.
To generate this calculation in Salesforce, ensure you are logged into your
Salesforce account where you deployed the model and locate the model. If you
followed the instructions in the preceding sections, it should be named .Predicted
Survived?
Once you have selected your model, you will find Create Tableau Table
Calculation as a under the Advanced tab on the right side of the screen:
This will reveal a table calculation that you can copy and then paste into Tableau.
Within Salesforce, you will also find options to export R code for an Einstein model.
You could potentially use the R script with RServe in a similar way to the Python
script we examined previously.
With the table calculation copied, return to Tableau and continue to follow the steps
to integrate your Einstein Discovery model into Tableau:
Once you have pasted your code into the code editor and clicked OK, you may be
prompted to log into Salesforce and the initial processing of data may take some
time as Einstein flows the data through its models. Subsequent refreshes will be
much faster.
Once your calculation matches the model you deployed, you should see results
similar to this:
Figure 13.28: Einstein predictions of survival based on Class and Sex
Einstein’s predictions for each individual are shown to the right with an overall
average prediction for all individuals shown as a reference line.
Notice that the actual result does not always match Einstein’s prediction. This is
expected in predictive models and you must be very careful when using predictive
models and making assumptions about individuals.
Having seen the analytics extension used to leverage Einstein, let’s turn our focus
to the dashboard extension and even put everything together.
4. Click Proceed.
5. The extension should detect the relationship between the model fields and
worksheet fields, but ensure Class and Sex are matched appropriately.
Then click Proceed.
6. On the final configuration screen, set the label to Predicted to Survive and
the Prediction Score Unit to %. Take a moment to review all other settings
but accept default values. Finally, click Done:
Figure 13.30: Setting label and units on final configuration screen
The bottom view of individual predictions serves as the source of data for the
Einstein model. The results of the model are displayed in the extension in the
upper right. In addition to displaying the percent predicted to survive, Einstein also
gives the top predictors and specific advice on how to improve the predictions.
Observe que o painel inclui uma ação de filtro que é acionada selecionando uma
ou mais faixas etárias no histograma. Ao filtrar a exibição inferior, que é a fonte de
dados para o modelo do Einstein, você verá os resultados da previsão mudarem
com base em sua interação:
Figura 13.32: A interação pode ser usada para alterar os dados avaliados pelo
modelo
Dessa forma, você pode criar painéis totalmente interativos que permitem que o
usuário final interaja com o modelo preditivo e descubra novos insights e tome
medidas proativas para gerar resultados positivos. Imagine as possibilidades para
sua organização!
Resumo
A capacidade de estender o Tableau é incrível! Com as extensões de painel, você
tem uma biblioteca cada vez maior de extensões do Tableau/Salesforce e de
terceiros. Eles podem estender a interface do usuário, fornecer integração com
sistemas e plataformas de back-end e melhorar a experiência do usuário de várias
maneiras. Nós até olhamos para um exemplo de como escrever suas próprias
extensões de painel. A capacidade de escrever código personalizado e hospedá-lo
em seus próprios servidores oferece a máxima flexibilidade e controle à medida
que você amplia os recursos do Tableau.
As extensões de análise oferecem a capacidade de executar scripts R e Python e
conectar-se a outros mecanismos de análise. Você também é capaz de aproveitar
os incríveis recursos preditivos do CRM Analytics / Einstein Discovery e usar a IA
para detectar padrões, descobrir insights e orientar suas decisões e ações com
base em seus dados!
Figura 14.1: As quatro guias do arquivo do Excel ilustradas como quatro tabelas
com relações
O Excel não define explicitamente as relações, mas elas são mostradas aqui como
podem existir em um banco de dados relacional usando pesquisas de chave
estrangeira. Aqui está uma breve explicação das tabelas e suas relações:
Com uma compreensão sólida da fonte de dados de exemplo, vamos voltar nossa
atenção para como podemos criar um modelo de dados no Tableau.
Você pode alterar a tabela raiz clicando com o botão direito do mouse em uma
tabela que não é atualmente a tabela raiz e selecionando a opção Trocar com
raiz.
Neste exemplo, a ordem em que você adiciona as tabelas não importa, embora
você possa notar uma exibição ligeiramente diferente dependendo de qual tabela
você começa. Na captura de tela a seguir, começamos com a Visita ao
Hospital (que é a tabela principal e, portanto, faz sentido ser a tabela raiz) e, em
seguida, adicionamos todas as outras tabelas:
Figura 14.3: Todas as tabelas foram adicionadas ao modelo de dados
Figura 14.4: A caixa de diálogo Editar Relação inclui opções para melhorar o
desempenho
Com nosso modelo de dados inicial criado, vamos tirar um momento para explorar
as duas camadas do paradigma do modelo de dados.
Figura 14.6: Camada física das tabelas físicas que compõem a Visita Hospitalar
Esta é a camada física para a tabela lógica de Visita Hospitalar. Essa camada
física é composta por tabelas físicas de dados — potencialmente unidos ou
unidos. Neste caso, somos informados que a Visita Hospitalar é composta por 1
mesa. Então, neste caso, a camada lógica da Visita Hospitalar é idêntica à
camada física abaixo. Na seção Usando junções deste capítulo, exploraremos
exemplos de como podemos estender a complexidade da camada física com
várias tabelas e, ao mesmo tempo, tratar a coleção de tabelas como um único
objeto.
Vá em frente e feche a camada física da Visita ao Hospital com o ícone X no
canto superior direito. Em seguida, navegue até a guia Análise da pasta de
trabalho deste capítulo e exploraremos como o modelo de dados funciona na
prática.
Com uma visão geral de como o painel de dados ajuda você a trabalhar com o
modelo de dados, vamos examinar alguns comportamentos que você pode
esperar do modelo de dados.
Quando você cria um novo modelo de dados pela primeira vez, é útil executar
algumas verificações rápidas semelhantes aos exemplos desta seção. Isso
ajudará você a ganhar familiaridade com o modelo de dados, além de ajudá-lo a
validar se os relacionamentos estão funcionando conforme o esperado.
Agora vamos voltar nosso foco para aprender a relacionar dados na camada física
usando junções.
Usando junções
Uma junção no nível físico é uma correspondência linha por linha dos dados entre
tabelas. Examinaremos alguns tipos diferentes de junções e, em seguida,
consideraremos como aproveitá-las na camada física de um modelo de dados.
Tipos de junções
Na camada física, você pode especificar os seguintes tipos de junções:
Interno: Somente os registros que correspondem à condição de junção da
tabela à esquerda e da tabela à direita serão mantidos. No exemplo a
seguir, apenas três linhas correspondentes são mantidas nos resultados:
Com uma sólida compreensão dos tipos de junção, vamos considerar como usá-
los na camada física do modelo de dados do Tableau.
Juntando tabelas
A maioria dos bancos de dados tem várias tabelas de dados que estão
relacionadas de alguma forma. Além disso, você pode unir tabelas de dados em
várias conexões de dados para muitas fontes de dados diferentes.
Para nossos exemplos aqui, vamos mais uma vez considerar as tabelas no banco
de dados do hospital, com um pouco de simplificação:
Vamos considerar como podemos criar uma fonte de dados usando algumas
junções na camada física. Para acompanhar, crie uma nova fonte de dados do
Excel na pasta de trabalho que faça referência ao arquivo no diretório. Você
também pode examinar a conexão na pasta de trabalho. Chapter 14
Starter.twbxHospital Visits (Joins).xlsxChapter 14Chapter 14 Complete.twbx
Assim como fizemos antes, começaremos arrastando a tabela Visita ao Hospital
para a tela da fonte de dados de modo que tenhamos um
objeto Visita ao Hospital na camada lógica, assim:
Figura 14.19: Depois de arrastar a tabela para a tela, o objeto Visita ao hospital é
criado na camada lógica
Neste ponto, o objeto de camada lógica simplesmente contém uma única tabela
física. Mas vamos estender isso a seguir. Clique duas vezes no objeto Visita ao
Hospital para expandir a camada física. Ficará assim:
Figura 14.20: A camada física, que atualmente consiste em uma única tabela
física
Você pode estender o modelo físico adicionando tabelas adicionais. Faremos isso
aqui, adicionando Detalhe de Alta e Paciente. À medida que os adicionamos, o
Tableau solicitará uma caixa de diálogo para ajustar os detalhes da associação.
Ficará assim:
Figura 14.22: A camada física é composta por três tabelas unidas entre si
Ao fechar a camada física, você verá novamente a camada lógica, que contém um
único objeto: Visita ao Hospital. Esse objeto agora contém um ícone de junção,
indicando que ele é composto de tabelas físicas unidas. Mas ele permanece um
único objeto na camada lógica do modelo de dados e tem a seguinte aparência:
Figura 14.23: A camada lógica contém um único objeto que é composto por três
tabelas físicas
Todas as junções criam o que você pode pensar como uma tabela plana, que
pode ser relacionada com outros objetos no modelo de dados. Esses objetos, por
sua vez, podem ser compostos por uma única tabela física ou várias tabelas
físicas juntas.
Unir cálculos
No exemplo anterior, observamos que o Tableau une linhas em uma tabela a
linhas em outra com base nos campos dos dados. Você pode se deparar com
casos em que você precisa unir com base em valores que não estão presentes
nos dados, mas podem ser derivados dos dados existentes. Por exemplo, imagine
que há uma tabela Perfil do paciente que agregaria valor significativo ao seu
conjunto de dados. No entanto, ele não possui uma ID do paciente e tem apenas
os campos Nome e Sobrenome.
Para juntar isso à nossa tabela de pacientes, podemos usar um cálculo
de junção. Este é um cálculo que existe apenas com a finalidade de juntar
tabelas. Para criar um cálculo de junção, use a lista suspensa de campos na caixa
de diálogo Ingressar e selecione a opção final, Criar cálculo de associação...:
Figura 14.24: Você pode criar um cálculo de junção para ajudar na formação das
junções corretas
Selecionar essa opção permite que você escreva cálculos em nível de linha que
podem ser usados na junção. Por exemplo, nosso cálculo de associação pode ter
código como retornar valores que correspondem ao campo Nome.[First Name] +
" " + [Last Name]
ID da
Nome do Paciente ID do Médico
visita
1 Kirk 1
2 Picard 2
3 Sisko 3
ID do
Nome do Médico
Médico
1 Mccoy
2 Triturador
3 Bashir
2 Pulaski
Observe que o valor para ocorre duas vezes na tabela. A união da tabela na
igualdade entre o valor resultará em registros duplicados, independentemente do
tipo de associação usado. Essa junção resultaria no seguinte conjunto de
dados:2Doctor IDDoctorDoctor ID
ID da
Nome do Paciente ID do Médico Nome do Médico
visita
1 Kirk 1 Mccoy
2 Picard 2 Triturador
3 Sisko 3 Bashir
2 Picard 2 Pulaski
Isso vai impactar muito na sua análise. Por exemplo, se você estivesse contando o
número de linhas para determinar quantas visitas de pacientes ocorreram, você
supercontaria. Há momentos em que você pode querer criar intencionalmente
registros duplicados para ajudar na análise; no entanto, muitas vezes, isso
aparecerá como um erro não intencional.
Usando misturas
A combinação de dados permite que você use dados de várias fontes de dados
na mesma exibição. Muitas vezes, essas fontes podem ser de diferentes tipos. Por
exemplo, você pode misturar dados do Oracle com dados do Excel. Você pode
combinar dados do Google Analytics com um arquivo espacial. A combinação de
dados também permite comparar dados em diferentes níveis de detalhes. Vamos
considerar o básico e um exemplo simples.
Só pode haver uma fonte primária, mas pode haver quantas fontes secundárias
você desejar. As etapas 3 e 4 são repetidas para cada fonte secundária. Quando
todos os resultados agregados tiverem sido retornados, o Tableau corresponderá
às linhas agregadas com base nos campos de vinculação.
Quando você tem mais de uma fonte de dados em uma pasta de trabalho do
Tableau, a fonte usada primeiro em uma exibição se torna a fonte primária dessa
exibição.
A combinação é específica da exibição. Você pode ter uma fonte de dados como
primária em um modo de exibição e a mesma fonte de dados como secundária em
outro. Qualquer fonte de dados pode ser usada em uma mistura, mas os cubos
OLAP, como no SQL Server Analysis Services, devem ser usados como a fonte
primária.
Além disso, use a tela Editar relações de dados para definir os campos que serão
usados para filtros de fonte de dados cruzados. Quando você usa o menu
suspenso de um campo em Filtros em um modo de exibição e seleciona Aplicar a
planilhas | Tudo Usando fontes de dados relacionadas, o filtro funciona entre
fontes de dados.
Cirurgia de Internação 30
Cirurgia Ambulatorial 40
UTI 30
GINECOLOGISTA 25
Labrador 120
Figura 14.30: Você pode arrastar e soltar campos de fontes secundárias para o
modo de exibição ou usar Mostrar
Abordamos algumas opções sobre como relacionar dados neste capítulo. Vamos
apenas tirar um momento para considerar quando usar essas diferentes técnicas.
À medida que você cresce em confiança ao usar cada uma dessas abordagens,
você será capaz de determinar melhor o que faz sentido em uma determinada
circunstância.
Resumo
Agora você tem várias técnicas para recorrer quando precisar relacionar tabelas
de dados juntas. O modelo de dados fornece um paradigma para relacionar
tabelas lógicas de dados juntos. Ele introduz alguns comportamentos quando se
trata de mostrar os domínios completos e parciais dos valores dimensionais, mas
também simplifica muito as agregações, levando em conta o nível natural de
detalhe para a agregação. Na camada física, você tem a opção de unir tabelas
físicas.
Como lidar com esse tipo de dado confuso? No capítulo anterior, consideramos
como o modelo de dados do Tableau pode ser usado para relacionar dados em
diferentes tabelas. Consideraremos o Tableau Prep Builder como uma maneira
robusta de limpar e estruturar dados no próximo capítulo. Muitas das informações
deste capítulo serão uma base essencial para trabalhar com o Tableau Prep
Builder.
Por enquanto, vamos nos concentrar em algumas das estruturas de dados básicas
que funcionam bem no Tableau e em algumas das técnicas adicionais que você
pode usar para obter dados nessas estruturas. Manteremos nossa discussão
limitada aos recursos nativos do Tableau neste capítulo, mas muito do que você
aprendeu será aplicado ao Tableau Prep Builder no próximo. Ao final deste
capítulo, você terá uma base sólida de compreensão do que constitui uma boa
estrutura de dados. Saber quais estruturas de dados funcionam bem com o
Tableau é fundamental para entender como você poderá resolver determinados
problemas.
Por exemplo, digamos que você tenha uma tabela de notas de teste com um
registro por sala de aula em uma escola. Dentro do registro, você pode ter três
medidas: o GPA médio para a sala de aula, o número de alunos na classe e o
número de alunos em toda a escola:
Número de
Sala de GPA Número de
Escola Alunos
aula médio Alunos
(Escola)
Pickaway
4ª série 3.78 153 1,038
Elementar
Pickaway
5ª série 3.73 227 1,038
Elementar
Pickaway
6ª série 3.84 227 1,038
Elementar
McCord
4ª série 3.82 94 915
Elementar
McCord
5ª série 3.77 89 915
Elementar
McCord
6ª série 3.84 122 915
Elementar
As duas primeiras medidas (GPA Médio e Número de Alunos) estão no mesmo
nível de detalhamento do registro individual de dados (por sala de aula na
escola). O número de alunos (Escola) está em um nível mais alto de
detalhamento (por escola). Contanto que você esteja ciente disso, você pode fazer
uma análise cuidadosa (ou usar o modelo de dados do Tableau para relacionar
uma tabela de contagem de alunos por escola).
Dados amplos
Dados amplos normalmente não são uma boa estrutura para análise visual no
Tableau.
Dados amplos descrevem uma estrutura na qual uma medida em uma única linha
é espalhada por várias colunas. Esses dados geralmente são mais legíveis por
humanos do que dados altos. Dados amplos geralmente resultam em menos
linhas com mais colunas.
Nome do
1960 1961 1962 1963 1964
país
Afeganistã
8,774,440 8,953,544 9,141,783 9,339,507 9,547,131
o
Notice that the level of detail for this table is a row for every country. However, the
single measure (population) is not stored in a single column. This data is wide
because it has a single measure (population) that is being divided into multiple
columns (a column for each year). The wide table violates the second key to a
good structure since the measure is at a lower level of detail than the individual
record (per country per year, instead of just per country).
Tall data
Tall data is typically a good structure for visual analysis in Tableau.
Tall data describes a structure in which each distinct measure in a row is
contained in a single column. Tall data often results in more rows and fewer
columns.
Consider the following table, which represents the same data as earlier but in a tall
structure:
Country
Year Population
Name
Figure 15.1: The wide data has a measure for every year
As we’d expect, Tableau treats each column in the table as a separate field. The
wide structure of the data works against us. We end up with a separate measure
for each year. If you wanted to plot a line graph of population per year, you would
likely struggle. What dimension represents the date? What single measure can you
use for the population?
This isn’t to say that you can’t use wide data in Tableau. For example, you might
use Measure Names/Measure Values to plot all the Year measures in a single
view, like this:
Figure 15.2: The wide data can still be used but in a complex and limited way
This data source is much easier to work with. There’s only one measure
(Population) and a Year dimension to slice the measure. If you want a line chart of
the population by year, you can simply drag and drop
the Population and Year fields into Columns and Rows. Forecasting, trend lines,
clustering, averages, standard deviations, and other advanced features will all work
in the way you expect them to.
You can see that the resulting visualization is much easier to create in Tableau,
using only three active fields:
Figure 15.4: The view is much easier to create in Tableau with the tall data
Next, we’ll consider another good structure for data that works well with Tableau.
Star schemas
Assuming they are well designed, star schema data models (typically used in data
warehouses or data marts) work very well with Tableau because they have well-
defined granularity, measures, and dimensions. Additionally, if they are
implemented well, they can be extremely efficient to query. This allows for an
ergonomic experience when using live connections in Tableau.
Star schemas are so named because they consist of a single fact table surrounded
by related dimension tables, thus forming a star pattern. Fact tables contain
measures at a meaningful granularity, while dimension tables contain attributes
for various related entities.
The following diagram illustrates a simple star schema with a single fact table
(Hospital Visit) and three dimension tables (Patient, Primary Physician,
and Discharge Details):
Fact tables are joined to the related dimension using what is often called
a surrogate key or foreign key that references a single dimension record. The
fact table defines the level of granularity and contains measures. In this
case, Hospital Visit has a granularity of one record for each visit. In this simple
example, each visit is for one patient who saw one primary physician and was
discharged. The Hospital Visit table explicitly stores a measure of and implicitly
defines another measure of (as the row count).Visit DurationNumber of Visits
Data modeling purists would point out that date values have been stored in the fact
table (and even some of the dimensions). They would, instead, recommend having
a date dimension table with extensive attributes for each date and only a surrogate
(foreign) key stored in the fact table.
The data preview reveals some of the issues resulting from the poor structure:
Since the column headers were not in the first Excel row, Tableau gave the
defaults of F1, F2, and so on to each column
The title World Population Data and the note about sample data were
interpreted as values in the F1 column
The actual column headers are treated as a row of data (the third row)
Felizmente, esses problemas podem ser resolvidos na janela de conexão.
Primeiro, podemos corrigir muitos dos problemas excessivos de cabeçalho
ativando o Interpretador de dados do Tableau, um componente que identifica e
resolve especificamente problemas estruturais comuns em documentos do Excel
ou do Planilhas Google. Quando você marca a opção Usar Interpretador de
Dados (localizada em Planilhas no painel esquerdo), a visualização de dados
revela resultados muito melhores:
Figura 15.8: O Tableau Data Interpreter corrige muitos dos problemas comuns
encontrados em fontes de dados do Excel (e similares)
Nosso passo final é girar as colunas do ano. Isso significa que vamos remodelar
os dados de tal forma que cada país terá uma fila para cada ano. Selecione todas
as colunas do ano clicando na coluna de 1960, rolando para a extrema direita e
mantendo pressionada a tecla Shift enquanto clica na coluna de 2013. Por fim,
use o menu suspenso em qualquer um dos campos de ano e selecione a
opção Pivotar.
O resultado são duas colunas (nomes de campos dinâmicos e valores de
campos dinâmicos) no lugar de todas as colunas de ano. Renomeie as duas
novas colunas para Ano e População. Seu conjunto de dados agora é estreito e
alto, em vez de largo e curto.
Por fim, observe que o ícone na coluna Ano indica que ele é reconhecido pelo
Tableau como um campo de texto. Clicar no ícone permitirá que você altere o tipo
de dados diretamente. Nesse caso, selecionar Data resultará em valores, mas
alterar o tipo de dados para Número (inteiro) fornecerá valores inteiros que
funcionarão bem na maioria dos casos: NULL
Figura 15.11: Você pode alterar os tipos de dados dos campos na página Fonte de
Dados
Sindicatos
Muitas vezes, você pode ter vários arquivos individuais ou tabelas que, juntos,
representam todo o conjunto de dados. Por exemplo, você pode ter um processo
que cria um novo despejo de dados mensal como um novo arquivo de texto em
um determinado diretório. Ou, você pode ter um arquivo do Excel onde os dados
de cada departamento estão contidos em uma planilha separada.
Uma união é uma concatenação de tabelas de dados que reúne linhas de cada
tabela em uma única tabela. Por exemplo, considere as três tabelas de dados a
seguir:
Originais:
Saldo da conta
Nome Ocupação
bancária
Prequelas:
Saldo da conta
Nome Ocupação
bancária
Seqüelas:
Kylo Desempregado $0
Kylo Desempregado $0
Figura 15.13: Você pode criar uniões arrastando e soltando tabelas ou arquivos
diretamente sob tabelas existentes na tela
2. Depois de criar uma união, você pode usar o menu suspenso na tabela no
designer para configurar opções para a união. Como alternativa, você pode
arrastar o objeto New Union da barra lateral esquerda para o designer para
substituir a tabela existente. Isso revelará opções para criar e configurar a
união:
Em uma união, o Tableau fará a correspondência das colunas entre as tabelas por
nome. O que acontece quando as colunas não são as mesmas entre tabelas ou
arquivos? Se você fosse gravar uma consulta em um banco de dados, talvez
esperasse um resultado com falha, pois os nomes de coluna geralmente precisam
corresponder exatamente. No entanto, o Tableau permite unir arquivos ou tabelas
com nomes incompatíveis.
Junta
Você se lembrará de que o conceito de junções e os tipos de junções foram
discutidos anteriormente no Capítulo 14, Noções básicas sobre o modelo de
dados do Tableau, junções e misturas. Embora as junções sejam bastante úteis
para reunir tabelas no mesmo banco de dados ou até mesmo fontes de dados
diferentes (dados contidos em sistemas e formatos diferentes), elas também
podem ser usadas para resolver outros problemas de dados, como remodelar
dados para facilitar o cumprimento de seus objetivos no Tableau.
Você pode trabalhar com o exemplo a seguir na pasta de trabalho, mas a fonte de
dados do banco de dados do servidor é simulada com um arquivo de texto
().Chapter 15Patient Visits.txt
Digamos que você tenha uma tabela em um banco de dados do servidor (como
SQL Server ou Oracle) que contenha uma linha por paciente hospitalar e inclua
a Data de Admissão e a Data de Alta como colunas separadas para cada
paciente:
Embora essa estrutura de dados funcione bem para certos tipos de análises, você
teria dificuldade em usá-la se quisesse visualizar o número de pacientes no
hospital dia a dia para o mês de dezembro.
Por um lado, qual campo de data você usa para o eixo? Mesmo se você girasse a
tabela para ter todas as datas em um campo, descobriria que há lacunas nos
dados. Dados esparsos, ou seja, dados nos quais não existem registros para
determinados valores, são bastante comuns em certas fontes de dados do mundo
real. Especificamente, nesse caso, você tem um único registro para cada data
de Admissão ou Alta, mas nenhum registro para os dias intermediários.
Às vezes, pode ser uma opção para reestruturar os dados na origem, mas se
o banco de dados estiver bloqueado, talvez você não tenha essa opção. Você
também pode usar a capacidade do Tableau de preencher lacunas nos dados
(densificação de dados) para resolver o problema. No entanto, essa solução
pode ser complexa e, potencialmente, frágil ou de difícil manutenção.
Uma alternativa é usar uma associação para criar as linhas para todas as datas.
Nesse caso, aproveitaremos uma junção entre bancos de dados para trazer outra
fonte de dados. Você pode criar rapidamente uma planilha do Excel com uma lista
de datas que deseja ver, da seguinte forma:
Figura 15.16: Um arquivo do Excel contendo apenas uma lista abrangente de
datas
Figura 15.18: Um script de exemplo que pode ser usado para criar um valor no
qual ingressar
Com base no cálculo de junção, nosso novo conjunto de dados cruzados contém
um registro para cada paciente para cada data, e agora podemos criar um cálculo
rápido para ver se um paciente deve ser contado como parte da população
hospitalar em qualquer data. O campo calculado, denominado Pacientes no
Hospital, tem o seguinte código:
IF [Admit Date] <= [Date] AND [Discharge Date] >= [Date]
THEN 1
ELSE 0
END
CopyExplain
Tendo considerado exemplos de pivôs, uniões e junções, vamos voltar nosso foco
para um exemplo do tipo final de grande transformação: a agregação.
Agregação
Lembre-se de que as duas chaves para uma boa estrutura de dados são as
seguintes:
Considere, por exemplo, os seguintes dados (incluídos como no diretório), que nos
dá um único registro a cada mês por apartamento:Apartment Rent.xlsxChapter 15
Figura 15.20: Os dados de aluguel de apartamento, que são mal estruturados
porque a medida de pés quadrados é repetida para todos os meses
Figura 15.21: Uma ilustração de como várias agregações podem estar certas ou
erradas, dependendo do nível de detalhe
Observe que a SOMA (Aluguel Cobrado) faz todo o sentido. Você pode somar o
aluguel cobrado por mês e obter um resultado significativo por apartamento. No
entanto, você não pode obter um resultado significativo por apartamento. Outras
agregações, como média, mínima e máxima, dão os resultados certos por
apartamento.Sum
Figura 15.22: Nenhuma das agregações funciona para nos dar um total geral
Figura 15.24: A expressão LOD nos dá a base para uma complexidade ainda
maior, como o cálculo do aluguel por área
UNION ALL
FROM Countries
UNION ALL
FROM Countries
...
...
CopyExplain
E assim por diante. Pode ser um pouco tedioso de configurar, mas tornará
os dados muito mais fáceis de trabalhar no Tableau! No entanto, muitas
fontes de dados que usam SQL personalizado complexo precisarão ser
extraídas por motivos de desempenho.
Resumo
Até este capítulo, tínhamos analisado dados que eram, em sua maioria, bem
estruturados e fáceis de usar. Neste capítulo, consideramos o que constitui uma
boa estrutura e maneiras de lidar com dados mal estruturados. Uma boa estrutura
consiste em dados que têm um nível significativo de detalhes e que têm medidas
que correspondem a esse nível de detalhe. Quando as medidas estão espalhadas
por várias colunas, obtemos dados que são largos em vez de altos.
Você também tem alguma experiência prática na aplicação de várias técnicas para
lidar com dados que têm a forma errada ou têm medidas no nível errado de
detalhes. O Tableau nos dá o poder e a flexibilidade para lidar com alguns desses
problemas estruturais, mas é muito preferível corrigir uma estrutura de dados na
origem.
No próximo capítulo, faremos uma breve pausa na análise do Tableau Desktop
para considerar o Tableau Prep Builder, outra alternativa para lidar com dados
desafiadores!
Neste capítulo, usaremos o termo Tableau Prep amplamente para falar de toda a
plataforma que o Tableau desenvolveu para preparação de dados e, às vezes,
como abreviação do Tableau Prep Builder, o aplicativo cliente usado para se
conectar a dados, criar fluxos de dados e definir saídas. Quando necessário para
maior clareza, usaremos estes nomes específicos:
Figura 16.1: Tela de boas-vindas do Tableau Prep Builder com numeração para
identificar os principais componentes da interface do usuário
Os seguintes componentes foram numerados na figura 16.1:
1. O menu inclui opções para abrir arquivos, editar e executar fluxos, fazer
login no Tableau Server e várias funções da Ajuda.
Depois de abrir ou iniciar um novo fluxo, a tela inicial será substituída por uma
nova interface, o que facilitará a concepção e execução dos fluxos:
Figura 16.2: Ao projetar um fluxo, você encontrará uma interface como esta. Os
principais componentes são numerados e descritos da seguinte forma:
À medida que você adiciona e conecta várias etapas para atingir suas metas, você
definirá um fluxo de dados e um fluxo de etapas lógicas e ações.
Além de usar o termo fluxo para se referir às etapas e conexões que definem o
fluxo lógico e a transformação dos dados, também usaremos o termo para nos
referir ao arquivo que o Tableau Prep usa para armazenar a definição das etapas
e alterações de um fluxo. Os arquivos de fluxo do Tableau Prep têm a extensão
(fluxo não empacotado) ou (fluxo empacotado). .tfl.tflx
Para acompanhar, abra o Tableau Prep Builder, que será iniciado na tela inicial
(não há um fluxo inicial para este capítulo). Os dados de exemplo estão no
diretório, juntamente com o fluxo, se você quiser verificar seu trabalho. O fluxo
contém uma amostra de como um fluxo pode ser autodocumentado — ele não
corresponderá às capturas de tela com precisão. Chapter 16CompleteComplete
(clean)
Ao abrir o arquivo de fluxo, você provavelmente receberá erros e avisos de que os
caminhos de entrada e de saída não são válidos. Isso é esperado porque sua
máquina quase certamente terá uma estrutura de unidade e diretório diferente
daquela em que os exemplos foram preparados. Você também terá esse
comportamento ao compartilhar arquivos de fluxo com outras pessoas. Para
resolver os problemas, basta trabalhar nas conexões no
painel Conexões (expandido na Figura 16.4) à esquerda para se reconectar aos
arquivos e definir as etapas de saída para os diretórios apropriados em sua
máquina.Complete
Figura 16.4: Você pode fazer uma nova conexão de dados clicando no botão + ou
no botão Conectar a Dados
Figura 16.7: A adição de uma etapa amplia o fluxo. Aqui, adicionar uma etapa
limpa adiciona Limpar 1
6. Com a etapa Limpar 1 selecionada, reserve um momento para explorar os
dados usando o painel de perfil. Observe como a seleção de valores
individuais para campos no painel de perfil realça partes de valores
relacionados para outros campos.
Isso pode lhe dar uma ótima visão sobre seus dados, como ver as
diferentes faixas de preço com base em:TicketType
Com nossas etapas de entrada definidas, vamos considerar como limpar alguns
dos dados para prepará-los para análise.
Limpando os dados
O processo de construção do fluxo é bastante iterativo, e você frequentemente
fará descobertas sobre os dados que o ajudarão a limpá-lo e transformá-lo. Vamos
dividir este exemplo em seções por uma questão de referência, mas não deixe
que isso diminua a ideia de que a construção de um fluxo deve ser um fluxo de
pensamento. O exemplo é para ser perfeito!
Vamos dar uma olhada em algumas possibilidades para preparar os dados nesta
seção, incluindo mesclagem e agrupamento. Vamos começar vendo como unir
ramos no fluxo.
desnecessários
Figura 16.11: Arrastar uma etapa para outra no fluxo revela opções para
reunir os conjuntos de dados no fluxo. Aqui, por exemplo, há opções para
criar um Sindicato ou Aderir
Figura 16.13: Seu fluxo deve ser semelhante a este. Você pode notar
alguma variação no local exato das etapas ou cor (você pode alterar a cor
de uma etapa clicando com o botão direito do mouse em uma etapa e
selecionando Editar cor)
Figura 16.14: Cada valor nulo no campo Companhia aérea vem dos arquivos
Sudoeste. Felizmente, neste caso, a fonte dos dados indica a companhia aérea
O campo foi gerado pelo Tableau Prep como parte do Union 1 para indicar a
origem dos registros. O campo veio apenas dos arquivos do Excel (você pode
confirmar isso selecionando-o no painel de perfil e observando o caminho realçado
do campo no painel de fluxo). Clique no valor nulo para e observe o pincelamento:
esta é a prova de que os valores em todos vêm dos arquivos Sudoeste, uma vez
que esses arquivos não continham um campo para indicar a companhia aérea.
Abordaremos os valores e faremos uma limpeza
adicional:TableNamesAirlineAirlinenullAirlinenull
1. Como podemos ver que todos os valores nulos para Airline vieram dos
arquivos Southwest, sabemos que a companhia aérea é Southwest. Clique
duas vezes no valor nulo e digite para substituir pelo valor que você sabe
que representa a companhia aérea correta. O Tableau Prep indicará que
ocorreu uma operação de grupo e substituição com um ícone de clipe de
papel. SouthwestNULL
Em um cenário do mundo real, gostaríamos de ser um pouco mais
cuidadosos. Mesmo que todos os valores sejam atualmente apenas dos
arquivos da Southwest, podemos obter valores de outras companhias
aéreas no futuro. Um cálculo que verifica explicitamente o valor de Nomes
de Tabela seria uma solução mais robusta. Veremos os cálculos na
próxima seção.NULLNULL
2. We’ll do an additional grouping to clean up the variations of American.
Using the Options button on the field, select Group
Values | Pronunciation: Airline
Figure 16.15: The ellipsis button on a field will reveal a plethora of options,
from cleaning to filtering, to grouping, to creating calculations
Figura 16.18: Aqui, o Tableau Prep sugere filtrar registros com valores
inválidos ou substituir os valores inválidos por nulos. Nesse caso, não
queremos filtrar o registro inteiro, mas os próprios valores inválidos são
inúteis e são melhor representados por null
Figura 16.19: Depois de selecionar dois ou mais valores, você pode agrupá-los
com a opção da barra de ferramentas ou o menu do botão direito do mouse
7. ELSE "Frequently"
8. END
CopyExplain
O código usa o campo em uma construção para criar três segmentos. Você pode
ver visualmente a correspondência entre os campos no painel de
visualização:Trips per PersonIfThenElse
O campo pode ser usado para realizar todos os tipos de análises úteis. Por
exemplo, você pode querer entender se os viajantes frequentes normalmente
obtêm melhores preços de passagens.FrequencySegment
Vimos cálculos de nível de linha e LOD fixo e observamos a opção
de classificação. Vamos agora voltar nossa atenção para as agregações.
Agregações
Figura 16.27: Ao editar o nome de uma etapa, você também pode adicionar
uma descrição mais detalhada para ajudar a documentar a finalidade da
etapa
Estenderemos nosso fluxo nas próximas seções para fornecer dados detalhados.
Os dados detalhados, bem como o arquivo de saída de dados agregados, nos
dão algumas opções interessantes para usar o modelo de dados do Tableau no
Tableau Desktop para realizar algumas análises complexas.
Figura 16.31: Os valores do filtro... permite filtrar valores na etapa de entrada. Isso
pode melhorar o desempenho em grandes conjuntos de dados ou bancos de
dados relacionais
A filtragem também pode ser feita dentro de uma etapa limpa em qualquer lugar
do fluxo. Há várias maneiras de aplicar um filtro:
Figura 16.33: Seu fluxo deve ser semelhante a este (o posicionamento exato e as
cores das etapas podem variar)
Vamos concluir o fluxo do Tableau Prep com algumas transformações finais para
tornar os dados ainda mais fáceis de usar no Tableau.
Figura 16.35: Adicionar a uma etapa que já tem uma saída adiciona uma
nova ramificação ao fluxo
2. Na etapa Limpar 4, use o botão de reticências no campo e
selecione Dividir valores | Divisão automática: Route
3. Rota - Split 1 é a origem e Route - Split 2 é o destino. Clique duas vezes
no nome do campo no painel de perfil (ou use a opção do botão de
reticências) para renomear os campos para e .OriginDestination
4. Localize o arquivo no diretório. Este arquivo contém cada um junto com o e
e :US Airports.hyperChapter 16AirportCodeAirportNameLatitudeLongitude
Figura 16.38: O hiperextrato contém os dados de que precisaremos para
complementar o fluxo com nossos próprios dados geoespaciais
5. Faça uma conexão com esse arquivo no Tableau Prep. Você pode optar
por arrastar e soltar o arquivo na tela do Tableau Prep ou usar
o botão Adicionar conexão na interface. O Tableau inserirá
automaticamente uma etapa de entrada chamada
Extract (Extract.Extract). Sinta-se à vontade para alterar o nome da etapa
de entrada para Códigos de aeroporto:
Observe que o pivô resultou em dados duplicados. O que antes era uma
linha (origem e destino juntos) agora são duas linhas. A contagem de
recordes dobrou, então não podemos mais contar o número de registros
para determinar o número de viagens. Também não podemos o custo de
um bilhete, pois ele contará o dobro do bilhete. Precisaremos usar // ou
algum tipo de expressão ou filtro de nível de detalhe para ver apenas
origens ou destinos. Embora muitas transformações nos permitam atingir
determinados objetivos, temos que estar cientes de que elas podem
introduzir outras complicações.SUMMINMAXAVG
A única informação de localização que temos atualmente em nosso fluxo
principal é o código do aeroporto. No entanto, já fizemos uma conexão e
renomeamos a etapa de entrada Airport Codes.Airports.hyper
11. Localize a etapa de entrada Códigos de Aeroporto e arraste-a sobre a
etapa Pivot. Solte-o na área de Ingresso:
Figura 16.45: A barra de ferramentas permite que você execute o fluxo para
todas as saídas ou uma única saída, enquanto o botão na etapa de saída
só executará o fluxo para essa saída
Depois que o fluxo tiver sido executado, abra a pasta de trabalho no diretório para
ver como os dados podem ser usados e explorá-los por conta própria: Airline
Travel.twb\Learning Tableau\Chapter 16
Figura 16.48: Explorando os dados na pasta de trabalho Airline Travel.twb, que
mostra todos os destinos de voo de Dallas Love Field (DAL) ou Dallas Fort-Worth
(DFW)
Ao contrário dos arquivos, os arquivos podem ser gravados, mesmo que estejam
abertos como uma fonte de dados no Tableau Desktop. Você receberá um erro se
executar um fluxo que tenta substituir um arquivo ou que está em uso. Além disso,
você pode reorganizar a ordem de campo para um arquivo arrastando e soltando
campos no painel de perfil de uma etapa limpa antes da
saída..tde.hyper.csv.tde.hyper.csv
Digamos, por exemplo, que você desejasse criar um parâmetro que indicasse se o
conjunto de dados era dados de teste ou de produção. Dependendo do valor, você
pode alterar aspectos dos dados no fluxo ou até mesmo a saída para um local
diferente.
Depois de clicar em Criar parâmetro, você verá outra janela com todas as opções
para seu novo parâmetro:
Figura 16.50: Criando um novo parâmetro
Aqui, por exemplo, está uma instrução SQL personalizada que é executada após o
fluxo que insere um novo registro contendo um carimbo de data/hora e o
valor Production ou Test em uma tabela:Execution_Log
Figura 16.51: Usando um parâmetro em uma instrução SQL personalizada da
etapa de saída
Você pode criar um fluxo que determina dinamicamente a origem, aplica diferentes
lógicas de filtro e cálculos em todo o fluxo e, em seguida, gera um arquivo
diferente, tudo com base em uma única seleção de se você deseja executar para
teste ou produção. E esse é apenas um de um número ilimitado de exemplos de
como você pode usar parâmetros em seu fluxo!
Com uma boa base de parâmetros no Tableau Prep, vamos concluir considerando
algumas opções para automatizar os fluxos do Tableau Prep.
Resumo
O paradigma inovador do Tableau Prep de limpeza e modelagem prática de dados
com feedback instantâneo amplia muito a plataforma Tableau e oferece um
controle incrível sobre seus dados. Neste capítulo, consideramos a interface geral
e como ela permite que você crie iterativa e rapidamente um fluxo lógico para
limpar e moldar dados para a análise ou visualização desejada.
Por meio de um exemplo detalhado, mas prático, que foi tecido ao longo deste
capítulo, exploramos todas as principais transformações no Tableau Prep, de
entradas a uniões, junções, agregados e pivôs a saídas. Ao longo do caminho,
também examinamos outras transformações e capacidades, incluindo cálculos,
divisões, fusões e agrupamento de valores. Isso fornece uma base para moldar e
moldar dados de qualquer maneira que você precisa.
O Tableau permite que você compartilhe seu trabalho usando vários métodos.
Neste capítulo, vamos dar uma olhada nas várias maneiras de compartilhar
visualizações e painéis, juntamente com o que considerar ao decidir como você
compartilhará seu projeto.
Vamos começar com uma visão geral dos processos de apresentação, impressão
e exportação.
Figura 17.1: Você pode ver estados e círculos selecionados nesta captura de tela.
Opcionalmente, você pode imprimir exibições com seleções
Aqui estão algumas considerações, dicas e sugestões para impressão:
Se você estiver criando várias folhas ou painéis para impressão, considere criar
uma como modelo, configurar todas as configurações de impressão desejadas e
duplicá-la para cada nova planilha.
Figura 17.2: A caixa de diálogo Configurar página contém opções para layout e
dimensionamento de impressão
Considere também criar painéis com imagens e texto para páginas de título,
índice, números de página e comentários. Você pode experimentar pastas de
trabalho completas de capítulos anteriores para ver como vários elementos visuais
são retidos ou alterados na conversão de PDF.
Evite barras de rolagem em painéis, pois elas serão impressas como barras
de rolagem, e qualquer coisa fora da janela visível não será impressa.
Certifique-se de que todas as informações necessárias sejam exibidas e
não estejam ocultas em dicas de ferramentas ou outra interatividade que
não esteja acessível na página impressa.
Considere cuidadosamente as opções de cores, pois as cores produzidas
por uma impressora podem não corresponder exatamente às de uma tela.
Considere usar mais contraste (cores mais escuras e claras) ou menos
cores do que você normalmente poderia para comunicar aspectos
importantes da história de dados.
Você também pode selecionar várias planilhas na pasta de trabalho
(mantenha pressionada a tecla Ctrl enquanto clica em cada guia) e, em
seguida, imprimir apenas as planilhas selecionadas.
As planilhas podem ficar ocultas se forem exibições usadas em um ou mais
painéis ou dicas de ferramentas, ou se forem painéis usados em uma ou mais
histórias. Para ocultar uma vista, clique com o botão direito do rato no separador
ou miniatura na faixa inferior ou no painel esquerdo do dashboard ou da área de
trabalho de matéria e selecione Ocultar Folha. Para mostrar uma planilha,
localize-a no painel esquerdo do painel ou do espaço de trabalho de matéria,
clique nela com o botão direito do mouse e desmarque Ocultar Planilha. Você
também pode clicar com o botão direito do mouse em um painel ou guia de
história e ocultar ou mostrar todas as planilhas usadas.
Se você não vir uma opção Ocultar Planilha, isso significa que essa planilha não
será usada em nenhum painel e poderá ser excluída.
Exportadores
O Tableau também facilita a exportação de imagens de visualizações, painéis e
histórias para uso em documentos, documentação e até livros como este! As
imagens podem ser exportadas como , , ou . Você também pode copiar uma
imagem para a área de transferência para colar em outros aplicativos. Você
também pode exportar os dados como uma tabela de referência cruzada (Excel),
um arquivo ou banco de dados do Microsoft Access (no
Windows)..png.emf.jpg.bmp.csv
Para copiar uma imagem ou exportar imagens ou dados, use as opções de menu
para Planilha, Painel ou Matéria.
Ao interagir com uma exibição no Tableau Server, Online ou Public, você verá
uma barra de ferramentas (a menos que não tenha as permissões necessárias ou
a barra de ferramentas tenha sido especificamente desabilitada por um
administrador do Tableau Server):
Figura 17.3: A exportação da barra de ferramentas fornece uma experiência
semelhante para Servidor, Online e Público
Reader e Desktop são boas opções, mas exigem que outros usuários tenham o
aplicativo instalado. Você também pode considerar o uso do Tableau Server,
Online ou Public para compartilhar e colaborar com um público mais amplo.
Um serviço
baseado em
Um serviço
nuvem
baseado em
mantido pelo
nuvem
Um aplicativo de servidor Tableau
mantido pelo
instalado em um ou mais Software que
Tableau
computadores servidores que hospeda
Descrição Software que
hospeda exibições e painéis exibições e
hospeda
criados com o Tableau painéis criados
exibições e
Desktop. com o Tableau
painéis criados
Desktop ou o
com o Tableau
cliente gratuito
Desktop.
do Tableau
Public.
Custo de
licenciamen Sim Sim Livre
to
Gerenciado e
Gerenciado e
mantido pelo
mantido pela
Tableau
Totalmente mantido, Tableau
Software com
gerenciado e administrado Software. Os
Administraç algumas
pelo indivíduo ou usuários têm
ão opções de
organização que adquiriu a algumas
gerenciamento
licença. opções para
de projetos e
gerenciar seu
usuários pelos
conteúdo.
usuários.
Tableau Tableau
Tableau Server
Cloud Público
O
administrador
do Tableau
Server pode
criar projetos e
Por padrão,
usuários e
O administrador do Tableau qualquer
ajustar
Server pode criar sites, pessoa pode
permissões
projetos e usuários e ajustar baixar e
para cada um.
permissões para cada um. visualizar
O acesso aos
Segurança O acesso aos dados dados; no
dados
subjacentes pode ser restrito entanto, o
subjacentes
e o download da pasta de acesso a essas
pode ser
trabalho ou dos dados pode opções pode
restrito e o
ser restrito. ser restrito
download da
pelo autor.
pasta de
trabalho ou
dos dados
pode ser
restrito.
Com essas opções, saiba que qualquer pessoa no mundo pode ver o que
você publica. Opcionalmente, você pode ocultar visualizações de sua conta
online.
Considere usar o Tableau Public quando quiser compartilhar sua história de dados
com o mundo!
Você deve ter uma conta de usuário com permissões de publicação para um ou
mais projetos. Insira a URL ou o endereço IP do Tableau Server ou da URL do
Tableau Cloud, seu nome de usuário e senha. Uma vez conectado, você será
solicitado a selecionar um site, se você tiver acesso a mais de um.
Finalmente, você verá a tela de publicação:
Figura 17.5: Publicação no Tableau Cloud
Além disso, todos os arquivos externos referenciados por uma pasta de trabalho
(por exemplo, arquivos de imagem e fontes de dados baseadas em arquivo não
extraídos) que não foram incluídos quando a pasta de trabalho foi publicada
devem ser referenciados usando um local acessível pelo Tableau Server (por
exemplo, um caminho de rede com configurações de segurança que permitam o
acesso de leitura do processo do Tableau Server).
Usando o Otimizador de Pasta de Trabalho para maximizar o desempenho no
Servidor ou na Nuvem
Ao publicar inicialmente uma pasta de trabalho no Tableau Server ou no Tableau
Cloud, você terá a opção de executar o Otimizador de pasta de trabalho antes de
publicar (observe o link Otimizador de pasta de trabalho na parte inferior da
janela de publicação na Figura 17.5. Você também pode executar o otimizador a
qualquer momento selecionando Servidor | Execute o Optimizer no menu
principal.
Figure 17.7: The Workbook Optimizer is a great option for increasing the efficiency
of your workbook prior to publishing
Take a moment to review the suggestions and take any actions you feel are
necessary.
The suggestions from the Tableau Workbook Optimizer are just that: suggestions.
They are based on generally accepted best practices but are not always the best
approach. For example, you may have long calculations that are actually quite
efficient. Or you may have more than the generally recommended number of
sheets in a dashboard, but it may be necessary your data story and it may not be
negatively impacting performance. Use the suggested actions as guidance.
Once dashboards and views have been optimized and published to Tableau
Server, you and other users with access will be able to interact with them. We’ll
consider the details next.
For the most part, interacting with a workbook on Server or Online is very similar to
interacting with a workbook in Tableau Desktop or Reader. Quick filters,
parameters, actions, and tooltips all look and behave similarly.
You will find some additional features: the side menu gives you various options
related to managing and navigating Tableau Server. Below that, you’ll find a
breadcrumb trail informing you which workbook and view you are currently viewing.
Now that we’ve explored some of Tableau Server’s interactive capabilities, we’ll
turn our attention to a specific interactive option on Tableau Server: Ask Data.
Figure 17.10: Typing a natural language phrase into Ask Data’s search
As you type, Ask Data will suggest possible fields, contexts, and definitions for
phrases you’ve entered. If your phrase is not understood, you may select one or
more of those suggestions to clarify your search.
Once you’ve completed your phrase, you may click the blue arrow in the search
box to advance to a visual answer, like this:
Figure 17.11: The visual response to the phrase “top 5 states by sales”
Ask Data interprets your phrase and gives you a visualization as a response. You
also have a new text search box that allows you to narrow the focus or context of
your initial query. For example, typing into the text box and clicking the blue search
arrow will add a date filter that limits to the top 5 states in 2022. in 2022
You’ll recall seeing the Ask Data object that can be added to dashboards. This
enables you to embed the power of NLP in your dashboards. The only requirement
is that you must use a data set that has been published to Tableau Server or
Tableau Cloud and also publish the workbook to the same Server or Cloud.
The possibilities of using Ask Data for quick analysis and easy data discovery are
amazing!
Having explored Ask Data, we’ll conclude with a final discussion of some additional
options for sharing using Tableau Server and Tableau Cloud.
Additional distribution options using Tableau Server or Tableau Cloud
Both Tableau Server and Tableau Cloud provide several other options for sharing
your views, dashboards, and data. Along with allowing users to log in to Tableau
Server, you might consider the following options:
Resumo
O Tableau é uma plataforma incrível para explorar, preparar e limpar seus dados à
medida que você cria visualizações e painéis úteis e significativos para entender e
comunicar os principais insights. Ao longo deste livro, consideramos como se
conectar a dados, seja baseado em arquivo, em um banco de dados local ou na
nuvem. Você trabalhou com exemplos de exploração e preparação de dados para
limpá-los e estruturá-los para análise. Abordamos vários tipos de visualização e
como eles podem descobrir insights analíticos profundos. Os quatro principais
tipos de cálculos foram explorados em profundidade, fornecendo as ferramentas
para estender os dados, a análise e a interatividade do usuário. Você criou painéis
e contou histórias com os dados. Neste capítulo, consideramos como compartilhar
os resultados de todo o seu trabalho com outras pessoas.
Agora você tem uma base sólida. Em sua essência, a plataforma Tableau é
intuitiva e fácil de usar. À medida que você mergulha mais fundo, a simplicidade
se torna cada vez mais bonita. À medida que você descobre novas maneiras de
entender seus dados, resolver problemas complexos, fazer novas perguntas e
encontrar novas respostas em seus conjuntos de dados, suas novas habilidades
do Tableau ajudarão você a descobrir, interpretar e compartilhar novos insights
ocultos em seus dados.