Você está na página 1de 6

Short Paper: Uma Ferramenta para Visualização de Dados

Considerando o Contexto do Usuário


Paulo Menezes e Ana Carolina Salgado
CESAR School
Cais do Apolo, 77
Recife – PE – Brazil
phgm@cesar.school, acs@cesar.school
Abstract. The way of data visualization in a data analysis process is
fundamental for the understanding by the user. However, there are users of all
levels of knowledge, with different profiles, in different sectors and each one of
them has different levels of information about the database or about the
application. So, it is utopian to imagine “a visualization that fits all” and at
the same time it is unfeasible to develop a unique data visualization for each
person. Therefore, this work proposed to develop a tool for data visualization
recommendation considering the user's context, data, profile and data
visualization literacy. As a result of this work, a tool for dashboard
recommendation was developed.
Resumo. A forma de visualização de dados em um processo de análise de
dados é fundamental para o entendimento pelo usuário. Porém, existem
usuários de todos os níveis de conhecimento, de perfis diferentes, em setores
diferentes e cada um deles tem diferentes níveis de informação sobre a base de
dados ou sobre a aplicação. Então, é utópico imaginar “uma visualização que
serve para todos” e ao mesmo tempo é inviável desenvolver uma visualização
de dados única para cada pessoa. Diante disso, esse trabalho se propôs a
desenvolver uma ferramenta para recomendação de visualização de dados
considerando o contexto do usuário, seus dados, seu perfil e informações
como o nível de conhecimento em visualização de dados. Como resultado
deste trabalho, foi desenvolvida uma ferramenta para recomendação de
dashboards.

1. Introdução
A visualização de dados é fundamental na análise e na geração de valor sobre os dados.
Uma das ferramentas de visualização de dados muito utilizadas nas indústrias e
organizações são os dashboards [Sarikaya et al. 2019] e iremos centrar nossa atenção
nos mesmos. Apesar de não ter uma definição muito clara, Wexler et al. (2017) definem
dashboards como uma exibição visual de dados usados para monitorar as condições e
facilitar o entendimento do usuário.
Em uma organização existem pessoas de todos os níveis de conhecimento, de
perfis diferentes, em setores diferentes e cada um deles tem diferentes níveis de
informação sobre a base de dados ou sobre o negócio da sua empresa. Então poderia
uma visualização de dados atender todos esses diferentes perfis? A. Vázquez-Ingelmo et
al. (2019) diz que é utópico imaginar “um dashboard que serve para todos” e ao mesmo
tempo é inviável desenvolver visualizações únicas para cada pessoa. Desta forma,
ferramentas como Tableau, PowerBI ou Grafana permitem a criação de visualizações
mais facilmente, mas ainda é uma tarefa complexa e alguns usuários podem não saber
qual é a melhor configuração para cumprir seus objetivos [Padilla 2018].
O objetivo deste trabalho é apresentar uma ferramenta de visualização de dados,
considerando o contexto do usuário. Apresentaremos a contextualização na Seção 2. A
Seção 3 descreve nossa proposta e a Seção 4 apresenta um resumo dos trabalhos
relacionados.

2. Contextualização
Ferramentas de visualização oferecem diversos níveis de expressividade para a
construção de gráficos, elementos visuais, a exemplo dos dashboards. O trabalho do
Sarikaya et al. (2019) propôs uma ontologia para categorizar os dashboards por
objetivos e grupos. Ele criou 4 objetivos com 2 categorias cada, levando em
consideração um levantamento de 80 dashboards em artigos acadêmicos e de empresas.
Outro tópico importante utilizado neste trabalho é o contexto do usuário, que
consiste em qualquer informação relevante que pode ser usada para caracterizar a
situação de um usuário [Yang 2009]. Por exemplo, elementos contextuais importantes
são o local do usuário, com quem ele está e quais recursos estão próximos. Serviços
como Google e Amazon utilizam bastante essa funcionalidade em suas respostas aos
usuários. Neste trabalho, vamos expandir o contexto considerando também informações
que são importantes para a recomendação de um dashboard, como a base de dados do
usuário e seu perfil, com suas preferências, deficiências e conhecimentos.
Sistemas de recomendações, segundo Few (2017), são estratégias de tomada de
decisão para usuários, permitindo obter diversas recomendações em diferentes aspectos.
Por exemplo, em visualização de dados podemos recomendar diferentes visualizações
para o mesmo conjunto de dados.

3. Recomendação de Dashboards
A ferramenta proposta é um sistema de recomendação de dashboards considerando
como contexto: o perfil do usuário, seu nível de conhecimento e informações sobre o
conjunto de dados. Recomendar dashboards não é uma tarefa trivial. Devido a sua alta
complexidade, a recomendação não pode ser simplesmente baseada nos dados dos
usuários como faz o Voyager [Wongsuphasawat et al. 2016], pois a partir desses dados
dezenas de combinações diferentes são possíveis. Por isso, estender a proposta do
trabalho de A. Vázquez-Ingelmo et al. (2019) parece uma opção interessante. Isso
porque, o metamodelo proposto pelos autores detalha uma série de atributos que podem
ser utilizados pelo motor de recomendação para melhorar o resultado desejado. Em
contrapartida, ele não apresenta alguns atributos de várias entidades e, além disso,
utiliza uma abordagem de objetivos e tarefas relativamente complexa.
Então, a primeira contribuição deste trabalho seria um novo metamodelo
apresentado na Figura 1. Nele descrevemos as entidades relevantes para o motor de
recomendação, como o perfil do usuário, suas características, preferências, deficiências
e seus objetivos para o dashboard. Além dessas informações, ele também descreve a
estrutura de saída do algoritmo de recomendação, informando quantas páginas serão
exibidas no dashboard e quais componentes gráficos de cada página.
Figura 1. Metamodelo utilizado para a recomendação de dashboards.

3.1. Arquitetura
A arquitetura da ferramenta para recomendação de dashboards segue conforme a Figura
2, onde o usuário deve preencher informações como: base de dados, tarefas e objetivos,
baseado no metamodelo proposto. O algoritmo de recomendação tem como entrada
essas informações a fim de produzir a especificação de um dashboard. Essa
especificação descreve os gráficos do dashboard informando quais colunas da base
devem ser utilizadas e possíveis agregações. Finalmente, essa especificação é a entrada
de um algoritmo gerador de código que vai ter como resultado o dashboard final para o
usuário. A base de dados do usuário deve ser um data warehouse, modelado segundo o
esquema estrela, carregado a partir de um arquivo no formato CSV. Novos tipos de
dados e formatos de arquivos podem ser implementados em trabalhos futuros.

Figura 2. Arquitetura da ferramenta de recomendação de Dashboards.


3.2. Motor de Recomendação

O motor de recomendação deve, a partir do contexto do usuário, encontrar a melhor


representação para o seu dashboard. Para cumprir seu objetivo uma série de etapas se
torna necessária.
O primeiro passo consiste na filtragem da base de dados para dividir as colunas
do data warehouse entre as colunas ideais para cada eixo dos gráficos. Colunas com
com dados descritivos (datas, textos, locais) ou com poucos valores distintos,
utilizaremos como as Dimensões, enquanto as restantes são as Medidas. Nesta etapa
também excluímos algumas colunas que agregam pouco valor ao dashboard do usuário,
como colunas de identificadores ou nomes dos clientes.
O próximo passo do sistema de recomendação é a combinação de colunas. Por
exemplo, se após a filtragem da base de dados de uma loja virtual tivemos as seguintes
colunas:
1) Dimensões: Data da venda, Categoria do produto, Região do cliente;
2) Medidas: Valor da venda.
Podemos criar as seguintes combinações: Data da venda X Valor da venda,
Categoria do produto X Valor da venda ou Região do cliente X Valor da venda. Dessa
forma, conseguimos representar em um dashboard, os valores das vendas em diversas
dimensões diferentes e o usuário conseguirá explorar e entender melhor as suas vendas.
O contexto do usuário também é relevante nessa combinação, pois caso o usuário tenha
mais conhecimentos em visualização de dados, podemos recomendar criar uma
combinação com 3 colunas, por exemplo: Valor da venda X Categoria do produto X
Região do cliente.
O CompassQL é um motor de recomendação utilizado na ferramenta Voyager
[Wongsuphasawat et al. 2016] e será também utilizado em nossa ferramenta. Ele foi
desenvolvido a partir de estudos em percepção visual, e é capaz de desenhar uma
representação gráfica de acordo com cada combinação de colunas da base de dados.
Esta representação foi definida por sua expressividade e efetividade. Por exemplo, é
mais fácil para o usuário compreender com precisão que suas vendas dobraram de
acordo com o último período ao visualizar um gráfico de barras ao invés de um gráfico
de pizza.
Após criar essas combinações, enviamos elas para o CompassQL que vai
encontrar a melhor representação gráfica para cada uma delas. Por exemplo: Categoria
da venda X Valor da venda deve ser representado em um gráfico de barras, pois
visualizar diferenças nas barras é mais efetivo e preciso do que visualizar as diferenças
nos ângulos de um gráfico de pizza.
Dessa forma, podemos visualizar na Figura 3, um dashboard sugerido pela a
ferramenta proposta, baseado na base de dados do Belgian Infectious Diseases1.

1
Belgian Infectious Disease, disponível em: https://epistat.wiv-isp.be
Figura 3. Resultado da recomendação utilizando a base de dados do Belgian Infectious
Diseases.

4. Trabalhos Relacionados
O trabalho de Wongsuphasawat et al. (2016), consegue, a partir de uma base de dados
informada pelo usuário, desenhar diversos gráficos com diversas combinações diferentes
de colunas, agregações e tipos de gráficos. Essa ferramenta ajuda os analistas no
processo de exploração da base de dados, não necessitando a especificação manual de
cada gráfico, o próprio sistema recomenda as visualizações e os analistas podem filtrar
as colunas e encontrar mais informação no dado que se deseja explorar.
Os seguintes trabalhos utilizam diferentes técnicas para a recomendação de
dashboards com diferentes propósitos. Em Aksu et al. (2019), a recomendação é feita
especificamente para dashboards de KPIs e a solução não pode ser facilmente portada
para outros contextos devido ao seu método de recomendação, que é através de uma
árvore de decisão. O trabalho apresentado por Vázquez-Ingelmo et al. (2020) utiliza
uma técnica que funciona independente do contexto ou da base de dados do usuário
através do metamodelo e da inteligência artificial. Porém, o trabalho não apresenta o
componente principal da recomendação que é o algoritmo de aprendizagem de máquina.
O trabalho de Yalçın et al. (2016) é capaz de recomendar dashboards de uso
geral independente da base de dados do usuário, porém ele utiliza arquivos de
configurações onde é necessário especificar quais as colunas da base de dados que
desejam utilizar no dashboard, deixando a cargo do usuário a escolha das colunas e
como elas se relacionam.
Desta forma, o trabalho proposto tem como diferencial o desenvolvimento de
uma ferramenta de recomendação de dashboard de propósito geral onde o usuário
precisa preencher apenas seus requisitos em alto nível, sem a necessidade de especificar
quais gráficos devem ser exibidos ou quais colunas devem ser utilizadas.

5. Conclusão
A criação de dashboards é um tópico de interesse na indústria e deve ser cada vez mais
estudado na academia. Métodos para a recomendação ou melhores práticas de
desenvolvimento são tópicos que ainda devem ser bastante estudados. Este trabalho tem
como objetivo propor um novo método de recomendação onde o usuário consiga criar o
seu dashboard com o menor custo possível. A ferramenta implementada, apesar de
ainda estar em fase inicial, já se mostrou eficiente em alguns dos casos testados.
Pesquisas com usuários serão realizadas para aperfeiçoá-la cada vez mais e obter uma
recomendação mais efetiva. Além disso, poderemos também adicionar novos tipos de
gráficos e novas opções relacionadas ao contexto do usuário.

6. Referências
Aksu, Ü., del-Río-Ortega, A., Resinas, M., & Reijers, H. A. (2019). An approach for the
automated generation of engaging dashboards. In On the Move to Meaningful Internet
Systems: OTM 2019 Conferences, pages 363–384, Cham. Springer International
Publishing.
Few, S. (2017). There’s nothing more about semantics, 13 dez. 2017. Disponível em:
https://www.perceptualedge.com/blog/?p=2793. Acesso em: 17 jul. 2021.
Padilla, L. (2018). How do we know when a visualization is good? perspectives from a
cognitive scientist, 4 dez. 2018. Disponível em:
https://medium.com/multiple-views-visualization-research-explained/how-do-we-know-
when-a-visualization-is-good-c894b5194b62. Acesso em: 17 jul. 2021.
Sarikaya, A., Correll, M., Bartram, L., Tory, M., and Fisher, D. (2019). What do we talk
about when we talk about dashboards? IEEE Transactions on Visualization and
Computer Graphics, 25(1):682–692.
Vázquez-Ingelmo, A., García-Peñalvo, F. J., and Therón, R. (2019). Information
dashboards and tailoring capabilities - a systematic literature review. IEEE Access,
7:109673– 109688.
Vázquez-Ingelmo, A., García-Peñalvo, F., Therón, R., and Conde-González, M. (2020).
Representing data visualization goals and tasks through meta-modeling to tailor infor-
mation dashboards. Applied Sciences, 10.
Wexler, S., Shaffer, J., and Cotgreave, A. (2017). The Big Book of Dashboards: Visuali-
zing Your Data Using Real-World Business Scenarios. Wiley Publishing, 1st edition.
Wongsuphasawat, K., Moritz, D., Anand, A., Mackinlay, J., Howe, B., and Heer, J.
(2016). Voyager: Exploratory analysis via faceted browsing of visualization recom-
mendations. IEEE Transactions on Visualization and Computer Graphics, 22:649– 658.
Yalçın, M. A., Elmqvist, N., and Bederson, B. (2016). Keshif : Out-of-the-box
visual and interactive data exploration environment.
Yang, Y. (2009). Personalized Redirection of Communication and Data. In I. Khalil
(Eds.), Handbook of Research on Mobile Multimedia, Second Edition (pp. 902-915).
IGI Global. http://doi:10.4018/978-1-60566-046-2.ch062

Você também pode gostar