Você está na página 1de 84

UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL

INSTITUTO DE INFORMTICA
PROGRAMA DE PS-GRADUAO EM COMPUTAO
CTIA SOUZA DO NASCIMENTO
PANDORA - Uma Ferramenta para
Visualizao Incremental e Anlise de
Redes Sociais Acadmicas
Dissertao apresentada como requisito parcial
para a obteno do grau de
Mestre em Cincia da Computao
Profa. Dra. Carla Dal Sasso Freitas
Orientadora
Profa. Dra. Renata de Matos Galante
Co-orientadora
Porto Alegre, maro de 2013
CIP CATALOGAO NA PUBLICAO
Nascimento, Ctia Souza do
PANDORA - Uma Ferramenta para Visualizao Incremental
e Anlise de Redes Sociais Acadmicas / Ctia Souza do Nasci-
mento. Porto Alegre: PPGC da UFRGS, 2013.
84 f.: il.
Dissertao (mestrado) Universidade Federal do Rio Grande
do Sul. Programa de Ps-Graduao em Computao, Porto Ale-
gre, BRRS, 2013. Orientadora: Carla Dal Sasso Freitas; Co-
orientadora: Renata de Matos Galante.
1. Redes Sociais. 2. Visualizao Interativa. 3. Anlises de
Mtricas de Redes Sociais. I. Freitas, Carla Dal Sasso. II. Ga-
lante, Renata de Matos. III. Ttulo.
UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL
Reitor: Prof. Carlos Alexandre Netto
Pr-Reitor de Coordenao Acadmica: Prof. Rui Vicente Oppermann
Pr-Reitora de Ps-Graduao: Prof. Vladimir Pinheiro do Nascimento
Diretor do Instituto de Informtica: Prof. Lus da Cunha Lamb
Coordenador do PPGC: Prof. Luigi Carro
Bibliotecria-chefe do Instituto de Informtica: Beatriz Regina Bastos Haro
2
O degrau de uma escada no serve simplesmente para que algum
permanea em cima dele, destina-se a sustentar o p de um homem
pelo tempo suciente para que ele coloque o outro um pouco mais alto.
SR THOMAS HUXLEY
3
AGRADECIMENTOS
A caminhada at aqui foi longa, mas, enm, consegui alcanar meu objetivo. Muito tenho a
agradecer a todos que me ajudaram nessa jornada. Em primeiro lugar, a Deus, por ter me dado
foras para continuar trabalhando mesmo diante das adversidades. Agradeo minha famlia,
meus pais e minhas irms que, mesmo distantes, me deram apoio total em todos os momentos
que passei. Agradeo a Lucas por ter me acompanhado em toda minha trajetria. Aos meus
amigos que esto longe, mas que sempre estiveram perto em pensamento. Tambm agradeo s
minhas orientadoras Carla Dal Sasso e Renata Galante por terem me acolhido como orientanda em
um momento complicado e por terem me dado a oportunidade de continuar trabalhando aqui na
UFRGS. Por m agradeo a todos que aqui me deram apoio, principalmente aos professores que
agregaram conhecimentos minha vida.
SUMRIO
LISTA DE FIGURAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
LISTA DE TABELAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
RESUMO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
ABSTRACT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1 INTRODUO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.1 Motivao, Objetivo e Contribuio . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.2 Organizao do Texto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2 FUNDAMENTAO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.1 Mtricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.1.1 Grau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.1.2 Distncia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.1.3 Excentricidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.1.4 Centralidade de Grau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.1.5 Centralidade de Closeness (Proximidade) . . . . . . . . . . . . . . . . . . . . . . 19
2.1.6 Centralidade de Betweenness (Intermediao) . . . . . . . . . . . . . . . . . . . . 20
2.1.7 Coeciente de Clustering (Agrupamento) . . . . . . . . . . . . . . . . . . . . . . 21
2.1.8 Densidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.1.9 Coeciente de Colaborao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.1.10 Dimetro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.1.11 Assortatividade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.2 Consideraes Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3 TRABALHOS RELACIONADOS . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3.1 Anlises de Redes Sociais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3.2 Ferramentas de Visualizao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
REFERNCIAS REFERNCIAS
3.2.1 COMMETRIX . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.2.2 COSBILab Graph . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.2.3 SocialAction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.2.4 SocialNetSense . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.2.5 ArnetMiner . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.2.6 igraph . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.2.7 Pajek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.2.8 UCINET . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.2.9 NodeXL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.2.10 Estudo Comparativo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4 DESCRIO DA FERRAMENTA . . . . . . . . . . . . . . . . . . . . . . . . . . 50
4.1 Viso Geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
4.1.1 Visualizao de Grafos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
4.1.2 Gerao de Grcos para Anlises de Dados . . . . . . . . . . . . . . . . . . . . . 54
4.2 Implementao de PANDORA . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.2.1 Funcionalidades de PANDORA . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
4.2.2 Limitaes de PANDORA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.3 Consideraes Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
5 ESTUDOS DE CASO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
5.1 Estudo de Caso I - Grupos dentro do PPGC . . . . . . . . . . . . . . . . . . . . . 69
5.2 Estudo de Caso II - Pesquisadores Individuais PPGC . . . . . . . . . . . . . . . . 74
5.3 Estudo de Caso III - Grupo Completo PPGC 2004 a 2011 . . . . . . . . . . . . . 75
6 CONCLUSO E TRABALHOS FUTUROS . . . . . . . . . . . . . . . . . . . . . 80
REFERNCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
6
LISTA DE FIGURAS
2.1 Grafo correspondente rede de coautoria do grupo de Computao Grca da
UFRGS e seus colaboradores no ano de 2008. . . . . . . . . . . . . . . . . . . 16
2.2 Distncias entre ns e dimetro do grafo . . . . . . . . . . . . . . . . . . . . . 18
2.3 Um dos possveis caminhos para representar o dimetro do grafo. . . . . . . . 23
3.1 Interface da ferramenta COMMETRIX . . . . . . . . . . . . . . . . . . . . . 28
3.2 Mtricas geradas pela COMMETRIX: (a) Mtricas gerais da rede e (b) Mtri-
cas de um n especco . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.3 Interface da ferramenta COSBILab Graph . . . . . . . . . . . . . . . . . . . . 30
3.4 Caractersticas bsicas das estruturas em COSBILab Graph . . . . . . . . . . . 31
3.5 SocialAction: Mudana de rtulos dos ns de acordo com as mtricas de an-
lise de redes sociais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.6 Grafo mostrando dois grupos de senadores americanos e a freqncia de vota-
o em conjunto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.7 Grcos gerados com a SocialAction que permitem que o usurio compare
duas mtricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.8 Esquema proposto para o framework SocialNetSense . . . . . . . . . . . . . . 34
3.9 Representao visual do SocialNetSense . . . . . . . . . . . . . . . . . . . . . 35
3.10 Interface do RBS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.11 Grafo de coautoria gerado pela ArnetMiner formado por dois pesquisadores
escolhidos e com seus colaboradores . . . . . . . . . . . . . . . . . . . . . . . 37
3.12 Interface da ferramenta online ArnetMiner . . . . . . . . . . . . . . . . . . . 38
3.13 Interface criada utilizando a linguagem R que possui suporte para a biblioteca
igraph . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.14 Interface inicial da ferramenta Pajek . . . . . . . . . . . . . . . . . . . . . . . 40
3.15 Um grafo gerado usando a Pajek . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.16 Interface da ferramenta UCINET . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.17 Exemplo de arquivo FreemanDegree, um dos arquivos de sada gerado UCINET 43
LISTA DE FIGURAS LISTA DE FIGURAS
3.18 Grafo criado com o NetDraw . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.19 Grafos gerados com o nodexl: (a) Grafo Completo e (b) Grafo Filtrado . . . . 44
3.20 Criao de uma restrio para gerar grupo de ns de acordo com seus atributos 45
4.1 Viso geral da proposta de PANDORA: o usurio entra com um arquivo XML,
contendo a produo bibliogrca, que usado pelo sistema para gerar uma
visualizao de grafo, bem como dados analticos sobre este grafo. A seta em
azul indica interao entre o usurio e o sistema. . . . . . . . . . . . . . . . . 51
4.2 Esquema do uxo de execuo da aplicao. O uxo superior representa a
abordagem de visualizao do grafo completo, em que a aplicao recebe um
arquivo XML com todos os pesquisadores, para em seguida gerar um grafo
completo juntamente com grcos e planilhas. O uxo inferior representa
a abordagem incremental em que um pesquisador escolhido pelo usurio;
a aplicao recebe vrios arquivos XML e cria um grafo utilizando o XML
referente ao pesquisador escolhido pelo usurio, juntamente com planilhas e
grcos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
4.3 Esquema da abordagem incremental: ao clicar em um n qualquer, o grafo
expandido caso o pesquisador tenha colaboradores que no estejam visveis
ainda. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
4.4 Representao dos mdulos de PANDORA incluindo interao com o usurio. 55
4.5 Arquivo XML da pesquisadora Carla Freitas no ano 2008. . . . . . . . . . . . 57
4.6 Trechos do arquivo de entrada utilizado na aplicao. . . . . . . . . . . . . . . 58
4.7 Exemplo de grafo completo mostrado ao usurio. . . . . . . . . . . . . . . . . 59
4.8 Coloraes que representam as diferentes categorias para os pesquisadores.
Na ordem das imagens: Discente, Docente e Participante Externo. . . . . . . . 59
4.9 Relao Grau x Quantidade de Publicaes correspondente ao grafo completo. 61
4.10 Grco Assortatividade (Grau x Mdia dos graus dos colaboradores) para da-
dos de um grafo completo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
4.11 Visualizao gerada depois do usurio selecionar um pesquisador especco
no grafo em exibio no momento. . . . . . . . . . . . . . . . . . . . . . . . . 62
4.12 Grafo de artigos aps algumas expanses no grafo de Coautoria. . . . . . . . . 63
4.13 Coeciente de Colaborao calculado sobre os dados que se referem aos pes-
quisadores representados no grafo visualizado. . . . . . . . . . . . . . . . . . 64
5.1 Grafo de artigos do grupo de Sistemas da Informao no trinio de 2007 a 2009. 71
5.2 Grafo de artigos do grupo de Computao Grca no trinio de 2004 a 2006. . 71
5.3 Grafo de artigos do grupo de Sistemas Embarcados no trinio de 2007 a 2009. 72
5.4 Evoluo dos grafos de colaboraes nos anos de 2004 a 2011 do grupo de
Sistemas de Informao. Legenda: A - trinio de 2004 a 2006, B - trinio de
2007 a 2009 e C - trinio incompleto contendo 2010 e 2011. . . . . . . . . . . 72
8
LISTA DE FIGURAS LISTA DE FIGURAS
5.5 Evoluo nos grafos de colaborao entre os anos de 2004 a 2011 para o grupo
de Sistemas de Informao. Legenda: A - trinio de 2004 a 2006, B - trinio
de 2007 a 2009 e C - trinio incompleto contendo 2010 e 2011. . . . . . . . . 73
5.6 Grcos de barras com mtricas para cada um dos pesquisadores escolhidos. . 76
5.7 Grcos das mtricas referentes aos anos 2004 a 2010. . . . . . . . . . . . . . 77
5.8 Grco Grau X Quantidade de Publicaes para o PPGC no ano de 2011. . . . 79
5.9 Grco de Assortatividade do ano de 2011 para todo o PPGC. . . . . . . . . . 79
9
LISTA DE TABELAS
3.1 Tabela com caractersticas de visualizao e interatividade. . . . . . . . . . . . 48
3.2 Tabela com resumo das mtricas calculadas por cada ferramenta. . . . . . . . . 49
4.1 Tabela com caractersticas de visualizao e interatividade com acrscimo de
PANDORA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
4.2 Tabela com resumo das mtricas calculadas por cada ferramenta acrescido de
PANDORA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
5.1 Coecientes de Colaborao dos grupos em cada trinio. . . . . . . . . . . . . 70
5.2 Mtricas dos pesquisadores individuais escolhidos. . . . . . . . . . . . . . . . 74
RESUMO
A anlise de redes sociais atravs de ferramentas visuais permite ao usurio extrair informaes
importantes sobre os indivduos e seus relacionamentos. Atravs dela possvel entender de que
forma os grupos se organizam. Para o caso de redes de coautoria, algumas concluses como qual
o pesquisador com maior prestgio na rede ou qual pesquisador tem o perl mais parecido com o
seu podem ser obtidas.
Uma grande quantidade de ferramentas tm sido desenvolvidas para visualizao de redes so-
ciais. Algumas delas permitem que anlises sejam feitas sobre os dados que compem as re-
des, porm a maioria no mostra os resultados dessas anlises sobre o prprio grafo, em geral
apresentando-as como informaes textuais.
Neste trabalho, inicialmente, foi feito um estudo comparativo de diversas ferramentas visuais
que alm de mostrar redes sociais de forma grca, fazem algum tipo de anlise sobre a rede. O
estudo subsidiou o desenvolvimento de Pandora, uma ferramenta que permite visualizao incre-
mental de redes acadmicas alm de interao com o grafo e clculo de algumas mtricas, como
centralidades, assortatividade e coeciente de colaborao.
Palavras-chave: Redes Sociais, Visualizao Interativa, Anlises de Mtricas de Redes Sociais.
ABSTRACT
The analysis of social networks through visual tools allows to extract important information
about each individual and their relationships. Through it we can understand how groups are or-
ganized. For the case of co-authorship networks, some conclusions about which researcher has
greater prestige in the network or where the researcher has prole more like his can be obtained.
A lot of tools have been developed for visualizing social networks. Some of them allow ana-
lyzes are made about the data that make up the networks, but most do not show the results of these
analyzes on the graph itself, usually presenting them as textual information.
This work was initially done a comparative study of various visual tools that show beyond
social networks graphically. This tools generally do some kind of analysis on the network. In
this work Pandora was developed, a visualization tool that allows incremental academic networks
and interaction with the graph and calculate some metrics, such as centralities, assortativity and
collaboration coefcient.
Keywords: Social Networks, Interactive Visualization, Metrics of Analysis.
13
1 INTRODUO
A crescente disponibilidade de ferramentas na Web, que possibilitam a troca de um volume
tambm crescente de informaes entre pessoas ou organizaes, est tambm permitindo que
cientistas analisem em larga escala as maneiras pelas quais as conexes entre as pessoas so esta-
belecidas e como as chamadas redes sociais evoluem ao longo do tempo. H muitos anos, pesqui-
sadores de cincias sociais estudam essas redes buscando compreender as estruturas que se formam
e os diferentes papis que surgem (WASSERMAN; FAUST, 1994), contribuindo para um melhor
entendimento das relaes nessas redes.
De forma simplicada, pode-se dizer que uma rede social um conjunto de indivduos com co-
nexes entre eles que dependem dos relacionamentos existentes. Computacionalmente, toda rede
pode ser representada como um grafo no qual os ns esto interligados por uma ou mais arestas (re-
lacionamentos). Recentemente, redes sociais se tornaram bastante populares, em especial, com o
grande crescimento dos sites de relacionamentos disponveis na Internet, como: Orkut, Facebook,
Twitter e MySpace.
A necessidade de representar visualmente redes sociais existe h muitos anos (FREEMAN,
2009; NORTHWAY, 1952), pois permite, atravs de uma maneira natural, expressar a conectivi-
dade e facilitar a identicao de padres na rede. Nesse sentido, a visualizao e a anlise das
redes sociais vem atraindo grande interesse tanto na rea de anlise de dados quanto na de visuali-
zao de informaes. Esse interesse motivado, tambm, pela dimenso que essas redes podem
atingir, o que introduz problemas interessantes de pesquisa.
Uma das formas de contornar a diculdade em lidar com redes de grandes dimenses atravs
de mecanismos de interao, que surgem como um interessante aliado para auxiliar o usurio a
entender e analisar o grafo, bem como formar o mapa mental da rede social de forma mais clara e
objetiva. As principais tcnicas de visualizao de redes incluem diversos recursos como: busca,
zoom, ltros e manipulao direta do tipo arrastar e soltar, dentre outros (HERMAN; MELAN-
CON; MARSHALL, 2000).
Um aspecto importante na anlise de redes sociais apoiada por visualizao a possibilidade
de expandir a rede medida que os relacionamentos de seus indivduos so explorados. Existem
algumas operaes de conjunto que podem ser aplicadas sobre grafos, como, por exemplo, unio,
14
composio, soma, produto cartesiano, entre outras (NASCIMENTO et al., 2011). Considerando
um grafo que representa uma rede de colaborao cientca, a operao de unio, por exemplo,
equivale a unir uma rede, que esteja sendo visualizada, com outras redes obtidas a partir de ns
da rede atual. Esse tipo de visualizao permite construir anlises sobre um tema, navegando
gradualmente pelos diversos relacionamentos de coautoria.
Este trabalho foca em redes sociais de colaborao cientca, em especial redes de coautoria,
as quais representam as interaes no meio acadmico. Em redes de coautoria, os ns so os pes-
quisadores enquanto suas publicaes so representadas pelas ligaes, ou arestas, entre os ns que
representam os autores de uma publicao. No desenvolvimento deste trabalho, as redes sociais
de colaborao cientca so utilizadas como fontes de dados para experimentos e avaliao de
resultados. Cabe ressaltar que, embora a estrutura dessas redes possa ser extremamente complexa
(HERMAN; MELANCON; MARSHALL, 2000), analis-las permite identicar os diversos tipos
de conexes existentes entre as pessoas dentro e fora de suas instituies, permitindo o planeja-
mento de novas cooperaes que podem causar impacto direto na qualidade da produo cientca
de indivduos.
1.1 Motivao, Objetivo e Contribuio
Ao estudar algumas ferramentas de visualizao e anlises de redes sociais, notou-se um decit
nessas ferramentas. Percebeu-se que existem muitos trabalhos analisam o desempenho de grupos
de ps-graduao espalhados no Brasil, porm muitos deles fazem apenas anlises numricas e
outros utilizam ferramentas que servem para uso geral em rede sociais ou grafos em geral, no
sendo especcos para redes acadmicas. Com isso, algumas mtricas de redes acadmicas deixam
de ser calculadas automaticamente. Alm disso, as ferramentas utilizadas na maioria das vezes
possuem visualizao simplicada sem muita interao, at por se tratarem de ferramentas que
foram desenvolvidas h muito tempo sem muitos recursos visuais, e que deixaram de ser mantidas
e evoludas com o passar dos anos.
O objetivo do presente trabalho a proposta de uma ferramenta de visualizao e anlise de
redes de coautoria. Sendo que as principais contribuies desse trabalho dizemrespeito a visualiza-
o interativa e de forma gradual de grafos e ao clculo de mtricas (centralidades, assortatividade,
quantidade de publicaes, etc) sobre grafos de forma que um usurio do sistema possa analisar
o comportamento de uma rede de coautoria, sendo que essas anlises possam ser feitas de forma
gradual (em subredes) ou para um grafo completo. Para os estudos de caso, foram utilizados dados
provenientes dos relatrio CAPES que foram gerados dos anos de 2004 a 2011 para o PPGC da
UFRGS.
15
1.2 Organizao do Texto
O texto est organizado como segue. No Captulo 2 apresentam-se as descries das mtricas
estudadas para o desenvolvimento do trabalho com o auxlio de um exemplo de grafo que repre-
senta o grupo de computao grca da UFRGS no ano de 2008. No Captulo 3 feita a reviso de
trabalhos correlatos tanto de anlises de redes sociais quanto de visualizao de redes. No Captulo
4 detalhada a aplicao que foi implementada para validar a idia proposta. No Captulo 5 so
mostrados os estudos de caso que foram utilizados. Por m, o Captulo 6 apresenta a concluso e
discute as sugestes de trabalhos futuros alm da concluso do trabalho.
16
2 FUNDAMENTAO
Nesse captulo so apresentadas as denies bsicas que fundamentam teoricamente este tra-
balho. Assim, a Seo 2 conceitua as principais mtricas utilizadas nos trabalhos relacionados
a redes sociais representadas a partir de grafos. Na Seo 2.2 feito o fechamento do captulo
relacionando-o s contribuies deste trabalho.
Figura 2.1: Grafo correspondente rede de coautoria do grupo de Computao Grca da UFRGS
e seus colaboradores no ano de 2008.
17
2.1 Mtricas
Para esse trabalho as mtricas mais empregadas na construo de ferramentas de anlise de
redes sociais foram selecionadas, estudadas, sendo apresentadas a seguir. Foram tomados como
base para esses conceitos os trabalhos de Wasserman e Faust, Freeman e Jamakovic e Uhlig (WAS-
SERMAN; FAUST, 1994; FREEMAN, 1979; JAMAKOVIC; UHLIG, 2008).
Para auxiliar a compreenso das denies, um pequeno grupo de pesquisadores foi selecio-
nado, sendo gerada uma rede social de coautoria. Cada mtrica ser exemplicada neste captulo
aplicada sobre essa rede social gerada. Os dados so reais e referem-se ao ano de 2008, envol-
vendo os seguintes pesquisadores: Carla Freitas, Luciana Nedel, Joo Comba, Manoel Oliveira,
Jacob Sharcanski, integrantes do grupo de Computao Grca da UFRGS no ano de 2008, e so
representados no grafo pelos rtulos: FREITAS, C.M.D.S., COMBA, J.L.D., OLIVEIRA, Manuel
M. e SCHARCANSKI, J., respectivamente. importante ressaltar que os dados incluem os cola-
boradores desses pesquisadores tambm. O grafo correspondente a esse grupo pode ser visto na
Figura 2.1, tendo sido gerado utilizando a ferramenta implementada nesse trabalho com o objetivo
de ilustrar a rede de colaborao.
2.1.1 Grau
O grau do n representa a quantidade de ns que esto interligados a ele, podendo variar de
zero (quando o n chamado de isolado) at n-1, onde n denota a quantidade total de ns no
grafo. O grau do n mostra a atividade do n no grafo. Calculando-se essa mtrica para os
pesquisadores integrantes do grupo de Computao Grca apresentados no grafo da Figura 2.1,
tm-se os seguintes valores:
g(Carla) = 22
g(Luciana) = 27
g(Joo) = 15
g(Manoel) = 11
g(Jacob) = 3
Do ponto de vista da semntica da rede, os valores indicam que a pesquisadora Luciana a que
tem maior nmero de colaboradores dentro do grupo e o pesquisador Jacob tem menor nmero de
colaboradores.
2.1.2 Distncia
A distncia geodsica, ou simplesmente distncia, mede o nmero de saltos para chegar de
um n a outro no grafo. A distncia pode ser denida tambm como o menor caminho entre dois
ns. Se no for possvel alcanar um n a partir de outro, no caso de existirem duas componentes
desconexas, ento a distncia entre eles os ns tende ao innito.
Dado um grafo G, a distncia entre os ns n
1
e n
2
(d
12
) igual distncia entre n
2
e n
1
(d
21
).
Um exemplo do clculo das distncias entre os ns no grafo pode ser visto na Figura 2.2.
18
Figura 2.2: Distncias entre ns e dimetro do grafo (WASSERMAN; FAUST, 1994).
Aplicando o conceito de distncia ao grafo mostrado na Figura 2.1, apenas aos pares que envol-
vem os professores integrantes do grupo de Computao Grca sem envolver seus colaboradores
so encontrados os seguintes valores:
d(Carla, Luciana) = 1
d(Carla, Joo) = 2
d(Carla, Manoel) = 2
d(Carla, Jacob) = 3
d(Luciana, Joo) = 1
d(Luciana, Manoel) = 1
d(Luciana, Jacob) = 2
d(Joo, Manoel) = 2
d(Joo, Jacob) = 1
d(Manoel, Jacob) = 3
2.1.3 Excentricidade
A excentricidade de um n representa a maior distncia geodsica entre um n e todos os outros
ns do grafo. Tomando-se como exemplo a Figura 2.1, para calcular a excentricidade de cada n na
rede, deve-se calcular a distncia deste n a todos os outros ns do grafo. Desta forma, os valores
encontrados para excentricidade dos ns representantes dos integrantes do grupo de Computao
Grca so:
e(Carla) = 4
19
e(Luciana) = 3
e(Joo) = 3
e(Manoel) = 4
e(Jacob) = 4
Assim, possvel perceber que os pesquisadores Luciana e Joo esto mais prximos de todos
os ns do grafo do que os outros 3 pesquisadores. Para Luciana, por exemplo, a maior quantidade
de saltos necessrios para alcanar um n qualquer no grafo partindo do n que a representa
3. Quanto menor a Excentricidade de um n, melhor o seu relacionamento com os outros ns
do grafo. Isto signica que quanto mais relacionamentos diretos o n possui no grafo, menor a
necessidade de ns intermediadores entre ele e os outros ns.
A excentricidade de cada n pode ser visualizada facilmente usando o leiaute radial, colocando
o n desejado no centro e contando quantos nveis o grafo possui naquela visualizao.
2.1.4 Centralidade de Grau
A centralidade de grau a forma mais simples de medir a importncia de um n no grafo e
tem o mesmo valor numrico do grau do n, ou seja, conta-se a quantidade de ns ligados ao
n no grafo. Assim, possvel medir o nvel de atividade de um determinado n, no sentido de
que ele tem mais relacionamentos com outros ns. Para o exemplo da Figura 2.1, calculando as
centralidades de grau para cada um dos ns pertencentes ao grupo tomado como exemplo, tem-se:
cg(Carla) = 0,43
cg(Luciana) = 0,53
cg(Joo) = 0,29
cg(Manoel) = 0,22
cg(Jacob) = 0,06
Esses valores esto normalizados pois alguns autores normalizam o valor do grau dividindo
pela quantidade de ns na rede, ou seja, o mximo possvel de ligaes para um n, para poder
comparar os ns entre si, assim essa mtrica diferencia-se do grau do n. A normalizao feita
dividindo o grau do n pela quantidade de ns do grafo menos 1, pois esse o mximo de ligaes
possveis para um n. Para o grafo de exemplo usado neste trabalho, a quantidade de ns 52.
Assim, o pesquisador com maior centralidade de grau no grupo Luciana e Jacob o menor. Ou
seja, Luciana tem mais possibilidades de publicar com pesquisadores diferentes do que Jacob.
2.1.5 Centralidade de Closeness (Proximidade)
Esta mtrica revela o quo prximo um n est de todos os outros. Para o clculo dessa mtrica,
so somadas todas as distncias geodsicas entre o n e os outros ns do grafo. Em seguida,
calculado o inverso deste valor, j que quanto mais distante o n estiver de outro n, menor ser a
proximidade.
20
A frmula utilizada para o clculo da centralidade de proximidade de um n n
i
a seguinte:
C
p
(n
i
) = (
n

j=1
d(n
i
, n
j
))
1
, (2.1)
onde n representa a quantidade de ns e n
j
um n qualquer no conjunto de ns, exceto n
i
. Para
normalizar o valor, autores sugerem que o valor de C
p
(n
i
) seja multiplicado por (n-1) (WASSER-
MAN; FAUST, 1994).
Calculando a centralidade de proximidade para cada um dos pesquisadores do grupo de Com-
putao Grca, os valores aproximados obtidos so:
cp(Carla) = 0,51
cp(Luciana) = 0,67
cp(Joo) = 0,52
cp(Manoel) = 0,47
cp(Jacob) = 0,35
Assim, Luciana mostra-se mais prxima dos outros ns do grafo do que os outros calculados,
isso signica que ela atravs do n representado por ela possvel alcanar os outros ns do grafo
de forma mais rpida. Em teoria, seria mais fcil para ela colaborar com mais pesquisadores que
esto em outros nveis no grafo, uma vez que ela teria mais anidade com os outros ns em relao
s colaboraes em comum.
2.1.6 Centralidade de Betweenness (Intermediao)
A centralidade de um n mede a importncia deste n para o grafo, a partir da quantidade
de caminhos mnimos entre os outros ns que passam por este n. Assim, calcula-se todos os
caminhos geodsicos entre os pares de ns nos quais o n, ao qual se est calculando a mtrica,
est incluso. A frmula utilizada para o clculo da centralidade de intermediao de um n n a
seguinte:
C
i
(n
i
) = (

j<k
d
j
k(n
i
)
d
j
k
)
1
, (2.2)
onde j e k representam ns no grafo, d
j
k(n
i
) representa as distncias mnimas entre os ns j e k
que envolvem n
i
e d
j
k representa todos os caminhos mnimos que ligam os ns j e k.
A normalizao, segundo os autores, feita dividindo o C
i
(n
i
) por
(n1)(n2)
2
que representa
todas as combinaes de pares de ns no grafo exceto pelo n n
i
. Assim, possvel obter a
proporo de caminhos mnimos em que o n n
i
est envolvido com C
i
(n
i
) e deste valor obter a
proporo em relao a quantidade total de caminhos possveis entre todos os pares de ns. As
centralidades de intermediao para os pesquisadores do grupo de Computao Grca so:
21
ci(Carla) = 0,22
ci(Luciana) = 0,71
ci(Joo) = 0,31
ci(Manoel) = 0,22
ci(Jacob) = 0,04
Luciana apresenta maior centralidade de intermediao, 0,71, ou seja, ela participa de 71% dos
caminhos mnimos entre todos os ns do grafo. A centralidade de intermediao mostra o quo
importante o n para o grafo no sentido de que se for retirado do grafo quebrar muitas relaes
dicultando o uxo no grafo. Ou seja, o n intermediador estaria sendo removido o que dicul-
taria, no caso do grafo de colaborao, o surgimento de novas colaboraes entre colaboradores
diferentes de dois pesquisadores que so colaboradores entre si.
2.1.7 Coeciente de Clustering (Agrupamento)
Esta mtrica quantica o quo densamente conectados esto os vizinhos de um n. Este clculo
feito atravs da razo entre a quantidade de ligaes existentes entre os vizinhos e a quantidade
de ligaes possveis que podem ser formadas entre eles.
A frmula que representa esse clculo dada por:
C
a
(n
i
) =
2 e
jk
k
i
(k
i
1)
, (2.3)
onde e
jk
representa a quantidade de arestas existentes entre os vizinhos de n
i
, js e ks, e
k
i
(k
i
1)
2
a quantidade de arestas mximas possveis entre os ns e k
i
representa a quantidade de
vizinhos para o n n
i
, para um grafo no direcionado.
ca(Carla) = 0,24
ca(Luciana) = 0,19
ca(Joo) = 0,21
ca(Manoel) = 0,20
ca(Jacob) = 0,33
Para a pesquisadorea Carla, por exemplo, tm-se 55 arestas envolvidas entre seus vizinhos,
sendo que se todos estivessem conectados existiriam 231, o que faz com que C
c
= 55/231 = 0,238.
Isto signica cerca de 23,8%, uma conectividade relativamente baixa. J Jacob apresentou 33,3%
de conectividade entre seus vizinhos, porm deve-se levar em conta que ele possui apenas 3 cola-
boradores no grafo, enquanto os outros tm no mnimo 10 colaboradores, ou seja, a probabilidade
de estarem ligados entre si menor.
22
2.1.8 Densidade
A densidade do grafo medida calculando a razo entre a quantidade de relacionamentos
existentes no grafo e a quantidade total de relacionamentos que podem ser formados. Isto mostra
a coeso do grafo. Quanto maior a densidade do grafo, mais ligado ele se mostra, e melhor ser o
uxo de dados dentro dele. No caso do exemplo da Figura 2.1, que uma rede de coautoria, a maior
densidade representa a maior quantidade de publicaes produzidas em colaborao. Ento, para
esse exemplo, assumindo que RE = quantidade de relacionamentos existentes, RP = quantidade de
relacionamentos possveis e DE = densidade, tem-se que:
DE = RE/RP
RE = 140
RP = 1326
DE = 0,106
Sabendo-se que a densidade da rede poderia variar entre 0 e 1, a densidade DE calculada
representa apenas cerca de dez porcento das possibilidades.
2.1.9 Coeciente de Colaborao
O Coeciente de Colaborao uma mtrica que relaciona a quantidade de publicaes (conti-
das nas arestas do grafo de coautoria) e nmero de autores para medir o ndice de colaborao em
um grupo. Para o clculo feito um somatrio, onde para cada quantidade de autores de artigos,
so contadas quantas publicaes possuem aquela quantidade de autores. Por exemplo, se temos
um conjunto de artigos, separamos em grupos de acordo com a quantidade de autores que cada
publicao possui. Assim feito um somatrio dividindo pela quantidade de artigos no total.
C
co
= 1

j1,n
(1/j)F
j
N
, (2.4)
onde N representa a quantidade total de publicaes no grupo, e F
j
a quantidade de publicaes
com j autores.
Essa mtrica deve ser calculada para um conjunto de publicaes de um conjunto de auto-
res, no somente para um pesquisador. Desta forma, para o exemplo da Figura 2.1 tem-se que o
Coeciente de Colaborao encontrado de 0,67.
2.1.10 Dimetro
Para encontrar o dimetro de um grafo preciso tomar todas as maiores distncias geodsicas
entre todos os pares de ns no grafo, e a partir da selecionam a maior dessas distncias que ser o
dimetro do grafo propriamente dito. Em outras palavras, feita a seleo da maior excentricidade
dos ns no grafo. Para o grafo da Figura 2.1, tem-se que o dimetro D igual a 5. Umdos caminhos
possveis para representar o dimetro do grafo partir de SANTOS R.A.P. e chegar a PINTO, F.M.
23
passando por SCHARCANSKI, J., COMBA, J.L.D., NEDEL L.P., FREITAS, C.M.D.S e PINTO,
F.M., nessa ordem, como pode ser visto na Figura 2.3.
Figura 2.3: Um dos possveis caminhos para representar o dimetro do grafo.
2.1.11 Assortatividade
Newman desenvolveu trabalhos relacionados "Mixing Pattern"em redes, que calculam medi-
das que representamo padro de mistura que ocorre de acordo comalguma caracterstica especca
dos ns (NEWMAN, 2002). Por exemplo, no trabalho de (SOUSA; RUIZ, 2011), essa mtrica foi
calculada com o intuito de indicar a relao entre ns que representavam doenas mais frequentes
e ns que representavam doenas raras. A forma mais empregada dessa mtrica para vericar
relacionamentos entre ns que possuem o mesmo grau. A frmula utilizada para o clculo da
Assortatividade est relacionada correlao entre os graus de vrtices adjacentes e mostrada a
seguir:
r =
M
1

i
j
i
k
i
[M
1

i
(1/2)(j
i
+ k
i
)]
2
M
1

i
(1/2)j
2
i
k
2
i
[M
1

i
(1/2)(j
i
+ k
i
)]
2
(2.5)
Uma das formas de caracterizar uma rede como assortativa ou disassortativa, segundo o traba-
lho de (BENEVENUTO; ALMEIDA; SILVA., 2011), calcular a mdia dos graus ligados a cada
grau k presente no grafo. A partir da feita a avaliao das mdias, onde valores crescentes, ou
seja, ns com grau maior se relacionando com outros ns de grau maior ou igual ao dele indicam
uma rede assortativa. Devido facilidade em entender grcos visualmente e como j existiam ou-
24
tros grcos que eram produzidos nesse trabalho, escolheu-se analisar a assortatividade dos grafos
atravs de um grco tambm.
2.2 Consideraes Finais
Este captulo apresentou as principais mtricas referentes s redes sociais, as quais permitem
entender aspectos da estrutura das redes. Cada mtrica pode ser utilizada de forma individual ou
em conjunto, olhando mais de uma mtrica ao mesmo tempo, para analisar uma rede. Algumas
delas possuem interpretaes semelhantes como grau e centralidade de grau, desta forma o usurio
deve escolher as mtricas que deseja avaliar de acordo como seu interesse. Por isso, nesse trabalho,
foi dada a liberdade ao usurio de escolher quais mtricas ele deseja visualizar nos arquivos .xls
gerados. Entre as mtricas descritas, Assortatividade e Coeciente de Colaborao no so em
geral calculadas por ferramentas de anlise e visualizao de redes sociais acadmicas, sendo este
um diferencial deste trabalho.
25
3 TRABALHOS RELACIONADOS
Este captulo apresenta o contexto no qual a dissertao est inserida: anlise de redes sociais
e visualizao de grafos que representam redes sociais. As reas de pesquisa so descritas, iden-
ticando as principais necessidades e desaos visando delimitar o escopo do problema tratado na
dissertao. Este captulo est dividido em 2 sees. Na primeira seo, so apresentados traba-
lhos que envolvem estudos tericos sobre anlise de redes sociais, sendo que alguns destes utilizam
programas de gerao de grafos para mostrar sadas grcas. Na segunda seo, so descritos os
trabalhos que propem ferramentas de visualizao de grafos e que calculam mtricas para an-
lise dos grafos gerados, e apresentada uma anlise comparativa dos trabalhos descritos. Deve-se
ressaltar que os trabalhos descritos nesse captulo consideram redes sociais de forma abrangente
(grafos dentro de vrios domnios de problema), enquanto a proposta descrita nesta dissertao
tem seu foco em redes sociais acadmicas de coautoria. O objetivo do estudo em abrangncia
, principalmente, aplicar a anlise e visualizao de grafos na soluo dos problemas de redes
sociais acadmicas de coautoria.
3.1 Anlises de Redes Sociais
O esforo em decifrar as redes sociais e suas caractersticas se aplica a diversas reas de co-
nhecimento. Desta forma, alguns trabalhos desenvolvidos em outras reas que utilizavam anlise
de redes sociais foram pesquisados e so apresentados a seguir.
Em 2006, Oliveira Silva et al. (OLIVEIRA SILVA et al., 2006) realizaram um estudo sobre
as redes de colaborao entre professores de programas de Ps-Graduao do Brasil na rea de
Cincia da Informao. As informaes para tal estudo vm de dados da RedeCI
1
. O objetivo
do trabalho foi pesquisar sobre correlaes entre trabalhos de pesquisa entre diferentes programas
de Ps-Graduao no Brasil. Outra questo foi descobrir quais as caractersticas dessa rede, se
densa, se existem colaboraes entre professores de diferentes linhas de pesquisa. A partir da
foi feito um estudo bibliomtrico das publicaes vericando quais tinham colaborao e, assim,
foram aplicadas medidas de centralidade. Um grafo foi gerado com tais pesquisadores com o au-
1
www.redeci.netic.com.br
26
xlio da ferramenta de visualizao UCINET
2
. Alm disso, uma tabela com centralidade de grau,
proximidade e intermediao foi gerada com o objetivo de conrmar o destaque de alguns pesqui-
sadores no grafo com respeito s colaboraes, mostrando os pesquisadores que so fundamentais
para ligaes entre algumas universidades. Como resultado, o estudo mostrou baixa cooperao
entre os grupos estudados.
No mesmo campo (Cincia da Informao), foi realizado outro trabalho, em busca de evidn-
cias comportamentais dos pesquisadores e tendncias evolutivas nas redes de coautoria no ramo
da cincia da informao no Brasil (BRANDO; PARREIRAS; SILVA, 2007). Para o estudo das
tendncias foram coletados dados referentes a publicaes de diversos eventos, revistas, etc, em
determinados perodos de tempo e volumes. J, para avaliar a evoluo, foi feita a diviso da
coleo em cinco perodos de tempo. A partir de um grco construdo com os dados obtidos,
os autores concluram inicialmente que o nmero de publicaes com autoria individuais supe-
rior aos trabalhos feitos em coautoria. Porm perceberam que a diferena entre a quantidade de
trabalhos nas duas modalidades vem caindo, o que leva a crer que, no futuro, os trabalhos em co-
laborao devem superar os individuais. Porm, para trabalhos em nvel global (da rede como um
todo e no somente local quando envolve colaborao dentro das sub-redes) o nvel de colaborao
vem diminuindo, devido aos autores "novatos"que entram na rede, incorporando baixo ndice de
colaborao.
Em 2009, Lima relatou um estudo sobre as redes de colaborao ligadas ao grupo da Ps-
Graduao na rea de Geocincias na UFRGS (LIMA, 2009). A principal questo que motivou o
trabalho foi estudar quais elementos inuenciam na evoluo estrutural das redes de colaborao
entre pesquisadores pertencentes ao grupo estudado em um determinado perodo de tempo. Para
isso foram construdas trs redes de coautoria usando dados da base CAPES em trs intervalos de
tempo diferentes. Os resultados do estudo mostraram que o conjunto de atores centrais formado
em sua maioria por docentes, no havendo previso de mudana desse padro. Alm disso, foi
vericada reincidncia no padro de parceiros em colaborao. Outra concluso foi que tanto
grupos, linhas e projetos de pesquisa inuenciam na evoluo estrutural das redes de colaborao
do PPGGeo da UFRGS.
J em 2008, Ftima e Caregnato aplicaram clculos bibliomtricos s redes de colaborao for-
madas pelos pesquisadores do grupo da Ps-Graduao emEpidemiologia da Universidade Federal
de Pelotas (UFPel) (FTIMA S. MAIA; CAREGNATO, 2008). Para tal estudo foram utilizados
trabalhos realizados no perodo de 1991 a 2002. As autoras constataram que os pesquisadores
publicaram mais trabalhos em conjunto do que individualmente. Como mtodos de avaliao, as
autoras mostraram a distribuio de artigos e o nmero de autores, alm de outro que mostra os
coecientes de colaborao dos professores para cada ano dentro do intervalo de tempo j citado
anteriormente. Alm disso, alguns grafos foram gerados e analisados. A UCINET foi usada para
calcular as centralidades de grau, proximidade e intermediao, para assim comparar os pesquisa-
dores entre si. Como trabalhos futuros, as autoras sugeriram analisar as visibilidades dos artigos.
2
http://www.analytictech.com/ucinet/
27
Desta forma as publicaes internacionais e nacionais podem ser comparadas de acordo com os
seus fatores de impacto.
No trabalho de Hayashi, Hayashi e Lima, em 2008, foi feito um estudo das redes de coautoria
formadas por pesquisadores da rea de Educao Especial ou entre esses pesquisadores e outros
do pas e do exterior (HAYASHI; HAYASHI; LIMA, 2008). A partir da anlise das colaboraes
foram identicados possveis colaboradores futuros e o grau de colaborao dos pesquisadores.
Para esse estudo, foram analisadas publicaes de pesquisadores da Ps-Graduao de Educao
Especial da Universidade Federal de So Carlos (UFSCar) no perodo de 2001 2006, sendo os
dados extrados da base Lattes (arquivos xml individuais de cada pesquisador). Os grafos foram
gerados tambm com o auxlio da UCINET, so eles: grafo de artigos, de livros, captulos de
livros e trabalhos completos. A partir desses grafos, foram feitas anlises sobre as componentes
dos grafos, comparando seus tamanhos, assim como tambm foram feitas anlises sobre os graus
dos ns. O objetivo do trabalho era identicar prticas de coautoria na rea de Educao Especial.
Como pode ser visto nesta seo, a maioria dos estudos utilizam grafos para ilustrar as redes
estudadas, facilitando a visualizao para os leitores. A UCINET mostrou-se bastante utilizada
tanto para gerao dos grafos das redes quanto para calcular mtricas de centralidade.
3.2 Ferramentas de Visualizao
Para a realizao deste trabalho, algumas ferramentas de visualizao de redes sociais foram
estudadas com o objetivo de identicar suas caractersticas e as mtricas utilizadas para anlises
das redes. Assim, as prximas subsees so dedicadas ao detalhamento das ferramentas anali-
sadas, sendo que cada uma descrita de acordo com a seguinte ordem: idias gerais e principais
caractersticas, mtricas calculadas e consideraes nais. Por m, uma anlise comparativa
apresentada para o fechamento da seo.
3.2.1 COMMETRIX
COMMETRIX (TRIER; BOBRIK, 2009) um framework para anlise e visualizao de redes
sociais de propsito geral, podendo ser utilizado para representar diversos tipos de redes, como:
coautorias, colaborao entre organizaes ou rastreamento em redes de roteadores. A interface
com o usurio permite que seja feito um exame exploratrio para identicao e observao de
estruturas relevantes na rede, ou seja, atravs de ltros possvel visualizar apenas estruturas
que satisfaam uma busca em um determinado momento. Alm disso, permitido congurar as
variveis visuais tais como rtulo, tamanho e cor dos ns. possvel visualizar a evoluo da
rede em um perodo de tempo passando como parmetro de entrada a informao do perodo de
tempo desejado. O usurio pode exportar dados para tabelas em formato .cvs e .xcl, para registrar
a evoluo da rede e que permita posterior anlise. O leiaute utilizado para visualizar o grafo
o leiaute baseado em foras, podendo ser ajustado de acordo com as preferncias do usurio. O
download da verso trial pode ser feito em http://www.commetrix.de/.
28
Figura 3.1: Interface da ferramenta COMMETRIX. Fonte: (TRIER; BOBRIK, 2009).
29
A Figura 3.1 ilustra um exemplo de grafo gerado com a ferramenta COMMETRIX. As setas
destacam as principais caractersticas da ferramenta. A seta 1 mostra a tela principal da aplicao,
na qual o usurio pode marcar, ou desmarcar um n clicando nele. O n pode ser reposicionado,
selecionando-o e clicando com o boto direito sobre a nova posio desejada. A seta 2 mostra o
painel de controle da ferramenta, no qual o usurio pode alterar as caractersticas do grafo. Por
exemplo, dizer qual caracterstica ser usada como rtulo para cada n, denir o que representa
o tamanho dos ns, entre outras. A seta 3 mostra um menu com vrios botes que permitem
ao usurio carregar dados novos, especicar o tipo de visualizao desejada (2D ou 3D), acionar
ltros, acessar a ajuda, dentre outras opes. A seta 4 mostra informaes sobre o processo atual
da operao que est sendo executada, atravs de uma barra de progresso.
(a) (b)
Figura 3.2: Mtricas geradas pela COMMETRIX: (a) Mtricas gerais da rede e (b) Mtricas de um
n especco. Fonte: (TRIER; BOBRIK, 2009).
As mtricas calculadas e visualizadas pela COMMETRIX so referentes rede como um todo
ou a um n especco. As propriedades calculadas para a rede so mostradas na Figura 3.2a,
dentre elas: nome da rede, nmero de ns e relacionamentos, dimetro do grafo, quantidade de ns
isolados (ns de grau zero), quantidade de membros mais ativos, densidade da rede, centralidades,
mdia de alcance, mdia do tamanho dos caminhos e coeciente de clustering.
Para um determinado n, as caractersticas podem ser vistas na Figura 3.2b. As principais
caractersticas so: ndice, identicador de grupo, tamanho do grupo do qual o n participa, pro-
30
fundidade de viso, listas de palavras-chave (trs palavras mais usadas para referenci-lo), atri-
butos do n (nome, e-mail, etc), linkevents sent (quantidade de transaes iniciadas/ enviadas por
ele), linkevents received (quantidade de transaes recebidas por ele), alcance do n, medidas de
centralidade, quantidade de contatos diretos, etc.
COMMETRIX mostra-se uma ferramenta eciente no que tange aos seus objetivos, permitindo
grande interao com o usurio. Alm disso, o usurio pode ajustar a visualizao de diversas
formas para deixar o grafo da forma que mais lhe agrade. Pode ser utilizada com diversos tipos de
redes, rede de e-mails para vericar a taxa de envio e os ns mais envolvidos dentro de conjunto,
ou de uma rede de coautoria. Uma limitao da COMMETRIX o fato de ser paga, fazendo com
que a quantidade de usurios seja restrita. Inclusive, para gerar os arquivos de entrada, necessria
uma outra ferramenta, que exige outra licena para ser utilizada.
3.2.2 COSBILab Graph
Figura 3.3: Interface da ferramenta COSBILab Graph. Fonte: (VALENTINI; JORDN, 2010).
A COSBILab Graph (VALENTINI; JORDN, 2010) uma ferramenta que permite construo,
visualizao e modicao de grafos. A Figura 3.3 mostra a interface da COSBILab. A seta 1
indica a barra de ferramentas, onde o usurio pode gerar um novo grafo, selecionar os ns, alterar
o leiaute (randmico, rvore, espiral, grid, circular, etc), calcular mtricas e exportar o grafo. A
seta 2 indica uma aba onde possvel visualizar informaes de um item selecionado. A seta 3
31
mostra a tela onde o usurio visualiza e interage com o grafo. O contedo da aba indicada pela seta
4 pode variar, mostrando uma tela em que o usurio pode navegar pelo grafo que aparece apontado
pela seta 3. Nesta tela aparece um retngulo azul que representa a poro do grafo que est sendo
visualizada atualmente pelo usurio; ou ainda um palette onde o usurio pode escolher qual o tipo
de item que ser inserido, por exemplo, se um n com ou sem arestas. A COSBILab Graph pode
ser obtida gratuitamente para uso no-comercial no site http://www.cosbi.eu/.
Por padro, ao criar os componentes bsicos do grafo e o grafo em si, so criadas estruturas
(ns, arestas e o grafo) que podem ser alteradas pelo usurio, adicionando ou removendo atributos
aos componentes, como pode ser visto na Figura 3.4. Assim, a COSBILab Graph pode ser aplicada
em qualquer tipo de rede, sendo adaptada de acordo com o interesse do usurio. Alm disso, pode-
se alterar atributos grcos de um n ou do grafo, por exemplo, rtulo, cor, largura, altura, largura
das arestas. A COSBILab Graph tambm permite que ns possam ser agrupados para melhorar a
visualizao do grafo.
Figura 3.4: Caractersticas bsicas das estruturas em COSBILab Graph. Fonte: (VALENTINI;
JORDN, 2010).
As principais mtricas calculadas pela COSBILab Graph so as relativas ao grafo: se ou
no direcionado, se possui ciclos, rvores ou orestas, nmero de arestas e ns, quantidade de
subgrafos, coeciente de clustering, medidas de centralidade, quantidade de ciclos, nmero de
componentes do grafo, grau dos ns, etc.
Alm de criar um grafo manualmente, o usurio pode escolher importar arquivos em cinco
formatos diferentes, incluindo sadas geradas pelo BlenX Environment, DOT GraphViz e UciNet
DL. A sada alm de ser gerada de forma grca para o usurio, tambm pode ser exportada para
.png.
Uma das vantagens de utilizar a COSBILab Graph sua generalidade pois pode ser aplicada a
diversos tipos de grafo e a diversas reas.
32
3.2.3 SocialAction
SocialAction uma ferramenta de anlise criada para testar o poder de integrao entre clculos
de mtricas e visualizao de redes sociais (PERER; SHNEIDERMAN, 2008). A contribuio
sugerida pelos autores da SocialAction mostrar que essa integrao melhora a anlise exploratria
de dados e que sua metodologia de avaliao para estudos de longo prazo caso captamas estratgias
de investigao de analistas de dados. Com as mtricas possvel simplicar a compreenso de
algumas visualizaes complexas, j que permite que o usurio mantenha o foco nos ns que
so mais relevantes para ele. A implementao da SocialAction utiliza a biblioteca Prefuse para
gerao dos grafos.
Figura 3.5: SocialAction: Mudana de rtulos dos ns de acordo com as mtricas de anlise de
redes sociais. Fonte: (PERER; SHNEIDERMAN, 2008).
SocialAction permite que o usurio escolha uma dentre as mtricas mais comuns de anlise
de redes sociais (centralidades de grau, proximidade e intermediao, etc) e ordene-a para usar
como rtulos dos ns. Alm disso, os ns tambm recebem uma colorao dentro de uma faixa
de acordo com seu nvel no ranking (verde - baixo ranking, preto - mdio ranking ou vermelho
- alto ranking). Na Figura 3.5, a seta indica o local onde o usurio pode modicar a mtrica
utilizada para colorir os ns. A SocialAction tambm permite arrastar e dar zoom no grafo. Os
rtulos dos ns esto sempre presentes, sendo que o usurio pode alterar o tamanho da fonte e
o comprimento dos rtulos. Ao selecionar um n, o usurio pode visualizar informaes sobre
33
ele. Alm disso, ao deixar o mouse sobre o n, os ns vizinhos so destacados alcanando o
NetViz Nirvana (capacidade de visualizar para cada n suas arestas e percorr-las at encontrar
cada n vizinho) para aquele n. Outras mtricas e caractersticas visuais esto disponveis na
SocialAction, como rankeamento das arestas para encontrar relacionamentos fortes, habilitar
algoritmos de agrupamento, analisar diferentes tipos de relacionamento.
Figura 3.6: Grafo mostrando dois grupos de senadores americanos e a freqncia de votao em
conjunto. Fonte: (PERER; SHNEIDERMAN, 2008).
Como estudo da efetividade da ferramenta, foi desenvolvida uma metodologia que envolve
quatro passos: entrevista, treinamento, utilizao da ferramenta, resultado. Os terceiro e quarto
passos envolvem a utilizao da ferramenta. Para validao do trabalho foram desenvolvidos qua-
tro estudos de caso que foram executados com diversos tipos de usurios. A Figura 3.6 mostra um
dos estudos de caso onde as cores azul e vermelha determinam a que grupo os senadores partici-
pam, e as arestas representam a freqncia em que dois senadores votaram juntos. A SocialAction
permite que sejam gerados grcos que comparam duas mtricas, por exemplo, grau e centralidade
de intermediao.
Como vantagem em utilizar a SocialAction pode-se apontar o fato de se aplicar a vrios tipos de
rede. J uma das desvantagens a impossibilidade de explorao de dados durante determinados
perodos de tempo, como dias, meses e anos.
3.2.4 SocialNetSense
Gou et al. props um framework que permite integrao entre atributos de redes sociais para
entend-las estrutural e socialmente (GOU et al., 2012). Os autores consideraram que os trabalhos
34
Figura 3.7: Grcos gerados com a SocialAction que permitem que o usurio compare duas m-
tricas. Fonte: (PERER; SHNEIDERMAN, 2008).
Figura 3.8: Esquema proposto para o framework SocialNetSense. Fonte: (GOU et al., 2012).
35
atualmente desenvolvidos apresentam fraco suporte para redes altamente complexas e normal-
mente precisam da ajuda do usurio para reunir, sintetizar e organizar informaes das caracte-
rsticas extradas da rede. Alm do framework, foi desenvolvido um prottipo, SocialNetSense
que se baseia na proposta deste framework para permitir visualizao e anlise de redes sociais
juntamente com interao com o usurio.
A Figura 3.8, mostra o esquema do framework proposto por Gou et al.. O esquema dividido
em trs partes: dados da rede social, loop de explorao de rede e loop de construo da representa-
o. Inicialmente, os dados so processados e inseridos em estruturas de dados de acordo com suas
caractersticas sociais, de rede e hbridas. No loop de explorao, os usurios procuram informa-
es desejveis explorando as caractersticas disponveis nessa fase. As caractersticas sociais se
referem aos atributos sociais dos atores como classicao na hierarquia da rede. As caractersti-
cas de rede esto relacionadas estrutura da rede. J as caractersticas hbridas mostram o impacto
dos atributos sociais sobre a estrutura da rede. Um outro loop externo une os apresentados anteri-
ormente, so os processos top-down e bottom-up. No primeiro, o usurio parte das representaes
para orientar suas pesquisas no loop de explorao. No bottom-up, o usurio reune informaes de
interesse para dar suporte sua representao.
Figura 3.9: Representao visual do SocialNetSense. Fonte: (GOU et al., 2012).
A partir das idias propostas foi construdo um prottipo que permite explorao de carac-
tersticas sociais, explorao e anlises de caractersticas de rede, explorao de caractersticas
hbridas, construo da representao e gesto de processos que aumentam a conscientizao dos
usurios em relao ao histrico de aes realizadas por eles. A Figura 3.9, mostra a interface
do Network Exploring Sense (NES). O Painel 1 mostra a visualizao da rede social, o Painel 2
36
mostra o painel de controle onde esto presentes ferramentas analticas. O painel 1-1 permite a
visualizao do grafo da rede; o 1-2 contm uma rvore que representa a hierarquia entre os ns; e
o painel 1-3 mostra uma viso geral da rede e permite rpidas navegaes na rede. Alm do NES,
o TreeNetViz (GOU; ZHANG, 2011), mostrado na Figura 3.9, ao lado direito, foi utilizado para
mostrar caractersticas hbridas de padres de rede sobre a hierarquia social. Na visualizao do
TreeNetViz possvel expandir ou agrupar setores ou redimensionar setores.
A partir dos resultados obtidos com o NES, o RBS (Representation Building Space) organiza as
evidncias e estabele relaes entre elas. A Figura 3.10 mostra o painel 1 que contm o workspace
principal. No painel 2, so mostrados histricos das execues do usurio guardando o timestamp
de cada ao. E no painel 3 mostrada a lista dos elementos presentes no workspace. Alm
do timestamp, o usurio pode adicionar notas ou agrupar os elementos selecionados. Atravs do
histrico, o usurio pode escolher voltar para um passo intermedirio sem precisar reiniciar todo
processo do incio.
Figura 3.10: Interface do RBS. Fonte: (GOU et al., 2012).
Apesar de apresentar grande quantidade de informaes para o usurio, isso pode ser um ponto
negativo para um usurio leigo ou que queira tirar simples concluses sobre a rede visualizada. Al-
gumas limitaes do SocialNetSense se referem ao fato de funcionar bem com dados incompletos,
prejudicando a construo de redes e o suporte de explorao social. Alm disso, o armazenamento
das aes que formam o grco com o histrico possui apenas informaes contidas na visualiza-
o no momento em que o usurio grava a ao, ou seja, pode perder informaes que no estejam
37
visveis apenas pelo tamanho da tela, por exemplo.
3.2.5 ArnetMiner
ArnetMiner (TANG et al., 2008) uma ferramenta que tambm trabalha com minerao e
extrao de dados aplicadas s redes sociais acadmicas. Inicialmente, so extrados pers dos
pesquisadores automaticamente da Web. Em seguida, feita a integrao dos dados referentes s
publicaes existentes em bibliotecas digitais e das pginas pessoais dos pesquisadores. Aps o
tratamento da redundncia de dados, feita a modelagem da rede acadmica envolvendo os pesqui-
sadores extrados da consulta inicial juntamente com suas informaes, ou seja, seus colaboradores
e suas publicaes. Por m, so oferecidos servios de busca dentro da rede (TANG et al., 2008).
A Figura 3.11 mostra o exemplo de um grafo de coautoria entre dois pesquisadores(Andrew Chi-
Chih Yao e John E. Hopcroft) e seus colaboradores, onde podem ser vistos os colaboradores em
comum. Para utilizar a ArnetMiner basta acessar o site http://arnetminer.org/.
Figura 3.11: Grafo de coautoria gerado pela ArnetMiner formado por dois pesquisadores escolhi-
dos e com seus colaboradores. Fonte: http://arnetminer.org.
Alm dos grafos de coautoria gerados pela ArnetMiner, tambm possvel fazer buscas como:
busca por um perl de usurio criado pelo sistema a partir de tcnicas de extrao de informao;
busca de especialista, podendo ser feita a partir de um nome de pesquisador ou a partir do nome de
uma rea especca ou qualquer outro campo. Ento, dependendo da consulta digitada pelo usurio
a busca retornar os especialistas naquela rea; anlise de conferncia, onde o usurio consegue
buscar pelos pesquisadores que so mais ativos num determinado evento; busca por disciplinas,
onde a partir de uma consulta por uma rea, por exemplo, minerao de dados, o sistema retorna
38
quem est ministrando as disciplinas mais relevantes para essa rea. O usurio tambm pode
criar um login para alterar pers extrados, fornecer feedbacks para os resultados das pesquisas,
acompanhar pesquisadores da ArnetMiner e criar uma pgina para ele. A Figura 3.12 mostra a
interface da ArnetMiner onde o usurio pode interagir com o sistema.
Figura 3.12: Interface da ferramenta online ArnetMiner. Fonte:http://arnetminer.org/.
As mtricas calculadas pela ArnetMiner so: nmero total de citaes e publicaes, H-index,
longevidade (tamanho da vida acadmica de um pesquisador), fator de impacto (reete a impor-
tncia do local da publicao), atividade (baseada nos artigos publicados nos ltimos anos pelo
pesquisador, considerando a importncia de cada artigo), diversidade (calculada de acordo com
as reas em que o pesquisador trabalha), sociabilidade (denido pela quantidade de coautores do
pesquisador), uptrend (mtrica utilizada para denir o grau de crescimento de um pesquisador) e
New star (tem o score baseado na atividade do pesquisador).
ArnetMiner uma ferramenta muito indicada para trabalhar com redes sociais acadmicas,
j que calcula diversas mtricas que auxiliam na avaliao da produo de pesquisadores. Alm
disso, as formas de interao com o grafo so intuitivas e a interface amigvel para o usurio. A
maior desvantagem em utilizar a ArnetMiner a necessidade de estar conectado internet para
buscar os dados para formar as redes. Do mesmo modo no possvel passar um arquivo de
entrada especco para representar uma rede especca. Os dados, assim, no so completos,
restringindo-se aos coletados pela prpria ferramenta.
3.2.6 igraph
A igraph (CSARDI; NEPUSZ, 2006) uma biblioteca para criao e manipulao de grafos
no-direcionados e direcionados. Essa biblioteca pode ser includa em implementaes desen-
39
volvidas em linguagem R ou Python, para auxiliar no clculo de mtricas em anlises de gra-
fos. A Figura 3.13 mostra um grafo de uma rede gerada com linguagem R juntamente com
a biblioteca igraph. A caixa apontada pela seta mostra alguns leiautes (randmico, circular e
leiautes baseados em foras) possveis para visualizao do grafo. Nesta imagem, o tamanho
de cada n est relacionado ao seu grau. O download da igraph pode ser feito em: http:
//igraph.sourceforge.net/download.html.
Figura 3.13: Interface criada utilizando a linguagem R que possui suporte para a biblioteca igraph.
Fonte: http://igraph.sourceforge.net/screenshots.html.
Por se tratar de uma biblioteca, a igraph pode ser aplicada a qualquer campo de estudo que o
usurio deseje, sendo necessrio apenas adaptar as estruturas de dados que o usurio utilizar para
representar a rede social. O arquivo de entrada pode ser qualquer tipo de arquivo que usurio deseje
desde que programe corretamente para preencher as estruturas de dados internas implementadas
na biblioteca.
A igraph implementa muitos algoritmos que envolvem problemas clssicos de teoria dos gra-
fos, tais como uxo na rede e rvores geradoras mnimas. As mtricas calculadas pela igraph
incluem caminhos mnimos (usando algoritmo de Dijkstra), dimetro, quantidade de vizinhos,
subcomponentes do grafo, clculo de componentes biconectadas, medidas de centralidade, clculo
da densidade, cliques do grafo, entre outras.
Uma das maiores vantagens em utilizar essa biblioteca a opo de adaptar o grafo de acordo
com o problema aumentando as possibilidades de aplicao da biblioteca. Como desvantagem,
pode-se dizer que o usurio precisa criar uma interface para que possa haver interao com o
grafo, j que a biblioteca gera somente o grafo, permitindo anlise sobre este grafo.
40
3.2.7 Pajek
Figura 3.14: Interface inicial da ferramenta Pajek. Fonte: (BATAGELJ; MRVAR, 2011).
Pajek (BATAGELJ; MRVAR, 2011) uma ferramenta que foi desenvolvida para plataforma
Windows que permite visualizar e analisar redes em geral com milhes de ns (redes de cola-
borao, organizao de molculas, genealogias, redes de Internet, etc). Alm de ter suporte a
grafos direcionados, no-direcionados e mistos, tambm possvel trabalhar com grafo multi-
relacionais, redes de duas modas (grafos bipartites formado entre conjunto de ns disjuntos) e
grafos temporais (que variam em determinados perodos de tempo). A Figura 3.14 mostra a ja-
nela inicial da Pajek, que est disponvel de forma livre para uso no-comercial no site: http:
//vlado.fmf.uni-lj.si/pub/networks/pajek/.
Pajek usa at seis tipos de objetos de dados:
Redes (Networks) - so os dados principais e contm as arestas e ns. Podem ser representa-
dos como aresta, como listas de arestas, formato de matriz ou formato UCINET, GEDCOM.
Extenso padro .net;
Parties (Partitions) - determina a qual partio cada n pertence. Extenso padro .clu;
Permutaes (Permutations) - permite reordenar os ns. Extenso padro : .per;
Agrupamentos (Clusters) - subconjunto de ns. Extenso padro: .cls;
Hierarquias (Hierarchies) - ns ordenados hierarquicamente. Extenso padro: .hie;
Vetores (Vectors) - para uma determinada propriedade numrica, eles guardam o valor para
cada n do grafo. Extenso padro: .vec;
41
Para cada um desses tipos de arquivo, a Pajek consegue l-los e salv-los no formato ASCII,
sendo que possvel exportar matrizes no formato EPS. Tambm possvel ler arquivos no formato
Pajek .paj, que podem conter os seis tipos de dados. Um exemplo de grafo gerado usando o Pajek
pode ser visto na Figura 3.15.
Figura 3.15: Um grafo gerado usando a Pajek. Fonte: http://imasters.com.br/artigo/4177/sql-
server/softwares-livres-relacionados-a-banco-de-dados.
A partir das estruturas bsicas (n e aresta) foram implementados algoritmos para calcular
algumas mtricas, como grau, profundidade, p-cliques, componentes fortes, fracas ou biconecta-
das. Tambm possvel calcular caminhos entre os ns do grafo, uxo mximo entre dois ns,
k-vizinhos, extrair subredes, ordenao topolgica, remover laos, etc.
Uma das limitaes da ferramenta Pajek ter sido desenvolvida apenas para Windows, no
podendo ser utilizada por usurios Linux e Mac OS por exemplo. Por outro lado, possvel aplic-
la a redes com grandes quantidades de ns, sendo essa uma limitao de muitas outras ferramentas.
3.2.8 UCINET
UCINET (BORGATTI; FREEMAN, 2002) um pacote para anlise de redes sociais. A Figura
3.16 mostra a interface do UCINET. Ao clicar no boto indicado pela seta da caixa 1 possvel
modicar o diretrio padro, cujo caminho indicado pela caixa 2. A caixa 3 indica um boto
que referencia um editor de texto. A caixa 4 aponta para o editor de tabelas do projeto. A caixa
42
Figura 3.16: Interface da ferramenta UCINET. Fonte: http://www.analytictech.com/ucinet.
5 indica o boto de sada do UCINET. A caixa 6 indica o boto para o editor de formato DL, que
um dos formatos mais utilizados pelo pacote UCINET. A caixa 7 indica um boto para rodar o
NetDraw
3
, que associado ao UCINET gera a visualizao da rede emforma de grafo. AFigura 3.18
mostra um grafo sendo exibido pelo Netdraw depois de clicar no boto referente a esse aplicativo e
escolher o arquivo. Depois disso, possvel interagir com o grafo e alterar caractersticas dos ns,
arestas e do grafo em geral. A caixa 8 indica um boto que permite que operaes algbricas sejam
executadas sobre o conjunto de dados de entrada e sada do UCINET. A caixa 9 mostra o boto
que permite exibir arquivos gerados pelo UCINET depois de rodar alguma entrada. Por exemplo,
um arquivo contendo as medidas de centralidade calculadas para um grafo, como pode ser visto na
Figura 3.17. A caixa 10 aponta para o Menu Principal do UCINET, que permite acessar todas as
rotinas do UCINET, tais como: File, Data, Transform, Tools, Network, Visualize, Options e Help.
A verso trial pode ser obtida em http://www.analytictech.com/ucinet/download.htm.
Com a UCINET possvel trabalhar com grafos que possuem grande quantidade de ns, cerca
de 10000, ainda de forma eciente. Alm disso, a UCINET permite exportao dos dados para
outras ferramentas, por exemplo, Pajek e NodeXL.
As anlises permitidas pelo UCINET so: deteco de cliques (subconjunto de ns, no qual a
cada dois ns pertencentes a ele, existe uma aresta que conecta os dois ns) no grafo; clustering
hierrquico, que cria uma matriz da distncia geodsica; centralidades de grau, proximidade, in-
termediao e eigenvector dos ns; construo de uma tabela correlacionando as distncias, para
logo depois fazer um ranking dos ns comparando as distncias; centralidade da rede; densidade
de uma rede egocntrica.
Como vantagem pode-se apontar a possibilidade de criar grafos que representem qualquer tipo
de rede social, aumentando a gama de aplicaes possveis. Uma desvantagem a utilizao que
3
http://www.analytictech.com/Netdraw/netdraw.htm
43
Figura 3.17: Exemplo de arquivo FreemanDegree, um dos arquivos de sada gerado UCINET.
Fonte: http://www.analytictech.com/ucinet.
Figura 3.18: Grafo criado com o NetDraw. Fonte: http://www.analytictech.com/ucinet.
44
s pode ser feita na plataforma Windows.
3.2.9 NodeXL
O NodeXL (SMITH et al., 2009) um template desenvolvido para trabalhar com Excel 2007
e 2010, com o intuito de ajudar o usurio a explorar grafos de maneira mais fcil. O principal
objetivo do NodeXL facilitar a usabilidade de forma que no seja necessrio programar ou ser
prossional em manipulao de grafos e seus dados. Para gerar os grafos, basta passar como
entrada uma lista de ns e arestas, ou simplesmente passar uma lista de arestas numa tabela. O
NodeXL permite que o usurio possa alterar algumas caractersticas dos seus componentes, tais
como: largura, cor, nvel de transparncia das arestas, ou ainda cor, tamanho, posio e at as
imagens que representam os ns. O download do NodeXL pode ser feito em: http://nodexl.
codeplex.com/releases/view/83654.
(a) (b)
Figura 3.19: Grafos gerados com o nodexl: (a) Grafo Completo e (b) Grafo Filtrado. Fonte:
(SMITH et al., 2009).
A Figura 3.19a mostra um exemplo de grafo com dados extrados de um aplicativo de rede
social usado por uma empresa de mdio porte. Como pode-se perceber, o grafo parece bastante
ilegvel, sendo que a rede possui densidade de 26% de todas as arestas possveis no grafo. Para
lidar com esse problema, o NodeXL permite que sejam aplicados ltros, ajustando sliders com
restries, por exemplo, mostrar apenas ns com grau maior que dois, como pode ser visto na
Figura 3.19b. Pode-se tambm destacar e diferenciar ns de acordo com suas caractersticas, por
exemplo, mudar o tamanho do n de acordo com a quantidade de arestas incidentes. possvel
tambm agrupar ns selecionando um conjunto deles, sendo que o grupo formado tem algumas
propriedades como: podemser expandidos e agrupados, podemser operados como umconjunto, as
45
mtricas da rede podem ser calculadas para cada grupo. O usurio pode criar os grupos a partir de
algumatributo dos ns, como pode ser visto na Figura 3.20, ou seja, escolhendo uma das colunas da
tabela para agrupar os ns. Outra forma de agrupar a partir das componentes fortemente conectadas
encontradas pelo prprio NodeXL, onde, para cada grupo, todos os ns pertencentes a ele so
representados por uma mesma cor. A ltima forma de agrupamento ocorre atravs de algoritmos de
agrupamento, sendo que o NodeXL dispe de trs algoritmos de agrupamento da biblioteca SNAP
4
: Wakita and Tsurumi, Girvan-Newman ou Clauset-Newman-Moore. Em geral, esses algoritmos
tentam posicionar os ns analisando os conjuntos de ns mais fortemente conectados e separando-
os em grupos. O NodeXL permite interaes como zoom, aumentar/diminuir a escala, atribuir cor,
opacidade, tamanho, rtulos aos ns e arestas, arrastar ns, alm de permitir alterar os leiautes que
variam entre algoritmos que implementam o leiaute baseado em foras.
Figura 3.20: Criao de uma restrio para gerar grupo de ns de acordo com seus atributos. Fonte:
http://nodexl.codeplex.com/documentation.
As principais mtricas calculadas pelo NodeXL so: grau de entrada e sada de um n (quanti-
dade de arestas incidentes e ascendentes do n), coeciente de clustering, centralidades closeness,
betweenness e eigenvector. Outras mtricas podem ser adicionadas por usurios avanados, cri-
ando uma nova coluna na tabela.
O NodeXL pago, uma desvantagem. Aps o trial de noventa dias, necessrio pagar taxas
de acordo com o propsito do usurio. Alm disso, por ser um template desenvolvido para Excel,
s pode ser utilizado no Windows. O NodeXL permite importar e exportar dados nos formatos:
GraphML, Pajek, UCINet e matrizes, sendo essa uma vantagem em usar o NodeXL.
3.2.10 Estudo Comparativo
O objetivo desta seo analisar criticamente as caractersticas de cada ferramenta descrita na
seo anterior.
4
http://snap.stanford.edu
46
A Tabela 3.1 apresenta uma sntese de caractersticas julgadas importantes para a visualizao
e interao de redes sociais e que podem, ou no, ser encontradas nas ferramentas analisadas. Foi
analisada a disponibilidade dos seguintes recursos:
Zoom - permite afastar ou aproximar um n sem perder o foco;
Distncia mnima entre ns - permite mensurar a distncia mnima entre os ns, para
mant-los afastados;
Comprimento da aresta - permite que o usurio ajuste o comprimento das arestas;
Alterar os rtulos - permite que o usurio congure os rtulos, dizendo o que deseja visua-
lizar como rtulo;
Alterar o tamanho dos rtulos dos ns - permitem alterar o tamanho dos rtulos dos ns;
Alterar o tamanho dos ns - permite modicar o tamanho dos ns;
Alterar a largura das arestas - permite que o usurio modique a largura das arestas, seja
congurando a partir do arquivo de entrada ou de forma grca;
Filtrar - permite que o usurio crie ltros para limitar a visualizao apenas para os ns e
arestas que possuam determinadas caractersticas;
Consultar - permite que o usurio faa consultas sobre algum n no grafo, sejam consultas
por um n ou criadas pelo prprio usurio;
Expandir - permite que o usurio expanda o grafo. A partir de cliques nos ns ou atravs de
algum mecanismo que faa com que novos ns e arestas sejam acrescentados ao grafo, de
acordo com a vontade do usurio;
Agrupar - permite que sejam denidos grupos com os ns com caractersticas semelhantes
para diminuir a quantidade de ns, tornando assim a imagem mais "limpa";
Representao - dene a estrutura utilizada para a representao grca da rede social.
Todas as ferramentas estudadas usam a representao em forma de grafo.
Ao analisar a Tabela 3.1, pode-se perceber que nenhuma das ferramentas estudadas permite que
seja feito o agrupamento de ns de forma visual. Vale lembrar aqui que o agrupamento aqui no
est se referindo ao clculo do coeciente de Clustering, que outra denio. Nesse item, o que
est sendo avaliado a possibilidade de formaes de grupos visualmente para o usurio. Outro
item que chama ateno ao analisar essa tabela a linha referente ao item de Expanso, sendo que
a nica ferramenta que permite que o grafo seja expandido de forma incremental o ArnetMiner.
47
A Tabela 3.2 contm as mtricas mais utilizadas e calculadas pelas ferramentas de visualizao
de redes sociais analisadas (detalhes sobre as mtricas podem ser vistos na Seo 2). Quando um
item est marcado com Sim, signica que a ferramenta possui uma determinada caracterstica;
quando marcado com No, signica que a ferramenta no possui a caracterstica e quando mar-
cado com ? signica que no possvel armar se a ferramenta possui ou no uma caracterstica.
Na Tabela 3.2, o que chama ateno novamente a coluna referente ferramenta ArnetMiner,
apesar de no calcular as mtricas mostradas na Tabela 3.2, calcula outras mtricas julgadas pelos
autores como mais relevantes para redes de coautoria, so elas: sociabilidade, h-index, longevi-
dade, diversidade, entre outras. J as outras ferramentas estudadas se aplicam a campos genricos,
de forma que o usurio pode visualizar qualquer tipo de rede, no sendo especializadas em ne-
nhuma rea.
4
8
Ferramentas
Caractersticas COMMETRIX COSBILab ArnetMiner SocialNetSense Pajek igraph UCINET NodeXL SocialAction
Graph
Zoom Sim Sim Sim Sim Sim Sim No Sim Sim
Distncia mnima entre ns Sim No No No Sim Sim No No No
Comprimento das arestas Sim No No No ? Sim No No No
Alterar rtulos Sim Sim No No Sim Sim Sim Sim Sim
Alterar tamanho dos rtulos Sim ? No Sim Sim Sim Sim Sim Sim
Alterar tamanho dos ns Sim Sim No Sim Sim Sim Sim Sim Sim
Alterar largura das arestas Sim Sim No No Sim Sim Sim ? No
Filtros Sim No No Sim ? Sim Sim Sim Sim
Consulta Sim Sim No No No No No No No
Expande No No Sim No No No No Sim No
Agrupa No No No No No No No Sim Sim
Representao Grafo Grafo Grafo Grafo Grafo Grafo Grafo Grafo Grafo
Tabela 3.1: Tabela com caractersticas de visualizao e interatividade.
4
9
Ferramentas
Mtricas COMMETRIX COSBILab ArnetMiner SocialNetSense Pajek igraph UCINET NodeXL SocialAction
Graph
Distncia Sim Sim No No Sim Sim Sim Sim Sim
Excentricidade No No No No No No No No No
Grau Sim Sim No Sim Sim Sim ? Sim Sim
Dimetro Sim Sim No ? Sim Sim ? Sim Sim
Densidade Sim No No Sim No Sim Sim Sim Sim
Centralidade Sim No No Sim No Sim Sim No Sim
de Grau
Centralidade Sim Sim No Sim Sim Sim Sim Sim Sim
de Closeness
Centralidade Sim Sim No Sim Sim Sim Sim Sim Sim
de Betweenness
Coeciente Sim Sim No No Sim Sim Sim Sim Sim
de Clustering
Assortatividade No No No No No No No No No
Coeciente No No No No No No No No No
de Colaborao
Tabela 3.2: Tabela com resumo das mtricas calculadas por cada ferramenta.
50
4 DESCRIO DA FERRAMENTA
Este captulo dedicado ao detalhamento da ferramenta desenvolvida neste trabalho e est
organizado da seguinte forma: a Seo 4.1 mostra uma viso geral das contribuies e propostas
de visualizao dos grafos das redes de coautoria. Na Seo 4.2, detalhada a implementao e
funcionalidades do prottipo. Finalizando o captulo, apresentada uma seo de consideraes
nais.
4.1 Viso Geral
PANDORA permite visualizar redes de coautoria a partir de arquivos XML que representam
produo bibliogrca. A visualizao pode ser feita de forma incremental, a partir de expanses
no grafo, e permite gerar dados analticos a respeito da rede que est sendo visualizada.
A Figura 4.1 mostra a viso geral da proposta deste trabalho. A partir de um arquivo fornecido
pelo usurio, neste caso um arquivo XML, gerada uma visualizao do grafo da rede de coautoria
que permite interao com o usurio de tal forma que ele possa expandir o grafo de acordo com o
que deseja visualizar. Ou seja, medida que o usurio clica em algum n novos ns e arestas so
adicionados ao grafo, caso o n clicado ainda no tenha sido explorado. Nesta gura, as arestas
que foram adicionadas aps o clique do usurio esto representadas em vermelho e tracejadas.
Cada n apresentado sempre que pelo menos uma de suas arestas estiver visvel. Por exemplo,
na Figura 4.1, os ns que possuem apenas arestas tracejadas tornaram-se visveis s aps o clique
do usurio que fez surgir as arestas tracejadas.
Outra funcionalidade de PANDORA gerar grcos referentes s mtricas calculadas para o
grafo. Neste trabalho, os grcos sugeridos so os de Grau x Quantidade de Publicaes, grco
de Coeciente de Colaborao e grco de Assortatividade. O primeiro grco mostra a quan-
tidade de pesquisadores para cada par de coordenadas (grau, quantidade de publicaes), assim
possvel avaliar a produtividade do grupo visualizado no momento, vericando se os pesquisa-
dores que possuem grau alto tambm possuem grande quantidade de publicaes. O grco de
Coeciente de Colaborao indica, para o grafo visualizado no momento, o ndice de colaborao
entre cada pesquisador e seus colaboradores. medida que o grafo expandido, essa mtrica
51
Figura 4.1: Viso geral da proposta de PANDORA: o usurio entra com um arquivo XML, con-
tendo a produo bibliogrca, que usado pelo sistema para gerar uma visualizao de grafo,
bem como dados analticos sobre este grafo. A seta em azul indica interao entre o usurio e o
sistema.
52
recalculada para o novo conjunto de pesquisadores. O grco de Assortatividade mostra a relao
entre quantidade de colaboradores e mdia das quantidades de colaboradores dos colaboradores de
um pesquisador.
4.1.1 Visualizao de Grafos
Este trabalho prope duas abordagens para visualizao de grafos que representam redes so-
ciais acadmicas de coautoria. A primeira abordagem permite visualizar o grafo completo envol-
vendo todos os pesquisadores desejados. A segunda abordagem permite incrementar gradualmente
o grafo com novos ns que representam pesquisadores colaboradores dos que j estavam sendo vi-
sualizados. medida que o usurio clica em um dos ns no grafo, o grafo ampliado com todos
os coautores do n clicado.
A Figura 4.2 mostra um esquema no qual podem ser vistas as duas abordagens propostas. O
uxo superior seguindo pela seta 1 representa a abordagem de visualizao do grafo completo, j
o uxo a partir da seta 4 representa a abordagem incremental.
Seguindo a partir da seta 1 os seguintes passos so executados:
Nesse caso, o usurio escolheu visualizar um grafo que contm todos os pesquisadores do
arquivo passado como entrada (seta 1), a ferramenta gera ento apenas um arquivo XML, a
partir do GraphML que representa toda a rede de colaborao entre os pesquisadores (seta
2);
A partir da gerada uma visualizao do grafo, com leiaute baseado em foras, e grcos
com mtricas extradas do prprio grafo (seta 2);
Aseta 3 representa a interao que o usurio pode ter como grafo gerando planilhas, gerando
imagens do que est se visualizando dentre outros tipos de interao.
Seguindo a partir da seta 4 os seguintes passos so executados:
Inicialmente o usurio escolhe um dos pesquisadores disponveis para visualizar seu grafo
de colaborao (seta 4);
A aplicao gera ento diversos arquivos XML um para cada pesquisador no arquivo inicial,
sendo que cada arquivo contm informaes sobre o pesquisador principal ao qual pertence
o arquivo e seus colaboradores (seta 5);
Depois de separados os arquivos XML, o arquivo referente ao pesquisador que foi escolhido
pelo usurio separado pela ferramenta e usada para gerar a visualizao do grafo desse
pesquisador, com leiaute radial. Desta forma, a aplicao gera tambm grcos referentes
ao grafo visualizado (seta 6);
53
Figura 4.2: Esquema do uxo de execuo da aplicao. O uxo superior representa a abordagem
de visualizao do grafo completo, em que a aplicao recebe um arquivo XML com todos os
pesquisadores, para em seguida gerar um grafo completo juntamente com grcos e planilhas.
O uxo inferior representa a abordagem incremental em que um pesquisador escolhido pelo
usurio; a aplicao recebe vrios arquivos XML e cria um grafo utilizando o XML referente ao
pesquisador escolhido pelo usurio, juntamente com planilhas e grcos.
54
A seta 7 representa a interao com o usurio que pode expandir o grafo, gerar planilhas com
as mtricas, etc. Ao expandir o grafo, outros arquivos XML so lidos para que novos ns e
arestas sejam adicionados.
Figura 4.3: Esquema da abordagem incremental: ao clicar em um n qualquer, o grafo expandido
caso o pesquisador tenha colaboradores que no estejam visveis ainda.
A abordagem incremental pode ser vista na Figura 4.3, que representa um exemplo, onde aps
n expanses, o usurio obtm o Grafo 1. Em seguida, ao clicar em um n que ainda no foi
expandido, no caso o n destacado no Grafo 1, obtido o Grafo 2. Neste ltimo grafo so adi-
cionados colaboradores que antes no eram visualizados, assim como as arestas que representam
colaboraes entre eles. A seta em azul representa a interao e interveno do usurio sobre o
grafo.
4.1.2 Gerao de Grcos para Anlises de Dados
Para analisar os grafos gerados pela PANDORA, alm das mtricas calculadas usando JUNG
1
, que so mostradas ao deixar o mouse sobre os ns no grafo radial, so tambm criados trs
grcos: grco Grau x Quantidade de Publicaes, grco Coeciente de Colaborao e grco
de Assortatividade.
No grco Grau x Quantidade de Publicaes, as mtricas utilizadas para sua construo so
os graus de cada pesquisador e a quantidade de publicaes que ele possui. importante dizer que
nesse grco esto sendo levados em conta apenas os pesquisadores que possuem todas suas publi-
caes e colaboradores mostradas no grafo e que tenham sido escolhidos (clicados) pelo usurio.
Isso porque para um pesquisador representado por um n que ainda no havia sido expandido, o
clculo das mtricas no estaria condizente com a realidade.
1
http://jung.sourceforge.net/
55
No grco de Coeciente de Colaborao, so calculados os coecientes de colaborao do
grupo que est sendo visualizado no momento. A cada expanso, o pesquisador selecionado
adicionado ao grco e a mtrica recalculada para o grupo atual. Desta forma, possvel ana-
lisar, para um determinado grupo, de que forma a adio de colaboradores e publicaes de um
pesquisador, no caso o clicado pelo usurio, inuencia, no ndice de colaborao do grupo.
O grco de Assortatividade calculado apenas na visualizao de grafos completos. Para cada
grau encontrado no grafo so calculadas as mdias dos graus do colaboradores do pesquisador.
Assim, possvel vericar se pesquisadores com grande quantidade de colaboradores tendem a se
relacionar com pesquisadores que tambm se relacionam com muitos colaboradores.
4.2 Implementao de PANDORA
Figura 4.4: Representao dos mdulos de PANDORA incluindo interao com o usurio.
O objetivo da implementao de PANDORA validar a proposta apresentada na Seo 4.1 e
mostrar sua viabilidade. A Figura 4.4 mostra o uxograma que representa os mdulos implemen-
tados em PANDORA. As caixas azuis representam cada mdulo e as de cor laranja representam
56
dados de entrada e sada de cada mdulo. O usurio est representado por uma caixa cinza e
para cada dado que ele tem acesso foi adicionada uma linha rosa relacionando-os. A primeira
interao com usurio acontece no momento em que ele fornece um arquivo contendo informa-
es de coautorias e publicaes. A partir desse arquivo GraphML feito um pr-processamento,
onde so geradas estruturas de dados internas, contendo listas de pesquisadores, publicaes e re-
lacionamentos de colaborao. Estas estruturas so usadas para construo dos arquivos XML e,
posteriormente, esses arquivos so usados para gerao dos grafos. Se o usurio escolhe visualizar
o grafo completo, ento gerado um arquivo XML contendo todos os pesquisadores, e so gerados
dados da rede global de coautorias. Caso contrrio, so criados arquivos XML individualizados,
contendo o pesquisador escolhido pelo usurio e seus colaboradores, gerando redes de coautoria.
Para cada pesquisador, gerado um arquivo XML, como o mostrado na Figura 4.5. Cada
arquivo XML contm apenas publicaes que envolvem o pesquisador que o usurio selecionou
como autor. A caixa em vermelho, na Figura 4.5, mostra as denies do XML, onde cada atributo
dos ns e arestas denido. Dentro da caixa azul, so mostradas informaes do pesquisador
principal dessa rede, ou seja, esse arquivo se refere a esse pesquisador. O exemplo, refere-se
pesquisadora Carla Maria Dal Sasso Freitas. A caixa em amarelo apresenta as informaes sobre
os colaboradores de outro pesquisador principal, no exemplo: Ana Lucia Cetertich Bazzan, Denise
de Oliveira e Kai Nagel. A caixa rosa apresenta as arestas que mostram quais ns elas esto
conectando, a quantidade de publicaes em comum e quais so estas publicaes.
Depois de gerados os arquivos XML, o mdulo de gerao de grafos, gera uma estrutura de
dados que representa o grafo, a qual usada para calcular as mtricas, assim como para gerar
outras visualizaes do grafo. Vale ressaltar que as mtricas calculadas se referem ao grafo atual
visualizado pelo usurio. A partir das mtricas so gerados grcos para anlise.
Ocdigo da aplicao foi desenvolvido usando linguagemJava, comapoio da biblioteca grca
Prefuse para facilitar a gerao dos grafos. Alm disso, a biblioteca JUNG foi usada para auxiliar
no clculo das mtricas mais comuns. J para a gerao dos grcos, foi utilizada a biblioteca
JFreeChart.
4.2.1 Funcionalidades de PANDORA
A Figura 4.6 mostra um exemplo de arquivo GraphML usado como entrada para execuo
da aplicao desenvolvida. O trecho do arquivo circundado em verde contm as denies dos
atributos pertencentes aos elementos que denem os ns (pesquisadores), arestas e publicaes.
No trecho em azul, mostrada a denio de um n representante da pesquisadora Carla Maria
Dal Sasso Freitas, que contm um id que serve como referncia para indicar nas arestas quais so
os ns que esta estar ligando. No trecho em rosa, possvel ver a denio de duas arestas,
onde target e source recebem o valor dos ids referentes aos pesquisadores que esto ligados pela
aresta. Estas arestas esto relacionadas pesquisadora Carla Freitas, j que o source, destacado em
amarelo, possui o valor do id dessa pesquisadora. Caso dois pesquisadores possuam mais de uma
publicao em comum, a aresta ter n data_element, um para cada publicao. Por m, o trecho
57
Figura 4.5: Arquivo XML da pesquisadora Carla Freitas no ano 2008.
58
Figura 4.6: Trechos do arquivo de entrada utilizado na aplicao.
59
circundado em amarelo mostra informaes de uma publicao, como ttulo, ano de publicao,
etc.
Figura 4.7: Exemplo de grafo completo mostrado ao usurio.
Inicialmente, o usurio escolhe um arquivo GraphML, como o mostrado na Figura 4.6. Em
seguida, o usurio deve informar se deseja visualizar apenas o grafo completo ou, partir de um
determinado pesquisador, expandir o grafo incrementalmente clicando em cada n desejado. Para
o primeiro caso, gerado um grafo, como pode ser visto na Figura 4.7, contendo todos os pes-
quisadores presentes no arquivo XML passado como entrada, alm de dois grcos: um grco
relacionando grau do n e quantidade de publicaes e outro evidenciando a assortatividade (Grau
x Mdia dos graus dos colaboradores).
Figura 4.8: Coloraes que representam as diferentes categorias para os pesquisadores. Na ordem
das imagens: Discente, Docente e Participante Externo.
Na primeira aba, mostrado o grafo completo, representado com leiaute baseado em foras,
onde cada n inuenciado por foras geradas pela interao entre as molas (no caso, as arestas so
60
tratadas como molas) , fora de repulso entre os ns e fora de arraste, que similar resistncia
do ar. Neste grafo, as cores dos ns signicam as diferentes categorias de ns: Discente (verde
claro), Docente (verde grama) ou Participante Externo (verde azulado), como pode ser visto na
Figura 4.8. O tamanho dos ns mostra a quantidade de arestas que esto ligadas ao n, ou seja,
seu grau ou, no caso, a quantidade de colaboradores que ele tem. As cores e largura das arestas
mostram a quantidade de publicaes envolvidas na relao entre dois pesquisadores. Quanto mais
escura for a cor da aresta, mais publicaes esto sendo representadas; quanto mais grossa, mais
publicaes esto envolvidas (foram usados dois tipos de representao para chamar mais ateno
do usurio). Est disponvel uma variao de quatro cores que representam:
Quantidade de publicaes igual a 1 - cor mais clara;
Quantidade de publicaes igual a 2 - segunda cor mais clara;
Quantidade de publicaes igual a 3 - cor escura;
Quantidade de publicaes maior que 3 - cor mais escura.
Vale ressaltar que a largura das arestas segue o mesmo padro citado para as cores, variando
em quatro valores.
Na segunda aba mostrado um grco Grau x Quantidade de Publicaes com todos os pes-
quisadores do conjunto de entrada. Neste grco, segundo a legenda, cada ponto possui uma cor e
uma forma geomtrica que signica a quantidade de pesquisadores que possuem um par de valores
(grau, nmero de publicaes). Um exemplo deste grco pode ser visto na Figura 4.9.
Na terceira aba mostrado o grco de Assortatividade, onde para cada grau dos ns encon-
trado no grafo, calculada a mdia dos graus dos colaboradores do pesquisador representado pelo
n. Caso aparea um grau para o qual j tenha sido calculada a mdia, essa novamente calculada
agora incluindo os novos ns. Um exemplo deste tipo de grco pode ser visto na Figura 4.10.
Para o caso em que o usurio deseja, inicialmente, visualizar o grafo egocntrico, a partir de um
nico pesquisador, ser exibida uma lista com todos os pesquisadores do conjunto de entrada para
que o usurio possa selecionar um deles. O usurio pode expandir o grafo de forma incremental,
clicando nos ns que representam co-autores. A cada clique so acrescentados os ns dos cola-
boradores daquele que foi selecionado, e que no pertenciam ao grafo, juntamente com as arestas
correspondentes s publicaes que no estavam sendo visualizadas.
A partir desse momento, esto disponveis quatro visualizaes em abas especcas da inter-
face:
Grafo de Coautoria - grafo contendo o pesquisador inicialmente escolhido pelo usurio jun-
tamente com seus colaboradores. Neste grafo, esto representadas apenas as relaes cor-
respondentes s publicaes que envolvam o pesquisador inicial. Ao expandir um n, so
adicionadas as arestas que representam publicaes que envolvam o pesquisador expandido.
61
Figura 4.9: Relao Grau x Quantidade de Publicaes correspondente ao grafo completo.
Figura 4.10: Grco Assortatividade (Grau x Mdia dos graus dos colaboradores) para dados de
um grafo completo.
62
Neste grafo, os ns e arestas so representados pelas mesmas cores e larguras citadas an-
teriormente para o grafo completo. O grafo mostrado com leiaute radial, em que o n
central mostra o pesquisador inicial ou o ltimo n clicado para expandir o grafo, j que
o Prefuse rearranja o leiaute medida que o usurio clica em um n. Ao deixar o mouse
sobre um n, so mostradas informaes referentes quele n como quantidade de publica-
es, quantidade de publicaes ao ser expandido, categoria, mtricas calculadas como grau,
betweenness, etc (Figura 4.11).
Figura 4.11: Visualizao gerada depois do usurio selecionar um pesquisador especco no grafo
em exibio no momento.
Grafo de Publicaes - grafo que mostra todas as publicaes representadas no grafo de co-
autoria, usando leiaute de foras. O grafo subjacente tem as arestas unindo artigos do mesmo
autor. Cada publicao representada por um quadrado em que o tamanho varia de acordo
com a quantidade de autores. Para vericar quais artigos tem autores em comum, basta dei-
xar o mouse sobre um dos artigos, os que tiverem autores em comum sero destacados em
vermelho. Ao deixar o mouse sobre um n nesse grafo, so mostrados todos os autores que
participaram da produo daquela publicao, como pode ser visto na Figura 4.12.
Grco Grau x Quantidade de Publicaes - grco que representa o grau e a quantidade
de publicaes dos pesquisadores expandidos a partir do pesquisador inicial. Este grco
utiliza a mesma representao do grco para o grafo completo citado anteriormente (Figura
63
Figura 4.12: Grafo de artigos aps algumas expanses no grafo de Coautoria.
4.9). A partir desse grco possvel inferir se os autores que possuem maior quantidade de
colaboradores (maior grau), em geral, publicam mais que os demais.
Grco de Coeciente de Colaborao - so calculados os coecientes de colaborao para
o grupo de pesquisadores representado no grafo, naquele momento, considerando apenas
as publicaes entre eles. Ao expandir o grafo, novas coautorias (e novas publicaes) so
inseridas e o coeciente de colaborao recalculado. O eixo das abscissas representa os
nomes dos pesquisadores que foram selecionados at o momento, como pode ser visto na
Figura 4.13.
Para ambas as visualizaes do grafo completo ou grafo expandido de forma incremental,
existem funes na aplicao: "Opes"e "Informaes". A partir de "Opes", o usurio pode:
1. reiniciar a visualizao do grafo a partir do mesmo arquivo ou de umoutro arquivo no mesmo
formato;
2. gerar imagens que representam o grafo ou qualquer um dos grcos gerados;
3. gerar arquivos com os dados dos ns e do grafo completo, que podem ser abertos em pla-
nilhas como o Excel, podendo gerar outros grcos a partir das planilhas, sendo possvel
tambm ltrar as caractersticas que aparecero no arquivo.
64
Figura 4.13: Coeciente de Colaborao calculado sobre os dados que se referem aos pesquisado-
res representados no grafo visualizado.
J no boto "Informaes", o usurio pode ver os crditos e informaes sobre as funcionali-
dades da ferramenta.
Algumas funcionalidades presentes na ferramenta se referem aos tipos de interao permitidos
com a visualizao do grafo. possvel aumentar e diminuir o zoom. No grafo de visualizao
completo, pode-se alterar os parmetros (comprimento das arestas, coeciente gravitacional e nvel
de profundidade para visualizao) para ajustar o grafo de forma que que o mais visvel possvel.
Foi criada nesse trabalho uma variao do coeciente de colaborao para medir o coeciente
de colaborao apenas entre Docentes. Para tal clculo foram levados em conta apenas os autores
de trabalhos que fossem Docentes, desconsiderando Discentes e Participantes Externos.
4.2.2 Limitaes de PANDORA
Atualmente uma das limitaes de PANDORA est na gerao de alguns grcos (aqueles que
mostram informaes em diferentes anos), j que s alguns deles so gerados automaticamente.
Isso se deve ao fato de no ser possvel ler vrios arquivos XML de diversos anos ao executar a
aplicao apenas uma vez. Para obter o grafo referente a diversos anos, uma alternativa passar
como entrada um arquivo XML nico contendo informaes dos anos desejados.
65
4.3 Consideraes Finais
Este captulo apresentou uma proposta de anlise e visualizao das redes sociais acadmicas
de forma que seja possvel calcular mtricas, fazer anlises e posteriormente com auxlio da visua-
lizao tirar concluses sobre a rede estudada. A maior contribuio desse trabalho permitir uma
anlise incremental da rede. Essa forma de representao permite que o usurio construa um mapa
mental no perdendo os passos das alteraes do grafo e calcule as mtricas sempre que o grafo
alterado.
A maioria das ferramentas estudadas como fundamentao para esse trabalho apresentam m-
tricas e tcnicas de interao de visualizao de forma individual, ou seja, calculam uma mtrica
e outra no. Neste trabalho, tentou-se agregar as mtricas consideradas como as mais importantes
para avaliao das redes sociais aplicadas estritamente ao campo de redes acadmicas de coautoria.
As tabelas 3.1 e 3.2 foram alteradas, gerando agora as tabelas 4.1 e 4.2, para cada uma foi adicio-
nada uma linha referente PANDORA para comparao com as outras ferramentas estudadas.
A Tabela 4.1 mostra as propriedades interativas de cada ferramenta. Das propriedades aponta-
das, a PANDORA no possui alterao dos rtulos, tamanhos dos ns, j que se pensou que, por se
tratar de uma rede de coautoria, bastaria colocar os sobrenomes dos pesquisadores como rtulos.
As consultas e o agrupamento de ns atualmente no so permitidos, mas pensa-se nisso como
trabalho futuro. A Tabela 4.2 mostra as mtricas calculadas por cada ferramenta. A excentrici-
dade, dimetro e densidade apesar de no serem calculados na verso atual, podem ser facilmente
agregados, uma vez que a biblioteca JUNG permite esses clculos.
As ferramentas estudadas so dedicadas visualizao de redes de modo geral e, desta forma,
acabam no sendo especializadas em redes sociais, em especial as redes de coautoria, exceto pela
SocialNetSense e ArnetMiner, esta ltima se dedica apenas anlise e visualizao de redes aca-
dmicas. A ArnetMiner, porm, busca os dados de diversas fontes da Web, integrando-os, mas
no permite que o usurio insira um arquivo de entrada para visualizar uma rede especca. J
a SocialNetSense se mostra um pouco mais ampla que a aplicao desse trabalho no sentido de
permitir que os ns sejam no somente indivduos mas grupo de pesquisa ou instituies, podendo
o usurio dar Zoom e vericar quais pesquisadores pertencem ao grupo. Desta forma o SocialNet-
Sense mais aplicvel a redes de coautoria em um sentido mais amplo que envolva, por exemplo,
diferentes instituies.
Como vantagens em usar PANDORA, em relao s outras ferramentas estudadas, pode-se
citar:
Permite visualizar uma rede de coautoria especca, lendo um arquivo de entrada passado
como entrada pelo usurio;
Permite visualizar de forma geral as publicaes de um grupo de pesquisadores mostrando a
quantidade de publicaes produzidas naquele ano;
possvel gerar grcos que possibilitam analisar o comportamento da rede;
66
Diversas mtricas so calculadas para cada n, sendo algumas gerais (calculadas pela mai-
oria das ferramentas de anlise de redes), e outras que no foram encontradas nas outras
ferramentas estudadas como, por exemplo, coeciente de colaborao e coeciente de cola-
borao apenas com Docentes.
Durante o estudo de trabalhos sobre anlise de redes acadmicas, vericou-se que muitos cal-
culam mtricas e, para visualizao dos dados, utilizam a ferramenta UCINET com NetDraw ou
Pajek, no tendo opo para utilizar outras ferramentas. Essas ferramentas foram desenvolvidas
para visualizar e calcular mtricas de redes em geral, no sendo especcas para redes acadmicas.
Com PANDORA, um professor ou coordenador de um curso de ps-graduao, graduao
ou qualquer grupo que envolva redes acadmicas, pode analisar seu prprio desempenho ou o
desempenho de um grupo em um ano especco. Alm disso, exportar os dados em .csv permite
que o usurio gere grcos com os dados que desejar, ltrando as mtricas e caractersticas do n,
ou seja, escolhendo quais mtricas devem ser exportadas para o arquivo.
6
7
Ferramentas
Caractersticas COMMETRIX COSBILab ArnetMiner SocialNetSense Pajek igraph UCINET NodeXL SocialAction PANDORA
Graph
Zoom Sim Sim Sim Sim Sim Sim No Sim Sim Sim
Distncia mnima entre ns Sim No No No Sim Sim No No No Sim
Comprimento das arestas Sim No No No ? Sim No No No Sim
Alterar rtulos Sim Sim No No Sim Sim Sim Sim Sim No
Alterar tamanho dos rtulos Sim ? No Sim Sim Sim Sim Sim Sim No
Alterar tamanho dos ns Sim Sim No Sim Sim Sim Sim Sim Sim No
Alterar largura das arestas Sim Sim No No Sim Sim Sim ? No Sim
Filtros Sim No No Sim ? Sim Sim Sim Sim Sim
Consulta Sim Sim No No No No No No No No
Expande No No Sim No No No No Sim No Sim
Agrupa No No No No No No No Sim Sim No
Representao Grafo Grafo Grafo Grafo Grafo Grafo Grafo Grafo Grafo Grafo
Tabela 4.1: Tabela com caractersticas de visualizao e interatividade com acrscimo de PANDORA.
6
8
Ferramentas
Mtricas COMMETRIX COSBILab ArnetMiner SocialNetSense Pajek igraph UCINET NodeXL SocialAction PANDORA
Graph
Distncia Sim Sim No No Sim Sim Sim Sim Sim Sim
Excentricidade No No No No No No No No No No
Grau Sim Sim No Sim Sim Sim ? Sim Sim Sim
Dimetro Sim Sim No Sim Sim Sim ? Sim Sim No
Densidade Sim No No Sim No Sim Sim Sim Sim No
Centralidade Sim No No No No Sim Sim No Sim Sim
de Grau
Centralidade Sim Sim No Sim Sim Sim Sim Sim Sim Sim
de Closeness
Centralidade Sim Sim No Sim Sim Sim Sim Sim Sim Sim
de Betweenness
Coeciente Sim Sim No No Sim Sim Sim Sim Sim No
de Clustering
Assortatividade No No No No No No No No No Sim
(usando grcos)
Coeciente No No No No No No No No No Sim
de Colaborao
Tabela 4.2: Tabela com resumo das mtricas calculadas por cada ferramenta acrescido de PANDORA.
69
5 ESTUDOS DE CASO
Como estudos de caso, escolheu-se trabalhar com diferentes grupos e mostrar o nicho de apli-
caes e estudos que podem ser feitos utilizando este trabalho. O primeiro estudo de caso, envolve
alguns grupos de pesquisa dentro do PPGC da UFRGS para analisar o comportamento do mesmos,
vericando se existe alguma inuncia devido area de pesquisa em relao s publicaes. No
segundo estudo de caso, foram escolhidos alguns pesquisadores dentro do grande grupo do PPGC
supondo que estes tivessem diferentes comportamentos em relao pesquisa, por exemplo, pu-
blicar mais com alunos ou participantes externos. O terceiro e ltimo avalia todo o PPGC como
um grupo completo.
5.1 Estudo de Caso I - Grupos dentro do PPGC
Para esse estudo de caso, os docentes integrantes do PPGC da UFRGS foram divididos nos gru-
pos de pesquisa do qual participam. Os grupos formados foram: Computao Grca, Inteligncia
Articial, Processamento Paralelo, Sistemas Embarcados e Sistemas de Informao.
O objetivo inicial desse estudo foi calcular o coeciente de colaborao de cada grupo, atravs
das expanses disponveis na PANDORA, e assim vericar de que forma ocorre a colaborao den-
tro dos grupos. Inicialmente, pensou-se em utilizar todo o intervalo de 2004 a 2011, mas por causa
de limitaes do tamanho do arquivo buscou-se a alternativa de utilizar os trinios (2004 a 2006;
2007 a 2009 e 2010 a 2011). Desta forma, seria possvel avaliar de que forma os grupos se com-
portaram ao longo dos anos, vericando se ao nal de cada trinio houve alguma alterao. Vale
lembrar que o ltimo trinio no contm o ano de 2012 pois os dados ainda sero contabilizados.
Para cada grupo, ento, iniciou-se com um pesquisador, escolhido aleatoriamente e, a partir
deste foram feitas expanses sempre buscando outros Docentes integrantes do grupo ao qual o
primeiro pertence. Porm, percebeu-se que alguns deles seriam inalcanveis a partir do primeiro.
Isso porque existem pesquisadores que, em nenhum momento, publicaram com algum docente par-
ticipante do seu mesmo grupo, ou com seus colaboradores. Ou seja, no existe caminho que ligue
os dois pesquisadores no grafo completo, pois eles participam de componentes desconexas. Outro
fator notado que muitos dos pesquisadores pertencentes ao grupos no apareciam ou apareciam
70
Anos
Grupos 2004 a 2006 2007 a 2009 2010 a 2011
Computao Grca 0,685 (4 professores) 0,67 (5 professores) 0,68 (8 professores)
Sistemas Embarcados 0,7 (4 professores) 0,73 (4 professores) 0,76 (4 professores)
Sistemas de Informao 0,66 (6 professores) 0,69 (7 professores) 0,73 (9 professores)
Tabela 5.1: Coecientes de Colaborao dos grupos em cada trinio.
como participante externo, no conjunto de publicaes de entrada para PANDORA, mesmo que
tenham se tornado Docentes ao longo do tempo.
Para lidar com o problema dos grupos com componentes desconexas, para esse estudo, foram
escolhidos apenas os grupos que correspondiam a apenas uma componente conexa representando
os docentes. Assim sendo, os grupos escolhidos para essa anlise foram: Computao Grca,
Sistemas Embarcados e Sistemas da Informao. A tabela 5.1 mostra os valores dos coecientes
de colaborao calculados. Para cada valor, est marcada tambm a quantidade de pesquisadores
Docentes e participantes daquele grupo que foram expandidos. Cada coeciente de colaborao
teve uma pequena variao, apesar de terem aumentado a cada trinio nos grupos de Sistemas
Embarcados e Sistemas de Informao. No grupo de Computao Grca houve uma queda nos
anos de 2007 a 2009, mas voltou a aumentar de 2010 a 2011. importante ressaltar que para
o clculo desses coecientes de colaborao, as quantidades de autores levam em conta todos os
tipos de pesquisadores possveis (Participantes Externos, Docentes, Discentes). Isso signica que
o aumento do coeciente de colaborao no signica que os Docentes pertencentes ao grupo
tenham aumentado a colaborao entre si necessariamente.
O grupo que manteve mais professores publicando proximamente foi o grupo de Sistemas de
Informao, que aumentou a cada trinio a quantidade de pesquisadores e tambm o coeciente
de colaborao. O grupo de Inteligncia Articial foi o que apresentou mais fragmentao sendo
que, no ltimo trinio, apresentou 6 grupos separados para os pesquisadores do grupo, sendo que
a maioria continha 2 dos pesquisadores.
Apesar do coeciente de colaborao dos pesquisadores do grupo de Sistemas de Informao
ter aumentado, atravs do grafo de Artigos possvel perceber que os artigos de cada Docente
no costumam incluir outros pesquisadores do grupo, como pode ser visto na Figura 5.1. Pode-se
ver que existem crculos mais separados, isto signica que os artigos no tm muitos autores em
comum, ou seja, o coeciente de colaborao entre Docentes do grupo pequeno.
Em comparao ao grupo de Sistemas de Informao, pode-se observar o grafo de Artigos, na
Figura 5.2, do grupo de Computao Grca no trinio de 2004 a 2006. Neste grafo possvel
perceber que ca mais difcil separar os crculos correspondentes a cada pesquisador, ou seja, esto
mais integrados, com maiores interseces, o que signica maior colaborao entre os Docentes
maior. No trinio de 2007 a 2009 o grupo de Computao Grca se comportou da mesma forma
que o grupo de Sistemas da Informao de 2004 a 2006.
No grupo de Sistemas Embarcados foi encontrado o pesquisador com maior nmero de pu-
71
Figura 5.1: Grafo de artigos do grupo de Sistemas da Informao no trinio de 2007 a 2009.
Figura 5.2: Grafo de artigos do grupo de Computao Grca no trinio de 2004 a 2006.
72
Figura 5.3: Grafo de artigos do grupo de Sistemas Embarcados no trinio de 2007 a 2009.
Figura 5.4: Evoluo dos grafos de colaboraes nos anos de 2004 a 2011 do grupo de Sistemas
de Informao. Legenda: A - trinio de 2004 a 2006, B - trinio de 2007 a 2009 e C - trinio
incompleto contendo 2010 e 2011.
73
Figura 5.5: Evoluo nos grafos de colaborao entre os anos de 2004 a 2011 para o grupo de
Sistemas de Informao. Legenda: A - trinio de 2004 a 2006, B - trinio de 2007 a 2009 e C -
trinio incompleto contendo 2010 e 2011.
74
blicaes em um trinio, Luigi Carro, com 84 publicaes, isso pode ser visto na Figura 5.3. Os
crculos mostram-se muito mais densos, mostrando que existem muitas publicaes com um de-
terminado pesquisador como autor.
Para mostrar as comparaes sobre evolues de um grupo durante os trinios, os grafos de pu-
blicaes dos trinios so mostrados na Figura 5.4 para o grupo de Sistemas de Informao, j que
para esse grupo as mudanas no grafo so visveis. Alm disso, o grupo de Sistemas Embarcados
possui uma concentrao muito grande de publicaes em dois pesquisadores em especial, como
foi mostrado na Figura 5.3. J o grupo de Computao Grca apresentou pequena variao no
coeciente de colaborao nos trs trinios e como a inteno nesse momento mostrar a relao
entre o grafo de publicaes e o coeciente de colaborao, este no seria um bom exemplo. A Fi-
gura 5.4, mostra os grafos de publicaes para o grupo de Sistemas de Informao em cada trinio.
A cada trinio a colaborao entre os pesquisadores do grupo aumentou. No primeiro trinio, os
crculos esto mais dispersos, sendo mais unidos no segundo trinio e mais ainda no ltimo. Isso
comprovado na tabela 5.1, em que o ano em que foi registrado o maior coeciente de colaborao
entre o grupo.
A Figura 5.5, mostra os grafos de colaborao em cada trinio estudado para o grupo de Siste-
mas de Informao. Os pesquisadores destacados com caixas roxas representam os pesquisadores
que formam o grupo de Sistemas de Informao. Com o passar dos anos os docentes do grupo se
tornaram mais prximos em relao s colaboraes entre si.
5.2 Estudo de Caso II - Pesquisadores Individuais PPGC
Para esse grco so levados em conta os anos de 2004 a 2011, calculando as mtricas de cada
um dos 6 pesquisadores. Por questes de sigilo, eles sero chamados de Professor A, Professor
B, Professor C, Professor D, Professor E e Professor F. Para cada um desses pesquisadores foram
calculadas mtricas utilizando a PANDORA. A tabela 5.2 mostra as mdias de quantidades de
pesquisadores e da quantidade de colaboradores, assim como a porcentagem da quantidade de
colaboradores que so Participantes Externos.
Pesquisadores
Mtricas Professor A Professor B Professor C Professora D Professora E Professora F
Mdia da quantidade de publicaes 20 8 6 13 8 12
Mdia da quantidade de colaboradores 35 13 9 16 20 18
Participantes Externos 47,7% 48,5% 52% 54,8% 43,5% 56,8%
(em porcentagem)
Docentes 22,3% 25,2% 21,3% 12,9% 18,4% 19,9%
(em porcentagem)
Tabela 5.2: Mtricas dos pesquisadores individuais escolhidos.
O pesquisador que obteve maior quantidade mdia de publicaes foi o Professor A, assim
como tambm obteve a maior quantidade de publicaes. Mas no necessariamente isso ocorre.
75
Por exemplo, o Professor E apesar de possuir maior quantidade mdia de colaboradores que o
Professor D, possui menor quantidade mdia de publicaes por ano. Para o Professor A, a maior
quantidade de publicaes registrada aconteceu em 2005, enquanto para os outros pesquisadores
isso aconteceu no ano de 2007. A quantidade de Participantes Externos em suas colaboraes
chamou ateno, esperava-se que os pesquisadores se diferenciassem mais em relao ao tipo de
colaboradores, mas para todos os seis escolhidos, que teoricamente possuem diferentes compor-
tamentos em relao ao tipo de colaboradores, a quantidade de colaboradores como Participantes
Externos foi maior. Observa-se, entretanto, que alguns dos Participantes Externos declarados nos
cadastros, so na verdade ex-alunos que antes eram orientandos. O ideal seria de alguma forma
ter uma quarta categoria ou trat-los como Discentes at um tempo pr-determinado. Para a mdia
de colaboradores como Docentes, percebe-se que a maior porcentagem foi de 25%. Isso mostra
que os pesquisadores Docentes publicam muito pouco em colaborao com outros Docentes. O
coeciente de colaborao entre Docentes se manteve no mximo em 0,5, exceto para o Professor
A no ano de 2010. O coeciente de colaborao geral variou de 0,54 a 0,83, sendo que o maior
coeciente foi registrado em 2005 para o Professor E.
A Figura 5.6 mostra grcos de barras com as mtricas calculadas para cada um dos seis
pesquisadores escolhidos. Foi utilizada escala logartmica para que as mtricas pudessem ser colo-
cadas no mesmo grco, uma vez que algumas das mtricas so calculadas de forma normalizada
e outras no tem como serem normalizadas. Vale ressaltar que as mtricas calculadas pelo JUNG
(centralidades), levam em conta apenas para o clculo a componente em que o n est, isso porque
para o clculo dessas mtricas so utilizadas as distncias e, se no possvel alcanar um n a
partir de outro, ento a distncia entre eles no relevante, considerada 0. Ento, existem pes-
quisadores que tero altos valores para centralidades apesar de estarem conectados a poucos ns,
mas como suas componentes possuem poucos ns, tero alto valor para centralidade.
5.3 Estudo de Caso III - Grupo Completo PPGC 2004 a 2011
A Figura 5.7 mostra que, em 2007, foi registrada a maior quantidade de Anais e Artigos e
que, em 2009, foi registrada a maior quantidade de captulos de livros publicada. Em geral a
quantidade de publicaes e de colaboradores varia de maneira semelhante, no sendo esse o nico
fator determinante para maior quantidade de publicaes.
76
Figura 5.6: Grcos de barras com mtricas para cada um dos pesquisadores escolhidos.
7
7
Figura 5.7: Grcos das mtricas referentes aos anos 2004 a 2010.
78
Na maior parte do tempo, a quantidade de Docentes envolvidos no desenvolvimento de cap-
tulos de livros de no mximo metade da mdia dos envolvidos com Anais. Isso mostra a maior
importncia dada aos Anais e Livros. Em geral, a quantidade de Discentes envolvidos com cap-
tulos de livros cerca de 10% do valor dos envolvidos com Anais. A quantidade de Participantes
Externos sempre superior s outras categorias de pesquisadores, o que j era esperado.
Os coecientes de colaborao entre pesquisadores em geral varia entre 0,6 e 0,7, o que
razovel. Porm, a taxa de colaborao entre Docentes varia de apenas 0,1 a 0,2 o que refora a
idia de que pouco se publica entre Docentes.
O coeciente de colaborao para os anais se manteve praticamente constante nos 7 anos, j
a quantidade de Docentes envolvidos com captulos de livros se manteve praticamente constante
com cerca de 50 pesquisadores em mdia durante o perodo. Em 2007, foi registrado o maior
nmero de publicaes, sendo registrado aumento da quantidade de pesquisadores, em relao
aos anos anteriores. Apesar terem sido registrados nos anos de 2010 e 2011 valores maiores de
pesquisadores mas as quantidades de publicaes nesses anos ainda foram menores do que em
2007. A maior inuncia na quantidade de pesquisadores, em geral, a quantidade de Participantes
Externos, sendo que os dois grcos so muitos parecidos em relao ao crescimento. Os dois anos
que registraram maior quantidade de publicaes foram tambm os anos em que foram calculados
os maiores coecientes de colaborao entre Docentes, 2007 e 2011.
De 2005 a 2009 houve crescimento considervel na quantidade de pesquisadores em geral
envolvidos com captulos de livros, acompanhado da quantidade de publicaes e participantes
externos. Entre 2005 e 2007 o coeciente de colaborao entre docentes envolvidos com captulos
de livros cresceu. J em 2009 e 2010 houve queda nos grcos de quantidades de publicaes e
pesquisadores, mas o coeciente de colaborao geral apresentou pequeno crescimento.
Em 2006 e 2008, houve queda na quantidade de publicaes, participantes externos, docentes
e pesquisadores em geral envolvidos com artigos. Em 2006, foi registrada a menor quantidade de
publicaes realizadas, sendo que em 2007 foi registrada o maior valor para a mesma mtrica. Em
2010, o coeciente de colaborao para artigos foi o menor registrado. No intervalo de 2008 a
2010 a quantidade de artigos cresceu de forma considervel, de 100 para 160. O menor coeciente
de colaborao entre Docentes para artigos registrado aconteceu em 2010.
A Figura 5.8 mostra o grco Grau x Quantidade de Publicaes e mostra que a maior quanti-
dade de pesquisadores se concentra na faixa de at 2 publicaes e at grau 13, que onde encontra-
se a maior parte de retngulos em vermelho escuro. Apenas 10 pesquisadores encontram-se na
faixa demarcada de acima de 14 publicaes e grau maior que 21. O grco de Assortatividade,
mostrado na Figura 5.9, mostra que a mdia dos graus dos vizinhos est acima de 7, o que mostra
que a maioria dos pesquisadores tendem a se relacionar com pesquisadores que tenham grande
quantidade de colaboradores. Para essas duas anlises foram utilizados grcos referentes ao ano
de 2011 que o mais recente.
79
Figura 5.8: Grco Grau X Quantidade de Publicaes para o PPGC no ano de 2011.
Figura 5.9: Grco de Assortatividade do ano de 2011 para todo o PPGC.
80
6 CONCLUSO E TRABALHOS FUTUROS
Este trabalho prope um mtodo para anlise e visualizao de grafos que representam redes
sociais acadmicas. Com esse mtodo, o usurio pode visualizar grafos de duas formas: grafo
completo com todos os pesquisadores ou, incrementalmente, a partir de um pesquisador com ex-
panses mostrando apenas os colaboradores do pesquisador escolhido pelo prprio usurio.
Dado um arquivo GraphML, arquivo XML especco para representar grafos, a ferramenta
gera a visualizao do grafo completo ou individual, de acordo com a escolha do usurio. A partir
da so permitidas interaes, desde o zoom e visualizao de informaes at alteraes nas foras
que atuamsobre os ns. Almdisso, so gerados dados que podemser utilizados para interpretao
do grafo e para posteriores estudos sobre o comportamento dos indivduos na rede.
Como estudos de caso, foram utilizados dados referentes ao grupo do PPGC da UFRGS, j
que estavam totalmente disponveis para acesso. Assim, foram desenvolvidos 3 estudos de caso.
O primeiro dividiu o grupo de acordo com as sub-reas de pesquisa, o segundo estudo de caso
comparou alguns pesquisadores escolhidos sugerindo que tivessem diferentes comportamentos em
relao escolha dos seus colaboradores (Discentes, Docentes ou Participantes Externos). J o
terceiro estudo de caso analisou o grupo completo do PPGC da UFRGS, no perodo de 2004 a
2011.
Os resultados apresentados por esse trabalho mostraram algumas concluses especcas para
a rede do PPGC da UFRGS que podem ser usados para melhorar o desempenho de seus inte-
grantes. Alm disso, pode ajudar os pesquisadores a perceber caractersticas prprias sobre seu
comportamento em relao s suas colaboraes. Desta forma, estes pesquisadores podem me-
lhorar sua produo analisando os grafos e vericando o que poderia melhorar para chegar nesse
objetivo, por exemplo, diversicar sua colaborao, ou buscar colaboraes com colaboradores de
seus colaboradores, ou buscar produzir mais trabalhos com colegas de sua rea de pesquisa.
Diversas idias podem ser incorporaes futuras PANDORA. Uma delas seria facilitar a en-
trada de vrios arquivos xml simultaneamente para gerar grafos temporais permitindo vericar
evolues em anos. Outra idia seria automatizar a gerao dos grcos que aqui foram produ-
zidos com o auxlio do Excel. Tambm poderia ser possvel ltrar as publicaes para visualizar
apenas artigos, peridicos, etc. Sugestes de colaboradores poderiam ser feitas automaticamente
81
pela aplicao. Uma ltima sugesto de trabalho futuro seria diferenciar os alunos que saram h
pouco tempo, tratando-os numa categoria especial, de modo que a mudana de papel passa a ser
acompanhada.
82
REFERNCIAS
BATAGELJ, V.; MRVAR, A. Program for Analysis and Visualization of Large Networks.
[S.l.: s.n.], 2011.
BENEVENUTO, F.; ALMEIDA, J.; SILVA., A. Explorando Redes Sociais Online: da coleta e
anlise de grandes bases de dados s aplicaes. Campo Grande, Brazil., 2011.
BORGATTI, M. E. S.; FREEMAN, L. UCINET for Windows. 2002.
BRANDO, W. C.; PARREIRAS, F. S.; SILVA, A. B. de Oliveira e. Redes em Cincia da Informa-
o: evidncias comportamentais dos pesquisadores e tendncias evolutivas das redes de coautoria.
Informao & Informao, [S.l.], v.12, 2007.
CSARDI, G.; NEPUSZ, T. The igraph software package for complex network research. Inter-
Journal, [S.l.], v.Complex Systems, p.1695, 2006.
FREEMAN, L. Centrality in social networks conceptual clarication. Social networks, [S.l.], v.1,
n.3, p.215239, 1979.
FREEMAN, L. C. Social Network Visualization, Methods of. In: Encyclopedia of Complexity
and Systems Science. [S.l.: s.n.], 2009. p.83458363.
FTIMA S. MAIA, M. de; CAREGNATO, S. E. Co-autoria como indicador de redes de colabora-
o cientca. Perspectivas em Cincia da Informao, [S.l.], v.13, 2008.
GOU, L. et al. Semantic Interaction for Sensemaking: inferring analytical reasoning for model
steering. VizWeeK, [S.l.], 2012.
GOU, L.; ZHANG, X. L. TreeNetViz: revealing patterns of networks over tree structures. IEEE
Trans. Vis. Comput. Graph., [S.l.], v.17, n.12, p.24492458, 2011.
HAYASHI, M. C. P. I.; HAYASHI, C. R. M.; LIMA, M. Y. de. Anlise de redes de co-autoria na
produo cientca em educao especial. Liinc em revista, [S.l.], v.4, 2008.
83
HERMAN, I.; MELANCON, G.; MARSHALL, M. S. Graph visualization and navigation in infor-
mation visualization: a survey. IEEE TRANSACTIONS ON VISUALIZATION AND COM-
PUTER GRAPHICS, [S.l.], v.6, n.1, p.2443, 2000.
JAMAKOVIC, A.; UHLIG, S. On the relationships between topological measures in real-world
networks. NHM, [S.l.], v.3, n.2, p.345359, 2008.
LIMA, M. Y. de. Redes de Co-autoria Cientca no Programa de Ps-Graduao em Geocin-
cias da UFRGS. 2009. Dissertao (Mestrado em Cincia da Computao) UFRGS.
NASCIMENTO, C. S. do et al. Visualizao interativa de redes sociais: um estudo de caso em
redes de colaborao cientca. Conferencia Latinoamericana de Informtica - CLEI, [S.l.],
2011.
NEWMAN, M. E. J. Assortative Mixing in Networks. Physical Review Letters, [S.l.], v.89, n.20,
p.208701, Oct. 2002.
NORTHWAY, M. A primer of sociometry. [S.l.]: University of Toronto Press, 1952.
OLIVEIRA SILVA, A. B. de et al. Redes de co-autoria dos professores da Cincia da Informa-
o: um retrato da colaborao cientca dessa disciplina no brasil. VII ENANCIB - Encontro
Nacional de Pesquisa em Cincia da Informao, [S.l.], Novembro 2006.
PERER, A.; SHNEIDERMAN, B. Integrating statistics and visualization: case studies of gaining
clarity during exploratory data analysis. In: SIGCHI CONFERENCE ON HUMAN FACTORS IN
COMPUTING SYSTEMS, New York, NY, USA. Proceedings. . . ACM, 2008. p.265274. (CHI
08).
SMITH, M. et al. Analyzing (social media) networks with NodeXL. In: COMMUNITIES AND
TECHNOLOGIES. Proceedings. . . ACM, 2009. p.255264.
SOUSA, F. S.; RUIZ, E. E. S. Aplicao da teoria de redes complexas no estudo de relacionamento
entre doenas em casos de bito do paciente. SBI 2011, [S.l.], 2011.
TANG, J. et al. ArnetMiner: extraction and mining of academic social networks. In: ACM
SIGKDD INTERNATIONAL CONFERENCE ON KNOWLEDGE DISCOVERY AND DATA
MINING, 14., New York, NY, USA. Proceedings. . . ACM, 2008. p.990998. (KDD 08).
TRIER, M.; BOBRIK, A. Social Search: exploring and searching social architectures in digital
networks. IEEE Internet Computing, [S.l.], v.13, n.2, p.5159, 2009.
VALENTINI, R.; JORDN, F. Software, Data and Modelling News: cosbilab graph: the network
analysis module of cosbilab. Environ. Model. Softw., Amsterdam, The Netherlands, The Nether-
lands, v.25, n.7, p.886888, July 2010.
84
WASSERMAN, S.; FAUST, K. Social network analysis: methods and applications. [S.l.]: Cam-
bridge University Press, 1994. (Structural analysis in the social sciences).

Você também pode gostar